难的地方是找到对方的位置文字转WAV音频