我们都是得到坐标文字转WAV音频