然后从那个坐标离开文字转WAV音频