按照自动设定好的坐标文字转WAV音频