直到顺利定位文字转WAV音频