并可以进行准确定位文字转WAV音频