我们始终都没有给与他一个准确的定位文字转WAV音频