都是他经过反复测量和计算之后得出文字转WAV音频