这种现象在理论上可以计算出来文字转WAV音频