这样的损失就无法估计文字转WAV音频