我们无法估计到所有可能文字转WAV音频