先前推测的最坏结果要出现了文字转WAV音频