这一点确实是他们一开始疏忽了的文字转WAV音频