这也是为什么他们屡次提到文字转WAV音频