并不是第一次想到这个问题――当然更可能的是文字转WAV音频