他们似乎选择了后者文字转WAV音频