那他就只能使用了文字转WAV音频