必须按照协议上的内容执行文字转WAV音频