这一项就是走个过场文字转WAV音频