他完全可以自主处理文字转WAV音频