就算中枢要处理人文字转WAV音频