而是用器材文字转WAV音频