因为他话里的信息文字转WAV音频