最重要的一条就是互相信任文字转WAV音频