然后又把他听到的文字转WAV音频