做出了更进一步的指示文字转WAV音频