然后进行收获文字转WAV音频