最终的结果只能是被淘汰文字转WAV音频