他必须得做出取舍文字转WAV音频