他们需要做的是筛选文字转WAV音频