他们会尝试通过选拔文字转WAV音频