他们直接选择了……无视文字转WAV音频