他们只会放弃文字转WAV音频