准确的说是吸收文字转WAV音频