则是完全吸收文字转WAV音频