但为何又不取走文字转WAV音频