他只能复述文字转WAV音频