因为他只得文字转WAV音频