因为他根本无法回答文字转WAV音频