因为他确实不懂那些文字转WAV音频