因为他记得文字转WAV音频