他其实是在想文字转WAV音频