第一反应是自己听错了文字转WAV音频