既然是他推衍得到的结果那可信性还是挺大的文字转WAV音频