两人似乎只是简单地互换了一个位置文字转WAV音频