为什么要这样去比较文字转WAV音频