但这是从对抗角度考虑文字转WAV音频