对抗过程是漫长的文字转WAV音频