它们会选择攻击文字转WAV音频