主要能力是攻击文字转WAV音频