每一次施展都要文字转WAV音频