这种控制是可以通过某种手段打破文字转WAV音频