他们只能执行文字转WAV音频