应该是种本能而不是只会嘴上口文字转WAV音频