退出去很长一段距离才稳住身形文字转WAV音频