只能根据三名星盗的动作和反应文字转WAV音频