做出适宜的行动和表情文字转WAV音频