最主要的是要观察妖兽的行为文字转WAV音频