为了监控他们是否产生了不必要的情感波动文字转WAV音频