就是利用探测在这样情绪状态下文字转WAV音频