录制的时候是会同步修士的气息的文字转WAV音频