主要都是在交谈角色的细节问题文字转WAV音频