为什么要用两个身份活动文字转WAV音频