所以他们的声音并没有如当天真实情形那样文字转WAV音频