加之随行的人大部分都是步行文字转WAV音频