只是当两人下车的时候文字转WAV音频