使得分离的两个时空文字转WAV音频