另加根据横幅上的时间推断文字转WAV音频