只是将它们用时间文字转WAV音频