所以无法判断准确时间文字转WAV音频