那么他就可以利用这个无比庞大的时间差文字转WAV音频