因为很多是我们自身所提供的文字转WAV音频