大体上可分为三类人文字转WAV音频