他们一般用极其普通的能量文字转WAV音频