能根据吼声的细微差别分出大致等级来文字转WAV音频