人为的划分出了几个等级文字转WAV音频