同时每提升一个级别文字转WAV音频