要大致维持在一个相差不大的水准文字转WAV音频