就是以数量来分文字转WAV音频