同时可以计算出质量目标的大致质量文字转WAV音频