就用覆盖率来凑文字转WAV音频