接连认定了好几个关键点之后文字转WAV音频