目标的位置基本稳定下来了文字转WAV音频