然后分析出目标的构成文字转WAV音频