如果每个目标都需要瞄准再文字转WAV音频