得到他们确切的方位之后文字转WAV音频