而是按照指定的座标方向来走文字转WAV音频