我们需要确定自己所处的准确位置文字转WAV音频