就可以推断出他们的位置文字转WAV音频