而是根据他行进的距离而进行变化文字转WAV音频