在走出十米左右的位置时文字转WAV音频