尽量让他们每次歇脚都能找到客栈文字转WAV音频