因此不需要寻找类如客栈的地方文字转WAV音频