估计后面观察不到的位置至少还得有二至四个哨位文字转WAV音频