所以我们就没办法获得稳定的补给点文字转WAV音频