还没有完全稳定境界的情况下文字转WAV音频