它可以实现跟人的视角共享文字转WAV音频