形成了一个半透明的模型文字转WAV音频