从上一幕的表现来看文字转WAV音频