应该是第二型甚至第三型的改进仪器文字转WAV音频