只不过是给予了相当的引导文字转WAV音频