但是话语当中蕴含的信息量还是比较的大文字转WAV音频