听到的知识总要消化了文字转WAV音频