也就是按照教学大纲文字转WAV音频