慧科研究院

大数据教育与教育的大数据

前言:
大数据是一个事关我国经济社会发展全局的战略性产业,大数据技术为社会经济活动提供决策依据,提高各个领域的运行效率,提升整个社会经济的集约化程度,对于我国经济发展转型具有重要的推动作用!2016年,由中国首席数据官联盟与网加时代网发起并承办,北京大学信息化与信息管理研究中心、中国新一代IT产业推进联盟、数邦客协办的“影响中国大数据产业进程100人”大型人物专访活动全面启动,被采访对象分别来自政府、产、学、研、企各个领域,他们将从不同角度,不同层面向大家阐述当前大数据产业热点、难点、疑点问题,为中国大数据产业健康、持续发展探索经验、保驾护航,敬请关注

435207530343863206.jpg

首席数据官联盟专家组成员,慧科教育研究院院长、集团首席战略官。专注于云计算、大数据、教育和信息技术融合、物联网等领域的研究,在国内外学术期刊和会议上发表论文60余篇,获美国和其他国家专利40余项,合著有《虚拟化与云计算》等四部云计算书籍,2011年“江苏省高层次创新创业人才引进计划”引进人才,2012年南京市首批“321科技领军人物”。

 

 

本期特邀嘉宾中国首席数据官联盟发起人葛涵涛,就“大数据与教育”和陈滢先生进行深入探讨。

葛涵涛:您是IT培训领域的资深专家,您如何看待大数据人才培养的发展现状?

陈滢:大数据概念出现后,受到各国政府、企业和学术界的关注,其作用已经上升到企业战略甚至国家战略,但是,大数据高端人才捉襟见肘,严重制约产业发展,高等院校作为创新人才的主要培养阵地,但是由于大数据主要概念和技术等都来自于主要互联网企业,教师能力相对短缺,急需相关课程体系、内容和师资。慧科教育率先与北京航空航天大学合作,于2011年秋季开设中国首个云计算方向软件工程硕士,2012年又开设中国首个大数据方向的软件工程硕士项目。大数据产业对人才要求高,既需要有数学统计基础好的数据科学家(Data Scientist),也需要熟悉大数据处理技术的数据架构师(DataArchitect)和工程师(Data Engineer),更需要人才深钻行业,建立洞察力,这样才能够将具体领域的问题经过建模和算法,最终从大数据中产生知识。因此,大数据人才培养既要有专业基础知识的建立,也要有基于开放和开源理念的校企合作和项目实践,要能够真正做到专业知识能力培养和企业现实问题对接,培养有扎实能力并可持续学习的人才,这个目标对IT和大数据这个行业是特别需要的。

葛涵涛:确实大数据的发展还得有人才作为保障,那么在您看来,什么样的培养模式是最有益于大数据人才发展的呢?

陈滢:正如刚才所讲,大数据人才培养也有不同方向,我们整体上分成两个方向:大数据技术和大数据分析,前者培养的技能更类似计算机学科的,包括大数据相关算法和系统,后者更注重数学建模和统计分析相关的技能。两者都分别面向专、本、硕更不同层次设计相应体系,其中会共享很多课程。与此同时,慧科与IBM、阿里云、百度等建立合作,一同将最先进和具有实战场景的理念、技术和数据等资源打包设计成专业实验室方案,并将企业项目引入课堂,促进专业实习和实践,让理论能真正联系实际,让专业和企业行业真正对接。在教育模式创新方面,慧科一直致力于践行打通线上和线下的混合学习方式,建设了一大批大数据MOOC精品课程,学生可以通过高校邦线上学习平台展开线上学习。

葛涵涛:我们一直倡导教育和科技的融合,用教育传播新兴技术的同时也用科技去改变教育。大数据技术又为教育带来了哪些改变?

陈滢:正如其他行业,大数据也可以并一定会给教育带来价值。线上教育的普及为大数据技术的使用奠定了基础,平台可以捕捉学生在平台上的每一次鼠标点击,进一步转化成语义层次更高的任务描述甚至意图(Intention)描述,通过大数据分析技术获得有价值信息,这就是学习分析(LearningAnalytics),目前很多学术界的人也在研究。在慧科教育研究院年度发布的教育技术前瞻(UtideVision)2014和2015年报告中,提到的教育智能(EducationIntelligence,2014) 和智慧学习流(SmartLearning Stream,2015)都和大数据学习分析相关。大数据分析深入揭示学习成果和学习行为之间的各种关系,帮助优化教学过程、了解学生状态、增加学习内容,是实现基于自适应学习(Adaptive Learning)的个性化教育的重要机制。目前我们还在关注和研究在混合学习模式下,如何打通数据收集和分析的线上和线下闭环,从而为翻转课堂等新的教学模式提供大数据分析支持。

葛涵涛:确实如您所说,在线学习是科技对教育的重要改变,那么在线学习领域又是如何应用大数据的?

陈滢:在线学习主要的学习任务包括视频观看、在线练习和测试、论坛互动等,每种活动都产生大量数据,需要不同的机器学习算法从数据中提取有价值信息。例如视频观看行为,我们记录学生的观看动作(前进、暂停和回退等),从大量学生动作分析中捕捉到在某个微视频处有大比例的暂停和回退动作,这潜在意味着该视频时间点所对应的知识点可能有教学设计上的不足,进而和老师沟通进行重新设计。围绕视频大规模的标注和笔记(类似在线影视的弹幕)可以有效对视频进行基于众智的语义标注,方便视频搜索和要点自动生成。也有学者在研究利用贝叶斯统计分析进行同伴评阅(Peer Review,一种在MOOC大规模参与学习者中进行同学互评的方法)后的机器自动评分和排序;利用聚类分析总结学生在线学习的行为,促进课程和学习路径优化;利用NLP等技术在论坛中找到可能辍学的学生;利用回归分析和神经网络等方法获得各种影响学习的参数和学习效果之间的关系。总之,学习分析和教育大数据挖掘可以在很多方面真正帮助优化教学,提升学习效果。我用一句话总结大数据对学习的作用:Deep learning deepens learning。

葛涵涛:最后,请您给企业一些在大数据人才发展方面的建议?

陈滢:大数据是很多企业的战略,而人才则是战略中的战略,目前在市场上大数据人才炙手可热,大数据企业应该更加注重人才培养,注重研发人员的知识更新和迭代。优秀的大数据企业很多都在通过传播知识和对社区的影响,建立生态和人才优势。我们愿意和大家一起为大数据人才培养和知识传播共同发力,为中国的大数据事业发展添砖加瓦。

 

中国首席数据官联盟(中国CDO精英俱乐部)是国内首个以CDO为核心的公益性联盟,发起人是刘冬冬、鲁四海、葛涵涛。联盟遵循自愿、平等、合作的原则,为推动中国大数据产业创新发展而努力,为实现中国大数据产业全球领先而奋斗。联盟努力打造跨行业、跨领域的大数据精英交流平台,目前已经汇集了数万名来自国内外知名企业、科研机构、高校的大数据精英,已经成为国内最大的以CDO为核心的大数据智库。希望通过我们的努力,推动中国大数据产业的进步与发展,提升CDO(首席数据官)在企业中的地位,促进各行业的大数据应用升级,帮助企业实现以数据为核心竞争力的转型。