中国教育报专访EMBA校友江青:大数据时代改革的靶向治疗

作者:发布时间:2016-04-06浏览次数:59

江青,中国统计信息服务中心大数据研究实验室主任,中南财经政法大学EMBA,高级公关员、大数据研究实践者。

历任广播电台电视主持人、制片人、专栏作家、报社记者/主任、协会副秘书长等职,对政府、企业等标准化管理、数字管理、公共关系等具备丰富经验,曾任数家知名公司顾问等,多年来致力于研究探索“品牌标准营销”、“公共关系及媒体传播”、“大数据研究与领导者决策”等。

近年来,“大数据”成了人们口中的一个“热词”,“大数据告诉你……”也成了众多用以吸引眼球、增强权威性的文章标题。大数据对社会生产和生活的影响,在教育以外的行业已经非常明显,但在教育领域还处于起步阶段。

教育关乎国计民生,教育问题又异常复杂,大数据在重塑教育方面具有无限的潜能。那么,大数据怎样才能有效驱动教育改革?大数据进入教育领域面临着哪些困难与挑战?为此,中国教育报记者专访了中国统计信息服务中心大数据研究实验室主任江青。

我国教育大数据发展尚处于基础期

记者:自从2011年美国著名的咨询公司麦肯锡发布《大数据:创新、竞争和生产力的下一个前沿领域》的研究报告以来,“大数据”便成为近年来对人类思维和社会各领域冲击最为强烈的一个“热词”。但是,许多人对何为数据却一知半解。那么,数据是什么?教育小数据与教育大数据之间有什么联系与区别?

江青:无论大数据还是教育大数据,都不仅仅是数据本身的大小描述,而是由数据引发的各种关联工作和解决方案。教育大数据就是教育统计插上了信息化的翅膀,变得比统计和信息化本身对人类更有价值。教育小数据是指没有信息化关联的一个个数据集,或者说教育数据孤岛,这些独立的数据不是没有作用,而是相对大数据来说,其分析结果和价值很多时候不如大数据客观和强大。

记者:大数据对社会生产和生活的影响,在教育以外的行业已经非常明显,但在教育领域还处于起步阶段。教育大数据会给教育改革与发展带来哪些影响?

江青:我国教育大数据发展尚处于基础期。大数据对于教育改革和发展带来的将是传统思维的颠覆、教学效率的提升和教育科研的有效性,甚至会带来教育的终身个性化匹配。除了在线学习,大数据可以用在招生、预算和学生服务等方面以确保透明度,将对学生学习、教师教学、教学科研、校园治理、家校互动、教育决策、就业管理、招生管理、学生成长等方方面面带来很大影响。

实现真正的“因材施教”离不开教育大数据

记者:一般来说,数据是冰冷的,是抽离了鲜活之后的抽象。而教育面对的是活生生的有个性的人,需要因材施教,大数据能否克服传统数据的缺陷,从而关注到学生的个性发展?

江青:大数据分析已经被应用到美国公共教育中,成为教学改革的重要力量。美国联邦政府教育部2012年参与了一项耗资2亿美元的公共教育中的大数据计划。这一计划旨在通过运用大数据分析来改善教育。联邦教育部从财政预算中支出2500万美元,用于了解学生在个性化层面是怎样学习的。

记者:在关注学生个性化发展方面,教育大数据可以提供什么样的服务?

江青:教育工作者和研究者已经开发出从大数据中提取价值的5种主要的技术:预测,预知事实的可能性;聚类,发现自然集中的数据点;相关性挖掘,发现各种变量之间的关系,并对其进行解码以便今后使用它们;升华人的判断,建立可视的机器学习模式;用模式进行发现,使用通过大数据分析开发出的模式进行“元学习”。实施这些技术,就能够通过大数据来创建为提高学生成绩提供支持的学习分析系统。这些技术将帮助教育工作者更加有效地指导学生朝着更加个性化的学习进程迈进。

数据的失真失实是大数据时代必须面对的问题

记者:人们经常说:用事实说话,用数据说话。但是,数据等于事实吗?教育大数据和教育事实是什么关系?

江青:教育大数据是对教育客观的逻辑归纳,是对与之相关的未经加工的原始素材进行采集、处理、研究、应用的一系列工作。教育大数据做好了,可以客观反映教育事实,呈现教育现象,给教育改革提供决策参考。

记者:前不久,“今日头条创始人张一鸣炮轰艾瑞数据失实”的事件引起了人们的关注。怎样才能保证教育数据采集的数据客观、不失实?

江青:应该说,获得相关数据并不是一件容易的事。对于大学阶段的学生而言,数据的收集并不是主要问题。然而,对于中小学阶段的学生而言,挑战却很大,因为有些数据的收集存在法律问题,有的则存在伦理道德(隐私)的问题。

数据收集者的人数和技能也是一个问题。数据的采集需要通过特定的渠道,互联网数据需要用技术手段获取,通常通过网络上的小型文本文件来收集用户的相关信息,但是对于教育部门而言,则需要依赖于全国众多学区和研究者的网络来提炼和确认数据。

核心挑战在于数据分析处理及结果的可视化呈现

记者:在这些数据采集的过程中,如何保护被采集对象的个人隐私?

江青:数据采集的过程会涉及方方面面,对事关隐私的数据当然要考虑当事人的意愿,我们提倡对于收集到的数据进行加工,生产出具体数据产品,而不是直接将教育具体数据对外公开。当然,采集和拥有数据的机构也需要加强法律意识,加强技术保护措施。

记者:对采集到的教育大数据,应该怎样进行科学分析、应用?

江青:过去十几年里,教育领域的技术发展陷入了停滞,研发投入远远不够。教育技术未来发展的关键在于数据。美国教育部门对大数据的运用主要是创造了“学习分析系统”,旨在向教育工作者提供学生到底是“怎样”学习的更多、更好、更精确的信息。

教育大数据一定要落地应用。例如,根据不同的需求调用某教育部门各套系统的数据,结合外部其他单位的数据,教育管理部门可以利用大数据优化教育资源配置,提高教育水平,引导学生成长,共享学习资源。教育大数据可以帮助教育管理部门建立“数字教育地图”,助力教育资源布局优化;建立“智慧教育平台”,助力教育成果管理;建立“绩效评价系统”,提升教育科研创新力。

不加约束地使用教育大数据一定会产生风险

记者:当前,似乎有一种将大数据神话的倾向,但教育大数据不是万能的,人的成长远比我们想象的要复杂的多。在教育领域,是否也有一些方面是大数据不能解释和预测的?

江青:教育大数据可以修正教育过程,使之更加符合教育的本质,但教育大数据的确不是万能的。大数据可以很好地展现一个人的学习过往,也可以预测未来该学生的成长轨迹,但大数据预测他可能会成为一名科学家,可这名学生长大后却有可能走上演艺的道路。作为个人,我们不断地成长、发展、变化,而那些多年来全面收集的教育数据却始终保持不变。

记者:舍恩伯格认为:“我们对潜在后果和概率性结果的预测有加大教育不平等的可能。全面教育数据带来的首个重大威胁,并不是信息的发布不当,而是束缚于我们的过去,否定我们进步、成长和改变的能力。”对此,您怎么看?

江青:学生家长,教育专家长期以来对未成年人的隐私保护问题和对学生的学业追踪带来的后果忧心忡忡,因为这是限制学生未来发展机遇的潜在威胁。大数据不但会放大这些问题,还会改变他们的本质。随着时间的推移,我们会改变看法,调整观点甚至重塑我们的价值观。大数据结果需要结合行业经验才能发挥出巨大的价值,否则将加大因为数据结果的不准确而带来的决策风险。

教育大数据科学发展还需迈过多道“坎”

记者:当前,我国教育大数据发展前景如何?当前主要面临哪些困难?

江青:国家政策已经将我国大数据产业发展定为国家战略,对一系列的政策措施都给出了产业引导和支撑。教育领域在应用大数据上也会面临大数据产业发展中存在的共同问题:大数据思维亟待培育、大数据人才亟待培养、大数据相关标准亟待制定、大数据法律法规亟待建立。

记者:如何克服这些困难?

江青:要克服这些困难,需要教育部门、社会针对性地采取必要的对应措施,例如,针对思维问题,可以由教育主管部门组织行业培训,出台相应政策措施,组织相关活动会议,展示推广大数据在教育领域的应用案例;针对人才问题,清华大学、复旦大学、北京大学、中国教育大数据研究院等一些高校及研究机构已开始启动人才培养,但除高校培养培训之外,还应对在职的统计、信息工作人员进行专业性的培养;针对大数据相关标准制定,标准制定机构需要大数据从业机构的配合,更需要大数据应用对象的配合,凡事预则立,标准制定是大数据产业有序健康发展的基础要件;无规矩不成方圆,大数据产业发展过程中逐渐暴露的问题,如隐私等,都需要有相应的法律法规制约,否则,教育大数据产业谈不上良性发展。