从大数据到计算教育学：概念、动因和出路

> 中国论文网 >
政治论文 >
从大数据到计算教育学：概念、动因和出路

从大数据到计算教育学：概念、动因和出路

来源:用户上传作者:王晶莹杨伊郑永和夏惠贤

　　摘要：在大数据时代，计算社会科学是社会科学发展的必然走向，教育学作为社会科学的重要分支，同样面临着向计算教育学转型的形势。计算社会科学的兴起催生出一系列亟待明确的核心概念，极大地超越了传统社会科学研究范式。从新计算社会学出现的过程、从大数据时代的背景和特征、从传统研究范式的局限，足以见出计算教育学出现的必然性。在这一过程中需着重处理好四个关键问题：积极适应计算教育学的思维方式;技术繁荣与理论繁荣齐头并进;增强数据挖掘能力以争取話语权;变被动为主动回应时代和政策要求。
　　关键词：大数据;计算教育学;计算社会科学
　　中图分类号：G434
　　文献标识码：A
　　近年来，大数据（Big Data）为社会科学的发展带来了极大的机遇，计算社会科学是大数据时代社会科学发展的必然结果。所谓大数据时代，就是“以系统数据为基础充分而深入挖掘数据内在关系”[1]。过去人类获取的社会数据是有限的、间段的、片面的，但随着收集和处理海量的社会数据能力的空前提升，旧的范式无法解决太多的问题而出现了“科学危机”，新的社会科学研究范式呼之欲出。教育学作为社会科学的一个种类，必然无法回避范式转型的浪潮，如今，计算教育学仍是一个处在萌芽期的新生事物，要正确、全面地认识教育学的这一分支，就要把握住计算社会科学总的发展脉络，明确大数据的范式特征。
　　一、大数据与计算社会科学
　　大数据催生了计算社会科学这门新兴的学科，通过学科交叉帮助人们更好地认识复杂社会现象背后的规律和作用机理，计算社会科学打破了自然科学与社会科学的长期隔离，是一种数据驱动的研究范式，背后是白下而上的思维方法，是对传统研究范式的超越。
　　（一）核心概念辨析
　　大数据时代的到来带来了很多新生的概念，“大数据”本身就是一个内涵丰富且值得推敲的核心概念，除此之外还有“数据密集型计算（Data Intensive Computing）”“社会计算（SocialComputing）”“计算社会科学（Computational SocialScience）”等等，这些概念在实际研究中存在着不同程度的模糊和混用的情况，因此，急于将新范式投入具体学科是不明智的，正确定位核心概念、厘清概念间的关系是深入到社会学、教育学、经济学、政治学等具体学科的前提。
　　首先，关于“大数据”与“数据密集型计算”是一组容易在研究中混用的概念，将二者等价亦或是都视为研究范式的观点是不合理的。有研究者曾对此做过专门的辨析，并对“数据密集型计算”做了严格的界定，数据是其核心，系统负责获取用以维护持续改变的数据集，实现大数量并行计算和处理[2]。从定义中我们不难发现，数据密集型计算是数据获取到管理再到分析、理解的过程[3]，其本质是一种方法。相比之下，大数据并无明确的定义，因为“大”本身就是一个相对的概念，研究者多是从大数据特征出发进行描述。董春雨教授在综述国外研究的基础上提出“大数据是一种思维方式、一种世界观理解世界的方式”[4]。严谨地看，这种定义是准确的。库恩认为，“范式”内在地包含了信仰、价值、技术等方面，是某一共同体中的个体共同遵从的世界观和行为方式，也是常规科学要紧密依赖的理论基础和实践规范[5]。依从库恩的界定，技术是范式的重要组成部分，而方法是技术层面的核心，可以说，研究方法是范式的重要表现形式，方法的选择与转变的背后是价值观念、思维模式的转型，不同方法在研究中的“此消彼长”正是哲学思想的涌动。而哲学界产生的“计算主义思潮”成为了大数据范式的思想基础，这一思潮包含着“宇宙是一部巨型计算装置”“整个世界是由算法控制”的隐喻，自然规律作用于计算过程，进而支配着一切自然事件，事物之所以呈现出多样性均是源于算法复杂程度的不同[6]。美国计算机图灵奖得主吉姆·格雷（Jim Gray）把科学研究走过的阶段分为经验科学、理论科学、计算科学和数据密集型科学[7]，相对应的，18世纪以前为经验范式，18-19世纪为理论范式，20世纪中期到21世纪初为模拟范式，本世纪初至今为第四范式。尽管各国由于技术水平、理论水平、研究传统等多方面的差异，时间段的划分不一而同，但是可以确定的是，如今我们正在经历着由计算科学向大数据科学的过渡，这一变化的发生冲击着科学研究的各个领域。而从定义人手，数据密集型计算显然是一种数据处理方法，它与大数据的关联就在于，这是大数据处理的核心方式非唯一方法，绝不是包含了世界观的时代转型，更不是科学革命意义上的“范式”。
　　“社会计算”与“计算社会科学”是两个重要的概念，其中社会计算进入人类社会总体上有两方面的动因，一是社会系统中的复杂社会现象需要复杂性科学理论来描述，另一方面是计算机作为基本研究工具，用以解决复杂性问题成为可能。白1994年社会计算第一次被提出起，不断有学者对其内涵做出阐述，总体上围绕两个方面：计算设备发挥着交流媒介的作用，目的是理解社会过程。总体上讲，社会计算有两种发展趋势，一是面向社会科学，二是面向技术应用[8]。计算社会科学属于前者，是面向社会科学的社会计算的一个具体研究领域，与之相并列的还有社会网络分析等等。从本质上讲，社会计算既不属于自然科学，也不属于社会科学，曾有研究者将三者关系绘制如图1所示，社会科学与自然科学的长期分离被形象喻为相对的两岸，自然科学居于河的左岸，是以科学计算为核心研究范式;社会科学居于右岸，包括心理学、经济学、传播学、社会学、政治学等[9]。社会计算正是自然科学与社会科学的沟通与联手，以互联网兴起、在线实时数据的公开为前提，以数据挖掘为核心技术，计算社会科学作为其中的研究领域之一，近年在Science和Nature等顶级期刊上亦有成果不断涌现。大卫·拉泽（David Lazer）等15位美国学者在Science联合发表了《计算社会科学》（Computat.ional Social Science）[10]，吉姆·贾尔斯（Jim Giles）在Nature发表最新进展的研究综述《计算社会科学：建立联系》（Computational Social Ccience：Making the Links）[11]这些具有里程碑意义的研究标志着计算社会科学时代的兴起。　　（二）计算社会科学对传统研究的超越
　　从宏观上的学科分野上看，计算社会科学对传统研究的超越表现在它打破了自然科学与社会科学的长期隔离。由于思维方式的差异，图1中“两岸”长期处于对垒状态，社会科学是“总体逻辑思维”，关注独立个案的整体分布，将变异视为社会现实的本质。不同的是，自然科学是“类型逻辑思维”，关注典型现象，并将其呈现出的规律加以概括，进而推广到个体和具体问题[13]。直到上世纪50年代之前，两者仍是相对独立的，直到信息革命开始，人类面临的问题愈发复杂，社会科学与自然科學研究者开始意识到，仅仅立于岸的一边是无法揭示问题的实质的。以社会科学研究为例，复杂的社会问题需要结束严谨的数学方法进行求解，特别是随着互联网的发展和计算机性能的提升，大数据的获取与处理成为可能，过去无法处理的问题在新范式下找到了解决的突破口，而这种全新的范式正是“大数据”，自然科学和社会科学开始走到一起联手面对社会问题。具体到研究范式，大数据范式在我国仍是一个新生事物，但它对社会科学领域产生的影响已是不争的事实。为进一步提炼其特征，将传统研究范式与计算社会科学的新范式进行对照，如表1所示。
　　从传统研究到计算社会学的研究，纵向比较来看，传统的研究范式始于假设，是一种自上而下的研究：从现象中发现问题，从理论中建立假设，从整体中抽取有限的、有代表性的样本，最终对假设进行验证。目前用于社会科学的研究方法，不论思辨研究还是实证研究，亦不论是质性研究还是量化研究，都有不能克服的局限：无法摆脱主观认识干扰，无法确保样本的代表性，结论推广面临的诸多难题。肯尼斯·丘吉（Kenneth Church）是自然语言领域泰斗，他2012年的《钟摆摆得太远》（A Pendulum Swung Too Far）深度反思了传统研究范式到计算社会科学的变革，在近三十年经验主义的黄金时代，唾手可取的低枝果子已经被当代学者使用统计学的方法采撷，下一代面临的必将是“难啃的硬骨头”[5]。计算科学哲学资深学者拉斐尔·阿尔瓦拉多（Rafael Alvarado）和保罗·汉弗莱斯（PaulHumphreys）在“已知的已知、已知的未知、未知的未知”的知识分类中，加入第四类——未知的已知，即机器经验的知识（计算机已知而人类可能未知）[5]。知识存在的认知论研究中，知识对人类的不透明来自多方面，传统研究范式属于算法偏见导致知识获取的不公平。计算社会科学与传统研究范式相比，最大的超越之处就在于它不再始于假设，而是从海量的数据中进行归纳，是一种数据驱动的研究范式，背后是白下而上的思维方法。可以说，计算社会科学掀起的范式转型的风波必将是颠覆性的，它具有四方面的显著特征：
　　首先，整体代替抽样，研究样本几乎覆盖所有研究对象。计算社会科学始于数据，基于数据，对数据量的需求远大于传统研究。它在摆脱样本量或样本代表性困扰的同时也对数据的挖掘与获取提出了更高的需求，与此同时，随着样本量的无限扩大，对数据混乱、易变的包容性也不断增大，对数据的精确性要求则有所降低，在新的研究范式下，数据多样性、即时性与宏观层面的洞察力成为了新的追求。
　　其次，从因果到关联，新的思维模式正在建立。传统实证研究更关注现象的解释，或通过控制变量揭示现象背后的成因，这一过程不可避免地受到研究者价值观的影响。大数据时代的社会科学研究将对体量庞大、类型多样的数据集合进行对比分析、交叉检验和聚类统计，更加强调发现而非证实，相关关系的并联思维也将逐渐取代因果关系的线性思维而占据主流[7]，计算社会科学更加关注的是从海量的数据的相关关系中发现问题并预测趋势。
　　再次，从搜集到挖掘，以样本整体为对象的研究成果更易于迁移。传统社会科学研究中，问卷调查是最主流的数据获取途径，问卷的编制具有很强的针对性，研究目的先于研究过程。这一范式的隐患就在于主观性高、可信度低的数据束缚了结论的迁移范围。计算社会科学采用“自然数据”的特征与优势正在于此，数据不受研究者主观认识的影响，先于研究目的而存在，由此得来的结果不仅客观且易于推广和迁移。
　　最后，不论是传统的研究范式还是计算教育学的新范式，都对理论水平提出了较高的要求。计算社会科学虽是以数据为根本，但就数据论数据必将忽视人性。对大数据分析要上升到社会科学层面，就是要用社会科学的理论指导社会计算，避免陷入“唯数据主义”的泥潭。因此，计算社会科学对理论功底的要求并不逊色于传统的研究范式，因为没有理论做诠释的数据是混乱而缺乏意义的，没有数据支撑的理论也是没有根基与说服力的。
　　二、计算教育学出现的必然性
　　计算社会科学的发展已是必然趋势，但目前仍处于初步发展期。当代社会科学的研究正走在时代变革的转折点，成功收集和严格分析大数据开展计算社会科学研究需要新的技能、新的合作、新的研究方法和新的计算工具。计算教育学的出现是计算社会科学发展的必经之路，基于大数据的研究范式不可避免地促使计算教育学的萌发。
　　（一）从大数据研究的群体看计算社会科学
　　世界第五大学术出版商塞奇出版公司（SAGE Publishing）于2016年对全球社会科学家进行了一项计算社会科学研究群体状况的调查，研究结果形成了白皮书《从大数据研究的趋势看计算社会科学的参与群体》[18]。该调查由9412名受访者完成，受访人群中高校为主（84%），还有政府机构、非营利性机构、工商部门等。在受访者中，有3160人（33%）报告说他们参与了使用大数据的研究，剩下的66%表示他们没有参与。但未参与大数据的6238名研究者中，82.6%的受访者不同程度上在未来有参与大数据研究的考虑，这意味着，绝大多数研究者对于大数据是持接受和认同的态度的。
　　在使用大数据进行研究的群体中，72.3%的受访者只有一些或很少一部分研究与大数据有关，并且计算社会科学中大数据应用最为广泛的是社会统计和研究方法，经济学次之，教育学中只有30%左有的人员从事的研究与大数据相关，具体分布如图2所示。上述调研结果给我们一定的启示，一方面从数量上看，计算教育学具有明显的萌芽期特征;另一方面计算社会学是计算社会科学中较为成熟的领域，计算教育学的发展可以从计算社会学的脉络中受到启发。此外，大数据研究者根据专业特征会使用不同类型的数据源。行政数据的使用最为广泛，55%的受访者（1690人）在最近的大数据研究中使用了此类数据。29%的受访者（927人）使用某种社交媒体数据（Facebook、Twitter和其他社交媒体）进行研究，中国研究人员更多地选择微博、百度和微信。第三种最常用的数据类型是商业或专有数据，包括有23%的受访者（697人）。研究者在进行大数据研究时面临的最大挑战是数据集太大需要分布式计算基础设施，常用的大数据软件或编程语言包括Python，R、PostgreSQL、SAS、Netezza和Coogle BigQuery等。大数据研究者面临着独特的问题，原因在于该领域的跨学科性质，以及其在社会科学中的相对新颖性。许多社会科学家已经开始接受大数据带来的挑战，并且希望将来能够在更大范围和更深入地参与这种研究。　　（二）从新计算社会学的出现看计算教育学
　　在以大数据为基础和支持的环境下，2009年，哈佛大学教授拉泽等15名顶级学者在ScienCe上的联合发文标志着“计算社会科学”的诞生。2014年，斯坦福大学计算社会科学中心（Center forComputational Social Science）召开了“新计算社会学”的学术研讨会。从“计算社会学”到“新计算社会学”， “新”源于两个方面：一方面是新计算社会学在理念、方法、思路、工具应用等方面比此前的社会学研究中的“计算”都更为先进和复杂;另一方面则是“计算社会学”（ComputationalSoc，iology）这个名词已在乔治·瑞泽尔（CeorgeRitzer）2007年IL版的《布莱克威尔社会学百科全书》（Blackwell EnCyclopedia of Sociology）中出现，其内涵有别于新计算社会学[19j。事实上，从拉泽提出计算社会学到新计算社会学讨论会召开，其间的五年是社会学家探索“计算”背后的学科差异的历程，这段深刻的探索让社会学家逐渐意识到，尽管都是基于计算机科学、互联网与人工智能的有效应用，但计算社会科学的理路、方法与工具对于社会学的研究和具体问题的解释力有限，社会学有其特定的研究对象、研究方法和理论解释框架，新计算教育学在计算教育科学的笼盖下义经过了五年的酝酿应运而生。
　　不仅仅是社会学，社会科学所包含的社会学、经济学、政治学、教育学等学科都有其自身的学科发展特征、特定研究群体、理论解释框架和研究方法，社会学家在大数据的浪潮中已然看到扎根于本学科建立以“计算”为核心的新计算社会学的必要性。反观教育学领域，尽管计算教育学还未脱离社会科学而白立门户，很多研究者尚未明确意识到数据在教育研究中的巨大能量，但大量的基于大数据的教育学研究的问世已成为不争的事实。如今世界各国教育研究者已将关注的重点聚焦在以计算教育学为代表的个性化学习，新研究范式的开启已成为不可逆转的趋势。由新计算社会学从计算社会科学中“分离”与“重建”的过程不难看到，计算教育学自立门户将随着数据的大规模使用成为必然。
　　（三）从大数据时代看基于数据的研究范式
　　每一代的研究者都面对着不同的社会发展水平，这应当成为社会科学研究者分析、思考问题的逻辑起点。在飞鸽传书的时代、电话刚刚问世的时代、计算机普及的时代、人工智能时代等等，研究者的视野、视角、可利用的资源都有着天壤之别，思想观念和思考问题的方式必然要与时俱进。多数国家都已经意识到，在互联网技术飞速发展的今天，教育面对的是“数字时代原住民”，其学习和生活方式与前工业化时代、工业化时代和后工业化时代的学习者存在本质差别。2015年联合国教科文组织召开的国际互联网教育合作伙伴会议，勾画了“以学习者为中心”的数字化学习生态系统的愿景[20]，该系统具有动态、负责、公平和可持续的特征。如今人类已经进入了大数据时代，时代的变化意味着不仅是教育学的知识和教学的内容需要更新，教育学研究范式同样要紧紧跟随各领域的趋势，转型迫在眉睫。
　　拉泽在文章中指出：“计算社会学”正在兴起，数据收集、数据利用水平的提升必将极大地推动社会科学研究的深度和广度。Nature在2012年8月刊发了一篇计算社会学领域最新进展的综述，综述提到了康奈尔大学的社会科学家米歇尔·梅西（Michael Macy）的评论，她把大数据给社会学带来的机遇，等同于粒子加速器给物理学带来的机遇，以及功能磁共振成像给神经系统科学带来的机遇。美国社会学家纷纷表示，在20世纪70年代，不敢想象可以大规模地利用这些数据进行研究。如今之所以成为现实，主要源于计算机技术的提升，这是计算社会科学发展的外部条件，更是教育学诞生的外部动力。
　　（四）从旧研究范式的局限看新范式的突破
　　与此同时，基于大数据的研究范式的诞生也是各个学科发展的需求。类比新计算社会学对社会学研究的贡献，可知基于大数据的研究范式不仅解决了传统范式不能解决的问题，而且纠正了根深蒂固的错误认识。
　　社会学中有一个依靠大数据证实的经久不衰的社会科学理念就是“弱连接”的重要性，即指相隔较远且很少碰面的熟人间的关系。该理念最初是由斯坦福大学的社会科学家马克·格兰诺维特（MarkCranovetter）在1973年提出的，直到2007年，才被哈佛大学网络科学家的尤卡·佩卡翁内拉（JukkaPekka Onnela）的团队证实，证实的途径正是利用了四百萬手机用户的数据。但是在前数据时代是无法证明弱连接发挥社会桥梁作用的。大数据除了可以解决问题还可以推翻一些根深蒂固的错误认识。在关于社会网络中的传染性研究中，人们理所应当地认为，一个人所接触到的接受某一观念的人数越多，他接受该观念的几率就越大。但是事实却是：观念的传播取决于让他们坚守该观念的人的多样化，所谓“多样化”是接受该观念的人群隶属于不同的社会群体的数目。推翻这一谬误的是约翰·乌甘德（Johan Ugander）正是利用了脸谱网的约9亿用户数据。可以说，传统的社会科学研究范式由于过分依赖个人经验和研究假设而存在着较大的局限性。类比之下，目前计算教育学远不及新计算社会学发展成熟，但可以肯定的是基于大数据的研究范式必然会为教育问题的破解提供新的思路，可以解决基于经验和假设的研究范式不能解决的问题，纠正长期存在的认识上的谬误。
　　三、我国计算教育学发展出路探索
　　党的十九大作出了优先发展教育事业、加快教育现代化、建设教育强国的战略部署，以此为标志，教育信息化从以“教育信息化”为重点的1.0时代进人到以“信息化教育”为重点的2.0时代。今年2月，党中央、国务院发布了《中国教育现代化2035》，从战略背景、总体思路、战略任务实施路径和保障措施等五个方面全面系统地规划了教育现代化建设进程。从2015年“互联网+”首次被纳入国家经济的顶层设计，到今天从政策层面提出了教育现代化的发展要求，教育研究范式应时代发展需求迎来义一次关键性的跨越。为使得教育更好地服务中华民族伟大复兴，为使教育研究的成果能更好地用于大数据背景下的教育实践，教育研究范式在向计算教育学的飞跃与转变过程中需着重处理好四个关键问题。　　（一）积极适应计算教育学的思维方式
　　新中国成立后的任何一个阶段，思辨都是我国教育学研究最主流的方法，这有着深刻的文化根源。在各类研究范式中，思辨研究是基于“中学”的一种研究范式，它与我国研究者的思维方式高度统一。我国传统文化孕育和培植了丰富的直觉思维观念，宋明理学更是集儒道佛三家之精髓，提出了“穷理悟性”[21]。五四运动之后，国外的研究方法被大量引入和借鉴，在20世纪20-40年代，“唯科学主义”的认识虽然短暂席卷教育研究领域，最终也未能撼动思辨在我国的地位。而今，教育学研究范式面临着向计算教育学范式转型，在我国面临的最大的挑战就是我国研究者对新的思维模式的适应性。理性思辨是由感性认识上升到理性认识的过程中凝练思想观点的一种方法，主要依赖于研究主体的理性思维活动[22]，感性认识向理性认识飞跃的过程中，“灵感”扮演着重要的角色，好的思辨研究需要强大的直觉思维做支撑，需要严谨的逻辑对预设的结果做出解释。而计算教育学是数据驱动的一种研究范式，与我国教育研究者最习惯也最擅长使用的研究范式有着质的区别。我们无法评判两种范式的优劣，更无法武断地说哪一种范式更能逼近教育活动的本质，但可以肯定的是.计算教育学在我国要得到真正的应用和发展，研究者必然要从单一的思辨研究中解放出来，将真实的教育问题置于时代背景下重新审视。这是一个漫长而艰辛的过程，处于萌芽阶段的计算教育学既需要理论的建构，义需要有操作化的解读，更为重要的是，国人应当积极适应计算就学需要的思维方式，如此才能使新的研究范式免于束之高阁或流于形式的厄运，真正为研究者接受和适应，为教育研究服务。
　　（二）技术繁荣与理论繁荣齐头并进
　　目前，教育技术大量转化为琳琅满目的产品，其本质是对教育内容进行包装，辅助学习，这只关注了教育技术浅层的价值。教育技术的价值可从两方面进行探讨，一方面是将技术转化为教育产品服务于教学，另一方面则是技术发展对科学研究范式转型的驱动。前者是技术层面的问题，由于它可以直接投入应用，回报周期短，成果真实可见，人们往往更乐于捕捉技术层面的价值;后者基于将技术置于人文视角下观照，通过哲学的思考转化为对基本理论研究无形的贡献。在很多人看来，基础研究抽象的回报逊色于具体的产品，这导致教育技术出现了严重的价值倾斜，本该两条腿走路的教育技术明显向市场化的方向偏移，表面的繁荣遮蔽了基本理论的薄弱和缺失。大量研究者执着于产品开发，在技术研究的道路上越走越深，而在研究层面的价值仍是待开垦的处女地，这对于目前面临的研究范式转型是极为不利的。
　　要处理好教育技术两个层面价值的关系，使技术繁荣与理论繁荣齐头并进，首先要对两种价值的关系有客观理性的认识。目前，技术的教学辅助功能正在蓬勃发展，各类在线学习工具性能日益完善，学习过程产生的大量数据将被强大的互联网技术记录下来，技术对教学的支持越是全面，对研究的支持就越是坚实。有学者将技术的支持作用总结为四个方面，包括追踪作用、计划作用、教学支持作用和评价作用[23]，各个环节无缝衔接，基本覆盖了学习的全过程。学习过程中有价值的信息被全面地捕捉，教育大数据应用的关键在于挖掘数据背后的教育现象和教育规律[24]，这一过程主要通过学习分析和数据挖掘来完成，教育研究将以新的视角从数据层面理解学习行为，采用量化研究T具分析学习过程，用以将在线学习产生的海量数据优化学习环境，并以此作为评估学习过程、进行有针对性干预的依据[25]。更为关键的是，大量的数据还将彻底改变过去基于假设的研究范式。传统的思辨研究和实证研究都没有跨过研究者假设的藩篱，而教育是一个复杂的过程，人类有限的假设无法预知所有的教育问题。由于研究范式的限制，大量的有意义的发现和变量之间深层的关联必然游离于研究者视线范围之外，这对我们解开教育问题真实的面纱是不利的。技术的发展打破了传统范式的禁锢，将学习过程转化为海量的数据，这些数据不以研究者意志为转移，以更客观和全面的方式呈现出来。计算教育学就是摆脱了用已有的知识解释主观假设的传统研究范式，寻找客观数据间的相关关系，让技术真正为研究服务。
　　综上所述，教育技术的价值复杂而多元，教育技术两方面的价值完全有可能齐头并进，各类学习辅助工具在飞速发展的同时要不忘为理论的繁荣带去滋养。因为两类价值本质上是相互沟通相互制约的，技术的完善可以为研究范式转型提供更丰富的数据支持，而理论的发展也会促进技术突破瓶颈。
　　（三）增強数据挖掘能力以争取话语权
　　计算教育学的来临意味着数据挖掘能力将在很大程度上推动或制约研究水平，对比已经相对成型的计算社会学，二战之后的七十多年里，美国始终走在全球社会科学研究的前沿，美国意识形态主导下的社会学计量范式（QuanLitative Paradigmof Sociology）风靡全球，西方学界长期主导了世界社会科学发展的话语权。在大数据时代来临的今天，社会学的计算范式取代定量范式依然在美国率先发生，这一次社会学革命为美国继续保持学术的主导地位奠定了极为有利的基础[26]。反观教育学领域，同样遵循着这一逻辑，尽管计算教育学仍处在萌芽期，话语权的争夺已悄然而至。西方国家把“大数据”称为“未来的石油”[27]，这意味着谁具有更强大的数据挖掘技术，谁就在大数据时代有更强大的计算能力，在垄断数据的同时垄断教育研究的话语权。
　　我国人口众多数据丰富，这是教育学在大数据时代蓬勃发展的有利条件，也是我国教学研究弯道超车的重要机遇。要把握好向计算教育学研究范式转型的契机，不仅需要加强数据挖掘能力的开发，更要懂得创新数据的综合应用。教育学的研究不能禁锢于本学科的樊笼而仅关注教育相关数据的采集，应当“将教育基础数据库与国家人口基础信息库、宏观经济信息库、财政信息库等不同行业的数据库进行多方数据的融合、对接”，在更广泛的来源中发现相关关系，推动研究向纵深发展。我们无意垄断教育学研究的话语权，而是要借研究范式转型的契机建构其具有中国特色的教育学理论体系，打破70年来移植、借鉴的局面。目前，加强数据挖掘能力，鼓励多领域合作，数据资源共享是我国教育学研究应对挑战的必然选择。　　（四）变被动为主动回应时代和政策要求
　　有教育才有教育研究，有教育研究才有教育研究范式，教育问题多样化与教育研究范式多样化是同时存在的，而教育现代化与教育研究现代化也应当齐头并进。我国教育的历史虽然悠久，但是教育研究范式却长期落后。新中国成立至今的70年，我国教育研究范式的转型或是政策驱动，或是明显落后于时代发展需要而不得不转型。计算教育学的m现与过去有所不同，它是介于政策推动与社会发展需要之间，十九大报告对教育做出了战略部署，这意味着教育将迎来绝佳的转型契机，教育研究的转型也恰逢其时。《中国教育现代化2035》不仅立足于时代而且具有前瞻性，在政策指引下我国教育研究具备了“弯道超车”的可能和条件。在积极的政策环境下，研究者何以转换延续几十年的陈旧研究范式，何以驱使教育学这一传统学科变被动为主动而摆脱范式转型的惰性，何以让适应“信息化教育”的计算教育学尽快为教育研究服务，这是我国教育研究者不能回避的问题。要走好这关键的一步，研究者要站在一定的高度重新审视传统的思辨与实证之争，定量与定性之争，为新的研究范式找到最佳“植入点”，推动不同研究范式之间的融合。如此，一是可以保留我国教育研究范式中的精华，特别是理性思辨中强大的逻辑性和思维的跳跃性，这一优势在计算教育学中同样可以得到充分的发挥;二是可以有效地避免“一边倒”或“矫枉过正”的结果。改革是一个摆动中螺旋上升的过程，但是客观理性的改革思路仍可以避免弯路，以此推进教育研究的现代化进程，并坚持以学术自信传承教育研究的“中国魂”，在国际舞台讲好中国的教育故事、彰显中国教育研究的文化立场，如此，才能不负使命迈入教育强国的行列。
　　参考文献：
　　【1】高书国.大数据时代的数据困惑——教育研究的数据困境[J].教育科学研究，2015，（1）：24-30.
　　【2】【4】董春雨，薛永红.数据密集型、大数据与“第四范式”[J].自然辩证法研究，2017，33（5）：74-80.
　　【3】美同太平洋西北国家实验室.数据密集型计算项目[EB/OL].http：//dicomputing.pnl.gov/2019-06-01.
　　【5】T.S.库恩.科学革命的结构[M].上海：上海科技出版社，1980.29.
　　【6】李建会.走向计算主义[J].白然辩证法通讯，2003，25（3）：31-36.
　　【7】Hey T，Tanslev S，et al.The Fourth Paradigm： Data-lntensive Scientific.Discoveiy[M].Washingtong D.C：Mic：rosoft Research Press，2009.
　　【8】【9】孟小峰，李勇等.社會计算：大数据时代的机遇与挑战[J].计算机研究与发展，2013，50（12）：2483-2491.
　　【10】Lazer D7Pentland A，et al.Computational Social Science[J].Science，2009，323（5915）：721-723.
　　【11】Cile J.C.omputational social science：Making the links[J].Nature，2012，44（7412）：448-450.
　　【12】Castellani B，Hafferty FW.Sociology and Complexity Scienr，e：A NewArea of Inquiry[M].Berlin：Springer，2009.
　　【13】谢宇.社会学方法定量研究[M].北京：社会科学文献出版社，2012.1-31.
　　【14】【17】邹太龙，易连云.从“始于假设”到“基于数据”——大数据时代教育研究范式的转型[J].教育研究与实验，2017，（4）：74-79.
　　【15】Churr，h K.A Pendulum Swung Too Far[J].inguistics issues inLanguage rechnology，2011，6（5）：1-27.
　　【16】Alvarado R，Humphreys P.Big Data，Thick Mediation，and RepresentationalOpacity[J].ew Literacy History，2017，48（4）：729-749.
　　【18】Metzler K，Kim D A，et al.Who is doing computational socialscience？ Trends in hig data research （White papernRJ.London：SACEPuhlishing，2016
　　【19】罗玮，罗教讲.新计算社会学：大数据时代的社会学研究[J].社会学研究，2015，30（3）：222-241.
　　【20】张生.构建新时代的计算教育学[N].中国教育报，2018-04-07（003）.
　　【21】【22】栗洪武.理性思辨研究方法在教育科学研究中的运用[J].陕西师范大学学报（哲学社会科学版），2011740（2）：165-169.
　　【23】Asino T.Positing the Future[J].TechTrends，2014，58（5）：14-19.
　　【24】孙志伟，李小平.系统整合视角下教育大数据应用研究[J].中国电化教育，2018，（11）：111-117.
　　【25】陈明选，俞文韬.信息化进程中教育研究范式的转型[J].高等教育研究，2016，37（12）：47-55.
　　【26】罗玮，罗教讲.新计算社会学：大数据时代的社会学研究[J].社会学研究，2015，30（3）：222-241.
　　【27】陈金华，陶春梅等.面向大数据的教育信息化持续推进模型建构[J].中国电化教育，2019，（6）：52-57.
　　作者简介：
　　王晶莹：教授，双博士后，博士生导师，研究方向为科学教育、工程教育和教师教育的国际比较（wangjingying8018@126.com）.
　　杨伊：在读博士，研究方向为课程与教学论（839011560@qq.com）。
　　郑永和：教授，硕士，博士生导师，研究方向为教育信息科学与技术、科技与教育政策（zhengyonghe@bnu.educn）。
　　夏惠贤：教授，博士，博士生导师，上海师范大学教育学院院长，研究方向为课程与教学论（xiahuixian@shnuedu.cn）。
转载注明来源:https://www.xzbu.com/1/view-15215628.htm

查看更多→

从大数据到计算教育学：概念、动因和出路

相关文章