您好, 访客   登录/注册

学习分析技术研究现状综述

来源:用户上传      作者:

  摘 要 首先通过内容分析法,从学习分析的概念及内涵着手,对学习分析技术的国内外研究现状进行综述;其次分析学习分析在教育实践中的具体应用,以国外的成功案例为借鉴,总结影响学习者学业状况的指标;最后对学习分析技术的未来发展抱以期待,它必将为优化学习发挥重要作用。
  关键词 学习分析技术;机器学习;在线学习;教育大数据;Moodle;MOOC;课程信号系统
  中图分类号:G642 文献标识码:B
  文章编号:1671-489X(2019)08-0007-05
  Overview of Research Status of Learning Analytics Technology//WANG Shasha, WANG Mei
  Abstract Firstly, this paper begins with the content analysis method, from the concept and connotation of learning analysis, summarizes the research status of learning analytics technology at home and abroad, and then analyzes the specific application of learning analy-tics in educational practice, taking foreign successful cases as a refe-
  rence. It summarizes the indicators that affect the learner’s academic status, and finally looks forward to the future development of lear-ning analytics technology, which will play an important role in opti-mizing learning.
  Key words learning analytics technology; academic status; machine learning; online learning; big data on education; Moodle; MOOC; course signals system
  1 背景
  自MOOC开始繁荣发展以来,在线学习网络学习平台飞速发展,学习者在线学习产生的数据不断增加,教育大数据日渐丰富。在当今信息化时代,数据价值不言而喻,各个行业都对大数据有极高的价值期待,其中教育领域的专家学者希望借鉴商业智能的成功经验,从数据出发,利用学习分析连接技术与教育,为今后的学习、教学及教学管理提供评价、反馈及建议。
  学习分析作为一个可以连接技术与教育的研究领域,既可以使教育数据发挥更重要的作用,也有利于教育信息化的发展。因此,学习分析在教育大数据应用领域研究中占据重要地位。2011年,新媒体联盟和美国高校联盟在其发布的《地平线报告——高等教育版》中首次将学习分析作为未来影响教育发展的六大技术之一[1],并且在之后的连续六年间,地平线报告中对学习分析均有所提及。这无疑证实了学习分析在教育领域所具有的潜在影响,以及在整个教学、学习及教学管理过程中的应用地位。
  2 概念及内涵
  学习分析,即Learning Analytics。2010年,学习分析专家乔治·西蒙斯认为,学习分析是通过应用智能化数据、学习者数据与分析模型,实现对信息与社会性连接的发掘,并为学习提供预测与建议[2]。西蒙斯对学习分析的定义重视分析模型的作用,关注学习分析的具体应用,以此帮助研究者更方便认识和理解数据中的信息。
  在2011年第一届学习分析与知识国际会议中,参会的专家认为,学习分析是“测量、采集、分析和汇报有关学习者及其学习情境的数据集,用以理解和优化学习及学习情境”[3]。该定义重视对数据在学习分析中的作用,以此认为学习分析的功能在于对学习及学习情境的优化,但对学习分析过程不甚重视。
  2014年,胡艺龄教授等人为学习分析所下的定义是:学习分析技术是教育领域从海量数据中提取隐含的、未知的及有潜在应用价值信息或模式的工具,也是一种决策辅助工具[4]。该定义则是将学习分析技术当作工具,重视应用与技术,用来发现数据潜在信息和辅助决策。
  何克抗教授于2016年发表的论文中,在整合国内外一些定义的基础上,对学习分析的定义表述为:学习分析技术是指利用各种数据收集和数据分析工具,从教育领域的海量数据中,通过收集、测量、分析和报告等方式,提取出隐含的、有潜在应用价值的、涉及“教与学”或“教学管理”的过程及行为的各种信息、知识与模式,从而为教师的“教”、学生的“学”以及教学管理提供智能性的辅助决策的技术[5]。该定义对学习分析的描述较为全面,既提到了对数据的收集和分析,也未忽视对教学过程的分析,并且提到学习分析的作用是为了“教”“学”及教学管理提供智能性的辅助决策。
  通过对各位专家学者给学习分析的定义的解读,可以看出虽未有明确统一的定义,但已有共识。学习分析即通过各种工具对教学过程中各种数据进行收集、管理、分析,并将分析结果反馈于教学中,用于优化学习。本文将学习分析和学习分析技术分开来说,学习分析作为一个将学习分析技术包含在内的大的研究领域,而学习分析技术是学习分析应用过程中有关的工具、方法、使用技术的研究。
  3 学习分析技术的研究现状
  学习分析技术的国内研究现状 关于学习分析技术的研究,本文主要将学习分析技术研究内容按时间顺序进行梳理,以明确学习分析技术的研究现状。国內最早关于学习分析技术的文献是李菁等人[6]于2012年发表的《学习分析技术研究与应用现状述评》,该研究从辨析学习分析的概念出发,就学习分析组成要素和应用模型进行讨论,还对学习分析技术的分析工具、分析方法和技术来源进行了研究分析,最后就学习分析应用案例的一般和特殊情况进行深入剖析。   李逢庆等人[7]的研究从学习分析兴起的原因着手,即学习分析可以根据学习平台中的数据去更好地支持教与学,从而进一步提升教与学的质量与效能。该研究通过梳理之前学习分析的发展脉络,对其过程、工具及方法进行解读,并阐述学习分析对促进大学教学信息化深入发展的价值。
  曹晓明等人[8]做了基于学习分析技术支持的学习者个性化学习平台的研究。该研究以智慧学习为背景,尝试基于学习分析中的动态采集、精确分析、可视化反馈等技术,以构建符合因材施教理念的个性化学习平台。研究通过分析不同学习情境下如何让学习分析发挥其作用和优势,实现对学习者学习的個性化指导。
  胡艺龄等人[4]从当前教育效益未获得预期的高产出这一问题出发,提出学习分析可以从海量数据中发现潜在价值,改善教学,从而提升教育的内外部效益。
  华中师大曾东薇[9]以Moodle平台中开设的一门课程为例,通过收集学习者的学习行为数据,使用定性与定量相结合的分析方法对学习者的学习过程进行分析,最后还对学习分析技术的应用效果进行分析和反思。
  魏顺平等人[10]做了对学习过程数据挖掘与分析应用于在线教学反思的研究。该研究借鉴Moodle平台课程,从辅导教师的角度出发,将学习分析技术应用于在线教学反思。
  陈耀华、孙洪涛和郑勤华等人[11-13]从模型构建出发,利用学习分析技术,分别构建在线学习测评的综合建模、课程评价的模型和教师综合评价的参考理论模型,并在实际教学应用中验证这些模型是否可用。
  高琪等人[14]将学习分析技术与智慧教育环境构建结合起来,从学习分析的一般过程出发,结合对智慧教育的特征分析,论述学习分析在智慧教育环境构建及发展过程中将会发挥极大的作用。
  学习分析应用于具体的教育实践中已经取得一些研究成果。各个专家学者根据学习情境和研究目的的不同,所使用的具体方法并不相同,例如:社会网络分析法是一种根据学习者的群体社会交互行为来定量分析的方法;机器学习算法则更关注学习数据的深入挖掘,通过对机器的训练以实现对个体学习行为的下一步预测;会话分析法是从研究人类语言互动交际入手,以研究会话情境的意义的一种方法;内容分析法是一种对传播内容进行客观和系统描述的研究方法。通过对各种方法的分析,可以看出学习分析并不拘泥于某一种特定的方法,又因为学习系统的复杂性、多样性,针对不同的学习情境,应该采取不同的方法,也可以多种方法结合起来使用,但这些方法的应用其最终目的都是优化学习及学习过程。
  机器学习在教育领域应用的研究现状 机器学习(Ma-chine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能[15]。简单来说,就是使机器能够像人类一样思考,通过经验的学习去改进自身处理信息的能力,智能化地处理信息。
  机器学习作为人工智能研究领域的重要部分,可以应用于对数据的聚类、预测和关系挖掘等。目前,机器学习算法在教育领域的应用也取得一些研究成果。
  Cetintas等人[16]利用机器学习技术识别智能辅导系统中的离题行为。该研究通过自动检测学习者的行为,利用时间特征和鼠标移动特征来比较不同学习者的行为类型,以此预测学习者的学习状态,以及学习者是否处于“离题”状态。
  Wang等人[17]描述了一种适用于第二语言学习,并且考虑各种学生特点的电子学习系统。研究者利用神经网络算法根据学习者在第二语言的在线课程学习记录和个人信息数据建立预测模型,从而预测学习者的学习表现,通过实验验证该电子学习系统能够使学习者的学习表现更好。
  Alkhuraiji等人[18]在在线学习平台中应用贝叶斯网络(Bayesian Network)构建模型,模型以学习者的学习风格为基础,学习平台的演示风格根据每个学生的首选学习风格进行个性化设置,以此为学习者提供适应性的个性化学习内容。
  Lauría等人[19]描述了可用于对开源课程管理的系统数据和学习者学习记录数据进行推理分析的模型,并介绍了使用多种数据挖掘算法对模型进行设计的初步开发结果。他们使用支持向量机(SVM)、C4.5决策树和逻辑回归等机器学习方法分析各种数据,得到关于分类绩效的分析结果,用于实际环境中以预测学习成绩并对危险学生进行早期检测。
  Kotsiantis[20]将机器学习应用于教育数据挖掘,并介绍使用机器学习进行教育数据挖掘的文章,由此提出一个预测学习者成绩的案例研究方案。为了预测学生的表现,降低辍学率和预测课程成功率,通过使用机器学习技术进行学习者学习数据的分析,根据分析结果识别出那些学习动机不足的学习者,并根据学习者不同学习状况,分别给予相应的指导和干预措施。
  Aher等人[21]采用数据挖掘技术从学习管理系统(LMS)中收集Moodle平台中的学习数据,并由此进行聚类和分析,然后向学习者推荐合适的课程。课程推荐可以帮助建立一个智能推荐系统,可以给MOOC等环境中的课程学习者使用。
  San Pedro等人[22]使用新英格兰的ASSISTment系统,将3747名学生的数据应用于学生知识、情绪和行为的细粒度模型,并利用逻辑回归方法建立预测模型,用于预测大学入学率。该研究发现,学生投入对学生成功的预测很有帮助。
  Thammasir等人[23]使用过采样、欠采样和少数群体过采样的平衡技术,以及逻辑回归、决策树、神经网络和支持向量机四种分类方法,在此基础上对大量学生学习数据进行分析,验证了这三种平衡技术和四种分类方法对少数类预测精度的提高,并且确定了准确预测学生自然减员最重要的变量,由此有可能准确预测存在风险的学生,并有助于降低学生辍学率。   Hachey等人[24]将学习者之前成功率作为因变量,将平均学分绩点(Grade Point Average,GPA)作为一个连续变量运行二元逻辑回归算法,利用学习者之前的在线课程成果和GPA,预测学习者的未来在线课程成绩以及留存率。
  Park(2015)等人[25]采用聚类方法,对收集到的教育数据进行挖掘,数据来源于韩国某大学的课程学习者,并由此确定了学习者四种独特的亚型。
  Shimada(2015)等人[26]采用机器学习的分类方法分析了非正式学习中的学习行为与其在相应测验中的有效性之间的关系。该研究从电子教科书中收集了大量的操作日志来分析学习过程,实验结果表明,进行良好非正式学习的学生在测验中会获得更好的分数。
  综上,研究者使用逻辑回归、支持向量机、聚类算法、决策树和神经网络等机器学习方法,对学习者数据进行分析,以此预测学习者的学习状态,预测学习者未来学习表现,已经取得一些研究成果,这些研究成果证明了机器学习算法应用于教育领域有其适用性。机器学习算法应用于教育领域主要关注个体行为数据的挖掘,通过训练机器而达到预测个体行为的目的[27]。但是必须知道学习分析的方法有其适用性,每种方法所面临的学习情境不同,所能发挥的效用也不尽相同。因此,需要对学习者学习状况各个影响因素进行深入考量,确保对影响因素的精确把握,并在此基础上找到合适的方法,实现更优的实验结果。此外,必须在设计分析模型时进行更多的调查,以确保收集的数据真正满足下一步分析的需求。
  4 学习分析应用的研究现状
  学习分析应用于学习者学业状况预测的研究现状 关于学习分析应用方面,目前国际上最有代表性的要数普渡大学的课程信号系统(Course Signals System)[28]。课程信号系统是一个基于教育大数据对学习者进行预测及干预的系统。该系统自2007年开始启动以来,对该校学生新生保留率的提高发挥了重要作用。该系统实施过程是:首先收集学习者学习过程中产生的数据,包括学习者特征数据、学习经历数据等;然后根据这些数据建立预测模型,识别存在学业风险的学习者,并通过邮件等方式将预警信号发送给学习者、教师及教育管理者,使他们各自采取相应措施对学习者下一步学习提供指导和帮助。
  简单来说,课程信号系统是通过对收集到的学习数据的分析,建立预测模型,然后识别出学业困难学生,最后对他们进行帮助,以达到提高学生保留率的目的。该系统重要的核心部分是一个“学习者学业成功算法”(Student Success Algorithm,SSA),该算法主要根据学习者学业表现、学习者努力程度、学习者学术记录和学习者特征四部分数据进行分析计算,通过对学习者的相关学习数据进行分析后,会得到学习者能否顺利通过课程学习的预测结果,系统会根据不同的预测结果采取不同的措施。还有一点很重要的是,现在课程信号系统可以实时收集数据,并及时给学习者反馈。这就避免了因提醒的滞后造成的学习者未能及时获得指导和帮助的情况。
  澳大利亚埃迪斯科大学的Connect4Success系统,可以自动识别和预测问题学生,并对其提供相应的帮助和支持。该系统通过利用收集到的数据进行系统分析和整理,以此来识别在学习过程中存在困难的学生[29]。
  影响学习者学业成功的指标 通过以上关于预测学习者学业成功的研究,可以发现目前关于学习者学业成功的预测指标有很多,在各个研究者及应用平台中,对这些预测指标的分类各有不同。本文将这些预测指标按照时间先后顺序主要分为两大类:过去影响因素指标和现在影响因素指标。过去的影响因素主要是指学习者在之前学习过程中的相关表现以及所取得的学习结果,包括学习者之前学业成绩、学习者基本学习数据(如学习者年龄、性别、家庭情况等)。现在影响因素指标主要是学习者在当前学习中的一些表现,包括学习者在学习这门课程中的表现,如听课情况、作业完成情况、交互频次、测试成绩等。很重要的一点是,学习参与度在很大程度上影响着学习者的学业成功与否。
  5 结语
  学习分析作为一个连接技术与教育的研究领域,它在近几年随着大数据的发展也得到人们更多的关注,毫无疑问,它有广阔的发展前景。学习分析技术作为学习分析中重要的一部分,也需要研究者去认真思考:技术的进步该如何促进这一研究领域的发展?学习分析技术究竟该如何走向一种标准化的、可以适用于个性化指导学习的技术?学习分析技术存在的隐私伦理问题该如何解決?如何才能实现对学习者更全面的分析?等等。这些问题仍然需要关注并且逐步解决。
  但是,学习分析技术有它的优势所在,在大数据教学情境下,学习分析可以将技术与教育连接起来,以技术促进学习、学习情境及教学优化。目前的有关研究主要集中于正式教育的课程学习,它可以为在线学习及教学提供反馈和帮助,实现个性化的自主学习,真正做到因材施教。另外,学习分析扩展了教育数据研究的领域。在可以预见的将来,学习分析一定能获得更多认可和支持,有更广阔的应用空间。
  参考文献
  [1]陈娜,牛朕,吴昭,等.2011地平线报告:未来五年改变教育的六大技术[J].上海教育,2011(Z2):8-22.
  [2]Siemens G. What are Learning Analytics?[EB/OL].http://www.elearnspace.org/blog/2010/08/25/what-are-learning-analytics/.
  [3]Society of Learning Analytics Research in 1st Inter-national Conference on Learning Analytics and Know-ledge 2011[DB/OL].[2018-04-01].https://tekri.athabascau.ca/analytics/.   [4]胡藝龄,顾小清,罗九同,等.教育效益的追问:从学习分析技术的视角[J].现代远程教育研究,2014(6):41-48.
  [5]何克抗.“学习分析技术”在我国的新发展[J].电化教育研究,2016,37(7):5-13.
  [6]李青,王涛.学习分析技术研究与应用现状述评[J].中国电化教育,2012(8):129-133.
  [7]李逢庆,钱万正.学习分析:大学教学信息化研究与实践的新领域[J].现代教育技术,2012,22(7):5-10.
  [8]曹晓明,朱勇.学习分析视角下的个性化学习平台研究[J].开放教育研究,2014,20(5):67-74.
  [9]曾东薇.学习分析技术在网络学习中的应用研究[D].武汉:华中师范大学,2014.
  [10]魏顺平,韩艳辉.基于学习过程数据挖掘与分析的在线教学反思研究[J].现代教育技术,2015,25(6):89-95.
  [11]陈耀华,郑勤华,孙洪涛,等.基于学习分析的在线学习测评建模与应用:教师综合评价参考模型研究[J].电化教育研究,2016,37(10):35-41.
  [12]孙洪涛,郑勤华,陈耀华,等.基于学习分析的在线学习测评建模与应用:课程综合评价参考模型研究[J].电化教育研究,2016,37(11):25-31.
  [13]郑勤华,孙洪涛,陈耀华,等.基于学习分析的在线学习测评建模与应用:综合建模方法研究[J].电化教育研究,
  2016,37(12):40-45.
  [14]高琪,乜勇.基于学习分析技术的智慧教育环境构建研究[J].中国教育信息化,2017(17):1-4.
  [15]Machine learning[DB/OL].[2018-04-10].http://www.pudn.com/Download/item/id/2455146.html.
  [16]Cetintas S, Si L, Xin Y P P, et al. AutomaticDetection of Off-Task Behaviors in Intelligent Tuto-ring Systems with Machine Learning Techniques[J].IEEE Transactions on Learning Technologies,2010,3(3):228-236.
  [17]Wang Y H, Liao H C. Data mining for adaptive lear-ning in a TESL based e-learning system[J].Expert Sys-tems with Applications,2011,38(6):6480-6485.
  [18]Alkhuraiji S, Cheetham B, Bamasak O. Dynamic Adaptive Mechanism in Learning Management System based on Learning Styles[M]//11th IEEE International Conference on Advanced Learning Technologies(ICALT).2011:215-217.
  [19]Lauría E J M, Baron J D, Devireddy M, et al. Mi-ning academic data to improve college student reten-tion: An open source perspective[M]//Proceedings of the 2nd International Conference on Learning Analy-tics and Knowledge.2012:139-142.
  [20]Kotsiantis S B. Use of machine learning techni-ques for educational proposes: A decision support system for forecasting students’grades[J].Artificial
  Intelligence Review,2012,37(4):331-344.
  [21]Aher S M D, Lobo L M R J. Combination of machine learning algorithms for recommendation of courses in
  e-learning system based on historical data[J].Know-ledge-Based Systems,2013(51):1-14.
  [22]San Pedro M O Z, Baker R S, Bowers A J, et al.Predicting college enrollment from student interac-tion with an intelligent tutoring system in middle
  school[M]//The 6th International Conference on Edu-cational Data Mining. Massachusetts: International Educational Data Mining Society.2013:177-184.
  [23]Thammasiri D, Delen D, Meesad P, et al. A critical assessment of imbalanced class distribution problem:The case of predicting freshmen student attrition   [J].Expert Systems with Applications,2014,41(2):321-330.
  [24]Hachey A, Wladis C, Conway K. Do prior online course outcomes provide more information than G.P.A.alone in predicting subsequent online course gradesand retention? An observational study at an urbancommunity college[J].Computers&Education,2014(72):59-67.
  [25]Park Y, Yu J H, Jo I H. Clustering blended lear-ning courses by online behavior data: A case study ina Korean higher education institute[J].Internet & Higher Education,2015(29):1-11.
  [26]Shimada A, Okubo F, Yin C, et al. Informal lear-ning behavior analysis using action logs and slidefeatures in e-textbooks[C]//The IEEE InternationalConference on Advanced Learning Technologies.2015:116-117.
  [27]范逸洲,汪瓊.学业成就与学业风险的预测:基于学习分析领域中预测指标的文献综述[J].中国远程教育,2018(1):5-15,44,79.
  [28]刘艳华,徐鹏.大数据教育应用研究综述及其典型案例解析:以美国普渡大学课程信号项目为例[J].软件导刊:教育技术,2014(12):47-51.
  [29]杨旸,胡珊珊,邢宏根,等.借鉴与反思:学习分析在国外高等教育领域的应用[J].现代教育技术,2018(2):107-112.
  项目来源:东北石油大学研究生教育创新工程项目“新工科视角下计算机类研究生创新和实践能力培养研究与实践”;黑龙江省教育科学“十三五”规划2018年度重点课题“工程教育认证背景下智能云教学过程化教学评价平台构建的研究”(项目编号:GBB1318021);黑龙江省教育科学“十三五”规划2017年度备案课题“信息技术类大学生创新创业教育支撑平台研究”(项目编号:GBC1317027)。
  作者:王莎莎,东北石油大学计算机与信息技术学院在读硕士研究生,研究方向为知识工程、学习分析技术;王梅,通讯作者,东北石油大学计算机与信息技术学院,教授,研究方向为机器学习、模型选择和核方法支持向量机(163318)。
转载注明来源:https://www.xzbu.com/9/view-15036017.htm