您好, 访客   登录/注册

“数据科学导论”课程教学探讨

来源:用户上传      作者:周建英 李广明 王双成

  [摘 要] 近年来,很多高校均开设了大数据相关专业,但是整体上,我国大数据人才培养相较于西方发达国家还处于初级阶段,专业建设及课程体系也处于探索阶段。在分析国内数据科学人才培养现状的基础上,以上海立信会计金融学院数据科学专业人才培养方向为例,从数据科学人才培养目标和社会人才市场需求入手,探讨“数据科学导论”在课程教学过程中的问题,结合专业发展方向和目标定位,初步形成具有特色的课程体系设置方案。作为导论课程,将以培养学生专业认知基础为目标,采用理论教学、前沿讲座以及实践教学相结合的方式进行多方式教学,成效显著。
  [关键词] 数据科学;课程教学;人才培养
   数据科学是关于数据的科学或者研究数据的科学,数据科学研究和探索计算机中数据中存在的规律、处理方法以及技术,研究的对象是计算机中的数据。那么数据科学应该包括两方面内涵:一个是数据本身,比如数据的各种类型、状态、属性及变化形式和数据的变化规律;另一个是数据能够为自然科学和社会科学研究提供新的研究方法、研究依据,包括用于研究和探索自然界和人类行为现象和自然规律。近些年来,很多高校,包括双一流的高校,以及地方院校均在响应人才市场需求和技术发展需求前提下,开设了大数据相关专业。但是整体上,我国大数据人才培养相比较西方发达国家还处于初级阶段,专业建设及课程体系也处于探索阶段,而针对大数据方向的实践课程构建更是没有成熟的经验可借鉴。本文在分析国内数据科学人才培养现状及研究现状的基础上,以上海立信会计金融学院数据科学专业人才培养方向为例,从数据科学人才培养目标和社会人才市场需求入手,探讨“数据科学导论”在课程教学过程中的几点思考和建议,结合专业发展方向和目标定位,初步形成具有特色的课程体系设置方案,作为导论课程,将以培养学生专业认知基础为目标,从加强教师队伍建设以及提高教师教学责任心入手,采用理论教学、前沿讲座以及实践教学相结合的方式进行多方式教学,成效显著。
  本文给出了数据科学实验课程教学改革的几点思考建议,结合专业发展方向和目标定位,形成了具有显著时代特色的课程体系设置方案,以提升学生动手能力为目标,从加强教师队伍建设以及提高教学责任心入手,采用学评教与同行评价相结合的办法来提高教学质量,并将实验教学方法与考核办法配套结合,成效明显。
  一、数据科学人才培养现状
  目前无论是西方发达国家还是发展中国家,数据科学,包括大数据行业,数据科学行业人才的短缺,为高校数据科学专业建设提供了发展空间,也给高校数据科学人才培养提出了更大的挑战和机遇。尤其是在人工智能高速发展背景下,各国政府的大力扶持和数据产业链的不断完善,更要求高校数据人才培养要切合实际需求,为社会服务输出高质量的人才,我国各地地方院校以及重点院校,也在积极申报“数据科学与大数据技术”相关专业,或至少已经开设“大数据”“数据科学”等人才培养课程。香港中文大学从2008年起设立“数据科学商业统计”科学硕士学位,复旦大学从2007年起开设数据科学讨论班,2010年开始招收数据科学博士研究生,并从2013年起开设研究生课程“数据科学”,在2014年,清华大学设置了大数据技术的相关硕士学位,目标是多学科交叉培养大数据技术人才。2016年,我国开始建设本科“数据科学与大数据技术”相关专业,教育部批准中南大学、对外经济贸易大学、北京大学建立“数据科学与大数据技术”本科专业;在2017年,教育部批准32所高校设立“数据科学与大数据技术”本科专业,2018年,国家进一步批准248所高校设立“数据科学与大数据技术”本科专业。2019年初,教育部又公布了203所高校获批设立“数据科学与大数据技术”新专业,其中包括上海立信会计金融学院。截至2019年,我国共有406所高校获得招收“数据科学与大数据技术”本科专业资格。在这些院校中,不仅有很多“985”“211”高校,也有地方特色院校。但是在这么多学校获批数据科学专业时,专业建设、课程建设等工作是迫在眉睫的一件事情。
  二、数据科学课程体系构建
  数据科学,从统计学、人工智能/机器学习、数据挖掘、数据库与数据处理、大数据分析等领域,吸取有效的成分,不断创建起来。上海立信会计金融学院的数据科学专业中,数据科学涉及方方面面,包括数理统计学、计算机科学以及具有行业特色的财经金融学科等,其中统计学是建模的数学基础,而计算机科学是数据建模的手段和方法,财经金融背景又是数据的行业背景。近年来,上海立信会计金融学院开设数据科学专业,正是在数字金融、人工智能背景下,将机器学习模型和金融数据结合起来,通过基础课和专业课,培养学生具有理解模型、推理模型、数据建模以及行业应用能力。而“数据科学导论”正是这些专业课中的一门较为基础,也是较为重要的课程,通过这门课主要阐述了一些数据科学领域的基本概念、基本原理和分析方法,为数据建模提供基础知识、方法,是数据科学专业的一块敲门砖,通过这门课,达到抛砖引玉的作用,为后续的专业课提供很好的引导和铺垫作用,同时又与后续课程互相渗透、互相补充,成为必不可少的基础课程。
  “数据科学导论”作为数据科学专业较为基础的课程,从以下四个方面开展了教学探索和实践。
  (一)課程目标
  “数据科学导论”作为数据科学专业的基础专业课,涉及数据科学的各个环节,因此该课程的主要目标是为数据科学专业提供一个入门导引的作用,通过这门课达到抛砖引玉的效果,使学生掌握数据科学的基本概念、方法,对数据科学描述一个体系和框架,因此该门课的设置尤其重要。“数据科学导论”起到提纲挈领的作用,在本课程中讲解到的每一个知识点,均会在后续课程中展开详细介绍。本课程的主要目的是希望学生通过本课程培养对专业体系的整体认识,对学科发展的脉络有初步的把握和认知,掌握专业基础知识,为后续课程陆续展开做好铺垫。
  (二)课程设置
  数据科学研究数据科学的本源—数据的来源、采集、存储、建模等各个环节,不同行业背景下,数据的来源不同,针对上海立信会计金融学院的财经金融特色,数据的专业来源将是金融财经方向的时序数据为主,针对数据的采集、存储、建模等各个环节,分别介绍数据清洗、预处理等数据清洗内容,以及数据的存储仓库,数据的建模方法等,但是在数据建模方法前,将首先针对常用的数据建模方法和常用的数理统计背景进行介绍,以便学生更好理解数据建模的理论、方法等。
  (三)课程实验
  针对课程实验,本课程主要针对常用的数据清洗、数据存储技术、数据分类和聚类模型展开实验,并结合程序设计Python语言,实现数据的采集、清洗以及存储和加载等目的,并实现模型的建模和优化,在课程实验中,实验过程中的数据是中小规模的,同时结合数据的规模和模型规模,具有一定大数据量,但是最重要的是培养学生对数据的采集、清洗、建模和优化分析流程。为后续大数据和机器学习等专业课程起到铺路作用。
  (四)课程案例
  数据科学是一门实践性很强的学科,同时也是针对数据进行抽象和建模的学科。本课程主要结合上海立信会计金融学院的财经金融背景方向,以量化交易为案例,以量化交易的数据为本源,分析数据的类型、数据的特征、数据建模的模型基础、模型的优化以及模型在量化交易中的决策支持作用等,通过该案例将数据科学的各个环节在量化交易中的作用一一解释,给予学生理论联系实际的案例分析。
  三、结语
  针对国家对数据科学人才的迫切需求,本文根据我校数据科学专业及数据科学方向的教学实践,探讨了“数据科学导论”的课程体系建设以及教学模式,今后我们还将进一步针对该问题进行探讨、总结和分析实践经验,构建更好更加科学的课程体系。
  参考文献
  [1]欧高炎,朱占星,董彬,鄂维南.数据科学导引[M].北京:高等教育出版社,2017.
  [2]覃雄派,陈跃国.数据科学概论[M].北京:中国人民大学出版社,2018.
  [3]李航.统计学习方法[M].北京:清华大学出版社,2012.
  [4]朝乐门.数据科学[M].北京:清华大学出版社,2016.
转载注明来源:https://www.xzbu.com/9/view-15276417.htm