周一至周五 | 9:00—22:00

走向大数据时代的运动训练科学研究

作者:未知

  摘要:数据是科学研究的重要组成部分,数据活动方式的改变必然会影响科学研究的变化。随着大数据时代的到来,一场关系到人们科学研究的技术与思维方式的巨大变革正在发生。目前,传统运动训练科学的简单小数据研究模式正面临难以突破的困境与局限,而大数据科学技术正在为运动训练科学研究注入新的活力,大数据思维给运动训练科学研究带来了新的洞察力。基于复杂性科学理论研究视角,探讨运动训练科学大数据的研究现状、研究的本质及其存在问题。由此为运动训练科学研究打开了一条新的认识论与方法论的路径:大数据时代的运动训练科学的研究视角应从单向度转向多维度,研究对象应从传统的实体转向关系,研究方法应从样本数据转向全数据,研究范式应从理论转向数据。
  关键词: 大数据时代;大数据思维;运动训练科学
  中图分类号: G 808.1文章编号:1009783X(2015)06054105文献标志码: A
  Abstract:Data is an important part of scientific research.The change of data activity way is bound to affect the change of scientific research.With the advent of the era of big data,a great change has occurred in the technology and thinking mode of people's scientific research.At present,the simple and small data research model of traditional sports training science is facing difficulties and limitations,and the big data science and technology is bringing new vigor to the sports training and scientific research.Based on the theory of complexity science,the research status,the essence and the existing problems of the scientific research of sports training are discussed.The research on the scientific research of sports training opens a new way of epistemology and methodology.The research of the sports training science in the big data era should turn from one dimension to the multi dimension,the research object from the traditional entity to the relationship,the research method from the sample data to the full data,the research paradigm from the theory to the data.
  Keywords:era of big data;thinking mode of big data;sports training science
  在近代科学研究中,人们主要依赖抽样数据、局部数据和片面数据,甚至在无法获得实证数据的时候纯粹依赖经验、理论、假设和价值观去发现未知领域的规律。而在当代,随着信息与网络技术的发展,人类在收集、存储、分析、使用数据的能力方面实现了巨大跨越,人们可以运用海量的数据来揭示世界运行规律,即大数据理念和方法正在改变着政治、经济、教育、文化、医疗等各个领域模式。面对大数据时代的到来,在运动训练科学研究领域也逐渐开始采用大数据模式。如从运动器械上的传感器、运动员身上的可穿戴设备、比赛场内、外的摄像头到教练手中的终端设备及互联网,大量的数据被广泛地采集并通过大数据分析转化为新的洞察力。于是,无论是赛场上运动员的表现、教练的技战术布置,还是场外运动员的训练或监控,大数据都在其中逐渐扮演着举足轻重的角色。
  运动训练科学研究已经进入大数据时代,大数据正在成为运动训练科学界热议的术语。大数据不仅可以协助运动训练专家、教练员从海量的训练和比赛数据中发现规律,而且可以优化运动训练方法,提高运动员训练、比赛的能力;然而,在感受运动训练大数据带来的变化的同时,我们发现大数据不仅是一种新的数据管理方式,更是一种知识发现的过程,一种认识问题的思维模式。其思维模式的改变,不仅是方法、工具上的一种进步,更是人们认知能力的巨大改变;因此,运动训练科学研究的大数据及其思维模式不仅为解决运动训练中许多难以解决的问题提供新的科学技术工具,也将为现代运动训练科学研究提供新的认识论与方法论路径,致使运动训练科学研究走向新范式。
  1大数据时代与运动训练科学研究
  1.1大数据时代与大数据思维
  1980年,阿尔文・托夫勒在《第三次浪潮》中就前瞻性地指出过大数据时代即将到来。此后经过几十年的发展,特别是移动互联网络和云计算的出现,人们逐渐认识到大数据的重大意义。国际顶级学术刊物相继出版大数据方面的专刊,如2008年9月《Nature》杂志推出《Big Data》专刊,讲述了数据在数学、物理、生物、工程及社会经济等多学科中扮演重要的角色。自此,“大数据”正式登上科学研究的大舞台,并成为各个学科中的研究热点问题。2011 年,《Science》杂志出版关于数据处理的专刊《Dealingwith Data》,提出了对大数据进行有效地分析、组织与利用可以对社会发展起到巨大推动作用。2012年3月奥巴马宣布美国政府5大部门投资2亿美元启动“大数据研究和发展计划”[1],希望推动大数据相关的收集、储存、管理、分析和共享海量数据技术研究,进而加速美国在科学与工程领域发明的步伐,这标志着大数据已经成为国家战略。2013年则被称为大数据的元年,从这一年开始,大数据像旋风一样吹遍整个世界,同时科学研究的各个领域也快速地跨入了大数据时代。   “数据”(data)一词,在拉丁文里原是“已知”的意思,也可理解为“事实”。在科学研究中,数据是指科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值。在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号介质的总称,可以代表各种字母、数字符号的组合、语音、图形、图像等,数据经过加工后就成为信息[2]。当然,在哲学视域中,世界的本质就是数据,数据是事物现象的表征,时间和空间都可以用数来度量,只有通过数据才能获知事物的现象[3];然而,尽管“大数据”这个词受到人们的高度关注,但大数据是一个较为抽象的概念,至今尚无确切、统一的定义。Gartner[4]认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。维基百科的定义[5]为:大数据是指利用常用软件工具捕获)管理和处理数据所耗时间超过可容忍时间的数据集。麦肯锡公司给出了定义[6]:“大数据是指大小超出了常规数据库工具收集、存储、管理和分析能力的数据集。”当前,较为统一的认识是大数据有4个基本特征:数据规模大(volue),数据种类多(varitey),数据要求处理速度快(velocity),数据价值密度低(value),即所谓的四V特性,这些特性使得大数据区别于传统的数据概念。
  任何人都生活在一定的时代和环境中,其思考问题和解决问题的习惯和模式都会受到时代和环境的影响。大数据时代的大数据不仅是一种资源、一门应用性科学技术工具,更重要的是一种思维方式。所谓思维方式[7]是“指一个时代人们认识和研究事物的方法和手段的总和,是一种支配人们思考与行动的规范、风气和格式”,它包含研究者思维的途径、视角、模式、习惯、方法与手段等。也就是说,大数据思维不单单是一种新的数据管理方式,更是一种知识发现的过程,一种认识问题的思维模式。舍恩伯格等[8]在《大数据时代》中,认为大数据与3个重大的思维转变有关:首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本;其次,我们乐于接受数据的纷繁复杂,而不是追求精确性;最后,不再探求难以捉摸的因果关系,转而关注事物的相关关系。不难看出,大数据思维实质就是从现存事物的结构和关系模式、演化程序和过程模式中去把握和描述事物的本质、特点和属性,将现存事物的结构、关系、过程作为信息(数据)的载体或符码,并由此破译出其中蕴涵着的关于事物历史状态、现实关系、未来趋向的间接存在的内容、意义和价值[9]。这些思维上的转变相互联系、相互作用,它们颠覆了传统的科学研究观念,使得现代科学研究正在进入到一个崭新的阶段。
  1.2运动训练科学大数据研究的现状
  进入21世纪以来,在运动训练科学研究领域,无论是运动员选材、运动训练的技术、战术安排与分析,或是运动训练的效果评价与预测、运动竞赛过程,运动员的疲劳、伤病的预防或恢复等方面无不与大量数据紧密联系。也就是说,如何从浩瀚的数据中,深入寻找各种因素间的相互联系,发现诸多因素之间的动态变化规律,从而对数据进行深层分析,使之及时准确地提供有价值的信息,这对运动训练科学研究极为必要。如今大数据技术的出现,无疑正在悄然改变运动训练科学研究模式。从高尔夫、网球、赛艇、棒球到足球、篮球、游泳、田径等大数据分析正席卷整个竞技运动界。
  在高尔夫运动中,运动员和球队如今越来越依靠数据分析来使他们更快、更强。Track Man技术就是通过雷达测量高尔夫运动员每次击球后球在飞行过程中的所有数据,如速率、角度、方向、旋转速度等,然后,通过软件进行分析。Track Man的数据非常全面,以至于一些职业教练在考虑日后如何根据Tack Man在每次击球后的数据分析来改变他们的训练方式[10]。在NBA,从80年代开始将球员在赛场上的表现数据化(各种移动、对抗、挡拆、掩护、进攻、得分等),经过30多年的积累已达到可辨别每一个球员在场上的弱点,方便教练进行针对性战术安排。目前,30家球队俱乐部中聘请了数据分析师的15家,其平均胜率达到59.3%,而另一半球队仅有40.7%的平均胜率[11]。在NFL新秀训练营,每个选秀球员都需要穿上带有传感器的运动服,这些传感器能记录运动员的加速度、垂直弹跳力及心率等。通过分析那些保障运动员健康的因素,就能够制订合理的训练计划,使得运动员既能够充分训练,又能够保证不因过度训练而导致受伤[12]。
  踢足球也得靠数据,在2014 年世界杯上德国队就采用了他们的秘密武器――SAP大数据解决方案。在德国足球国家队的训练场地内,四处都布置了传感器,甚至训练用球和每位球员的护胫中也都放置了传感器,用于捕捉球员的动作与位置变化等重要而细致的信息。这些数据信息被实时传回SAP HANA平台,并在短时间内完成处理。任一球员的攻击范围、运动轨迹、进球率等相关信息都可以直接呈现在面板上,帮助教练做出决断[13]。网球也涉及大量的数据。一发成功率、一发得分率和Ace球是标志球员竞技水平的关键指标,发球速度、接发球成功率、上网成功率、得分点则突出体现了球员的打法特点,如果非受迫性失误和双发失误率上升,那表明球员的心理状态或者体力开始下滑。这些网球中的数据,现在都可以通过Slam Tracker平台实现[14]。与其他的体育项目一样,棒球也运用到大数据。在美国,基于大数据分析的棒球运动员选材,成为传统运动选材方式的有益补充,美国职业棒球队大联盟奥克兰“运动家球队”的总经理比利・比恩就依据这样独特的运动员选材方式,以最经济的成本带领自己的球队赢得多次比赛[15]。
  2运动训练科学大数据研究的实质及问题
  2.1运动训练科学大数据研究的实质
  传统的运动训练科学研究是小数据模式。所谓小数据指的是数据规模比较小,它主要通过随机、采样方式取得。因而“小数据”代表的是局部或部分,小数据研究模式[16]就是“对事物进行抽象化提取,通过层层假设剥离事物,并最终通过数学建模完成对事物的科学化认知”。小数据的科学理论基础应是近代自然科学,而近代自然科学研究方法是一种机械还原的方法。也就是说,运动训练科学的小数据研究就是主要把运动训练整体简单分解或还原各个部分,运用“局部或部分”原理或规律去解释或认识运动训练“整体”的现象与规律;于是,在其研究形式上运动训练科学小数据研究模式最终表现为在少量数据的基础上进行推理,追求数据的精确性或代表性(主要通过抽样的),希望通过寻找数据之间的简单因果关系来解释运动训练规律。   运动训练科学大数据研究所呈现的是数据的大规模、快速、多维度、系统、模块、不确定性等特点及其相互错综复杂关系。这些数据特点从本质上看主要源于运动训练的复杂性,也就是说运动训练的复杂性是运动训练科学大数据的本质,而运动训练实质上就是一个复杂性系统,复杂性是其本质特性[17]。一个系统的运动科学训练不但要考虑运动员本身的各种身体要素,要考虑其表现的外在因素,还要区别看待运气和技术因素,需要了解运动员的表现和年龄变化之间的关系等;因此,运动训练科学大数据研究模式本质就是运动训练科学的复杂性研究模式。我们知道如果只是对一个只有3只蜜蜂的蜂群进行分析,那么将十分简单;但如果是一个100万只蜜蜂的蜂群,那么将是一个巨大任务。例如,在足球运动中,如果对10个球员用3个球进行训练,那么10 min就会产生超过700万个可供实时分析的数据点;因此,运动训练科学大数据研究模式开拓了运动训练科学复杂性研究一条新的路径。运动训练大数据研究是以运动训练的复杂性研究为理论基础,而基于大数据对运动训练复杂系统内在机制、特征、关系及其原理进行的整体性研究则为运动训练复杂性科学提供了研究的技术及工具。当然,运动训练科学大数据研究所提供的相关理论和观点、方式和方法能够较好地体现出运动训练复杂性研究的一般特征,进而也为运动训练复杂性研究提供一个新的研究维度。
  传统运动训练科学小数据研究模式无法揭示运动训练系统中许多复杂的关系,无法有效地整体把握运动训练的规律。通过运动训练大数据研究可加深人们对运动训练复杂系统的整体理解,能使人们有可能得到一种最接近正确的选择和路径或最接近正确的观点与方法,从而更加接近运动训练的客观情况,消除基于小数据还原论的经典科学研究的主观性;因此,运动训练大数据是研究运动训练复杂性科学的一门科学技术,运动训练大数据面临的科学问题本质可能就是运动训练复杂性科学问题。然而,对运动训练复杂性科学研究将有助于指导运动训练大数据搜集、更好地分析运动训练系统的数据,帮助研究者利用大数据建立复杂运动训练分析与预测模型等,即运动训练的复杂性分析是其大数据科学研究的重要基石。
  2.2运动训练科学大数据研究面临的问题
  大数据带来了运动训练科学研究的新的洞察力,正在改变着运动训练科学界;但运动训练科学大数据是作为一种新的理论,其技术、方法等还远不成熟,在其发展的过程中还将面临着大量问题。如数据量大,但数据分散,数据格式众多,数据重复性大;数据通常对时间极度敏感,缺乏数据全方位有效的分析方法(实时数据分析能力差);数据传输、处理效率低,缺乏各种类型数据的采集方法等。更重要的是我们拥有极大规模的数据,却缺乏有价值的洞察力,难以提取有效信息,即我们以为自己需要信息,但其实我们真正更需要的是知识。也就是说当人们的主观愿望不积极的时候,大数据对他们来说不过是噪音而已。相反,数据也会因为主观意愿的片面而具有欺骗性,因为有些方面是数据系统无法感知的,例如运动员的心理状态、意志性、专注力等。如2个最顶尖的足球球探里弗斯和布朗都认为“光凭数据就能买进某个球员”这种想法是十分荒谬的。“你需要亲眼看看那个球员,你需要爱上那个球员,你会看到他如何做热身运动,他怎样跟裁判交流,在错过机会后他是怎样跟队友沟通的,他怎样庆祝得分,还有在他进球以后其队友的反应。数据只会帮你排除一些明显的错误,但最终的决定必须依赖人的判断。这就是球探和教练的直觉”。[18]
  与此同时,在竞技体育界里有句老话“数据也会说谎”。如篮球选手得分高不等于对球队贡献大,因为他可能为了追求得分而疯狂出手,导致球队进攻无法流畅运转;某些网球选手,如瑞士天王费德勒的非受迫性失误比例会比其他球员高,但那是因为他的球风比较积极,致胜分也比别人要多;橄榄球四分卫被抄截率低也未必一定就好,因为他可能为了避免被抄截而拖延出手时间,最终被对方防守组擒杀等。所以,运动员的实力和潜力实在很难用一个简单的数字来判断,集体项目中尤其如此[18]。除对时间的极度敏感性之外,数据分析可能还会有一些负面影响。博尔顿的分析研究总监布莱恩・普莱斯迪奇透露说,“自从他们的守门员开始研究对方的点球手的数据以后,他的扑点球效率反而降低了,过去2个赛季只有9%的成功率”,“我们给他灌输了数据分析的思维方式,却拿走了人性的部分,他作为球员的直觉被弱化了。”
  3大数据时代运动训练科学研究的新路径
  3.1运动训练科学研究视角:从单向度走向多维度
  由于近代科学技术的局限和自然科学研究的简单性理念的影响,传统运动训练科学研究主要局限于运动训练的单向度或局部因素方面研究。如运动员的生理机能、运动技术或所谓的核心竞技能力研究,并主要局限于化学或物理因素或机械方面的分析,由此形成运动训练的生物学模式,即生物学因素成为运动训练的主要因素;但随着运动训练科学研究的逐渐深入,我们发现运动训练不仅与运动员的生物学因素有关,还与运动员的心理因素、自然环境、社会因素等许多因素相关联,而且这些因素逐渐成为影响运动员比赛胜负的关键。同时由于缺少对这些因素研究的有效方法,这些因素的研究也成为运动训练与比赛中难以有效控制的因素。然而,随着运动训练科学大数据模式研究的实现,这些大规模、多源性、多样性运动训练数据得以整合,并可以处理与分析所有相关的数据,挖掘其中独有的价值,进而真正实现运动训练科学整体研究的模式,即生物心理自然社会系统的运动训练新模式。也就是说,运动训练科学大数据研究,是实现了运动训练科学研究从单向度向多维度、局部向整体转变的有效途径。
  3.2运动训练科学研究对象:从实体走向关系
  近代科学研究是一种关于实体的研究。所谓实体是指不依赖他物而独立自存的事物,而实体观的理论预设就是“世界的本质是简单的,它是由刚性不变的“实体”构成,外部世界复杂性是由种种简单性“实体”聚合而成,并在“实体”层面得到还原论的清楚解释和充足说明。科学的任务就是探明宇宙的最终“实体”,而科学中的所有学科最终都可以统一到“实体”上来;因此,受到近代科学研究“实体”的自然观和方法论的影响,传统运动训练科学研究也是实体研究,研究方法则主要是一种分解还原的方法。而数据形式上则表现为小数据模式,如在中国足球训练在几十年的时间里,主要就是按照这样方式进行研究和训练的,即将足球运动训练中的集体、对抗的训练,化解成分散、分割、拆零式的非对抗个人练习;或将竞技各项因素割裂开来,以单项的形式分别进行或技术或体力的训练,并以肌肉围度、肺活量、心率、摄氧能力、弹跳力等指标(100 m跑和库伯(12 min跑)测试)反映一名球员的足球能力等[19]6567。   然而,现代科学研究发现,实体是关系的产物,关系比实体更重要。如原子是原子核与电子相互作用的产物,分子是原子与原子相互作用的产物,生命是蛋白质与核酸相互作用的产物等。对于运动训练来说,不只是纯粹的实体世界,而是以一种关系存在的,即构成运动训练的各种要素及它本身都处在复杂的关系之中,而且这种关系比实体更重要;因此,我们只有以一种关系思维或关联性思维方式来考察各种要素或系统的运行状态,才能揭示它们的运动发展的规律。如在足球训练中,我们不能说,如果一名球员肺活量很大,他就能把球踢好。也不能说,一名球员有强壮的肌肉,他就会在比赛中表现出色或他的头球能力强。同样,若一名球员跑得快,但我们不能认为他肯定踢好球;因此,这种单纯的技术训练(脱离了应用环境,等于杂技练习),或单纯的跑动训练(等于田径),或不设对抗的技术+跑动训练(等于杂技+田径练习),在参加重大比赛时,在激烈的对抗中,在对方的压力下,就不会运用技术,失误多,不会使用体力,不知怎样跑,相互不会配合,缺少变化,不能随机应变,于是,输球也就难免了[19]94。运动训练科学大数据研究全在于发现与理解这些信息内容及信息与信息之间的关系。利用大数据技术对运动训练中相关关系分析能够更准确、更快,而且不易受到有关偏见的影响。
  3.3运动训练科学研究方法:从样本走向全数据
  目前,大数据研究主要作为一种研究方法或一种发现新知识的工具,而不是把数据本身作为研究目标。作为研究方法,它与数据采集、统计分析和挖掘等无法分开。受到时代数据处理能力的局限影响,传统运动训练科学的研究方法,即数据的收集运用的是采样数据,采样数据的目的就是用最少的数据得到最多的信息,即以局部代替整体的研究模式;但这种研究方法的成功与否全依赖于采样过程的绝对随机性,因为采样的准确性随着采样的随机性增加而大幅度提高,而与样本数量的增加关系不大,这是由于当样本数量达到某个一定值之后,从新样本身上得到的信息就会越来越少了。运动训练科学的随机采样方法在一定范围内取得了成功,然而这种研究方法只是一条捷径,是在不可收集和分析全部数据的情况下的一种选择,而它本身存在着一些缺陷。如在抽样中真正实现采样的随机性非常困难,一旦采样过程中存在着任何偏见,其分析结果就会相去甚远;更重要的是采样无法得到一些微观细节方面的考察,甚至还会失去对某些特定子类别进行进一步研究的能力,也就是说,我们不能只满足于正态分布,在运动训练研究中有时真正有价值的东西经常藏匿于细节之中(数据具有混合性),而采样分析却忽略或无法捕捉到这些细节。运动训练科学大数据研究是采用的所有数据方法(我们已经具有足够的数据处理和存储能力,也有了最先进的分析技术)。拥有全部或几乎全部的数据,我们就能够从不同的角度、不同层面、更细致地观察和研究运动训练数据的方方面面;因为运动训练科学大数据研究更多的是基于不同数据之间的关系(非线性关系)的一种预测。
  3.4运动训练科学研究范式:从理论走向数据
  库恩认为范式的演变是科学研究的方法及观念的取代过程,科学的发展不是靠知识的积累而是靠范式的转换完成的,新范式形成表明建立起了新的常规科学。图灵奖获得者、美国计算机科学家詹姆斯・格雷先生认为科学经历了经验科学、理论科学、计算机科学与数据密集型科学;相对应的研究范式经历了经验范式、理论范式、计算机模拟范式与数据密集型范式的变迁和演化[20]。目前运动训练科学研究主要是一门经验与理论相结合的科学,其中运动训练的经验是其理论科学的实践基础,运动训练理论科学是其经验科学的指导,而运动训练的经验又是在已有的理论基础上进行实验的;因此,两者是互相联系、互相补充共同推进着运动训练科学的研究。当然在现代运动训练科学研究中也会引入计算机科学,但这只是对运动训练的经验科学和理论科学中的科学方法进行必要的补充和优化。以上这些科学研究方法在过去大半个世纪大大推动了运动训练科学研究,让我们见证了运动训练科学研究许多的辉煌;然而,面对越来越多运动训练的复杂性问题(如运动训练难以预测问题、运动训练过程与运动技术不可完全复制的问题、运动性疲劳问题等),以运动训练科学理论研究为主的范式受到了挑战。因为基于已有的知识或理论,再通过推理和论证而得出的科研预期成果,是对研究对象的初步分析和综合;但有许多全新的东西可能远超出我们能假设的认知范围。
  大数据科学研究推动了一种“数据密集型”科研的第4范式的发展,它不同于传统的经验、理论和计算的范式,这种范式不需要考虑因果关系,以数据为中心,分析数据的相关性,打破了许多年来从结果出发探究原因的科学研究模式,使得大规模的复杂数据成为新的科研模式(运动训练过程中包含海量的数据)。2008年,Chris[1]甚至发出“理论已终结”的惊人断言,即“相互关系已经足够。我们可以停止寻找模型,相互关系取代了因果关系,没有具有一致性的模型、统一的理论和任何机械式的说明,科学也可以进步”;因此,“用数据说话”已成为认知世界的一种方法。换句话说,现代科学研究范式正在从传统的理论驱动型方法转向基于数据的探索型方法。对于在运动训练科学研究领域运用“数据驱动”方法去尽可能多地搜集人体运动的各种信息(数据密集型科学研究范式由数据的采集、管理和分析3个基本活动组成),在此基础上再考虑理论假设;这样一种方法与“理论假设驱动”的研究策略相比,可能更适合对复杂的人体运动科学现象的研究。
  4结束语
  随着大数据时代的到来,“大数据”成为学术界、经济界以及政府热议的话题,同时也成为运动训练科学领域新的研究热点;但目前对运动训练大数据的研究仍处于起步阶段,还有很多基础性的问题有待解决,我们也将面临越来越多的问题与挑战,如何充分采集、利用并挖掘大数据?如何使得数据可视化和自我量化及不同数据库积累?如何突破数学框架而引入生物学、心理学和社会学模式等?尽管如此,大数据及大数据思维依然为运动训练科学研究开辟了新的研究路径、新的研究方法与新的研究范式。


常见问题解答