您好, 访客   登录/注册

大数据时代的思考

来源:用户上传      作者: 本刊编辑部

  大家都说用数据说话,但数据多到不可理解,怎么办?大数据时代的变革又触发你怎样的思考?这本书或许能为你答疑解惑。
  工业化时代,一切需要用数据说话;黄仁宇的《万历十五年》,说中华帝国最大的问题是不能以数目说话,帝国许多的决策是想当然,并认为是帝国千年无法快速发展的原因。其实,幅员辽阔的帝国治理在许多时候,还是用数字说话的,只是关键是数据承载和传递的方式,使得许多数据无法使用。
  就是到今天,我们老百姓也很难相信堂堂国家统计局的报告数字,不知道能说明什么意思?
  在计算、存储和传送成本快速下降的云时代,这些不再为个人所能理解的数据将会变得如何,计算机系统会开启什么样的视角?人们的思考、工作以及存在的机遇在哪里?
  维克托·迈尔-舍恩伯格和肯尼斯·库克耶所著的《大数据时代(生活、工作与思维的大变革)》为我们整理了这方面的思路。
  作者之一维克托·迈尔-舍恩伯格,是牛津大学互联网治理与监管教授,曾在亚洲新加坡国立大学担任教学研究岗位,对大数据时代特征颇有研究;而另一位作者肯尼斯·库克耶则是多个国际期刊和频道的技术评论员,先后供职于如华尔街日报、国际先驱论坛报以及经济学人等。
  作者以Google在2009年成功预测新型H1N1流感流行为引子开始全文,这种结合禽流感和猪流感病毒特征的新型流感在流感流行几周前,谷歌就成功预测出将出现这样的流感,这是因为谷歌系统中可以检测出诸如“哪些是治疗咳嗽和发热的药物”问题的密集出现区域,结合其他特征提前进行预告。
  这是一个引人注目的开头,当数据应用和普罗大众的生活紧密结合时,大众的信息的确可以反应出许多以前很难关注的问题。在这方面美国和欧洲的确走在了世界的前面。例如在医药领域中,对于某一个品名或品次的药品不良反应很快可以形成某种警示,对民众和厂家都是一种保护,当然这需要一个良好的数据监控和公布制度,这方面我们中国就弱了许多。
  作者告诉我们在新的大数据时代,将会在三个方面有所不同,这也是本书的核心部分。
  其一:“不是随机样本,而是全体数据”,因为有了技术的能力,我们可以看到全部数据的总和,从DNA基因全息分解,找到应对于每个人特质的基因疗法(就是利用健康的基因来填补或替代基因疾病中某些缺失或病变的基因,乔布斯因此延长了生存期),到记录六万四千场的比赛中,看出为什么在临界点上的运动员将会有不同的表现、反应。
  其二:“不是精确性,而是混杂性”,数据将不只是归纳结论的基础,更将成为修正结论的依据,同时大数据量的特征将会让许多进化算法具有更强的生命力,而不是一开始就设计复杂的算法,其实并不能适应大数据的环境。这有点像人民并不需要一个复杂设计精巧的管理机构,如果有一些简单的原理和方式,也许自治类的管理将是效率和成本的解决方案。
  其三:“不是因果关系,而是相关关系”,在逻辑推理课程以及许多管理学课程时,老师最喜欢和我们说的话是不要将时间先后性作为因果推导,陷入不可理喻的反智主义中。
  不过,作者告诉我们,现实世界中许多的关联关系我们无法揭示,这种不被揭示的相关关系又有可能有很好的商业价值,因此从大数据推导来的相关关系能对此进行挖掘。
  嗯,这是一个很好的说法。
  不过这样的说法确实很危险,想一想股市,由于和每一个人投入的金钱相关,所以数据统计的表达和分析,有了几十年的历史,但是在这种羊群理论作用的无意识环境中,大数据量有多少价值呢,看看LongCapital两个诺贝尔经济学家的折戟沉沙就知道,盲目相信相关性,其实是相当危险的。
  作者继而用“数据、技术与思维”三个维度阐述在大数据时代下人们的机遇,数据是资源,是需要制造、管理和整理的,技术是发掘的手段,而思维是前面讲的三个数据特征对政治、经济和生活的影响,很好!这是一个不错的维度,就看我们如何做了。
  这是一本典型的Internet时代的著作,在出版时序上,国内中文版和国际版本同步推出;在整体逻辑上,涵盖多个角度、多维度,许多例子真真假假,多少让人眼花缭乱;看完后,仔细想想,其实作者也未必将每一件事情想得明白,不过Internet的数据是提供思考和触发思考,并不是提供一个现实的结论,这正是大数据时代的特征。读读看,你会看到什么?
转载注明来源:https://www.xzbu.com/8/view-3952735.htm