您好, 访客   登录/注册

浅谈大数据时代

来源:用户上传      作者: 喻梅

  【摘要】大数据时代已经来临,什么是大数据,大数据究竟有多大,大数据发展中将逐步实现多学科,多行业融合,大数据的安全和隐私持续受到关注。
  【关键词】数据 展望 预测 隐私
  如今,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数大数据时代来临据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。
  一、什么是大数据
  数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然现在企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。那究竟什么是大数据呢?
  著云台的分析师团队认为,大数据(Big?data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
  二、大数据到底有多大
  “大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……
  截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。
  三、对大数据发展展望
  对大数据发展展望做预测。这个预测的调研方式就是大数据专家委一百多位委员内部进行这样的一个观点征集、汇总,最后进行投票,同时邀请中国大数据产业联盟的会员参与到最后的投票环节,2015年底总共投票的专家是116位,从这116位专家投票中形成了下述的结果。
  大数据专家委列出的2016大数据产业技术发展的十大趋势,从这里面我们简单解读为他出现了这样四个重点的关键字,一个是民生相关的应用,因为应用很多,应用驱动大数据,因此民生相关的大数据可能会得到更快的发展,第二就是多样性和融合性,不管是技术、产业等等各方面会出现多样融合的状况,另外第三个就是政策拉动,第四总是呼吁各个层面出现多样的生态,简单对这十各方面稍微做一个解释。
  第一,可视化技术。作为汇总整理的时候这也是给了工作组一个很大的意外,做了这样一个解读:可视化作为技术形态能够排到第一,其实背后隐藏着大数据的贫民化。普通老百姓和常规的决策者能够更好的理解大数据的效果和价值,所以能够摆在这么重的位置,不仅仅可视化的形态,也包括可视化的分析,这是排在第一的趋势。
  第二,多学科融合。大家对学科的发展非常关注,预测排在第二位是多学科融合,大家认为数据科学的雏形已经出现了,从表现形式来看,很多相关的数据,科学的研究院,专门的实验室,也可以看到这样的学科逐渐的完备,可能会逐渐的出现,当然本身确实也是交叉性的学科,是多学科融合的产物,所以从事大数据研究不仅仅是计算机领域的科学家,也包括数学等等方面的科学家参与到整个大数据前沿的研究中。
  第三,大数据的安全和隐私持续受到关注。从现在大数据的发展情况来说,应该说针对大数据的威胁和大数据所产生的副作用,以及大数据发展中的障碍会逐渐成为大数据领域所要关注的点。针对大数据的攻击现在没有大规模的报道,但是隐忧已经令大家担忧。隐私大数据所带来的副作用,原来的隐私我们接受的程度,有了大数据之后隐私接受程度发生了很大的变化。由于大家对大数据的安全等等相关的问题的担忧阻碍我们在大数据的发展上的投入,这也是阻碍大数据发展的问题。
  下面是一个有关大数据时代的笑话,但从中不难看出大数据时代来临带给我们的方便,同时也会对担忧:我还有隐私吗?!
  您好,请问有什么需要我为您服务?
  顾客:你好,我想要一份……
  客服:先生,烦请先把您的会员卡号告诉我。
  顾客:16846146***。
  客服:陈先生,您好!您是住在泉州路一号12楼120x室,请问您想要点什么?
  顾客:我想要一个海鲜比萨……
  客服:陈先生,海鲜比萨不适合您。
  顾客:为什么?
  客服:根据您的医疗记录,你的血压和胆固醇都偏高。
  顾客:那你们有什么可以推荐的?
  客服:您可以试试我们的低脂健康比萨。
  顾客:你怎么知道我会喜欢吃这种的?
  客服:您上星期一在中央图书馆借了一本《低脂健康食谱》。
  顾客:好。那我要一个家庭特大号比萨,要付多少钱?
  客服:99元,这个足够您一家六口吃了。但您母亲应该少吃,她上个月刚刚做了心脏搭桥手术,还处在恢复期。
  顾客:那可以刷卡吗?
  客服:陈先生,对不起。请您付现款,因为您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括房贷利息。
  顾客:那我先去附近的提款机提款。
  客服:陈先生,根据您的记录,您已经超过今日提款限额。
  顾客:算了,你们直接把比萨送我家吧,家里有现金。你们多久会送到?
  客服:大约30分钟。如果您不想等,可以自己骑车来。
  顾客:为什么?
  客服:根据我们全球定位系统的车辆行驶自动跟踪系统记录。您登记有一辆车号为SB-748的摩托车,而目前您正在解放路东段华联商场右侧骑着这辆摩托车。
  顾客当即晕倒……
  总之,我们需要做好充足的准备迎接大数据技术给我们的机构和自身带来的改变。我们可以依靠大数据为我们预测信息,但是我认为应该先要发现大数据带来的隐私泄露的问题。我们不会因为投鼠忌器而缩手缩脚,积极克服这些困难,让大数据能为我们更好的服务。
转载注明来源:https://www.xzbu.com/2/view-7630334.htm