您好, 访客   登录/注册

大数据时代的“巫师”

来源:用户上传      作者: 高敏仪

  科学界也有像Elon Musk那样玩嘛嘛酷的偶像派人物?当然有,除了美国总统奥巴马想跟他“玩”以外,恐怕未来每届的总统候选人也都想跟他“玩”,他就是美国当前政治圈里的超级新星Nate Silver,号称为美国公众眼里完美的“预言帝”。
  2012年美国总统大选时,奥巴马和罗姆尼选情普遍认为很接近,Silver却成功预测奥巴马将有90.9%机会获得大多数选票,最后他对美国50个州投票结果的预测全对了。事实上,2008年的总统大选美国50个州的投票结果他预测对了49个。Silver在2008年大选结束之后,很快就出版了他的处女作《信号与杂音:预测学的艺术与科学》。
  Silver所使用的是被学界称为“巫术统计”的贝叶斯理论,所以也招惹来频率学派和一些保守的统计科学家们质疑,还有一些来自政党和媒体们的指责,因为Silver的预测就像是军事级别而且是精确到个人的倾向式报导,接下来的每一次大选,整个政治圈和媒体圈只能“坐以待毙”。
  事实上,Silver也开始担心:他的声望将会影响往后的选情,也将失去旁观者清的优势。他并不希望人们视他为科学界“占卜的巫师”,“预测是一门严谨科学,不是一种游戏,我们要用来衡量我们主观现实是否能与客观世界吻合”。
  Silver指出,数据是有陷阱的,人们经常对数据产生虚有的危险幻想。“概率性思考还是绝对性思考在预测中有着截然相反的导向,如果不能做到诚实地看待数据,预测有可能变成灾难,忽略事物的不确定性往往会导致严重后果。”
  Silver举例分析,1997年时美国国家气象局预测,大福克斯的洪水水位是49英尺,镇上的防洪堤限定为承受51英尺的洪水,并未将通过历史数据的正负9英尺误差算进去,结果洪水达到了54英尺。日本福岛核反应堆是另外一个活生生的样本,过去45年间福岛最大的地震记录是里氏规模8.0级,日本地震研究人员参考这个数据后,他们预测该地区不会超过里氏9.0级的地震规模,然后按8.5级的防震标准来建造核反应堆,而事实上福岛在过去更早的时间曾发生过9级地震,但这种情况被人为地排除了,这个预测最终为日本乃至全球带了历史性的灾难。
  “数据本身是不能为自己代言,我们经常是带着偏差的思想、个人兴趣开展数据分析,我们必须知道在你所接收到的信息和你知道的信息之间是存在巨大鸿沟的。”Silver同时指出,明白自己弱点的人反而会采取一定办法来抵消它的负作用。
  今年三十五岁的Nate Silver,既没有从哈佛耶鲁大学辍学的经历,也没有从实验室建造改写历史记录数学模型的成绩。
  从芝加哥大学获得经济学学位后,他去了毕马威担任顾问,那四年时间成为了他人生中最后悔的时间,后来他开始沉迷于网络扑克,但从网友手中赢得的钱足够能让他辞掉工作靠玩扑克为生。
  “我的书可以告诉出租车司机如何工作和选择客人,也能给网络婚介网站一点经营建议。但多数情况下,我们是无法处理庞杂无序的数据,拥有更多的信息并不意味着我们能更好地预测,也就是说我们并不能够对所有东西进行很精准的预测。”Silver指出,事实上人们是可以非常擅长预测天气这类事物的,但特别不擅长预测股票价格,而恐怖袭击则是我们可以预测但却容易忽视了的事物。
  Silver建议初创公司“可以探索一些还没有人涉足的领域,如果企业在这些领域拥有有效的数据,并可以提供相应的分析手段,那么可能会更容易获得成功。”
  看到这里,如果你非常羡慕Silver拥有这种超人能力,那不得不告诉你,不排除正是他的同性恋倾向才让他有了这般神通广大的“预测”能力,“我总觉得自己是个局外人,我总是有不合群的观点。如果你从小就是同性恋,又或者你成长在一个相信不可知论但又笃信宗教的家庭,那你和我一样,你也不愿意相信社会的主流信念。”
转载注明来源:https://www.xzbu.com/3/view-4186004.htm