Half the truth is often a great lie.

大数据、机器智能和未来社会的图景

科技 sean 16988℃ 0评论

二、大数据和机器智能的井喷式爆发

大数据这个概念在今天这个时间点被提出来,其根本原因是因为摩尔定律导致互联网的发展,进而使得各种数据量的急剧增长(图5,数据增长的速度快于互联网本身增长的速度)。因此,大数据的第一个来源是互联网,包括移动互联网。大数据的产生还有第二个原因,就是传感器技术的突破--今天各种手机,各种可穿戴式设备都有非常精准的传感器。而一些传感器价格非常便宜(比如RFID,每个售价仅四美分),使得每一个物品都可以装上一个。这些传感器产生了大量的数据。

5

图5. 数据的增长速度(最上端的黑线)快于互联网的增长速度(数据来源:美国Gartner公司)

那么大数据能有多么完备?未来的机器能有多么“聪明”?我们看两个极端的例子。

1.精确到每一个细节

我们来构造两个场景,一个是关于物品,一个是关于人。

我们假定在未来的社会里,每一件物品上都贴有一个RFID(指甲盖大小的不干胶),那么它每经过一道(装有RFID阅读器)门,都可以记录下来,这样我们可以追踪它从出厂一直到被消费掉(或者最终销毁掉)的每一步。将来顾客在超市买东西时,他不再需要在收银台前排队,然后一件件扫描商品算账,而只需要把购物车推出装有RFID阅读器的大门,而那个阅读器将读出他购物车里每一件商品,并且算出价钱。不仅如此,他还能知道商品的来源,这样假货就难有藏身之处。对于厂家来讲,它的意义就更大了,大数据可以能建立起厂家和终端用户的直接联系。以前,厂家和客户之间或多或少隔着一些经销商,因此只能了解自己产品大致的销售情况(比如哪个地区卖了多少),而无法了解细节(比如哪个收入阶层在消费,各个流通环节加价多少等)。但是在大数据时代,它不仅能够知道每一件商品买给了谁,甚至能知道中间每一个流通环节里的细节。因此,它可以完全根据市场供需进行生产,而且可以减少中间环节。对于政府的税收部门,如果可以备份每一笔交易的每一个细节,保证每一笔税收。当时,实现这一切需要多少IT投入,什么时候可以完成现在尚难估计。

接下来谈谈对人的精细化了解。从理论上讲,在大数据时代完全有条件了解每一个人24小时的全部行程。对于使用手机的人,这件事很容易做到。Google向智能手机和Chrome的用户提供一个被称为Google Now的个人资讯服务,它通过大数据(利用多维度的特点)将用户在日常生活中使用的很多(网络)服务打通,让使用者可以非常方便地管理每一天的生活。比如,它通过纪录使用者不同时间所在的位置,自动了解他的住址和上班的地点,每天上下班前,通知用户路上所需要的时间和比较好的行程路线,同时也能通知用户沿路可能发生的拥堵和交通事故。它还可以根据用户的通信(比如邮件),帮助用户自动地将每天的活动自动地加到日历中并且及时提醒下一个活动。事实上,用户在获得这种方便性的同时,将每天的活动全部交给了Google来管理。只要再做进一步的数据挖掘,拥有这样大数据的公司和机构(不一定需要是手机制造商和服务运营商),不仅可以知道一个人任何时刻的位置,而且可以知道他在做什么(比如在打电话,写邮件,开会或者工作)等等,甚至可以知道在什么时候他和什么人见了面(比如两个人在某个地方一起吃了一小时午饭,吃的是什么饭)。对于没有使用手机的人来讲,虽然不能获得如此详尽的信息,每天的活动也是有办法知道的。比如只要他身上任何一件物品是可以识别,或者他的一些生物特征(脸谱、指纹、声音等)可以识别,再经过大数据分析,也能比较详尽地了解这个人的活动。在过去,针对非常少量的人,如果不计成本的话,这件事情也能办到,但是不可能针对大范围的人,而在大数据和机器智能使得了解每一个人的生活变成了可能。

大数据和机器智能的发展,必将使得“机器”能够准确地了解社会的每一个细节。因此,具有最强大智能机器的不是哪一个具体的机器人,而是超级数据中心后面几十万,上百万的服务器集群。而掌控这个集群的人实际上在掌控这个社会发生的一切。

2.对医疗卫生的影响

近几十年来,虽然人类的寿命在不断地延长,但这在很大程度上是靠技术手段,而不是医疗本身水平的提高。事实上,提高医疗水平是一个非常漫长的过程,而过去研制新的药品和医疗手段亦是如此。医疗健保的费用不断增加,而且照此下去各国将是不堪负荷的,据估计到2020年,美国用于医疗健保的费用将达到GDP的20%左右。

那么出路在哪里?今天IT界和医学界领域都有一个共识,就是通过IT的进步,尤其是大数据和机器智能的进步,帮助解决人类健康的问题。当然,这个话题很大大,我们可以从三个侧面来看看在未来IT技术对生物医疗的帮助。

首先,药品的研制。攻克癌症是人类的一个梦想,但是迄今为止没有一种特效的抗癌药能够治愈癌症。过去医学界还试图研制这样的抗癌药,但是后来医学界认识到,由于癌细胞本身的基因会变异,因此并不存在这样一种万能药。基于这一点共识,医学界改变了治疗癌症的思路,那就是针对特定患者(不断变化的癌细胞),研制特定的药物,从理论上讲,只要研制的速度超过癌细胞变化的速度,癌症就可以治愈了。

按照传统的药品研发思路,科学家们应该先研究病理,找到解决方法(比如阻止具有某种基因的癌细胞蛋白质的合成),然后找到相应的药物,进行各种动物实验和临床试验。这是我们前面提到的强调因果关系的工作方法。但是,按照这个思路,为每一位癌症患者研制一种新药是很难办到的。且不说制药公司能否安排一个专门的团队为一个特定的患者服务,就算是能做到这一点,研制新药的成本也是患者无法负担的-平均一个人要十亿美元(基因泰克公司董事长李文森博士的估计)。事实上,不仅研制抗癌药成本高周期长,在美国,任何一种有效的处方药研制的时间和费用都非常高。过去大约需要十年时间,十亿美元,今天这个过程并没有缩短,而成本甚至上升到近百亿美元。

转载请注明:北纬40° » 大数据、机器智能和未来社会的图景

喜欢 (1)or分享 (0)
发表我的评论
取消评论
表情