为什么用大数据、人工智能去建立计划经济是行不通的？

9月23日，在第二届野三坡中国经济论坛上，经济学家、长江商学院经济学教授许成钢对最近出现在中国的一场争论——基于大数据和人工智能（AI）是否可以重振计划经济，给出了否定回答。

许成钢称，机器只能习得可度量、可传递的数据，而对基于人类自身心理感知的原始基础要素无能为力，更无法模拟人的目标行为。

他表示，人工智能只能执行有限范围内目标清晰的任务，但国家经济制度并不属于此类。试图用大数据、人工智能建立计划经济与人工智能得以发展的基础相悖，“大数据从市场上来，你如果把市场消灭了，数据没有了。你说，我现在收集了人类历史上没见过的无数的数据，我就可以不要市场了，就可以计划了，那你搞错了，因为你把市场消灭以后，你的基础也就没有了。”许成钢说。

许成钢1991年在哈佛大学获得经济学博士学位，于2013年获得孙冶方经济科学奖。2016年，许成钢获得首届中国经济学奖（与钱颖一共享），奖励其在转轨经济中作用于政府和企业激励机制的研究所做出的贡献。

以下为许成钢演讲全文：

我今天讨论的是大数据、人工智能以及计划经济、市场经济的争论。

重要的问题就是人工智能的产生是从计划来还是从别的地方来？这是第一个问题。第二个问题就是，人工智能发展了之后会把我们带到哪儿去？人工智能会把我们带到计划经济去吗？这个就是我要今天讨论的主题。

人工智能的基础——大数据

为了讨论这个主题，我想从最基本的技术层面开始讨论，因为我需要理解人工智能是什么意思，人工智能到底能做什么不能做什么，大数据跟它是什么关系。

首先，大数据它自己其实没有那么大的重要性，它的重要性在于它是人工智能的基础。如今之所以世界上所有发达国家都高度关注人工智能的发展，原因现在已经很清楚，就是这是一次正在兴起的产业革命。

这个产业革命会引起的后果立即能看到的就是大量的无人工厂会产生、许多无人服务行业会产生、人类历史上从来没有见过的高效率会产生，会有巨大量的失业。

那么由于人工智能的技术基础是大数据，因此如今大数据变成了一个基础资源，和我们人类历史上过去经历过的原材料、能源等一样。但是这个资源不一样的地方是它不是原来就在世界上存在的，而是我们人工去收集的。

产业革命的教训

下面的问题就是当这种生产模式发生基本变化的时候，这种全新、全面的自动化，它会不会从基本的地方改变制度？我想非常简要的概要一下，我们要吸取从过去已经发生过的产业革命的教训，如果我们不吸取过去的教训，那么我们会重蹈覆辙。

过去的产业革命之所以带来教训，就是因为当这些产业革命产生的时候，人们过高的估计了产业革命可能到什么地方，在过高估计自己力量的时候人类会滥用这些新兴的科学和技术。我举两个历史上的例子，第一个是在第二次产生革命时期，靠那个技术在那个背景下产生出来的以国有制为基础的中央计划这样一类制度的设计，这是一个过高地估计了人的计划能力、人的统治能力设计出来的东西。

另外一个例子就是对环境的破坏，比如化石原料，化石原料的大规模使用就是伴随着第一次和第二次产业革命来的，造成了全球碳排放过高带来全球变暖、带来的一系列污染，人们已经意识到现在到时间扭转了。

这都是过去带来的教训，今天当大数据和人工智能结合在一起的时候，它可能的危险我们还不知道，比如带有垄断性质的大公司利用手中的数据试图来控制社会，用于大规模的战争，用于犯罪等等。

基于大数据的算法与计算能力

下面我们从最基础的地方认识一下人工智能和大数据，只有知道基础，才有可能能知道它能做什么不能做什么。

今天人工智能整个的大发展实际上是过去超过了半个世纪的发展积累出来的。首先，人工智能第一个重要的部分是算法，而这个算法是早在1950年代就开始探索的东西。关于人工智能的提法、算法和想法，甚至一些指导性的意见，是很少几个创始人在1956年的时候在一次会上把这个名字确定下来，讨论了大的方向，其中奠基人之一是经济学家西蒙教授，他是诺贝尔经济学奖获得者，同时他是卡内基梅伦大学的经济学教授、计算机教授、心理学教授，这三个专业统一在一起，才有了人工智能的想法。

人工智能的算法部分如今发展的最好的是所谓的“神经元模型”，神经元模型导致这个机器可以在人的指导下进行学习，所谓“深度学习”就是今天通常人们讲人工智能时所提到的东西。人工智能的另外一个普遍使用和可探索的方法是“统计算法”，但是无论是使用的是人工训练的办法还是统计得办法，都必须要大量的数据，这就是为什么大数据是基础。

人工智能的第二个基础是计算能力。在过去的半个世纪里，计算速度、计算能力和存储能力基本上是每两年提高一倍（摩尔定律），积累了半个世纪以后，现在超强的能力使得无论使用任何一种计算方法的人工智能，在一些领域机器超过人，而且是大大地超过人，一部分是因为算法，一部分原因是因为计算能力。当然了，所有的这些的基础是大数据。

大数据的基础：可度量数据

下面我们需要理解一下大数据本身的技术基础是怎么回事，我们才能明白人工智能可以做什么不可以做什么。首先，大数据产生的最基本的基础是传感器、移动设备，是传感器和移动设备先检测到一些具体的数据，然后通过互联网和物联网把他们传送，然后集中起来，所谓的大数据的核心就在于收集、传输、储存和处理所有这些传感器和移动设备他们可以度量的数据。这是关键所在，人工智能可以做什么不可以做什么，是由这个决定的，即是不是可以度量。

另一层面的大数据，是利用历史上积累的大量文献，其中包括各个学科积累的文献，比如说图书馆里有文字的、有图的、有音乐的、有舞蹈的记录，这些全都可以转换为大数据供机器去学习、分析。

所谓“深度学习”的人工智能（我们今天讲人工智能多半讲的是这个），它的技术基础基本是用大数据来训练机器来产生识别的能力、推理的能力、规划的能力，等等。

冷识别与热识别、硬数据与软数据

下面我们讲的是算法，因为所谓的深度学习其实是一种算法。这个东西从一开始产生就从同经济学里的决策理论是在一起的，或者换句话说可以认为它是决策理论的一个部分。算法的核心是什么东西？首先，作为人工智能的设计者，你要为你的机器人分配一个目的，就是你造的这个机器在世界上的目的是什么，它是用来干什么的？他的目的和我们经济学家讨论的是一回事——它要寻求它自己效益（利益）的最大化。

没有任何一个经济学家知道世界上每一个人真实的目的是什么，是什么东西影响你？抽象来说你的目的是为了幸福、为了愉快，但是什么东西影响了你的幸福、你的愉快，没有任何一个经济学知道，这就是为什么“市场”重要。下面的问题就是如果有了大数据，有了这么聪明的人工智能，有没有可能通过收集无数的巨大量大数据把它算出来、把它模拟出来，有没有可能？

下面我们就要把人的智能和人造的智能，分别看一下。首先，人的智能是产生于人的生理、心里的感知以及人收集的信息。1950年代，西蒙教授讨论人工智能的时候，就已经区分出来了“识别”的概念，这也是今天人工智能核心的概念。早在那个时代就已经有了所谓冷识别和热识别区别的辩论。什么是冷识别和热识别？冷识别是机器能够识别的，热识别是人带着感情的识别，人带着感情的识别机器是学不来的，这是一点。

再一点就是今天讨论人工智能也好、讨论相关的激励机制问题也好，有一个重要基本概念——硬数据和软数据，硬数据就是前面我提到过的，所有可以度量可以传递的数据；但是，永远和硬数据对应的还有一部分是软数据，软数据是没有办法用传感器或移动设备度量的，不能度量就无法传递、无法处理。所以当我们讨论人工智能是基于大数据训练出来的时候，热识别和软数据的问题从技术上决定都不包含其中，它连基础都没有上哪去学呢，这就是为什么机器不是人。

再有一点，人的智能里边有个非常重要的基本部分就是直觉。什么是直觉？直觉是基于人对于硬数据和软数据、冷识别和热识别综合在一起产生出来的人的一种高度的抽象的跳跃性的反映。这种直觉，不但它依赖的数据是不可度量、不可传递、无法机器处理的，而且产生的直觉本身也是人无法描述的，这就是为什么师傅带徒弟不一定带得出来，在教学的时候，好的教授之所以好，因为好的教授有更多的好的直觉，但是这个直觉传递不过去，你已经想出来了都传递不过去，更不要说你的学生会不会学出来，这个学生能不能产生直觉是老师没有办法，天生的。

转载请注明：北纬40° » 为什么用大数据、人工智能去建立计划经济是行不通的？

1 2 下一页