您的当前位置:首页 > 人工智能

“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

2020-07-30 05:31:20

原标题:“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

“AI首先是华丽辞藻,其实就是统计学。”

这是2011年诺贝尔经济学奖获得者托马斯·萨金特(Thomas J. Sargent)近期在中国公开演讲时对AI的结论。

于是一石激起千层浪。

AI研究者纷纷坐不住了,其中,阿里AI负责人、阿里巴巴达摩院机器智能技术实验室主任金榕,决定逐条批驳萨金特的观点。

也借机正本清源,表达了对于AI发展现状和未来的看法。

量子位将问答实录编辑如下,最后也附录了萨金特演讲实录,孰是孰非,一辩便明。

“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

△阿里AI业务负责人金榕

金榕驳萨金特

问:萨金特说,“其实就是统计学,只不过用了一个很华丽的辞藻,其实就是统计学。好多的公式都非常老,但是所有的人工智能利用的都是统计学来解决问题。”

金榕:这位宏观经济学家也许是习惯了用统计去寻找经济的因果关系,因而认为AI也是这样。即使是他提到的动态规划(dynamic programming),也不属于统计学范畴。

除了统计,AI中的“学习”“推理”和“决策”中还使用了代数、逻辑、最优化等许多其他学科知识与方法。此外,有了算法后如何有效实现也非常重要。所以单纯说AI就是统计学,或者说“所有的AI都是利用统计学来解决问题的”都是片面和不准确的。

在这里我们首先需要定义什么是人工智能背后的核心技术。现在人工智能技术的成功背后,是基于对海量数据的学习,因此大量的处理、优化以及分布式计算基础设施都扮演了非常重要的角色。

此外,AI还涉及到一个关键因素,就是如何实现最优的智能决策(例如AI打游戏)。一些理论和实证研究已经发现,神经网络就非常善于在复杂的条件下做出最优的决策。神经网络也不是统计学范畴。

还有,人工智能在计算机视觉、等领域取得的突破,还得益于硬件的日趋成熟。类似智能音箱天猫精灵、Echo的成功不仅来自于成熟的语音识别算法,也源于麦克风阵列等硬件设备变得越来越可靠。

那如何比较准确的表述统计学和AI的关系呢?应该说,统计学是人工智能若干重要基础之一,但远不是全部。

就像我上文提到的除了统计学,AI的核心能力还来自于数学(博弈论、数值分析、逻辑学等)、运筹学(优化)、计算机科技(分布式计算、并行计算、CPU、NPU)、神经科学,甚至心理学。

问:AlphaGo为代表的这一波AI浪潮,跟统计学之间有直接关系吗?

金榕:AlphaGo使用了蒙特卡洛树搜索、神经网络、增强学习等方法,因为算法规模大,所以采用了分布式计算来实现。棋力更强的AlphaGo Zero没有使用人类数据,而是从自我博弈中学习。

所以这更说明AI远比统计学来得广泛。所以推动这一波AI浪潮的正是神经网络的迅速发展,以及能够让大量数据发挥作用的算法和算力。

“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

问:托马斯·萨金特也谈到了交叉学科研究推动的科技进步,您是否认同?如何评价这种观点?在这波深度学习为推动力的AI浪潮中,哪些学科的交叉起到了推动作用?

金榕:这一观点我很认同,这也是很多学者的共识。就像我上面提到的,AI不是独自成长起来的。1956年的达特茅斯会议(Dartmouth Conference)被学术界公认为是人工智能的起源。

今天有人说现在是人工智能的春天,其实这都源于我之前提到的一系列技术的发展与进步。特别是我刚刚提到的硬件,诸如麦克风阵列技术的成熟对语音识别的发展起到了重要作用。还有超强的算力,不论是GPU或者是,都给我们带来了强大的计算能力和灵活度。

我们在自然语言对话机器人的开发中,还会应用到许多心理学知识。所以说人工智能的繁荣是诸多学科交叉相互影响,共同促进的结果。

问:下一波大的AI技术跃迁,您觉得会有赖于哪些领域/学科的交叉研究成果?

金榕:我认为首先可能来自于AI、量子计算这些全新的计算基础设施对算力的巨大提升上。

此外还有神经科学的一些重要突破,可能将揭示大脑中神经元如何处理信息与做出决策的,这对人工智能的发展也有重要意义。

问:人工智能的概念提出已经60多年了,许多算法和模型在几十年前就曾提出了,但在过去的发展中,碍于计算力和数据的局限,此前的发展并没有像如今这样迅速,这是不是从侧面印证人工智能也算是统计学的一种呢?

金榕:计算力和数据的增长是人工智能发展的必要条件。AI的发展还要感谢Hinton,LeCun, Bengio等研究者的长期坚持。当然统计学也在发展,但由于深度学习的迅速发展,它们反而变得没有以前那么重要了。

“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

除了统计学,对现在人工智能发展起到举足轻重作用的,神经网络的一些研究工作,也是在50年前进行的,但它被广泛应用是从2010年后开始的。

在2010年前,许多上一代机器学习成果的确是基于统计学的,他们被归类于统计机器学习。但技术是持续进步的,近几年推动人工智能进入发展快车道的深度学习技术,并不能归因于统计学。

问:在您能看来,应该如何定义人工智能,如果要跟大众普及的话,应该传递一个什么样的概念?

金榕:我认为智能化的目的,不是让机器像人一样。上一个世纪,在工业时代,我们基本上把人变得越来越像机器,而未来我们真正应该走的道路是,让机器更像机器,人更像人。我们发明了机器,不一定要机器按照人的思考。

机器要有自己的学习方式、思考的方式、解决问题的方式,所以我们提出“机器智能”。机器智能不应该是,让机器人复制人类的智能,而是发展出自己独特的智能。我们应该让机器做人类做不到的东西,让机器去发展自己智能的力量、尊重机器、敬畏机器。所以在阿里我们是以“机器智能”为目标。

举几个例子,诸如人工智能客服,它能7*24小时的工作,对海量用户的接待能力远超人类。人工智能应用于城市大脑,通过智能决策和管理能大幅缩短交通拥堵时间,甚至提高救护车到达现场的时间。

AI在工业领域的应用,诸如将计算机视觉应用于产品质检,已经为许多制造企业节省了数十亿元。这些都是AI比人类更擅长的领域。而在艺术、文学等创造性工作上,人工智能可能永远无法替代人类。

“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

问:还有一种观点是认为算法、计算力和数据是人工智能技术能否成功的三个关键,你是否也这样认为?阿里AI在这三方面现状如何?

金榕:历史上人工智能经历了多次黄金时期。到了今天,我们迎来了新的一波热潮。

那么这次的人工智能热潮有哪些不一样的地方呢。就是由于我们在算法、计算力、数据上都有了重要突破。

首先人类首次拥有了超强的计算能力,不论是GPU还是云计算。给我们带来了强大的计算能力和灵活度。这点阿里具有很大的优势。阿里云在中国拥有最大的云计算服务,同时我们也在积极探索量子计算。

其次,也是很重要的一点,就是大量的数据的产生。海量的数据使AI模型的大规模训练成为可能。阿里巴巴积累了海量的数据与应用场景,这些数据将成为阿里在人工智能领域快速突破的基础。

最后,就是算法领域的突破。深度学习等新技术已经在各个领域得到广泛应用,比如计算机视觉、语音识别、自然语言处等,多点开花。阿里也在算法领域做了很多探索。诸如在语音识别领域,阿里推出了新一代语音识别模型——DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提升至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。

而在机器翻译领域,在此前结束的WMT2018国际机器翻译大赛上,达摩院机器智能-NLP翻译团队打败多个国外巨头与研究机构,在所有提交的5项比赛中,全数获得冠军。这5个项目包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译。短短一年时间,我们已经在20多个各领域的国际人工智能大赛上获得冠军。

附:托马斯·萨金特的演讲全文

托马斯·萨金特:1943年生,1968年获哈佛哲学博士,先后执教于明尼苏达大学、芝加哥大学和哈佛大学,2003年起任教纽约大学至今。

自70年代初以来,萨金特一直是理性预期学派的领袖人物,为新古典宏观经济学体系的建立和发展作出了杰出贡献。

2011年,萨金特与普林斯顿大学西姆斯教授一起获得诺贝尔经济学家,得奖理由是:“对宏观经济中因果的实证研究”。

“AI就是统计学”?阿里AI负责人金榕逐条驳诺奖得主萨金特

以下演讲是萨金特在厚益控股&《财经》世界科技创新论坛上的演讲全文:

首先我对刚才几位嘉宾讲的话非常感兴趣,我想先谈一谈我的感受,然后再讲讲我的部分。

第一,能不能扮演上帝。作为科学家,很多领域的科学家,我们都需要用统计数据说话。其实在这个时候我们已经在扮演上帝的角色了。

什么意思?有好多应用科学像工程学、物理学、经济学都是应用科学,我们会建立一些模型模拟世界运营,我们的理论也是一样,都是由一系列的等式所构成,有一些随机组成部件。

我们的目的是希望解释我们所观察到的世界上的现象,而我们关键的工具是使用模型,然后放到电脑里模拟。把模拟后的数据拿来,利用数学方法,去微调它的参数,希望尽量接近于现实。

在这个过程中,我们扮演上帝的角色。所以写参数、模拟过程中是在假装,我们是在假装是上帝产生了这些数据。我们尽量想接近这个准确度。我们想接近或者模拟上帝的做法。

这个说起来容易做起来非常难,两百年、三百年前人们认为这是个好主意,但是当年的人不知道怎么操作。为什么?因为比如说你写下一个粒子的模型没有办法运算,算不出来。

但是到了二十世纪尤其是二战结束以后,我们出现了一些技术的巨将,包括诺尔曼,来自于奥地利的一个移民。我的岳父泰勒是研究核弹的,他们发明了蒙特卡洛模型,都是50多岁的时候发明的。

但是三、四年以后统计学家来了,搞清楚了可以做统计分析。所以这时候来了一场革命,影响了各行各业的科学家的研究工作,这就是技术创新带来的好处。其实这个过程中我们都在扮演上帝的角色。

我怎么讲到这儿来了呢?人工智能首先是一些很华丽的辞藻。人工智能其实就是统计学,只不过用了一个很华丽的辞藻,其实就是统计学。

好多的公式都非常老,但是我们说所有的人工智能利用的都是统计学来解决问题。有一些新发展,过去二三十年,今天我们统计学的完成质量更高,首先电脑运算速度更快,有新的算法,好多是源于物理学发展,还有统计力学等等,这是过去3到4年从物理学拿来,加速了我们做系列统计学方面的进步。

过去写下来公式,但是没有办法求解,过去你放计算机,但是能力太差,做不了。后来有了AlphaGo,就是一个动态编程,太大了。两三年前的解决之道就是特别大、特别快的计算机,利用一块一块的算法去运算。我觉得亚当斯密百分之百正确,多少年前说应该有专业分工,这是正确的。

今天有很多工具,如果统计学家一点也不懂物理学,很多人类科技进步就不能变成现实。所以我想作为企业家大家也应该做通才,我们应该去考虑来自不同技术的融合或者是相互促进,这就是为什么有了阿尔法GO的成功。

还有一两点,是刚才听了前面发言人的一些感受。到底什么是金融?金融的含义是什么?问一个高中生什么是金融,他觉得是太华丽的一个辞藻。

什么是金融?金融就是有人存钱有人不存钱,有人花的多挣的少,有人想投资,人是不一样的。什么是储蓄?什么是金融?有一些人就是来做中介,存钱的和需要花钱的人做中介,这个业务就是金融。

这个业务包含以下几方面。首先很容易受到欺诈侵害。第二很容易受到不信任的伤害。如果我攒了钱,把钱交给别人帮我打理,我交给的人是我信任的人,他没有不还钱的动机。他为什么还钱给我。金融体系要验证,我把钱借给你之后会不会还我,这就是金融的关键。如何让别人相信你?金融该是信任和验证相关的活动。在这些方面是有技术发展的,就是验证和信任的工具。

是谁作为主体,是国家做还是谁做?你以自己的生活为例,你和你的家人为例,家人之间也有很多的信任和验证。

比如,阿里巴巴或者亚马逊是“国中国”,因为他们的工作是创造交易平台,人们可以参与买方卖方在他们的交易平台上活动,无论是阿里巴巴还是亚马逊都是发挥警察作用,既管理买方也管理卖方,相当于电子警察,他们开发技术,改良交易平台的信任和验证。

像20到25年前你们的工作。就是前沿的工作,当时就在讲这样的问题的理论,这个理论的技术不断进步。

最后我还想一点,有新的领域的出现,我应该意识到算法机制设计。这个涉及了几个领域。

首先,它讲的是如何运转一个国家或者是运转一个公司像阿里巴巴,或者运转一个拍卖,如何保证人们付款。它结合了什么?结合了计算机科学、博弈论、计算、数学运算,也就是说,上过这门课的人了解了好多东西。他要了解各种各样的学科,所以说专家和通才一起开创新的领域,这些都是值得大家追踪的新的领域。