李德毅院士:探索什么叫新一代人工智能
李德毅院士在认知模型、智能控制、不确定性推理、数据挖掘、无人驾驶等方面取得了多项国际领先成果。 他是不确定人工智能领域的主要先驱者,也是我国无人驾驶领域的积极领导者。 是人工智能产学研发展的重要推动者。
#
会议期间,李德毅院士还分享了他的“对新一代人工智能的看法”。 以下为演讲全文。 #
我今天报告的标题是《探索什么是新一代人工智能》。 那么传统人工智能呢? 什么是新一代内核? 它会是什么样子?
副标题是“人工智能100年”,这就是2056年世界新一代人工智能的样子。 #
1956年达特茅斯会议讨论的七个议题并不落后于现在的任何一个。 那么到本世纪中叶它会是什么样子呢? 传统人工智能有哪些技术特点? 新一代的症状是什么? 分界线在哪里? 如果我们不认真思考这四个问题,就整体用信息化来代替人工智能,那就太粗放了。 尤其是科技工作者更要坐下来认真思考。 不要整天花在云计算、大数据、人工智能等智能化上。 我们需要静下心来谈谈如何回答这四个问题。
新一代人工智能如何从传统人工智能中脱颖而出? #
我个人认为这个分界点可以设置在机器学习之后的深度学习事件上。 因为人类围棋高手全部被机器击败,全世界一片哗然。 2023年的这件事震惊了政治家、心理学家和普通民众,当然也启发了人工智能学者。 它起源于早期的机器学习,尤其是深度学习。 #
但深度学习是新一代人工智能吗? 我以此为分界点,什么是传统人工智能? 为了方便起见,我发明了一个词——计算机智能。 任何在计算机上玩智能(算法、大数据等)的人都是一台在玩的计算机。 它不被认为是新一代智能,而是传统智能。 #
计算能力是关于计算机的,这就是计算机应该做的事情。 算法是人类工程师应该做的事情,数据是应用。 我们不能满足于算力、算法、数据发挥最大作用,必须探索新一代人工智能。
#
新一代人工智能很难命名。 有人说这叫类脑智能。 人类最喜欢这样,因为人类之所以处于身份链的顶端,是因为我们有聪明的大脑。 但脑科学不是一两年的事。 在脑科学被理解之前,我们能否开发出类脑智能?
#
现在人工智能的最高水平是GPD3。 因为预训练和预编程使用了大量的算力和算法,所以我们清华大学在中文预训练和编程上花费了大量的精力。 未来,自然语言处理将用于生成报告、小说、诗歌,这些都可以在机器上阅读。 这些预编程和预训练就是我们想要的智能吗? 我认为我们想要的是能够智能学习和编程的人工智能。
#
能够学习意味着什么? 智能编程是指我们需要软件工程师和算法工程师,用智能来表达代码,让机器自己去写,类似于人脑的智能。 为了弄清楚这个问题,我想讲三个认知革命。 第一个是五千年前语言,特别是文字的发明。 #
一切生物中,只有人类能够拥有自己的文字。 文字脱离了生物体的智力,可以传承知识和文化。 有文字才有文化,有文化才有文明。 所以这几年我一直在讲两句话:智力植根于教育,文明是智力的生态。 500年前,人类的科技革命有了很大发展,认识了客观事件,发明了大量的蒸汽、电和原子。 这些电动工具扩展了人类的体能,解放了人类的体力。
#
100年前,我们开始了解生命科学并发明了人工智能。 我们需要用人工智能来延续人类的智慧。 这三场革命值得回顾。 如今,有些人想要创造人造生命,但对此要小心。 如果人类要培养出一个新的人类,我们人类是不会这么做的。 因此,我们需要了解意识和生命。 这是未来的问题,而不是现在的问题。 我们需要研究人类大脑组织结构的进化和后天学习,因为它有助于人类的智力。 基因和可塑性就是我们所说的可以学习的机器。 没有任何软件的机器是不可能学习的。 后天怎么能学呢? 众所周知,与其他生物相比,如果没有后天的学习,人类的智力也好不了多少。 #
我得出了一个新的定义,智力是学习和解决问题的能力。 学习是解决问题的基础,学习的内容可以有很多。 学习的结果就是记忆。 这句话非常重要。 我们不仅需要研究计算智能,还需要研究记忆智能。 解决问题是学习的目的。 你不可能用一台机器总是解决它原本能解决的问题。 我们希望解决它以前从未遇到过的新问题。 这就是我们想要追求的。 如何解决这个问题? 用数学家的语言来说,如何基于高阶来解决一个设计问题,将小变量放入大变量范围内,就可以解释和解决问题。 我个人认为计算算法和数据只是计算机智能的硬核。 #
这东西为何如此强大? 这并非偶然人工什么意思,请看一下这个视频。 每个科学和工程领域的人都知道微积分。 后来玻尔做了逻辑代数,成为了计算机。 后来,Fraga提出了位置微积分。 如何在有限的数学资源内表达出无限的数学能力,打破了人们思维的传统界限。 有人提出了23个数学问题,后来哥德尔提出了完备性定理。 最后出来的两位大神就是图灵和伊曼。 他们不仅是人工智能之父,也是计算机之父。 #
1936年发表图灵模型,1945年提出自动计算机。1950年成为人工智能之父。 他写了一篇重要的文章《计算机与思维》。 冯·洛伊曼先生用冯·洛伊曼的五要素组成了一台真正的物理机器。 这就是所谓的计算机。 因此,智能科学的发展就是不断提出智能。 确保智能可解释性的问题引发了数学危机。 再证明一遍,让这个封闭的圆圈越来越大。
所以,我们现在遇到一个基本问题,就是开放与封闭的矛盾。 我们可以无限接近真相,但我们永远不可能一模一样。 40位人工智能科学家或认知科学家等学者获得的诺贝尔奖和图灵奖展示了他们如何进行智能和人工智能研究。 西蒙于 1978 年获得诺贝尔经济学奖,并于前一年获得人工智能图灵奖。 这是我们的榜样。 #
现在我们谈论类脑智能,准确的说应该是受脑科学或认知科学启发的人工智能。 这并不是要在某种机制上制造一个真正的类似大脑的物理大脑设备,而是它的灵感。 我们需要认真研究如何启发,什么样的启发使我们能够做出新一代的智能? 这是人工智能工作者认真研究的对象。
#
我们不仅需要类脑智能人工什么意思,还需要类人智能和身体智能。 能够在物理设备上再现人类智能,受脑科学和认知科学启发的新一代人工智能架构,理解新一代人工智能的四梁八柱,是人工智能技术工作者追求的方向。
人类利用类脑系统发明了飞机,并利用空气动力学来解释鸟类的滑翔。 鸟类在飞行过程中仍有许多动作,但尚无法完全解释。 人类利用类脑系统发明了计算机,而计算机又利用计算智能来解释人脑的部分智能。 要实现类脑、类人的东西还有很长的路要走。 我们不应该太急躁或浮躁。
它究竟给我们带来了什么启发? 为什么我们可以做这些事情? 我列出了五个灵感点。 每一项都非常重要。 只有围绕这五点孵化才能做到。 回顾人工智能70年来的发展,我们有3条主线。 一是机器人学的行为主义学派,它提出了机器如何像人类一样行事。 一是符号主义,这是人工智能的主流思想流派。 我在英国读博士的时候,做的是排名计算和排名逻辑。 他们强调的是机器如何像人类一样思考,这样我们就有了可以解释的推理和预测。 现在大家比较看好的是研究主义,特别是人工神经网络,然后出现了深度学习,特别是迁移学习。
#
机器大脑如何像人脑一样连接? 今天,当我们研究新一代人工智能时,我们发现这三个流派的封闭假设必须被打破。 所以我们强调行为主义者的模仿和类比。 人类的模仿是人类抽象思维的首要功能。 从行为智能到感知智能,计算智能强调计算智能的模型驱动发展。 联结主义强调需要考虑语境、语用、语言结构和语法这四个要素。 人类的智力是从低级到高级的。 初级认知产生感知智能和行为智能,高级认知产生记忆智能和计算智能。 人工智能则恰恰相反。 我们首先要忠于符号计算,一阶认知一直很弱,必须大力加强。 我从事无人驾驶这么多年了。 本质上我从事的是跨模态感知智能,认知很少用到。 因为激光雷达、毫米波雷达和摄像头可能无法正常工作。
人工智能不是人造生命。 生命是人类生存的底线。 触碰底线时必须谨慎。 为什么要剥夺意识? 因为上海地区对伦理非常重要,所以我会更多地谈论现在不急于创造人工生命的原因。 意识问题是所有哲学家都感兴趣的。 计算机已经成功地分离了智力和意识。 计算机没有意识,但有智能。 因此,我们可以继续打造无意识但具有智能的高端机器。 无生命的人工智能可以保证工具性的一致性,而智能在体外的延伸正是人类最需要的。
#
汽车已经成为我们的工具,也是人类的第一杀手。 之所以创造出这个第一杀手,是因为人的意识,因为它累,有情绪,注意力不集中。 我们需要这种意识有什么用? 我们需要的只是意识,而不是智力。 如果我们想要意识,抱歉,路还很长。 意识可分为三种类型:自觉意识、自我意识或传递意识。 意识意识要求当前的人工智能学术界制造出人造皮肤来包裹机器人,使其能够感知自己。 皮肤的功能非常强大。 哪里可以找到这样的皮肤呢? 人体中有1000亿个上皮细胞,它们不断更新,可以再生。 体内还有15万公里的神经。 哪里可以制造人造皮肤? 如果不是,那还谈什么意识? 我建议你首先构建工具,而不是意识。
在当前情况下,要构建受脑科学启发的人工智能,我们必须提出非冯莱曼架构。 在监督方面,它类似于人脑的神经组织。 当这个机器放置在这个地方的时候,它应该能够感知周围的环境。 在智能驾驶中,称为同步定位和建图。 关于人工智能在新时代的价值,我提出两个循环、两个协同。 一是客观事件和内部循环,通过五种感官和感知器官。 还有身体的循环,形成动态的行为。 内部协作有两种,工作记忆与场景记忆的协作,以及记忆与计算的协作。
#
我们不想让所有机器都基于 CPU。 我们可以以数据中心为主,让CPU加速。 只是在计算方面,CPU占主导地位。 让GPU加速。 没有必要所有芯片都以CPU为主。 这能实现吗? 我们还需要一个知识图来使用快慢双驱动来提取记忆。 提取记忆在人工生命中是一件伟大的事情。 #
新一代人工智能的核心是什么? #
第二点是关于学习。 这是新一代人工智能的核心。 #
今天的所有计算机都只是由软件工程师编写的代码,以便一遍又一遍地执行。 我们希望这台机器能够解决学习过程中的新问题。 这就是所谓的新一代人工智能。 那么如何找到它的边界呢? 学习的形式是互动,学习的核心是理解,学习的结果是记忆。 学习已成为新一代人工智能解释和解决现实生活问题的基础。 记忆智能已成为新一代人工智能中多领域、多场景可计算智能的边界和约束。 #
使用语用学和上下文来约束语义和语法。 机器必须具有感知客观空间位置并形成位置感和空间感的能力。 为什么不谈论多模态? 因为我觉得视觉和听觉,甚至双模态,已经非常丰富了。 这不是关于更多,而是关于交叉融合。 这就是我们所说的信息融合。 信息冲突较多。 如何减少冲突是我们正在认真考虑的问题。 要做的事情。 #
这就涉及到一个非常基本的问题:通用智能是否被使用? 我认为,在人类的学习过程中,我们无法区分普遍与特殊,也无法区分常识与非常识。
#
如果不是特殊游戏,可以在不同的棋盘上进行,如果游戏规则稍作改变,也称为特殊游戏中的通用游戏。 这是我的基本观点。 相对来说,不用刻意区分。 归根结底,是人的魔法。 魔术最重要的是抽象、类比、类比。 那么如何学习呢? 我提出了三种学习方法,一种叫课堂学习,一种叫模拟学习,一种叫真实环境学习。 #
如果我们制造这样的无人驾驶汽车,机器人将向人类学习。 就像特斯拉一样,你仍然会驾驶它。 当你开了两年后,驾驶大脑说它可以开。 这是第二阶段,机器驱动并允许驾驶员干预。 到了一定的时候,机器人学会了,说我不仅可以从虹桥到苏州,还可以叫所有从虹桥到苏州的车。 机器人被称为机器人。 这很棒。 这里最重要的是如何形成知识图谱。 我们提出了记忆网络的想法。 使用数据和网络来做到这一点。
我们知道神经元是一个非常大的网络。 我们目前正在研究如何挖掘知识、提取基因。 我们希望通过学习让机器自己学习语言,让机器人听课。 它有语言能力、听觉、视觉和表达能力。 它可以利用其交互能力来学习和提出问题。 学习一两年之后,难道就不能允许自己写一个新的程序了吗? 这就是我们自己宣传的。
机器人需要依靠自身的软硬件和外部不断变化的环境,通过交互学习和记忆来实现自我编程和自我成长。 机器人可能无法改变自己的研发或基础软件,就像人类无法改变自己的基因一样。 它可以通过自编程来扩展自己的能力,也可以通过交互提出硬件或基础软件扩展的请求,以便它的主人配合它更好的成长。 人才,适应环境而成长。 演员必须是一个人。 我们提出情境数据和自我模型两个驱动,归纳和研究的系统推进,理性和经验的迭代发展。 #
也许到2050年最浪漫的事情就是新一代人工智能将与时代和人类同步,共同学习成长,解决新问题。 今天的手机将变得互动、能够学习、自我成长和个性化。 个人代理。 #
传统人工智能是计算机智能,应该是封闭式人工智能。 新一代人工智能应该是开放的人工智能。 传统的人工智能应该是计算算法和数据。 新一代人工智能应该是交互式学习和记忆。 传统人工智能解决的是确定性问题。 我们要解决的是不确定性。 人工智能。