DeepMind 强化学习研究组组长大卫·西尔弗 (David Silver) 被授予 AlphaGo 的“第九段”荣誉专业分类。
郑允智 | 法新社 | 盖蒂图片社
计算机科学家想知道 DeepMind 和 字母表一家以世界领先的人工智能实验室而闻名的英国公司将永远能够创造出具有我们在人类和动物身上看到的那种“通用”智能的机器。
在追求人工通用智能(有时也称为人类级别的 AI)的过程中,DeepMind 将大部分精力集中在一种称为“强化学习”的方法上。
这涉及对人工智能进行编程以采取某些行动,以最大限度地提高其在给定情况下获得奖励的机会。 换句话说,算法通过寻找这些预编程的奖励来“学习”完成一项任务。 该技术已成功用于训练 AI 模型如何玩(并擅长)围棋和国际象棋等游戏。 但它仍然相对愚蠢或“狭隘”。 例如,DeepMind 广受欢迎的 AlphaGo 人工智能软件不能画火柴人,也不能区分猫和兔子,而 7 岁的孩子可以。
尽管如此,2014 年被谷歌以约 6 亿美元收购的 DeepMind 认为,由强化学习驱动的人工智能系统理论上可以增长和学习很多,以至于它们在没有任何新技术进步的情况下打破了人工智能的理论障碍。
该公司的研究人员在 Alphabet 旗下已经发展到大约 1,000 人,他们认为 一张 上个月,我向同行评审的《人工智能杂志》表示,获得通用 AI 的“奖励已足够”。 是纸 VentureBeat 首次报道 上个星期。
在论文中,研究人员声称,如果你每次做你想做的事情时都不断“奖励”一个算法,这是强化学习的核心,它最终会开始显示出通用智能的迹象。
作者写道:“奖励足以驱动表现出自然和人工智能研究能力的行为,包括知识、学习、认知、社交智能、语言、概括和模仿。”
“我们建议通过反复试验来获得最大回报的客户可以学习表现出大部分(如果不是全部)这些能力的行为,因此强大的强化学习代理可以构成 AGI 解决方案。”
然而,并不是每个人都相信。
柏林的人工智能研究员 Sam Weniger 告诉 CNBC,DeepMind 的“奖励就足够了”的观点是“一种有点边缘化的哲学立场,被误导为一门硬科学”。
他说,通向 AGI 的道路是复杂的,科学界认识到存在无数挑战和已知的未知因素,这些挑战和已知的未知因素“正确地向该领域的大多数研究人员灌输了一种谦逊感”,并阻止他们做出像“RL是终极答案,你需要的就是奖赏。”
DeepMind 告诉 CNBC,虽然强化学习一直是一些最著名的研究成果的幕后推手,但 AI 技术只是它正在进行的整体研究的一小部分。 该公司表示,它认为在更基本的层面上理解事物很重要,这就是为什么它正在追求其他领域,例如“符号人工智能”和“基于人口的培训”。
“在 DeepMind 有点典型的方法中,他们选择做出大胆的声明,不惜一切代价吸引注意力,而不是更微妙的方法,”韦尼格说。 “这更接近政治而不是科学。”
人工智能独立研究员斯蒂芬·梅里蒂 (Stephen Meriti) 告诉 CNBC,“理论与实践之间存在差异”。 他还指出,“一堆炸药可能足以将一个炸药送上月球,但这并不实用。”
最终,无论哪种情况,都没有证据表明强化学习是否会导致通用人工智能。
“事实是,没有人知道,DeepMind 的主要产品仍然是公共关系,而不是技术或产品创新,”专注于人工智能的科技投资者和企业家 Rodolfo Rosini 告诉 CNBC。
企业家 William Tunstall-Pedoe,他将类似 Siri 的 Evi 应用程序出售给了 亚马逊,告诉 CNBC,即使研究人员是对的,“这并不意味着我们会很快到达那里,也不意味着没有更好、更快的方式到达那里。”
DeepMind’s Reward is enough 论文由 Richard Sutton 和 David Silver 合着,他们于 1990 年代在剑桥大学会见了 DeepMind 首席执行官 Demis Hassabis。
“奖励充足”这一论点的主要问题不是它错了,而是它不可能错,因此不满足 著名的卡尔波普尔标准 “所有科学假设都是可证伪的,”美国一家大型科技公司的高级人工智能研究员说,由于讨论的敏感性,他希望保持匿名。
“由于 Silver 等人的说法笼统,而且奖励想法没有得到充分定义,你总是可以选择满足假设的情况,或者可以改变奖励想法使其得到满足,”消息人士补充道。
“因此,这里的不幸判决不是我们研究界的这些杰出成员以任何方式弄错了,而是所写的东西是微不足道的。最终从这篇论文中学到了什么?在缺乏实践的情况下,可操作的发现 从承认这个假设的不可剥夺的真理来看,这篇论文就足够了吗?”
什么是通用人工智能?
虽然 AI 通常被称为 AI 社区的圣杯,但对于 AI 究竟是什么还没有达成共识。 一个定义是智能工作者理解或学习一个人可以执行的任何智力任务的能力。
但并非所有人都同意这一点,并且有人质疑 AGI 是否会永远存在。 其他人对其潜在影响以及人工智能是否会建立自己的或更强大的人工智能形式(即所谓的超级智能)感到震惊。
企业家变身天使投资人 Ian Hogarth 告诉 CNBC,他希望强化学习不足以获得通用人工智能。 他说:“人工智能的最新技术越多,我们为人工智能的安全工作做准备的时间就越少,我们的物种进展顺利的可能性就越小。”
韦尼格认为,与几十年前相比,我们今天并没有更接近 AGI。 “自 1950 年代和 1960 年代以来发生了根本性变化的一件事是,科幻小说现在是大公司混淆和误导公众、记者和股东的可行工具,”他说。
DeepMind 每年从 Alphabet 那里获得数亿美元的资金,与 Facebook 和 OpenAI 等公司竞争,聘请该领域最聪明的人,因为它希望开发通用人工智能。 “这项发明可以帮助社会找到一些世界上最紧迫和最基本的科学挑战的答案,”DeepMind 在其网站上写道。
DeepMind 首席运营官莱拉·易卜拉欣 (Laila Ibrahim) 周一表示,试图“弄清楚如何实现愿景”是她 2018 年 4 月加入公司以来面临的最大挑战。
More Stories
Android 15/One UI 7 正在针对 Galaxy A53、A54 等进行测试
《Helldivers 2》的重大更新招致了负面评价,而且玩家数量并未增加一倍
据报道,谷歌 Pixel 9 将获得一些新的 Gemini AI 功能