加入收藏 | 设为首页 |

凌天传说-业界 | Facebook:不会“犯错”的机器人,不是“聪明”的机器人

海外新闻 时间: 浏览:235 次

在人们知道傍边,机器人依照开发者的志愿而做出指定的动作似乎是一件理所应当的事,并且,机器人完结使命还要做到精准、敏捷。但是,Facbook 的研讨人员却不走寻常路,他们有意让机器人“犯错误”,这到底是为什么呢?

让咱们一同来看看吧。

“知法犯法”是“智”也

在 Facebook 坐落硅谷的新实验室里,有一个叫作 Sawyer 的机器人(来自现已关闭的 Rethink Robotics 公司),它红黑相间的手臂挥舞着,企图完结研讨人员交给它的使命。

依照指令,Sawyer 的手臂应该移动到右边一处固定方位,但是,Sawyer 把手臂举高,然后违背轨迹,错开了指定方位,从头回到了原点;研讨人员只好将 Sawyer 重置,让它持续完结之前的使命。这一次,Sawyer 的手臂的确往右移了,但就在十分挨近指定方位的时分,它再一次违背了运动轨迹,回到了开端方位。两次使命都失利了。

或许有人会觉得 Sawyer 的“恶劣”行为令人抓狂。但就像兔子为了逃避猎鹰而迂回前进相同,Sawyer 看似蠢笨的行为实际上是一种特别的聪明。

Facebook 以为,无论是关于机器人的开发,仍是 AI 的开发来说,这种聪明都至关重要。

强化学习让机器人更“聪明”

一般来说,开发者会编程机器人,让他们经过这些设定好的指令来履行动作,不过从某种程度上来说,这种办法有点呆板。

而咱们人类在学习上则要聪明得多。由于,即便是婴儿也理解,物体从视界中消失并不代表从国际上消失;玩具球可以滚来滚去,沙发却不行;长大后,人们可以学习驾驭,而不是撞车。

这一切都要归功于人类大脑里树立起来的国际模型。

Facebook 首席 AI 科学家 Yann LeCun 表明:

假如咱们在山崖边开车,方向盘只需往右转,轿车就会掉下去,所以,咱们绝不会这样做。咱们大脑里的国际模型会阻挠咱们自己做傻事。

Facebook 也在测验为机器供给这种形式,Yann LeCun 弥补道说,树立国际模型的体系是 AI 取得重大进展的下一个应战。

实际上,Facebook 并不是第一个测验让机器人学会自我移动的团队。

雷锋网注:上图为 Brett 机器人及其开发者 Pieter Abbeel

在加凌天传说-业界 | Facebook:不会“犯错”的机器人,不是“聪明”的机器人州大学伯克利分校,研讨人员使用了一种名为强化学习(reinforcement learning)的技能,让双臂机器人 Brett 把方形钉子塞进一个方形洞里。

在此过程中,研讨人员会让 Brett 测验许许多多随机的动作:假如 Brett 更挨近方针,体系就会给它“奖赏”;假如 Brett 搞砸了,体系会给它“记过”。

这些记载,Brett 都会保存下来,然后经过屡次迭代,它会越来越精准地找到方洞,并把钉子放进去。

立异的自我监督学习

而 Facebook 的测验有点不同,Facebook AI 研讨科学家 Franziska Meier 表明:

咱们想测验的是给机器人灌注好奇心的概念。

人类便是经过好奇心来知道国际的,比方,孩子们想知道猛拽猫尾巴会发作什么,所以他们会去做这种测验。因而,Brett 是经过一点一点地接近方针,来改善自己的动作,而 Facebook 的 Sawyer 则是接近方针,然后成心违背轨迹。

Fhighlightacebook 研讨人员旨在让 Sawyer 自由地测验非最佳动作,而不是奖赏它不断取得的成功,即便这在其时看起来并不理性。Meier 说:

尽管 Sawyer 没有完结使命,但它给了咱们更多的数据,咱们经过这种办法取得的数据比传统的办法要多。

这个概念被称为自我监督学习——机器人测验新行为并更新软件模型,然后协助它猜测自己的行为结果。

雷锋网注:上图为 Facebook 所说的“自我监督学习”的算法模型

这样做的意图是让机器可凌天传说-业界 | Facebook:不会“犯错”的机器人,不是“聪明”的机器人以愈加灵敏地去完结使命,或者说,更简单习惯动态的人类环境。

比方,机器人要将架子上的杯子放到周围的架子,最好的办法是将杯子直接平移,但是两个架子之间有隔板,这就需求机器人重复实验、重复犯错,直到它探究出更好的处理方案。

正如奥斯陆大学的机器人专家 Tonnes Nygaard 所说的那样:

假如咱们一向执着于一个处理方案,咱们或许会走进死胡同;咱们更应该专心于探究更多新的处理方案。

模仿与实际之间的距离

一些研讨人员经过模仿来教机器人完结使命——树立一个数字国际,再让其间的动画目标经过“犯错”的办法来完结使命。这种办法相对较快,由于当数字“机器”不受实际国际物理规律的束缚,它们迭代的速度要快得多。

不过,尽管模仿更高效,但它并不能完美地反映实在国际,模仿动态人类环境的杂乱性。

这就导致,机器人在模仿环境中可以完美匹配的理论,在实际国际中却不适用。在实际国际中做任何事情都或许更慢、更吃力,但优点是,机器人能取得的数据更朴实。

Facebook的人工智能研讨科学家 Roberto Calandra 表明:

假如它在实际国际中行得通,那它就真的行得通。

究竟,机器人在实际国际中要面临各种意想不到的费事,程序员不或许对每一个都预先进行编码.

AI 和机器人相辅相成

雷锋网注:上图是 Facebook 的六足机器人

从某种程度上来说,Facebook 的项目是 A凌天传说-业界 | Facebook:不会“犯错”的机器人,不是“聪明”的机器人I 和机器人的巨大交融。

尽管谷歌和亚马逊和 Facebook 等科技巨子现已大大推动了 AI 的开展,比方让机器进行凌天传说-业界 | Facebook:不会“犯错”的机器人,不是“聪明”的机器人图像识别,不过这个使命仍根据人们事先给图片贴好标签。不得不供认,机器仍是不行聪明。

跟着 AI 研讨人员开端使用机器人作为渠道来改善软件算法,这种状况开端发作变化。

例如,Facebook 教机器人独立完结一系列使命,这反过来或许会对开发 AI 帮手有所启凌天传说-业界 | Facebook:不会“犯错”的机器人,不是“聪明”的机器人示,让它们可以更好地为用户服务。LeCun 说道:

假如机器人处理了一个问题,同理,它也能在另一种状况下处理这个问题。

简而言之便是,AI 正在让机器人变得更聪明,而机器人也在协助推动 AI 的开展。

不过,Facebook 表明,现在,公司的这项研讨并没有连接到特定的产品。不过,LeCun 说:

咱们以为,机器人将在长途出现中发挥重要作用。究竟,Facebook 具有 Portal 和 Oculus VR 体系。

雷锋网注:本文编译自 Wired

2019 全球人工智能与机器人峰会

由中国计算机学会主办、雷锋网和香港中文大学(深圳)联合承办的 2019 全球人工智能与机器人峰会( CCF-GAIR 2019),将于 2019 年 7 月 12 日至 14 日在深圳举办。

到时,诺贝尔奖得主JamesJ. Heckman、中外院士、国际顶会主席、闻名Fellow,多位重磅嘉宾将亲身坐阵,一同讨论人工智能和机器人范畴学、产、投等杂乱的生计态势。

点击阅览原文检查怎样高效验证深度神经网络的学习行为?看看 Facebook 是怎样做的