初看Facebook新生的机器人平台看起来有点......混乱,在富丽堂皇的硅谷总部的一个新实验室里,红色和黑色的Sawyer机器人手臂正在用机械呜呜声挥舞着整个地方。它应该随意地将手移动到右侧空间中的某个位置,但它会向上,向上,向上偏离正向,然后重置到其起始位置,然后手臂向右移动并且非常靠近目的地。
但是,就像野兔来回摆动以避免猎鹰一样,这个机器人看似疯狂的事实上是一个特殊的聪明品牌,Facebook认为这不仅是更好的机器人的关键,也是开发更好的人工智能的关键。这个机器人正在教自己探索世界。Facebook表示,有朝一日可能会出现像远程呈现机器人这样的智能机器。
目前机器人非常愚蠢,通常你必须用代码拼出所有东西:这就是你向前滚动的方式,这就是你移动手臂的方式。我们人类在学习方式上要聪明得多。即使是婴儿也明白,移出视野的物体并没有从物质世界中消失。他们知道他们可以滚球,但不是沙发。从沙发上掉下来很好,但不是悬崖。
所有这些实验都在你的大脑中构建了一个世界模型,这就是为什么以后你可以学会驾驶汽车而不会立即崩溃的原因。“我们提前知道,如果我们在悬崖附近驾驶,我们将车轮转向右侧,那么这辆车就会从悬崖上跑下来,没有什么好事发生,”Facebook首席人工智能科学家Yann LeCun说。 我们头脑中有一个自学模型,可以防止我们做蠢事。Facebook正试图将这种模式提供给机器。学习“世界模型的系统在我看来是真正在AI中取得重大进展的下一个挑战”,LeCun补充道。
现在,Facebook的团队并不是第一个尝试让机器人自学移动的人。在加州大学伯克利分校,一组研究人员使用了一种称为强化学习的技术来教授一个名为Brett的双臂机器人,将方形钉推入方孔。简而言之,机器人会尝试大量的随机动作。如果让它更接近目标,系统会给它一个数字“奖励”。如果它搞砸了,它会得到一个数字“缺点”,机器人保持计数。经过多次迭代,寻求奖励的机器人的手越来越靠近那个方孔并最终掉落了钉子。
Facebook正在尝试的是有点不同。“我们想要尝试的是灌输这种好奇心的概念,”Facebook的AI研究科学家Franziska Meier说。这就是人类学会操纵物体的方式:孩子们被对自己世界的好奇心驱使。他们不会尝试新的东西,比如扯猫尾巴,因为他们必须这样做,但是因为他们想知道如果他们这样做会发生什么,这对于可怜的老胡须来说是有害的。
因此,像Brett这样的机器人一点一点地改进其动作,更接近目标,重新设置,并且在下一次尝试时更接近 - Facebook的机器人手臂可能会越来越近,然后偏离路线。这是因为研究人员并没有因为增量成功而给予奖励,而是让它自由地尝试非最佳运动。它正在尝试像婴儿一样的新事物,即使这些事情在当下看起来并不特别合理。
每个移动都为系统提供数据。什么做这在各个关节应用的扭矩做手臂移动到那个特定的点。“尽管它没有完成任务,但它给了我们更多的数据,我们通过这样的探索得到的各种数据比我们没有探索的要大,”Meier说。这个概念被称为自我监督学习,机器人尝试新事物并更新软件模型,这可以帮助它预测其行为的后果。
我们的想法是让机器更灵活,更少一心一意地完成任务,把它想象成完成一个迷宫,也许机器人知道找到出口所需的方向。它可能会一遍又一遍地试图到达那里,即使它在这种追求中不可避免地遇到了死胡同。奥斯陆大学机器人专家TønnesNygaard说:“由于你专注于朝着这个方向前进,所以你可能会走进弯道。”他开发了一种学会独自行走的四足机器人。(Facebook也正在尝试让一个六足机器人单独行走,但在访问实验室时无法证明这项研究。)“ 我不想那么专注于说,而是想朝这个方向前进我知道解决方案是在相反,我试着专注于去探索。我打算尝试寻找新的解决方案。“
因此,Facebook机器人手臂正在制造的这些看似不连贯的动作实际上是一种好奇心,而这种好奇心可能导致机器更容易适应环境。想想一个试图装载洗碗机的家用机器人,也许它认为将杯子放在顶部架子上的最有效方法是侧向移动,在这种情况下它会撞到机架的边缘。从某种意义上说,它是确定性的:一次又一次地试验和错误,将它引向这条不太理想的路径,它试图在侧面加载机架时做得更好,现在它无法备份并尝试新的东西。另一方面,充满好奇心的机器人可以试验并了解到它实际上最好是从上面进来。它灵活,不确定,
现在,一种更简单,更快速的方法来教授机器人如何做东西就是模拟。也就是说,为一个动画棒图建立一个数字世界,并让它自己运用同样的试验和错误。该方法相对较快,因为当数字“机器”不受现实世界物理定律的约束时,迭代发生得更快。
虽然模拟可能更有效,但它是现实世界的不完美表现,你无法完全模拟动态人类环境的复杂性。因此,虽然研究人员已经能够训练机器人在模拟中首先做一些事情,然后将这些知识移植到现实世界中的机器人,但过渡非常混乱,因为数字和物理世界是不匹配的。
在物理世界中做所有事情可能会更慢,更费力,但从某种意义上说,你得到的数据更纯净。Facebook的人工智能研究科学家说:“如果它在现实世界中有效,它确实有效。” 如果你正在设计极其复杂的机器人,你无法模拟他们将要解决的人类世界的混乱。他们必须活下去。这将是特别重要的,因为我们给机器人的任务变得更加复杂。在工厂生产线上升起车门的机器人相对容易编码,但是为了驾驭房屋的混乱(地板上的混乱,儿童,地板上的孩子......),机器人必须自己适应创造力,所以它不会卡在反馈循环中,编码员无法抓住每一个障碍。
Facebook的项目是人工智能和机器人的完美结合的一部分。传统上,这些世界在很大程度上依赖于自己。是的,机器人总是需要AI来自主操作,比如使用机器视觉来感知世界。但是,尽管谷歌,亚马逊和Facebook这样的科技巨头已经在纯粹的数字环境中推动了人工智能开发的重大进步,让计算机识别图像中的物体,例如,让人类首先标记这些物体 - 机器人仍然相当愚蠢,如研究人员一直专注于让事物在不摔倒的情况下移动。
随着人工智能研究人员开始使用机器人作为改进软件算法的平台,这种情况开始发生变化。例如,Facebook可能希望教一个机器人自己解决一系列任务。反过来,这可能会为AI助手的开发提供信息,这些助手可以更好地为用户规划一系列操作。“这是同样的问题,”LeCun说。“如果你在一个环境中解决它,你将在其他环境中解决它。”
换句话说,人工智能让机器人变得更聪明,但机器人现在也在帮助推进人工智能。“许多与人工智能相关的有趣问题和有趣的问题 - 尤其是人工智能的未来,我们如何才能达到人类级别的人工智能 - 目前正由机器人技术人员解决,”LeCun说。“因为你不能用机器人作弊。你不能让成千上万的人为你标记图像。