一个字母,多色块:一个微不足道的任务等待人类捡起它,转过身来,把它扔在我们的手掌中。但对于机器人专家而言,这是一项难以攀登的艰巨任务。机器人的手动操作一直是一个挑战。


(资料图)

输入Dactyl。星期一发布的名为Learning Dexterity的OpenAI视频自豪地展示了他们的机器人系统Dactyl,它是以一流的方式操纵物体而创建的。

重点在于敏捷这个词。它的手指以非常显着的方式处理块,包括巧妙地转动块的不同侧面。它学会了如何将块旋转到任何喜欢的方向。

他们训练了一个卷积神经网络,称IEEE Spectrum的Evan Ackerman,在短短50个小时内控制一只暗影之手操纵物体。

可以肯定的是,他们的手引起兴趣的另一个原因是它在更短的时间内得到了解决。阿克曼强调了机器人团队时间削减的重要性。(这些数字令人羞愧.IEEE Spectrum提到了50个成功的立方体操作,因为6,144个CPU内核和8个GPU在50小时内收集了100年的模拟机器人经验。)

人类需要数年才能实现“强大”的手部操作。好吧,机器人,阿克曼说,“没有那种时间。通过实践和经验学习仍然是解决这类复杂任务的方法,而挑战在于找到一种更快,更有效的学习方法而不仅仅是给予一个机器人手拿东西一遍又一遍地操纵,直到它知道哪些有效,什么无效,这可能需要一百年左右。“

路透社同样描述了为什么他们的工作很重要:“体育锻炼需要数月或数年,并且有自己的问题 - 例如,如果机器人的手放下工件,人类需要捡起并放回去。这也很昂贵研究人员试图将这些年的体育训练分成几部分,并将它们分发到多台计算机上进行软件模拟,可以在几小时或几天内完成培训,无需人工帮助。

斯蒂芬·内利斯(Stephen Nellis)在路透社的一篇文章中提到了另一个激动人心的方面 “研究人员将随机噪声注入到软件模拟中,使得机器人手的虚拟世界变得非常混乱,以至于它不会被现实世界中的意外情绪迷惑。”

在提高杠杆操纵率方面,该团队设法涵盖了无法很好建模的变量。阿克曼写道,“这包括物体的质量和尺寸,物体表面和机器人指尖的摩擦力,机器人关节的阻尼程度,执行器力,关节限制,电机间隙和噪音等等。”

在他们的OpenAI博客文章中,该团队表示,他们训练了一个类似人类的机器人手,以“前所未有的灵巧”操纵物理对象。他们注意到Dactyl是如何在模拟中完全训练的,“使用我们过去一年一直在研究的技术来适应现实世界的物理学.Dactyl从头开始学习使用与OpenAI Five相同的通用强化学习算法和代码。”

他们说,有可能在模拟中培训代理人并让他们解决实际任务,而无需对世界进行物理精确建模。

本文由用户上传,如有侵权请联系删除!

推荐内容