套用PayPal联合创始人、科技企业家Peter Thiel的话来说就是“我们本想要酷酷的机器人,但我们只得到了有着140字输入限制的汉堡机器人Flippy”。但是,科学家们正在逐步取得进展,赋予机器人与人类一样的能力,可以对周围的环境进行观察和反应。
该领域的一些最新进展是本月在年度机器人大会暨马萨诸塞州剑桥科学与系统会议上所提出来的。这些论文深入探讨了一些话题,包括如何让机器人更健谈,帮助他们理解语言的模糊性,以及帮助他们在复杂的空间中观察和导航等。
研究人员对机器人的算法进行了训练,方式是对大约4,000种常见的家用物品进行3D扫描,如床铺、椅子、桌子,甚至是马桶。然后,他们测试了机器人以鸟类的视角观察和分辨出900个新的3D物体的能力。相对于其他计算机视觉技术50%的正确率而言,该算法在其75%的时间内做出了正确的猜测。
研究人员表示,他们的研究并不是训练机器对3D物体进行分类的首例。他们的方法不同之处在于,他们对机器人学习物体分类的空间进行限制。
“想象一下所有可能的物体存在的空间,”研究人员解释道:“这就是说,假如你有微型乐高积木,我告诉你,你可以随意将它们粘在一起来创造不同的东西。你可以创造出很多东西!”
这种无限的可能性可能会最终带来人或机器都不能够识别的物体。
“问题在于,命令可以有不同的抽象级别,这可能会导致机器人无法有效地规划其行为或根本无法完成任务。”Arumugam在一份新闻稿中说。
研究最终从虚拟环境进入了真实世界,使用了一个 和Roomba相似的机器人,90%的情况下,该机器人可以做到一秒内对指令做出反应。相反,当无法识别任务的特异性时,机器人需要20秒或更多秒的时间来计划任务约50%的时间。
论文中提到的这种新机器学习技术的一个应用是在仓库环境中工作的机器工人,但还有许多领域可以从一个更全能的机器中受益,这种机器能够在具体操作和一般化任务之间无缝切换。
“其他可能受益于这样系统的领域包括自动驾驶汽车、辅助机器人技术以及医疗机器人等。”Singularity Hub在回答一封邮件来信时这样说。
即使相对“话多”的聊天机器人也可能会被问的无