人类语言很复杂,对人类来说很难理解,更不用说机器人了。但是谷歌研究和日常机器人想要改变这一点。
母公司Alphabet正在整合机器人技术和人工智能创造一个能理解人的机器人自然语言命令。
“人类有一种天赋——从理解习语到操纵我们的物理环境——似乎我们只是‘明白’。”说(在新窗口打开)Vincent Vanhoucke是谷歌Research的机器人技术负责人。“机器人就不一样了。”
现代机器人大多局限于工业环境,在那里它们可以被编码为特定的任务,比如捡箱子或充当移动存储容器。但他们没有灵活性来适应不可预测的现实世界事件。
输入PaLM-SayCan(在新窗口打开),该算法将对语言模型的理解与辅助机器人的实际功能结合起来。谷歌Research和Everyday Robots正在一起使用PaLM(路径语言模型),通过教机器人处理开放式提示并做出明智的回应,来促进更自然的互动。
Vanhoucke说:“这不仅使人们可以通过文本或语音与辅助机器人交流。”“但也通过利用语言模型中编码的世界知识,提高了机器人的整体性能和执行更复杂和抽象任务的能力。”
就像在数学考试中展示你的作品一样,研究人员为模型提供了人类思维过程的例子,以帮助它通过提示进行推理。例如,让PaLM-SayCan“给我带一份零食和一些可以把它吞下去的东西”,机器会通过一连串的思考来识别出一袋薯条和一杯饮料可能会满足请求者。
Vanhoucke说:“无论是在繁忙的办公室里走动,还是理解俗语,我们在机器人技术方面仍然有许多机械和智能挑战需要解决。”“所以,就目前而言,这些机器人只是在为我们的微型厨房里的谷歌人抓取零食方面做得越来越好。”
Vanhoucke说,现在还处于早期阶段,但团队对“机器人可以处理复杂请求的未来”充满希望。