谷歌DeepMind推GeminiRobotics,助力机器人开启智能交互全新篇章
盖世汽车从外媒处获取到一则振奋人心的消息:谷歌 DeepMind 宣布推出两款专为控制机器人而研发的新型人工智能模型,分别为 Gemini Robotics 和 Gemini Robotics - ER 。谷歌方面宣称,这两款模型将助力各类形态与尺寸的机器人,更高效、精准地认知世界,并与现实物理环境展开互动,为人形机器人助手等前沿应用奠定基础。
在机器人技术领域,虽然机器人平台的硬件水平一直在稳步提升,然而,开发出一款能够让机器人在全新场景中安全、精准地自主行动的人工智能模型,始终是一大挑战。谷歌此次推出的新模型,正是为了解决这一难题。
谷歌的这两款新模型以其 Gemini 2.0 大型语言模型为基础,并增添了适用于机器人应用的特殊功能。Gemini Robotics 具备谷歌所描述的 “视觉 - 语言 - 动作” 能力。这意味着它能够处理视觉信息,理解人类下达的语言指令,并据此产生相应的身体动作。例如,当接收到 “将桌子上的杯子拿起来放到旁边的柜子里” 这样的指令时,它可以通过视觉识别找到杯子和柜子的位置,然后控制机器人手臂完成抓取和放置的动作。
与之不同的是,Gemini Robotics - ER 则侧重于 “具身推理 (embodied reasoning)”,这一模型极大地增强了机器人的空间理解能力。凭借这种能力,机器人专家能够将其与现有的机器人控制系统相连接,使机器人在复杂的空间环境中更好地规划行动路径,完成各种任务。例如,在一个堆满杂物的仓库中,机器人能够借助 Gemini Robotics - ER 的能力,准确判断如何在不碰撞周围物品的前提下,移动到指定位置拿取货物。谷歌 DeepMind 推出的这两款人工智能模型,有望为机器人领域带来新的突破,推动机器人在更多场景中发挥更大作用,为未来智能生活开启新的篇章。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。