手机版

谷歌DeepMind推GeminiRobotics，赋能机器人智能交互

发布时间：2025-03-30 13:58:56 来源：中国广告网阅读量：10895 会员投稿

小中大

字号：

谷歌DeepMind推GeminiRobotics，助力机器人开启智能交互全新篇章

盖世汽车从外媒处获取到一则振奋人心的消息：谷歌 DeepMind 宣布推出两款专为控制机器人而研发的新型人工智能模型，分别为 Gemini Robotics 和 Gemini Robotics - ER 。谷歌方面宣称，这两款模型将助力各类形态与尺寸的机器人，更高效、精准地认知世界，并与现实物理环境展开互动，为人形机器人助手等前沿应用奠定基础。

在机器人技术领域，虽然机器人平台的硬件水平一直在稳步提升，然而，开发出一款能够让机器人在全新场景中安全、精准地自主行动的人工智能模型，始终是一大挑战。谷歌此次推出的新模型，正是为了解决这一难题。

谷歌的这两款新模型以其 Gemini 2.0 大型语言模型为基础，并增添了适用于机器人应用的特殊功能。Gemini Robotics 具备谷歌所描述的 “视觉 - 语言 - 动作” 能力。这意味着它能够处理视觉信息，理解人类下达的语言指令，并据此产生相应的身体动作。例如，当接收到 “将桌子上的杯子拿起来放到旁边的柜子里” 这样的指令时，它可以通过视觉识别找到杯子和柜子的位置，然后控制机器人手臂完成抓取和放置的动作。

与之不同的是，Gemini Robotics - ER 则侧重于 “具身推理 (embodied reasoning)”，这一模型极大地增强了机器人的空间理解能力。凭借这种能力，机器人专家能够将其与现有的机器人控制系统相连接，使机器人在复杂的空间环境中更好地规划行动路径，完成各种任务。例如，在一个堆满杂物的仓库中，机器人能够借助 Gemini Robotics - ER 的能力，准确判断如何在不碰撞周围物品的前提下，移动到指定位置拿取货物。谷歌 DeepMind 推出的这两款人工智能模型，有望为机器人领域带来新的突破，推动机器人在更多场景中发挥更大作用，为未来智能生活开启新的篇章。

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。

猜

你

喜

欢