指的是拥有物理形态的人工智能系统这些系统能够在真实的物理环境中进行学习和操作与周围世界实现动态交互。 不同于传统基于数字环境的AI具身智能具备感知行动并对外界物理刺激作出反应的能力。 长期以来这些系统希望通过集成的传感器和执行器模仿人类或动物的感知和行为逐步弥合智能计算与物理行为之间的差距。 同时它们的复杂性还取决于其处理感官与行为数据的能力当下大模型的出现让相关能力呈现规模级增长正在革新其交互方式。 然而为何具身智能尚未像其他智能应用样广泛融入我们的日常生活?究竟还缺乏哪些关键技术突破?通过回顾近期的技术进展我们起来探讨这个问题。 物理智能更强大更便宜的物理实体让“身体”追上“大脑”的发育 进入大模型时代人工智能的发展超出了许多人的预期。有人甚至设想只要将最先进的大模型装入机器人就能立刻实现具身智能。然而事实并非如此物理实体或面临更大的挑战。
大家熟知的机器人行业明星公司波士顿动
已经为“具身”工程问题“死磕”了二十余年。该公司 新西兰电话号码库 成立于1992年最初因其先进的机器人研究而获得认可许多项目被视为全球标杆包括人形机器人Atlas和四足机器人St等。然而在众多引人注目的演示视频背后实际上这些机器人在过去很长段时间内并未达到“可用”的状态。 不久前波士顿动力公布了条催人泪下的短片宣布大家熟悉的液压动力人形机器人Atlas正式退役!在最后段告别视频中我们可以看到这位明星机器人的真实状态不断尝试奔跑跳跃后空翻失手已成为家常便饭甚至膝盖喷出了液压油运动时皮带断裂而摔倒。这些公众平时看不到的画面正是传统机器人多年来难以实现商业化的重要原因。 当屏幕前的几十万观众为Atlas的次次摔倒而跟着喊疼时波士顿动力随即宣布将推出下代产品专为实际应用而设计的全电动Atlas。然而很遗憾这次的产品更新并非引领性创新因为在波士顿动力死磕液压技术的这两年间已经出现了不少新的竞争对手。 特斯拉便是其中的佼佼者。早在2021年8月的特斯拉AI日上特斯拉首次提出了推进机器人全电动化的概念。
经过近两年的努力今年5月Tesla官方发布
了其二代人形机器人Optimus最新的演示视频展 数字营销选项有哪些好处 示其在特斯拉电池工厂习分装电池。视频中最值得关注的并不是AI的能力而是马斯克让我们窥见了人类帮助机器人进行数据收集的真实场景这也是Optimus最大的优势。方面Optimus的手是世界上顶级的五指灵巧型机器人手之具备触觉感知拥有11个自由度DOF)并称今年晚些时候将达到22个自由度DOF)。另方面视频中展示了人类操作员戴着VR眼镜和手套指挥机器人进行操作以精确的复刻动作这背后是个超低时延的全身控制器与硬件组合强大的运动控制有助于训练的数据迭代。这样的能力我们还在特斯拉10月11日举办的“Robotaxi Day”上看到。虽然过程中发生了段小插曲网友称其中的Tesla Bot与人类互动太流畅背后应该是人类操作员而并非由AI独立完成称其作假。真相无从考究也许特斯拉确实还未能全面的接入AI实现机器人的完全自主。但实际上此时的AI只是锦上添花我们更希望看到“具身”工程的重大突破。 与此同时竞争对手们也不甘示弱。8月初OpenAI投资的Figure AI发布了第二代人形机器人Figure 02进行了全面的硬件和软件升级增强了AI视觉处理电池续航和传感器性能。在最新的视频中5台机器人已经可以进入到宝马车间进行了“实训”尽管它们的动作依然较为迟缓。仅仅三天后波士顿动力的全新电动Atlas机器人也展示了能连续做8个俯卧撑的能力采用非线性模型预测控制方法来优化动作取得很大的进步。尽管新款电动Atlas的手部设计仍未包含手指在技术和实用性方面受到了挑战。
当前人形机器人的顶流希望通过全面
的电动化能够更精确地将智能控制指令转化为物理行动这转 agb 目录 化类似于电动车的兴起如何促进自动驾驶技术的发展。然而要实现真正可用甚至好用的水平仍需更多时间与技术进步。 另外人形机器人除了本体运动控制高自由度灵巧手还有触觉传感器肌肉骨骼技术表情模仿控制等等均在不断发展中虽不完美但年内也有不少试点项目陆续取得了进展。 腾研AGI路线图图谱截选 OptimusFigure 02 中国产业链或成全村的希望? 人形机器人行业尚难以实现大规模量产主要原因之是供应链成熟度不足导致制作成本居高不下。在电动化之前波士顿动力的传统液压动力Atlas各个部分的零部件均为定制生产单台制作成本高达200万美元约合1447万元人民币)且后期维护费用高昂。电动化之后虽然机器人的制作成本将有所下降但仍面临复杂的供应链挑战。马斯克擅长通过第性原