评论

人形机器人迎来新奇点:特斯拉“画大饼” 波士顿“赚眼泪”

想要商业化,先要电动化

作者/ IT时报记者 沈毅斌

编辑/ 钱立富 孙妍

特斯拉“画大饼”,波士顿“赚眼泪”,多颗“重磅炸弹”再次引爆人形机器人行业。

4月23日,特斯拉CEO马斯克在财报电话会上表示,今年年底,Optimus人形机器人将拥有完成简单工厂任务的能力,可能会在2025年实现对外销售。

4月17日,波士顿动力在网上发布了一条视频,曾经表演过跑跳、后空翻、空手道等动作的液压人形机器人Atlas,挥动着左右臂,为观众献上“最后一舞”后鞠躬退场,缓缓出现的字母“Til we meet again, Atlas.(下次再见,阿特拉斯)”,可谓是赚足观众眼泪。

观众感动不到24小时,波士顿动力立刻发布全新版本的人形机器人预告,名字也叫Atlas,新机器人不仅可以做到180°头部旋转、360°的关节扭动,动力方面也采用全电力驱动。震惊四座之余,让人们看到“具身智能”的发展迎来新奇点。

英伟达创始人黄仁勋在ITFWorld 2023半导体大会上曾表示,AI下一个浪潮将是“具身智能”,其描述的“具身人工智能”是能够理解、推理并与物理世界互动的智能系统,包括机器人技术、自动驾驶汽车,甚至是聊天机器人,它们会更聪明,因为智能系统已经开始了解物理世界,而不是简单地执行命令。

从“模仿人类”到“超越人类”

波士顿动力的预告视频一开始,Atlas静静地躺在地上,伴随着嗡嗡作响的电机声,它的双腿以一种不可思议的角度向上翻转折叠,随后将整个身体支撑起来。完全站立后,原本背对镜头的Atlas先将头部旋转180°,慢步走向镜头时又将上半身旋转了180°,颇有一种变形金刚变形时的感觉。

短短半分钟的视频,震惊了许多人,英伟达高级研究经理、具身智能负责人Jim Fan更是发帖感慨:我们对“人类级别”的机器人技术如此痴迷,以至于忘记了这只是一个人为的限制。为什么我们不从一开始就创造一个超越人类的新物种呢?

“360°的关节活动是该机器人给我带来最直接的震撼,很大程度上突破了传统关节的运动限制。”高工机器人产业研究所所长卢瀚宸告诉《IT时报》记者,传统人形机器人的关节活动角度在设计上会尽量模仿人体关节活动范围,例如颈部旋转80°~90°,髋关节活动角度在120°~150°。

运动角度越大,也意味着机器人拥有越高的灵活度,而增加灵活度最直接的方法便是增加关节执行器数量。以特斯拉Optimus为例,全身共有28个执行器,分别为肩部6个、肘部2个、腕部6个、躯干2个、髋部6个、膝部2个、踝部4个,其中旋转执行器和线性执行器各14个。如此之多的执行器数量,在已有的人形机器人中算得上“遥遥领先”。

不过,与全球仿生机器人“天花板”波士顿动力所打造的Atlas相比,Optimus就像是一位步履蹒跚的老人。

尽管波士顿动力尚未公开新版Atlas的执行器数量,但CEO罗伯特·普莱特表示,新版Atlas能达到如此灵活度,是因为在大多数关节处设计了一套定制化高功率且极其灵活的执行器,如同将顶尖运动员般的力量集成在关节处的小型设备中。这样即使在狭小的空间内,也能实现灵活转身,可使用的场景变得更加广泛。

若波士顿动力能将这个“敏捷的躯体”量产,再配合多模态大模型赋予的“最强大脑”,也许能成为“治好”具身人工智能笨拙的“良药”。

想要商业化,先要电动化

电力作为第二次工业革命的核心特征,到如今第四次科技革命,依旧担任动力来源的角色。波士顿动力此前一直深耕液压动力,“并不是说液压路线‘低人一等’,在高爆发、高负载等特殊场景领域,液压技术路线依然具备较强的优势。不过,综合光、机、电、算、软等多方面技术的考量,加上成本的权衡,纯电驱动才是当下面向多场景领域的最佳机器人路线选择。”卢瀚宸说。

在波士顿动力发布的液压Atlas演示视频中,常常可以看到机器人在做跑跳、后空翻等高难度动作失误摔倒时,腿部的液压油会从关节处喷洒而出,不少网友调侃是机器人皮套里的扮演者受伤了。

电驱无论从成本、高精度控制,还是后期维护、噪音等方面都有着很大的优势。”宇树科技市场部负责人王其鑫向《IT时报》记者介绍道,成本方面,液压Atlas单台成本在200万美元,相比之下,宇树最新发布的双足机器人H1成本已经压缩至几十万元人民币。

高盛发布的《人形机器人专题报告》中提到,高规格机器人的物料成本从2022年约25万美元下降到2023年15万美元,降幅达40%。而且,电驱机器人的成本还有下降的空间。

高精度控制方面,人形机器人每个关节都需要精密的运动控制,才能模仿人类行走、抓取等复杂行为。相比液压系统,电力驱动系统,特别是伺服电机,能够提供非常高的位置、速度和力矩控制精度,这对于模拟人体精细动作至关重要。此外,电驱系统与机械控制系统更容易整合,便于通过软件编程进行复杂动作序列的设计和更新,系统发生故障也更容易诊断和维护。

面对爆发力不足的软肋,电驱技术也有所突破。宇树科技在一个月前发布了一条全球首次全尺寸电驱人形机器人原地空翻视频,其动作流畅度和平衡度已经不输液压Atlas。王其鑫表示,这项技术是在人形机器人每个关节处都安装了一个核心关节电机,共19个,其中胯部最大扭矩能达到360牛顿米,最大拉力达到1000牛。但目前上述机器人还处于早期测试阶段,运用场景大多数以实验为主。

随着液压Atlas的退役,电驱Atlas的新生,也从侧面证明波士顿动力对电驱动力技术的顺势而为,商业化前景和“钱景”都吸引着这位元老级玩家。以商业化较为成功的亚马逊双足机器人Digit为例,目前的运营成本为每小时10至12美元,但亚马逊预计,随着产量的增加,成本将降至每小时2至3美元,大大低于人力成本,需求只增不减。

据高盛预计,在基础情况下,人形机器人的全球市场总规模将在2025年、2030年、2035年分别达到15亿美元、120亿美元、380亿美元,出货量则分别为2万、25.6万、137.8万台。

罗伯特·普莱特表示,实现全面量产还需要几年时间,2025年计划在现代汽车场景对电驱Atlas进行实验,只有了解使用场景,才能确保投资机器人能带来足够的生产力。

急待运动控制大模型

在人形机器人领域,会将运用在不同行业的机器人进行分类,如机器人初创企业Figure与OpenAI合作打造的Figure 01,这类能与人类进行对话、清理垃圾、整理餐具、将识别出可以吃的物品递给演示者等交互为主的人形机器人,主要运用了视觉感知类大模型。

“对于我们和波士顿动力以大幅度灵活运动为主的机器人,更需要的是一个基于运动控制类的垂类大模型。”王其鑫告诉《IT时报》记者,目前在机器人测试训练中,AI大模型充当的角色往往是一个模拟器,通过电脑上的虚拟场景和机器人模型,模拟计算出遇到障碍物需要做出哪些动作指令,再将其形成经验储存到实体机器人上,并不断调试。

不过,目前大部分大模型厂商都在“卷”交互、生成、视觉,机器人运动领域还是一片空白。若搭载运动控制大模型后,将不再需要计算机场景模拟,而是变成现实障碍物的自动学习计算,可以精准识别出运动轨迹、力量控制、速度控制、平衡控制等,这才能让机器人的运动能力得到快速提升。返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读