中读

最火热的机器人,为什么非得是“人形”的?

作者:三联生活周刊(微信公号)

04-02·阅读时长26分钟

77人看过
今天的我们,越来越接近科幻小说里的情节。

*本文为「三联生活周刊」原创内容

新刊出炉!点击上图,一键下单↑↑↑

人形机器人,来了



2025年过去几个月,从宇树科技的机器人登上春晚舞台开始,一股前所未有的人形机器人热潮袭来。在网上传播的视频里,机器人已经能像人一样走路,跑步,甚至能翻跟斗,骑自行车。很多人都为技术的飞跃而欢呼,渴望以后能靠机器人给自己养老。但人形机器人实际上发展到什么程度了?它与我们普通人的认知存在什么偏差?机器人要走进千家万户,在技术、产业以及伦理问题上,还需要跨越哪些关口?



主笔|张从志

机器人热潮何以到来?

2025年的央视蛇年春晚表演了46个节目,历时4个半小时,但是,最后被大多数人记住的,不是相声、小品,也不是魔术、曲艺,甚至不是当红的歌手或者演员,而是一台身高1.8米,体重47公斤,肤色黝黑,身着花棉袄,扭着秧歌,转着手绢的人形机器人。它就是杭州宇树科技有限公司生产的Unitree H1Unitree H1在春晚舞台的亮相,在国内掀起了一场人形机器人热潮。

Unitree H1在春晚舞台的亮相,在国内掀起了一场人形机器人热潮。
过去几个月,各家公司推出的人形机器人都开始上阵,在视频里展示各种绝技:跑步、翻跟头、打拳,或者进厂打工、端茶倒水。这些视频在社交媒体上广泛传播,其中还夹杂着一些AI生成的虚拟内容,让很多人对机器人的认知与现实产生了某种偏差。这种偏差有两个极端:一个是认为我们很快就可以在家里买台机器人当保姆了;另一个则是相信,机器人仍然只是个铁玩具,不会对我们的生活产生大的影响。
事实上,机器人技术的发展确实在加快。10多年前,随着强化学习、模仿学习等AI技术的兴起,人形机器人的研究范式从传统的机电控制逐渐向深度学习转移。那个阶段,美国机器人公司波士顿动力和谷歌等公司已经利用这些方法,让机器人实现了很多过去难以实现的运动能力。以强化学习为例,其核心思想是通过奖励的方式让机器不断试错,从而找到最优策略。现在我们看到的很多机器人做出的酷炫动作,比如跳舞、翻跟头,抓东西,大都用到了强化学习的技术。
更大的转折点发生在2022年ChatGPT的横空出世,大模型从此变成了人工智能的主流技术路径,计算机专家们甚至看到了通用人工智能(AGI)实现的希望。而要实现AGI,很多人认为,光有大脑的智能还不够,还需要有身体的智能。所以过去两年,从AI的版图里分叉出了一个新的领域,那就是具身智能(Embodied Intelligence)。最通俗来理解,具身智能就是有身体的智能,它强调智能的来源包括智能体的身体与周围物理环境的交互,而不仅仅是发生在大脑层面,而具身智能最佳的载体就是人形机器人。所以,发展人形机器人,成了推动AGI的必由之路。

在浙江省人形机器人创新中心,工程师正在对样机进行调试(蔡小川 摄)
大模型给机器人领域带来的更深刻的变化,是指出了一条新的道路,那就是“端到端”(end to end)传统的机器人学把机器人系统分为感知、决策、控制、执行四个模块,如今这种模块化的思路逐渐被“端到端”的架构取代。“端到端”,简单来说,就是只管输入和输出两头,而且只用输入原始的数据,不需要对数据进行分割,中间怎么运算则交给算法来完成,最终机器会从海量的数据中识别出规律和特征,从而得到正确的输出结果。
在这期封面报道中,本刊记者采访的加州大学洛杉矶分校工程学院教授丹尼斯·洪(Dennis Hong)提供了一段更加通俗的解释:在前人工智能时代,我们长期以来对机器人的操控是基于模型,它的原理其实不难理解:我们用数学和物理,把机器人的运动拆解成一堆方程式,然后输入机器人的大脑。就像你给它一本操作手册,告诉它什么时候该迈哪只脚、用多大力气、身体往哪边倾。飞机、汽车也都是这么被控制的。这套方法的好处是可控——你知道它为什么能动,也知道它出错时错在哪儿。但问题也很明显:真实世界变化太多了,模型再精准,也总有想不到的地方。比如地板打滑、风吹、碰了一下桌角,机器人就容易‘蒙’。”现在,科学家可以不再给机器人操作手册,而是让它自己学。比如我们给它成千上万段走路、转身、上下坡的动作数据,它就能从里面找出规律。你不用教它牛顿定律,它也能慢慢学会走得稳、站得住。这种方式叫‘端到端
如今,在机器人领域,越来越多人相信,通过大规模的数据采集、训练,可以让机器人学会举一反三,从而适应复杂多变的物理环境和动态任务,成为真正的具身智能机器人或者说通用人形机器人。
这对我们外行来说,是一条不太容易理解的技术演进之路,但其意义重大,也是当下这一轮人形机器人热潮的实质所在。正是具身智能的提出,把做传统机器人研究的学者和工程师,与做大模型研究的AI专家们聚合起来,开始合力给人形机器人造出一个更加聪明的大脑和一个更加强壮、灵活的身体,让它将来能够在工厂、商场乃至家庭之中,帮人类承担更多的工作。从业者们相信,机器人通往未来的路径已经清晰,只等待突变点的到来。
这种信念正在将产业界、资本界的资源大规模引入人形机器人领域。自2022年以来,这个行业密集成立了一众创业公司,融资金额不断创新高。最新的纪录是,一家成立仅仅50天,尚无任何公开产品的具身智能公司,就拿到了8.7亿元的投资。而不同行业的巨头,如特斯拉、小米、小鹏、美的、蚂蚁集团等等,要么已经入局,要么正在招兵买马。

上海智元机器人的量产工厂内,工作人员正在对组装好的“远征 A2”号机器人进行检查(蔡小川 摄)

为什么要把机器人做成“人”的样子?

人形机器人作为一种科幻想象有很长的历史,但世界上第一台真正意义上的人形机器人1973年诞生于日本,那是早稻田大学开发的一个叫做WABOT-1的机器人,它有双足、双臂,但看着非常简陋,功能很少,走路都很困难。之后的几十年里,全世界各地推出了不同的人形机器人,在科学家和工程师们的努力下,它们开始学会用双足行走,做一些简单的抓取动作,甚至还能跟人聊上几句,不过离我们的生活都还很遥远。
后来,从机器人学中衍生出各种专用机器人,它们不追求人的形貌和能力,而是聚焦不同的场景和需求,比如工业机器人,以及后来的扫地机器人、送餐机器人、医疗机器人等,更快获得了市场的认可。既然如此,为什么一定要执着于造出像人这样双足、双臂的机器人呢?
对于这种执着,研究者们可以给出一大堆理由。他们认为,人形机器人是机器与人类社会融合的最大公约数——它可以适应人类的各种生活环境,比如楼梯的高度、扶手的位置、门把手的位置、厨房操作台的高度等。可以使用各种专为人类设计的工具(比如剪刀、扳手、键盘等),这就意味着,它可以帮人类做更多我们不想做的事情。此外,拟人化的外形,也更容易在情感上被我们接纳。

3月24日,山东省烟台高新区第二实验幼儿园,一台宇树科技的 G1 人形机器人与儿童握手
但双足加双臂的结构,使得机器人本身就成为一个高度不稳定的系统。要让它像人一样协调地运动起来,比如最基本的走路、抓杯子,就把全世界的科学家难住了几十年。这也造成人形机器人的研究在学术界是一个非常小众的领域,在产业界则迟迟无法落地。
浙江大学控制科学与工程学院教授、机器人实验室主任熊蓉和清华大学自动化系研究员、机器人控制实验室主任赵明国,都是国内最早一批做人形机器人研究的学者,在这一领域扎根了20多年。他们也都曾被人劝过转换研究方向。“从学术上来说,过去的机器人研究是一个投入产出比非常低的领域。同样智力和能力的团队,做其他领域可以更容易获得很好的成果,但是做机器人就不容易,有大量的枯燥、乏味的工作要做,要动那么多硬件,周期也长。很多聪明的人不愿意做,这跟最近几年的情况很不一样。”赵明国说。
熊蓉则发现,到2018年前后,很多研究者转向了别的领域,比如当时兴起的建筑机器人、医疗机器人等,在学校里选这个方向的学生也比较少。因为缺少工程人员,在团队里做算法研究的同学不得不肩负起检修机器人的任务。
早年的机器人研究作为前沿技术获得了国家科技项目经费的支持,这给很多学者的科研提供了支撑,后来,眼看出不来成果,很多项目都停掉了。
丹尼斯·洪教授在美国也同样亲历了人形机器人从边缘走到聚光灯下的过程。我缺少研究经费。我尝试过向最大的研究资助机构美国自然科学基金会申请双足机器人研究的经费,但没有成功,申请研究轮式运动的方案则成功了,因为在资助者看来,这个技术的难度相对低,而且更实用,更有可能落地在搜索和救援任务、自然探索和反恐行动当中,而双足步行的应用场景还不明确。
日本从上世纪八九十年代以来就对人形机器人进行了重点投入,包括本田、丰田、索尼等公司在内,都推出过自己的产品。但后来,这些项目大都停止开发。诞生于美国麻省理工学院的机器人公司波士顿动力(Boston Dynamics),从2013推出人形机器人Atla后,不断迭代,实现了让人惊艳的运动能力,但还是因为无法真正落地实用,公司几度易主——先是在2013年被Google收购,2017年又转到日本软银集团旗下,2020年12月12日韩国现代汽车集团成为新东家。

2022年10月26日,波士顿动力公司首席执行官罗伯特·普莱特与他们推出的人形机器人Atlas在一起

我们准备好迎接机器人了吗?

尽管具身智能给人形机器人找出了新的道路,让机器人的进化开始加速,但这个行业的发展仍处于早期,对未来趋势的判断也有不同观点。有的技术专家给出了7-10年机器人就可以实现通用能力的判断,有的则认为需要更长的时间。这是因为在机器人的大脑和本体层面,从业者之间都还存在技术路线的分歧。“端到端”的架构而言,虽然其上限很高,但也存在有“不可解释性”的弊端,也就是人们常说的“黑箱”状态。因为不知道数据输入后,中间经历了什么样的计算过程,科学家们也无法解释机器人任务失败的原因。
在大部分场景下,人们能够容忍机器人犯一定的错误,但在某些场合下如果要求必须分析原因,找到解决办法,这会变得很棘手。中国科学技术大学计算机科学与技术学院教授、机器人技术标准创新基地主任陈小平说,这对机器人的落地应用是一个阻碍。“训的时候效果挺好,但用的时候又不好,不知道是怎么回事,也不知道怎么修改。有些用户可能就觉得心理没底,你到底要多少数据,你缺什么样的数据,这些都不明确,人家就很难配合你。”
而在数据的层面,到底需要需要什么样的数据,需要多大规模的数据,怎么获取这些数据,整个行业也分成了不同的流派。我们采访了不同的创业公司,有的公司认为真机数据最重要。真机数据通常是人类操作员通过遥控或辅助机器人进行任务操作而采集到的数据。所以这些公司会把机器人送进工厂,或者建设集中的数据采集场,部署大量的操作人员和机器人来采集数据。还有的公司相信仿真数据是解决问题的核心。仿真数据是在计算机模型中模拟真实场景,对机器人进行虚拟训练,最终得到的数据。
人形机器人发展如火如荼,大众情绪也烘托至此。我们能感觉到已经身处在一轮技术巨变的浪潮之中。但技术会把我们带向何方,我们并不清楚,这种讨论的声音也十分微弱。虽然国家科技部、工业和信息化部2019年就制定了《新一代人工智能治理原则》,中国国家机器人标准化总体组委托北京大学出版了《中国机器人伦理标准化前瞻2019》,国内一些高校和机构近年来也在开辟关于人工智能研究与治理的方向。但是,技术的演进和跃迁速度,往往迅速将专家们达成的原则、框架和共识甩在身后。

北京人形机器人创新中心有限公司推出的“天工”号机器人正在不同路面进行行走能力演示(蔡小川 摄)
人形机器人产业如今的发展,很大程度上还是基于技术和资本的逻辑,对于它可能带来的失业问题、安全和伦理风险等,都缺乏与技术发展相匹配的研究和共识。技术界和产业界忙着攻克机器人的技术难关,布局规模化生产能力,根本无暇顾及这些问题。而传统的研究伦理的人文社科学者,则对发展越来越快,越来越艰深的智能技术体系和产业缺乏深入的、足够丰富的经验,这对他们的研究和思考构成了阻碍。
本刊记者专访了主导制定《中国机器人伦理标准化前瞻2019》的北京大学刘哲教授。他在北大组织开设的人工智能、机器人与伦理课程,需要由五个院系的老师共同教授,而目前这样的课程尚不多见。他说,人形机器人”的概念本身就值得反思,而伴随机器人的智能而来的自主性,已经给人类社会带来多重伦理困境,需要更多的社会资源和注意力投入其中进行研究。
如果能够实现所谓的通用能力,人形机器人将与人类历史上的蒸汽机、汽车、计算机、手机等所有的单一技术或工具都不一样,它会以具身方式进入人类的生产与生活场景,与我们直接进行物理的、乃至精神的接触,甚至在很多场景下接替人类的决策者身份。这将直接冲击人类的主体性地位,我们的道德经验、伦理规范和法律准则,可能都需要重新调整。
著名的科幻小说家艾萨克·阿西莫夫20世纪40年代提出了机器人三原则
第一,机器人不得伤害人类,或坐视人类受到伤害;
第二,除非违背第一原则,机器人必须服从人类的命令;
第三,在不违背第一及第二原则下,机器人必须保护自己。
80年过去,社会和技术环境都发生了巨大变化,我们对这些机器人的认识似乎还没有超越这些原则,但今天的我们,越来越接近科幻小说里的情节。

2021年,特斯拉公开了Optimus人形机器人计划,图为虚拟场景










更多精彩报道详见本期新刊
人形机器人,来了

点击下图,一键下单




期更多精彩


| 封面故事 |

  • 人形机器人,来了(张从志
  • 人形机器人:进化何以加速?(张从志
  • 我经历的“人形机器人”发展之路(覃思)
  • 五个关键的人形机器人(覃思)
  • 一个“90后”创业团队的技术信仰与实践(李晓洁
  • 机器人自主性的伦理困境(刘畅)

| 经济 |

  • 市场分析:楼市开始企稳了吗?(谢九)

| 社会 |

  • 时事:缅甸强震:动荡局势下的救援难题(程靖 彭丽 杨纯希)
  • 调查:23岁留学生在美遇害:危险的边界(覃思)

  | 文化 |
  • 文化:重读《骆驼祥子》(苗炜)
  • 文史:彭元瑞入馆(卜键)

| 专栏 |

  • 邢海洋:贸易战1.0到2.0的“悲喜剧”
  • 袁越:多功能肾
  • 张斌:刘美贤回到冰场
  • 朱德庸:大家都有病

点击下方图片

开通数字刊会员年卡解锁本期👇



本周新刊

 人形机器人,来了

点击图片,一键下单纸刊!


0人推荐

文章作者

三联生活周刊(微信公号)

发表文章525篇 获得0个推荐 粉丝5924人

三联生活周刊微信公号

中读签约机构

现在下载APP,注册有红包哦!
三联生活周刊官方APP,你想看的都在这里

下载中读APP

全部评论(0)

发评论

作者热门文章

推荐阅读