人机共存?业界大佬畅想未来社会
来源:证券时报 作者:陈雨康 2025-12-14 21:04
Aa 大号字

2025全球开发者先锋大会12月12日至12月14日在上海举行。在同期举行的思辨会上,具身智能企业家们对“2050年人机共存的社会”进行了畅想。

他们认为,随着具身智能硬件、软件、生态深度融合,机器人能胜任人类的大多数工作。有企业家提出,当机器人成为主要生产力后,人类将有更多时间和机会探索宇宙,尽享“星辰大海”。

既要仰望星空,也要脚踏实地。多名具身智能专家在思辨会上强调了多模态语料数据痛点。他们表示,数据短缺是具身智能发展的真命题,且数据多来自受控环境,质量与真实场景需求存在差距。产业应用对数据质量要求更高,这需要政府与企业协同构建贴合实际场景的高质量数据集,推动机器人应用落地。

未来社会或出现机器人医院、具身智能学校

“现在,具身智能行业的发展速度和呈现状态远超所有人预期,但其实很多人不清楚具身智能机器人这一概念的起源。”国家地方共建人形机器人创新中心首席科学家江磊表示,1986年,863计划(国家高技术研究发展计划)开始实施,其中提出了“智能机器人”研究方向,开启了我国机器人研究的历程。

江磊说,近 40 年过去了,如今人们在这一基础上新增 “具身” 二字,提出 “具身智能机器人”,标志着行业迎来了全新发展阶段。“很多人说这是机器人行业的 ‘翻篇’,但我并不完全认同。它更像是历代从业者不断探索尝试的积累,是整个行业在追逐 ‘星辰大海’ 愿景过程中,一个极具里程碑意义的热点爆发。”

对于2050年具身智能机器人的理想和愿景,上海青心意创科技有限公司CTO曾俊表示,至少能于2050年前实现三个核心维度“质的飞跃”。

一是硬件能够稳定、可靠地满足任务要求,这是基础保障。二是软件集成度提升,当人们下达任意任务指令时,配套软件能高效支撑机器人完成与人、与环境的交互,还具备紧急情况下的自动响应能力。

三是在产品生态上,2050年前,行业已明确可盈利的商业方向,且这些盈利方向能清晰拆解为对应的软件和硬件需求。当硬件、软件、生态三者深度融合,行业就能进入良性循环的发展状态,形成持续前进的 “飞轮效应”。

开普勒副总裁宋华作出了较为乐观的预测,他表示,具身智能的发展速度将快于业内预期。到2050年,行业已彻底解决两大核心问题。在硬件稳定性上,经过多轮迭代更新,硬件性能会达到非常可靠的水平;软件功能性方面,通过持续迭代,机器人能精准完成各类预设任务。

宋华认为,人机共存的社会,将出现专门服务于机器人的配套体系,例如类似人类医院、学校、培训机构的单位,为机器人提供维护、升级和技术赋能。

“人形机器人的核心发展逻辑,是追求机器人能胜任各类任务。”新时达副总经理蔡亮表示,十五年内想要机器人做到 “无所不能” ,存在不小的挑战,但整体发展方向是积极向好的。

他还透露,新时达将具身智能作为未来发展的重点方向,正在从传统工业机器人向具身智能加速转型,预计本月月底或2026年年初左右会公布具身智能方面的新进展。

蔡亮还抛出一个颇具哲学意味的思考:若未来机器人具备高度的运动能力和任务执行力,能胜任人类所有的工作,那人类的价值在哪里?“到时候,真正困扰大家的可能不再是如何让机器人做事,而是人类该做什么。”他说。

对于上述问题,宋华提出,人类对未知世界的探索欲望是无限的。如今太空探索已迈出了第一步,未来太空必然会成为无数人向往的美好家园。而这件事,必须借助人形机器人的力量 —— 让机器人为人类创造更多财富,让人类有更多时间和机会投身太空探索。

“到2050年,人类很可能会和人形机器人一起登上太空,而真实的未来,或许会比这个设想来得更早。”宋华说。

机器人也需要“为什么犯错”等负样本数据

具身智能何时迎来“ChatGPT时刻”?在2025全球开发者先锋大会思辨会上,业内人士普遍指出,模型是具身智能的 “大脑”,数据是滋养大脑的 “养分”。大语言模型的爆发,源于海量高质量语料的支撑;而具身智能要实现从 “能行动” 到 “会思考” 的跨越,同样离不开多模态语料数据的“质的飞跃”。

灵御智能首席科学家、清华大学自动化系长聘副教授莫一林表示,数据缺失是公认的非常严重的行业痛点,尤其是较自动驾驶行业而言,具身智能数据集规模远远未达到合理水平。

数据的问题,不仅体现在数量上,更反映在质量上。莫一林进一步表示,大量具身智能数据是在实验室、数据采集场等受控、干净的环境中采集的,而自动驾驶数据则来自真实的道路行驶场景,更贴近实际应用需求。由于具身智能机器人尚未大规模落地,数据采集只能局限于实验室、工厂或数据农场,这导致具身智能数据质量与自动驾驶数据存在显著差距。这一问题必须得到正视并着力解决。

上海科技大学教授顾家远也表示,仿真数据已成为具身智能数据的重要来源。此外,数据质量是至关重要的,尤其是叠衣服、高精度操作等场景对数据采集的精度和细节要求极高,数据质量直接影响模型的学习效果。

上大通用智能机器人研究院特聘研究员、技术副总监黄嘉锋强调了“数据维度”和“数据信息密度”的重要性,他表示,具身智能需要解决的任务更复杂,且完全处于真实物理场景中,这与大语言模型有本质区别。大语言模型可以通过文本、图像数据识别物体、拆解任务;但在物理世界中执行任务时,仅靠文本、图像数据和机器人关节数据是不够的 ,真实物理场景需要动态交互。

“中国有句古话 :人教人教不会,事教人一次会。机器人只有真正感知物理世界,才能理解‘为什么抓不住衣服’‘为什么踢球后球会因重力下落’等底层逻辑。”黄嘉锋表示,具身智能数据需要增加维度,纳入力传感器、触觉传感器等数据——这些对人类而言习以为常的感知信息,对机器人理解物理世界至关重要。

数据的正负样本比例亦受到专家的关注。黄嘉锋表示,当前训练数据大多聚焦于 “如何正确完成任务”,但缺乏 “错误操作的后果及原因” 相关数据,包括 “没抓稳杯子会掉落破碎”“掉落的原因是握持力不足”等。具身智能需要理解真实的物理逻辑,而正负样本的均衡搭配,能帮助模型更全面地掌握任务规律。

责任编辑: 陈英
e公司声明:文章提及个股及内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
更多相关文章
热门解读 更多
视频推荐 更多
热门股票 更多
股票名称 最新价
涨跌幅