商汤科技发布悟能具身智能平台
随着互联网自然语言数据逐渐耗尽,商汤AI想要获得进一步的科技突破性成长,需要走出数字世界,发布迈向物理世界。具身
如同人类的平台进化轨迹——当机器能够在现实物理世界中自主探索,便能完成自我迭代与持续进化。商汤
近日,科技由全国工商联人工智能委员会倾力主办,发布商汤科技承办的具身“大爱无疆·模塑未来” WAIC 2025大模型论坛上,商汤科技正式发布「悟能」具身智能平台,平台从开悟世界模型到明晰智能、商汤开悟智能,科技旨在为具身智能打造一个能够在现实世界中自由探索成长的发布强大“训练场”。
基于方舟视觉感知、具身大装置、平台日日新大模型等多种技术的长期积累,商汤「悟能」具身智能平台以商汤“开悟”世界模型为核心引擎,依托商汤大装置提供强大的端侧和云侧算力支持,能够为机器人、智能设备赋予强大的感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化演进。
商汤科技董事长兼首席执行官徐立表示,“世界模型和具身AI的结合,将开启AI发展的下一个阶段,完成由‘工具’向‘人’的跃迁,加速迈向AGI时代。商汤希望「悟能」具身智能平台能够帮助各类具身智能企业,帮助他们完成和现实世界交互的梦想。”
感知全能、导航精准、交互灵活
为具身智能打造“三大核心引擎”
感知、导航和交互,是具身智能的三大核心能力。
商汤科技在这三大方面均拥有深厚的技术积淀,如今这些积累转化成了「悟能」具身智能的能力。
首先,感知是机器探索现实世界的基础。
凭借商汤方舟在视觉AI领域十余年的深耕积累,从机器狗到机器人,「悟能」具身智能平台能为各类终端硬件赋予对万物的识别与理解能力,同时具有强大的场景适配性,可完全嵌入端侧芯片实现端侧推理,让感知更高效、响应更敏捷。
无论是机器狗的视角(上方视频)还是机器人的视角(下方视频),都能对外界有整体的天然感知识别,对物体形成自然划分切割。
导航是机器在现实世界中行动的“骨架”。
商汤绝影在纯视觉端到端智能辅助驾驶方案上的技术积累,可泛化适配至机器人、机器狗等硬件设备,让机器人在更多样的环境中实现精准路径规划与导航。
同样,无论是在绿化小路中四足奔走的、体型较小的机器狗(上方视频)还是行驶在城区正常车道的自动驾驶车辆(下方视频)都在实现精准路径规划与导航的同时,准确地进行了自动避障。
交互是机器与现实世界连接的桥梁。
基于“日日新”大模型的技术积累与不断迭代,“悟能”具身智能平台可以赋能机器人具备和现实世界的交互能力,具备有温度、有深度、长记忆、超稳定等能力亮点。
以AI生成的《长安的荔枝》电影介绍PPT为例,由“悟能”具身智能平台赋能的人形机器人,能够以各种风趣幽默、严谨务实等各种语言风格进行生动讲解。
同时,它还可以自动翻页,实时响应用户提问,敏锐捕捉用户意图,期间用户打断提问,它完成提问后还能回归继续讲解。
它还能结合长记忆能力进行阶段性回顾历史用户提问,作出小结,即便遇到嘈杂环境也能轻松应对。
商汤“悟能”具身智能平台可广泛适配包括汽车、机器人在内的各类终端,实现空间层面的现实世界互动。
构建4D真实世界
为机器进化提供高质量现实世界数据
基于强大的多模态深度理解能力,商汤“开悟”世界模型具备合理的空间一致性和时间一致性,可生成高质量数据,有效提升具身智能等终端设备的智能水平。
“开悟”世界模型能够仅凭自然语言描述,即可生成逼真的七路摄像头视角模拟数据,且不同视角下的几何位置高度对应,完全符合物理世界的规律。
“开悟”世界模型还能够编辑真实世界,可对现实世界中的车辆等场景元素进行替换、删除、增补,创造更加多样的现实场景。
基于强大的生成和编辑能力,“开悟”世界模型可以精准模拟方向盘、刹车和油门控制,带来如同在真实的街道场景中玩“极品飞车”的效果,让机器在现实世界中自由探索。
“极品飞车”啥效果,来这里看看:商汤董事长兼CEO徐立:人工智能的十年演进 | WAIC 2025主论坛
到了具身世界,发挥空间则更大。
相较于智能汽车,机器人适用和覆盖的场景更加广泛,能够通过主动探索生成更多高质量的现实世界数据,在具身智能数据匮乏的当前环境下,可通过构建面向人、物、场的4D真实世界,突破模型泛化能力的边界。
具身世界模型让用户仅需要输入简单的提示词,就能自主进行位姿、动作骨架和指令的生成,让机器人动作更合理。
给出“在厨房区域的架子上找东西”指令,具身世界模型可以准确生成相应的场景视频和机器人的连续位姿,从上图变成下面连续的动态视频
再来一组,还是只给出初始视角。
给出“进入娱乐室、向右转,然后打开通往院子的门”指令,具身世界模型不仅可以进行连续位姿生成,还支持多角度查看,并保持高度的时空一致性
给出“生成一段切黄瓜的机器人视频”指令,具身世界模型可准确生成动作骨架,随后输出具身第一视角、第三视角4D世界视角等多种视角的视频。
给出“生成一段白天公园里机器人跳跃的视频”指令,具身世界模型同样可以模拟生成符合3D关系的4D世界的真实视频。
即便是不同相机位姿视角的视频生成,具身世界模型也能轻松拿捏,来看下具身世界模型生成的多视角视频
商汤“悟能”具身智能平台正在实质性打破虚实界限,构建AI与物理世界交互的高效通路。
未来,商汤科技希望助力赋能具身智能企业实现感知、理解与生成能力的跃迁,将具身交互的不确定性挑战转化为产业升级的确定性路径,推动AI向下一个十年加速进化。
(责任编辑:热点)
-
8月18日,集团旗下食品电商平台中粮我买网迎来了七周年店庆。今年,我买网打出了“7”心不改的口号,用丰富多彩的活动迎接七岁生日的到来。集团总裁助理、中粮我买网董事长张东风表达了 ...[详细]
-
如今随着厂家生产技术不断发展,玻璃也有了各种新的种类,拥有更多更强的功能,逐渐取代普通玻璃。举例来说,原本只能透光挡风的普通玻璃窗,使用夹胶玻璃后就具备了降噪隔热的功能,更加方便实用。我们将在 ...[详细]
-
北京时间10月26日,在湖人主场对掘金的比赛中,科比-布莱恩特来到现场看比赛了。科比在退役之后,很少到现场看湖人比赛。今天他其实是来参加湖人为季票持有者举办的回馈活动的,既然来了,就顺便留下看比赛,还 ...[详细]
-
【新品发布】艾为推出SIM卡电平转换AW39103,成功通过高通平台认证
艾为推出SIM卡电平转换产品AW39103,其凭借优异的性能,成功通过高通平台认证,并获得高通最高推荐等级(GOLD)。图1高通平台认证随着手机平台处理器工艺向 4nm/3nm 演进,其 I/O 电平 ...[详细]
-
现如今,健康环保成为消费者选购产品的重要影响因素之一,在油墨行业,企业选用的材料,生产过程的环境,使用的油墨等等都成为衡量产品是否绿色环保的要素,而在对环保要求日益提高的时代,油墨厂家必须重视环保,走 ...[详细]
-
不锈钢定制家居发展十余年,从学习西方商厨,到形成自己的技术体系……行业发展重心,始终在于工艺的提升和单品类的创新,主要解决传统木制橱柜的环保性、耐用性和适应性问题。新十年开启,不锈钢家居进入设计美学发 ...[详细]
-
2日早报:米神公开谈交易流言 阿米努无缘奥运会发布时间:2016-12-30 11:51 来源:豫都网 我来说说 我要投稿[摘要]保罗-米尔萨普 北京时间8月2日,NBA已经进入休赛期,而在赛场内外, ...[详细]
-
北京时间10月26日,2018-19赛季NBA常规赛继续进行,洛杉矶湖人坐镇出场迎战丹佛掘金。全场打完,湖人逆转121-114战胜掘金,迎来两连胜。本场球,詹姆斯在科比的注视下,打出全能表现,他17投 ...[详细]
-
北京时间8月24日凌晨,沙特阿拉伯利雅得举行的2025电竞世界杯(EWC)《街头霸王6》总决赛中,中国选手“小孩”曾卓君在0:3落后的绝境下,换用角色“不知火舞”连扳五局,最终以5:4的比分逆转15岁 ...[详细]
-
小乔丹称需小心中国4将 杜兰特:无詹皇亦可夺金发布时间:2017-01-12 12:06 来源:豫都网 我来说说 我要投稿[摘要]北京时间8月6日,据美国雅虎体育报道,在接受采访时,杜兰特表示,尽管像 ...[详细]