+1-3454-5678-99
北京朝阳区,全天候在线
《长安的荔枝》这个故事,讲述了小吏李善德如何克服重重困难,将“一日色变”的鲜荔枝从岭南运往长安,这背后需要一套完善的系统来解决保鲜、驿站、路线和补给等一系列相互关联的问题。前英伟达研究员、清华大学人工智能学院助理教授李一鸣认为,这个故事与当前的“世界模型”赛道有着异曲同工之妙。
李一鸣在接受《智能涌现》采访时指出,“世界模型”并非一个独立存在的组件,它更像是一个解决问题的工具,“一匹运送荔枝的马”,其价值在于能否与其他环节协同工作,共同解决实际问题。他认为,当前AI领域存在对“世界模型”的过度追捧(FOMO),许多公司将视频模型、3D模型或具身大脑等与仿真、物理相关的技术都归类为“世界模型”,导致该赛道估值泡沫严重。
相较于纠结于“世界模型”的定义,李一鸣更看重于构建一套能够让机器人在不同场景下泛化的系统。为此,他提出的“Physical AI Infra”(物理AI基础设施)是一个由数据和物理双轮驱动的系统,包含两个核心自研组件:
“世界模型”在这套系统中扮演着重要角色,既是数据采集后的预训练目标,也是机器人进行强化学习的仿真环境。该基础设施能够训练机器人完成切割、旋拧、插拔、搅拌、按压、捏取、穿引等精细操作,并能跨不同类型的灵巧手和机械臂部署,适用于生产制造、零售服务、酒店运营、餐饮备料、医疗辅助等多种场景。
基于这套技术方案,成立于2026年4月的“厘清智能”在短短两个月内完成了多轮融资。据《智能涌现》独家获悉,厘清智能的种子轮融资额高达数亿元,投资方包括顺为资本、红杉中国、高瓴创投、峰瑞资本、星连资本、水木清华校友种子基金、SEE FUND等机构,以及智元机器人、灵心巧手、世纪金源等多家产业资本。
厘清智能受到资本青睐的原因在于其稀缺性,一方面是李一鸣团队在空间感知、多模态推理、自动驾驶和具身智能等领域的深厚积累,另一方面是其“重”的技术路线——从数据采集到模型训练,再到物理引擎,实现全栈自研。李一鸣认为,只有打通所有环节,才能保证信息流畅,并实现各环节的协同优化。
李一鸣的规划是,在2026年底前发布支持跨B端场景的世界模型,并在2028年实现解决方案的规模化落地。其最终目标是为客户提供一套软硬一体的解决方案,能够跨越不同本体和场景解决问题。
李一鸣在采访中阐述了他的核心观点:
Physical AI 公司,并非仅限于“世界模型”或“本体”公司,而应是一个系统
他强调,公司的目标是以解决实际问题为导向,而非技术路线。训练“世界模型”是为了解决Physical AI的问题,提升任务成功率,关键在于如何将数据、模型、硬件和基础设施整合为一个能在实际场景中有效运作的系统。厘清智能致力于构建一套数据与物理双轮驱动的生态系统,其中“世界模型”渗透于预训练和后训练等各个环节。
新一代Physical AI团队的核心特征是全栈自研
厘清智能从数据采集设备、数据管线、可微物理引擎到模型训练,全部自主研发。这包括自研触觉手套以规模化数据采集,自研可微物理引擎以实现Real-to-Sim-Real闭环并支持复杂材质建模,以及自研的世界模型操作系统以实现快速泛化和跨本体能力。
新时代的具身公司应定位为“World Model as Service”
随着数据量的积累,公司将实现快速的跨本体泛化,最终交付给客户的将是一套软硬一体的系统,能够根据落地场景和客户预算自动匹配最优硬件方案,即插即用。
Physical AI的人才画像为软硬一体
李一鸣认为,Physical AI所需的人才与LLM领域不同,侧重于软硬一体的综合能力,这类人才目前非常稀缺。清华大学为团队提供了良好的人才平台,团队成员平均年龄仅23岁。
不能仅依赖数据采集,忽视物理规律
他指出,具身模型的参数量可能需要达到甚至超过语言模型,以实现“智能涌现”。人类数据的规模化效率远高于机器数据采集。同时,仅靠数据采集不足以应对现实世界的复杂性,物理规律的引入至关重要,可以弥补数据局限性。厘清智能设计的方案通过少量真实数据校准世界模型,能够显著减少机器人学习所需的数据量,例如,机器人学习切苹果,只需真实切十次,其余练习可在物理世界模型中完成。
VLA、视频模型、JEPA并非“原生世界模型”
李一鸣认为,“世界模型”负责机器与世界的交互,而语言模型负责机器与人的交互。基于LLM的VLM和VLA模型与物理世界适配性不高,因为语言是一个高度离散化的空间,充满偏见且难以清晰表达所有事物。语言的本质是交流,是人机交互界面,而非世界本身。
“原生世界模型”需要打通感知、推理、决策和动作输出,并面向机器与世界的交互任务设计。VLA因其离散的语言表征而非真实世界,JEPA因只能预测状态而非输出动作,视频生成模型因其推理过程的局限性,都不能算作“原生世界模型”。
高效的物理世界Tokenization是构建“原生世界模型”的关键
多模态观测如何被有效转化为模型可理解的Token序列,是决定模型能力上限的关键。厘清智能是少数能够进行表征端Tokenization的公司,将物理世界高效压缩为机器易于理解的Token。该体系的壁垒在于认知和Know-How,涉及数据清洗、模型优化等复杂问题。其内部训练的视觉Tokenizer效果已优于Meta的DINOv3。
构建Physical AI Infra是训练世界模型的另一难题
除了数据平台,还需要设计高效的物理引擎,以建模柔性物体、流体等,支持机器人进行强化学习。真正的Physical AI Infra能够提升数据效率,优化训练效果,并实现从短程任务到复杂长程任务的泛化部署。
2028年将是Physical AI规模化落地的里程碑
李一鸣认为,轮臂(带轮子的机械臂)是适配多数操作场景的硬件形态,而人形机器人技术难度较大。公司将以轮臂为主要部署形态,并在不同场景中进行泛化。
公司将积极与场景方合作,先从B端切入工业、物流、生活消费等领域,这些领域存在强烈的替代和降本提效需求。通过B端积累的数据和技能,最终将应用于C端。
最终目标是打造一款通用的Physical AI Infra,使其成为类似iOS的平台,支持各类物理操作任务的规模化开发和部署。他预测,2028年将是Physical AI规模化落地的关键节点,届时数据采集规模和电机密度将实现飞跃。
Client's
Comment's
Team Member
世界杯买球网深耕实时更新的赛事比分与数据领域,用心服务每一位用户。
围绕深度分析热门球队与赛事趋势,世界杯买球网持续打磨更优质的服务。
世界杯买球网深耕海量高清赛事精彩瞬间回顾领域,用心服务每一位用户。
在安全可靠的赛事互动平台方面,世界杯买球网提供贴心周到的支持。
世界杯买球网以世界杯赔率为核心,带来高效便捷的体验。
想了解更多足球世界杯相关内容,尽在世界杯买球网。
世界杯买球网围绕世界杯竞猜不断创新,回应用户的真实需求。
| 主队 | 比分 | 客队 | 联赛 | 时间(北京) |
|---|---|---|---|---|
| 第比利斯 2025 | 1:0 | 贝特莱米·凯达 | 格鲁吉亚联赛3 | 18:00 |
| 内盖勒·阿尔西 | 0:0 | 哈瓦萨·凯内马 | 埃塞俄比亚足球超级联赛 | 18:00 |