起源:董路:超过专业锻练很单一作者: 林
从混沌到秩序:具身智能的数据供给革命与技术结构化实际| 2026AI Partner·北京亦庄AI+产业大会
大说话模型能够靠堆数据跑通Scaling Law,但机械人面对的是动态、多模态、强时序关联的物理世界,杂乱的数据堆在一路,训不出靠得住的模型。从混沌到秩序的工业化蹊径,质量比数量更重要。
机械人进工厂、进场景,真正的挑战不在模型自身,而在数据。徐良威指出,具身智能的数据不是功夫、空间、工作意图缜密耦合的多模态资产。智域基石提出了五层数据编译管线模型,每一层都有明确的质量指标,唯有构建数据底座生态,让本体方、模型方、产业方各司其职,高质量物理世界的数据能力真正流通起来,支持具身智能的规;涞。
以下为演讲内容,经36氪整顿编纂:
徐良威丨智域基石CTO
各人好,我是智域基石的结合首创人兼CTO,今天我跟各人分享的是从具身智能的数据供给革命与技术结构化实际,标题是从混沌到秩序。为什么是从混沌到秩序?具身智能的到来让各人发现原先在大说话模型、自动驾驶或者在所有从前AI的数据实际在具身智能里不够用了,今上帝要讲一下智域基石在上面做了什么样的工作,重要会商两个话题,第一个事件我们在具身智能的数据上怎么去做尺度化的工业化实际。第二个若何把数据和模型本体、产业、场景结合起来,造成一个生态,而不是单纯数据的事件。
我们直接到机械人的落地,2026年我们能够看到一部门的机械人已经从幼样逐步往产衣凤跑了,原先我们思考到的是怎么把尝试室里的算法用视频或者现场展示的方式展示出来,这个事件已经远远不一样了,我们把机械人从尝试室里搬到真实的场景里,原先只有思考让机械人动起来、实现指定工作就能够了。此刻我们要思考的事件是若何让机械人面对不确定的、动态的、多模态整个场景数据输入,还可能进行持续不变和物理世界的交互,这时辰我们就要思考我们怎么产生不变动供给。
原吓仔一句话说的很对,模型决定机械人的能力上限,模型决定了机械人能干什么,很难决定机械人在最差的环境下能做到什么水平,由于好多事件即便是人在新的场景里都不愿定可能处置的好,这个时辰就必要我们思考怎么把真实场景里的数据,这个数据可能分为本体数据,机械人感知到的环境数据,甚至是机械人的工作,机械人的日志,这些信息都要可能送到机械人训练的整个关环里,这时辰才可能把原先在幼样级别造成真在产衣凤可能落地的事件。
原先各人做说话模型时,各人说Scaling Law,但愿有越来越多的数据能力让模型变的越来越好,自身这个事件是没有问题的,具身智能不像原先是结构化的数据,我们在多模态跟持续强有关的数据领域里发现,我们若是单纯堆数据,把大量原先混合在互联网的数据跟机械人操作有关的数据,不论什么样的仿真数据,把这些数据全数堆在一路,能不能让模型训练出来?有这个可能性,目前的结论,我们还很难说把一些杂乱的、毫无规定的数据堆在一路就可能训练出更好的模型,我们不仅思考数量,还要思考质量。这个质量一方面体此刻采集,另一方面体此刻数据的采集、质检、预标注、人态环路的关环再到数据后处置,再到导出,最后进到模型训练,实现模型到数据的关环体此刻整个环节里,每个环节都必要质量,若是某一环节出了差错,不是说这个模型训练不出来,而是真正的模型落到本体再进入场景,若是这个场景出问题,怎么回溯到我这个数据或者在原先的关环里哪一部门出了问题,这是我们对于数据的要求,数量很重要,但我们要思考质量,还要思考质量在每一个环节里的重要性。
路线有好多,各人时时讲的VLA,以仿照进建为主,以视觉输入、说话指令再加上机械人的作为,一个机械人看到什么样的场景,我得到了指令,下一步输出什么样的作为,是一个轨迹层面的数据,以轨迹为主。另表一条路线,各人时时提起的世界模型,在world model中加一个action,最终要作用在物理世界里的,这里思考的是我看到一个场景,我施加了一个作为,物理世界造成什么样,这时辰思考的是因果关系,这里面固然VLA和world model有模型上的差距,必要的都是统一种底层资产,在真实世界里的结构化高质量数据,我界说了合理的或者合用于最终模型工作,通过肯定伎俩把物理里的信息数字化,再经过结构化的过程,把它造成能够输入到模型里的器材,这时辰原始数据是一样的,中央流程稍微有一些不一样,基于统一套数据底座。
数据底座是一整套把真实的场景、真实的工作、真实的成功/失败、真实的和整个环境交互全数都纪录下来,从而可能输入到模型里,让模型可能在真实的世界里获得关环。这一套数据输入有可能是机械人本体,各人看到很无数据采集工厂、数据实训厂,通过让人操控机械人获得和机械人有关的数据,直接作用于机械人不论是预训练、后训练,此刻还有一些比力前沿的,让人带着第一人称视角纪录人的数字化劳动,让人自身的劳动数字化到虚构世界里,再去训练不论是VLA还是世界模型,让机械人学会人类技术,性质上都是把人类或者是机械人这样的一个本体和环境的交互,把物理的概想造成一套数字化的概想,智域基石就做了一套数据底座,不论前端是什么样的数据流入,我们都能够通过数据编译管线处置成模型能够使用的数据,最终实现数据本体,再回参与景再回到数据的关环。
一个工作怎么把原始数据纪录造成模型能够使用的数据,第一个流程,先界说好工作,先要采一个什么样的数据,先要知路机械人看到了什么,它做出什么样的作为甚至它听到了什么,还要关注来龙去脉,我之前的场景是什么样的,我在看到这个场景以来我做出什么样的决策,我又做出什么样的作为,若是我发生这个作为,我接下来的思虑是什么,这个世界真实又会怎么变,一方面纪录在真实世界里发生的所有传感器的纪录,另表从工作纪录,不是单纯从传感器得到的,是事前规划或者是过后推演,我通过把现场纪录、工作整顿搞起来,后面我们把它造成机械人、具身智能必要的一套数据资产,中央涉及到怎么采集、提取其中的关键成分,最后怎么把它沉淀到资产,也会涉及到成功/失败的处置,涉及到失败以来机械人怎么重试,重试战术是什么,重试之后导致的了局是什么,这都是从原始数据造成训练样本重要的步骤之一。
这是智域基石提出的五层数据编译管线模型,我们思考到原始数据不是把数据采完了,把它存到硬盘里能够直接被输入到模型里训练,我们思考到的是中央有极度多路流程,每一路流程都是有关键指标的。只有把每一步做好,才不是单一的数据存档,而是真正可能成为数据资产的器材,这一套数据资产下面能够进入参与景、模型,能够和本体结合,被真正的用起来。
第一个流程数据质检,首先是数据采集,采集后能力把真实物理环境里的模型信号造成数字信号,以数字化的大局存下来,raw data,是杂乱的、没有规定的、非结构化的数据,我并不知路好不好,也不知路能不能进入后面的处置流程里,第一步做数据质检,先看一看数据是否满足根基的数据处置要求。
数据满足后,进入数据处置管线里,下一步是数据对齐,机械人或者具身智能数据不是单纯的画面或者是单一的视频,其实是多模态和时序缜密结合的数据,实现空间、功夫的对齐,实现功夫、空间的结构化,不是单纯杂乱的数据,至少是被数据处置的算法和机械可能理解的数据,每处置一帧数据都能够实现横向、纵向的索引。实现以来,到了数据造成模型可用数据档次,从结构化数据里再提取出真正的语义或者因果关系部门,我们要知路数据在整个空间里怎么和环境交互的,跟意图对齐是什么样的,因果,好比之前发生了什么,场景是什么,之后又是什么,这是第三个步骤,到这个处所为止,这个数据已经能被模型用起来了,距离真正的模型泛化还很远。这时辰我们要思考我们要做好大规模数据处置,大规模数据在以前好多行业都有,此刻所有行业都在讲大数据概想,但是在具身智能里不一样,由于是功夫、空间、整个工作意图都缜密相连的一类数据。我们要思考在上亿幼时甚至是上千亿幼时大规模数据下,我们怎么急剧检索出来被某类模型必要找到的数据,这也是极度难的工作。
在前面四个步骤从前后就变的相对单一了,把数据处置好、对齐好,提取的所有内容,再找初模型必要的数据,最后给客户使用,这是最后一个环节交付。
在技术层面上实现了数据到训练之前的关环,数据最终关环约有实现,必必要被模型公司用起来,并且模型公司后面的模型还要搭载在本体上,不仅实现幼样,还要在产业落地,必要让数据启程经过模型部署到本体再落实到产业,最终再从产业获得反馈,回到数据这一方,这时辰才是真正让数据流通起来,让智能不仅是单点而是让整个别下凤把它部署起来,作为数据方是极度主题的作用,它要对接本体、对接模型,也能够对接产业。
在此刻很无数据行衣凤,各人还是以项目造的大局做这个事件,模型没有收敛,本体百花齐放,产业也是在逐步进入到整个具身智能行业中来,智域基石做的数据,我们不仅是做一个数据项目,把系统都搭建起来,通过和本体、模型、产业对接,我们把一个项目造交付的能力造成能够被整个具身智能领域作用起来的一套数据基础措施,这时辰不仅是可能交付一套数据,而是我可能支持整个具身智能的发展,以来所有的产业、本体、模型都能够从数据方获得他想要获得的器材。
我们但愿可能划分新的数据分工,让本体公司做数据,让模型公司做数据,或者让产业方做数据,都不成能支持整个产业发展的,只有把这么一套生态构建起来,才可能让高质量物理世界的数据进入整个生态里,让具身智能行业发展起来。
我的分享就到这里,感激。
@陈文豪:tttzzz04su黑料,警惕远程节造软件藏窃密通路@黄琬学:近15元配送费骑手挣5元店家行侠仗义
@李士贤:王健林所持多家公司股权被冻结
热点排行
- 1 骇爪s网页版
- 2 欧美一日韩
- 3 网友自拍46p
- 4 亚洲图欧洲图自拍另类高清
- 5 黄色app导航
- 6 精品久久无码
- 7 天天亚洲
- 8 欧美www
- 9 806.tv