k8凯发天生赢家

新闻中心 新闻中心

“从前堆集的数据已经亏损完了” ,上海这家公司若何攻关AI时期新输赢手?

在西岸的一间办公室里 ,王长冕的桌

作者:孙朝盛
颁布功夫:2026-06-02 08:18:20
阅读量:7415

“从前堆集的数据已经亏损完了” ,上海这家公司若何攻关AI时期新输赢手?

在西岸的一间办公室里 ,王长冕的桌上放开着一份关于“具身智能数据合成”的汇报 ,这是他与团队近期攻关的关键领域之一。2025年5月 ,这位在AI领域深耕多年的技术专家选择参与一家成立仅一年的年轻公司——上?馀了伎萍加邢薰 ,担任首席技术官。他看到了AI时期的趋向:数据 ,正成为新的输赢手。

当下 ,大模型的竞争已从“拼算法”转向“拼数据”。模型能力的提升、行业利用的落地 ,越来越离不开高质量的语料。而王长冕团队面对的 ,正是这个主题而辣手的“数据瓶颈”。他们安身国度战术需要 ,致力构建覆盖语料全性命周期的综合性解决规划。

“人类互联网从前二三十年堆集的数据 ,根基上已被大模型‘亏损’得差不多了。”王长冕坦言。更关键的是 ,随着大模型、多模态模型、智能体的发展 ,AI对数据的需要在从从前“给人看的数据” ,转向“给AI用的数据” ,也就是更适合模型训练和推理的AI Ready语料。

库帕思的诞生 ,恰逢其时。2024年3月 ,这家人为智能语料数据平台型企业正式成立 ,成为中国首家专业AI语料公司。王长冕参与后 ,携带团队攻关“三个重构”:一是重构语料供数据步骤系统 ,依附语料魔方;二是重构语料基础设施 ,以AI Ready为导向;三是以供需关环 ,重构语料行业生态。

挑战巨大 ,但进展迅速。2025年11月 ,库帕思陆续申请了“具身智能数据合成与标注步骤”等多项专利。他们与智元机械人合作 ,实现了“数千万真机数据采集和数千万仿真数据合成”?馀了蓟怪斜炅肆俅惨搅屏煊虻娜宋悄苡锪霞钅 ,为医疗AI模型构建高质量语料基座。

“一些关键性的数据 ,好比医疗领域的数据 ,会交给我们去运营。”王长冕泄漏。这些天然稀缺的数据 ,经过库帕思的处置 ,能直接赋能前沿科研。他们与将加工后的高质量数据用于肠胃镜模型的训练 ,“让模型成效的阐发极度惊艳”。

在上海发展这项事业 ,王长冕感触“天然拥有优势”。上海不仅是AI企业和人才的荟萃地 ,更重要的是当局对人为智能十吩祺重 ,且高瞻远瞩地早早布局。作为国有控股企业 ,库帕思承担了部门公共数据运营的职能 ,这为其提供了贵重的数据资源和项目参加机遇。同时 ,上;钤镜拇葱麓匆瞪 ,尤其是大量涌现的OPC(一人公司) ,成为了库帕思服务的新对象。

2026年3月 ,库帕思牵头颁布了“模塑申城语料普惠打算2.0” ,颁发将免费向中幼企业、高校师生和创新创业者提供语料数据服务。打算到2027年底 ,链接500个创新主体 ,打造300个稀缺数据集 ,普惠提供价值不少于1.5亿元的语料。“这有助于带头整个上海AI产业的发展。”王长冕说。

眼下 ,AI模型的迭代速度以月甚至以周计 ,让从业者都感应“很吃力”。但王长冕坚信 ,无论模型若何演进 ,高质量的数据需要是永恒且日益增长的底层动力。他与团队正持续以“全流程覆盖、多模态处置、高度自动化与智能化”为主题战术 ,致力推动人为智能产业数据基础设施建设 ,为上海打造国度级人为智能创新发展高地提供主题技术支持 ,加强上海在人为智能数据身分领域的竞争力和话语权 ,助力构建拥有全球影响力的人为智能产业生态。

栏目主编:张骏 题图起源:上观题图

起源:作者:解放日报 胡幸阳

 

文章点评

未查问到任何数据!

颁发评论

◎迎接参加会商 ,请在这里颁发您的见解、互换您的概想。

最新文章

热点文章

随机推荐

【网站地图】