k8凯发天生赢家

新闻中心 新闻中心

梁文锋想送DeepSeek一个成人礼

文 | 硅基钻研室 kiki

作者:李丰真
颁布功夫:2026-06-01 01:19:11
阅读量:3

梁文锋想送DeepSeek一个成人礼

文 | 硅基钻研室 kiki

DeepSeek在握别从前那个低调的自己  。

MiniMax首创人闫好汉曾讲过一个关于DeepSeek首创人梁文锋的故事  。他说有一次约梁文锋吃饭,其时双方并未见过面  。闫好汉到早了看到一位穿T恤的幼哥,对方和他聊了半幼时的技术,直到闫好汉开口问:"梁总什么时辰来 ?"

这个二心目中是助理的T恤幼哥,回了一句:"我就是梁文锋"  。

这个故事里,闫好汉以为梁文锋是一个低调专一的人,这和从前DeepSeek对表展示的形象一致:不融资、不pr,维持自身的独立性  。在大厂、MiniMax等模型创业公司的两股力量表,DeepSeek走出一条挺拔独行的路  。

极客公园首创人张鹏形容此类公司的特点:"较高的利润率、可观的利润规模、有砸几十亿美元的投入刻意,以及首创人自己对大模型领域足够深的投入,在技术刻意和业务决定上的极端笃定  。"

但此刻,DeepSeek似乎变了  。

从被曝出推动700亿人民币的融资,到公开组建Code Harness团队,再到一贯神秘的DeepSeek钻研员们也起头在幼红书活跃......最新的作为是,DeepSeek官宣其原定于5月底实现的DeepSeek-V4-Pro模型API价值的折扣永远化  。

从模型降价的老招式,到一改昔日低调的高调融资、招兵买马,梁文锋真正想做的,是送给DeepSeek一个真正的成人礼  。

1、一改低调的DeepSeek

DeepSeek在变得越来越高调  。

自4月DeepSeek-V4 颁布、传出融资需要后,「硅基钻研室」观察到,DeepSeek在产品利用、模型能力以及人才组建上多箭齐发  。

首先是,产品利用侧全力对准Agent  。

DeepSeek在北京组建Code Harness团队,据DeepSeek钻研员陈德里的描述,DeepSeek的Agent业务目前重要聚焦AI Coding方向,旨在打造DeepSeek桌面端Agent产品  。"或许你能够把它叫做 DeepSeek Code 或者其他什么名字"  。

短期将Agent的主战场定位Coding领域,而非通用型Agent,这并非是DeepSeek的挺拔独行,而是当下大模型公司的共识  。

一方面,Coding是模型心智和模型能力的加快器  。

OpenAI借Codex的密集更新,迎来口碑翻转  。另一壁的Anthropic则是由于较早押注Coding 方向, 凭借Claude Opus系列编程模型和编程利用Claude Code反超OpenAI  。

Coding场景也能给模型的能力带来先发优势  。内生的思想链让模型可自觉实现推理与思虑过程,Coding自身可验证性强,用户数据能够反哺模型训练,实现能力提升  。

据东方证券数据,Anthropic在今年2月至3月底,一个多月内迭代了30多项Harness层职能,因而更早拿到正向反馈,同时借其他AI Coding产品作为分发渠路,自身Claude Opus系列模型深度集成进IDE,作为分发渠路,使Anthropic堆集到大量数据,来用于模型能力提升  。

另一方面,Coding能更好地卖Token  。

国内阿里、腾讯、字节等大厂,也聚焦基模的Coding能力和独立的Coding工具成立自身的Token经济关环  。

阿里云公共云事业部总裁刘伟光此前就谈到:"Coding产生Agent,Agent产生AI利用,Agent又回到云上亏损算力  。"这组成了做大Token经济从「token-云-利用」的循环  。

海表的大模型公司已经看到了Coding带来的收入曲线  。据Anthropic今年2月的融资布告,Claude Code年化收入已超25亿美元,较2026年1月翻了一倍多  。

其次,在模型能力上,用成本优势换模型能力升级的功夫窗口  。

SemiAnalysis的钻研曾指出,DeepSeek的技术迭代不仅关注智能水平,而是致力于极大提升「每单元Token的成本效能」,这也是其为什么被称为「价值屠夫」的原因地点  。

DeepSeek最新的作为是官宣其原定于5月底实现的DeepSeek-V4-Pro模型API价值的折扣永远化  。

按百万 tokens算,Pro 的缓存射中输入是 0.025 元,缓存未射中输入是 3 元,输出是 6 元,原来的价值别离为 0.1 元、12 元、24 元,在国内模型普遍涨价的布景下,梁文锋再度给了友商重击  。

X上的一位用户这样评价:"当你成天使用DeepSeek ,破费仅相当于一包薯片的价值时,你才会心识到它有多便宜  。"

一位大模型行业人士通知「硅基钻研室」,DeepSeek此举是在用成本为自身Coding Agent建生态  。"这个作为重要会对国内模型厂商产生影响,由于各人模型机能的代际差距并不大,GLM、kimi的编程能力不错,MiniMax强在多模态,一旦DeepSeek用‘最佳价值’,再加快模型迭代,各家间的差距会迅速缩短  。"

最后,则是招兵买马  。

蕴含郭达雅等多位钻研员去职后,DeepSeek起头急剧招兵买马  。以Harness团队为例,DeepSeek引入了「量化买卖老兵」、TSY Capital结合首创人崔添翼  。DeepSeek钻研员陈德里近期也在幼红书上高频活跃,在社交媒体上提议「英雄帖」  。

有大模型猎头通知「硅基钻研室」:"今年DeepSeek的hc确切实变多,但要求和门槛并不低  。"

「硅基钻研室」还观察到,除Agent岗位表,DeepSeek在招聘中开释出测试开发工程师、预/后训练钻研员、模型战术产品经理等多个岗位,甚至还招起了HR、企业文化主管等非技术岗位,这都意味着,DeepSeek正朝着一个更大的组织扩张  。

2、梁文锋给DeepSeek的价值建模

梁文锋曾给DeepSeek立下端正:不接受表部融资、不稀释股权、不被任何人的贸易化功夫表绑架  。

「三不」源自DeepSeek的挺拔独杏转—

背靠幻方量化输血,极致的成本节造,所以不缺钱;没有二把手,相对幼且扁平独立的钻研性团队,所以不会愿意稀释股权;梁文锋自己以AGI为钻营,专一极致的战术,所以不会被任何人的贸易化功夫表绑架  。

但为什么在当下,梁文锋会一改昔日低调态度 ?原因是,大模型竞争已走过了青春期  。

智谱和MiniMax已经上市,kimi和阶跃星辰也从未终场IPO打算,今天的大模型竞争也已不再是单一的模型能力竞争,而是人才、产品、生态等系统化能力的比拼  。

强模型依然是主题兵器,前者DeepSeek固然能够通过幼而美的组织状态和极致来实现,梁文锋能够力出一孔不畏表界的噪音,但后者,却是他最难以节造的处所,人才、产品、生态以及贸易化,它难以只通过模型这一张牌去获得  。

当其他独角兽都走过了成人礼,梁文锋也意识到,是时辰给DeepSeek一个成人礼了  。

首先,要重新给DeepSeek找一个心智定位  。「最强模型」「价值屠夫」都是从前时,DeepSeek通过盛开融资,吸引表部本钱,是在强化自己的一个新战术定位:

国产AI基础设施中的主题节点  。

DeepSeek被传的潜在投资方里,同时多方身影:蕴含国度大基金、巴中时期、京东、腾讯、Monolith等,一位AI投资人通知「硅基钻研室」:"投资DeepSeek战术价值高于现实财政回报"  。

他口中的战术价值源自两个方面:一是DeepSeek的开源路线带头了早期国产AI生态链的形成:蕴含AI Infra公司硅基流动、无问芯穹、清程极智等,利用层的端侧手机厂商以及一批B、C端AI利用  。

二是DeepSeek是适配国产算力最坚定、最积极的  。误点曾提到,除了钻营大模型的智能上限表,梁文锋以为很重要的一项工作就是基于国产生态来做大模型  。

DeepSeek 在V3.1 的技术汇报里曾提到选取的 UE8M0 FP8「是针对下一代国产芯片设计」,在V4技术汇报里,DeepSeek 在华为昇腾芯片上验证了细粒度并行 EP 规划的技术可行性  。

V4颁布当天,8家国产AI芯片都颁发与V4实现适配,这注明,DeepSeek在原生支持国产芯片如重写算子等方面花了较大的精力和功夫  。

同时DeepSeek对国产算力的工程化适配自身也符合国产芯片异构协同的技术方向  。

不难发现,DeepSeek的角色已发生变动,从纯模型公司转化为国产AI基础设施中的主题节点  。

其次,要重新给DeepSeek找个「超等入口」  。

在《DeepSeek"伴侣圈"的B面:抢入口、争流量,开筹算力战》一文中,资深芯片专家、中存算董事长陈巍曾通知「硅基钻研室」,DeepSeek所带来的扭转是,让更多人知路了:"大模型也能够成为一个超过互联网、甚至超过原先这些操作系统的超等流量入口  。"

但一年从前,超等流量入口的竞争已上升为超等入口的竞争  。

阿里的千问、字节的豆包都在尝试进化为新的超等入口,这些AI利用的类似野心是,试图用一个入口包揽用户所有的使用场景  。

今年618前夕,阿里颁发千问和淘宝实现深度整合,豆包也起头尝试付费分级,它们在超等入口的索求中都不成预防线遇到挑战  。

DeepSeek和它们都不一样,它既没有字节的APP工厂,也没有阿里的多板块协同,它的C端入口当前只有一个,并且为chatbot  。

因而梁文锋必须重造一个超等入口,它对准的也是Agent  。从目前披露的信息看,DeepSeek应该会左右开弓:

第一,C端原有的入口会正视多模态能力和感情陪同能力的升级  。

此前DeepSeek灰测识图职能,预报了多模态能力的进展  。

「硅基钻研室」还相识到DeepSeek-V4 强化了角色表演能力,官方还上线了角色表演的特殊节造指令注明,用于在思虑模式下切换思想链风格  。

5月,DeepSeek钻研员陈德里在社交媒体上公开对角色表演能力和感情陪同能力进行了用户调研  。

第二,聚焦Coding Agent,也就是DeepSeek组建的Agent Harness团队,可能会推出一款桌面级Coding Agent产品  。

在招聘中,他们要求候选人深度使用Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes等产品  。

最后,则是给DeepSeek的人才组织找一个新的市场定价  。

不成否定的是,今天DeepSeek钻研员已成为巨头争抢的对象,梁文锋不成预防线也必要回覆,今天的大模型世界里,DeepSeek到底值几多钱 ?员工手中的期权价值几何 ?

除此以表,在token成为新的薪酬标配下,和大厂相比,DeepSeek的算力却是相对有限,梁文锋也必必要有更多的算力和将来的设想力,来留住人心  。

心智定位、超等入口和人才定价,这些都在倒逼梁文锋扭转了设法  。

梁文锋曾说:"每当在工作中遇到难题的时辰,我会想起量化之王的话:‘肯定有法子对价值建模  。’"他口中的西蒙是"量化之王"  。

此刻,到了市场对DeepSeek定价的时刻,梁文锋仍旧是那个主导价值建模的人,这一点,依然未变  。

*封面图由AI天生

 

文章点评

未查问到任何数据!

颁发评论

◎迎接参加会商,请在这里颁发您的见解、互换您的概想  。

最新文章

热点文章

随机推荐

【网站地图】