起源:媒体评吴宜泽夺冠:不平不挠作者:
首发丨给AI“降本”,墨芯C轮融资近十亿元
AI算力的抢夺战在进入一个新阶段。大模型参数量从千亿迈向万亿,单次推理所需的token数量呈指数级增长,推理成本正成为造约整个行业规;骋茁涞氐闹魈馄烤。谁能把token的天生成本打下来,谁就可能拿到下一轮竞争的入场券。
“基于稀少推算的优势,墨芯产品的单token成本,可做到远低于主流竞品。”墨芯人为智能董秘兼企业发展及本钱市场部总经理王率宇给出了这个答案。
什么是稀少推算?
简而言之,传统AI芯片选取“浓密推算”模式,对矩阵中的所有参数因人而异地做运算,其中大量推算是在处置无效或冗余的数据。稀少推算则通过算法预先鉴别并跳过这些“无用功”,只对真正有效的参数进行推算,从而在同蹬撞件前提下大幅提升有效算力、降低能耗和成本。
近日,投中网获悉,专一于为云端和终端设备提供AI算力平台的墨芯实现了C轮近十亿元人民币融资,深创投、大湾区共同家园、力鼎本钱、蕴盛本钱等机构入局,老股东凯旋创投、盛景嘉成、岩山科技等投资人持续加注。
“当前行业仍处于急剧扩张、加码本钱投入的阶段,整体市场机缘巨大。”王率宇形容当下的AI算力市场,“但推理成本,是决定企业能否穿越行业周期、活到下一轮竞争的主题生死牌。”
在国产AI芯片赛路,墨芯走出了一条差距化的创新蹊径:依附自研稀少算法为芯片推算“做减法”,以算法+软件+硬件协同设计,实现真正创新的算力解决规划,把每个Token的天生成本优化做到更高的量级。
“做减法”的人
2018年,两位卡内基梅隆大学堂友在硅谷相遇,携手开启AI芯片创业之路,缔造墨芯人为智能。
首创人兼CEO王维是卡内基梅隆大学ECE硕士,占有超过15年经验的硅谷芯片专家。他曾担任英特尔五代到十代CPU处置器的主题架构师,先后在高通和英特尔任职,主导及参加的芯片累计量产超50亿片。
结合首创人兼首席科学家严恩勖博士同样毕业于卡内基梅隆大学,在机械进建领域深耕十余年,是神经网络动态稀少算法的发现人,独创双稀少算法。这是一种通过神经网络的“权重稀少化+激活稀少化”进一步提高AI推算效能的革命性思路,严恩勖博士已萦绕有关领域在国际顶级AI期刊颁发论文40余篇。
另一位结合首创人芦勇毕业于浙江大学电子工程专业,曾在SK Hynix和Marvell等驰名半导体公司任职,主导开发多款全球量产的SSD节造器芯片。
三人形成了美满的能力互补。一个善于产品架构,一个精于算法创新与系统优化,一个精通硬件工程和产品落地。三位一致认定,稀少化是AI推算的将来,将前沿学术层面的稀少化理论,逐步落地、迭代为可贸易化的算力推算规划。
墨芯独创的双稀少算法,通过软件前置优化,剔除模型中无效、非主题的推算元素,将推算工作,转化为高效、精准的稀少推算工作。
“AI模型的大量参数处于归零、不参加推算的状态,稀少化技术的主题,就是让AI模型实现真正的按需推算。”王率宇诠释路。
这一思路,在业界并非新鲜概想,但真正将“权重稀少化+激活稀少化”双稀少路线做成量产产品和软硬协同规划并率先贸易化的,墨芯是第一家。目前墨芯已累计申请全球有关专利100余项。
更具说服力的验证来自国际权威AI基准测试MLPerfTM。墨芯S30推算卡陆续三次登顶MLPerfTM推理榜首,硬核技术实力也得到了国际权威机构的验证。
而本钱入局的节拍,是最恳切的投票。
早在墨芯第一代芯片流片前后,丽江天使母基金、凯旋创投、将门投资、真格基金、基石本钱等驰名财政机构相继加注。
但真正的转折发生在2024年。随着大模型从技术较量转向贸易落地,本钱起头密集押注具备落地能力的算力企业。
加快融资的背后还是在于产品的突破性进展;谙∩倩呕腁I推理规划,墨芯已在多个真实场景中验证了其贸易价值。经实测,搭载墨芯推算卡的AI推理业务,不仅整体推理成本大幅降落,推理速度也实现数倍提升。
据IDC预测,2028年推理工作负载占比将达到73%。在中国AI算力市场正从“训练为王”转向“推理为王”的产业拐点上。在此布景下,极致降本增效的主题能力,成为墨芯在贸易化落地阶段最坚实的主题竞争壁垒。
“护城河”与“加快度”
对于稀少推算技术路线,其他竞争敌手是否可能急剧复造或绕过?
王率宇以为,墨芯的主题壁垒有三层:
第一层是专利壁垒。墨芯从硅谷创业之初就进行了全球PCT专利布局,覆盖硬件、算法、软件各个维度。
第二层是工程堆集。稀少化理论虽公开,但真正将算法落地到软硬协同的量产芯片,必要多年的系统化投入。墨芯从2021年第一代芯片流片至今,已与互联网、行业垂类、智算中心三类标杆客户实现了长达三四年的场景适配。
第三层是生态先发。稀少推算并非单一芯片技术,而是涵盖芯片、编译器、工具链、客户模型的整套协同系统。墨芯深耕行业多年,已与多多大客户形成深刻合作,这种功夫成本和信赖壁垒,非一日可破。
正是这路壁垒,让墨芯的贸易化落子有了怪异的底气。
截至目前,墨芯已在西北、西南、华东、华北四大片区实现智算中心集群的战术性铺开。西北片区部署的千卡级推理集群,已在电子造作、消费品出产等场景落地多个工厂安防项目,于边缘侧实现实时AI分析;西南片区结合本地绿电资源,构建低功耗绿色算力池;华东片区则面向生信分析、医疗健全等高端服务业,与行业头部企业合作加快基因测序数据分析流程;华北片区赋能城市治理与社区智能化升级。
要穿越周期,光靠单一市场不够。被问到想成为什么样公司时,王率宇转述了首创人王维的愿景:让墨芯成为稀少推算引领者,依附技术创新降低AI推理成本,用稀少推算赋能AI全民普惠。
据悉,融资资金将重点投向全新一代推算卡SparsePrime?的量产与贸易化,以及全国算力网络疆域的进一步扩张。
“推理成本是AI遍及的关键瓶颈,稀少推算在给出底子性的解答。从投资视角看,评价一家AI芯片公司的价值,不应只看单卡理论算力,更要看其在真实集群环境中实现一致AI工作的有效算力和能效比。墨芯的多地部署与客户持续扩容,正是产品力和贸易价值的硬核验证。”王率宇暗示。
@柳淑玲:马老二和田敏捷最新更新,60岁男子寻亲成功 与兄弟宛如双胞胎@吴孝洁:两部殡葬领域治理法子公开征求定见
@王丰彦:卡特·布莱恩特3分钟领到4犯被换下