k8凯发天生赢家

起源:工人用水泥振捣器洗衣服作者: 黄慈

起源:工人用水泥振捣器洗衣服作者: 黄慈桂:

MiniMax颁布新一代模型M3:100万高低文、旗舰编程和原生多模态

6月1日 ,国产大模型公司MiniMax颁布新一代通用模型 MiniMax M3 。M3选取全新的自研稀少把稳力架构MiniMax Sparse Attention(MSA) ,在编程及智能体能力、超长高低文及原生多模态等多个关键方向 ,均实现代际突破 。据悉 ,M3是国内首个同时具备“前沿 Coding 能力、1M超长高低文、原生多模态”三项主题能力的大模型 ,也是目前全球唯一具备齐全能力组合的开源选项 。

据介绍 ,支持 M3三大能力合一的 ,是其自研的稀少把稳力架构 MSA(MiniMax Sparse Attention) 。相较传统全把稳力机造 ,MSA可能显著降低长高低文下的推算成本 ,并将高低文窗口提升至100万token 。这意味着模型在处置长文档、复杂代码仓库、多轮工作合作等场景时 ,可能在一次推理中保留更齐全的信息链路 。MiniMax披露 ,在100万高低文规模下 ,M3单token推算量仅为上一代模型的约1/20 ,推理效能显著提升 。

除模型架构升级表 ,MiniMax在底层推理算子层面也进行了进一步优化 。通过重新设计数据读取与推算蹊径 ,有关机能较主流开源规划提升4倍以上 。

据相识 ,M3在Coding&Agentic 能力显著提升 ,在涵盖软件工程、终端执杏注效能与和谈理解等多个维度的国际权威评测中 ,均达到国际当先水平:在衡量 Coding 能力的 SWE-Bench Pro 上 ,MiniMax M3超过 GPT-5.5和 Gemini 3.1 Pro ,靠近 Opus 4.7 。在综合评估 SVG 天活力能的基准 SVG-Bench 上 ,MiniMax M3超过 Opus 4.7 。

在多模态测试集 OmniDocBench 上 ,MiniMax M3得分超过 Gemini 3.1 Pro ,在面向自主 Agent 的端到端评测框架 Claw-Eval 上 ,MiniMax M3得到最高分 。

据介绍 ,M3在编程与 Agent 训练中创新引入交互式用户仿照器框架——通过仿照真实开发者在合作过程中的行为模式 ,让模型在训练和评测阶段就接触到更靠近出产环境的交互场景 。

与此同时 ,MiniMax暗示 ,M3从训练起点便选取文本、图片、视频等多模态混合训练 ,并在数据规模和训练管线上进一步扩大 。模型不仅支持图像与视坡讽解 ,也具备桌面操作能力 ,可在复杂跨利用环境中执行Computer Use工作 。

M3是一个从 Step 0起头进行多模态混合训练的模型 。MiniMax 在汇报中强调 ,Interleaved data(交错数据)——文本和图像等其他模态在序列中交替天然分列的数据——对模型机能带来的提升 ,比通常以为的越发关键 。在为这些数据重构整套数据管线后 ,MiniMax 已能够将训练数据 Token 规模提升至100万亿的量级 。

同日 ,MiniMax Code 也迎来更新:作为专为 M3设计、并与 M3一路训练的 Agent 产品 ,MiniMax Code 可能充分阐扬 M3在长高低文、Coding/Agentic、原生多模态方面的能力 ,是搭配 MiniMax-M3的首选 Agent 。在长程复杂工作上 ,MiniMax Code 的 Agent Team 能够将大型工作拆解为多阶段、可并发、可动态调整的 Workflow ,由 Agent 集群合作推动 。

贸易化方面 ,MiniMax同步推出Token Plan订阅规划 。Plus版每月49元 ,提供6亿token;Max版每月119元 ,提供18亿token;Ultra版每月469元 ,提供55亿token 。(定西)

@李宗霞:3d美女被草 ,俄乌持续强烈抢夺顿巴斯地域
@廖凯英:下周A股会怎么走
@陈秋萍:缅甸发生地震 仰光震感显著

热点排行

【网站地图】