2026 年春节前这周,中国 AI 领域迎来了一波密集发布。MiniMax 刚发布了 M2.5,激活参数和 M2.1 一样只有 10B,却实现了全面进化。
M2.1 本身就是 OpenClaw 作者 Peter 最推荐的开源模型。而 M2.5 在编程领域最具代表性的 SWE-Bench Verified 上,进步速度超越了 Claude、GPT 和 Gemini 系列,堪称当下最强开源 Agent 模型。

Opus 当主力,MiniMax 做备用?
OpenClaw 作者 Peter 把 Opus 作为主力模型,MiniMax 作为 fallback。当 Opus 的 token 用完了,自动切换到 MiniMax 继续跑,7×24 小时永不掉线。
而且他不只是云端调用。自己在 2 台 Mac Studio 上用 MiniMax 跑本地推理,不依赖任何模型厂商的套餐,真正实现了本地化部署。能让 10B 模型跑出这个效果,靠的是 M2.5 在旗舰模型中最小的激活参数。

参数小,速度快,成本低
M2.5 的激活参数只有 10B。作为对比,GLM-5 激活 40B,Kimi K2.5 大约 50B,DeepSeek V3.2 大约 30B。参数小带来的好处是连锁反应:
- 推理速度达到 100 TPS,几乎是主流旗舰模型的两倍
- 以这个速度连续工作一小时,成本只要 1 美金
- 如果降到 50 TPS,只要 0.3 美金
这意味着让一个复杂 Agent 无限运行下去,在经济上变得完全可行了。

Agent 和工具调用能力
M2.5 的工具调用能力非常强悍。搜索是 Agent 最常用的工具,MiniMax 为此自建了评测集 RISE(Realistic Interactive Search Evaluation),专门测真实专业任务上的搜索能力。
相比 M2.1 提升明显。在 BrowseComp、Wide Search、RISE 多项任务上,M2.5 用更少的搜索轮次拿到更好的结果,轮次消耗少了大约 20%。模型学会了用更短的路径逼近答案。
海外开发者 Tom Osman 用 Clawdbot × MiniMax 重构日常工作流。他在 Telegram、Slack、WhatsApp、iMessage 上都部署了龙虾,通过语音或文字随时下指令。一个典型的工作日里,他会让龙虾分析网站、调研信息、撰写博客、更新元数据、起草社交帖子、发送邮件,所有任务并行跑,他只需要在不同的 Agent 之间切换对话。
他对 MiniMax 的评价是:工具调用表现非常出色,而且相当准确。用的是每月 10 美金的 Coding Plan,用量远没到上限。

编程和泛用性
编程方面,M2.5 相比 M2.1 进步巨大。SWE-bench Verified 80.2%,Multi-SWE-Bench 51.3%,直接拿下全行业第一。
更难得的是,在提升能力的同时,还同时提升了推理速度。端到端完成 SWE-bench 任务从 M2.1 的 31.3 分钟降到 22.8 分钟,快了 37%,和 Opus 4.6 的 22.9 分钟几乎一样。每个任务的 token 消耗从 3.72M 降到 3.52M。变快了,还变省了。

还有个有趣的点是 M2.5 在不同编程客户端里的泛用性很强。在 Droid 上跑 SWE-Bench,M2.5 是 79.7(Opus 4.6 是 78.9);在 OpenCode 上是 76.1(Opus 4.6 是 75.9),这样也就不太依赖 Claude Code 这种闭源脚手架了。
OpenCode 是 Claude Code 的开源平替,安装简单,上手容易。而且里面的 MiniMax M2.5 是限时免费的,都不需要配置。

从工具到同事
MiniMax 给 M2.5 的定位是真实世界的好同事。这是因为 Agent 是未来软件的使用者,是每个团队里都会有的新同事。
这个转变一旦发生,对模型的要求就彻底变了。自主 Agent 时代,Agent 要 7×24 小时不停地跑,一天几百次推理调用,你在乎的是:能力够不够用、速度快不快、成本扛不扛得住。
那雇佣 Agent 一年大概需要多少钱呢?
- 快速版本(100 TPS):连续工作一小时只需要 1 美金
- 慢速版本(50 TPS):连续工作一小时只需要 0.3 美金
算下来,雇佣 Agent 让它们 7×24 地工作,每个 Agent 的月薪才 200 美金。你只需要花一万美金,就能获得四个永不休息的同事。
未来几年算力供给是线性增长,需求是指数增长,Token 只会越来越稀缺。在这个大背景下,自主 Agent 时代能 7×24 持续运转极为重要。因为只有这样,Agent 才能走向真实世界,成为你真正的同事。
*文章原稿来源:X@oran_ge(https://x.com/oran_ge/status/2022586872061661343)
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...