米兰 MiniMax M2.5发布:性能并列Claude Opus 4.6,输入价钱约0.3好意思元/百万Token

 183     |      2026-02-19 15:48:23

米兰 MiniMax M2.5发布:性能并列Claude Opus 4.6,输入价钱约0.3好意思元/百万Token

  新浪科技讯 2月13日上昼音讯,MiniMax上线新一代文本模子MiniMax M2.5。在编程才调方面,M2.5在泰斗榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显耀普及;在Multi-SWE-Bench等多说念话复杂环境中卓越Opus 4.6,达到了行业最佳的水平。更伏击的是,模子展现出“原生Spec才调”——在编码前主动拆解架构与功能野心,更接近信得过架构师的责任花样。

  在器具调用和搜索才调方面,模子概况自动解决复杂任务,幸运飞艇在BrowseComp、Wide Search等多项 Agent 任务中以更低的轮次消费赢得了更优的后果,相较于上一代模子久了普及20% ,达到了行业顶尖水平。

  办公场景中,在 Word、PPT、Excel 金融建模等 Workspace 高阶场景中赢得了显耀的才调普及,米兰体彩app在测评框架GDPval-MM与主流模子的对比赢得了 59.0%的平均胜率。

{jz:field.toptypename/}

  性能除外,M2.5的另一中枢亮点在于极致的推理速率与资本收场。M2.5-lightning版块复旧100 TPS以上输出速率,是主流模子的2倍把握;输入价钱约0.3好意思元/百万Token,输出约2.4好意思元/百万Token。按每秒输出100 Token谈论,贯穿开动一小时资本约1好意思元;若按50 Token谈论,资本约0.3好意思元。

  这意味着1万好意思元表面上可复旧4个Agent贯穿责任一年。MiniMax方面觉得,当性能与资本不再组成料理,Agent领域化部署的经济模子将发生根柢变化。

  现在,M2.5已在 MiniMax Agent上线,并于13日群众开源复旧土产货化部署。不到一天,来自全天下的用户依然在MiniMax Agent上构建了1万多个大师,且仍在快速增长。(文猛)

{jz:field.toptypename/} 海量资讯、精确解读,尽在新浪财经APP

包袱剪辑:杨赐