世界杯官方网页版阿里Qwen3.7-Max发布，国产大模子排行第一

Qwen3.7-Max于2026年5月20日在阿里云峰会持重发布，在Arena群众大模子盲测总榜排行第13，超越Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，成为国产模子第一。[[5]][[6]]

旗舰智力亮点：全自主完成35小时超长程任务，超1000次用具调用，在国产芯片平台杀青推理速率10倍提高。[[8]][[11]]

Arena盲测与官方评测数据

Arena总榜

群众第13

国产模子第一，介于GPT-5.5与Grok-4.2之间

长程任务

35小时

超1000次用具调用，推理速率提高10倍

编程智力

群众第10

TerminalBench2.0得分69.7，超DeepSeek-v4-pro-Max

数学智力

群众第7

澳门大阳城官网(SuncityGroup)

Arena数学细分榜单

官方数据 vs 第三方盲测

Arena盲测（第三方）：文本总榜第13，数学第7，大众任务第9，编程第10，软件IT第9。[[4]][[29]]

官方演示数据：SWE-Pro 60.6、SWE-Multilingual 78.3、SciCode 53.5、MCP-Mark 60.8、SpreadsheetBench 87.0、IFBench提醒投诚79.1。[[9]][[8]]

两类开端侧重不同：Arena为用户盲测投票，官方基准为静态测试集，不成获胜对比。[[4]]

国产第一与群众第13之间的差距

Arena总榜第13，排在Qwen3.7-Max前边的包括Claude Opus4.6/4.7系列、Gemini-3.1/3 Pro系列、GPT-5.4/5.4-high等外洋头部模子。[[27]]

与最强外洋模子的差距是结构性的：GPT、Claude、Gemini在通用相识、长文本和多模态上积存深厚，不是单次迭代能抹平的。但在编程智能体、用具调用等Agent子赛谈，Qwen3.7-Max已超越Claude-Opus4.6。[[11]][[12]]

国产竞争花式：超越Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，差距在Agent智力上更显耀，GLM-5.1内核优化加快比仅7.3x，Kimi-K2.6为5.0x，Qwen3.7-Max达10.0x。[[8]]

35小时任务：数字若何来的

任务配景：在平头哥真武M890惩处器上，无芯片架构文档、无性能分析数据，全自主完成Triton算子内核优化。[[8]]

经由拆解：历时35小时，累计调用用具1158次，资格五个中枢演进阶段，最终完成架构级特化重构。[[8]]

考据效果：几何平均加快比10.0x，世界杯(中国)官网超越GLM-5.1（7.3x）和Kimi-K2.6（5.0x）。[[8]]

提戒备畴：该实践为单一场景（芯片内核优化），条目高度特定，不代表通盘长程任务进展。其他模子是否在接头平台、接头无文档条目下测试，官方未泄露对比基准的一致性细节。[[8]][[11]]

对建立者和企业用户意味着什么

API用户强壮性风险：28天一迭代节拍下，郑再版与预览版并行（3.6-Max预览版还未强壮，3.7-Max预览版已上线）。API调用方需关怀版块切换节点，幸免业务逻辑被模子更新打断。[[27]][[35]]

MCP集成与办公自动化落地范畴：MCP-Atlas、MCP-Mark等基准进展最先，表面上符合多用具勾通的职责流自动化。但刻下API尚在"行将上线"情景，本色集成需等阿里云百真金不怕火持重怒放。[[9]][[31]]

编程团队价值点：TerminalBench2.0得分69.7，SWE-Pro 60.6，可接入ClaudeCode、OpenClaw、QwenCode等主流框架，跨框架泛化强壮。[[9]][[11]]

千问三个月三次迭代技艺线

2026年5月20日

Qwen3.7-Max持重发布

阿里云峰会发布，Arena总榜第13，国产第一，API行将上线百真金不怕火。

本次发布

2026年5月19日

3.7预览版空降Arena

Qwen3.7-Max-Preview与Plus-Preview同日上线，先于峰会抢跑评测。

预热造势

2026年4月底

Qwen3.6-Max预览版发布

距3.7发布仅28天，两代超大杯并行激动。

距3.7仅28天

2026年2月前后

Qwen3.5发布

三个月三次旗舰迭代的早先，开启高频小步快跑节拍。

迭代早先

2025年全年

仅发布Qwen3和Qwen-Next两版

与2026年高频节拍造成显明对比，研发模式从"憋大招"转向怒放迭代。

对比基准

国产模子Arena位次历史演进

技艺

模子

Arena总榜位次

国产排行

2025年全年

Qwen3/Qwen-Next

未进前15

国产竞争中

2026年4月底

Qwen3.6-Max-Preview

未公布总榜

视觉榜国产第一

2026年5月19日

Qwen3.7-Max-Preview

第13（文本）

国产第一

2026年5月20日

Qwen3.7-Max（郑再版）

第13

国产独一前15

从"未进前15"到"群众第13、国产独一前15"，历经约半年高频迭代完成逾越。[[4]][[7]][[27]]

这一冲破更多体面前Agent子赛谈（编程、用具调用、长程任务），而非通用相识全面超越外洋顶级——属于阶段性冲破，而非全面超越的趋势性拐点。[[8]][[35]]

庞杂用户若何用Qwen3.7-Max

接入花式与怒放情景

面前能用：Qwen Chat（qwenchat）已上线，营救念念考模式体验，暂不营救图片上传。[[4]][[29]]

API行将上线：阿里云百真金不怕火平台，符合建立者和企业集成，刻下处于"行将上线"情景。[[9]][[31]]

符合哪类任务：

- 复杂编程（多文献工程、前端原型到后端逻辑）[[11]]

- 多递次推理题（数学、逻辑、专科问答）[[7]]

- 长周期自动化任务（配合MCP和Agent框架）[[9]]

暂不符合：图片上传、视觉理罢黜务（该功能在Plus版世界杯官方网页版，持重API未怒放）。[[4]][[29]]

世界杯官方网页版 阿里Qwen3.7-Max发布，国产大模子排行第一

世界杯官方网页版阿里Qwen3.7-Max发布，国产大模子排行第一