阿里Qwen3.6登顶:Artificial Analysis认证国产第一

🏆 阿里 Qwen3.6-Max-Preview 登顶:Artificial Analysis 认证最佳国产模型
阿里发布Qwen3.6-Max-Preview,权威第三方评测榜单Artificial Analysis显示:
Qwen3.6-Max-Preview 性能表现超过 GLM-5.1、MiniMax-M2.7 等模型,登顶最佳国产模型!
📊 Artificial Analysis 榜单结果
Artificial Analysis 是权威的 AI 模型独立评测机构,其 Intelligence Index v4.0 包含10 个评测维度:
| 评测维度 | 说明 |
|---|---|
| GDPval-AA | 通用问题解决 |
| τ²-Bench Telecom | 电信领域任务 |
| Terminal-Bench Hard | 终端命令测试 |
| SciCode | 科学代码能力 |
| AA-LCR | 长上下文推理 |
| AA-Omniscience | 知识可靠性 |
| IFBench | 指令遵循 |
| Humanity’s Last Exam | 终极考试 |
| GPQA Diamond | 研究生问题 |
| CritPt | 批判性思维 |
🎯击败国产竞争对手
| 模型 | 提供商 | 排名 |
|---|---|---|
| Qwen3.6-Max-Preview | 阿里 | 🥇 第一 |
| GLM-5.1 | 智谱 AI | 🥈 第二 |
| MiniMax-M2.7 | MiniMax | 🥉 第三 |
| DeepSeek V3 | 深度求索 | 第四 |
Qwen3.6-Max-Preview 在综合评测中超越所有国产竞争对手,登顶最佳国产模型。
✨ Qwen3.6-Max-Preview 特性
1. 百万上下文
Qwen3.6-Max-Preview 支持100万 token 上下文:
- 长文档处理:处理超长文档、代码库
- 多轮对话:保持长时间对话上下文
- 代码理解:理解大型代码项目
2. 编程能力强
Qwen 系列一直以编程能力著称:
- 代码生成:高质量代码生成
- 代码解释:理解复杂代码逻辑
- Bug 修复:精准定位和修复问题
- 多语言支持:Python、Java、C++、Go 等
3. 性价比高
Qwen3.6 系列定价极具竞争力:
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| Qwen3.6-Plus | $2/1M tokens | $8/1M tokens |
| Claude Sonnet 4.6 | $3/1M tokens | $15/1M tokens |
| GPT-5.4 | $2.5/1M tokens | $10/1M tokens |
Qwen 价格更低,性能却不输国际顶尖模型。
📈 Intelligence vs. Price 对比
Artificial Analysis 的Intelligence vs. Price 图表展示了最佳性价比区域:
- Qwen3.6-Max-Preview 位于「最吸引人的象限」
- 高智能指数 + 低价格 = 最佳性价比
- 击败 MiniMax、智谱 GLM 等国产竞争对手
💡 AA-Omniscience 知识可靠性
AA-Omniscience Index 测量模型的知识可靠性和幻觉率:
- 奖励正确答案
- 惩罚幻觉
- 不惩罚拒绝回答
- 分数范围:-100 到 100
Qwen3.6-Max-Preview 在 Omniscience 测试中表现优异,幻觉率低、知识可靠。
🚀 使用方式
API 调用
# 通义千问 API
curl -X POST https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.6-max-preview",
"input": {"prompt": "Hello, Qwen!"},
"parameters": {}
}'
开源版本
Qwen3.6 系列有开源版本:
- Qwen3.6-7B:轻量级开源版本
- Qwen3.6-72B:高性能开源版本
- Apache 2.0 许可证:免费商用
OpenClaw 支持
Qwen 模型已集成到OpenClaw:
# OpenClaw 配置 openclaw config set model qwen-portal/qwen3.6-max-preview
📝 总结
阿里 Qwen3.6-Max-Preview 登顶Artificial Analysis 榜单最佳国产模型:
- 🥇 Intelligence Index 国产第一
- 🏆 超越 GLM-5.1、MiniMax-M2.7
- 📚 百万上下文,编程能力强
- 💰 性价比高,价格低性能好
- ✅ AA-Omniscience 知识可靠性高
- 🚀 API + 开源版本双选择
国产大模型之争,阿里 Qwen3.6 暂时领先。
Artificial Analysis:https://artificialanalysis.ai/models
通义千问官网:https://tongyi.aliyun.com
Qwen GitHub:https://github.com/QwenLM
延伸阅读:
一行命令干翻5个API!阿里云百炼CLI开源,Agent水电煤之战正式开打
5月29日,阿里云干了一件让 Agent 开发者集体高潮的事——百炼核心能力正式 CLI 化,一行命令就能让 AI Ag...
20亿用户握手!PayPal钱包正式接入微信支付,老外来华扫码时代到了
5月27日,支付圈传出来一个让人眼前一亮的消息:腾讯财付通全球与 PayPal World 正式达成合作,PayPal ...
支付宝杭州扔下王炸:3亿笔智能体支付已跑通,AI付Token Pay四件套定义新范式
5月26日下午,支付宝在杭州未来科技城国际会议中心办了一场叫"AI 支付生态大会"的活动。表面看是常规的产品发布会,实际...
渗透圈一夜变天!Xalgorix 22阶段全自动 AI 攻击平台开源,国产模型直接接
渗透测试这行最累的是什么?不是写报告,是重复劳动——侦察、目录爆破、注入点测试、SSRF 验证、CORS 检查……一个标...
Claude Mythos 企业版挖出超1万高危漏洞:Anthropic 联手13家巨头建AI安全联盟
Anthropic 最近搞了个大动作,但这次不是发新模型那么简单。4月7日,它联合了一串你可能做梦都想不到会站在一起的公...