WWW.AWTEY.CN
标签聚合 35B

/tag/35B

www.ithome.com · 2026-04-28 08:38:51+08:00 · tech

IT之家 4 月 28 日消息,中国移动自主研发的九天 35B 通用大模型将在第九届数字中国建设峰会上正式发布。摩尔线程官方昨晚宣布,其基于旗舰级 AI 训推一体全功能 GPU MTT S5000,依托成熟的 MUSA 软件栈与高性能算子优化, 已率先完成九天 35B 模型的全流程适配与推理验证 。 据介绍,本次适配中,摩尔线程基于自研 MUSA 软件栈与 SGLang-MUSA 高性能推理引擎,深度打通九天 35B 模型推理全链路。 MTT S5000 基于第四代 MUSA“平湖”架构打造, 单卡 AI 稠密算力可达 1000 TFLOPS ,支持从 FP8 到 FP64 全精度计算,匹配九天 35B 大模型在长文本处理与高并发响应方面的核心需求。 摩尔线程通过 MUSA C 开发框架、muDNN 计算库与 MATE 开源算子库的全栈优化,针对九天 35B 模型特有的注意力机制与长序列推理进行深度适配,确保模型在 MTT S5000 上高效执行。 在标准推理场景下,MTT S5000 可稳定支撑九天 35B 模型的高并发请求 。 IT之家注:MTT S5000 是专为大模型训练、推理及高性能计算而设计的全功能 GPU 智算卡,基于第四代 MUSA 架构“平湖”打造。其单卡 AI 算力最高可达 1000 TFLOPS,配备 80GB 显存,显存带宽达到 1.6TB/s,卡间互联带宽为 784GB/s,完整支持从 FP8 到 FP64 的全精度计算。

www.ithome.com · 2026-04-20 14:46:49+08:00 · tech

IT之家 4 月 20 日消息,4 月 19 日(昨天)晚间,千问 3.6 系列中等尺寸模型 Qwen3.6-35B-A3B 模型正式开源,仅激活 3B。 根据介绍,该模型不但轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型 Qwen3.5-35B-A3B,并可与 Qwen3.5-27B 和 Gemma4-31B 等稠密模型一较高下。 其采用混合专家(MoE)架构, 总参数量 350 亿、激活仅 30 亿 ,在推理过程中,可实现 以更低的算力消耗完成更高性能的智能输出 。 阿里方面称,在考察终端编程的 Terminal-Bench2.0、长程编程任务 NL2Repo、真实世界 Agent 能力评测的 QwenClawBench 等权威基准测试中,Qwen3.6-35B-A3B 的表现均明显优于前一代 Qwen3.5-35B-A3B,以及 Gemma4-26B-A4B、Gemma4-31B 等同类开源模型。 新模型还支持多模态思考与非思考模式。多模态推理方面,在 MMBench、RealWorldQA、SimpleVQA 等多项视觉语言基准测试中,新模型表现媲美 Claude-Sonnet-4.5。在空间智能方面,Qwen3.6-35B-A3B 在例如 RefCOCO、ODInW13 等考核模型对复杂图像识别能力的基准测试中, 分别取得 92 和 50.8 的成绩 。 Qwen3.6-35B-A3B 还实现了 OpenClaw、Qwen Code、Claude Code 等主流 Agent 框架的深度兼容,能够将模型的编程能力、原生多模态能力,更好地赋予各类智能体,完成更长程、更复杂的任务,有望成为本地部署的“智能大脑”。 IT之家附模型调用 / 体验地址如下: 魔搭社区: https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B Hugging Face: https://huggingface.co/Qwen/Qwen3.6-35B-A3B Qwen Studio: https://chat.qwen.ai/

www.ithome.com · 2026-04-16 21:51:40+08:00 · tech

IT之家 4 月 16 日消息,继 Qwen3.6-Plus 发布之后,阿里千问大模型今日宣布开源 Qwen3.6-35B-A3B —— 一个稀疏但能力出色的混合专家(MoE)模型,总参数量为 350 亿,激活参数仅 30 亿。 官方称,Qwen3.6-35B-A3B 不但轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型 Qwen3.5-35B-A3B,并可与 Qwen3.5-27B 和 Gemma4-31B 等稠密模型一较高下。该模型依然支持多模态思考与非思考模式,是当前最具通用性的开源模型之一。现在,Qwen3.6-35B-A3B 已在 Qwen Studio 上线,并以开源权重的形式向社区发布。 IT之家附官方详细介绍如下: Qwen3.6-35B-A3B 是一个完全开源的 MoE 模型(总参数 35B / 激活参数 3B),主要特性包括: 卓越的智能体编程能力,可与大得多的模型相媲美 强大的多模态感知与推理能力 您可以在 Qwen Studio 进行交互对话,也将可通过阿里云百炼以 qwen3.6-flash 的名称调用 API,或从 Hugging Face 和 ModelScope 下载模型权重。 欢迎体验 Qwen Studio: https://chat.qwen.ai/ ModelScope: https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B Hugging Face: https://huggingface.co/Qwen/Qwen3.6-35B-A3B 模型表现 下文将全面展示 Qwen3.6-35B-A3B 与同规模模型在各类任务和模态上的评测对比结果。 自然语言 仅凭 30 亿激活参数,Qwen3.6-35B-A3B 在多项关键编程基准上超越了 270 亿参数的稠密模型 Qwen3.5-27B,并在智能体编程和推理任务上大幅超越其直接前代 Qwen3.5-35B-A3B。 视觉语言 Qwen3.6 原生支持多模态,Qwen3.6-35B-A3B 以仅约 30 亿激活参数,展现出远超其体量的感知与多模态推理能力。在大多数视觉语言基准上,它的表现已与 Claude Sonnet 4.5 持平,甚至在部分任务上实现超越。其在空间智能上的优势尤为突出:RefCOCO 92.0、ODInW13 50.8。 开始使用 Qwen3.6-35B-A3B Qwen3.6-35B-A3B 的开源权重已在 Hugging Face 和 ModelScope 上提供,支持本地部署;也即将可通过阿里云百炼 API 以 qwen3.6-flash 的名称调用。此外,您还可以在 Qwen Studio 上即时体验。 该模型可以无缝集成到流行的第三方编程助手中,包括 OpenClaw、Claude Code 和 Qwen Code,从而简化开发流程,实现高效且具备上下文感知能力的编码体验。 API 使用方式 本次发布支持 preserve_thinking 功能:在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。 阿里云百炼 阿里云百炼支持行业标准协议,包括兼容 OpenAI 规范的聊天补全(chat completions)和响应(responses)API,以及兼容 Anthropic 的 API 接口。 更详细信息请访问我们的技术博客(可通过文末“阅读原文”跳转至博客),及阿里云百炼 API 文档。 代码及智能体 Qwen3.6-35B-A3B 具备出色的智能体编程能力,可以无缝集成到流行的第三方编程助手中,包括 OpenClaw、Claude Code 和 Qwen Code。 OpenClaw Qwen3.6-35B-A3B 兼容 OpenClaw(原名 Moltbot / Clawdbot),这是一款可自托管的开源 AI 编码智能体。将其连接至百炼,即可在终端中获得完整的智能体编码体验。 Qwen Code Qwen3.6-35B-A3B 适配 Qwen Code,这是一款专为终端设计的开源 AI 智能体,针对 Qwen 系列进行了深度优化。 首次使用时,系统会提示您登录。您可以随时运行 /auth 来切换认证方式。 Claude Code Qwen API 也支持 Anthropic API 协议,这意味着您可以将其与 Claude Code 等工具配合使用,以获得更优质的编码体验。 关于 OpenClaw、Qwen Code、Claude Code 等三方编程助手的使用详细脚本,请参考我们的技术博客(可通过文末“阅读原文”跳转至博客)。 总结 Qwen3.6-35B-A3B 表明,稀疏 MoE 模型可以实现卓越的智能体编程和推理能力。仅凭 30 亿激活参数,它便能够交付与数倍于其激活规模的稠密模型相当的性能,同时在多模态基准上同样表现出色。作为完全开源的模型权重,它为该规模下的模型能力树立了新的标杆。 展望未来,我们将继续扩展 Qwen3.6 开源家族,并不断拓展高效开源模型所能实现的边界。我们由衷感谢社区的宝贵反馈,并期待看到大家利用 Qwen3.6-35B-A3B 创造出的精彩成果。Qwen3.6 开源家族正在持续壮大,敬请关注我们的后续发布!