WWW.AWTEY.CN
标签聚合 Qwen

/tag/Qwen

www.ithome.com · 2026-04-30 17:21:02+08:00 · tech

IT之家 4 月 30 日消息,今日,阿里千问宣布推出 Qwen-Scope—— 基于 Qwen3 系列和 Qwen3.5 系列模型训练所得的可解释性模块。 据介绍,阿里千问在 Qwen 隐藏层插入稀疏自编码器(SAE)并加以训练,通过施加稀疏性约束,自动提取出高度解耦、低冗余且更具可解释性的隐藏空间特征。Qwen-Scope 不仅可以用于分析 Qwen 模型行为的内在机制,也在模型优化上有着巨大潜力,应用场景包括推理结果定向控制、数据分类与合成、模型训练与优化、评估样本分布分析与对比等。 IT之家附官方详细介绍如下: Qwen-Scope 核心亮点包括: 推理:无需显示给出自然语言指令,实现推理结果定向控制; 数据:仅需少量种子数据便可收集用于数据分类的特征,显著降低数据依赖;同时可以使用未激活特征信息定向构造数据,补足长尾能力; 训练:通过分析语言混用和重复生成等低错问题,定位异常激活特征,在监督微调和强化学习阶段辅助模型训练,降低此类回复出现频率; 评估:计算不同样本间或不同评测集间特征激活模式,联合判断评测冗余程度,指导挑选评测集、提升评测能力覆盖度、降低评测成本。 整体概览 本次 Qwen-Scope 开源的权重涉及 7 个大模型,覆盖 Qwen3 及 Qwen3.5 系列的稠密模型和混合专家模型,共有 14 组稀疏自编码器权重。为了使得稀疏自编码器特征分布广、语义含义强、训练过程稳定可靠,我们从对应模型的预训练数据采样了 0.5B 词元数据规模进行训练。 实践 大家可以借助 Qwen-Scope 对 Qwen 系列模型进行分析和开发,下面我们会在推理、评测、数据、训练四个角度分别展示 Qwen-Scope 的用途,详细内容可以参考技术报告。 推理:模型行为的分析与可控的结果 通过控制特征的激活,实现对推理结果的定向控制,如语言、实体、风格的定向修改,而无需显式的给出自然语言指令。 数据:分类与合成 Qwen-Scope 对模型表示做了各个方向的解析和归纳,所以它可以用来作为数据处理工具,在数据分类和数据合成上均可提供数据处理思路。在毒性数据分类场景下,我们可以基于少量种子数据,分析毒性样本在 SAE 特征上的激活模式,并筛选出与毒性高度相关的特征用于分类。整个过程无需额外训练分类器,显著降低了标注和训练成本;同时,即使只依赖少量启动数据,也能获得较高的分类准确率,大幅降低了对大规模标注数据的依赖。 在数据合成场景中,Qwen-Scope 还可以帮助识别已有数据中激活次数少甚至未激活的毒性文本特征,并定向合成补充样本。相比传统合成数据方案,这种方式具有更强的可控性和针对性,能够更高效地覆盖长尾能力,使训练数据能效比提升至约 15 倍。 训练:定向优化 Qwen-Scope 的特征也可以应用在训练阶段。例如,当我们发现模型存在语言混用现象(比如英文回复中异常出现中文词)时,我们可以定位到异常激活特征,并在监督微调阶段,针对异常激活特征设计损失函数,引导模型降低 badcase 出现的频率。 再比如重复生成问题,这是一种低频现象,很难在强化学习阶段被采样到。为此,我们可以通过控制相应特征从而提高采样出异常回复的频率,增加学习奖励密度,以方便模型在强化学习阶段充分优化这一问题。 评估:测试样本的缺失与冗余 评估是大模型开发的核心之一,如今待评估能力、维度越来越多,样本规模越来越大,哪些评测集存在冗余,哪些领域覆盖不足是一个关键问题。通过 Qwen-Scope,我们可以对测试集的特征覆盖度进行分析以判断不同评测集之间的评测冗余程度。如下图所示,我们发现部分常用评测集在所激活特征上存在互相覆盖关系,致使部分评测集会受重复评估影响导致实用意义相比而言会更小。我们希望此类分析方法,可以方便大家挑选出覆盖度更高的、评测成本更低的测试样本和评测集。 总结 Qwen-Scope 不仅可以用于分析模型行为,更可以深入模型内部,将复杂的参数运算转化为人类可理解的概念与规律。它不仅仅能“看懂”模型,更能“改进”模型。实践证明,它可以在推理、评估、数据、训练等阶段,向我们提供模型优化思路、指导优化方向。可解释性,不仅是事后分析的工具,也可以是驱动模型进化的核心引擎之一。我们欢迎社区反馈,同时更希望可以看到大家发挥创造力,展示更多的、有趣的用法! 试用 大家可以前往 Huggingface 或魔搭体验 Qwen-Scope。 链接地址 Hugging Face: https://huggingface.co/spaces/Qwen/QwenScope ?spm= a2ty_o06.30285417.0.0.65e5c921MGq3Tu Modelscope: https://modelscope.cn/studios/Qwen/QwenScope ?spm= a2ty_o06.30285417.0.0.65e5c921FZvQi4 ios/Qwen/QwenScope?spm= a2ty_o06.30285417.0.0.65e5c921FZvQi4 技术报告: https://qianwen-res.oss-accelerate.aliyuncs.com/qwen-scope/Qwen_Scope.pdf

www.ithome.com · 2026-04-22 21:23:21+08:00 · tech

IT之家 4 月 22 日消息,阿里云通义千问团队今日宣布,开源模型家族迎来新成员 ——Qwen3.6-27B。这是一款拥有 270 亿参数的稠密多模态模型,也是社区呼声最高的模型规格。 此前,通义千问已陆续发布了 Qwen3.6-Plus 和 Qwen3.6-35B-A3B,而此次开源的 27B 版本在保持稠密架构优势的同时,全面提升了智能体编程与多模态推理能力。 据官方介绍,Qwen3.6-27B 支持多模态思考与非思考模式,在智能体编程方面达到了旗舰级表现,全面超越了前代开源旗舰 Qwen3.5-397B-A17B—— 后者是一款总参数 397 亿、激活参数 170 亿的 MoE(混合专家)模型。作为稠密架构,Qwen3.6-27B 无需 MoE 路由即可部署,是开发者在实用、可广泛部署规模上获取顶尖编程能力的理想选择。 在自然语言与编程基准测试中,Qwen3.6-27B 仅凭 270 亿参数,就在所有主要编程基准上全面超越了参数量高达其 15 倍的 Qwen3.5-397B-A17B。 具体来看,SWE-bench Verified 得分 77.2(前代 76.2),SWE-bench Pro 得分 53.5(前代 50.9),Terminal-Bench 2.0 得分 59.3(前代 52.5),SkillsBench 得分 48.2(前代 30.0)。 在推理任务上,Qwen3.6-27B 在 GPQA Diamond 上取得了 87.8 的成绩,可与数倍于其规模的模型相媲美。 视觉语言方面,该模型原生支持多模态,能够处理图像、视频与文本的混合输入,支持视觉推理、文档理解和视觉问答等任务,其能力与 Qwen3.6-35B-A3B 保持一致。 IT之家提醒,Qwen3.6-27B 的开源权重已在 Hugging Face 和 ModelScope 平台上提供,开发者可下载进行本地部署。同时,用户也可以在 Qwen Studio( chat.qwen.ai )上直接进行交互对话。 另外,阿里云百炼平台即将支持通过 API 调用该模型,并保留“preserve_thinking”功能,可在消息中保留所有前序轮次的思维内容,官方推荐用于智能体任务。 该模型还可以无缝集成到流行的第三方编程助手中,包括 OpenClaw、Claude Code 和 Qwen Code,从而简化开发流程,实现高效且具备上下文感知能力的编码体验。

www.ithome.com · 2026-04-21 14:29:28+08:00 · tech

IT之家 4 月 21 日消息,英伟达昨日(4 月 20 日)发布博文,针对当前边缘设备内存受限情况,通过架构优化 NVIDIA Jetson 平台,最高可释放约 12 GB 内存,帮助开发者优化 AI 模型部署。 在基础软件层,英伟达表示禁用图形桌面界面,最高可以释放 865 MB 内存,关闭非必要网络服务可再节省约 32 MB。 针对 Jetson Orin 系列,开发者可调整 Carveout 保留区域,在无需显示或摄像头功能的场景下,通过修改设备树配置回收约 68 MB 物理内存。内核层优化方面,利用硬件 IOMMU 特性调整 SWIOTLB 参数,可减少不必要的内存预留。 推理流水线层面,英伟达表示将应用从容器切换至裸机部署可节省 70 MB 内存,从 Python 迁移至 C++ 可再释放 84 MB。在 DeepStream 框架中禁用 Tiler 和 OSD 等可视化组件并使用 FakeSink,可额外节省 258 MB 内存,合计优化幅度达 412 MB。 此外通过量化模型,可以大幅降低内存占用,例如将 Qwen3 8B 模型从 FP16 量化至 W4A16 格式,可节省约 10 GB 内存 ;Qwen3 4B 模型从 BF16 量化至 INT4,可节省约 5.6 GB。 在实际运行案例方面,Reachy Mini 机器人项目在 Jetson Orin Nano 8GB 设备上,通过 4 位量化技术运行 Cosmos-Reason2-2B 视觉语言模型,并协同部署语音识别与合成模块,成功实现了无云端依赖的端侧多模态 AI 应用。

www.ithome.com · 2026-04-20 15:53:53+08:00 · tech

IT之家 4 月 20 日消息,4 月 20 日(今天)下午,阿里宣布 Qwen3.6-Max-Preview 正式发布。据介绍,该模型是 Qwen 系列新一代旗舰模型的早期预览版,用户可以在 Qwen Studio 进行交互对话,并且即将通过阿里云百炼 API 以 qwen3.6-max-preview 的名称调用。 该预览版带来了 更强的世界知识和指令遵循能力 ,以及在多项基准上 显著提升的智能体编程表现 。作为预览版,模型仍在积极迭代中,后续版本将持续优化。 据IT之家了解,Qwen3.6-Max-Preview 主要特性包括: 相比 Qwen3.6-Plus 显著提升的智能体编程能力 更强的世界知识和指令遵循 更优的真实场景智能体与知识可靠性表现 相比 Qwen3.6-Plus,预览版在智能体编程方面取得显著提升(如 SkillsBench +9.9、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8),世界知识更强(SuperGPQA +2.3、QwenChineseBench +5.3),指令遵循也更优(ToolcallFormatIFBench +2.8)。 该模型在智能体编程、世界知识和指令遵循方面相比 Qwen3.6-Plus 均有显著提升, 并在六项主要编程基准上取得最高分 ——SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode,且相比前代有大幅进步。同时,其在知识(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表现更优。 阿里方面表示,作为预览版,Qwen3.6-Max-Preview 仍在积极开发中。

www.ithome.com · 2026-04-20 14:46:49+08:00 · tech

IT之家 4 月 20 日消息,4 月 19 日(昨天)晚间,千问 3.6 系列中等尺寸模型 Qwen3.6-35B-A3B 模型正式开源,仅激活 3B。 根据介绍,该模型不但轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型 Qwen3.5-35B-A3B,并可与 Qwen3.5-27B 和 Gemma4-31B 等稠密模型一较高下。 其采用混合专家(MoE)架构, 总参数量 350 亿、激活仅 30 亿 ,在推理过程中,可实现 以更低的算力消耗完成更高性能的智能输出 。 阿里方面称,在考察终端编程的 Terminal-Bench2.0、长程编程任务 NL2Repo、真实世界 Agent 能力评测的 QwenClawBench 等权威基准测试中,Qwen3.6-35B-A3B 的表现均明显优于前一代 Qwen3.5-35B-A3B,以及 Gemma4-26B-A4B、Gemma4-31B 等同类开源模型。 新模型还支持多模态思考与非思考模式。多模态推理方面,在 MMBench、RealWorldQA、SimpleVQA 等多项视觉语言基准测试中,新模型表现媲美 Claude-Sonnet-4.5。在空间智能方面,Qwen3.6-35B-A3B 在例如 RefCOCO、ODInW13 等考核模型对复杂图像识别能力的基准测试中, 分别取得 92 和 50.8 的成绩 。 Qwen3.6-35B-A3B 还实现了 OpenClaw、Qwen Code、Claude Code 等主流 Agent 框架的深度兼容,能够将模型的编程能力、原生多模态能力,更好地赋予各类智能体,完成更长程、更复杂的任务,有望成为本地部署的“智能大脑”。 IT之家附模型调用 / 体验地址如下: 魔搭社区: https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B Hugging Face: https://huggingface.co/Qwen/Qwen3.6-35B-A3B Qwen Studio: https://chat.qwen.ai/

www.ithome.com · 2026-04-16 21:51:40+08:00 · tech

IT之家 4 月 16 日消息,继 Qwen3.6-Plus 发布之后,阿里千问大模型今日宣布开源 Qwen3.6-35B-A3B —— 一个稀疏但能力出色的混合专家(MoE)模型,总参数量为 350 亿,激活参数仅 30 亿。 官方称,Qwen3.6-35B-A3B 不但轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型 Qwen3.5-35B-A3B,并可与 Qwen3.5-27B 和 Gemma4-31B 等稠密模型一较高下。该模型依然支持多模态思考与非思考模式,是当前最具通用性的开源模型之一。现在,Qwen3.6-35B-A3B 已在 Qwen Studio 上线,并以开源权重的形式向社区发布。 IT之家附官方详细介绍如下: Qwen3.6-35B-A3B 是一个完全开源的 MoE 模型(总参数 35B / 激活参数 3B),主要特性包括: 卓越的智能体编程能力,可与大得多的模型相媲美 强大的多模态感知与推理能力 您可以在 Qwen Studio 进行交互对话,也将可通过阿里云百炼以 qwen3.6-flash 的名称调用 API,或从 Hugging Face 和 ModelScope 下载模型权重。 欢迎体验 Qwen Studio: https://chat.qwen.ai/ ModelScope: https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B Hugging Face: https://huggingface.co/Qwen/Qwen3.6-35B-A3B 模型表现 下文将全面展示 Qwen3.6-35B-A3B 与同规模模型在各类任务和模态上的评测对比结果。 自然语言 仅凭 30 亿激活参数,Qwen3.6-35B-A3B 在多项关键编程基准上超越了 270 亿参数的稠密模型 Qwen3.5-27B,并在智能体编程和推理任务上大幅超越其直接前代 Qwen3.5-35B-A3B。 视觉语言 Qwen3.6 原生支持多模态,Qwen3.6-35B-A3B 以仅约 30 亿激活参数,展现出远超其体量的感知与多模态推理能力。在大多数视觉语言基准上,它的表现已与 Claude Sonnet 4.5 持平,甚至在部分任务上实现超越。其在空间智能上的优势尤为突出:RefCOCO 92.0、ODInW13 50.8。 开始使用 Qwen3.6-35B-A3B Qwen3.6-35B-A3B 的开源权重已在 Hugging Face 和 ModelScope 上提供,支持本地部署;也即将可通过阿里云百炼 API 以 qwen3.6-flash 的名称调用。此外,您还可以在 Qwen Studio 上即时体验。 该模型可以无缝集成到流行的第三方编程助手中,包括 OpenClaw、Claude Code 和 Qwen Code,从而简化开发流程,实现高效且具备上下文感知能力的编码体验。 API 使用方式 本次发布支持 preserve_thinking 功能:在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。 阿里云百炼 阿里云百炼支持行业标准协议,包括兼容 OpenAI 规范的聊天补全(chat completions)和响应(responses)API,以及兼容 Anthropic 的 API 接口。 更详细信息请访问我们的技术博客(可通过文末“阅读原文”跳转至博客),及阿里云百炼 API 文档。 代码及智能体 Qwen3.6-35B-A3B 具备出色的智能体编程能力,可以无缝集成到流行的第三方编程助手中,包括 OpenClaw、Claude Code 和 Qwen Code。 OpenClaw Qwen3.6-35B-A3B 兼容 OpenClaw(原名 Moltbot / Clawdbot),这是一款可自托管的开源 AI 编码智能体。将其连接至百炼,即可在终端中获得完整的智能体编码体验。 Qwen Code Qwen3.6-35B-A3B 适配 Qwen Code,这是一款专为终端设计的开源 AI 智能体,针对 Qwen 系列进行了深度优化。 首次使用时,系统会提示您登录。您可以随时运行 /auth 来切换认证方式。 Claude Code Qwen API 也支持 Anthropic API 协议,这意味着您可以将其与 Claude Code 等工具配合使用,以获得更优质的编码体验。 关于 OpenClaw、Qwen Code、Claude Code 等三方编程助手的使用详细脚本,请参考我们的技术博客(可通过文末“阅读原文”跳转至博客)。 总结 Qwen3.6-35B-A3B 表明,稀疏 MoE 模型可以实现卓越的智能体编程和推理能力。仅凭 30 亿激活参数,它便能够交付与数倍于其激活规模的稠密模型相当的性能,同时在多模态基准上同样表现出色。作为完全开源的模型权重,它为该规模下的模型能力树立了新的标杆。 展望未来,我们将继续扩展 Qwen3.6 开源家族,并不断拓展高效开源模型所能实现的边界。我们由衷感谢社区的宝贵反馈,并期待看到大家利用 Qwen3.6-35B-A3B 创造出的精彩成果。Qwen3.6 开源家族正在持续壮大,敬请关注我们的后续发布!

www.ithome.com · 2026-04-16 10:12:21+08:00 · tech

IT之家 4 月 16 日消息,科技媒体 NeoWin 昨日(4 月 15 日)发布博文,基于 Microsoft 365 路线图, 微软计划支持 IT 管理员配置 Edge 浏览器,限制员工使用 Qwen、Gemini、Grok 等 AI 工具,并引导员工使用合规的 Copilot 服务。 根据 Microsoft 365 公开路线图,微软计划限制 Edge 浏览器内的“影子 AI”(shadow AI)。IT之家注:指员工在未经组织批准或 IT 部门授权的情况下,擅自使用的 AI 工具和服务。 微软为了简化这一流程,正在构建全新的管理界面,在拦截页面上让 IT 管理员直接显示引导选项,将用户重定向至已打开的 Microsoft 365 Copilot 新标签页。 根据官方公告内容,IT 管理员可以配置 Edge for Business 浏览器,阻止访问以下 AI 工具: Adobe Firefly CapCut ChatGPT (consumer) Cohere DeepAI DeepL DeepSeek Google Gemini Grok (xAI) Meta AI Microsoft Copilot 365 Chat Notion AI Otter.ai Perplexity AI QwenAI Qwen Chat Runway Textcortex Textcortex Zenochat You ( You.com ) Zapier 实际应用场景中,当员工尝试在 Edge 中访问 ChatGPT 等未授权 AI 工具处理办公事务后,策略将强制拦截该访问请求。 浏览器不会仅显示简单的拦截提示, 而是提供一个按钮,引导用户转向微软官方的 Microsoft 365 Copilot。 Microsoft 365 Copilot 支持企业数据保护,通过合规边界、租户隔离以及排除数据用于模型训练等机制,确保敏感信息不会外泄。 在 Edge for Business 中,微软目前支持拦截包括 Microsoft Copilot 365 Chat 和 Textcortex Zenochat 在内的多款 AI 工具。这项新功能计划于下月落地,企业可通过 Purview DLP 许可详情了解更多配置信息。

www.ithome.com · 2026-04-12 19:17:40+08:00 · tech

IT之家 4 月 12 日消息,阿里云开源的桌面 Agent 工具 CoPaw 今日发布了最新的 1.1.0 版本并宣布更名为 QwenPaw。 官方表示,此次品牌重塑标志着项目进入开源开发的新阶段,新名称更好地反映了团队正在构建的开放生态系统以及持续追求的更广阔方向。 名称中的“Qwen”代表与通义千问(Qwen)开源生态的更深层次整合,并在模型层上形成更清晰的聚焦,包括面向智能体的本地模型以及大小模型之间的智能协作。而“Paw”则延续了项目的原始使命 —— 陪伴用户,成为用户真正信任的个人助手。 官方强调,此次更名并未改变其在开源社区中的愿景与目标:打造一个更实用、更安全、更个性化的 AI 助手;同时坚守开源协作的承诺,与社区共同前行。 参考IT之家此前报道,该应用原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。 相关阅读: 《 阿里通义 CoPaw 1.0 发布:定制小模型、安全机制与多智能体全面进化 》 《 阿里桌面 Agent 工具 CoPaw 开源:自由接入本地模型,支持钉钉、飞书、QQ 等 》 《 阿里云通义 CoPaw 发布:对标 OpenClaw,可端可云且支持钉钉、飞书、QQ 接入 》