WWW.AWTEY.CN
标签聚合 开源

/tag/开源

www.ithome.com · 2026-05-04 21:11:34+08:00 · tech

IT之家 5 月 4 日消息,Red Hat 红帽首席软件工程师 Sally O'Malley 在红帽博客发文,公布了名为 Tank OS 的开源项目。该项目主要利用容器化与无 root 权限(rootless)架构设计,以提升 OpenClaw 安全性,IT之家附项目地址( https://www.redhat.com/en/blog/building-hardened-image-based-foundation-ai-agents )。 O'Malley 指出,如果 OpenClaw 配置不当,可能带来误删数据或敏感信息泄露等风险。因此其设计了 Tank OS 项目,其核心思路是将 OpenClaw 运行环境封装进容器中,以打造专门面向 AI 智能体的运行环境,避免宿主系统权限被滥用。 在底层架构方面,Tank OS 构建于 Fedora Linux 及 fedora-bootc 技术之上,主要利用镜像作为完整运行环境,同时支持在同一设备上运行多个 AI 智能体实例,各实例之间相互隔离,彼此不共享凭据及系统资源。 此外,Tank OS 采用不可变(immutable)操作系统设计,系统将内核、运行环境及服务预先定义在镜像中,大部分文件系统保持只读,仅允许有限范围内修改,从而进一步确保安全性。

www.ithome.com · 2026-05-03 21:07:37+08:00 · tech

IT之家 5 月 3 日消息,据 NeoWin 今日报道,微软 PowerToys 有望迎来一项新的实用功能。 PowerToys 作为一款面向 Windows 用户的开源工具集,目前在常规运行状态下,许多工具模块会在后台保活,以确保用户调用时能够接近瞬时启动。这种“热进程”机制虽然带来了更快的响应速度,但当用户开启较多模块且实际使用频率不高时,会持续占用系统内存。 为了缓解这一问题,一位 PowerToys 贡献者近日提交了一份请求,提议增加一项“低内存模式”。该模式的核心机制是:当受支持的模块未处于活跃使用状态时,其后台进程将自动关闭;当用户通过常规快捷键或界面重新唤启时再按需启动。 开发者解释称,新引入的 API(如 is_low_memory_mode_enabled)将允许各模块自主决定是保持常驻还是在“使用后退出”,且所有模块默认仍保持现有的快速响应表现,除非用户手动开启低内存模式。 开发者还补充说明,运行程序会在用户切换低内存模式设置时重置缓存,并仅重新启动受影响的已启用模块来应用新策略。 这一功能并非通过直接减少 PowerToys 自身的运行内存来实现加速,而是通过释放被闲置后台进程占用的系统资源,将其让给前台应用或其他主要系统进程使用。对于入门级或低端配置的 PC 设备,低内存模式的潜在收益尤为明显。 IT之家提醒:目前该提案尚处于早期代码提交和内部测试阶段,暂未确定具体的合并窗口与正式发布版本。 相关阅读: 《 微软 PowerToys 0.99 发布:任意位置拖动或缩放窗口、在系统托盘直接调整亮度对比度、加速 WinUI 3 迁移以贴近 Win11 现代化外观 》 《 微软悄然优化 Win11 现代待机机制,以降低功耗、延长续航 》

www.ithome.com · 2026-05-03 15:25:37+08:00 · tech

IT之家 5 月 3 日消息,据科技媒体 Phoronix 昨天报道,开放媒体联盟原计划 2025 年底发布 AV2 标准,但目前仍处于草案阶段。不过开发 VLC 播放器的 VideoLAN 团队已经提前行动,本周发布开源 AV2 解码器 Dav2d。 据报道,Dav2d 是一款完全开源 CPU 视频解码器, 脱胎于 AV1 解码器 Dav1d 。当前具备跨平台特性, 强调高性能、解码正确性 。 官方表示,目前相关代码已经达到“经过实战验证、 可用于生产环境 ”的水平。目前正在稳步完善 API、完整 C 语言实现,并计划移植到更多平台。 此外,团队还计划针对 x86 平台的 AVX2 指令集进行优化,并将 Dav2d 移植到 Arm、RISC-V 架构。

www.ithome.com · 2026-05-03 08:20:49+08:00 · tech

IT之家 5 月 3 日消息,据科技媒体 TechPower Up 昨天报道,AMD 此前一直尝试让 HDMI Forum(HDMI 管理机构)增加 Linux 系统 HDMI 2.1 支持,但最初遭到强烈拒绝。 如今这种情况有所改观,一位 AMD 开发者透露,公司正在为 AMD GPU 驱动提供完整的开源 HDMI 2.1 支持。V社(IT之家注:Valve)在其中提供了帮助, 主要是因为旗下 Steam Machine 主机将运行基于 Linux 的 SteamOS 系统 。 目前,AMD 已经提交了首批 Linux 内核补丁,增添 HDMI 2.1 独有的固定速率链路(FRL)功能,可让接口实现更高带宽, 实现 4K 240Hz、5K 120Hz 高分高刷显示 。 去年年底,V社曾与 HDMI Forum 展开谈判,尝试为 Linux 系统争取开源 HDMI 2.1 支持。

www.ithome.com · 2026-04-30 17:21:02+08:00 · tech

IT之家 4 月 30 日消息,今日,阿里千问宣布推出 Qwen-Scope—— 基于 Qwen3 系列和 Qwen3.5 系列模型训练所得的可解释性模块。 据介绍,阿里千问在 Qwen 隐藏层插入稀疏自编码器(SAE)并加以训练,通过施加稀疏性约束,自动提取出高度解耦、低冗余且更具可解释性的隐藏空间特征。Qwen-Scope 不仅可以用于分析 Qwen 模型行为的内在机制,也在模型优化上有着巨大潜力,应用场景包括推理结果定向控制、数据分类与合成、模型训练与优化、评估样本分布分析与对比等。 IT之家附官方详细介绍如下: Qwen-Scope 核心亮点包括: 推理:无需显示给出自然语言指令,实现推理结果定向控制; 数据:仅需少量种子数据便可收集用于数据分类的特征,显著降低数据依赖;同时可以使用未激活特征信息定向构造数据,补足长尾能力; 训练:通过分析语言混用和重复生成等低错问题,定位异常激活特征,在监督微调和强化学习阶段辅助模型训练,降低此类回复出现频率; 评估:计算不同样本间或不同评测集间特征激活模式,联合判断评测冗余程度,指导挑选评测集、提升评测能力覆盖度、降低评测成本。 整体概览 本次 Qwen-Scope 开源的权重涉及 7 个大模型,覆盖 Qwen3 及 Qwen3.5 系列的稠密模型和混合专家模型,共有 14 组稀疏自编码器权重。为了使得稀疏自编码器特征分布广、语义含义强、训练过程稳定可靠,我们从对应模型的预训练数据采样了 0.5B 词元数据规模进行训练。 实践 大家可以借助 Qwen-Scope 对 Qwen 系列模型进行分析和开发,下面我们会在推理、评测、数据、训练四个角度分别展示 Qwen-Scope 的用途,详细内容可以参考技术报告。 推理:模型行为的分析与可控的结果 通过控制特征的激活,实现对推理结果的定向控制,如语言、实体、风格的定向修改,而无需显式的给出自然语言指令。 数据:分类与合成 Qwen-Scope 对模型表示做了各个方向的解析和归纳,所以它可以用来作为数据处理工具,在数据分类和数据合成上均可提供数据处理思路。在毒性数据分类场景下,我们可以基于少量种子数据,分析毒性样本在 SAE 特征上的激活模式,并筛选出与毒性高度相关的特征用于分类。整个过程无需额外训练分类器,显著降低了标注和训练成本;同时,即使只依赖少量启动数据,也能获得较高的分类准确率,大幅降低了对大规模标注数据的依赖。 在数据合成场景中,Qwen-Scope 还可以帮助识别已有数据中激活次数少甚至未激活的毒性文本特征,并定向合成补充样本。相比传统合成数据方案,这种方式具有更强的可控性和针对性,能够更高效地覆盖长尾能力,使训练数据能效比提升至约 15 倍。 训练:定向优化 Qwen-Scope 的特征也可以应用在训练阶段。例如,当我们发现模型存在语言混用现象(比如英文回复中异常出现中文词)时,我们可以定位到异常激活特征,并在监督微调阶段,针对异常激活特征设计损失函数,引导模型降低 badcase 出现的频率。 再比如重复生成问题,这是一种低频现象,很难在强化学习阶段被采样到。为此,我们可以通过控制相应特征从而提高采样出异常回复的频率,增加学习奖励密度,以方便模型在强化学习阶段充分优化这一问题。 评估:测试样本的缺失与冗余 评估是大模型开发的核心之一,如今待评估能力、维度越来越多,样本规模越来越大,哪些评测集存在冗余,哪些领域覆盖不足是一个关键问题。通过 Qwen-Scope,我们可以对测试集的特征覆盖度进行分析以判断不同评测集之间的评测冗余程度。如下图所示,我们发现部分常用评测集在所激活特征上存在互相覆盖关系,致使部分评测集会受重复评估影响导致实用意义相比而言会更小。我们希望此类分析方法,可以方便大家挑选出覆盖度更高的、评测成本更低的测试样本和评测集。 总结 Qwen-Scope 不仅可以用于分析模型行为,更可以深入模型内部,将复杂的参数运算转化为人类可理解的概念与规律。它不仅仅能“看懂”模型,更能“改进”模型。实践证明,它可以在推理、评估、数据、训练等阶段,向我们提供模型优化思路、指导优化方向。可解释性,不仅是事后分析的工具,也可以是驱动模型进化的核心引擎之一。我们欢迎社区反馈,同时更希望可以看到大家发挥创造力,展示更多的、有趣的用法! 试用 大家可以前往 Huggingface 或魔搭体验 Qwen-Scope。 链接地址 Hugging Face: https://huggingface.co/spaces/Qwen/QwenScope ?spm= a2ty_o06.30285417.0.0.65e5c921MGq3Tu Modelscope: https://modelscope.cn/studios/Qwen/QwenScope ?spm= a2ty_o06.30285417.0.0.65e5c921FZvQi4 ios/Qwen/QwenScope?spm= a2ty_o06.30285417.0.0.65e5c921FZvQi4 技术报告: https://qianwen-res.oss-accelerate.aliyuncs.com/qwen-scope/Qwen_Scope.pdf

www.ithome.com · 2026-04-30 09:22:01+08:00 · tech

IT之家 4 月 30 日消息,蚂蚁集团旗下的百灵大模型今日宣布,今天将 Ling-2.6-1T 正式开源。 官方表示,Ling-2.6-1T 并不是为了单纯追求更长的思考链,或制造更强的“参数规模体感”,而是面向真实复杂任务,系统性优化模型的智效比、指令执行、工具适配、长上下文承接和工程任务处理能力。该模型重点解决三个问题: 在更低 Token 开销下保持强综合智能: 依托 MLA 与 Linear Attention 的 Hybrid 架构创新,结合抑制“过程冗余”的强化奖励策略,Ling-2.6-1T 在保持 1T 参数能力上限的同时,减少对冗长思考链的依赖,以更高效的“快思考”机制直达结果,从而压缩同等智能水平下的输出成本。 在复杂任务中实现更可靠的多步执行: 在 Agent、Coding 和工作流场景中,模型需要的不只是单点回答能力,而是对指令、工具、上下文和中间状态的持续把控,在噪声环境下的推理与精准作答。Ling-2.6-1T 加强对复合型任务的学习,在 AIME26、SWE-bench Verified、BFCL-V4 、TAU2-Bench、IFBench 等执行类基准上达到开源 SOTA 水平,展现出面向复杂任务的综合执行能力。 让万亿级模型真正进入开发者和企业的生产工作流: Ling-2.6-1T 具备从代码生成到缺陷修复的完整工程落地能力,并与主流 Agent 框架高度兼容,适用于多工具、多步骤、多约束的复杂场景。它的目标不是停留在单次演示,而是成为真实业务系统中可部署、可协同、可持续运行的模型能力底座。 ▲ Ling-2.6-1T 以 16M tokens 完成 Artificial Analysis 完整评测 官方还表示,为支持更多开发者体验与评测 Ling-2.6-1T,将 OpenRouter 平台 的免费 API 调用服务延期一周 。 IT之家附开源链接如下: Hugging Face : https://huggingface.co/inclusionAI/Ling-2.6-1T ModelScope : https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T 相关阅读: 《 蚂蚁百灵万亿旗舰模型 Ling-2.6-1T 发布:主打“快思考”,对标 GPT-5.4 非推理版 》

www.ithome.com · 2026-04-29 16:51:53+08:00 · tech

IT之家 4 月 29 日消息,今日腾讯混元宣布开源手机端离线翻译模型 Hy-MT1.5-1.8B-1.25bit,把支持 33 种语言的翻译大模型压缩至 440MB,无需联网,下载即可直接在手机本地运行,“翻译质量优于谷歌翻译”。 演示设备:高通骁龙 865,8GB 内存 IT之家附官方详细介绍如下: 基于混元翻译大模型 Hy-MT1.5 打造,翻译效果比肩商用翻译模型 Hy-MT1.5 是腾讯混元团队打造的专业翻译大模型,原生支持 33 种语言、5 种方言 / 民汉及 1056 个翻译方向。从常见的中英互译,到法语、日语、阿拉伯语、俄语,甚至藏语、蒙古语等少数民族语言,它都能游刃有余地处理。 仅以 1.8B 参数量,Hy-MT1.5 实现了比肩商业翻译 API 和 235B 级大模型的翻译效果。在严格的评测基准中,其翻译质量不仅超越了谷歌翻译等主流系统,更证明了在高效优化下,轻量级模型能够迸发出令人印象深刻的翻译能力。 Hy-MT1.5-1.8B 翻译效果评分,详情见文末链接「Hy-MT1.5 技术报告」 但问题来了:原始的 1.8B 模型即使在 FP16 精度下,依然占用 3.3GB 内存。对于手机上金子般的内存来说,依然太大、太慢,所以需要量化压缩。 最极致的量化压缩,把模型装进手机 量化压缩,简单来说就是:把模型里原本用 16 位数字 (16-bit) 表示的参数转用更低位数字储存。这就像把一幅高清照片压缩成缩略图,文件小了很多,但你还是能看清楚里面的内容。针对不同的手机用户,腾讯特别推出了 2-bit 与 1.25-bit 两种极致的量化压缩方案。 不同大小的模型在 FLORES-200 中外互译的效果评分 2-bit 模型:性能与质量的平衡(适用:中高端机型) 2-bit 模型采用了业内顶尖的拉伸弹性量化(SEQ),将模型参数量化至 {-1.5,-0.5,0.5,1.5},并结合量化感知蒸馏,在将模型体积压缩至 574MB 的同时,实现了几乎无损的翻译质量,效果超越上百 GB 的大模型。在支持 Arm SME2 技术的移动设备上,2-bit 模型能够实现更快速、更高效的推理。 2-bit 模型在 SME2 及 Neon 内核的速度对比演示 1.25-bit 模型:Sherry 极致压缩(适用:全系机型) 为了达成极致的轻量化,腾讯推出了基于 Sherry(稀疏高效三值量化)技术的 1.25-bit 模型。该技术方案已经被 NLP 顶级学术会议 ACL 2026 录用。 链接: https://arxiv.org/ abs/2601.07892 Sherry 压缩方案的核心逻辑在于“细粒度稀疏”策略:每 4 个模型参数,3 个最重要的用 1-bit 储存,1 个用 0 储存,平均每个参数仅需 1.25-bit。 配合腾讯专门为手机 CPU 设计的 STQ 内核,该方案实现了对 SIMD 指令集的完美适配。最终,3.3GB 的原始模型被进一步压缩至 440MB,轻松常驻后台,让内存紧张的普通手机也能顺滑进行高质量离线翻译。 FP16 (八倍速)vs.1.25bit 速度对比,演示设备:高通骁龙 888,8GB 内存 实际体验:全离线、零成本、零隐私暴露 本次开源不仅包含模型权重,我们还特别制作了一个实际可用的腾讯混元翻译 Demo 版,特别适配了“后台取词模式”。无论是在本地查看邮件还是浏览网页,混元翻译都能随叫随到。无需网络,无需订阅,完全本地处理、不涉及个人信息的采集和上传,一次下载永久使用! 演示设备:高通骁龙 7+gen2,16GB 内存 立即体验 所有的模型权重、代码及技术报告均已全面开源。(暂时只支持安卓体验 demo,后续正式版会添加对 IOS 等平台的支持。) 体验链接: Huggingface(海外用户):: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF / resolve / main / Hy-MT-demo.apk 魔搭社区(国内用户): https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF / resolve / master / Hy-MT-demo.apk 模型下载 1、Huggingface(海外用户): 2-bit 模型权重: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-2bit 2-bit 模型 gguf: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-2bit-GGUF 1.25-bit 模型权重: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit 1.25-bit 模型 gguf: https://huggingface.co/ AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF 2、魔搭社区(国内用户): 2-bit 模型权重: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-2bit 2-bit 模型 gguf: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-2bit-GGUF 1.25-bit 模型权重: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit 1.25-bit 模型 gguf: https://modelscope.cn/ models / AngelSlim / Hy-MT1.5-1.8B-1.25bit-GGUF 3、技术报告: Sherry 论文地址: https://arxiv.org/ abs/2601.07892 AngelSlim 技术报告: https://arxiv.org/ abs/2602.21233 Hy-MT1.5 技术报告: https://arxiv.org/ abs/2512.24092 4、代码仓库: AngelSlim: https://github.com/tencent/AngelSlim

www.ithome.com · 2026-04-29 09:27:20+08:00 · tech

IT之家 4 月 29 日消息,蚂蚁集团旗下的百灵大模型今日宣布, Ling-2.6-flash 正式开源 。同步提供 BF16、FP8、INT4 等多个版本,方便开发者根据不同硬件环境、推理成本和部署需求灵活选择。 Ling-2.6-flash 是一款总参数量 104B、激活参数 7.4B 的 Instruct 模型,两周前以 Elephant Alpha 的匿名身份登陆 OpenRouter。 官方表示,过去两周里持续收集来自开发者的真实反馈,并针对 Ling-2.6-flash 的使用体验进行了多轮优化, 进一步改善了中英文自然切换能力,并提升了其在主流 Coding 框架中的适配效果 。 据介绍,Ling-2.6-flash 的核心能力体现在三个方面: 混合线性架构,释放推理效率: 通过引入混合线性架构,模型从底层优化计算效率,在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s ,Prefill 吞吐达到 Nemotron-3-Super 的 2.2 倍 Token 效率优化,提升智效比: 在训练过程中对 Token 效率进行了针对性校准,力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中,Ling-2.6-flash 仅消耗 15M tokens ,约为 Nemotron-3-Super 等模型的 1/10 面向 Agent 场景进行定向增强: 针对当前需求最旺盛的 Agent 应用,在工具调用、多步规划与任务执行能力上持续打磨,使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中,即使面对激活参数更大的模型,依然能够取得相近甚至 SOTA 级别的表现 IT之家附开源链接如下: Hugging Face : https://huggingface.co/inclusionAI/Ling-2.6-flash ModelScope : https://www.modelscope.cn/models/inclusionAI/Ling-2.6-flash

www.ithome.com · 2026-04-29 09:08:10+08:00 · tech

IT之家 4 月 29 日消息,在第九届数字中国建设峰会召开前夕,鸿蒙生态峰会(以下简称“峰会”)在福州海峡国际会展中心成功举办。 开放原子开源基金会理事长谢少锋在致辞中分享了一组数据:开源鸿蒙自华为捐赠至开放原子开源基金会以来实现快速发展, 社区代码量已突破 1.3 亿行,贡献者超过 13000 名,版本已迭代至 6.1 Release ,支持手机、平板、电脑、电视、穿戴及行业智能终端等形态。 目前,已有 1700 多款产品通过兼容性测评,在电力、交通、电信、金融、教育等领域形成一批商用成果,电鸿、交鸿、矿鸿、警鸿、移鸿等行业发行版也在加速落地。 据IT之家今日早些时候报道,在国新办 4 月 28 日举行的新闻发布会上,工业和信息化部副部长柯吉欣表示,截至 3 月底,搭载基于开源的鸿蒙操作系统的手机总量已经突破 5500 万台。

www.ithome.com · 2026-04-29 07:41:50+08:00 · tech

IT之家 4 月 29 日消息,在国新办 4 月 28 日举行的新闻发布会上,工业和信息化部副部长柯吉欣表示,现在国产的软件在运用方面跟前几年是完全不一样的,现在越来越丝滑,越来越好用。 柯吉欣还在现场分享了一组数据:截至 3 月底, 搭载基于开源的鸿蒙操作系统的手机总量已经突破 5500 万台 。 参考IT之家此前报道,在 4 月 20 日的华为 Pura 系列及全场景新品发布会上,华为常务董事、产品投资评审委员会主任、终端 BG 董事长余承东宣布: 鸿蒙 HarmonyOS 6 终端设备数突破 5500 万 。第三方平台的加权数据显示,鸿蒙 HarmonyOS 系统装机量目前已突破 5625.5 万台(数据还在持续增长)。

www.ithome.com · 2026-04-28 07:07:44+08:00 · tech

IT之家 4 月 28 日消息,小米技术官方今日凌晨宣布,小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动。 MiMo-V2.5 系列模型已于 4 月 23 日开启公测,系列包含两款模型,均支持 100 万上下文窗口: MiMo-V2.5-Pro,面向复杂的任务场景,深度适配 Agent 与 Coding 应用,在 GDPVal-AA 和 ClawEval 榜单上位列全球开源模型第一 MiMo-V2.5,原生全模态模型,支持文本、图像、视频和音频理解,具备强大的 Agent 能力 小米技术表示,模型的真正价值不在于榜单排名,而在于能否高效帮助开发者解决实际问题。在 Claw-Eval 榜单上,MiMo-V2.5 位列任务完成率与 Token 效率的最优前沿。 经过公测阶段的打磨与验证,该系列在智能水平与稳定性上得到进一步提升,已达到可以开放的标准。MiMo-V2.5 系列的模型的权重(包含 Base 模型)已全量开放, 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权 。 另外,小米还正式推出 —— MiMo Orbit 计划。计划分为 2 部分,分别是面向 AI builder 的 『百万亿 Token 创造者激励计划』 ,以及面向 Agent 框架团队的 『Agent 生态共建计划』 。 IT之家从小米技术获悉, Xiaomi MiMo 将面向全球用户进行免费 Token 发放 ,在 30 天内发放总计 100 万亿(100T) Token 权益,赠完即止。本次活动采取申请制,申请通过的用户最高将获得 Max 档位的 Token Plan,包含 16 亿 Credits ,价值 659 元。 活动时间 北京时间 2026 年 4 月 28 日 00:00 至 5 月 28 日 00:00 参与方式 你可以通过下列链接或二维码填写申请,我们会认真评估每一份申请材料,并根据你的使用场景与需求匹配相应权益。申请通过者将收到我们的后续邮件。 申请网址 100t.xiaomimimo.com Xiaomi MiMo 还面向全球 Agent 框架团队提供专项支持, 小米将为 agent 框架提供 MiMo token 限免支持 ,让用户免费接入并体验 MiMo 系列模型。MiMo-V2.5-Pro 已于开源首日完成多个芯片厂商的接入适配,以下是部分厂商列表: 阿里平头哥 平头哥真武 810E 依托全栈自研 AI 软件栈,实现深度适配。 亚马逊云科技 亚马逊云科技基于自研 Trainium2 芯片与 Neuron SDK + vLLM 推理框架,完成 MiMo-V2.5-Pro 深度适配,实现模型开源即全球可用的首日适配。下一代 3nm 制程 Trainium3 将进一步释放模型 Agentic 性能潜能。 AMD AMD 依托 ROCm 开源软件栈,为 MiMo-V2.5-Pro 提供 Day-0 适配及全面优化支持,助力开发者和企业用户高效完成模型部署与上线。 百度昆仑芯 昆仑芯依托自研架构,通过底层算子优化与软硬件协同加速,有效保障了模型在平台上的稳定、高效运行,为上层应用构建了坚实的算力基础。 燧原科技 燧原科技依托自研驭算 TopsRider 软件栈进行深度优化,MiMo-V2.5-Pro 已在燧原 L600 上完成了全量适配,实现高吞吐、低延迟的稳定运行,并在复杂任务与长序列场景下保持优异表现。 沐曦 沐曦曦云 C 系列依托全栈自研的 MXMACA 软件栈,实现 Triton 语法到沐曦 GPU 指令集的端到端原生支持,性能更优。 天数智芯 天数智芯可实现模型 Day 0 级深度适配,依托全栈自研软硬件,打造高质量算力,适配高效且易迁移,能精准释放模型性能、保障稳定运行。 此外,MiMo-V2.5 系列模型也同步完成了 SGLang 和 vLLM 的主流推理框架的 Day0 适配。

www.ithome.com · 2026-04-27 14:01:36+08:00 · tech

IT之家 4 月 27 日消息,OpenAI 于 4 月 22 日发布了一款用于脱敏文本中个人身份信息 (PII) 的前沿模型 Privacy Filter。 该模型已以 Apache 2.0 许可协议在 Hugging Face 和 GitHub 平台同步开源,供开发者下载、定制及商业部署。 OpenAI 表示,开发者在自己的环境中运行这一模型后,可针对特定用例进行微调,在训练管线、索引流程、日志记录和审核环节中构建更强的隐私保护机制。 与传统依赖规则匹配的隐私过滤工具不同,OpenAI Privacy Filter 内置了更深层次的语言理解能力,能够根据上下文语境识别非结构化文本中的个人信息,在准确保留公开信息的同时,对与特定个体相关联的敏感数据进行遮盖或脱敏。 据 OpenAI 介绍,该模型采用了双向 Token 分类架构,版本总参数规模为 15 亿,但每次仅激活约 5000 万个参数,这一混合专家(MoE)设计使其能够运行于笔记本电脑甚至浏览器等资源受限的设备上。 该模型支持高达 12.8 万个 Token 的上下文窗口,单次前向传播即可对整个输入序列完成标注,并采用受限维特比算法解码出连贯的片段。 在隐私分类体系方面,Privacy Filter 可识别八类个人敏感信息:姓名(private_person)、地址(private_address)、邮箱地址(private_email)、电话号码(private_phone)、URL 链接(private_url)、日期(private_date)、账号信息(account_number,涵盖银行卡号、信用卡号等金融信息)以及机密信息(secret,如密码和 API 密钥)。 评估过程中,该模型在 PII-Masking-300k 基准测试中取得了 96% 的 F1 分数(准确率 94.04%,召回率 98.04%)。 由于 PII-Masking-300k 数据集的初始注释存在多处遗漏,OpenAI 在对评估中发现的标注问题进行修正后,模型在该修正版基准测试上的 F1 分数进一步提升至 97.43%(准确率为 96.79%,召回率为 98.08%)。 OpenAI 指出,该模型在少量数据上进行微调即可快速提升在特定领域的准确性,且能够在高精度与高召回率之间按需调整。 OpenAI 承认,Privacy Filter 并非匿名化工具,亦不替代合规认证,在法律、医疗和金融等高敏感性场景中,人工审核及领域特定的评估与微调依然是必要的。 在用户日常使用中不慎将包含个人信息的文本粘贴到 AI 工具的行为并不罕见,Privacy Filter 定位为在本地即可运行的预过滤层 —— 数据在不离开用户设备的前提下即可完成 PII 的检测与脱敏处理,此后再将已脱敏内容发送至云端 LLM,从而在使用强大 AI 服务的同时有效控制个人信息的暴露风险。

www.ithome.com · 2026-04-27 12:53:26+08:00 · tech

IT之家 4 月 27 日消息,据博主 @粮厂研究员Will 分享,在今天的小米投资者日上,小米集团副总裁、技术委员会主席屈恒发表主题为“Agent 范式重塑小米与人车家全生态”的演讲。 博主总结核心观点如下: Agent 将范式重塑小米与「人车家全生态」 , 未来三年 AI 投入超过 600 亿元 ,这个数字只是保底,会更高; 小米拥有 AI 时代的全栈能力:基建层、数据层、模型层、框架层和生态层;一方面重塑人车家生态,另一方面是提升企业效率; 基座大模型 :(1) MiMo 开始收费后留存超过 35% ,当下的比例会更高 ;(2)收费计划里 Pro / Max 收入占比超过 50%;(3)MiMo v2.5 的 AA 智能与 Agent 指数,位列全球开源大模型并列第一;(4) MiMo v2.5 即将开源,几乎适配国内所有芯片 ;(5) 大模型团队平均年龄 25 岁,清北占比 60%,博士占比 55%; 辅助驾驶 :强调基座能力的重要性:小米智驾的 XLA 使用了开源跨域具身基座模型 Xiaomi MiMo - Embodied; 具身智能 :(1) 首代机器人 VLA 大模型 Xiaomi-Robotics-0 , 团队仅用 6 个月完成 ;(2)横跨家庭、工业场景,高质量具身数据正在向十万小时稳步迈进 —— 仅用 20 小时数据的极低训练成本,就可以快速掌握耳机收纳的高难度动作;(3)小米判断 机器人的 GPT3 时刻在未来 1-2 年到来 ; 芯片 x AI :主要侧重模型 x 端侧芯片双自研优势持续成长。 Agent 的全场景化 :(1)Miclaw - 当下仍然是测试版, 未来会和小爱做全面融合 ,还在探索更长程的任务执行;(2) 人车家全生态会支持 Miclaw - 平板、笔记本、音箱;(3)智能座舱 Agent 已经正在升级中:能思考、会决策、自己挑工具;(3)Miclaw 也会赋能 Miloco,多模态感知 + 家庭记忆;(4) 未来存在一个中枢,贯通全域设备 —— 共享记忆、跨端调度和主动智能 。 企业效率 x AI :(1)企业效率全面拥抱 Agent, 预计整体效率提升 500% ;(2)场景包括产品变革(生成 Demo)、研发变革(代码和协作)、模式变革等;(3)面向全业务流程构建企业级 Context,驱动组织进化 —— 个人虾和岗位虾,深度赋能核心业务场景。 据IT之家此前报道,代号为“ Hunter Alpha ”的神秘模型 3 月在全球最大 API 聚合平台 OpenRouter 引发热议,一度登上大模型调用榜第一。随后小米正式认领该模型, 宣布推出 MiMo-V2 系列模型 。 4 月 23 日,小米宣布 Xiaomi MiMo-V2.5 系列模型正式开启公测 ,新模型拥有更强的推理、更稳的 Agent、更长的上下文、更强的指令遵循与模糊指令理解、更好的全模态感知和理解。 相关阅读: 《 雷军:小米玄戒 O1 芯片已经出货超过一百万颗 》 《 小米汽车明年下半年出海首战欧洲,2028 年上半年进入右舵市场 》

www.ithome.com · 2026-04-27 12:03:32+08:00 · tech

IT之家 4 月 27 日消息,黑芝麻智能昨日正式宣布加入理想星环 OS 开源生态。双方将围绕开源共建展开深度合作,基于黑芝麻智能全系列芯片平台, 对星环 OS 进行深度适配与性能优化 。 IT之家注: 理想星环 OS 是理想汽车自研的面向 AI 智能化的整车操作系统 , 包含智能车控、智能驾驶、通信中间件及信息安全系统四大核心支柱 ,具备资源池化共享、软硬深度解耦及多架构灵活适配等核心技术特征。 该操作系统研发于 2021 年启动,投入 200 名研发人员、10 亿人民币。理想汽车创始人、董事长兼首席执行官李想认为,汽车操作系统是汽车行业智能化下半场的中枢,也是通往高阶智能体的基座。 作为本次合作的核心技术底座,黑芝麻智能提供全系列芯片算力平台,旗下华山、武当两大芯片家族覆盖从辅助驾驶、智能座舱到跨域融合的全场景计算需求。 根据合作规划, 理想星环 OS 开源生态的开发板将采用黑芝麻智能芯片平台 ,黑芝麻智能将基于自身全系列芯片平台的软件进行开源,与星环 OS 社区深度协同、共建共享。

www.ithome.com · 2026-04-27 10:22:01+08:00 · tech

IT之家 4 月 27 日消息,TOPC 与开源宇宙上周正式开启了 MCIO 接口迷你主机与显卡坞的生态,而在今日 GPD(中软赢科)也宣布了两款采用 MCIO 接口的产品。 GPD BOX 迷你主机将 基于英特尔酷睿 Ultra 300 "Panther Lake" 处理器 ,提供 PCIe Gen5 ×8 带宽的 MCIO 8i 接口,还拥有 2 个 USB4 v2 (80Gbps) 接口。 而 GPD G2 则 号称全球首个 MCIO + USB4 v2 双接口 eGPU 扩展坞 ,搭配 GeForce RTX 4090 显卡性能损失仅 2%。同时其配备 M.2 SSD 盘位,支持 100W PD-out 电力输出。 相关阅读: 《 TOPC 推出全球首款 MCIO 接口迷你主机 TA255 》

www.ithome.com · 2026-04-27 08:35:46+08:00 · tech

IT之家 4 月 27 日消息,小米于今年 2 月对外 发布并开源 VLA 模型 Xiaomi-Robotics-0 ,模型发布首月在 HuggingFace 全球 VLA 模型下载榜获第六名。 小米今日宣布,为了让其真正成为“开箱即用”的生产力利器,带来新的能力演示并正式发布 Xiaomi-Robotics-0 真机后训练(Post-training)全流程 。 基于预训练基座,小米称仅利用 20 小时的任务数据进行真机后训练,便让 Xiaomi-Robotics-0 掌握了“将耳机收纳进耳机盒”这一高难度动作,并能够连续丝滑地完成多个耳机的收纳。 官方表示,该任务涉及两大核心挑战: 耳机与槽位间公差极小,模型必须达到亚毫米级的空间感知精度,才能完成精准对位。 耳机与盒体表面粗糙度最低至 Ra0.03μm,极易在触碰过程发生位移,模型必须能快速修正动作偏差,避免装配失败。 IT之家附相关链接如下: 技术官网 : https://robotics.xiaomi.com 技术报告 : https://arxiv.org/abs/2602.12684 项目网站 : https://robotics.xiaomi.com/xiaomi-robotics-0.html 模型权重 : https://huggingface.co/XiaomiRobotics 开源代码 : https://github.com/XiaomiRobotics/Xiaomi-Robotics-0

www.ithome.com · 2026-04-24 10:59:09+08:00 · tech

IT之家 4 月 24 日消息,今天上午,DeepSeek-V4 模型预览版正式上线并同步开源。 DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本: 即日起登录官网 chat.deepseek.com 或官方 App , 即可与最新的 DeepSeek-V4 对话,探索 1M 超长上下文记忆的全新体验。API 服务已同步更新,通过修改 model_name 为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。 DeepSeek-V4 模型开源链接: https://huggingface.co/collections/deepseek-ai/deepseek-v4 https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4 DeepSeek-V4 技术报告: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf IT之家附两款模型的官方介绍如下: DeepSeek-V4-Pro Agent 能力大幅提高: 相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异。目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。 丰富的世界知识: DeepSeek-V4-Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。 世界顶级推理性能: 在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。 DeepSeek-V4-Flash 相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。 在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上与 DeepSeek-V4-Pro 旗鼓相当,但在高难度任务上仍有差距。 DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。 从现在开始,1M(一百万)上下文 将 是 DeepSeek 所有 官方 服务的标配。 DeepSeek-V4 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。下图为 V4-Pro 在某 Agent 框架下生成的 PPT 内页示例: V4-Pro 与 V4-Flash 最大上下文长度为 1M , 均同时支持 非思考模式 与 思考 模式 ,其中思考模式支持 reasoning_effort 参数设置思考强度(high / max)。对于复杂的 Agent 场景建议使用思考模式,并设置强度为 max。 旧有的 API 接口的两个模型名 deepseek-chat 与 deepseek-reasoner 将于三个月后(2026-07-24)停止使用。当前阶段内,这两个模型名分别指向 deepseek-v4-flash 的非思考模式与思考模式 。

www.ithome.com · 2026-04-24 10:51:07+08:00 · tech

IT之家 4 月 24 日消息,开源网络工具 cURL 开发者 Daniel Stenberg 于 4 月 22 日发布博文, 指出 AI 生成的漏洞报告已从“垃圾信息”演变为“高质量混乱”。 IT之家曾于今年 1 月报道, Stenberg 指出因 cURL 安全漏洞赏金项目(cURL Bug Bounty)持续收到大量 AI 生成的虚假漏洞报告 ,于 2 月 1 日终止这项赏金项目。 Stenberg 在最新博文中指出,在终止赏金项目,转回 Hackerone 平台后,安全报告提交频率不降反升,达到 2025 年的 2 倍。他用“高质量混乱”定义这一新阶段: 虽然 AI 生成的报告质量大幅提升,但提交频率的激增正将开源维护者推向超负荷边缘。 Stenberg 表示在 2020 至 2024 年间,平均每 100 小时才有一次漏洞提交。2025 年这一间隔缩短至 50 小时以内。进入 2026 年,提交间隔已跌破 25 小时。这意味着维护者几乎每天都要处理新的报告,工作量呈指数级增长。 尽管数量激增,报告的有效性却未降反升。2025 年初,被确认为真实安全问题的比例曾从 13% 跌至 5%。然而近期该数据强劲反弹,目前已接近 16%,甚至超过了 2024 年的水平。这表明 AI 工具在漏洞挖掘领域的准确度正在显著优化,不再单纯制造垃圾信息。 Stenberg 认为 AI 工具已成为安全报告的标准配置,虽然报告者鲜少提及具体工具,但从措辞和重复度可明确辨识 AI 痕迹。与 2025 年初的低质“AI 垃圾”不同,现在的 AI 辅助报告质量极高。 更严峻的风险在于攻防时间差。Stenberg 警告称,恶意攻击者同样可以使用这些 AI 工具快速发现漏洞。在维护者修复问题之前,攻击者可能已经利用漏洞发起攻击。

www.ithome.com · 2026-04-24 09:45:09+08:00 · tech

IT之家 4 月 24 日消息,开源启动盘制作工具 Ventoy 最新发布 1.1.12 版本,针对 Windows 10、Windows 11 用户, 主要修复了 VirtualBox UEFI 中的显示问题,以及 UEFI 启动 Windows / WinPE 分辨率问题。 Ventoy 针对 Linux 平台,主要修复了 Ubuntu 24.04.4 安装失败以及 Oracle Linux 6.9 安装问题。 IT之家注:Ventoy 是一款与 Rufus 类似的开源启动盘制作工具,首个版本于 2020 年 4 月发布,在过去 6 年间版本持续更迭,成为不少用户首选的装机工具。 该工具的亮点是简化可引导介质的创建流程,用户无需反复格式化,只需将 ISO、WIM、IMG 等镜像文件拷贝至 U 盘,即可通过内置菜单引导启动。 该工具兼容 BIOS 和 UEFI 双模式,支持 Windows 及主流 Linux 发行版,允许单盘存储多个镜像,适用于系统测试、维护与安装场景。 参考 Ventoy 1.1.12

www.ithome.com · 2026-04-24 09:27:31+08:00 · tech

IT之家 4 月 24 日消息,科技媒体 WinAero 昨日(4 月 23 日)发布博文,报道称独立开发者 Hailey Somerville 上线推出 WSL9x 工具包, 可以在 Windows 95、Windows 98 以及 Windows ME 系统上,运行现代 Linux 内核。 该开源项目名为 Windows 9x Subsystem for Linux,使用 C 语言和汇编语言编写,源代码已按 GPLv3 协议开源。 不同于 Windows 10、Windows 11 系统中的 WSL2 架构,WSL9x 不依赖虚拟化技术,而是让 Linux 内核在 ring 0 保护层级与 Windows 内核直接并行运行。通过这项架构设计,用户可以在搭载 Intel i486 处理器的老旧系统上,不依赖虚拟化支持运行软件。 项目使用修改版的 Linux 6.19 内核(专为 User-mode Linux 构建),为简化两个操作系统间的通信,开发者将翻译层的 POSIX(可移植操作系统接口)API 调用替换为 Windows 9x 内核 API 调用。 此外该工具核心操作由专用 VxD(虚拟设备驱动程序)驱动管理,负责初始化环境、将 Linux 内核加载至系统内存、调度中断及切换控制权。 驱动采用协作式多任务模式维持环境间稳定性,并处理用户空间事件,如系统调用执行和页面错误管理。由于 Windows 9x 内核缺乏中断向量表,开发者利用通用保护故障处理器拦截 SYSCALL 指令执行时的异常。 IT之家附上参考地址 WSL9x