Flash - WWW.AWTEY.CN - WWW.AWTEY.CN

ASUSTOR 预热 Flashstor Gen3 全闪 NAS，用上 8640U

www.ithome.com · 2026-04-30 09:37:08+08:00 · tech

IT之家 4 月 30 日消息，ASUSTOR（华芸 / 爱速特）昨日发布 COMPUTEX 2026 台北国际电脑展预热，宣布将推出新一代全闪存 NAS 产品 Flashstor Gen3 (FS8) 。该系列总共包括 2 款产品，分别是 Flashstor 6 Gen3 (FS806X1) 和 Flashstor 12 Pro Gen3 (FS812X1)，均搭载 AMD 锐龙 5 PRO 8640U 处理器，提供 16 TOPs 的 NPU AI 算力，为本地运行边缘计算、智能影像识别工作负载提供支持。 Flashstor Gen3 (FS8) 系列分别具有 6 / 12 个 M.2 NVMe SSD 盘位，至高支持 PCIe Gen4，还提供 USB4、HDMI 等接口；同时其支持双 USB 网络直连，可提供超越 10GbE 的传输效率。 ASUSTOR 同期也将带来新一代 12 盘位存储扩充设备 Xpanstor 12R Gen2 (AX7112R)。其配备 2 颗 550W 白金效率冗余电源和热插拔风扇，支持双路径串联模式，可为 Lockerstor R Pro Gen2 (AS72) 系列 NAS 提供大量额外存储空间。

科大讯飞星火 X2-Flash 模型发布：基于华为昇腾 910B 集群训练，最大 256K 上下文

www.ithome.com · 2026-04-29 15:09:05+08:00 · tech

IT之家 4 月 29 日消息，科大讯飞星火 X2-Flash 模型今日正式发布，同步开放 API。星火 X2-Flash 采用 MoE 架构，总参数 30B，最大支持 256K 上下文，宣称在智能体、代码等能力上实现了大幅提升，基于华为昇腾 910B 集群训练完成。目前，AstronClaw、Loomy 已率先接入星火 X2-Flash。科大讯飞表示，经 AstronClaw 实测，星火 X2-Flash 在深度研究报告、Skill 管理与调用、系统控制与执行等多类“养龙虾”最常用的任务上效果接近业界万亿级参数模型效果；在相同工作流下，整体 token 消耗不到当前主流大尺寸模型的三分之一，降低了开发者构建复杂 Agent 应用的使用成本。以创建一个复杂的视频生成 Skill 为例，星火 X2-Flash 在了解详细需求后快速生成，并给出技能结构、核心功能和使用案例等关于 Skill 的详细说明。科大讯飞介绍称，星火 X2-Flash 率先在国产算力上实现了 DSA（稀疏注意力）与 MTP（多 token 预测）结合的长文本高效训练，上下文拓展至 256K，通过亲和国产芯片的算子和分布式训练策略深度优化实现训练效率相比同规模 A800 集群从 20% 提升到 90%，解决了智能体长上下文在国产芯片训练慢的难题。在智能体强化学习训练场景，星火 X2-Flash 通过上述的算法创新 + 工程创新，大幅提升了采样推理效率，相对于非 DSA 结构的采样解码效率最高可以提升 2 倍以上。该突破，一定程度缓解了 910B 上智能体长交互场景下采样效率过低影响 RL 训练问题，为后续的大规模强化学习对齐训练扫清了算力障碍。星火 X2-flash 已实现了 OpenClaw、Claude Code 等主流 Agent 框架的深度兼容。 IT之家附 API 地址如下： https://xinghuo.xfyun.cn/sparkapi

蚂蚁集团百灵大模型开源 Ling-2.6-flash，提供 BF16、FP8、INT4 等版本

www.ithome.com · 2026-04-29 09:27:20+08:00 · tech

IT之家 4 月 29 日消息，蚂蚁集团旗下的百灵大模型今日宣布， Ling-2.6-flash 正式开源。同步提供 BF16、FP8、INT4 等多个版本，方便开发者根据不同硬件环境、推理成本和部署需求灵活选择。 Ling-2.6-flash 是一款总参数量 104B、激活参数 7.4B 的 Instruct 模型，两周前以 Elephant Alpha 的匿名身份登陆 OpenRouter。官方表示，过去两周里持续收集来自开发者的真实反馈，并针对 Ling-2.6-flash 的使用体验进行了多轮优化，进一步改善了中英文自然切换能力，并提升了其在主流 Coding 框架中的适配效果。据介绍，Ling-2.6-flash 的核心能力体现在三个方面：混合线性架构，释放推理效率：通过引入混合线性架构，模型从底层优化计算效率，在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s ，Prefill 吞吐达到 Nemotron-3-Super 的 2.2 倍 Token 效率优化，提升智效比：在训练过程中对 Token 效率进行了针对性校准，力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中，Ling-2.6-flash 仅消耗 15M tokens ，约为 Nemotron-3-Super 等模型的 1/10 面向 Agent 场景进行定向增强：针对当前需求最旺盛的 Agent 应用，在工具调用、多步规划与任务执行能力上持续打磨，使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中，即使面对激活参数更大的模型，依然能够取得相近甚至 SOTA 级别的表现 IT之家附开源链接如下： Hugging Face ： https://huggingface.co/inclusionAI/Ling-2.6-flash ModelScope ： https://www.modelscope.cn/models/inclusionAI/Ling-2.6-flash

今天起，DeepSeek V4 成 OpenClaw 默认模型

www.ithome.com · 2026-04-26 13:53:25+08:00 · tech

今天，OpenClaw 重磅接入 DeepSeek V4！新版本 OpenClaw 2026.4.24 一发布，随即接入了最新的 DeepSeek V4 双版本 —— V4 Flash 成为默认大模型，V4 Pro 也已上线模型库。从今天起，全球每一个更新 OpenClaw 的人，打开的第一秒钟，跟自己对话的大脑就是 DeepSeek V4 Flash。可以说，DeepSeek V4 的接入，成为了 OpenClaw 更新的最大亮点。一时间，全网激动地都开始跃跃欲试。这一次，OpenClaw 还打通了 Google Meet，实时语音通话让全网震撼。 DeepSeek V4，成为 OpenClaw 默认模型两天前，DeepSeek V4 一声惊雷炸出，全球 AI 圈的人期待已久的开源新王，终于靴子落地。OpenClaw 第一时间接入 DeepSeek V4「双版本」，还把 V4 Flash 设为默认模型。「龙虾」亲手把中国 AI 推向了最 C 位。对普通用户来说，最直接的变化是，上手 OpenClaw 时默认进入 DeepSeek V4 Flash 路线。感受一下 V4 的含金量。 DeepSeek V4 Pro：1.6 万亿总参数，49B 激活参数，MoE 架构，全球最大的开源模型。DeepSeek V4 Flash：284B 总参数，13B 激活参数，同样 MoE 架构。更小、更快、更便宜，但推理能力在 Max 模式下几乎追平 Pro 版本。两个模型都支持 100 万 token 上下文，都采用 MIT 协议完全开源这次更新，还修复了 DeepSeek 在多轮工具调用中的 thinking 和 replay 行为。此前，Agent 在连续调用工具、切换会话模型时，容易因为 reasoning_content 缺失触发 provider replay 检查错误。新版本补齐了相关占位逻辑，让 DeepSeek V4 Flash 和 DeepSeek V4 Pro 在长链路任务里更稳定。这类修复看起来偏工程细节，但对 Agent 产品很关键。 OpenClaw 的核心场景已经不只是聊天，更多时候是让模型连续调用浏览器、会议、语音、文件和插件。模型接入如果停在文本回复层，价值有限。真正影响体验的，是它能否撑住复杂任务链路。龙虾打电话，Google Meet 成内置插件这次更新中，Google Meet 被加入 OpenClaw，成为 bundled participant plugin。新版本支持个人谷歌账号授权、显式会议 URL 加入、Chrome 和 Twilio 实时传输，也支持 paired-node Chrome，用于 Parallels、BlackHole、SoX 这类本地音频与浏览器组合环境。更重要的变化在会议结束后。 OpenClaw 可以处理会议记录、录音、转写、智能笔记和参会人会话，并导出为 Markdown 或其他类型文件。系统还支持查找最新会议记录，以及扫描历史 conference records。这让 OpenClaw 在会议场景中的位置更靠前。它承担的不只是转写，而是会议进入、实时参与、内容沉淀和结果回查。AI 会议助手过去多围绕「记录」展开。OpenClaw 这次把会议变成一个可被 Agent 调用和管理的工作节点。实时语音接入完整 Agent Talk、Voice Call 和 Google Meet 现在都可以使用实时语音循环。这部分更新的重点，是实时语音可以调用完整 OpenClaw Agent。通过 openclaw_agent_consult，电话或会议里的问题可以交给后台 Agent 处理，Agent 再调用工具、查询上下文、组织答案，并用语音返回。 Voice Call 插件新增 setup 和默认 dry-run 的 smoke command，用来在真实拨号前检查 Twilio 或其他 provider 是否准备好。 Google provider 侧新增 Gemini Live 实时语音能力，支持双向音频和函数调用。 Gateway / VoiceClaw 也加入基于 Gemini Live 的 realtime brain WebSocket endpoint，并通过 owner-auth 做权限限制。这说明 OpenClaw 正在把语音做成一级入口。文本框之外，电话和会议正在成为 Agent 的运行环境。浏览器自动化，继续补工程短板浏览器自动化是另一个重点。新版本加入 viewport coordinate clicks，支持 managed automation 和 existing-session automation，CLI 侧也新增 openclaw browser click-coords。网页控件无法稳定识别时，坐标点击提供了兜底方案。默认 action budget 被延长到 60 秒，减少长等待被误判失败的情况。浏览器 profile 也支持单独设置 headless，一个 profile 可以无头运行，其他 profile 不受影响。 Google Meet 相关修复也集中在浏览器稳定性上。新版本可以复用已经打开的 Meet 标签页，浏览器超时后尝试恢复，还能识别登录、权限、麦克风选择等人工阻塞点。这些改动不容易成为传播点，但会影响 Agent 是否能持续工作。浏览器 Agent 的问题经常出在标签页、权限、等待时间和恢复机制上。插件和模型架构变轻 OpenClaw 同时在降低启动负担。模型列表改用静态目录，减少默认 models list 时的 registry 枚举。模型目录加入 manifest-sourced model rows，让 provider index、cache、onboarding 和 listing 可以在不加载 provider runtime 的情况下工作。插件侧也在做类似调整：modelCatalog、channelConfigs、 setup.providers 等信息更多从 manifest 暴露，descriptor-only setup contract 也变得更明确。随着 Google Meet、Voice Call、PDF、Anthropic Vertex、Bonjour 等能力插件化，启动时加载全部 runtime 会拖慢系统。新版本把描述信息前置，把运行时依赖后置。这是一种典型的工程取舍，牺牲一点早期兼容便利，换取更轻的启动路径和更清晰的插件边界。 SDK 发生破坏性变化此次更新还有一项破坏性变动： OpenClaw 移除了 Pi-only 的 api.registerEmbeddedExtensionFactory (...) 兼容路径。之后 bundled tool-result rewrites 需要使用 api.registerAgentToolResultMiddleware (...)，并在 contracts.agentToolResultMiddleware 中声明目标 harness。这会影响插件开发者。官方希望工具结果转换在 Pi 和 Codex app-server dynamic tools 中保持一致，旧接口需要迁移。相应地，OpenClaw 增加了插件兼容性 registry 和迁移记录，用来管理 SDK、配置、setup 和 runtime 的弃用路径。这背后是 OpenClaw 在整理早期快速扩张留下的接口债务。 OpenClaw 的方向更清楚了这次更新覆盖模型、会议、语音、浏览器、插件、诊断、TTS、Slack、Telegram 和 MCP 等模块。 DeepSeek V4 进入默认模型路径，解决的是模型能力；Google Meet 和 Voice Call 强化的是协作入口；浏览器自动化、插件懒加载和 SDK 迁移，补的是复杂任务运行时的工程底座。 OpenClaw 正在从聊天产品走向工作流系统。参考资料： https://github.com/openclaw/openclaw/releases/tag/v2026.4.24 本文来自微信公众号：新智元（ID：AI_era），作者：新智元

蚂蚁集团百灵大模型 Ling-2.6-flash 发布，匿名上线一周日均 tokens 调用达 100B 级

www.ithome.com · 2026-04-22 10:00:57+08:00 · tech

IT之家 4 月 22 日消息，蚂蚁集团旗下的百灵大模型今日宣布，推出一款总参数量 104B 、激活参数 7.4B 的 Instruct 模型 Ling-2.6-flash 。一周前，代号为 Elephant Alpha 的匿名模型登陆 OpenRouter。上线以来，其调用量持续增长，连续多日位列 Trending 榜首，日均 tokens 调用量达 100B 级别。百灵大模型今日宣布 Elephant Alpha 正是百灵模型 Ling-2.6-flash 的匿名测试版本。官方表示，面对持续攀升的 Token 压力，Ling-2.6-flash 选择了一条不同的技术路径：不是单纯依赖更长输出换取更高分数，而是围绕推理效率、Token 效率与 Agent 场景表现进行系统性优化，在保持竞争力智能水平的同时，尽可能做到更快、更省和更适合真实业务场景。 Ling-2.6-flash 的核心能力体现在三个方面：混合线性架构，释放推理效率：通过引入混合线性架构，模型从底层优化计算效率，在 4 卡 H20 条件下推理速度最快可达到 340 tokens/s ，Prefill 吞吐达到 Nemotron-3-Super 的 2.2 倍 Token 效率优化，提升智效比：在训练过程中对 Token 效率进行了针对性校准，力求以更精简的输出完成既定目标。在 Artificial Analysis 的完整评测中，Ling-2.6-flash 仅消耗 15M tokens ，约为 Nemotron-3-Super 等模型的 1/10 面向 Agent 场景进行定向增强：针对当前需求最旺盛的 Agent 应用，在工具调用、多步规划与任务执行能力上持续打磨，使模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等评测中，即使面对激活参数更大的模型，依然能够取得相近甚至 SOTA 级别的表现 ▲ Ling-2.6-flash 在 Agent 相关基准上达到同尺寸 SOTA 水平为方便更多开发者快速体验 Ling-2.6-flash，百灵大模型将在 OpenRouter 与官方平台同步提供一周免费 API 调用。免费期结束后，将按使用量计费：输入 0.1 美元 / 百万 tokens，输出 0.3 美元 / 百万 tokens，缓存命中 0.02 美元 / 百万 tokens（按 20% 计费）。 Ling-2.6-flash 官方 API 服务也已正式开放，官方免费期结束后，平台仍将提供每日 50 万 tokens 免费额度；超出部分按量计费：输入 0.6 元 / 百万 tokens，输出 1.8 元 / 百万 tokens。 IT之家注意到，官方表示，模型的 BF16、FP8、INT4 等版本也将于近期正式开源。

PPIO首批上线DeepSeek-V4

36kr.com · None · tech

4月24日，DeepSeek-V4预览版正式推出并开源，包含DeepSeek-V4-Pro和DeepSeek-V4-Flash两个版本。中国全栈式AI云服务商PPIO第一时间全量首批上线，成为业内首批上线DeepSeek-V4的AI云平台之一。目前，DeepSeek-V4-Pro和DeepSeek-V4-Flash均已同步上线PPIO官网。

DeepSeek官网公布DeepSeek-v4接口文档

36kr.com · None · tech

36氪获悉，DeepSeek官网上线DeepSeek-v4接口和模型介绍，包括Deepseek-v4-flash和DeepSeek-v4-pro。

蚂蚁百灵Ling-2.6-flash正式发布，定价每百万token 0.1美元

36kr.com · None · tech

4月22日，蚂蚁百灵正式推出Ling-2.6-flash——一款总参数量104B、激活参数7.4B的Instruct模型。该模型在BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench等Agent相关基准上达到同尺寸SOTA水平。 API定价方面，Ling-2.6-flash输入每百万tokens定价0.1美元，输出 0.3 美元。目前，Ling-2.6-flash的API已正式向用户开放，并提供为期一周的限时免费试用。Ling-2.6-flash上线以来，日均tokens调用量达100B级别，周增长超5000%。

/tag/Flash