WWW.AWTEY.CN
标签聚合 V4

/tag/V4

www.ithome.com · 2026-05-06 19:27:06+08:00 · tech

IT之家 5 月 6 日消息,微软威胁情报团队在领英发布警告称,目前有不少黑客冒充 DeepSeek V4 模型名义,在 GitHub 创建虚假仓库,诱导用户下载所谓“模型文件”,相应“模型文件”实为 Vidar、GhostSocks 等木马。 微软指出,此次事件属于“蹭热点”攻击,黑客只是借用 DeepSeek 名称作为诱饵进行钓鱼,DeepSeek 官方代码和账号本身并未被入侵。官方强调,DeepSeek V4 是通过 API 和 Hugging Face 发布,并没有在 GitHub 上提供模型仓库。如果用户通过“DeepSeek v4 weights GitHub”等关键词搜索,很可能会优先看到这些恶意仓库及其分支版本。 从整体来看,如今黑客正大肆利用热门 AI 模型名义传播恶意软件,用户在下载相关资源时需要格外谨慎。目前 GitHub 已关闭部分恶意仓库并封禁账号,以防止恶意内容进一步传播。

www.ithome.com · 2026-04-29 22:04:58+08:00 · tech

IT之家 4 月 29 日消息,华为官方今日宣布,鸿蒙“龙虾”小艺 Claw 迎来重磅更新, 上线“自进化”能力 。在 11.6.3.300 新版本上线后,对小艺提出“记住这种风格”、“以后都用这种格式”、“永远都不要犯这种错”这类要求时, 它会识别并学习长期偏好,可减少重复沟通 。 另外, 小艺 Claw 正式接入 DeepSeek V4 。新版本上线后,小艺 Claw 支持百万级超长上下文处理,可一次性读取并理解更长材料。同时,小艺 Claw 理解能力也得到提升, 在信息搜集、文档处理、内容创作等任务中有更强的 Agent 推理能力 。 IT之家注意到,小艺 App 更新 11.6.3.300 新版本后,还引入了社区精选技能与鸿蒙生态伙伴官方技能,覆盖金融专区、办公创作、生活助手和专业开发领域。 另据IT之家此前报道,华为鸿蒙“龙虾”小艺 Claw 获信通院首个终端厂商权威安全认证, 成为首个获国家级智库认证的终端厂商 Claw 类智能体 。 目前,支持小艺 Claw 的小艺 App 已开启尝鲜升级。根据官方介绍,小艺 Claw 支持开箱即用,可一键唤醒;支持自我学习、深度记忆,可不断进化;支持多端协同,可与鸿蒙多设备互动,如便捷管理手机的日程、备忘录等;支持端云协同,拥有鸿蒙系统级安全加固。

www.ithome.com · 2026-04-28 12:56:13+08:00 · tech

IT之家 4 月 28 日消息,DeepSeek 官网“悄悄”更新了 API 文档。相关页面显示 DeepSeek 旗舰级大模型 DeepSeek-V4-Pro 的 2.5 折优惠活动 将延长至今年 5 月 31 日 23:59 ( 此前优惠活动持续至 5 月 6 日 )。 (1) deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。 (2) 全系列模型,输入缓存命中的价格已降至首发价格的 1/10,该价格调整自北京时间 2026/4/26 20:15 起生效。 (3) 当前 deepseek-v4-pro 模型 2.5 折,优惠期延长至北京时间 2026/05/31 23:59。 目前, DeepSeek-V4-Pro 的输入价格(缓存命中)低至 0.025 元(每百万 tokens) ,输入价格(缓存未命中)为 3 元,输出价格为 6 元。 DeepSeek-V4-Pro 模型采用了业界领先的混合专家(MoE)架构,其总参数量达到 1.6 万亿,单次激活参数约为 490 亿。除了海量的参数,该模型还全面支持百万级别的超长上下文窗口。 DeepSeek 方面已经确认,受限于高端算力,目前 Pro 版本的服务吞吐较为有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格还将大幅下调。IT之家此前报道, 昇腾超节点全系列产品也已全面支持 DeepSeek-V4 系列模型 。 相关阅读: 《 迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 》 《 寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行 》 《 华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务 》 《 摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配 》 《 英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user 》 《 (更新:缓存命中输入价格降至首发价 1/10)DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前 》 《 华为:昇腾超节点系列产品全面支持 DeepSeek V4 》

www.ithome.com · 2026-04-28 10:25:08+08:00 · tech

IT之家 4 月 28 日消息,据每日经济新闻报道,DeepSeek 上周发布长达 58 页的 V4 技术报告,一份近 300 人的“研究与工程”作者名单引发关注。 创始人梁文锋与所有研究员、工程师并列署名。 名单中 10 人标注“已离职” ,其中不乏王炳宣、魏浩然、郭达雅等核心骨干成员。据报道,2025 年下半年至今,DeepSeek 至少 5 名核心研发成员确认离职。 ▲ 带星号 * 的代表已离开 DeepSeek 团队 报道提到,DeepSeek 第一代大语言模型核心作者王炳宣去了腾讯,V2 核心贡献者罗福莉去了小米,R1 核心研究员郭达雅入职字节跳动 Seed 团队,多模态技术核心研究员阮翀也离职加入自动驾驶科技公司元戎启行,OCR 系列核心作者魏浩然也离职去向暂未披露,这些核心研发成员覆盖了基座模型、推理、OCR、多模态四条核心技术主线。 作为由量化私募巨头幻方量化于 2023 年孵化的人工智能公司,DeepSeek 凭借 DeepSeek-V3 和 DeepSeek-R1 等模型的开源与卓越性能,在 2025 年一度成为全球 AI 领域的技术标杆。 据IT之家 4 月 24 日报道, DeepSeek-V4 模型预览版正式上线并同步开源 。DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。

www.ithome.com · 2026-04-27 14:55:31+08:00 · tech

IT之家 4 月 27 日消息,今天下午,中国信通院通过公众号宣布:为推动 DeepSeekV4 与国产软硬件的深度适配,加速技术协同优化及产业应用落地,中国信息通信研究院联合人工智能软硬件协同创新与适配验证中心, 正式启动 DeepSeekV4 国产化适配测试工作 。 根据介绍,以大模型为代表的人工智能已成为引领科技变革与产业升级的核心力量,国产大模型迭代速度持续加快,对人工智能软硬件协同创新的要求日益增强。日前,DeepSeek 全新一代模型 DeepSeek V4 正式发布并同步开源。发布当日,多家国产硬件厂商 开展“0day 适配” ,国产 AI 软硬件进入“同频迭代、无缝衔接”的新阶段,也进一步凸显了软硬件协同优化的重要性。 IT之家从公告获悉,本次适配测试依托人工智能大模型及软硬件评测工业和信息化部重点实验室,以及 AISHPerf(Performance Benchmarks of Artificial Intelligence Software and Hardware)人工智能软硬件基准体系及测试工具,面向 芯片、服务器、一体机、集群、开发框架及工具链、智算设施及平台 等人工智能软硬件产品及系统开展。 测试覆盖 DeepSeek V4 全系列模型,聚焦推理、微调等流程,从适配易用性、功能完备性、优化效果、性能指标、成本等维度开展评估,结合模型技术特性,新增长序列处理、代码生成与理解、智能体调用成功率和任务拆解能力等测评方向,形成立体化评测体系,全面检验适配水平。

www.ithome.com · 2026-04-27 12:18:33+08:00 · tech

IT之家 4 月 27 日消息,腾讯云官方今日宣布 QClaw 发布 v0.2.14 版本更新。据介绍,这是该项目迄今为止力度最大的一次版本更新。 本次升级中,QClaw 正式接入支持 Hermes 框架,用户可创建并运行 Hermes 类型的 Agent,实现单一应用内同时运行两种 Agent 内核。 在此次更新中,原有的“灵感广场”功能全面升级为“专家广场”。新版本内置了超过 100 个按行业和场景分类的 AI 专家,用户选择对应领域的专家后,只需用自然语言描述需求,专家即可直接生成可用的文档、报告、代码或分析结论。每个专家都拥有独立的人设与隔离的会话空间,交互流程简化为“选专家、说需求、拿结果”三步,用户无需了解 Prompt、Skill 或 Agent 的概念,也无需进行额外配置或训练。首期上线的专家覆盖内容创作、数据分析、代码开发等多个领域。 远程操控方面,QClaw 的微信小程序同步升级,新增语音交互与文件共享功能。用户可通过微信小程序「QClaw 管家」以语音方式远程下达指令,并支持将文件分享给好友。此外,小程序还支持一键绑定用户在 Lighthouse 云服务器上已购买的云端 Agent 实例。完成绑定后,本地和云端的 Agent 可在小程序中统一管理和调度,用户即使不在电脑前也能远程执行任务。 底层模型方面,QClaw 从固定使用模式升级为自由切换模式。用户可选择系统智能匹配模型,也可手动指定。目前已支持的模型包括 Hy 3 preview、DeepSeek-V4 Pro、KIMI-K2.6 及 GLM-5.1。其中,Hy 3 preview 是腾讯混元重建后训练的首个模型,为快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。IT之家注意到,DeepSeek-V4 Pro 则是 DeepSeek 于 4 月 24 日发布的开源模型,总参数 1.6T,激活参数 49B,上下文长度达 1M。与此同时,积分统计体系也从原有的 Token 计数改为按任务类型和所用模型匹配积分额度。 连接器方面,本次更新新增了对百度网盘、携程、飞猪和腾讯新闻四个平台的接入支持。用户可通过对应的连接器让 Agent 访问百度网盘中的文件、查询携程和飞猪上的行程信息,以及获取腾讯新闻的内容摘要。 此外,QClaw 还上线了基于腾讯文档的 Agent 团队协作功能,团队成员之间可以通过腾讯文档指挥 Agent 共同编辑同一份文档,实现团队协作。

www.ithome.com · 2026-04-26 13:53:25+08:00 · tech

今天,OpenClaw 重磅接入 DeepSeek V4!新版本 OpenClaw 2026.4.24 一发布,随即接入了最新的 DeepSeek V4 双版本 —— V4 Flash 成为默认大模型,V4 Pro 也已上线模型库。 从今天起,全球每一个更新 OpenClaw 的人,打开的第一秒钟,跟自己对话的大脑就是 DeepSeek V4 Flash。 可以说,DeepSeek V4 的接入,成为了 OpenClaw 更新的最大亮点。一时间,全网激动地都开始跃跃欲试。 这一次,OpenClaw 还打通了 Google Meet,实时语音通话让全网震撼。 DeepSeek V4,成为 OpenClaw 默认模型 两天前,DeepSeek V4 一声惊雷炸出,全球 AI 圈的人期待已久的开源新王,终于靴子落地。OpenClaw 第一时间接入 DeepSeek V4「双版本」,还把 V4 Flash 设为默认模型。「龙虾」亲手把中国 AI 推向了最 C 位。 对普通用户来说,最直接的变化是,上手 OpenClaw 时默认进入 DeepSeek V4 Flash 路线。 感受一下 V4 的含金量。 DeepSeek V4 Pro:1.6 万亿总参数,49B 激活参数,MoE 架构,全球最大的开源模型。DeepSeek V4 Flash:284B 总参数,13B 激活参数,同样 MoE 架构。更小、更快、更便宜,但推理能力在 Max 模式下几乎追平 Pro 版本。两个模型都支持 100 万 token 上下文,都采用 MIT 协议完全开源 这次更新,还修复了 DeepSeek 在多轮工具调用中的 thinking 和 replay 行为。 此前,Agent 在连续调用工具、切换会话模型时,容易因为 reasoning_content 缺失触发 provider replay 检查错误。 新版本补齐了相关占位逻辑,让 DeepSeek V4 Flash 和 DeepSeek V4 Pro 在长链路任务里更稳定。这类修复看起来偏工程细节,但对 Agent 产品很关键。 OpenClaw 的核心场景已经不只是聊天,更多时候是让模型连续调用浏览器、会议、语音、文件和插件。模型接入如果停在文本回复层,价值有限。真正影响体验的,是它能否撑住复杂任务链路。 龙虾打电话,Google Meet 成内置插件 这次更新中,Google Meet 被加入 OpenClaw,成为 bundled participant plugin。 新版本支持个人谷歌账号授权、显式会议 URL 加入、Chrome 和 Twilio 实时传输,也支持 paired-node Chrome,用于 Parallels、BlackHole、SoX 这类本地音频与浏览器组合环境。 更重要的变化在会议结束后。 OpenClaw 可以处理会议记录、录音、转写、智能笔记和参会人会话,并导出为 Markdown 或其他类型文件。 系统还支持查找最新会议记录,以及扫描历史 conference records。 这让 OpenClaw 在会议场景中的位置更靠前。它承担的不只是转写,而是会议进入、实时参与、内容沉淀和结果回查。AI 会议助手过去多围绕「记录」展开。OpenClaw 这次把会议变成一个可被 Agent 调用和管理的工作节点。 实时语音接入完整 Agent Talk、Voice Call 和 Google Meet 现在都可以使用实时语音循环。 这部分更新的重点,是实时语音可以调用完整 OpenClaw Agent。 通过 openclaw_agent_consult,电话或会议里的问题可以交给后台 Agent 处理,Agent 再调用工具、查询上下文、组织答案,并用语音返回。 Voice Call 插件新增 setup 和默认 dry-run 的 smoke command,用来在真实拨号前检查 Twilio 或其他 provider 是否准备好。 Google provider 侧新增 Gemini Live 实时语音能力,支持双向音频和函数调用。 Gateway / VoiceClaw 也加入基于 Gemini Live 的 realtime brain WebSocket endpoint,并通过 owner-auth 做权限限制。 这说明 OpenClaw 正在把语音做成一级入口。文本框之外,电话和会议正在成为 Agent 的运行环境。 浏览器自动化,继续补工程短板 浏览器自动化是另一个重点。新版本加入 viewport coordinate clicks,支持 managed automation 和 existing-session automation,CLI 侧也新增 openclaw browser click-coords。 网页控件无法稳定识别时,坐标点击提供了兜底方案。默认 action budget 被延长到 60 秒,减少长等待被误判失败的情况。浏览器 profile 也支持单独设置 headless,一个 profile 可以无头运行,其他 profile 不受影响。 Google Meet 相关修复也集中在浏览器稳定性上。新版本可以复用已经打开的 Meet 标签页,浏览器超时后尝试恢复,还能识别登录、权限、麦克风选择等人工阻塞点。 这些改动不容易成为传播点,但会影响 Agent 是否能持续工作。浏览器 Agent 的问题经常出在标签页、权限、等待时间和恢复机制上。 插件和模型架构变轻 OpenClaw 同时在降低启动负担。模型列表改用静态目录,减少默认 models list 时的 registry 枚举。 模型目录加入 manifest-sourced model rows,让 provider index、cache、onboarding 和 listing 可以在不加载 provider runtime 的情况下工作。 插件侧也在做类似调整:modelCatalog、channelConfigs、 setup.providers 等信息更多从 manifest 暴露,descriptor-only setup contract 也变得更明确。 随着 Google Meet、Voice Call、PDF、Anthropic Vertex、Bonjour 等能力插件化,启动时加载全部 runtime 会拖慢系统。 新版本把描述信息前置,把运行时依赖后置。这是一种典型的工程取舍,牺牲一点早期兼容便利,换取更轻的启动路径和更清晰的插件边界。 SDK 发生破坏性变化 此次更新还有一项破坏性变动: OpenClaw 移除了 Pi-only 的 api.registerEmbeddedExtensionFactory (...) 兼容路径。 之后 bundled tool-result rewrites 需要使用 api.registerAgentToolResultMiddleware (...),并在 contracts.agentToolResultMiddleware 中声明目标 harness。 这会影响插件开发者。 官方希望工具结果转换在 Pi 和 Codex app-server dynamic tools 中保持一致,旧接口需要迁移。 相应地,OpenClaw 增加了插件兼容性 registry 和迁移记录,用来管理 SDK、配置、setup 和 runtime 的弃用路径。 这背后是 OpenClaw 在整理早期快速扩张留下的接口债务。 OpenClaw 的方向更清楚了 这次更新覆盖模型、会议、语音、浏览器、插件、诊断、TTS、Slack、Telegram 和 MCP 等模块。 DeepSeek V4 进入默认模型路径,解决的是模型能力;Google Meet 和 Voice Call 强化的是协作入口;浏览器自动化、插件懒加载和 SDK 迁移,补的是复杂任务运行时的工程底座。 OpenClaw 正在从聊天产品走向工作流系统。 参考资料: https://github.com/openclaw/openclaw/releases/tag/v2026.4.24 本文来自微信公众号: 新智元(ID:AI_era) ,作者:新智元

www.ithome.com · 2026-04-26 11:33:06+08:00 · tech

IT之家 4 月 26 日消息,今日,国家超算互联网推出 DeepSeek-V4 限时免费对话服务。企业、科研机构及个人开发者只需登录超算互联网( www.scnet.cn )进入 Chat 页面,即可免费体验 DeepSeek-V4 的百万 Token 超长上下文实时、流畅对话。 IT之家附官方原文如下: 随着 DeepSeek-V4 的发布,百万上下文从大模型的「高端选配」变成了「基础标配」,正式迈入普惠时代。正如官方所说:“从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。” 百万上下文是什么概念?相当于《三体》三部曲的总字数、几十篇累计数万字的参考文献合集、或是你过去一年的工作聊天记录。以前,你需要手动切片、分段提问;现在,直接把全文丢进去,让 DeepSeek-V4 一口气读完,然后为你总结、分析、找 bug—— 它甚至记得最开头的知识点,随时可进行全局思考和深度推理。在此之前,处理 1M 级别的上下文的能力,更多出现在闭源模型的高端版本里,高昂的调用成本,让大多数开发者和中小企业望而却步。 DeepSeek‑V4 的到来,不只是一次模型升级,更是开源大模型进入“百万上下文普惠时代”的分水岭。这与超算互联网始终致力于以惠普算力赋能产业,推动 AI 从“可⽤”⾛向“好⽤”的核⼼理念高度契合。 而此次超算互联网与 DeepSeek-V4 的结合,亦标志着世界顶级大模型与国家级算力基础设施的深度融合。平台通过将复杂的算力资源封装为简单通用的公共服务,大幅降低了大规模 AI 应用的体验门槛与成本,真正赋能千行百业的低成本、规模化数字化转型走向新阶段。 相关阅读: 《 DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前 》 《 迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 》

www.ithome.com · 2026-04-25 22:27:09+08:00 · tech

4 月 26 日 21:00 更新:DeepSeek-V4-Flash / Pro 输入(缓存命中)已降至首发价格的 1/10,分别为 0.02 元(百万 tokens)、0.025 元(百万 tokens)。 IT之家 4 月 25 日消息,DeepSeek 官网刚刚更新了 API 文档。页面宣布旗下新发布的旗舰级大模型 DeepSeek-V4-Pro 开启限时 2.5 折优惠活动。 此次调价后,DeepSeek-V4-Pro 的输入价格(缓存命中)低至 0.25 元(每百万 tokens),输入价格(缓存未命中)为 3 元,输出价格为 6 元。此次优惠活动将持续至北京时间 2026 年 5 月 5 日 23:59。 DeepSeek-V4-Pro 模型采用了业界领先的混合专家(MoE)架构,其总参数量达到 1.6 万亿,单次激活参数约为 490 亿。除了海量的参数,该模型还全面支持百万级别的超长上下文窗口。 DeepSeek 方面已经确认,受限于高端算力,目前 Pro 版本的服务吞吐较为有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格还将大幅下调。IT之家此前报道,昇腾超节点全系列产品也已全面支持 DeepSeek-V4 系列模型。 相关阅读: 《 迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 》 《 寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行 》 《 华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务 》 《 摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配 》 《 英伟达已适配 DeepSeek-V4 AI 模型,GB200 NVL72 开箱性能超 150 tokens / sec / user 》

www.ithome.com · 2026-04-25 17:32:21+08:00 · tech

IT之家 4 月 25 日消息,荣耀官方今日宣布,荣耀 YOYO 成为安卓阵营中首家接入 DeepSeek-V4 大模型的 AI 智能体。 得益于此,荣耀 YOYO 实现三大核心升级:更强性能、更长上下文、更高推理效率。 IT之家提醒:YOYO 智能体版本 90.10.28.041 及以上,MagicOS 8.0 及以上可抢先体验。 相关阅读: 《 荣耀版“龙虾”YOYO Claw 发布:出厂预制 23 个子虾,Token 消耗降低 50% 》 《 荣耀 YOYO Claw PC 版“龙虾”首曝,有望随 MagicBook Pro 14 笔记本一起亮相 》 《 荣耀“龙虾宇宙”官宣:支持 YOYO 龙虾、生态养虾、安全养虾 》 《 荣耀 YOYO 助理接入智能检测,支持自动定位、排查设备问题等 》

www.ithome.com · 2026-04-25 15:36:02+08:00 · tech

IT之家 4 月 25 日消息,英伟达今天(4 月 25 日)发布博文, 宣布其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型 ,开发者可通过 NVIDIA NIM 微服务下载部署,或利用 SGLang 与 vLLM 框架进行定制化推理。 英伟达在博文指出,DeepSeek-V4-Pro 拥有 1.6T 总参数量与 49B 激活参数,定位高级推理任务;DeepSeek-V4-Flash 版本则为 284B 总参数量与 13B 激活参数,主打高速高效场景。 两款模型均支持 100 万 Token 上下文窗口与最高 38.4 万 Token 输出长度,覆盖长文本编码、文档分析等核心应用,并采用 MIT 开源协议。 实测数据显示, DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user ,借助 vLLM 的 Day 0 配方,开发者可在 Blackwell B300 上快速部署。随着 Dynamo、NVFP4 及 CUDA 内核的深度优化,预期性能将进一步提升。 部署生态方面,开发者可通过 NVIDIA NIM 微服务下载部署,或利用 SGLang 与 vLLM 框架进行定制化推理。SGLang 提供低延迟、均衡及最大吞吐量三种配方;vLLM 则支持多节点扩展至 100 个以上 GPU,具备工具调用与推测解码能力。 IT之家附上参考 Build with DeepSeek V4 Using NVIDIA Blackwell and GPU-Accelerated Endpoints

www.ithome.com · 2026-04-25 07:29:34+08:00 · tech

“IT早报”时间,大家好,现在是 2026 年 4 月 25 日星期六,今天的重要科技资讯有: 1、提升 50%,消息称苹果 iPhone 18 标准版配 12GB 内存 半导体产业分析师 Dan Nystedt 4 月 24 日在 X 平台发布推文,指出苹果 iPhone 18 标准版(预估延后至 2027 年发布)将配备 12GB 内存,较当前机型提升 50%。>> 查看详情 2、迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。>> 查看详情 3、OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍 OpenAI 公司 4 月 24 日宣布推出 GPT-5.5 模型,是其迄今最智能、最直观的 AI 模型,在 Agentic Coding、计算机使用及科研领域表现卓越,相比较 GPT-5.4,在完成相同任务的情况下减少词元(Token)消耗。>> 查看详情 4、2026 北京车展 4 月 24 日开幕:规模跃居全球首位,首发车 181 台 2026 北京国际汽车展览会 4 月 24 日正式开幕,总展出面积达 38 万平方米,规模跃居全球车展首位。本届展会汇聚了 BMW、奔驰、奥迪、丰田、比亚迪、小米等国内外主流及新能源品牌,共展出 1451 台展车,其中首发车 181 台,概念车 71 台。展会为期 10 天,将举办 219 场新闻发布会。>> 查看详情 5、超千匹马力、300km/h 极速,雷军宣布小米 YU7 GT 新车 5 月底见 在 4 月 24 日上午的小米汽车北京国际车展发布会上,雷军宣布:小米 YU7 GT 将于 5 月底正式发布。>> 查看详情 6、OPPO 法务部:警惕低价购机诈骗陷阱,拒绝一切脱离官方平台担保的私下交易 OPPO 公司法务部 4 月 24 日发文提醒,警惕低价购机诈骗陷阱。>> 查看详情 7、未成年退款后又充 5 万再退被拒,游戏客服回应称同一家庭无法进行二次退款申诉 8 岁女孩游戏首次充值 2000 多元获退款后,竟通过同一设备再次充值 5 万元,游戏公司以“同一家庭无法二次申诉”为由拒绝退款,这笔钱几乎耗尽家庭一年半房贷储备。类似纠纷并非个例,湖南也有儿童充值超 3.4 万元。事件暴露了平台审核机制与家庭监管间的协调难题。>> 查看详情 8、小鹏汽车正降低产品更新迭代速度,将更多依靠 OTA 升级来提升产品能力 何小鹏表示:“其实我们在前年底就开始思考如何构建更健康的商业模式,只有这样才能保障持续的科研投入,进而提升产品品质和用户体验,形成良性循环。去年四季度小鹏已经实现了首次盈利,这既是努力的成果,也有一定运气成分,未来我们会追求更高质量的收入和利润。”>> 查看详情 9、2026 五一档电影片单公布:纪录片《登月(第一部)》、动画《猪猪侠大电影》在列 五一档片单正式发布,包括革命历史题材《浴血困牛山》、动作悬疑《寒战 1994》、温情故事《10 间敢死队》、纪录片《登月(第一部)》及动画《猪猪侠大电影》等。多类型影片满足不同观众需求,假期观影选择丰富。>> 查看详情 10、时隔 6 个月,英伟达市值再次突破 5 万亿美元 英伟达股价连续四周上涨,本月累计涨幅高达 18%,推动其总市值时隔六个月后再次站上 5 万亿美元大关。上一次突破此关口是在去年 10 月,一度超过 5.13 万亿美元。>> 查看详情 11、小米神秘折叠屏新机现身代码库:搭“玄戒 O3”芯片,有望为 MIX Fold 5 外媒报道小米一款代号“lhasa”的折叠屏新机已现身代码库,搭载“玄戒 O3”芯片,该机镜头模组和物料将大面积国产化,预计 7 月发布。>> 查看详情 12、realme 真我商城 4 月 25 日起停止运营,业务全面整合至 OPPO 体系 realme 真我商城于 4 月 25 日停止购物、浏览等核心功能,仅保留历史订单查询。用户需通过 OPPO 商城查看历史订单,会员权益可继续在 OPPO 商城使用。这标志着 realme 在中国大陆的销售与售后正全面整合至 OPPO 体系。>> 查看详情 13、蔚来秦力洪:不能因为老用户就停止产品更新,这样公司都没了 在 4 月 24 日的 2026 北京车展上,蔚来联合创始人、总裁秦力洪与媒体进行对话。>> 查看详情 14、中国铁路:60 周岁及以上旅客周中乘车部分可享执行票价 9 折优惠 在 5 月 19 日中国旅游日来临之际,为满足旅客多样化旅游出行需求,铁路部门推出旅游惠民服务新举措。>> 查看详情 15、全球第三:我国建成新一代激光波长量子基准,量值溯源实现自主可控 我国成功研制并获批新建国家光波长量子基准,覆盖可见光到近红外波段,测量范围扩大约 20 万倍,长度基本单位“米”的复现精度较此前提升了两个数量级。该成果标志着我国成为继美、德之后第三个自主完成多波长同步锁定的国家。>> 查看详情 16、消息称荣耀 600 系列国行版发布在即:备案配色有 6 款,工程机测试 8500mAh-9000mAh± 电池 据爆料,荣耀 600 系列国行版备案配色有 6 款,工程机测试电池容量高达 8500-9000mAh±,远超国际版的 7000mAh。此外,该机将搭载骁龙 8 Elite 芯片、2 亿像素主摄及 IP68/IP69/IP69K 防尘防水。>> 查看详情 17、小米汽车 CTO 胡峥楠:未来将针对全球不同市场开发独特产品 小米汽车 CTO 胡峥楠表示,随着公司规模扩大、市场扩大,小米汽车会针对全球不同市场开发独特产品,但现阶段还是会专注现有产品。>> 查看详情 18、莲花 For Me 黑金限量版超混 SUV 发布:63.8 万元起,全球仅售 78 台 这款新车采用黑金专属涂装,纯手工喷涂,黑底融入定制黑金细闪。此外,该车还配备黑金专属碳纤维车标、黑金专属 21 寸锻造轮毂等。>> 查看详情 19、20.99 万元起号称“弯道之王”,领克 10 / 领克 10+ 中大型运动纯电轿车预售 此次发布的新车提供领克 10 701 长续航版、领克 10 816 超长续航版、领克 10+ 四驱版三种配置,预售价分别为 20.99 万元起、22.59 万元起、25.99 万元起。>> 查看详情 20、比亚迪方程豹轿车系列定名“方程 S”:首发三款新品亮相,第三季度上市 官方公布了“方程 S”家族的三款车型,包括方程 S、方程 SL 三厢轿车,以及方程 S GT 猎装车。>> 查看详情 21、比亚迪方程豹首款轿跑 FORMULA X 正式亮相,量产车明年上市 比亚迪方程豹首款轿车 FORMULA X 4 月 24 日在 2026 北京国际车展正式亮相。>> 查看详情 22、国内首秀,小米 Vision Gran Turismo 超跑亮相 2026 北京车展 小米 Vision Gran Turismo 超跑在北京车展亮相,其核心亮点是创新的「反升力体」车身设计,反向运用航空技术,仿真气动效率高达 4.1。车内传感器能实时感知驾驶员状态,追求人车合一。设计上,气动部件与车身融为一体,如悬浮水滴般简洁。该车代表了小米对未来智能出行的探索。>> 查看详情 23、八部门:贷款产品将不得使用“低门槛”“秒到账”“低利率”等营销话术 《金融产品网络营销管理办法》将于 9 月 30 日起实施,明确禁止贷款产品使用“低门槛”“秒到账”等营销话术,并要求支付工具与贷款产品区隔展示,非金融机构人员不得通过直播等形式营销金融产品。>> 查看详情 24、消息称“苹果 20 周年版 iPhone”将采用三星四微曲面板,今年下半年国产 TOP5 也将推出等深四曲面新机 供应链消息称苹果正找三星定制四微曲面板,用于传闻中的 20 周年纪念版 iPhone,该机或将实现“隐形边框”效果。同时,今年下半年国产 TOP5 也将推出等深四曲面新机。看来,四曲面设计或将成为新一轮旗舰手机竞争焦点。>> 查看详情 25、上市 28 天,零跑 A10 大定突破 4 万台、创品牌订单增速纪录 零跑科技高级副总裁曹力 4 月 24 日在 2026 北京车展宣布,零跑 A10 上市 48 小时大定破万,首月大定突破 4 万台,创品牌订单增速纪录。>> 查看详情 26、小米雷军到访理想汽车展台玩梗,赠送李想“听我讲完”T 恤 理想汽车旗下具身智能旗舰 SUV—— 全新理想 L9 Livis 在北京车展上首次亮相。雷军在理想汽车展台观看了全新理想 L9 Livis 做“俯卧撑”,并赠送李想“听我讲完”T 恤。>> 查看详情 27、比亚迪方程豹宣布成为增速最快的新势力品牌,单月销量突破 5 万辆 方程豹单月销量已突破 5 万辆,成为新势力月销 TOP3 品牌。>> 查看详情 28、小米汽车:新一代 SU7 锁单超 6 万台,交付 2.6 万台 在 4 月 24 日上午的 2026 北京车展小米汽车发布会上,小米创办人、董事长兼 CEO 雷军宣布:截至 4 月 23 日,新一代 SU7 锁单超 6 万台,交付 2.6 万台。>> 查看详情 29、豆包上线“帮你选”功能,与抖音电商实现交易闭环 豆包 App 新功能“帮你选”上线,用户可通过语音或文字提出购物需求,AI 助手将直接对比商品优缺点、价格,并给出个性化建议。更重要的是,该功能已与抖音电商打通,支持在豆包内直接下单支付,无需跳转。这标志着字节跳动在 AI 与电商结合上迈出关键一步。>> 查看详情 今天就先聊到这里,IT早报,咱们明天见。

www.ithome.com · 2026-04-24 20:23:55+08:00 · tech

IT之家 4 月 24 日消息,阿里云百炼平台宣布首发上线 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模型,其 API 定价与 DeepSeek 官网基本一致,其中 Flash 版本输入价格最低 1 元百万 Tokens ,输出价格最低 2 元百万 Tokens。 阿里云百炼平台是一个提供模型调用、微调、知识库管理等服务的一站式 AI 开发平台。此次接入 DeepSeek-V4 系列,进一步丰富了其作为“AI 模型超市”的模型生态,支持开发者在一个平台上灵活选用各类顶尖模型。 作为今日发布的重头戏,DeepSeek-V4 系列包含两款模型:专为复杂任务设计的 DeepSeek-V4-Pro,和侧重高效经济的 DeepSeek-V4-Flash,均支持 100 万 Tokens 的超长上下文,详情可见IT之家此前报道。 相关阅读: 《 迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 》 《 寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行 》 《 华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务 》

www.ithome.com · 2026-04-24 17:24:48+08:00 · tech

IT之家 4 月 24 日消息,摩尔线程今天携手智源 FlagOS, 为旗舰级 AI 训推一体全功能 GPU MTT S5000 完成 DeepSeek-V4-Flash 模型 Day-0 适配 。 据介绍,DeepSeek-V4-Flash 模型采用混合专家(MoE)架构,总参数量达 284B,激活参数 13B,支持百万 token(词元)上下文长度。预训练数据超 32Ttoken, 在最大推理力度模式(Flash-Max)下推理能力逼近 Pro 版本 。 值得注意的是,DeepSeek-V4 模型首次采用了“FP4+FP8”混合精度策略,而国内当前主流 AI 芯片仍普遍以 BF16 为主。摩尔线程凭借原生 FP8 支持能力,可更高效承载 DeepSeek-V4 的前沿精度设计。 同时,MTT S5000 GPU 内置硬件级 FP8 Tensor Core 加速单元,相比传统 BF16/FP16 能将数据位宽直接减半,显存带宽压力降低 50%, 理论计算吞吐量实现翻倍 。 为充分发挥 MTT S5000 的 FP8 优势,FlagOS 团队为 DeepSeek-V4 模型进行 FP8 量化。通过系统级分析,双方技术团队将本次适配的攻坚重点锁定在 FP8 算子与 Sparse Attention 算子, 在“编译优化”与“自动调优”两大方向取得重大突破 。 综合IT之家此前报道,摩尔线程已多次 Day-0 即时适配国产大模型,涵盖 MiniMax M2.7 、 智谱 GLM-5 等

www.ithome.com · 2026-04-24 16:02:32+08:00 · tech

IT之家 4 月 24 日消息,备受关注的 DeepSeek-V4 预览版今日正式上线并同步开源。 随后,华为云官方宣布为 DeepSeek-V4 提供首发适配,华为云 MaaS 模型即服务平台已为开发者提供免部署、一键调用 DeepSeek-V4-Flash API 的 Tokens 服务。 在适配过程中,华为云针对 V4 模型的特性,首发适配了模型分层注意力压缩机制,实现了 V4 注意力机制下 KVCache 的高效分配管理,提供了 TopK、SWA、CFA 等 10 余种昇腾高性能融合算子,搭配框架异步调度、MTP 多步投机等框架优化,支持原生 100 万 Token 长上下文的高性能推理。 DeepSeek 方面已经确认,受限于高端算力,目前 Pro 版本的服务吞吐较为有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格还将大幅下调。IT之家此前报道,昇腾超节点全系列产品也已全面支持 DeepSeek-V4 系列模型。 本次发布的 V4 系列包含两个 MoE 架构版本:旗舰版 DeepSeek-V4-Pro 总参数 1.6 万亿、激活参数 490 亿,经济型 DeepSeek-V4-Flash 总参数 2840 亿、激活参数 130 亿,两者均原生支持 100 万 Token 的超长上下文。 在技术架构层面,DeepSeek-V4 并未单纯依靠增加硬件投入,而是设计了全新的混合注意力机制,包含压缩稀疏注意力(CSA)与重压缩注意力(HCA)两大组件,在 Token 维度对 KV 缓存进行压缩并结合 DSA 稀疏注意力技术,大幅降低了长上下文场景下的计算和显存需求。 据官方技术报告,在 100 万 Token 上下文设置下,V4-Pro 的单 Token 推理 FLOPs 仅为前代 V3.2 的 27%,KV 缓存占用降至 10%;V4-Flash 更为极致,两项指标分别压低至 10% 和 7%。此外,V4 还引入了流形约束超连接(mHC)替代传统残差连接,使用 Muon 优化器提升训练收敛速度,整个模型在超过 32 万亿 Token 上完成了预训练。 性能方面,DeepSeek 官方表示 V4-Pro 在 Agent 能力、世界知识和推理性能上均实现了国内与开源领域的领先。在知识与推理类基准测试中,V4-Pro-Max 模式(最大推理强度模式)在 Apex Shortlist(90.2%)和 Codeforces(Rating 3206)两项硬核推理与编程任务中拔得头筹。 智能体能力方面,DeepSeek 在 Terminal Bench 2.0(67.9%)和 Toolathlon(51.8%)两项工具调用与复杂指令执行测试中表现突出。官方给出的定位是:V4-Pro 的使用体验优于 Anthropic Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式仍存在一定差距。 同时官方明确表示,V4 的能力水平仍落后 GPT-5.4 和 Gemini-3.1-Pro,发展轨迹大约滞后前沿闭源模型 3 至 6 个月。V4-Flash 则定位为经济型模型,推理能力接近 Pro 版,世界知识储备稍逊一筹,在简单 Agent 任务上与 Pro 版旗鼓相当,但在高难度任务上仍有差距。 相关阅读: 《 华为:昇腾超节点系列产品全面支持 DeepSeek V4 》 《 寒武纪 Day 0 适配 DeepSeek-V4,发布当日即稳定运行 》 《 迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源 》

www.ithome.com · 2026-04-24 14:26:43+08:00 · tech

IT之家 4 月 24 日消息,今天上午, DeepSeek-V4 模型预览版正式上线并同步开源 。 华为官方随后宣布,通过双方芯模技术紧密协同, 实现昇腾超节点全系列产品支持 DeepSeek V4 系列模型 。 官方表示,昇腾 950 通过融合 kernel 和多流并行技术降低 Attention 计算和访存开销,大幅提升推理性能,结合多种量化算法, 实现了高吞吐、低时延的 DeepSeek V4 模型推理部署 。昇腾 A3 超节点系列产品也全面适配,同时为便于用户快速微调, 提供了基于昇腾 A3 超节点的 训练参考实现 。 IT之家获悉,基于 DeepSeek V4-Pro 模型,在 8K 输入场景,昇腾 950 超节点可实现 TPOT 约 20ms 时单卡 Decode 吞吐 4700TPS。DeepSeek V4-Flash 模型,8K 长序列输入场景下可实现 TPOT 约 10ms 时单卡 Decode 吞吐 1600TPS(上述 Benchmark 数据均基于 Offine 推理模式采集,不包含 Serving 调度和框架负载均衡影响)。 基于昇腾 A3 64 卡超节点结合大 EP 模式部署,DeepSeek V4-Flash 模型,8K/1K 输入输出场景,基于 vLLM 推理引擎可实现 2000+TPS 的单卡 Decode 吞吐,单卡吞吐持续提升。官方表示,针对 DeepSeek V4-Pro 模型,昇腾 A3 同步支持推理部署,性能持续优化中。

www.ithome.com · 2026-04-24 13:53:07+08:00 · tech

IT之家 4 月 24 日消息,寒武纪今日宣布,已基于 vLLM 推理框架完成对 深度求索 公司最新开源模型 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的 Day 0 适配, 模型发布当日即可实现稳定运行 ,适配代码已开源到 GitHub 社区。 针对 DeepSeek-V4 的新结构,寒武纪通过自研高性能融合算子库 Torch-MLU-Ops,对 Compressor、mHC 等模块进行专项加速;利用 BangC 高性能编程语言,编写稀疏 / 压缩 Attention、GroupGemm 等热点算子的极致优化 Kernel,充分释放硬件底层性能。 在推理框架优化层面,寒武纪在 vLLM 中全面支持 TP / PP / SP/DP/EP 5D 混合并行、通信计算并行、 低精度量化 以及 PD 分离部署等优化技术,通过策略优化, 在满足延时约束下达到最佳的词元吞吐能力 ,显著提升端到端推理效率。 硬件特性同样被深度挖掘:利用 MLU 访存与排序加速能力,有效加速稀疏 Attention、Indexer 等结构;高互联带宽与低通信延时,将 Prefill 和 Decode 两种不同工作负载场景下的通信占比降至最低,最大化分布式推理的利用率。 IT之家注意到,今天上午, DeepSeek-V4 模型预览版正式上线并同步开源 。 DeepSeek-V4 拥有百万字超长上下文 ,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。即日起登录官网 chat.deepseek.com 或官方 App,即可与最新的 DeepSeek-V4 对话,探索 1M 超长上下文记忆的全新体验。API 服务已同步更新,通过修改 model_name 为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。

www.ithome.com · 2026-04-24 10:59:09+08:00 · tech

IT之家 4 月 24 日消息,今天上午,DeepSeek-V4 模型预览版正式上线并同步开源。 DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本: 即日起登录官网 chat.deepseek.com 或官方 App , 即可与最新的 DeepSeek-V4 对话,探索 1M 超长上下文记忆的全新体验。API 服务已同步更新,通过修改 model_name 为 deepseek-v4-pro 或 deepseek-v4-flash 即可调用。 DeepSeek-V4 模型开源链接: https://huggingface.co/collections/deepseek-ai/deepseek-v4 https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4 DeepSeek-V4 技术报告: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf IT之家附两款模型的官方介绍如下: DeepSeek-V4-Pro Agent 能力大幅提高: 相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异。目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。 丰富的世界知识: DeepSeek-V4-Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。 世界顶级推理性能: 在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。 DeepSeek-V4-Flash 相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。 在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上与 DeepSeek-V4-Pro 旗鼓相当,但在高难度任务上仍有差距。 DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。 从现在开始,1M(一百万)上下文 将 是 DeepSeek 所有 官方 服务的标配。 DeepSeek-V4 针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。下图为 V4-Pro 在某 Agent 框架下生成的 PPT 内页示例: V4-Pro 与 V4-Flash 最大上下文长度为 1M , 均同时支持 非思考模式 与 思考 模式 ,其中思考模式支持 reasoning_effort 参数设置思考强度(high / max)。对于复杂的 Agent 场景建议使用思考模式,并设置强度为 max。 旧有的 API 接口的两个模型名 deepseek-chat 与 deepseek-reasoner 将于三个月后(2026-07-24)停止使用。当前阶段内,这两个模型名分别指向 deepseek-v4-flash 的非思考模式与思考模式 。

www.ithome.com · 2026-04-22 17:36:44+08:00 · tech

IT之家 4 月 22 日消息,据外媒 Carbuzz 当地时间 4 月 21 日报道,作为丰田最畅销的车型,也是全球销量最高的车型,RAV4“至少暂时不会”推出纯电版。最新一代 RAV4 已经提供燃油、混动和 PHEV 版本,不过纯电版仍不在计划之中。 丰田 RAV4 首席工程师 Yoshinori Futonagane 透露:“很多事情都有可能,但就目前来看,我们并没有考虑纯电版 RAV4。” 他解释称,丰田当初开发 bZ4X 的目的,主要是让纯电技术有一个 集中展示和持续推进的平台 ,同时满足那些想看看纯电技术能发展到什么程度的消费者。当前纯电技术进步速度非常快,整个行业正处在转型期。不过至少在当前阶段,丰田仍把 RAV4 和纯电车型 视为两条彼此分开的产品线 。 这也意味着,RAV4 接下来仍会继续走电动化路线,但不会一步到位变成纯电产品。 IT之家注去:历史上,丰田曾推出过 RAV4 纯电版车型。 第一款 RAV4 EV 诞生于 1997 年,也就是初代 RAV4 推出 3 年后,总产量不到 1500 辆,配备 27 千瓦时镍氢电池组,续航约 193 公里 ,全部以租赁或销售方式投放到加州市场。 ▲ 图源丰田,下同 第二款 RAV4 EV 则在 2012 年登场,背景是丰田与特斯拉之间的一项合作,当时特斯拉接手了丰田位于加州的合资工厂。该车型 搭载 41.8 千瓦时电池组,续航约 166 公里 ,电池和电机方案与特斯拉 Model S 所使用的系统相近,3 年里大约生产了 2500 辆。