IT之家 5 月 1 日消息,央视新闻今天对高速公路“手机 +”无卡通行模式进行解读,相应模式依托手机提供服务、以车牌识别技术记录车辆信息, 用户只要提前通过手机注册,就可以无感通行 ,可减少车辆通行时间,提高出行效率。 央视表示,当前江苏“茉莉畅行”、重庆“高速码上行”等地方平台已先行开展试点,为车主提供了初步的无卡通行体验。目前,江苏高速茉莉畅行平台注册人数已突破 65 万,日均通行量破 2 万,车道通行时间平均减少 10 秒,通行效率至少提升 30%。 针对网友“‘手机 +’无卡便捷通行会取代 ETC 吗”“纯车牌通行是不是容易出现车牌被套牌”等问题,有关负责人表示: ‘手机 +’无卡便捷通行并不是要取代目前的 ETC、人工收费等现有收费模式,而是作为有益补充,与之长期并行、协同发展,公众可根据自身的需要来选择收费模式。推进工作将严格遵循‘三先三后’的审慎原则,即‘先人工收费车道、后 ETC 车道’‘先客车、后货车’‘先出口、后入口’,确保技术成熟、运行稳定后再逐步拓展。最终构建多元化收费服务新格局。 央视网同时透露,根据试点计划,目前在试点省市可以采用“手机 +”无卡便捷通行模式进入高速公路,并可在全国各地任意出口无卡停车支付后通行。后续,还将根据试点情况,逐步扩大实施范围。未来,还可能会有一个全国统一的服务入口。 车主未来有望自由选择使用部级平台或任一省级平台,实现全国高速公路通行,享受规范、统一、便捷的“一站式”服务 。
IT之家 4 月 30 日消息,苹果公司携手加州大学圣迭戈分校团队,在新版论文《LaDiR:潜在扩散增强 LLM 文本推理》中提出新框架, 让大语言模型(LLM)在回答前并行探索多条推理路径,再用自回归方式输出提高结果质量。 IT之家援引博文介绍,该框架并非新模型,而是叠加在现有模型之上的通用框架,重点改变模型思考问题的方式。LaDiR 结合扩散(Diffusion)和自回归(Autoregression)两种主流生成范式,在推理阶段采用扩散模型,在最终输出阶段使用自回归模型。 这种混合架构有效提升了模型处理复杂问题的能力,既保留了扩散模型并行处理的优势,又延续了自回归模型生成的连贯性。 LaDiR 的独特之处在于其并行推理机制。系统在推理时会同时启动多条独立的推理路径,每条路径从随机噪声开始,通过扩散过程逐步优化成连贯的推理步骤。为防止所有路径过早收敛于同一结论,框架引入了特殊的多样性鼓励机制,确保每条路径能探索不同的解题思路,从而生成多样化的候选答案池。 研究团队在 Meta 的 LLaMA 3.1 8B 和 Qwen3-8B-Base 上部署测试。在数学基准测试中,LaDiR 取得了比现有方法更高的准确率,在面对更困难的分布外任务时表现尤为突出。在代码生成测试 HumanEval 中,该框架生成的代码更加可靠,在难题上的表现明显优于标准微调方法。 在谜题规划任务中,LaDiR 能探索更广泛的解空间,找到正确解的概率高于所有通用基准模型。不过,在单次尝试准确率上,它仍略逊于专门针对特定任务优化的专用模型。这表明通用框架在追求广泛适用性的同时,在极致专精领域仍有提升空间。 IT之家附上参考地址 LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning
IT之家 4 月 21 日消息,月之暗面昨天发布并开源了其最新模型 Kimi K2.6,该模型在代码编写、长程任务执行及 Agent 集群能力方面实现了全面升级。 即日起,所有用户均可通过官网(IT之家附地址: kimi.com )、最新版 Kimi 应用、Kimi API 以及 Kimi Code 编程助手使用该模型。 据官方披露,Kimi K2.6 在博士级难度的完整版“终极人类考试”(Humanity's Last Exam)、评估真实软件工程能力的 SWE-Bench Pro 以及 Agent 深度检索基准 DeepSearchQA 等测试中,均取得了行业领先的成绩,表现持平或优于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等闭源模型。 作为月之暗面迄今最强的代码模型,Kimi K2.6 的长程编码能力显著提升。在测试中,该模型可以不间断编码长达 13 小时,编写或修改超过 4000 行代码,完成复杂系统的开发与优化。通过将代码与视觉能力深度融合,K2.6 能够交付具有设计创意的专业级 Web 应用。IT之家注意到,在 Kimi 内部的严格代码评测基准 Kimi Code Bench 中,K2.6 的成绩相比上一代 K2.5 提升了约 20%。 实测案例显示,该模型成功在 Mac 本地下载并部署了 Qwen3.5-0.8B 模型,使用小众的 Zig 语言实现并优化模型推理,经过 4000 多次工具调用、超过 12 小时的不间断运行,共迭代 14 轮,将吞吐量从约 15 tokens/s 提升至约 193 tokens/s,最终推理速度比 LM Studio 快 20%。 在另一个案例中,Kimi K2.6 自主完成了对拥有 8 年历史、接近性能极限的开源金融撮合引擎 exchange-core 的深度重构,历经 13 小时连续作业,迭代 12 套优化策略,通过 1000 余次工具调用,精准修改了 4000 多行代码,最终实现中位吞吐量从 0.43 MT/s 跃升至 1.24 MT/s(增幅 185%),峰值吞吐量从 1.23 MT/s 飙升至 2.86 MT/s(增幅 133%)。 在代码驱动设计方面,K2.6 的 Agent 模式能够制作具有设计感和视觉冲击力的网站。凭借对图像和视频生成工具的熟练调用,该 Agent 可以生成视觉风格高度统一的素材,构建视觉焦点突出的首屏区,并实现交互元素和滚动触发动效。 月之暗面表示,它不局限于前端页面编写,也支持基础的后端数据库模块,例如在网页中嵌入表单信息收集功能。 另外,月之暗面还创建了一套专门的前端开发设计评测基准 Kimi Design Bench,涵盖视觉输入、落地页构建、全栈应用开发及通用 Web 开发四个维度,对比 Google AI Studio 中的 Gemini 3 模型,基于 Kimi K2.6 的 Agent 展现出了明显领先优势。 同时,其 Agent 集群能力迎来全面升级。K2.6 支持动态拆解复杂任务,自主生成专项 Agent 并行处理,现在最多可调度 300 个子 Agent 并行完成 4000 个协作步骤,实现更大规模的并行化,任务完成度和交付质量相比 K2.5 显著提升。Agent 集群能够将搜索、深度研究、文档分析和长文创作等能力进行组合,在单次运行中独立完成从文档到网页、再到 PPT 和表格的多产物端到端交付。 例如,该集群针对全球 100 个半导体标的设计并执行了 5 套量化策略,将麦肯锡风格的 PPT 逻辑沉淀为可复用技能,最终交付了详尽的建模表格和整套汇报演示文档。 在另一个案例中,Agent 集群将一篇包含大量视觉数据的天体物理论文转化为可复用学术技能,提取论文的推理流程和可视化方法,产出了 40 页、7000 字的研究论文,以及包含 2 万多条数据的结构化数据集和 14 张天文级图表。 K2.6 显著增强了 Agent 的自主化执行能力,尤其在与 OpenClaw、Hermes Agent 等主动式 Agent 框架协同工作时表现突出。这类场景要求 AI 能够跨应用实现 24/7 不间断运行。 月之暗面的 RL 基础设施团队使用基于 K2.6 的 Agent 实现了连续 5 天自主运行,该 Agent 负责监控、故障响应和系统运维,展现了持久的上下文维持能力、多线程任务处理能力以及从接收告警到彻底解决的全流程执行能力。 Kimi 内部的 Claw Bench 测试结果显示,K2.6 相比 K2.5 综合性能提升了 10%,涵盖编程任务、即时通讯生态集成、信息检索与分析、定时任务管理及记忆调用五大维度,在需要长时间自主运行且无需人工干预的工作流中优势尤为显著。 借助 K2.6 更强的代码和视觉理解能力,Kimi Agent 模式现在支持创建和调用技能(Skill)。系统已内置上百个官方推荐技能,包括投研技能包,可一键生成专业排版的 A 股、港股、美股公司一页纸或深度投资研报。 用户在 Kimi Agent 模式下输入斜杠“/”即可开始创建和调用技能。此外,Kimi Agent 已支持“Office 文档转技能”功能,上传高质量 Office 文档后,模型会尝试理解原文档的结构与风格基因,生成专属的可复用文档创建技能。 月之暗面同时宣布开启“Claw 群组”小范围内测。该群组的目标是让多个 Agent 与人类作为真正的协作者共同运行,用户可以接入来自任何设备、任何供应商、运行任何模型的全天候 Agent(首批支持 OpenClaw,后续将加入对 Hermes Agent 等框架的支持),每个 Agent 可携带各自的专业工具包、技能和持久化记忆上下文。 在 Claw 群组中,K2.6 担任协调者,根据 Agent 的技能画像和可用工具动态匹配任务,当某个 Agent 遇到故障或停滞时,协调者会检测到中断并自动重新分配任务或生成子任务。Kimi Claw 用户将陆续收到内测邀请。 Kimi K2.6 现已面向所有免费用户、付费订阅用户、Kimi Code 和企业 API 用户开放。企业和开发者在 Kimi API 中指定模型为 kimi-k2.6 即可开始使用。 为庆祝 K2.6 模型 API 上线,Kimi 开放平台同步开启了最高 30% 的限时充赠活动。同时,Kimi K2.6 官方 API 已经首发登陆腾讯云 TokenHub 等平台。月之暗面推荐直接调用官方 API 复现基准评测成绩,如需使用第三方 API 服务,可通过 Kimi 模型供应商验证服务(Kimi Vendor Verifier, KVV)挑选精度更高的服务商。 参考资料: 与 Kimi 对话: kimi.com 或下载最新版 Kimi App 体验 Kimi Agent: kimi.com/agent 体验 Agent Swarm: kimi.com/agent-swarm 使用 Kimi Code 包月编码套餐: kimi.com/code K2.6 快速开始: https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart 查看限时充赠活动: https://platform.kimi.com/docs/pricing/promotion Hugging Face: https://huggingface.co/moonshotai ModelScope: https://www.modelscope.ai/organization/moonshotai
IT之家 4 月 12 日消息,顽皮狗工作室负责人尼尔 · 德鲁克曼去年曾暗示,除了《星际:异端先知》外,该团队还在开发另一款游戏。 爆料者 @AlexandreNGamR 上周爆料称,顽皮狗正在同时开发的这款游戏属于《神秘海域》IP 新作。这意味着索尼 PlayStation 招牌 IP 之一《神秘海域》系列可能将回归。 另外,《神秘海域:失落的遗产》项目总监肖恩 · 埃斯凯格(Shaun Escayg)之前还在 ins 上发了一张图,图中一门大炮从悬崖上俯瞰一座海滨城市,被玩家解读是在暗示系列新作。 IT之家查询发现,该系列上一部作品为《神秘海域:盗贼遗产合集》(《神秘海域 4:盗贼末路》及其衍生作品《神秘海域:失落的遗产》重制版合辑),其最后一款正统续作《神秘海域 4:盗贼末路》于 2017 年发售,至今已过去近十年。 虽然目前尚无法确认《神秘海域》新作是否真的在开发中,但种种迹象对系列粉丝而言无疑是积极的信号。 相关阅读: 《 〈神秘海域:失落的遗产〉导演晒乔治堡采风照,引玩家期待系列 IP 后续发展 》 《 微软前员工称 Xbox 曾试图开发对标〈神秘海域〉的作品,最终却陷入停滞 》 《 消息称顽皮狗正开发〈神秘海域 5〉游戏,卡西・德雷克有望首次成主角 》 《 索尼确认〈神秘海域〉真人电影续作等多个项目正在制作中 》