复杂 - WWW.AWTEY.CN - WWW.AWTEY.CN

www.ithome.com · 2026-05-01 16:30:26+08:00 · tech

IT之家 5 月 1 日消息，当地时间 4 月 30 日，微软宣布，在 Word 中推出面向法律工作的 Legal Agent。这个新智能体主要帮助法律专业人士审阅合同、生成红线修改稿，并按照结构化法律流程比较文档。 Word 目前已经集成 Microsoft 365 Copilot，也有可以直接修改文档内容的智能体模式。此次推出的 Legal Agent 则更聚焦法律团队的重复性工作，比如按照内部操作手册逐条检查合同条款。微软表示，为了开发这项功能，公司与法律工程师合作，研究了真实法律团队审阅和谈判合同的流程。 Legal Agent 可以分析协议内容，识别风险和义务，提出修改建议，并通过修订记录保留谈判过程。它还内置红线修改引擎，能够理解 Word 文档结构，因此在修改合同时，可以更稳定地保留格式、列表、表格和修订痕迹。微软没有让模型直接生成全部修改，而是加入了确定性处理层来执行编辑，包括处理不同作者留下的修改。据IT之家了解，微软列出的主要使用场景包括：理解复杂法律文档：分析完整协议、审阅具体条款、比较不同版本，并标出风险和义务。生成精确修改：法律人员可以要求 Legal Agent 修改合同，系统会在保留格式的同时生成带修订记录的红线稿，可直接用于谈判。处理已有修订：Legal Agent 可以区分既有修改和新提出的改动，帮助法律团队保留完整谈判历史。对照内部操作手册审阅合同：系统可以标出不符合内部标准的条款，并根据已批准措辞给出修改建议。保持人工控制：用户可以检查引用、批准修改，也可以要求 Legal Agent 插入注释，解释为什么要这样改。 Legal Agent 目前已经通过美国 Frontier 计划登陆 Windows 桌面版 Word。用户可以在 Word 中 Copilot 的智能体下拉菜单里找到这个功能。

何小鹏：部分复杂路况下 VLA 已胜过特斯拉 FSD，8 月力争全面反超

www.ithome.com · 2026-04-27 14:56:27+08:00 · tech

IT之家 4 月 27 日消息，在 2026 北京国际车展期间，小鹏集团董事长兼 CEO 何小鹏在媒体交流中重申，今年 8 月将在中国市场实现 VLA（视觉-语言-动作模型）智驾系统对特斯拉 FSD 的全面超越。何小鹏昨日在北京车展上表示，小鹏 VLA 与特斯拉 FSD 各有所长，但在特定场景下 VLA 已展现出明显优势。他指出，在城市支路、乡村道路及结构复杂的城市穿行路段中，VLA 在通行效率和决策稳定性上表现更优；在跟车、应对加塞、长距离巡航等纵向运动控制场景中，VLA 的响应精度与平顺性也体现出了领先性。不过在横向路径规划和极端掉头等少数工况下，该系统仍有优化空间。何小鹏表示，无论是在美国的特斯拉 FSD，还是中国的小鹏、蔚来、华为的辅助驾驶都非常棒。因为 FSD 满血版还没有进入中国，实际上它很难跟小鹏的 VLA 来进行比较。 “我认为互有所长，比如说在小路、有挑战的道路上，VLA 今天的效果会明显好过 FSD。”何小鹏同时指出，在纵向即前进方向上 VLA 也表现明显更优，但在横向能力和极端掉头场景中，今天的 VLA 仍在努力中。何小鹏同时强调，FSD 本身也在快速迭代，用小鹏的动态来比较 FSD 的静态是不公平的。因此，小鹏给自己设定了一个明确的目标 —— 到 8 月份，在中国市场实现 VLA 综合能力全面超越 FSD。所以我们给自己定了一个小小的目标，8 月份在中国的 VLA 超过在美国的 FSD。因为中国的道路环境更复杂，如果能够超过，我自己比较相信，技术整体的能力会是相对来说权威性的超过。何小鹏认为，中国多样且高密度的道路环境，包括高频加塞、无标线路口、非机动车穿行及临时占道等典型场景，构成了对智驾系统最严苛也最具代表性的验证场域。“如果能在中国的复杂路况下实现超越，那么技术的整体实力将是相对权威性的领先。”他对此表示。我相信小鹏的智能辅助驾驶在欧洲，在东南亚，比如说印尼、泰国、马来西亚都会非常好，因为越是窄的道路，越是人车多的道路小鹏的 VLA 表现力一定会更好，这是目前我们测试非常明显的结果。实际上，早在 2025 年 12 月，何小鹏就宣布与自动驾驶团队的“赌约”。他发文称，如果在 2026 年 8 月 30 日前，小鹏的第二代 VLA 系统能在国内道路环境中达到特斯拉 FSD V14.2 版本在硅谷地区的整体效果，他将在硅谷筹建一家中国风味食堂；反之，小鹏自动驾驶中心负责人刘先明则承诺在金门大桥完成裸跑挑战。彼时他曾表示，在硅谷试驾特斯拉最新 FSD V14.2 版本后，感受到 FSD 已进入“准 L4”阶段，虽尚有瑕疵，但较上一年度已有大幅提升。何小鹏当时也坦言，鉴于时间问题，小鹏 VLA 的第一个版本还无法完全实现 FSD V14.2 的全部能力，但团队正在全力以赴推进迭代。相关阅读：《何小鹏打赌：若明年小鹏 VLA 国内表现无法赶上特斯拉 FSD V14.2 在硅谷的水平，员工承诺在金门大桥裸跑》《何小鹏欢迎特斯拉 FSD 入华，小鹏图灵 AI 智驾将开启全球测试》《小鹏汽车自动驾驶负责人体验特斯拉 FSD：中美路况差异显著，小鹏更适合中国复杂路况》《何小鹏亲赴美国体验特斯拉 FSD 智驾功能，马斯克回应：中国车企最具竞争力》

OpenAI 发布 ChatGPT 团队工作流 AI 智能体：7*24 小时在线，自动化处理长周期复杂任务

www.ithome.com · 2026-04-23 08:01:00+08:00 · tech

IT之家 4 月 23 日消息，OpenAI 今天（4 月 23 日）发布博文，宣布在 ChatGPT 中推出 Workspace Agents（工作空间智能体），支持团队创建协作智能体，能处理复杂任务和长周期工作流。 IT之家附上相关演示视频如下：该功能重点解决跨时区、跨工具的协作难题，由 Codex 提供底层支持，能够处理从报告准备、代码编写到消息响应等多种办公任务。智能体在云端运行，支持全天候工作，即使员工离线也能持续执行任务。技术架构方面，Workspace Agents 具备文件处理、代码运行、工具调用和记忆存储能力，OpenAI 称其超越了简单的问答模式，能够执行多步骤复杂操作。系统支持定时调度和 Slack 集成，例如产品团队可构建智能体在 Slack 频道自动回答员工问题、链接文档并提交工单。 OpenAI 内部已部署软件审查员、产品反馈路由器、周度指标报告员等 5 种应用实例，其中销售团队通过智能体自动整合通话记录、筛选线索并起草邮件，从而大幅节省人工操作时间。知识管理方面，该功能将分散在系统与人员中的隐性知识转化为显性工作流，例如会计团队构建的智能体能在数分钟内完成月末结账流程，生成符合内控要求的工作底稿。智能体具备记忆与迭代优化能力，通过交互反馈不断优化表现，成为团队知识沉淀的有效载体。目前该功能面向 ChatGPT Business、Enterprise、Edu 和 Teachers 计划用户开放研究预览，2026 年 5 月 6 日前免费使用，随后转为积分计费模式。OpenAI 计划未来增加自动触发器、性能分析仪表盘等功能，进一步降低团队协作成本。

理想汽车辟谣“杭州某用户车辆系统遭黑客破解”：事件涉及多方复杂纠纷，将持续依法协助警方开展调查工作

www.ithome.com · 2026-04-22 21:58:22+08:00 · tech

IT之家 4 月 22 日消息，理想汽车法务部官方微博发文，对网络上流传的“杭州某用户车辆系统遭黑客破解”、“理想汽车配合走私车辆出境”等不实内容进行辟谣，IT之家附官方全文如下：近期，网络上流传有关“杭州某用户车辆系统遭黑客破解”、“理想汽车配合走私车辆出境”等内容，经核实与事实严重不符，特声明如下：一、理想汽车从未参与相关车辆的非法转移行为，“走私”说法与事实严重不符；二、该车辆的远程操作，均由车辆实际登记人通过本人账号执行，不涉及任何“黑客破解”；三、理想汽车门店依据车辆登记人的申请，提供了标准的钥匙服务，操作流程符合规定；四、本事件涉及多方复杂纠纷，经初步核实，实体车钥匙曾经手第三方，理想汽车将持续依法协助警方开展调查工作。

Windows 任务管理器 CPU 使用率为何不准？微软前工程师揭秘背后复杂原理

www.ithome.com · 2026-04-21 10:58:25+08:00 · tech

IT之家 4 月 21 日消息，曾参与为 Windows 添加 ZIP 文件支持、设计 Windows NT 开始菜单等标志性项目的微软前工程师戴夫 · 普卢默，揭秘了任务管理器读取 CPU 使用率的原理。据IT之家了解，普卢默是原版任务管理器的开发者，他在编程和工程层面将这款工具设计得极为简洁，以确保其不会无端占用电脑资源。不过，也有不少用户抱怨，任务管理器显示的数据有时会感觉不太准确。为此，他解释了为何查询 CPU 使用率的过程相当复杂、任务管理器是如何获取 CPU 利用率数值的，以及为何其显示结果可能与你在电脑上的实际观感存在偏差。普卢默表示：“测量 CPU 使用率听起来本该是计算机领域最简单的工作之一，我的意思是，CPU 要么处于忙碌状态，要么空闲，不是吗？它是硅基芯片，又不是即兴舞蹈。按理说，你只需要问 Windows 一句‘嘿，你忙到什么程度了？’，它就会告诉你 73%，然后大家就可以早早收工了。可事实完全不是这样。” “因为第一个让人头疼的问题就是：‘具体在忙什么？’是单个核心忙碌还是全部核心？是此刻正在忙碌，还是过去一两秒的平均使用率，或是界面恰好刷新时的状态？忙碌是发生在用户模式、内核模式，还是中断时间、延迟过程调用、空闲循环，又或是调度程序为了统计需要而专门设立的某个特殊统计项？一旦你开始思考这些问题，原本看似简单的速度表，就会变得像司法会计核算一样复杂。” 戴夫介绍，任务管理器由计时器驱动，会每隔一段时间刷新一次，为你提供更新后的数值。这意味着，设备显示的是两次刷新间隔内电脑运行情况的统计结果，而非 CPU 实际使用率的实时视图。最简单的处理方式，本应是用 CPU 使用率除以两次刷新的间隔时长，但普卢默表示，这依赖于图形界面计时器的精准触发。他把这种方式比作“指望节拍器在颠簸土路的皮卡后斗上保持绝对稳定”。于是，他为任务管理器编写了这样的逻辑：获取每个进程自启动以来的总运行时间，即内核时间与用户时间之和；再用该数值减去上一次刷新时记录的该进程总时间，得出这段时间内的 CPU 占用量；最后用这个数值，除以两次刷新期间所有进程占用的 CPU 总时间。相比直接用 CPU 总占用量除以刷新间隔时长，这种方法听起来更复杂，却精准得多。然而，技术的进步让这一统计方式显得不够精准。由于该统计结果只是一个平均值，无法反映刷新间隔内某一时刻的实际工作状态。普卢默解释道：“现代 CPU 使用率更像是衡量高速公路的拥堵程度，而非实际行驶了多少里程。半满的高速公路上跑着法拉利，其通行效率远比挤满老式水泥搅拌车的拥堵高速要高得多。” “早年的任务管理器诞生于一个‘运行时间基本能代表完成工作量’的时代。但如今的处理器具备动态调频、睿频、温控降频、深度休眠等特性，运行时间与实际工作量的关联已经变得十分松散。所以当你觉得数值不太贴合实际时，并非工具出了故障，而是硬件不再简单到能用一个百分比就概括全部情况。” 他还在屏幕上添加了一条备注：“如果我能说了算……CPU 使用率理应衡量实际完成的工作量，与理论上可完成的最大工作量之间的比值。”但由于他已经从微软退休，如今大概率无法再对 Windows 的设计方案施加影响。

小米“龙虾”Xiaomi miclaw 首批通过中国信通院手机端智能助手（Claw）评估，可自主执行复杂指令

www.ithome.com · 2026-04-19 17:34:47+08:00 · tech

IT之家 4 月 19 日消息，小米技术官方宣布， Xiaomi miclaw 已正式通过中国信通院手机端智能助手（Claw）评估，成为国内首批通过该权威评测的手机端智能体。据介绍，依托 Xiaomi MiMo 自研大模型与端侧优先架构，Xiaomi miclaw 具备全生态底层支撑、深度记忆理解、跨域生态互联、持续自进化四大核心能力，打通手机、PC、座舱、AIoT 全设备，自主执行复杂指令。参考IT之家此前报道，Xiaomi miclaw 目前面向科技发烧友、极客用户开放了小规模测试。部分高复杂度任务可能存在执行效率波动或阶段性失败，因此小米不推荐普通用户在日常主力设备上升级。Xiaomi miclaw 为面向科技发烧友、极客用户的小规模测试性探索产品，采用邀请码机制申请下载及体验。

MiniMax 开源 M2.7 模型，AI 自主训练与复杂任务能力再突破

www.ithome.com · 2026-04-12 17:32:18+08:00 · tech

IT之家 4 月 12 日消息，MiniMax 今天宣布开源 M2.7 模型，据称能让模型深度参与自身训练与优化流程，构建复杂的 Agent 框架并完成高度复杂的生产力任务。据介绍，M2.7 模型在真实软件工程场景表现出色，包括端到端项目交付、日志分析、Bug 排查、代码安全、机器学习等。在 SWE-Pro 基准测试中得分 56.22%，接近顶级模型水平。同时在完整项目交付（VIBE-Pro 55.6%）和复杂系统理解（Terminal Bench 2：57.0%）方面也表现强劲。同时，M2.7 还能够“自我进化”，内部系统可自动收集反馈、构建评估集，持续优化自身架构、技能和记忆机制。在优化编程能力时，M2.7 可以自主运行超 100 轮循环，最终内部测试可实现 30% 性能提升。此外，该模型还具备 OpenRoom 交互系统，把 AI 交互从文本扩展到可视化界面，支持实时场景反馈，支持高度扩展，未来可探索全新人机交互方式。 IT之家附上 MiniMax M2.7 模型开源地址如下： Huggingface： https://huggingface.co/MiniMaxAI/MiniMax-M2.7 MiniMax API： https://platform.minimax.io/docs/guides/models-intro

理想汽车宣布首发高德汽车出行AI Agent

36kr.com · None · tech

4月20日，理想汽车称，将首发高德汽车出行AI Agent。双方合作内容将包括“精准理解复杂出行指令”“多轮对话灵活调整路线”“定制专属个性化导航方案”“智能规划长途补能路径”等。前一日，高德官方发布一则产品宣传片，对外展示了其在出行场景的主动理解模糊和复杂意图的能力。

OpenAI据悉将于未来数周内发布全新图像模型

36kr.com · None · tech

4月20日消息，据报道，OpenAI即将在未来数周内发布一款全新的图像模型，该模型在生成复杂图像和图表方面的能力将显著提升。（界面）

/tag/复杂