IT之家 5 月 1 日消息,当地时间 4 月 30 日,微软宣布,在 Word 中推出面向法律工作的 Legal Agent。这个新智能体主要帮助法律专业人士审阅合同、生成红线修改稿,并按照结构化法律流程比较文档。 Word 目前已经集成 Microsoft 365 Copilot,也有可以直接修改文档内容的智能体模式。此次推出的 Legal Agent 则更聚焦法律团队的重复性工作,比如按照内部操作手册 逐条检查合同条款 。 微软表示,为了开发这项功能,公司与法律工程师合作,研究了真实法律团队审阅和谈判合同的流程。 Legal Agent 可以 分析协议内容,识别风险和义务,提出修改建议,并通过修订记录保留谈判过程 。它还内置红线修改引擎,能够理解 Word 文档结构,因此在修改合同时,可以更稳定地保留格式、列表、表格和修订痕迹。微软没有让模型直接生成全部修改,而是加入了确定性处理层来执行编辑,包括处理不同作者留下的修改。 据IT之家了解,微软列出的主要使用场景包括: 理解复杂法律文档:分析完整协议、审阅具体条款、比较不同版本,并标出风险和义务。 生成精确修改:法律人员可以要求 Legal Agent 修改合同,系统会在保留格式的同时生成带修订记录的红线稿,可直接用于谈判。 处理已有修订:Legal Agent 可以区分既有修改和新提出的改动,帮助法律团队保留完整谈判历史。 对照内部操作手册审阅合同:系统可以标出不符合内部标准的条款,并根据已批准措辞给出修改建议。 保持人工控制:用户可以检查引用、批准修改,也可以要求 Legal Agent 插入注释,解释为什么要这样改。 Legal Agent 目前已经通过美国 Frontier 计划登陆 Windows 桌面版 Word。用户可以在 Word 中 Copilot 的智能体下拉菜单里找到这个功能。
IT之家 4 月 27 日消息,在 2026 北京国际车展期间,小鹏集团董事长兼 CEO 何小鹏在媒体交流中重申,今年 8 月将在中国市场实现 VLA(视觉-语言-动作模型)智驾系统对特斯拉 FSD 的全面超越。 何小鹏昨日在北京车展上表示,小鹏 VLA 与特斯拉 FSD 各有所长,但在特定场景下 VLA 已展现出明显优势。 他指出,在城市支路、乡村道路及结构复杂的城市穿行路段中,VLA 在通行效率和决策稳定性上表现更优;在跟车、应对加塞、长距离巡航等纵向运动控制场景中,VLA 的响应精度与平顺性也体现出了领先性。不过在横向路径规划和极端掉头等少数工况下,该系统仍有优化空间。 何小鹏表示,无论是在美国的特斯拉 FSD,还是中国的小鹏、蔚来、华为的辅助驾驶都非常棒。因为 FSD 满血版还没有进入中国,实际上它很难跟小鹏的 VLA 来进行比较。 “我认为互有所长,比如说在小路、有挑战的道路上,VLA 今天的效果会明显好过 FSD。”何小鹏同时指出,在纵向即前进方向上 VLA 也表现明显更优,但在横向能力和极端掉头场景中,今天的 VLA 仍在努力中。 何小鹏同时强调,FSD 本身也在快速迭代,用小鹏的动态来比较 FSD 的静态是不公平的。因此,小鹏给自己设定了一个明确的目标 —— 到 8 月份,在中国市场实现 VLA 综合能力全面超越 FSD。 所以我们给自己定了一个小小的目标,8 月份在中国的 VLA 超过在美国的 FSD。因为中国的道路环境更复杂,如果能够超过,我自己比较相信,技术整体的能力会是相对来说权威性的超过。 何小鹏认为,中国多样且高密度的道路环境,包括高频加塞、无标线路口、非机动车穿行及临时占道等典型场景,构成了对智驾系统最严苛也最具代表性的验证场域。“如果能在中国的复杂路况下实现超越,那么技术的整体实力将是相对权威性的领先。”他对此表示。 我相信小鹏的智能辅助驾驶在欧洲,在东南亚,比如说印尼、泰国、马来西亚都会非常好,因为越是窄的道路,越是人车多的道路小鹏的 VLA 表现力一定会更好,这是目前我们测试非常明显的结果。 实际上,早在 2025 年 12 月,何小鹏就宣布与自动驾驶团队的“赌约”。他发文称,如果在 2026 年 8 月 30 日前,小鹏的第二代 VLA 系统能在国内道路环境中达到特斯拉 FSD V14.2 版本在硅谷地区的整体效果,他将在硅谷筹建一家中国风味食堂;反之,小鹏自动驾驶中心负责人刘先明则承诺在金门大桥完成裸跑挑战。 彼时他曾表示,在硅谷试驾特斯拉最新 FSD V14.2 版本后,感受到 FSD 已进入“准 L4”阶段,虽尚有瑕疵,但较上一年度已有大幅提升。何小鹏当时也坦言,鉴于时间问题,小鹏 VLA 的第一个版本还无法完全实现 FSD V14.2 的全部能力,但团队正在全力以赴推进迭代。 相关阅读: 《 何小鹏打赌:若明年小鹏 VLA 国内表现无法赶上特斯拉 FSD V14.2 在硅谷的水平,员工承诺在金门大桥裸跑 》 《 何小鹏欢迎特斯拉 FSD 入华,小鹏图灵 AI 智驾将开启全球测试 》 《 小鹏汽车自动驾驶负责人体验特斯拉 FSD:中美路况差异显著,小鹏更适合中国复杂路况 》 《 何小鹏亲赴美国体验特斯拉 FSD 智驾功能,马斯克回应:中国车企最具竞争力 》
IT之家 4 月 23 日消息,OpenAI 今天(4 月 23 日)发布博文,宣布在 ChatGPT 中推出 Workspace Agents(工作空间智能体), 支持团队创建协作智能体,能处理复杂任务和长周期工作流。 IT之家附上相关演示视频如下: 该功能重点解决跨时区、跨工具的协作难题,由 Codex 提供底层支持,能够处理从报告准备、代码编写到消息响应等多种办公任务。智能体在云端运行,支持全天候工作,即使员工离线也能持续执行任务。 技术架构方面,Workspace Agents 具备文件处理、代码运行、工具调用和记忆存储能力,OpenAI 称其超越了简单的问答模式,能够执行多步骤复杂操作。 系统支持定时调度和 Slack 集成,例如产品团队可构建智能体在 Slack 频道自动回答员工问题、链接文档并提交工单。 OpenAI 内部已部署软件审查员、产品反馈路由器、周度指标报告员等 5 种应用实例,其中销售团队通过智能体自动整合通话记录、筛选线索并起草邮件,从而大幅节省人工操作时间。 知识管理方面,该功能将分散在系统与人员中的隐性知识转化为显性工作流,例如会计团队构建的智能体能在数分钟内完成月末结账流程,生成符合内控要求的工作底稿。智能体具备记忆与迭代优化能力,通过交互反馈不断优化表现,成为团队知识沉淀的有效载体。 目前该功能面向 ChatGPT Business、Enterprise、Edu 和 Teachers 计划用户开放研究预览,2026 年 5 月 6 日前免费使用,随后转为积分计费模式。OpenAI 计划未来增加自动触发器、性能分析仪表盘等功能,进一步降低团队协作成本。
IT之家 4 月 22 日消息,理想汽车法务部官方微博发文,对网络上流传的“杭州某用户车辆系统遭黑客破解”、“理想汽车配合走私车辆出境”等不实内容进行辟谣,IT之家附官方全文如下: 近期,网络上流传有关“杭州某用户车辆系统遭黑客破解”、“理想汽车配合走私车辆出境”等内容,经核实与事实严重不符,特声明如下: 一、理想汽车从未参与相关车辆的非法转移行为,“走私”说法与事实严重不符; 二、该车辆的远程操作,均由车辆实际登记人通过本人账号执行,不涉及任何“黑客破解”; 三、理想汽车门店依据车辆登记人的申请,提供了标准的钥匙服务,操作流程符合规定; 四、本事件涉及多方复杂纠纷,经初步核实,实体车钥匙曾经手第三方,理想汽车将持续依法协助警方开展调查工作。
IT之家 4 月 21 日消息,曾参与为 Windows 添加 ZIP 文件支持、设计 Windows NT 开始菜单等标志性项目的微软前工程师戴夫 · 普卢默,揭秘了任务管理器读取 CPU 使用率的原理。 据IT之家了解,普卢默是原版任务管理器的开发者,他在编程和工程层面将这款工具设计得极为简洁,以确保其不会无端占用电脑资源。不过,也有不少用户抱怨,任务管理器显示的数据有时会感觉不太准确。为此,他解释了为何查询 CPU 使用率的过程相当复杂、任务管理器是如何获取 CPU 利用率数值的,以及为何其显示结果可能与你在电脑上的实际观感存在偏差。 普卢默表示:“测量 CPU 使用率听起来本该是计算机领域最简单的工作之一,我的意思是,CPU 要么处于忙碌状态,要么空闲,不是吗?它是硅基芯片,又不是即兴舞蹈。按理说,你只需要问 Windows 一句‘嘿,你忙到什么程度了?’,它就会告诉你 73%,然后大家就可以早早收工了。可事实完全不是这样。” “因为第一个让人头疼的问题就是:‘具体在忙什么?’是单个核心忙碌还是全部核心?是此刻正在忙碌,还是过去一两秒的平均使用率,或是界面恰好刷新时的状态?忙碌是发生在用户模式、内核模式,还是中断时间、延迟过程调用、空闲循环,又或是调度程序为了统计需要而专门设立的某个特殊统计项?一旦你开始思考这些问题,原本看似简单的速度表,就会变得像司法会计核算一样复杂。” 戴夫介绍,任务管理器由计时器驱动,会每隔一段时间刷新一次,为你提供更新后的数值。这意味着, 设备显示的是两次刷新间隔内电脑运行情况的统计结果,而非 CPU 实际使用率的实时视图 。最简单的处理方式,本应是用 CPU 使用率除以两次刷新的间隔时长,但普卢默表示,这依赖于图形界面计时器的精准触发。他把这种方式比作“指望节拍器在颠簸土路的皮卡后斗上保持绝对稳定”。 于是,他为任务管理器编写了这样的逻辑:获取每个进程自启动以来的总运行时间,即内核时间与用户时间之和;再用该数值减去上一次刷新时记录的该进程总时间,得出这段时间内的 CPU 占用量;最后用这个数值,除以两次刷新期间所有进程占用的 CPU 总时间。相比直接用 CPU 总占用量除以刷新间隔时长,这种方法听起来更复杂,却精准得多。 然而,技术的进步让这一统计方式显得不够精准。由于该统计结果只是一个平均值,无法反映刷新间隔内某一时刻的实际工作状态。 普卢默解释道:“现代 CPU 使用率更像是衡量高速公路的拥堵程度,而非实际行驶了多少里程。半满的高速公路上跑着法拉利,其通行效率远比挤满老式水泥搅拌车的拥堵高速要高得多。” “早年的任务管理器诞生于一个‘运行时间基本能代表完成工作量’的时代。但如今的处理器具备动态调频、睿频、温控降频、深度休眠等特性,运行时间与实际工作量的关联已经变得十分松散。所以当你觉得数值不太贴合实际时,并非工具出了故障,而是硬件不再简单到能用一个百分比就概括全部情况。” 他还在屏幕上添加了一条备注:“如果我能说了算……CPU 使用率理应衡量实际完成的工作量,与理论上可完成的最大工作量之间的比值。”但由于他已经从微软退休,如今大概率无法再对 Windows 的设计方案施加影响。
IT之家 4 月 19 日消息,小米技术官方宣布, Xiaomi miclaw 已正式通过中国信通院手机端智能助手(Claw)评估 ,成为国内首批通过该权威评测的手机端智能体。 据介绍,依托 Xiaomi MiMo 自研大模型与端侧优先架构,Xiaomi miclaw 具备全生态底层支撑、深度记忆理解、跨域生态互联、持续自进化四大核心能力, 打通手机、PC、座舱、AIoT 全设备,自主执行复杂指令 。 参考IT之家此前报道,Xiaomi miclaw 目前面向科技发烧友、极客用户开放了小规模测试。部分高复杂度任务可能存在执行效率波动或阶段性失败,因此小米不推荐普通用户在日常主力设备上升级。Xiaomi miclaw 为面向科技发烧友、极客用户的小规模测试性探索产品,采用邀请码机制申请下载及体验。
IT之家 4 月 12 日消息,MiniMax 今天宣布开源 M2.7 模型,据称能让模型深度参与自身训练与优化流程,构建复杂的 Agent 框架并完成高度复杂的生产力任务。 据介绍,M2.7 模型在真实软件工程场景表现出色,包括端到端项目交付、日志分析、Bug 排查、代码安全、机器学习等。在 SWE-Pro 基准测试中得分 56.22%,接近顶级模型水平。 同时在完整项目交付(VIBE-Pro 55.6%)和复杂系统理解(Terminal Bench 2:57.0%)方面也表现强劲 。 同时,M2.7 还能够“自我进化”,内部系统可自动收集反馈、构建评估集,持续优化自身架构、技能和记忆机制。在优化编程能力时,M2.7 可以自主运行超 100 轮循环,最终内部测试可实现 30% 性能提升。 此外,该模型还具备 OpenRoom 交互系统,把 AI 交互从文本扩展到可视化界面,支持实时场景反馈,支持高度扩展,未来可探索全新人机交互方式。 IT之家附上 MiniMax M2.7 模型开源地址如下: Huggingface: https://huggingface.co/MiniMaxAI/MiniMax-M2.7 MiniMax API: https://platform.minimax.io/docs/guides/models-intro
4月20日,理想汽车称,将首发高德汽车出行AI Agent。双方合作内容将包括“精准理解复杂出行指令”“多轮对话灵活调整路线”“定制专属个性化导航方案”“智能规划长途补能路径”等。前一日,高德官方发布一则产品宣传片,对外展示了其在出行场景的主动理解模糊和复杂意图的能力。
4月20日消息,据报道,OpenAI即将在未来数周内发布一款全新的图像模型,该模型在生成复杂图像和图表方面的能力将显著提升。(界面)