IT之家 5 月 5 日消息,Meta 当地时间本月 1 日完成了对物理 AI 模型初创企业 Assured Robot Intelligence (ARI) 的收购,这笔交易的财务条款未被披露。 Meta 发言人表示,ARI“处于机器人智能的前沿领域,致力于让机器人在复杂且动态的环境中理解、预测并适应人类行为”,该团队“ 将带来在模型设计以及机器人控制和自主学习前沿技术方面的深厚专业知识 ,应用于全身人型机器人控制领域”。 图源:Pixabay ARI 联合创始人 Wang Xiaolong 表示: 一年前我们创立 ARI 时,我们的使命非常明确:实现物理通用人工智能(AGI)。通过深入的客户互动和实际部署,我们逐渐认识到,要把握未来巨大的机遇,就必须训练出真正通用的物理智能体。 我们相信,这种智能体将具有类人形态 —— 其规模化发展将源于直接从人类经验中学习,而不仅仅依赖于遥控操作。Meta 的生态系统汇聚了实现这一愿景所需的关键要素。我们将加入 Meta Superintelligence Labs,共同推动个人超级智能进入物理世界。
IT之家 5 月 5 日消息,Intel(英特尔)美国加州当地时间 4 日宣布高层人士变动:前 Qualcomm(高通)高管 Alex Katouzian 将出任英特尔执行副总裁兼客户端计算和物理 AI 事业部总经理 。 IT之家注意到, 此次任命也意味着英特尔组织架构的一次大调整 :此前的 CCG 与物理 AI 业务合并为一个事业部,后者领域包括机器人、自主机器和其它 AI 智能设备。 英特尔首席执行官陈立武表示: AI 正在边缘计算领域创造前所未有的机遇,推动客户端计算和物理 AI 系统发生翻天覆地的变化。Alex 拥有深厚的技术专长、卓越的运营能力以及数十年来构建和扩展全球计算平台的经验。他是带领我们超越传统 PC,重新构想客户端计算,并使之与物理 AI 的下一波增长浪潮相契合的理想人选。 Alex Katouzian 本人则称: 英特尔正在为 AI 驱动的转型奠定基础,从引领 AI PC 领域,到扩展边缘 AI 推理能力,再到加速物理 AI 系统的未来发展。我很高兴在这个关键时刻加入陈立武和英特尔团队,助力扩大创新规模,并带来下一代计算体验。 ▲ Alex Katouzian(左) & Pushkar Ranade(右) 英特尔此次还正式任命此前临时代任首席技术官的 CEO 幕僚长 Pushkar Ranade 为企业 CTO 。Pushkar Ranade 将推进公司的技术战略,领导专项技术项目,并推动包括量子计算、神经形态计算、光子学和新型材料在内的关键新兴领域的发展。 Alex Katouzian 和 Pushkar Ranade 都将直接向陈立武汇报工作。
IT之家 4 月 27 日消息,联想拯救者官方今日公布了新品 联想拯救者游戏耳机 Y960 ,这款新品支持物理 7.1 声道,将于 5 月 19 日发布。 据介绍,这款耳机搭载专利六单元,支持声纹透视功能。官方宣称听声辨位只是门槛,“听声辨物”才是致胜关键。 5 月 19 日的发布会还将发布 联想拯救者手机 Y70 新一代 、 联想拯救者平板 Y900 与 联想拯救者 Y7000X 等多款拯救者新品,IT之家会持续关注并带来进一步报道。
IT之家 4 月 27 日消息,富士通于当地时间 4 月 23 日发布了关于自主驱动机器人的“物理 AI”领域的新战略。 富士通宣布,与该领域全球领先的美国卡内基梅隆大学成立了物理 AI 联合研究中心。 双方将联合研发通过 AI 驱动机器人的操作系统 ,将在 2026 年内公开首个版本。 ▲ 图源富士通官网,下同 IT之家获悉,双方本次合作将利用 2026 年 2 月开设的卡内基梅隆大学 Robotics Innovation Center(机器人创新中心)。该中心位于宾夕法尼亚州匹兹堡,总面积约 14,000 平方米,负责链接基础研究和商业发展。 据共同社报道,富士通与卡内基梅隆大学将优化该操作系统, 目标是到 2030 年实现人类与机器人协同工作的世界 。他们设想向工厂、医院等提供该操作系统,并利用设施内安装的传感器所获取的数据使机器人能够像人类一样灵活应对各种场景。
IT之家 4 月 21 日消息,韩国 AI 芯片企业 DEEPX 当地时间今日发布公告, 将与现代汽车集团机器人实验室 (Robotics LAB) 一道打造基于 DX-M2 新品的新一代机器人物理 AI 计算平台 ,支持本地实时运行大型 LLM。 IT之家注意到,DEEPX 的 DX-M2 芯片基于三星晶圆代工的 2nm 工艺制程,目标以 5W 提供 80 TOPS 的 AI 算力,预计 2027 年量产。现代汽车集团还在今年初的 CES 上宣布与 DEEPX 合作的 5W "Edge Brain" 芯片启动量产。 此外,现代汽车集团近期将在 2026(第十九届)北京国际汽车展览会上展出其 MobED 移动机器人平台。
5月5日,英特尔公司宣布两项重要领导层任命。Alex Katouzian将于5月加入英特尔,担任执行副总裁兼客户端计算与物理AI事业部总经理。Katouzian此前任职于高通技术公司,担任执行副总裁兼手机、计算和XR事业群总经理。 英特尔同时宣布,正式任命此前担任代理首席技术官的Pushkar Ranade出任首席技术官。作为首席技术官,他将推进公司技术战略,主导专项技术项目,并推动量子计算、神经拟态计算、光子学及新型材料等关键新兴领域的发展。 Katouzian与Ranade将直接向首席执行官陈立武汇报。(界面新闻)
文|肖漫 编辑|李勤 当下的智能汽车领域,物理 AI 已成为高频词汇,绝大多数智能驾驶算法厂商都在往“物理AI”转型。 卓驭在北京车展上也发布了面向移动物理 AI 的原生多模态基础模型。在卓驭科技副总裁于贝贝看来,算法厂商向物理AI转型不是为了迎合资本市场而编织的想象空间,而是一条关乎厂商存亡的生存法则。 “如果不上这条技术路线,很可能今后就跑不出来了。”于贝贝说。 在新的竞争维度上,算法厂商的对手不再仅仅是曾经的同行,还包括那些从数字 AI 领域跨界而来的巨头、具身智能公司等。 这场全新的竞赛让算法厂商进入全新维度的淘汰赛中,而此次能真正跑出来的玩家,其商业空间也将随着打开。 基于移动基座模型,卓驭已经开始尝试打破传统Tier 1“卖硬件、收开发费”的单一逻辑。在第二增长曲线中,通过将乘用车技术拓展至 Robotaxi、RoboVan 等 L4 级领域,卓驭正在探索一种基于订阅、利润分成以及“动作令牌(Action Token)”的新商业形态。 近日,36氪汽车与卓驭科技副总裁于贝贝聊了聊物理AI的底层逻辑、商业化可能性,以及在这场即将开始的淘汰赛中,卓驭又该如何建立护城河。 以下是36氪汽车和卓驭科技副总裁于贝贝的交流内容,经编辑: 36氪:能否详细介绍一下原生多模态基础模型? 于贝贝: 原生多模态这个概念的提出,可以追溯到去年我们开始做VLA 1.0,那时的做法比较接近视觉与动作对齐的模型,将大语言模型从后面附加上去的,因此存在很多问题,比如对语言和语义理解的局限性,以及响应延迟等。 我们认为把所有信息都转译到一个语言空间里去理解,然后再尝试通过这个语言转译的结果去理解物理世界,是一种反常识的做法。 真正合理的路径是,视觉、音频、动作都是一个模态、规则或推理也是一个模态,这些都应该在预训练阶段就一并加入,让模型能够天生地、在多种模态的共同空间里去理解物理世界,这才是更合适的做法。 36氪:现在有把语言模态拿掉吗? 于贝贝: 当前我们车端模型确实还没有开放语言这一路输入。这和小鹏发布的VLA 2.0其实是类似的,我们做的是类似方向的东西,都在向这个范式切换,底层的骨干网络已经改变了。 36氪:卓驭也进入了VLA2.0的阶段? 于贝贝: 是的。业界正处于一个范式切换的转折点,摆在我们面前的选择是:到底是沿着以前做专家模型这类小模型的范式继续做下去,还是果断切到大模型的范式上来。 我们比较看好大模型的范式。如果放在移动物理AI的语境下来看,希望移动能力能够在各种各样的载具上使用,这本质上就到达了规模化应用的阶段。 大语言模型的历史经验告诉我们,以前做视觉语言模型时,也有人做专家模型,有人做通用模型,也就是所谓的基座模型。 现在来看,最终跑出来的是做基座模型的这一批人。以前那些专注于看病的专家模型,其实都没有真正跑出来。在物理AI领域,我们相信演进的规律是一样的,因此我们也会坚定地走基础模型的范式。 36氪:厂商很多玩家都在这么干,但目前也还未能真正训练出一个可以让各种不同载体统一接入的模型,本质上大家仍然是在解决车上的问题。 于贝贝: 这是分阶段推进的。2025年,大家基本上都切换到了数据驱动,这意味着模型的基础能力已经达到了大概70分的水平。此时,想把它再提升到90分,那20分的差距仍然需要做后训练、采集数据和做泛化,但是其间的差距已经从当初的40分到80分,缩小为现在70分到90分的差距了。 后续,随着模型基础能力进一步提高,我们的目标肯定是做到零样本泛化,也就是所谓的“开箱即用”。 如果模型能力能够开箱就达到95分,那么后面的后训练、泛化、开城等工作几乎都可以忽略不计。虽然现在还没有到开箱95分的水平,但已经达到了开箱70分。 36氪:在现阶段,卓驭是否已经把各种场景都统一到同一个模型里实际运行过了,并认为它已经可以在各个领域都量产且实现泛化,还是说处于一个比较早期的阶段? 于贝贝: 在这个时间点,还远不能说已经做到了开箱即用。什么才是物理AI最终的终极范式,什么样的架构才能真正理解物理世界,目前业界尚无定论。 36氪:您怎么看待当前大多数方案厂商都在向物理AI方向转型的现象?这是不是向资本市场讲一个更有想象空间的故事? 于贝贝: 我们认为这已经不单单是商业或战略上的选择,最终应该会上升为一种生存法则层面的事情。如果不上这条技术路线,很可能今后就跑不出来了。 这和大语言模型爆发前夜一样,以前涌现出很多看病的专家模型,但通用大模型一出来,就把它们都替代掉了,以前的那些最终都没有跑出来。 36氪:在这个范式下做一个通用模型,但在其他场景下的数据,或者其他前期训练所需的条件,是不是还不够充分? 于贝贝: 我们现在在训练自己的基础模型时,30%的数据来自于车辆采集的真实数据,30%来自于机器人,另外40%来自于互联网。 这种移动能力的数据,事实上在互联网上,只需要获取第一人称视角的、在移动中的视频即可,这不一定非得是乘用车或商用车,也可以人走路时拍摄的视频,这类数据的规模庞大,并且相对容易获取。 很多企业都宣称要做移动物理AI,模型能力固然是一方面,但更重要的,具身智能必须部署到一个具体的硬件上去,它的分发过程是很难的。它不像数字AI,可以通过手机实现一传十、十传百的病毒式传播,从一个用户迅速扩展到上亿用户,传播极快。 所以, 建立一个分发平台和分发网络,也是其中非常关键的一环,这关乎如何把这个能力具体地部署到移动载具、部署到物理实体上。 36氪:卓驭在分发上是怎么做的? 于贝贝: 我们有自己的一套方法,比如与合作伙伴合作,定义硬件的标准,将这个硬件标准定义出来之后,通过合作伙伴进行硬件授权与分发,这属于硬件分发的部分。 在软件分发方面,比如我们的移动能力SDK,可以将模型能力封装成SDK,提供给那些不具备后训练模型能力的合作伙伴去使用。也可以将其包装成“移动AI”,也就是把模型做得足够好之后,将其开源,让其他方可以基于这个模型去做后训练,这又是一种分发方式。 还可以直接做成“移动智能体”,未来对于一些低安全、低实时性的应用,比如扫地机器人或割草机,只需要把视频流传输到云端,由云端计算好之后,直接下发一条轨迹给这个小机器,这或许就是另一种分发方式了。 36氪:这几种分发的方式,是否对应着卓驭的商业收费模式? 于贝贝: 是的,而且它们面向的商业场景也都不太一样。 传统的方式,像做乘用车或商用车,就是销售硬件、销售软件许可,并收取开发费和非重复性工程费用,我们内部称作第一增长曲线的业务。 第二增长曲线,则是将乘用车上已经验证过的技术,拓展到Robotaxi、RoboVan等领域。虽然也卖硬件,也可能收取开发费,但一般不收取软件许可费。 软件部分是通过利润分成来获取收益的,比如L4级业务,作为服务提供方,需要持续参与软件的迭代,甚至要参与到运营中去,所以需要一个持续性的收入,这就演变成了订阅和分润的模式。 36氪:听起来第二增长曲线更挣钱。 于贝贝: 相比第一增长曲线的收入,其利润结构是要更好的。 我们可能会有不同的算法分发方式,以“移动智能体”为例,这种分发方式就有点像是在分发所谓的“动作令牌”。 相当于某个消费级电子设备将视频流传输给云端推理的模型,模型再下发一条轨迹,其收费模式可能就是按照该消费级设备的使用次数、行驶里程来收取类似“动作令牌”的费用,这又是另一种形式的订阅。 36氪:后续运维各方面的东西,都是卓驭来做吗? 于贝贝: 对于L2的系统,本身不涉及到运维。只有到了L4级别才涉及运维,需要有一个所谓的远程监控系统,始终监控着车辆的运行过程,在必要时进行远程接管接入。 这有点像过去的安吉星服务,使用这个服务时是需要交费的。一旦车辆启用了L4功能,无论是干线物流还是乘用车,只要启用了L4,就需要额外交一部分费用。 甚至以后,乘用车的传感器配置、算力配置都能够支持L4级别时,平时车主可能还是用L2+系统,当他需要启用L4功能时,就需要为L4模式下每公里的行驶,额外再支付一点费用,因为始终会有一个系统在监控着它。 36氪:你认为L2和L4会是完全不一样的商业模式? 于贝贝: 没错,L2和L4是完全不同的商业模式。从我们的观点来看,我们认为L4应该是先在城区落地,然后再拓展到高速场景。 从工程安全角度来看,同样性质的一个事故,在高速上产生的伤害程度,要远比在城区产生的伤害严重得多。 36氪:行业玩家都在往物理AI方向做,这是新一轮淘汰赛的开始吗? 于贝贝: 新一轮的行业洗牌可能即将开始。所有做自动驾驶的公司,应该都会在不久的将来,转变为移动物理AI公司。 如果是在移动物理AI这个赛道上进行竞争,这本身就变成了一种跨界竞争,甚至可能都不是这个行业内既有玩家之间的竞争了,还需要和一些本来做数字AI,现在也想转型做具身智能、做物理AI的玩家去竞争。 36氪:那卓驭的护城河究竟是什么? 于贝贝: 我们认为有两点。第一,是模型能力。现在大家的迭代范式,乃至最终采用什么样的模型架构,都还没有定论。也许我们认为以后特别高级的3D DiT或V-JEPA等全新架构会跑出来,但这些都是未知数。 第二,分发能力其实是一个非常高的门槛。如何建立一个分发平台和分发网络,创建一个生态,联合不同的合作伙伴共同进行分发,这一定是一个非常高的门槛。
4月29日消息,据报道,LG电子正与英伟达合作,以加强其物理人工智能业务,包括推进其家用机器人CLOiD的研发,双方的合作涵盖机器人技术和下一代AI模型开发等多个领域。(界面)
36氪获悉,中信证券表示,物理AI是以数据驱动的深度融合物理规律的人工智能技术,有望加速落地具身智能、智能驾驶、工业制造等场景,长期趋势明确。英伟达作为行业先行者及主导者,不断升级其技术能力,国内厂商主要在空间环境、建模仿真、数据合作等方面布局。我们看好物理AI落地提速机遇。
特斯拉官方表示,其锂精炼厂在设计上碳足迹远低于传统硬岩锂精炼厂:无酸精炼工艺有助于产出安全的副产品;生产全过程实现水循环利用,每一滴水均在厂区内处理净化;旨在为电池供应链构建锂资源闭环体系。马斯克转发相关内容并表示,特斯拉工程团队从物理学第一原理出发,重新设计了锂提炼工艺。(新浪财经)
2026年,大语言模型和视频生成大模型都在疯狂烧token,而具身机器人行业却正在经历“无token可烧”的局面。大模型能像人一样读书,而具身智能要去真实的世界里摸爬滚打才能获取数据——数据的匮乏成为了卡住全行业的瓶颈。 4月16日,智元机器人旗下觅蜂科技发布一站式物理 AI 数据服务平台,希望能让数据像水电一样即取即用。 “GPT5用了100万亿tokens的训练语料。1token约等于0.75个英语单词,如果一个正常人一分钟能说150个词,这个语料级就等于一个人要说100亿个小时才能说完。”觅蜂科技董事长兼 CEO 姚卯青说,“但具身智能不一样。今天,全世界的高质量数据汇聚在一起,可能也只有50万小时的规模。” 数据资源匮乏且扩容缓慢,是因为具身智能所需要的训练数据,比大预言模型需要的训练语料要难获得的多。在三维的开放世界,行业各家公司已经尝试了通过真机遥操或仿真数据等等各种方式去积累数据,但仍然难以摆脱高成本和增速慢的问题。 现在,最前沿的采集方式是“无本体采集”。 无本体采集(Object-free/Body-less Data Collection)是指在具身智能训练中,直接利用人类操作(手戴传感器夹爪)或轻量化设备记录动作,而非依赖昂贵的实体机器人本体进行遥控操作。它通过人手抓取、移动等方式记录高质量、多模态的动作数据,具有成本低、采集效率高、场景泛化性强等优势。 发布会上,觅蜂推出了 MEgo 系列无本体数据采集硬件及 MEgo Engine 数据治理引擎。MEgo 系列包含采集夹爪、头戴式采集设备等,设备具备超 300° 全景感知与亚毫秒级数据同步能力,支持在工厂、商超、家庭等全场景随时随地轻量化采集。 这款名为 MEgo Gripper 的夹爪全通道支持1080P 60fps,轨迹重建的精度可以达到一毫米,确保拿起一张纸的力度都可以被还原,“让客户拿到数据就能直接落地”,以及亚毫秒级无线时间同步。这个设备只有480g的重量,支持电池快换快拆,摆脱了电线,方便人“走到哪采到哪”。 MEgo Gripper 另一款头戴式采集设备MEgo View融合了头部超过300度的视野,以及两个附着在手腕上的局部相机,既可以兼顾超广域的环境,也可以做到腕部和手部操作细节的捕捉。它搭载7个高清摄像头,车规级九轴IMU(惯性测量单元),可以输出RGB图片、IMU,还有位姿、音频在内的全感官数据。 MEgo View 与夹爪设备一样,头戴式采集设备同样采用无线设计,支持电池快换,并能实现亚毫秒级无线时间同步。 轻量化的硬件,带来了数据采集门槛的降低。在发布会后的采访环节,姚卯青告诉包括36氪在内的媒体, 他认为未来理想的采集者工作模式可能会类似于“美团骑手”——“大家可以兼职来做,但同时也要经过驿站的培训才能上岗。” 在软件上,MEgo系列解决方案背后有一套MEgo Engine 数据治理引擎,用来处理所有MEgo设备采集到的数据,包括数据的预处理、提取、评估等等,而且可以评估在机器人上的表现,实现一站式数据的多种标注。 姚卯青表示,觅蜂已经实现了真机遥操、无本体采集、仿真数据全范式覆盖,旨在“让高质量数据像水电一样即取即用。”该公司计划在 2026 年实现千万小时级数据产能,2030 年达成百亿小时级数据产能。 作为智元机器人旗下企业,觅蜂的定位却是面向其他机器人公司的To B数据服务平台。在活动后的采访环节,有媒体向姚卯青提问:“说服说服智元的竞争对手去买你们的数据?” 姚卯青回复说,“觅蜂作为一家独立的数据服务平台,所有的用户数据交易都有严格协议。数据的交易模式分为‘使用权’和‘所有权’两种,过去大部分用户都是选择了购买使用权而不是所有权,对于极个别选择购买所有权���客户,我们会进行严格的资产转移,在本地销毁数据。” “智元并不是需要所有数据,它也没法获取觅蜂的数据。”姚卯青说,“智元现在向觅蜂获取数据的唯一途径,就是市场化下订单。智元不存在免费从觅蜂获取数据的途径。” 在发布会上,觅蜂宣布与京东云、百度云、阿里云、猎聘及贵州大数据集团等多家企业举行战略签约,各方将在数据生态、场景协同、算力支撑等领域展开深度合作。
36氪获悉,近日,阿里巴巴世界模型ABot-PhysWorld登顶WorldArena评测榜首。该模型在物理规律理解与长程动态预测方面表现突出,能够准确预测物体在滑动、堆叠、流体变化等复杂交互中的运动轨迹,并保持多步因果逻辑一致性。区别于仅生成短时视频的模型,ABot-PhysWorld具备可推理的生成能力,可应用于任务规划、异常预判等实际场景。