IT之家 4 月 26 日消息,今日,2026 北京国际车展期间, 斑马智能 与东风研发总院联合宣布,基于元神 AI 打造的淘宝闪购 Agent 首发上车,将落地 东风天元智舱 。 据官方介绍,在天元智舱中,用户无需动手、无需跳转, 仅通过自然语音即可完成点餐全流程 。当用户说“给我点杯奶茶送到公司”,淘宝闪购 Agent 能精准识别模糊意图,自动匹配附近门店、推荐餐品规格,并支持中途修改、随心更换,真正实现“一句话点餐闭环”。 真全品类美食:从奶茶咖啡到正餐夜宵,手机上能点的美食,车里一站式全覆盖; 真自由对话:模糊需求也能理解,支持“中午没吃饭,给我点份餐吧”等自然表达,对话式修改订单; 真原生座舱体验:不跳转小程序、不打折功能,优惠自动叠加、配送时间智能联动导航、历史订单一键复购; 真个性懂你:基于用户历史行为,主动提醒点餐,并根据偏好给出个性化推荐,越用越贴心。 未来,斑马智能还将与东风研发总院围绕用车场景下的 影音娱乐、出行游玩、AI 播客 等多场景需求,带来更多原生 Agent 服务上车。
IT之家 4 月 24 日消息,2026 北京车展开幕首日,长安、东风、北汽、比亚迪、吉利、长城、理想、上汽大众、上汽智己等宣布接入千问。未来,这些车企的部分车型在车内可实现 复杂路径规划、闲聊、查新闻、订酒店、买门票、点外卖、查快递 等全场景服务。 据介绍,汽车智能化正在发生深刻变革,阿里云提供了一整套“端 + 云”协同架构助力汽车行业打造极致体验的智能座舱:端侧部署 Qwen-Omni 全模态大模型,可感知物理世界,保障隐私安全,在弱网环境下也能快速响应、稳定运行;云端通过千问链接数字世界,提供多种服务。 在识别车控指令、车辆运行状态,及用户意图等方面,端侧可直接执行;针对复杂的任务,端侧把请求通过网络分发给云端的千问,精准拆解意图后,千问调用对应的阿里巴巴生态服务, 用户可以一句话在车里完成订餐、购物、导航、支付等一系列操作 。 IT之家注意到, 阿里 3 月 26 日官宣千问首次上车 。一汽红旗的“灵犀座舱”在业内首次成功接入千问智能体,将首发搭载于红旗 HS6 PHEV。届时,在车内可实现多模糊意图识别与复杂路径规划的服务闭环。
IT之家 4 月 20 日消息,UU 跑腿今日宣布推出 全球首个跑腿 Skill ,只需开口说一句话,AI 就能帮你执行并下单。 根据官方介绍,UU 跑腿 Agent Skill 是为 AI 智能体应用(如 Qoder、Cursor、Claude、OpenClaw 等)开发的配送服务插件, 支持订单询价、发单、订单管理和跑男实时追踪等功能 。 用户只需通过手机号一键注册或配置已有凭证,即可让智能体具备同城配送能力,实现一句话发单的功能,降低智能体应用接入配送服务的门槛。 手机号一键注册(首次使用自动引导) 订单询价(计算配送费用) 创建配送订单 微信扫码支付(余额不足时自动生成支付二维码) 查询订单详情 取消订单 跑男实时位置追踪 配置本地持久化存储 此外,商户还可使用 Skill 进行批量智能调度, 将复杂的发单任务一键打包 ,由 AI 规划最优分发路径。同时支持打通 UU 跑腿 skill 与商家订单后台,实现履约自动化。 IT之家附 UU 跑腿 · Skill 下载地址: https://clawhub.ai/uupt-mcp/uupt-delivery
文|周鑫雨 编辑|杨轩 一句话介绍 Buzzy(https://www.buzzy.now/)是AI内容创作公司“感知阶跃”旗下的视频编辑Agent平台,主要面向C端内容创作者和中小型商家。 好比“视频版的PhotoShop”,用户只需下达自然语言指令,就能驱动Agent对视频进行背景去除、光线修正、产品替换、背景/视角更改等编辑操作。 团队介绍 “感知阶跃”创始人兼CEO Ella Zhang(张诗莹),曾在苹果、Oculus VR、Google负责核心产品。 在苹果期间,她曾为AirPods产品线创始团队核心成员,负责产品的系统集成和全周期设计落地,包括音频产品的架构设计、元器件选型、原理图绘制、版图设计、验证以及大规模生产。 此后,张诗莹又在Google担任AR产品的系统架构师,负责Glass、Reflector等产品的算法和架构研发。 “感知阶跃”其余核心成员,来自Adobe、小米、商汤等公司。 融资进展 近期,“感知阶跃”完成了新一轮融资, 金额超过2000万美元,领投方为Redpoint(红点创投)。 深渡资本担任本轮独家财务顾问。 产品及业务 在张诗莹看来,随着视频生成模型性能的发展,生成类的工具赛道,已经逐渐“红海”。她将市面上的视频创作工具,大致分成了两类: 一类是“画布型”产品,优点在于可以通过手动控制,保证生成结果的质量,但缺点是对大多数用户而言,使用门槛高;另一类则是向用户提供预制的workflow和模板,劣势在于不够灵活,同时,idea不够创新。 “用户更倾向于一次性生成整段视频,并通过不断迭代修改的方法来修到完美方案。所以一个指哪打哪的视频编辑器就变成了刚需。” 当下,由于视频的连贯性以及模型理解能力的局限性,用户很难通过Chat的方式,对视频进行换背景、换人物、消除某元素的“局部精修”。大多AI编辑器会改变整个画面,接近于重新生成。 近期, “感知阶跃”上线的新产品Buzzy, 就是一款AI视频编辑器,让用户可以 像P图一样便捷地“P视频”。 只需要通过Chat,Buzzy就可以对视频完成去除背景路人、修正光线、替换产品、合拍、更改背景与视角等操作,真正实现局部精修。 △背景路人去除。左:去除后;右:去除前。图源:受访者供图 △改变光线。上:改变前;下:改变后。图源:受访者供图 △拍摄角度改变。左:改变后;右:改变前。图源:受访者供图 做到对视频的局部编辑、维持其余部分,技术门槛并不低。张诗莹告诉我们,局部编辑要求视频模型有更高的视频和语言理解能力,“首先它要识别修改的部分到底是什么、在哪里出现,其次它还要准确理解用户的意图,比如prompt中的梗。” 为此,“感知阶跃”基于RLHF(人类反馈强化学习),训练了一个小模型,来增强Buzzy对视频编辑的理解。 与此同时,Buzzy也被设计为一个能够 自主学习用户审美和品味 的Agent。 Buzzy上线了一个“类OpenClaw”的Bot。用户可以通过扫码,直接将Bot接入Telegram和WhatsApp中。 通过向Bot分享TikTok、YouTube上的视频链接,Bot会自动分析用户的视频偏好和品味,基于该视频风格24*7自动全网搜索灵感素材,并将该风格沉淀为Skill。 风格沉淀。图源:受访者供图 此前,自2021年成立以来,“感知阶跃”经历了两次内容创作产品迭代: 在Midjourney、Stable Diffusion等文生图产品爆发之前,“感知阶跃”就基于GAN(生成对抗网络),开发出了第一款面向国内B端电商客户的AI模特图生成平台ZMO.ai,并在后续将落地场景扩展到商品图设计、编辑等场景。 ZMO.图源:受访者供图 占据先发优势的ZMO.ai,MAU一度达到了700万。 2024年起,视频生成赛道随着Sora的发布,迎来了一个小爆发。在风口中,“感知阶跃”叫停了ZMO.ai,并在2024年4月上线了涵盖图片、视频的内容创作平台Creati。 相较于聚焦电商、广告图片生成和编辑的ZMO.ai,Creati将内容创作扩展到了视频领域,包括文生视频、基于视频模板二创等功能。 与此同时,它为用户提供了移动端产品。不少非专业内容生产者,就可以直接用手机拍摄素材后,直接在App端完成内容的创作、编辑和发布,而非辗转导入电脑。 “用户对AI生视频的需求,比图片更刚一些。”张诗莹提到,“在传播效果上,无论在社媒端,还是广告端, 视频都比图片更能吸引注意力。 与此同时,用户拍视频的难度,比做图片高很多。” Creati。图源:受访者供图 同样转变的还有目标用户。ZMO.ai的主要客户,是国内B端的电商、广告商。但很快,张诗莹发现,即便ZMO.ai用户增长很快,但流量并没有转化为实际的付费。 核心原因在于,其一,“大B”客户的结款周期过长;其二,图片的创作成本比视频更���,因此 用户对图片的付费意愿不够高。 Creati则是一款面向“大C小B”的产品:C端内容创作者,以及中小商户。张诗莹告诉《智能涌现》, “大C小B”是付费意愿最高的人群, “更大的B端企业倾向于自研工作流”。 上线一年,Creati的全球用户量就突破了千万级别。 产品ARR(年度经常性收入),一度达到了2000万美金。 商业模式 靠用户订阅,覆盖Token消耗成本,是目前AI软件的主流商业模式。但张诗莹认为,订阅是SaaS时代的商业模式, Agent时代的商业模式应该为效果付费,而不应该为成本付费。 她告诉《智能涌现》,现阶段,用户依然将Agent视作工具,而非创造价值的人。 当Agent可以覆盖内容生成、发布、投放、A/B Test、效果分析、二创等创作全流程,Agent的商业模式,应该与人类Agency越来越相似,“收费模式不会是订阅,而更多会采用分佣的形式。” Founder思考 大多数非专业用户的内容创作场景,主要在Mobile端,而非PC端。 不少商家、非专业内容创作者,习惯用手机拍摄获取商品图、短视频等素材。但矛盾的是,创作工具往往集中在PC端。这就会导致内容创作链路的断裂。 因此,无论Creati,还是Buzzy,我们都向用户提供了MobileApp产品,让素材的获取、内容创作和编辑、发布,都可以在手机上完成。 当AI生成视频技术足够成熟,应用层能做的事只有两块:内容生成之前,以及内容生成之后。 内容生成之前,应用层解决的是产生创意的问题;内容生成之后,需要解决的是“怎么改”的问题。 应用层不应该去做模型层的事,因为模型一定会变得足够好。 当下有很多“套壳”视频模型能力的产品,无论是“画布”,还是workflow,解决的都是模型能力不够强的问题,比如“抽卡”、视频生成长度有限。 但未来,模型层一定会解决生成质量和长度的问题。应用层的机会,就在于解决生成环节之外的问题。 未来,Skill会成为可以交易的资产。 Skill本质上是用户沉淀下的品味、认知,以及工作流。就创作领域而言,人的审美和品味,以及掌握找素材的技能,都是有价值的。 因此未来,卖Skill可能会成为一种商业模式。 新的时代,应该独立开发新的产品,而不是在旧产品上加上一个新入口。 Buzzy和Creati是两代完全不同的产品。Creati聚焦生成,Buzzy聚焦生成后的编辑。不同代的产品,会形成不同的用户心智。 所有的Go Viral(走红)都很偶然,产品不应该过分追求Go Viral。 很多用户刚需,其实不具备在社媒上Go Viral的潜质,比如PDF Editor,但它们的用户量非常大。 根据我们的经验,能够Go Viral的产品有几个特点:第一,产品形态、设计比较创新;第二,实用,只有解决了用户的痛点,他们才愿意自发传播;第三,降低用户生产有趣内容的门槛。 欢迎交流!
文|周鑫雨 编辑|杨轩 一句话介绍 成立于2025年6月的“涌跃智能”,是《智能涌现》曾报道过的AI创业公司 。 其旗下产品Loopit,好比“可以玩的抖音”,是一个面向C端的AI互动内容平台,覆盖可交互内容的创作、分发和消费。 基于自研的“AI Coding+多模态生成”的互动引擎,用户既可以与社区中的内容互动,也可以创作、发表支持图像、语音、视频、3D等全模态可交互互动内容。 团队介绍 “涌跃智能”创始团队,主要出身于“AI六小虎”百川智能的核心团队。 “涌跃智能”联合创始人兼CEO陈炜鹏,前百川智能的联合创始人兼大模型负责人,主导了BaiChuan 1-4等大模型的训练。 此前,他的职业路径横跨搜索、推荐与社区产品——从搜狗的搜索与信息流,到Soul的内容社区,一直围绕分发与内容形态演进展开。 融资进展 近期,“涌跃智能”完成了新一轮融资,金额为5000万美元。 该轮融资由全球头部游戏厂商Garena领投。 本轮投资阵容还包括 经纬创投、蓝驰创投、渶策资本、柏睿资本等 机构,高鹄资本担任独家财务顾问。其中天使股东经纬创投为第4次加码。 2026年以来,“涌跃智能”已经连续完成了3轮融资,累计金额近1亿美元。此前,投资方还包括天使股东耀途资本、钟鼎资本等机构。 产品及业务 2026年才过了1/3,“涌跃智能”就连续完成了三轮融资。资本市场火热,背后是Loopit所代表的AI应用赛道的兴起: AI互动式内容平台 。 在Loopit创作端,用户可以通过文字输入创意,生成可互动的mini-App,也可以基于其余用户创作的内容进行remix(魔改); △Loopit支持复杂互动内容的创作。图源:受访者供图 在消费端,产品采用单列Feed流进行分发,将互动体验封装进统一内容卡片中,降低用户参与体验的门槛。 △左:Loopit创作后台;中:Loopit首页Feed流;右:Loopit内容分区。图源:产品界面 在众多互动内容产品中,Loopit是增长最为迅猛的产品之一:正式上线(2026年2月10日)不到24小时,用户制作互动内容就在X上被马斯克评论转发; 《智能涌现》独家获悉,上线两个月以来, Loopit的全球注册用户规模达到了近200万 ,其中北美用户超过半数; 产品次日留存从早期的30%,上升到超过50% ,用户创作率达到30%。 实现用户新增、留存和消费时长的同时增长,陈炜鹏告诉《智能涌现》, Loopit核心做对了两件事 : 一方面,不断拓展互动内容的体验边界;另一方面,持续降低互动内容创作的门槛。 围绕增强“体验”,近期Loopit拓展了 “联机内容”的创作 ,支持多人互动内容的生成和发布。 陈炜鹏观察到,近几年来,用户对“体验”有个更深的需求:“人与内容的关系,从人观看内容,发展为人与内容互动,现在又扩展到人和人之间通过内容产生联系。” 比如,在Loopit平台上,有用户生成了一个全网聊天室,支持多人视频连线;也有网友制作了多人可以参与的闯关游戏。 △用户生成的联机闯关游戏。图源:作者体验 增强内容体验的同时,在陈炜鹏看来, 底层技术足够通用、内容生成的门槛足够低 ,是激发用户创作欲、满足用户探索欲的前提。 陈炜鹏认为,支持 “许愿式创作”,是驱动用户创作的核心之一 。即便用户尚未形成成熟的创意、没有创作目的,也能通过描述大致的创作需求,生成互动内容。 比如,用户只需要输入“90年代TV”,Loopit的创作引擎也能在几分钟内完善创意,生成一个可以调频道的互动内容。 △许愿式创作。图源:作者体验 Loopit背后的互动内容创作引擎,是团队自研的Coding驱动多模态生成架构,支持涵盖语言、图片、语音、视频、3D等全模态的互动内容生成。平均经过3轮对话,用户就能创作出模态、交互形式较为复杂的内容。 据陈炜鹏介绍,这一套架构,本质上是一个通用的Coding Agent与一个通用的多模态Agent的组合,“这套技术实现的门槛非常高,Coding和多模态的生成都在互相约束”。 可以看见,互动内容平台,已经成为当下最火热的AI赛道之一。陈炜鹏认为, Loopit的差异化在于,产品更为通用。 “不少产品或聚焦在小游戏、社交等具体场景,吸引的也是某一圈层的用户。”他不希望在早期就将Loopit的定位限定“死”,“我们把底层能力做得足够通用、创作的门槛降到足够低,是为了让每个普通人的创意涌现出来。” 商业模式 陈炜鹏对我们坦言,现阶段对Loopit而言,谈商业化还为时尚早:“ 过早讨论一个社区型产品的商业化,是不专业的、不懂社区的行为。 ” 在陈炜鹏看来,产品仍在快速演进阶段,未来的商业模式很大程度上会与用户结构深度绑定,而当下的任何设计,都未必能完全匹配未来。 团队更关注的是另一件事:用户是否愿意在Loopit上持续停留,以及是否在这里产生足够深的体验。“只要用户的时间和体验深度成立,商业化的答案是可以被自然推导出来的。” Founder思考 过去分发的是信息,未来分发的是体验。 过去用户和内容的关系是观看,今天的关系变成了体验和参与。用户参与内容的形式又可以分成两种:一种是人参与内容,另一种是人与人通过内容产生连接。 AI时代,做70分但通用的产品,别做90分但垂直的产品。 做90分的产品是有代价的,你会过早收敛产品的形态。在技术不完全ready的情况下,做一个90分的垂类产品会错失未来智能增长红利。 大部分Agent看起来相似,真正拉开差距的是底层抽象能力。 底层抽象能力不仅决定了系统当前能完成多复杂的任务,也决定了未来是否具备持续扩展和演化的空间。 过早把产品边界定义得过于狭窄,往往会与未来技术的发展脱节。 在互动内容赛道中,如何定义边界、从哪些人群切入,本身仍然没有共识。 不少产品选择聚焦单一场景,例如小游戏或小发明。这种路径对技术能力的要求更集中,但也意味着对内容深度和完成度的预期更高,边界更容易被锁死。 Loopit则选择另一条路径——以“Make everything playable”为核心,构建一个通用的UGC表达平台。我们更看重底层能力的通用性,以及尽可能放大创作的可能性。 对于内容平台而言,真正重要的不是某一个具体场景,而是能否持续激发创意的涌现,从而不断产生让用户产生“Aha Moment”的内容。 产品内容越复杂,内容入口就要越简单。 很多早期用户规模不小的产品最终做不大,除了市场空间限制,一个重要原因是入口过于复杂。 好的内容平台往往遵循同一原则:把复杂性封装在内容里,而不是暴露在入口上。 每一代优秀的产品设计,本质上都是技术驱动下的抽象升级。例如Feed流的出现,让用户始终在同一个认知框架内完成消费与切换,从而降低使用成本、提升分发效率,并放大平台的整体规模。 在大模型时代,这一逻辑进一步成立:产品不再由功能定义,而是成为承接能力涌现的载体。 欢迎交流!