IT之家 4 月 30 日消息,苹果公司携手加州大学圣迭戈分校团队,在新版论文《LaDiR:潜在扩散增强 LLM 文本推理》中提出新框架, 让大语言模型(LLM)在回答前并行探索多条推理路径,再用自回归方式输出提高结果质量。 IT之家援引博文介绍,该框架并非新模型,而是叠加在现有模型之上的通用框架,重点改变模型思考问题的方式。LaDiR 结合扩散(Diffusion)和自回归(Autoregression)两种主流生成范式,在推理阶段采用扩散模型,在最终输出阶段使用自回归模型。 这种混合架构有效提升了模型处理复杂问题的能力,既保留了扩散模型并行处理的优势,又延续了自回归模型生成的连贯性。 LaDiR 的独特之处在于其并行推理机制。系统在推理时会同时启动多条独立的推理路径,每条路径从随机噪声开始,通过扩散过程逐步优化成连贯的推理步骤。为防止所有路径过早收敛于同一结论,框架引入了特殊的多样性鼓励机制,确保每条路径能探索不同的解题思路,从而生成多样化的候选答案池。 研究团队在 Meta 的 LLaMA 3.1 8B 和 Qwen3-8B-Base 上部署测试。在数学基准测试中,LaDiR 取得了比现有方法更高的准确率,在面对更困难的分布外任务时表现尤为突出。在代码生成测试 HumanEval 中,该框架生成的代码更加可靠,在难题上的表现明显优于标准微调方法。 在谜题规划任务中,LaDiR 能探索更广泛的解空间,找到正确解的概率高于所有通用基准模型。不过,在单次尝试准确率上,它仍略逊于专门针对特定任务优化的专用模型。这表明通用框架在追求广泛适用性的同时,在极致专精领域仍有提升空间。 IT之家附上参考地址 LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning
4 月 29 日,据 CNBC 报道,美国国防部 AI 负责人卡梅伦 · 斯坦利 (Cameron Stanley) 周二证实,美国国防部正扩大对谷歌 Gemini AI 模型的使用。就在大约两个月前,美国防部已将 Anthropic 列为供应链风险,并终止了与其合作。 此前,知情人士透露,美国国防部正将谷歌最新模型用于机密项目。 图注:谷歌 Gemini 站 The Information 援引知情人士的话报道称,谷歌已与美国国防部签署了一份将 AI 用于机密工作的协议。 斯坦利在接受 CNBC 视频采访时确认,除了 Gemini,五角大楼还在与 OpenAI 及其他供应商合作,以实现其作战能力的现代化。 “过度依赖单一供应商绝非好事,”他说,“尤其是在软件领域,我们亲眼看到了这一点。” 美国国防部采用谷歌 AI 模型,正值其与 Anthropic 陷入激烈法律纠纷之际。本月早些时候,华盛顿一家联邦上诉法院驳回了 Anthropic 提出的暂时阻止国防部将其列入黑名单的请求。 相关阅读: 《 既合作又竞争,谷歌拟向 Anthropic 投资至高 400 亿美元 》 《 Anthropic 二级市场估值飙升至 1 万亿美元,反超 OpenAI 》 《 Anthropic 回应被美国列为国家安全风险实体:将以象征性成本向政府提供 AI 模型及工程师支持 》 《 改用 OpenAI:美国财政部等部门开始全面停用 Anthropic Claude 》 《 被美政府列为供应链风险,Anthropic 称今年可能因此损失数十亿美元 》 《 联邦法官:美国政府似乎只是想报复 Anthropic,而非为了保护国家安全 》 《 Anthropic 起诉白宫获阶段性胜利:美国政府涉嫌违宪,Claude 禁令被叫停 》 《 Anthropic 上诉受挫:美法院拒绝阻止美国国防部将其列入黑名单 》 《 无视特朗普禁令,美联邦机构偷偷测试 Anthropic 新模型 Claude Mythos 》
IT之家 4 月 26 日消息,在今天的“鸿蒙智行会客厅”直播活动中,华为常务董事、产品投资评审委员会主任、终端 BG 董事长余承东谈到了中国汽车市场的竞争。 余承东表示,今天的中国市场已经进入到一个更加体系化竞争的这种阶段, 靠单一的某一个技术或者某一项东西,很难赢得这个竞争 ,要靠综合的体系化的竞争才能赢得市场的胜利。 余承东提到,除华为车 BU 引望公司的全套解决方案,包括智能化的智能驾驶 / 智能座舱 / 智能车控解决方案、智能电动解决方案、智能网联解决方案外,鸿蒙智行还会把华为十几年来积累的 ToC 的能力在真正赋能车厂。 余承东强调,把品牌定义、产品设计、核心技术、质量流程、全生命周期升级与维护、服务体系、渠道零售、品牌营销等结合起来 最完整的就是鸿蒙智行 。