IT之家 4 月 30 日消息,苹果公司携手加州大学圣迭戈分校团队,在新版论文《LaDiR:潜在扩散增强 LLM 文本推理》中提出新框架, 让大语言模型(LLM)在回答前并行探索多条推理路径,再用自回归方式输出提高结果质量。 IT之家援引博文介绍,该框架并非新模型,而是叠加在现有模型之上的通用框架,重点改变模型思考问题的方式。LaDiR 结合扩散(Diffusion)和自回归(Autoregression)两种主流生成范式,在推理阶段采用扩散模型,在最终输出阶段使用自回归模型。 这种混合架构有效提升了模型处理复杂问题的能力,既保留了扩散模型并行处理的优势,又延续了自回归模型生成的连贯性。 LaDiR 的独特之处在于其并行推理机制。系统在推理时会同时启动多条独立的推理路径,每条路径从随机噪声开始,通过扩散过程逐步优化成连贯的推理步骤。为防止所有路径过早收敛于同一结论,框架引入了特殊的多样性鼓励机制,确保每条路径能探索不同的解题思路,从而生成多样化的候选答案池。 研究团队在 Meta 的 LLaMA 3.1 8B 和 Qwen3-8B-Base 上部署测试。在数学基准测试中,LaDiR 取得了比现有方法更高的准确率,在面对更困难的分布外任务时表现尤为突出。在代码生成测试 HumanEval 中,该框架生成的代码更加可靠,在难题上的表现明显优于标准微调方法。 在谜题规划任务中,LaDiR 能探索更广泛的解空间,找到正确解的概率高于所有通用基准模型。不过,在单次尝试准确率上,它仍略逊于专门针对特定任务优化的专用模型。这表明通用框架在追求广泛适用性的同时,在极致专精领域仍有提升空间。 IT之家附上参考地址 LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning
36氪获悉,万兴科技在2026世界思维导图锦标赛期间宣布,旗下万兴脑图手绘模式开启公测。据了解,万兴脑图是国内业界首个实现AI一键生成手绘思维导图的专业脑图产品,进一步拓展脑图产品在知识可视化领域的应用边界。
国家发展改革委党组书记、主任郑栅洁在人民日报撰文《持续提升国家经济安全保障能力 以新安全格局保障新发展格局》。文章称,完善经济安全风险防控体系。树立底线思维和风险意识,做到居安思危、未雨绸缪,科学预见形势发展走势和隐藏其中的风险挑战,打好维护国家经济安全的总体战、主动战。加强宏观经济监测预测预警,提升动态监测、实时预警能力和水平,及时研究处置苗头性、倾向性、潜在性问题。健全反制裁、反干涉、反“长臂管辖”机制,防范反击外部对我极端遏制打压。加强贸易风险防控,完善出口管制和安全审查机制,依法保护外商投资权益。