大型语言模型能否重塑基础算法?
摘要
# 论文页面 - 大型语言模型能否重塑基础算法? 来源:[https://huggingface.co/papers/2604.05716](https://huggingface.co/papers/2604.05716) **在我们让 LLM“遗忘”之后,它们还能从零重塑 Dijkstra、Euclid 等基础算法吗?** 我们 loosely 将 Hassabis 的“爱因斯坦测试”搬到算法领域:先用“反学习”把目标算法从模型中抹去,再检验它能否独立重新发明。最新研究表明 LLM 具备这种潜力。
查看缓存全文
缓存时间: 2026/04/21 07:21
论文页面 - 大语言模型能否重新发明基础算法?
来源:https://huggingface.co/papers/2604.05716
在我们让大模型“忘掉”之后,它们还能重新发明基础算法吗? 我们 loosely 地把哈萨比斯的“爱因斯坦测试”搬到算法领域:针对每个目标算法(Dijkstra、欧几里得等),先通过“反学习”把它从 LLM 里抹掉,再测试模型能否从零开始重新发明。
最新研究表明,LLM 能发现新算法并完成高阶科研。但它们能否更进一步——发明那些似乎需要更大创造性跳跃的基础算法?我们提出 Unlearn-and-Reinvent 流水线来研究这一问题。
⭐ 在 3 个强开源权重模型上测试,包括 Qwen3-4B-Thinking-2507、Qwen3-4B-Instruct-2507 和 Ministral-3-14B-Reasoning-2512
⭐ 模型似乎能在“反学习”后重新发明具有直观贪心/分治结构的算法(如 Dijkstra、欧几里得)
⭐ 需要非显然数据结构或反直觉不变量的算法(KMP、Manacher、Strassen)在所有受测模型上均未成功
📌 更多发现:除了核心再发明任务,我们还表明测试时 RL 可进一步提升再发明表现;同时,我们识别出一种名为“思维坍缩”的失效模式——模型输出在多次再发明尝试中越来越短,并证明生成式验证器能有效缓解该问题。
🤖 亲自试试——和“忘掉”了 Dijkstra 算法的模型聊天:https://huggingface.co/spaces/jzhao1122/qwen3-thinking-dijkstra
📄 论文:https://arxiv.org/abs/2604.05716
💻 代码与模型:https://huggingface.co/algo-reinvention
相似文章
原生可遗忘的大语言模型
该论文提出了NULLs(原生可遗忘的大语言模型),这是一种模型类别,它将特定来源的贡献隔离到稀疏激活的sinks中,同时共享骨干神经元,从而无需重新训练即可干净地遗忘单个数据源,并保持通用语言能力。
模型遗忘目标因语言功能不同而异
本文认为,LLM中的遗忘应依赖于目标,提出了一种基于余弦的元学习RMU变体用于危险知识遗忘,以及一种结合探针方向的多层目标用于毒性遗忘,在四个7-8B模型上取得了显著效果。
PreUnlearn:在大语言模型遗忘前审计附带知识损害
本文提出了PreUnlearn,一个在LLM遗忘执行前审计附带知识损害的框架,采用以数据为中心的分析来预测跨语义层的下游损害。
大型语言模型是否适用于图计算?进展与展望
本综述回顾了大型语言模型在图计算中的应用,将其分为两种范式:LLM作为执行器和LLM作为规划器。研究发现,LLM在简单任务上表现良好,但在大规模精确计算方面不可靠,并提出了未来方向。
学习如何让大语言模型进行推理
OpenAI 发布了一篇文章,通过密码破译示例探索大语言模型的推理技术,展示了语言模型的逐步问题求解和模式识别能力。