@itarutomy: 一篇从头重建AI Agent研究"知识基础设施"的论文 (https://arxiv[.]org/html…
摘要
本文介绍了Agents-K1,一个基于246万篇论文构建的知识图谱系统,通过整合文本、图形、表格和方程式,以及五级引用分类,提升了AI Agent研究。它显著提高了Gemini-3和GPT-5.2等顶级模型在基准测试中的表现,表明优化知识结构比扩大模型规模更有效。
查看缓存全文
缓存时间: 2026/06/29 14:28
一篇从零重建AI Agent研究“知识基础设施”的论文(https://arxiv[.]org/html/2606.13669v1)。上海AI实验室(PJLab)基于246万篇论文构建了一个名为“Agents-K1“的知识图谱系统。
现有RAG(检索增强生成)的问题在于其结构粗糙。它只将文本存储为“主语-谓语-宾语“三元组,忽略了图表、表格和公式。引用仅记录为“是否被引用“。这对于需要在多份证据间进行推理的研究型Agent来说远远不够。
Agents-K1改变了这一点。它将文本、图形、表格和公式视为同等重要的证据,并将知识组织为五个模块。其独特之处在于引用分类:按五级量表记录引用,从“没有这篇论文就不会有当前成果(第5级)“到“仅仅是背景介绍(第1级)”。能保留“为什么被引用“这一意图的知识图谱非常少见。
抽取模型仅使用4B参数。在8块GPU上使用一种强化学习(GRPO)训练约一小时,便在10项基准测试中8项超越8B模型,甚至在命名实体识别(识别文本中技术术语等任务)上超越了32B模型。
在具有挑战性的学术论文基准“FrontierScience-Research“上,Gemini-3从7.9%提升至24.6%,GPT-5.2从25.2%提升至39.4%。地球科学领域的推理准确率从52.3%提升至69.5%。在多文档多跳问答任务中,它也胜过所有现有的九种方法。
这篇论文展示了,将论文进行“知识图谱化”这类看似基础的基建工作,能极大提升顶级模型的性能。它揭示了一个方向:优化输入知识的结构,比单纯扩大模型本身更有效。
相似文章
知识代理:通过更好的结构超越前沿模型(18分钟阅读)
文章介绍了‘知识代理’,这是一种通过混合检索系统将相关知识注入AI代理的方法论,使得较小的模型在金融、政策、医疗等专业领域超越大型前沿模型。
@_avichawla:为你的Agent构建类人记忆(开源)!每个智能体和RAG系统在实时知识方面都面临挑战……
Graphiti是一个开源工具,通过持续演进且具有时间感知的知识图谱,为AI代理构建类人记忆,相比MemGPT,准确率最高提升18.5%,延迟降低90%。
@pauliusztin_: 我花了几个月优化GraphRAG检索。但结果发现我优化错了方向……最大的知识…
一份关于为AI智能体优化知识图谱摄入的详细指南,提出了一个五步流水线(提取、解析、嵌入、去重、路由),以防止图谱损坏并提高检索质量。
@omarsar0:关于AI代理如何重塑知识工作的新论文。这是一篇不错的关于代理实际改变知识工作的经济学文章。
本研究使用Perplexity的生产数据来分析AI代理如何重塑知识工作,发现代理将时间和成本降低超过87%,提高质量,并扩大自动化任务的范围。
@dair_ai: 关于自我改进智能体的优秀论文:
本周一篇重要的AI论文探讨了自我改进智能体是否真正发现新知识,还是仅仅在重新混合现有信息。