构建了一款从 PDF 中映射研究空白点的工具——处于测试阶段,期待机器学习研究人员来“挑刺”

Reddit r/AI_Agents 工具

摘要

作者介绍了 Papira,这是一款测试阶段的工具,可分析上传的研究论文,以映射机器学习与自然语言处理(NLP)子领域内的覆盖情况并识别研究空白。

我开发了 Papira 来解决我自己的痛点:在撰写论文之前,了解某个子领域当前的研究现状。只需上传该研究领域的 3 篇论文,该工具就能一次性构建覆盖矩阵(涵盖问题、方法、基准测试以及存在的研究空白)。目前处于测试阶段,因此尚不完美。在处理经验性机器学习、NLP 或系统类论文时效果最佳。如果未能生成结果,可全额退款。
查看原文

相似文章

Show HN: 学术论文版 TikTok

Hacker News Top

Papel 是一个以研究为导向的新型社交平台,利用 AI 驱动的向量搜索和设备端 RAG,帮助研究人员发现、讨论学术论文并进行自我测验。它提供个性化信息流、通过 Apple Intelligence 或 MLX 进行本地 AI 聊天,以及游戏化学习功能。

PaperBench:评估AI复现AI研究的能力

OpenAI Blog

OpenAI推出PaperBench,一个评估AI代理复现最先进AI研究能力的基准。该基准通过复现20篇ICML 2024论文,包含8,316个可评分任务。表现最好的模型(Claude 3.5 Sonnet)仅达到21%的复现分数,低于人类博士级别的表现,凸显了当前自主研究能力的局限性。