标签
一个精选的推文串,涵盖了三篇引人注目的人工智能论文:用于高效长上下文推理的MiniMax Sparse Attention、用于自我改进智能体框架的Self-Harness,以及用于衡量智能体经济价值的Agents' Last Exam基准测试。
推荐一个免费网站 sophon.at/papers,聚合最新 AI 论文和模型基准测试,界面干净,支持按 Trending 或周/月筛选,每篇论文直接关联所用 benchmark 和 model。
一个名为 Paper Deck 的开源工具,聚合来自 arXiv 和 Hugging Face 的 AI/ML 论文,支持阅读、收藏以及跨设备进度追踪。
本周(5月31日至6月7日)值得关注的AI研究论文摘要,包括LEAP、AutoLab以及智能体框架的扩展定律等。
每周精选AI论文综述,涵盖MIT的自我修正发现系统、智能体自我进化解析,以及谷歌使用智能体框架进行形式数学的LEAP系统。
三篇值得关注的人工智能论文综述:SkillOpt 将技能文档视为可训练参数以优化冻结的智能体;一种新方法将智能体工作流编译成模型权重,实现100倍成本降低;而 AutoScientists 引入了一个去中心化智能体团队,无需中央规划者即可进行长期科学研究。
精选的5月25-31日顶级AI论文综述,涵盖多智能体世界建模、视觉-语言-动作模型、智能体技能优化和对齐框架。
来自Hugging Face的Niels宣布复兴PapersWithCode,新平台为paperswithcode.co,能够大规模解析高影响力的AI论文,并自动生成排行榜和基准测试,融合了热门论文、领域分类以及外部论文支持等功能。
个人收藏的 1,400 篇精心挑选的 Arxiv 白皮书,涉及推理、强化学习、对齐等主题,现已在线上提供语义搜索和可浏览的概念联系,使用 Obsidian 和 Claude 构建。
一份精心挑选的顶级AI论文列表,涵盖5月11日至17日期间,包括AEvo、δ-mem、AutoTTS、AI Co-Mathematician、Lighthouse Attention等论文。
一份关于5月11日至17日顶级人工智能论文的综述,涵盖了用于长上下文预训练的Lighthouse Attention、grep与嵌入检索在编码代理中的对比,以及揭示LLMs中几何计算器的机制可解释性工作。
本周 AI 研究论文精选汇总,涵盖 Conductor、HeavySkill、Horizon Generalization、合成计算机、自我改进预训练以及用于井字棋变体(Connect Four)的 AlphaZero 等主题。
TraceScope 提供了一个基于交互式网页的工具,用于探索 arXiv 上最新人工智能论文的语义流,其开源库可在 GitHub 上获取。