@akshay_pachaar: 将任何论文转化为可运行代码。只需在论文URL中将arxiv替换为autoarxiv,即可将论文交给AI代理……
摘要
autoarxiv 让你只需将 URL 改为 autoarxiv.org,就能将任何 arxiv 论文转换为可运行代码。来自 alphaXiv 的 AI 代理会阅读论文、克隆仓库、配置依赖项,并运行最小复现来验证声明,实时记录所有内容。
查看缓存全文
缓存时间: 2026/06/22 01:30
将任何论文转化为可运行的代码。
只需将论文URL中的 arxiv 替换为 autoarxiv。
这样就会把论文交给 alphaXiv 的 AI 代理。它会阅读摘要、声明以及关联的 GitHub 仓库,然后克隆代码库,并处理常见的环境配置痛点,比如依赖项、损坏的路径、环境配置及硬件假设。
接着,它会设计一个最小的复现方案。这意味着使用更小的模型、更少的步骤、单 GPU 而非集群,适当缩小规模,仅用于测试标题中的声明是否成立。
整个运行过程是实时且全程记录的。损失曲线、评估指标和训练进度均可实时观测。
最后返回的是一个清晰的信号:最小化运行结果是否与论文报告的结论一致,同时给出完整复现所需计算资源和时间的估算。
大量研究代码在任何人验证一个数字之前就倒在了环境配置上。这项技术将复现从数小时的调试工作简化为一次 URL 替换。
选一篇论文,现在试试。
视频鸣谢:@askalphaxiv
网页抓取将从此不同。
(100% 开源的大规模视觉搜索)
PixelRAG 是一个完全跳过 HTML 解析的检索系统。
它不再将页面解析为文本并切分嵌入,而是对页面截图并检索图像。视觉语言模型直接从像素中读取答案。
为什么这很重要:解析正是 Web RAG 不知不觉丢失信息的地方。
- 单个 HTML 转文本的解析器可能会丢失页面 40% 以上的内容。
- 表格、图表和布局会被扁平化或丢弃。
- 仅仅更换解析器,在同一份文档上准确率就可能波动约 10 个百分点。
PixelRAG 索引的是用户实际看到的页面。团队建立了整个维基百科的视觉索引,包含 3000 万以上截图,在纯文本问答任务上仍比最强的文本 RAG 基线高出 18.1%。
该仓库还附带一个 Claude Code 插件,让 Claude 拥有视觉能力。
它让 Claude 可以截图任意 URL 并读取渲染后的页面,而无需抓取 DOM。因此你可以把实时页面、arXiv 论文或本地站点交给它,询问它实际看起来的样子。
一个设置脚本即可完成。无需 MCP 服务器,无需后端。
流水线工作方式:
- 将每个文档(网页、PDF、图像)渲染为图像块。
- 使用 Qwen3-VL-Embedding(经 LoRA 在截图上微调)对图像块进行嵌入。
- 构建 FAISS 索引并提供搜索 API。
更强的阅读器模型可以在不重新索引的情况下提升准确率,因为索引就是像素本身。
一切基于 Apache-2.0 开源。
GitHub 仓库:https://github.com/StarTrail-org/PixelRAG…
说到 RAG,我最近写了一篇文章,介绍了一种新方法,它通过将语料库大小缩减 40 倍、每次查询的 token 数减少 3 倍、向量搜索相关性提升 2.3 倍,使检索更加高效。
文章引用如下。
@akshay_pachaar 说实话,这对开发者来说是颠覆性的改变。环境配置的麻烦少了,意味着更多时间可以用来写代码。
相似文章
@gyro_ai: 复现一篇机器学习论文,最痛苦的是论文写得含糊,关键参数藏在附录里甚至压根没写,你大半时间在当侦探而不是写代码 paper2code 是个 Agent 技能,丢给它一个 arxiv 链接,它生成一份能跑的实现代码,1308 star htt…
Paper2code 是一个 AI Agent 技能,输入 arxiv 论文链接即可生成带有引用锚定的可运行实现代码,自动审计论文中的模糊之处并标记未指定部分,帮助研究者和工程师高效复现机器学习论文。
@_ar9av: 连续第6天每天阅读一篇关于AI的arXiv论文并分享真正印象深刻的内容:AutoSci(北京大学)概要:…
一条推文介绍北京大学开发的AutoSci系统,该系统可自动化从文献调研到回复审稿意见的整个研究流程,并在项目间进行自我改进。
@AlphaSignalAI:Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……
AutoResearchClaw 是一个 GitHub 仓库,它能够将整个 AI 研究流程自动化——从想法到完整的会议论文,包含真实的实验、经过验证的引用和可运行的代码,在 55 个主题的基准测试中,比之前的自主研究系统性能提升 54.7%。
@_akhaliq: 论文:
一篇论文介绍了Arbor,这是一种AI框架,通过结合策略协调、隔离假设测试和持久知识树,实现跨多个领域的自主科学研究,并迭代改进研究成果。
@DanKornas: 如果你想跟踪用于研究的AI智能体,难点不在于一篇论文——而在于整个生命周期。Awesome A…
一个精选的GitHub资源,将AI辅助的科研工具和论文映射到整个研究生命周期,从创意生成到成果传播。