@akshay_pachaar: 将任何论文转化为可运行代码。只需在论文URL中将arxiv替换为autoarxiv,即可将论文交给AI代理……

X AI KOLs Following 工具

摘要

autoarxiv 让你只需将 URL 改为 autoarxiv.org,就能将任何 arxiv 论文转换为可运行代码。来自 alphaXiv 的 AI 代理会阅读论文、克隆仓库、配置依赖项,并运行最小复现来验证声明,实时记录所有内容。

将任何论文转化为可运行代码。 只需在论文URL中将arxiv替换为autoarxiv。 这会将该论文交给来自alphaXiv的AI代理。它会阅读摘要、声明以及关联的GitHub仓库,然后克隆代码库并处理常见的设置难题,如依赖项、损坏的路径、环境配置和硬件假设。 然后它会设计一个最小复现方案。这意味着使用更小的模型、更少的步骤以及单个GPU而非集群,缩小规模至刚好能测试主要声明是否成立。 整个过程是实时的且完全记录。损失曲线、指标和训练进度均可实时观察。 返回的是一个明确信号,表明最小运行是否与论文报告的结果一致,此外还会估算完整复现所需的计算和时间成本。 许多研究代码在设置阶段就夭折了,尚未有人验证过任何一个数字。这项服务将复现工作从一整个周末的调试变成一次URL更改。 挑选一篇论文立即尝试。 视频致谢:@askalphaxiv
查看原文
查看缓存全文

缓存时间: 2026/06/22 01:30

将任何论文转化为可运行的代码。

只需将论文URL中的 arxiv 替换为 autoarxiv。

这样就会把论文交给 alphaXiv 的 AI 代理。它会阅读摘要、声明以及关联的 GitHub 仓库,然后克隆代码库,并处理常见的环境配置痛点,比如依赖项、损坏的路径、环境配置及硬件假设。

接着,它会设计一个最小的复现方案。这意味着使用更小的模型、更少的步骤、单 GPU 而非集群,适当缩小规模,仅用于测试标题中的声明是否成立。

整个运行过程是实时且全程记录的。损失曲线、评估指标和训练进度均可实时观测。

最后返回的是一个清晰的信号:最小化运行结果是否与论文报告的结论一致,同时给出完整复现所需计算资源和时间的估算。

大量研究代码在任何人验证一个数字之前就倒在了环境配置上。这项技术将复现从数小时的调试工作简化为一次 URL 替换。

选一篇论文,现在试试。

视频鸣谢:@askalphaxiv

网页抓取将从此不同。

(100% 开源的大规模视觉搜索)

PixelRAG 是一个完全跳过 HTML 解析的检索系统。

它不再将页面解析为文本并切分嵌入,而是对页面截图并检索图像。视觉语言模型直接从像素中读取答案。

为什么这很重要:解析正是 Web RAG 不知不觉丢失信息的地方。

  • 单个 HTML 转文本的解析器可能会丢失页面 40% 以上的内容。
  • 表格、图表和布局会被扁平化或丢弃。
  • 仅仅更换解析器,在同一份文档上准确率就可能波动约 10 个百分点。

PixelRAG 索引的是用户实际看到的页面。团队建立了整个维基百科的视觉索引,包含 3000 万以上截图,在纯文本问答任务上仍比最强的文本 RAG 基线高出 18.1%。

该仓库还附带一个 Claude Code 插件,让 Claude 拥有视觉能力。

它让 Claude 可以截图任意 URL 并读取渲染后的页面,而无需抓取 DOM。因此你可以把实时页面、arXiv 论文或本地站点交给它,询问它实际看起来的样子。

一个设置脚本即可完成。无需 MCP 服务器,无需后端。

流水线工作方式:

  • 将每个文档(网页、PDF、图像)渲染为图像块。
  • 使用 Qwen3-VL-Embedding(经 LoRA 在截图上微调)对图像块进行嵌入。
  • 构建 FAISS 索引并提供搜索 API。

更强的阅读器模型可以在不重新索引的情况下提升准确率,因为索引就是像素本身。

一切基于 Apache-2.0 开源。

GitHub 仓库:https://github.com/StarTrail-org/PixelRAG…

说到 RAG,我最近写了一篇文章,介绍了一种新方法,它通过将语料库大小缩减 40 倍、每次查询的 token 数减少 3 倍、向量搜索相关性提升 2.3 倍,使检索更加高效。

文章引用如下。

@akshay_pachaar 说实话,这对开发者来说是颠覆性的改变。环境配置的麻烦少了,意味着更多时间可以用来写代码。

相似文章

@gyro_ai: 复现一篇机器学习论文,最痛苦的是论文写得含糊,关键参数藏在附录里甚至压根没写,你大半时间在当侦探而不是写代码 paper2code 是个 Agent 技能,丢给它一个 arxiv 链接,它生成一份能跑的实现代码,1308 star htt…

X AI KOLs Timeline

Paper2code 是一个 AI Agent 技能,输入 arxiv 论文链接即可生成带有引用锚定的可运行实现代码,自动审计论文中的模糊之处并标记未指定部分,帮助研究者和工程师高效复现机器学习论文。

@_akhaliq: 论文:

X AI KOLs Following

一篇论文介绍了Arbor,这是一种AI框架,通过结合策略协调、隔离假设测试和持久知识树,实现跨多个领域的自主科学研究,并迭代改进研究成果。