@akshay_pachaar: 将任何论文转化为可运行代码。只需在论文URL中将arxiv替换为autoarxiv，即可将论文交给AI代理……

X AI KOLs Following 2026/06/21 12:30 工具

ai-agent reproducibility arxiv research paper-implementation automation

摘要

autoarxiv 让你只需将 URL 改为 autoarxiv.org，就能将任何 arxiv 论文转换为可运行代码。来自 alphaXiv 的 AI 代理会阅读论文、克隆仓库、配置依赖项，并运行最小复现来验证声明，实时记录所有内容。

将任何论文转化为可运行代码。只需在论文URL中将arxiv替换为autoarxiv。这会将该论文交给来自alphaXiv的AI代理。它会阅读摘要、声明以及关联的GitHub仓库，然后克隆代码库并处理常见的设置难题，如依赖项、损坏的路径、环境配置和硬件假设。然后它会设计一个最小复现方案。这意味着使用更小的模型、更少的步骤以及单个GPU而非集群，缩小规模至刚好能测试主要声明是否成立。整个过程是实时的且完全记录。损失曲线、指标和训练进度均可实时观察。返回的是一个明确信号，表明最小运行是否与论文报告的结果一致，此外还会估算完整复现所需的计算和时间成本。许多研究代码在设置阶段就夭折了，尚未有人验证过任何一个数字。这项服务将复现工作从一整个周末的调试变成一次URL更改。挑选一篇论文立即尝试。视频致谢：@askalphaxiv

查看原文

查看缓存全文

缓存时间: 2026/06/22 01:30

将任何论文转化为可运行的代码。

只需将论文URL中的 arxiv 替换为 autoarxiv。

这样就会把论文交给 alphaXiv 的 AI 代理。它会阅读摘要、声明以及关联的 GitHub 仓库，然后克隆代码库，并处理常见的环境配置痛点，比如依赖项、损坏的路径、环境配置及硬件假设。

接着，它会设计一个最小的复现方案。这意味着使用更小的模型、更少的步骤、单 GPU 而非集群，适当缩小规模，仅用于测试标题中的声明是否成立。

整个运行过程是实时且全程记录的。损失曲线、评估指标和训练进度均可实时观测。

最后返回的是一个清晰的信号：最小化运行结果是否与论文报告的结论一致，同时给出完整复现所需计算资源和时间的估算。

大量研究代码在任何人验证一个数字之前就倒在了环境配置上。这项技术将复现从数小时的调试工作简化为一次 URL 替换。

选一篇论文，现在试试。

视频鸣谢：@askalphaxiv

网页抓取将从此不同。

（100% 开源的大规模视觉搜索）

PixelRAG 是一个完全跳过 HTML 解析的检索系统。

它不再将页面解析为文本并切分嵌入，而是对页面截图并检索图像。视觉语言模型直接从像素中读取答案。

为什么这很重要：解析正是 Web RAG 不知不觉丢失信息的地方。

单个 HTML 转文本的解析器可能会丢失页面 40% 以上的内容。
表格、图表和布局会被扁平化或丢弃。
仅仅更换解析器，在同一份文档上准确率就可能波动约 10 个百分点。

PixelRAG 索引的是用户实际看到的页面。团队建立了整个维基百科的视觉索引，包含 3000 万以上截图，在纯文本问答任务上仍比最强的文本 RAG 基线高出 18.1%。

该仓库还附带一个 Claude Code 插件，让 Claude 拥有视觉能力。

它让 Claude 可以截图任意 URL 并读取渲染后的页面，而无需抓取 DOM。因此你可以把实时页面、arXiv 论文或本地站点交给它，询问它实际看起来的样子。

一个设置脚本即可完成。无需 MCP 服务器，无需后端。

流水线工作方式：

将每个文档（网页、PDF、图像）渲染为图像块。
使用 Qwen3-VL-Embedding（经 LoRA 在截图上微调）对图像块进行嵌入。
构建 FAISS 索引并提供搜索 API。

更强的阅读器模型可以在不重新索引的情况下提升准确率，因为索引就是像素本身。

一切基于 Apache-2.0 开源。

GitHub 仓库：https://github.com/StarTrail-org/PixelRAG…

说到 RAG，我最近写了一篇文章，介绍了一种新方法，它通过将语料库大小缩减 40 倍、每次查询的 token 数减少 3 倍、向量搜索相关性提升 2.3 倍，使检索更加高效。

文章引用如下。

@akshay_pachaar 说实话，这对开发者来说是颠覆性的改变。环境配置的麻烦少了，意味着更多时间可以用来写代码。

相似文章

@gyro_ai: 复现一篇机器学习论文，最痛苦的是论文写得含糊，关键参数藏在附录里甚至压根没写，你大半时间在当侦探而不是写代码 paper2code 是个 Agent 技能，丢给它一个 arxiv 链接，它生成一份能跑的实现代码，1308 star htt…

X AI KOLs Timeline

Paper2code 是一个 AI Agent 技能，输入 arxiv 论文链接即可生成带有引用锚定的可运行实现代码，自动审计论文中的模糊之处并标记未指定部分，帮助研究者和工程师高效复现机器学习论文。

@akshay_pachaar: 将任何论文转化为可运行代码。只需在论文URL中将arxiv替换为autoarxiv，即可将论文交给AI代理……

相似文章

@gyro_ai: 复现一篇机器学习论文，最痛苦的是论文写得含糊，关键参数藏在附录里甚至压根没写，你大半时间在当侦探而不是写代码 paper2code 是个 Agent 技能，丢给它一个 arxiv 链接，它生成一份能跑的实现代码，1308 star htt…

@_ar9av: 连续第6天每天阅读一篇关于AI的arXiv论文并分享真正印象深刻的内容：AutoSci（北京大学）概要：…

@AlphaSignalAI：Karpathy 将实验自动化。AutoResearchClaw 将整个实验室自动化。大多数 AI 研究工具只处理一步。这个……

@_akhaliq: 论文:

@DanKornas: 如果你想跟踪用于研究的AI智能体，难点不在于一篇论文——而在于整个生命周期。Awesome A…

提交意见反馈