@LTChives: 网络爬虫已死。 视频里这个 PixelRAG,完全跳过 HTML 解析。 它把网页直接截图,然后让视觉模型从像素里读答案。 以前 AI 读网页,是先拆代码、提文字、切段落。 现在它直接看页面。 100% 开源,还带 Claude Code…
摘要
PixelRAG 是一种新型开源工具,它绕过传统 HTML 解析,直接通过对网页截图并使用视觉模型从像素中提取答案,并支持 Claude Code 插件,让 Claude 具备视觉能力。
查看缓存全文
缓存时间: 2026/06/22 17:49
网络爬虫已死。
视频里这个 PixelRAG,完全跳过 HTML 解析。
它把网页直接截图,然后让视觉模型从像素里读答案。
以前 AI 读网页,是先拆代码、提文字、切段落。
现在它直接看页面。
100% 开源,还带 Claude Code 插件,让 Claude 拥有“眼睛”。https://t.co/OOfYF604xQ
相似文章
@RoundtableSpace: 网页抓取已死。PixelRAG 完全跳过 HTML 解析。它截取页面截图,视觉模型直接读取答案…
PixelRAG 是一款开源工具,通过使用截图和视觉模型从网页中提取数据,取代了传统的网页抓取。它包含一个 Claude Code 插件。
@akshay_pachaar: 网页抓取将彻底改变。(100%开源的大规模视觉搜索) PixelRAG是一种检索系统,可跳过…
PixelRAG是一种开源检索系统,它通过截取网页截图并使用视觉语言模型直接从像素中读取答案,从而绕过HTML解析,声称相比基于文本的RAG有显著的准确率提升。
@0xMulight: Claude Code终极爬虫手册:5大开源Skill让AI真正会上网干活 想让Claude别再只是聊天工具,而是直接上手抓数据、操作网页、批量处理内容?下面这套组合就是最实用的方案。 我把方案整理成这份手册,可以直接复制给Claude …
本文介绍了5个开源工具(Agent-reach、Scrapling、Browser-use、Claude in Chrome、Web-access),让Claude Code等AI Agent具备网页数据抓取、浏览器操作等能力,从轻量到重量级覆盖不同场景,并提供配置心法。
@VincentLogic: 截图丢进去,AI 直接吐出 HTML 代码。手绘草图也能识别 香港中文大学开源的 ScreenCoder,GitHub 2.7k Star 视频里演示了三个案例: -YouTube 首页截图 → 还原出完整网页布局 -Google 搜索页…
香港中文大学开源了 ScreenCoder,一款能够将截图或手绘草图直接转换为可编辑 HTML 代码的 AI 工具,GitHub 上已获得 2.7k Star。
@axichuhai: 这个阿里的开源项目page-agent,能让你用自然语言控制网页界面,在 GitHub 已经斩获 18.7K star。 它把 AI agent 直接塞进网页里,然后你用自然语言指挥它点按钮、填表单、跳流程都行。 它不需要 headles…
阿里开源项目 Page-Agent 让你通过自然语言直接操控网页界面,无需 headless 浏览器或多模态模型,已在 GitHub 获得 18.7K star。