data-processing

标签

Cards List
#data-processing

对于能感知屏幕的AI,隐私问题不仅仅是“它看到了什么”,更是“它看到的内容去了哪里”。

Reddit r/ArtificialInteligence · 2026-05-29

一篇探讨读取屏幕的AI工具所引发的隐私顾虑的文章,质疑屏幕内容是否离开用户设备,并讨论了仅本地处理或明确披露的必要性。

0 人收藏 0 人点赞
#data-processing

@lhoestq: 你不知道你其实需要本地 Common Crawl

X AI KOLs Timeline · 2026-05-22 缓存

了解如何设置并在本地使用 Common Crawl 数据进行网页数据处理任务。

0 人收藏 0 人点赞
#data-processing

@VikParuchuri:本周我们将处理约 10 亿页内容。@datalabto 团队在跨数千个 GPU 编排我们的模型方面做出了令人惊叹的工作……

X AI KOLs Following · 2026-05-11 缓存

DataLab 团队本周正在数千个 GPU 上编排 AI 模型,以处理约 10 亿页内容,彰显了显著的大规模文档处理能力。

0 人收藏 0 人点赞
#data-processing

@rwayne: 太屌了学术论文搭本地知识库,瓶颈一直在 PDF 怎么干净转 md。OpenDataLoader-PDF 把这道题做到了 0.907 准确率 开源 PDF 解析榜第一全套 Apache 2.0。 200 篇真实论文测试集的关键数字 总分 0…

X AI KOLs Timeline · 2026-05-10

OpenDataLoader-PDF 是一款开源 PDF 解析工具,在真实学术论文测试中达到 0.907 的高准确率,支持将复杂的 PDF 文档(含表格、公式、扫描件)高效转换为 Markdown 和 JSON,非常适合本地知识库和 RAG 应用。

0 人收藏 0 人点赞
#data-processing

@cmpatino_:用了一段时间 ml-intern,它真的改变了我的工作流。它在以下方面特别强:- 模型/数据集发现……

X AI KOLs Following · 2026-04-21 缓存

开发者盛赞 ml-intern 工具,称其极大简化了模型/数据集发现、训练后迭代与数据处理流程。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈