deduplication

标签

Cards List
#deduplication

@pauliusztin_: 两个月前,我开始使用知识图谱构建统一记忆层。以下是我最常被问到的问题……

X AI KOLs Timeline · 2026-05-23 缓存

本帖子讨论了使用知识图谱构建统一记忆层的最佳实践,强调将实体解析(命名)与去重(身份)分离,以避免图污染。还重点介绍了使用像 PrefectIO 这样的编排工具,通过检查点和缓存来管理昂贵的 LLM 提取管道。

0 人收藏 0 人点赞
#deduplication

@ClementDelangue: 很高兴看到@CommonCrawl 使用并推荐 @huggingface Buckets 用于大规模不断演变的训练数据集!…

X AI KOLs Following · 2026-05-22 缓存

Hugging Face 宣布推出 Storage Buckets,这是一种适用于大规模不断演变的训练数据集的存储解决方案,内置 CDN 和去重功能,并获得 CommonCrawl 的推荐。

0 人收藏 0 人点赞
#deduplication

Velonus – 开源应用安全扫描器,去重SAST噪声

Hacker News Top · 2026-05-15 缓存

Velonus 是一个面向 Python 的开源应用安全扫描器,可通过一条命令运行五种安全工具,标准化发现结果并去重噪声,支持 SARIF 输出和 CI 集成。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈