indexing

标签

Cards List
#indexing

Open Source AI Gap Map

Simon Willison's Blog · 昨天 缓存

Current AI 发布了 Open Source AI Gap Map v0.1,这是一个包含421个开源AI产品的索引,涵盖软件、模型、数据集和硬件,其基础数据以MIT许可证发布。

0 人收藏 0 人点赞
#indexing

@lidangzzz: 我去年就跟你们说,用RAG和vector database一定是死路一条。正确做法是, 1. 正确用好memory; 2. 正确把内容分块,做好indexing,做好summarization; 3. 正确给agent提供search工具…

X AI KOLs Timeline · 昨天 缓存

作者批评RAG和向量数据库的方法,提出正确的做法包括用好memory、分块和索引、摘要、为agent提供搜索工具,以及使用SRAM-only推理服务如Groq和Cerebras。

0 人收藏 0 人点赞
#indexing

@Greptime: trace_id 是高基数——所以小米智慧工厂团队没有使用倒排索引。他们使用了 Bloom 跳跃索引…

X AI KOLs Following · 2026-06-23 缓存

小米智慧工厂用 GreptimeDB 替换了 Loki 进行日志存储,每月处理数十亿行数据,并采用了定制化索引:针对高基数的 trace_id 使用 Bloom 跳跃索引,针对低基数字段使用倒排索引,并对消息体进行全文搜索。

0 人收藏 0 人点赞
#indexing

RL-Index: 强化学习的检索索引推理

Hugging Face Daily Papers · 2026-06-15 缓存

RL-Index 提出了一种基于强化学习的智能索引框架,通过用LLM生成的解释来扩充文档,将推理从查询阶段转移到索引阶段,从而提升检索效果并降低在线延迟。

0 人收藏 0 人点赞
#indexing

@LearnWithBrij:别再像2022年那样构建RAG了。分块→嵌入→检索→生成 这条流水线能用……直到你尝试上线……

X AI KOLs Timeline · 2026-06-13 缓存

一个帖子解释了构建生产级RAG超越简单分块-嵌入-检索-生成所需的四个关键层次:智能查询路由、高级索引、多类型检索和持续评估。

0 人收藏 0 人点赞
#indexing

@antoine_chaffin: 无论你是GPU匮乏者还是GPU富裕者,今天发布的PyLate总有一款适合你!GPU追求者:MaxSim内核显著…

X AI KOLs Following · 2026-06-11 缓存

PyLate的发布引入了MaxSim内核,用于GPU加速训练,内存需求更低;以及TACHIOM,用于在CPU上实现快速多向量索引和搜索。

0 人收藏 0 人点赞
#indexing

FAISS内部:十亿级相似性搜索

Hacker News Top · 2026-06-04 缓存

教育性文章,解释FAISS(一个用于十亿级相似性搜索的库),涵盖向量嵌入、最近邻搜索以及IVF和Product Quantization等高效检索技术。

0 人收藏 0 人点赞
#indexing

IBM Confidential: System/360 File Organization [video]

Hacker News Top · 2026-05-24 缓存

该视频深入介绍了IBM System/360的文件组织方式,涵盖顺序与随机数据的处理、索引机制、设备独立性及成本优势,属于历史技术回顾。

0 人收藏 0 人点赞
#indexing

我构建了一个包含300万篇arXiv论文的模型上下文协议(MCP)索引,用于LLMs。[D]

Reddit r/MachineLearning · 2026-05-19

一位开发者构建了一个包含300万篇arXiv论文的模型上下文协议(MCP)索引,以帮助LLMs检索准确的研究引用并减少幻觉,现正在寻找测试者提供反馈。

0 人收藏 0 人点赞
#indexing

@GithubProjects: CocoIndex 将你的代码库、文档、PDF、Slack、会议记录甚至视频转化为 AI 持续更新的上下文…

X AI KOLs Timeline · 2026-05-07

CocoIndex 是一款工具,通过增量更新来自代码库、文档、PDF、Slack、会议记录和视频的嵌入向量、摘要和知识图谱,为 AI 代理提供持续新鲜的上下文。

0 人收藏 0 人点赞
#indexing

如何使用索引优化 MongoDB 查询性能

Hacker News Top · 2026-05-06 缓存

本教程介绍如何通过索引优化 MongoDB 查询性能,演示如何识别慢查询、应用复合索引,以及使用 VisuaLeaf 工具进行可视化管理。内容涵盖查询性能分析、索引推荐策略及常见索引误区。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈