标签
Current AI 发布了 Open Source AI Gap Map v0.1,这是一个包含421个开源AI产品的索引,涵盖软件、模型、数据集和硬件,其基础数据以MIT许可证发布。
作者批评RAG和向量数据库的方法,提出正确的做法包括用好memory、分块和索引、摘要、为agent提供搜索工具,以及使用SRAM-only推理服务如Groq和Cerebras。
小米智慧工厂用 GreptimeDB 替换了 Loki 进行日志存储,每月处理数十亿行数据,并采用了定制化索引:针对高基数的 trace_id 使用 Bloom 跳跃索引,针对低基数字段使用倒排索引,并对消息体进行全文搜索。
RL-Index 提出了一种基于强化学习的智能索引框架,通过用LLM生成的解释来扩充文档,将推理从查询阶段转移到索引阶段,从而提升检索效果并降低在线延迟。
一个帖子解释了构建生产级RAG超越简单分块-嵌入-检索-生成所需的四个关键层次:智能查询路由、高级索引、多类型检索和持续评估。
PyLate的发布引入了MaxSim内核,用于GPU加速训练,内存需求更低;以及TACHIOM,用于在CPU上实现快速多向量索引和搜索。
教育性文章,解释FAISS(一个用于十亿级相似性搜索的库),涵盖向量嵌入、最近邻搜索以及IVF和Product Quantization等高效检索技术。
该视频深入介绍了IBM System/360的文件组织方式,涵盖顺序与随机数据的处理、索引机制、设备独立性及成本优势,属于历史技术回顾。
一位开发者构建了一个包含300万篇arXiv论文的模型上下文协议(MCP)索引,以帮助LLMs检索准确的研究引用并减少幻觉,现正在寻找测试者提供反馈。
CocoIndex 是一款工具,通过增量更新来自代码库、文档、PDF、Slack、会议记录和视频的嵌入向量、摘要和知识图谱,为 AI 代理提供持续新鲜的上下文。
本教程介绍如何通过索引优化 MongoDB 查询性能,演示如何识别慢查询、应用复合索引,以及使用 VisuaLeaf 工具进行可视化管理。内容涵盖查询性能分析、索引推荐策略及常见索引误区。