@techwith_ram:一个1000万文档的语料库以float32格式占用31GB内存。大多数团队遇到这一瓶颈后会转向托管向量数据库。每月400美元……

X AI KOLs Timeline 工具

摘要

turbovec 是一个开源的 Rust 向量索引,使用 Google Research 的 TurboQuant 算法,实现了16倍压缩,搜索速度比 FAISS 更快,并且集成了 LangChain、LlamaIndex 和 Haystack 等 RAG 框架。

一个包含1000万文档的语料库以float32格式占用31GB内存。大多数团队遇到这一瓶颈后,会转向托管向量数据库。每月400美元或800美元。每添加一个文档都要扩展。然后一位独立工程师发布了 turbovec。turbovec 是一个开源的 Rust 向量索引,基于 Google Research 的 TurboQuant 算法。它可以将同样的1000万语料库压缩到4GB,并且搜索速度比 FAISS 更快。以下是它的不同之处:→ 零训练。零数据遍历 → 对1536维向量实现16倍压缩 → 在ARM上比 FAISS IndexPQFastScan 快12-20% → 内置 NEON (ARM) + AVX-512BW (x86) SIMD 内核 → IdMapIndex 支持稳定ID,删除后仍存在 → Python 绑定,集成 LangChain、LlamaIndex 和 Haystack → 完全本地化。无需托管服务。Rust核心。Python 绑定发布在 PyPI。基于 Google Research 的 TurboQuant。针对 ARM 和 x86 进行了 SIMD 优化。集成了所有主流 RAG 框架。
查看原文

相似文章

RyanCodrai/turbovec

GitHub Trending (daily)

turbovec 是一个基于 Rust 的向量索引,带有 Python 绑定,实现了谷歌的 TurboQuant 算法,提供高效的向量搜索,支持在线摄入,性能优于 FAISS,并具备过滤搜索能力。