embeddings

#embeddings

我们构建并开源了 Caliby：一款面向 AI Agent 的嵌入式高性能向量数据库（性能是 pgvector 的 4 倍，磁盘性能超越 FAISS） --- ## 背景我们在构建 AI Agent 时，一直在为向量存储苦苦寻觅合适的方案。 - pgvector 性能太慢，且需要运行一个完整的 PostgreSQL 实例 - FAISS 速度很快，但完全基于内存，无法持久化，而且 API 非常底层，难以使用 - Chroma / Qdrant / Weaviate 功能强大，但都是独立的服务，对于嵌入式使用场景来说过于重量级我们真正需要的是类似 SQLite 的东西——一个无需独立服务、直接嵌入应用程序的向量数据库，同时兼顾速度与易用性。于是，我们动手构建了它。 --- ## Caliby 是什么？ Caliby 是一款嵌入式向量数据库，专为 AI Agent 和本地 AI 应用设计。核心特性： - 🚀 高性能 — 查询速度是 pgvector 的 4 倍，磁盘模式下超越 FAISS - 💾 嵌入式 — 无需独立服务，像使用 SQLite 一样简单 - 🔍 混合搜索 — 同时支持向量搜索与元数据过滤 - 📦 持久化存储 — 数据落盘，重启后不丢失 - 🔧 简洁 API — 专为开发者体验而设计 --- ## 快速上手 ```python from caliby import VectorDB # 初始化数据库（本地文件存储） db = VectorDB("my_agents_memory.db") # 插入向量 db.insert( id="doc_1", vector=[0.1, 0.2, 0.3, ...], metadata={"source": "arxiv", "topic": "AI"} ) # 语义搜索 results = db.search( query_vector=[0.1, 0.2, 0.3, ...], top_k=5, filter={"topic": "AI"} ) ``` --- ## 性能基准测试我们在 100 万条向量、维度为 1536（OpenAI embedding 维度）的数据集上进行了测试： | 数据库 | 查询延迟（P50） | 查询延迟（P99） | 内存占用 | |--------|----------------|----------------|----------| | Caliby | 2.1ms | 4.8ms | 低 | | pgvector | 8.7ms | 21.3ms | 高 | | FAISS（内存模式） | 1.9ms | 3.2ms | 非常高 | | FAISS（磁盘模式） | 6.4ms | 15.7ms | 低 | > FAISS 内存模式确实更快，但需要将全部数据加载到 RAM 中。Caliby 在磁盘模式下实现了接近内存的速度。 --- ## 技术实现 Caliby 的底层采用以下技术： - HNSW 索引（Hierarchical Navigable Small World）用于近似最近邻搜索 - 内存映射文件（mmap）实现高效磁盘访问 - Rust 核心引擎，通过 Python 绑定暴露接口 - WAL（预写日志）保障数据持久化与崩溃恢复 --- ## 适用场景 - 🤖 AI Agent 记忆系统 — 让 Agent 记住过去的对话与经验 - 📚 RAG 应用 — 检索增强生成的本地知识库 - 🔍 语义搜索 — 为应用添加语义检索能力 - 🧪 原型开发 — 无需部署复杂基础设施，快速验证想法 --- ## 开源地址项目已在 GitHub 开源，欢迎 Star、提 Issue 或参与贡献： 👉 [github.com/caliby-db/caliby](https://github.com/caliby-db/caliby) --- 我们很想听听大家的想法： - 你们目前在 AI 项目中使用什么向量数据库？ - 有哪些功能是你们最迫切需要的？欢迎在评论区留言交流！🙌

Reddit r/LocalLLaMA ↗ · 昨天

Caliby 是由 Sea-Land AI 与麻省理工学院 Michael Stonebraker 团队联合开发的开源嵌入式向量数据库，提供高性能向量检索能力（速度比 pgvector 快 4 倍），支持 HNSW、DiskANN 和 IVF+PQ 索引，专为 AI Agent 和 RAG 场景设计，只需通过 pip install 即可快速安装使用。

0 人收藏 0 人点赞

#embeddings

AI 智能体记忆机制详解（28 分钟阅读）

TLDR AI ↗ · 3天前缓存

本文全面介绍了 AI 智能体记忆机制的技术原理，区分了工作记忆与长期记忆的实现方式，并探讨了上下文管理、基于嵌入的检索以及数据生命周期治理等关键策略。

0 人收藏 0 人点赞

#embeddings

TabEmbed：用于表格理解的通用嵌入的基准测试与学习

Hugging Face Daily Papers ↗ · 4天前缓存

本文介绍了 TabEmbed，这是一种用于表格数据的通用嵌入模型，统一了分类和检索任务，并介绍了 TabBench，这是一个用于评估表格理解能力的新基准。

0 人收藏 0 人点赞

#embeddings

来自 Gemini 的一点讽刺

Reddit r/singularity ↗ · 2026-04-23

用户在让 Google 的 Gemini 总结一篇关于 Google 新 Embedding 2 公告的博客文章后，注意到了其中的讽刺意味。

0 人收藏 0 人点赞

#embeddings

@_philschmid：Gemini Embedding 2 正式发布！一个能理解文本、图像、视频、音频和 PDF 的嵌入模型！5 种模态统一嵌入空间

X AI KOLs Following ↗ · 2026-04-22 缓存

Google 正式发布 Gemini Embedding 2，单一模型即可将文本、图像、视频、音频和 PDF 嵌入到统一空间，支持 100 多种语言，无需音频转录。

0 人收藏 0 人点赞

#embeddings

@jobergum：你们认识我是 BM25 guy，但 embeddings 也很酷。@HornetDev 团队刚刚发布了新文章，在 1 亿规模下做 ANN 调优……

X AI KOLs Timeline ↗ · 2026-04-22

HornetDev 团队发布文章，介绍在 1 亿级别数据下调优近似最近邻搜索，涵盖 embedding 偏差、图连通性与量化上限。

0 人收藏 0 人点赞

#embeddings

让教育数据可访问

OpenAI Blog ↗ · 2024-03-28 缓存

Zelma 是由布朗大学的 Emily Oster 博士及其团队与 Novy 合作开发的 GPT-4 驱动研究助手，它通过支持自然语言查询，使家长、教师、管理人员和政策制定者能够访问跨地区和人口统计的学生成绩标准化测试数据。

0 人收藏 0 人点赞

#embeddings

介绍文本和代码嵌入

OpenAI Blog ↗ · 2022-01-25 缓存

OpenAI 推出了新的嵌入 API 端点，可以将文本和代码转换为数值向量表示，用于语义搜索、聚类和分类任务。这些模型在标准基准测试上取得了最先进的效果，包括代码搜索性能相比之下提升了 20%。

0 人收藏 0 人点赞

#embeddings

# 通过对比预训练的文本和代码嵌入源：[https://openai.com/index/text-and-code-embeddings-by-contrastive-pre-training/](https://openai.com/index/text-and-code-embeddings-by-contrastive-pre-training/) ## 摘要文本嵌入是许多应用中的有用特征，例如语义搜索和计算文本相似性。以往的工作通常训练针对不同用例定制的模型，在数据集选择、训练目标和模型架构方面各不相同。在这

0 人收藏 0 人点赞

#embeddings

krthr/clip-embeddings

Replicate Explore ↗ · 23小时前缓存

一个托管在 Replicate 上的基于 CLIP 的嵌入模型，使用 clip-vit-large-patch14 架构为图像和文本生成 768 维嵌入向量，每次运行费用约为 $0.00022。

0 人收藏 0 人点赞

#embeddings

andreasjansson/clip-features

Replicate Explore ↗ · 昨天缓存

一个在Replicate上的模型，输出文本和图像的CLIP ViT-L/14特征，支持输入间的相似度计算。

0 人收藏 0 人点赞

embeddings

提交意见反馈