vector-database

标签

Cards List
#vector-database

@PrajwalTomar_: https://x.com/PrajwalTomar_/status/2069409824824316060

X AI KOLs Following · 昨天 缓存

作者构建了一个完全离线的AI代理,使用本地嵌入模型、通过Ollama的Llama模型以及VectorAI数据库,旨在解决依赖云端的AI所带来的风险。该代理运行在一台8GB内存的MacBook上,能够处理敏感文档,并在多个会话之间保持记忆。

0 人收藏 0 人点赞
#vector-database

关于本地文档RAG系统的帮助(存储 + 摄取 + 查询 + 高亮)

Reddit r/LocalLLaMA · 4天前

一个关于构建本地文档RAG系统的详细技术咨询,涵盖存储、摄取、查询和高亮,寻求关于向量数据库、GraphRAG可行性以及文档高亮实现的建议。

0 人收藏 0 人点赞
#vector-database

@AYi_AInotes: 卧槽,阿里把内部用了多年的向量数据库直接开源了,Pinecone每月70刀的能力,它pip一行免费就能用,十亿向量毫秒级还不用单独起服务 以后做RAG和AI搜索的,不用再每月给Pinecone交70美金了! 阿里内部跑了多年的向量数据库开…

X AI KOLs Timeline · 5天前 缓存

阿里开源了内部使用多年的向量数据库Zvec,支持十亿向量毫秒级检索,无需单独服务即可嵌入应用进程,完全免费,替代Pinecone等付费服务。

0 人收藏 0 人点赞
#vector-database

@DivyanshT91162: LVector数据库迎来重大变革——这个开源项目将2.01亿个文本块从201GB压缩至6GB,同时保持检索质量

X AI KOLs Timeline · 6天前 缓存

一个开源项目将6000万个文本块从201GB压缩至6GB,同时保持检索质量,实现97%的存储缩减,且无需GPU即可在普通笔记本上运行。

0 人收藏 0 人点赞
#vector-database

@Meari_V2_0_G: 这就是我的项目被做出来的原动力。 但是、实际上ai要找的东西如果猜不对关键词那就搜不到。就像我今天说我手写ac自动机而ai没搜出来——因为它的模块名不叫那个。 但向量并非一无是处。你永远不能对着关键词搜索去搜“今天天气怎么样?”这种话。三…

X AI KOLs Timeline · 2026-06-17 缓存

作者讨论了AI搜索中关键词搜索与向量搜索的优缺点,认为应将多种搜索策略结合注册给Agent,并引用了一个观点称免费的传统工具可能摧毁整个向量数据库行业。

0 人收藏 0 人点赞
#vector-database

@DivyanshT91162: 人工智能行业花费数十亿美元解决一个52年前的终端命令早已解决的问题。在过去的…

X AI KOLs Timeline · 2026-06-17 缓存

一条Twitter帖子指出,人工智能行业在RAG的向量检索系统上投入巨资可能并无必要,因为52年前的终端命令'grep'在AI代理上下文中进行精确匹配时表现优于现代语义搜索。

0 人收藏 0 人点赞
#vector-database

@huangyun_122: 飞书 cli 这个开源库,彻底把知识入库-装配-分发完美分层了: 1/ OpenClaw, Codex, CC 对话历史通过 SKILL 入飞书库 2/ 飞书 cli 接入 Agent, 把入库的知识库文档进一步消化,打入向量库 3/ 向…

X AI KOLs Timeline · 2026-06-17 缓存

Lark/飞书 CLI is an open-source command-line tool designed for human and AI agents, providing 200+ commands and 26 AI Skills across 18 business domains to streamline knowledge ingestion, assembly, and distribution.

0 人收藏 0 人点赞
#vector-database

@HowToPrompt__:整个向量数据库行业被一个1974年的免费工具打败了。过去两年里,每一家公司……

X AI KOLs Timeline · 2026-06-17 缓存

研究人员报告称,经典的grep命令在自主AI代理的检索任务中胜过现代向量数据库,挑战了当前主流的RAG基础设施方法。

0 人收藏 0 人点赞
#vector-database

大家都说自己的智能体“有记忆”——那你到底是什么意思?

Reddit r/AI_Agents · 2026-06-14

这篇文章讨论了AI智能体中“记忆”的模糊含义,强调了不同的解释,如上下文填充、向量数据库、用户画像和暂存区,并呼吁更清晰的定义。

0 人收藏 0 人点赞
#vector-database

@HowToPrompt__: 中国开源了一款碾压 Pinecone、Chroma 和 Weaviate 的向量数据库。它叫 Zvec,一种进程内向量…

X AI KOLs Timeline · 2026-06-14 缓存

中国开源了 Zvec,这是一种进程内向量数据库,无需服务器即可在应用内部运行,支持毫秒级搜索数十亿向量,并已在阿里巴巴规模下经受了实战考验。

0 人收藏 0 人点赞
#vector-database

@tom_doerr: 使用LLMs对私有数据进行深度研究的自动化 https://github.com/zilliztech/deep-searcher…

X AI KOLs Timeline · 2026-06-13 缓存

DeepSearcher 是一个开源工具,结合了LLMs和向量数据库,能够对私有数据进行深度研究,为企业知识管理和智能问答系统提供准确的答案和报告。

0 人收藏 0 人点赞
#vector-database

@topk_io: https://x.com/topk_io/status/2065172828161200563

X AI KOLs Timeline · 2026-06-11 缓存

TopK 推出了 semantic_index,这是一种单一的 schema 注解,抽象了生产系统中多向量检索的复杂性,实现了亚秒级延迟和高吞吐量的最先进性能。

0 人收藏 0 人点赞
#vector-database

Show HN: HelixDB – 基于对象存储的图数据库

Hacker News Top · 2026-06-10 缓存

HelixDB 是一个用 Rust 构建的图-向量数据库,专为知识图谱和 AI 记忆设计,提供统一平台支持图、向量、键值、文档和关系型数据模型,并配有便于本地和云端部署的工具。

0 人收藏 0 人点赞
#vector-database

@hasantoxr:向量数据库不再是云产品。它们正在变成 pip install。一个名为 turbovec 的新开源项目……

X AI KOLs Timeline · 2026-06-09 缓存

一个名为 turbovec 的开源项目在 GitHub 上获得了 1 万星标。它是一个基于 Rust、带有 Python 绑定的向量索引,使用谷歌研究的 TurboQuant 算法将嵌入压缩到接近理论香农极限,使得完全本地的 RAG(检索增强生成)成为可能——1000 万文档仅需 4 GB RAM,且搜索速度快于 FAISS。

0 人收藏 0 人点赞
#vector-database

@victorialslocum: 大多数智能代理聊天机器人要么像金鱼一样健忘,要么像囤积狂一样记忆。有更好的方式。吐槽时间:我真的很厌倦了……

X AI KOLs Timeline · 2026-06-09 缓存

Weaviate 推出 Engram,一种为AI代理提供全面管理的记忆服务,通过协商、去重和范围隔离来主动维护记忆,将记忆视为基础设施而非数据囤积。

0 人收藏 0 人点赞
#vector-database

所有AI记忆解决方案在真正进行基准测试之前看起来都差不多

Reddit r/AI_Agents · 2026-05-29

对三种开源AI记忆后端(Atomic Memory、Mem0、Zep)的透明对比,涵盖许可证、设置、提供商支持以及AUDN分类等独特功能。

0 人收藏 0 人点赞
#vector-database

我的AI代理在会话之间总是忘记'Karpathy'是谁。以下是解决这个问题的架构

Reddit r/AI_Agents · 2026-05-20

一位开发者分享了一种使用Neo4j知识图谱的架构,包含类型化实体和去重,解决了AI代理跨会话遗忘实体身份的问题,超越了平面文件和向量存储。

0 人收藏 0 人点赞
#vector-database

@akshay_pachaar: RAG vs. CAG,清晰解释!RAG 很棒,但有一个主要问题:每次查询都命中向量数据库,即使是静态数据也是如此……

X AI KOLs Following · 2026-05-19 缓存

解释了缓存增强生成(CAG)作为一种将静态知识直接缓存到模型 KV 内存中的方法,与传统 RAG 相比,可降低延迟和成本,并展示了如何将两者结合以获得最佳性能。

0 人收藏 0 人点赞
#vector-database

我如何在向量存储之上构建图数据库,以支持1000个代理运行2个月,因为仅凭向量搜索在用户偏好随时间变化时会失效。

Reddit r/AI_Agents · 2026-05-18

一份详细的架构指南,介绍如何构建长期运行的AI代理,通过结合向量存储、图数据库和时间边缘(temporal edges)来处理随时间变化的用户偏好,而不是覆盖数据。

0 人收藏 0 人点赞
#vector-database

每个AI记忆平台完全忽略的是什么?

Reddit r/AI_Agents · 2026-05-16

作者批评现有的AI记忆平台缺乏多代理记忆、多次交互后长期记忆能力差、没有遗忘机制,并正在构建新的解决方案;向社区询问其他痛点。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈