python

标签

Cards List
#python

@tom_doerr:通过持久化多智能体记忆自动化研究工作流程 https://github.com/EvoScientist/EvoScientist…

X AI KOLs Timeline · 10小时前 缓存

EvoScientist 是一个开源框架,利用具备持久化多智能体记忆的自进化 AI 科学家来自动化研究工作流程,采用"人在回路外"范式,实现自主研究探索与洞察生成。

0 人收藏 0 人点赞
#python

我们构建并开源了 Caliby:一款面向 AI Agent 的嵌入式高性能向量数据库(性能是 pgvector 的 4 倍,磁盘性能超越 FAISS) --- ## 背景 我们在构建 AI Agent 时,一直在为向量存储苦苦寻觅合适的方案。 - **pgvector** 性能太慢,且需要运行一个完整的 PostgreSQL 实例 - **FAISS** 速度很快,但完全基于内存,无法持久化,而且 API 非常底层,难以使用 - **Chroma / Qdrant / Weaviate** 功能强大,但都是独立的服务,对于嵌入式使用场景来说过于重量级 我们真正需要的是类似 **SQLite** 的东西——一个无需独立服务、直接嵌入应用程序的向量数据库,同时兼顾速度与易用性。 于是,我们动手构建了它。 --- ## Caliby 是什么? **Caliby** 是一款嵌入式向量数据库,专为 AI Agent 和本地 AI 应用设计。 **核心特性:** - 🚀 **高性能** — 查询速度是 pgvector 的 4 倍,磁盘模式下超越 FAISS - 💾 **嵌入式** — 无需独立服务,像使用 SQLite 一样简单 - 🔍 **混合搜索** — 同时支持向量搜索与元数据过滤 - 📦 **持久化存储** — 数据落盘,重启后不丢失 - 🔧 **简洁 API** — 专为开发者体验而设计 --- ## 快速上手 ```python from caliby import VectorDB # 初始化数据库(本地文件存储) db = VectorDB("my_agents_memory.db") # 插入向量 db.insert( id="doc_1", vector=[0.1, 0.2, 0.3, ...], metadata={"source": "arxiv", "topic": "AI"} ) # 语义搜索 results = db.search( query_vector=[0.1, 0.2, 0.3, ...], top_k=5, filter={"topic": "AI"} ) ``` --- ## 性能基准测试 我们在 100 万条向量、维度为 1536(OpenAI embedding 维度)的数据集上进行了测试: | 数据库 | 查询延迟(P50) | 查询延迟(P99) | 内存占用 | |--------|----------------|----------------|----------| | **Caliby** | **2.1ms** | **4.8ms** | **低** | | pgvector | 8.7ms | 21.3ms | 高 | | FAISS(内存模式) | 1.9ms | 3.2ms | 非常高 | | FAISS(磁盘模式) | 6.4ms | 15.7ms | 低 | > FAISS 内存模式确实更快,但需要将全部数据加载到 RAM 中。Caliby 在磁盘模式下实现了接近内存的速度。 --- ## 技术实现 Caliby 的底层采用以下技术: - **HNSW 索引**(Hierarchical Navigable Small World)用于近似最近邻搜索 - **内存映射文件**(mmap)实现高效磁盘访问 - **Rust 核心引擎**,通过 Python 绑定暴露接口 - **WAL(预写日志)** 保障数据持久化与崩溃恢复 --- ## 适用场景 - 🤖 **AI Agent 记忆系统** — 让 Agent 记住过去的对话与经验 - 📚 **RAG 应用** — 检索增强生成的本地知识库 - 🔍 **语义搜索** — 为应用添加语义检索能力 - 🧪 **原型开发** — 无需部署复杂基础设施,快速验证想法 --- ## 开源地址 项目已在 GitHub 开源,欢迎 Star、提 Issue 或参与贡献: 👉 **[github.com/caliby-db/caliby](https://github.com/caliby-db/caliby)** --- 我们很想听听大家的想法: - 你们目前在 AI 项目中使用什么向量数据库? - 有哪些功能是你们最迫切需要的? 欢迎在评论区留言交流!🙌

Reddit r/LocalLLaMA · 10小时前

Caliby 是由 Sea-Land AI 与麻省理工学院 Michael Stonebraker 团队联合开发的开源嵌入式向量数据库,提供高性能向量检索能力(速度比 pgvector 快 4 倍),支持 HNSW、DiskANN 和 IVF+PQ 索引,专为 AI Agent 和 RAG 场景设计,只需通过 pip install 即可快速安装使用。

0 人收藏 0 人点赞
#python

@akshay_pachaar: 这是目前AI代理领域最被低估的更新。你的AI工作流程运行47分钟,消耗312次LLM调用……

X AI KOLs Following · 昨天 缓存

CrewAI为其开源多智能体框架发布了检查点功能,允许AI工作流保存、恢复、分支和检查,而无需在失败时从头开始。

0 人收藏 0 人点赞
#python

如何构建你的第一个Claude智能体。大多数教程遗漏的部分。

Reddit r/AI_Agents · 昨天

本文解释了如何使用Python构建Claude智能体,强调了有效处理工具故障案例的重要性,而非仅仅依赖理想路径场景。

0 人收藏 0 人点赞
#python

Mojo v1.0.0b1

Lobsters Hottest · 昨天

Mojo,Modular 推出的高性能编程语言,已发布 1.0.0 beta 1 版本。

0 人收藏 0 人点赞
#python

openai/openai-python v2.35.1

GitHub Releases Watchlist · 2天前 缓存

发布 OpenAI Python 库 2.35.1 版本,提供对 OpenAI REST API 的更新访问支持,并支持工作负载身份认证。

0 人收藏 0 人点赞
#python

构建我梦寐以求的部署工具

Lobsters Hottest · 3天前 缓存

作者详细介绍了一款名为'Deptool'的自定义Python部署与配置管理工具的开发过程。该工具旨在比Ansible等现有方案更快、更可预测,源于对数字主权和更优工具的追求。

0 人收藏 0 人点赞
#python

anthropics/anthropic-sdk-python v0.98.1

GitHub Releases Watchlist · 4天前 缓存

这是 anthropics/anthropic-sdk-python v0.98.1 的 README,这是一个用于访问 Claude API 的 Python 客户端库。

0 人收藏 0 人点赞
#python

TRE Python绑定 — ReDoS鲁棒性演示

Simon Willison's Blog · 4天前 缓存

一个极简的Python ctypes绑定到TRE正则表达式库,展示了针对ReDoS攻击的鲁棒性能,处理1000万字符输入上的恶意模式时,速度远超Python的re模块。

0 人收藏 0 人点赞
#python

openai/openai-python v2.34.0

GitHub Releases Watchlist · 4天前 缓存

OpenAI Python 客户端库已更新至 v2.34.0,为 Kubernetes、Azure 和 GCP 等安全环境引入了工作负载身份验证支持。

0 人收藏 0 人点赞
#python

llm 0.32a1

Simon Willison's Blog · 2026-04-29 缓存

llm 0.32a1 版本发布说明。llm 是由 Simon Willison 开发的一个用于处理大语言模型的 Python 命令行工具和库。

0 人收藏 0 人点赞
#python

LLM 0.32a0 是一次重大且向后兼容的重构

Simon Willison's Blog · 2026-04-29 缓存

LLM 0.32a0 对 Python 库和 CLI 工具进行了重大且向后兼容的重构,从简单的文本提示转变为支持消息序列和多部分响应,以更好地处理结构化 JSON 和工具调用等现代 LLM 功能。

0 人收藏 0 人点赞
#python

从 uv 迁移到 PDM

Lobsters Hottest · 2026-04-21 缓存

开发者分享将 Python 项目从 uv 迁移到 PDM 的经验,强调 PDM 纯 Python 代码库、刚发布的 2.26.8 版带来的“相对时间依赖冷却”功能,以及更强大的项目管理特性。

0 人收藏 0 人点赞
#python

@isaacbmiller1:DSPy 3.2.0 发布!亮点速览:- dspy.RLM 在解析、工具执行与故障恢复方面的改进……

X AI KOLs Following · 2026-04-21 缓存

DSPy 3.2.0 优化了 dspy.RLM 的解析、工具执行与故障恢复,并持续推进与 LiteLLM 的解耦。

0 人收藏 0 人点赞
#python

@JeanRemiKing:NeuralSet 发布——一个简单、快速、可扩展的 Neuro-AI Python 包 pip install neuralset https://kingjr.github…

X AI KOLs Following · 2026-04-21

NeuralSet 是一个全新的 Python 包,为 fMRI、EEG、MEG、ECoG、spike 等多模态神经 AI 数据,以及文本、音频、视频和图像,提供快速、可扩展的预处理与嵌入工具。

0 人收藏 0 人点赞
#python

Show HN: Faceoff – 一款关注 NHL 比赛的终端界面

Hacker News Top · 2026-04-19 缓存

Faceoff 是一款终端界面应用程序,用于实时关注 NHL 冰球比赛,具有实时比分、比赛详情、排名、球员数据和球队信息,并采用响应式布局。

0 人收藏 0 人点赞
#python

Show HN:Python 背光键盘控制库

Hacker News Top · 2026-04-19 缓存

一个对新手友好的 Python 包及 CLI 工具,可在 Linux 下调节键盘背光亮度,并支持 mock 安全测试。

0 人收藏 0 人点赞
#python

欢迎参加2026年长滩PyCon US大会——今年新增AI与安全专题

Simon Willison's Blog · 2026-04-17 缓存

PyCon US 2026将于5月13日至19日在加州长滩举行,设有全新的AI与安全专题。AI专题涵盖AI辅助开发、笔记本电脑上的LLMs、语音代理以及适用于AI应用的Python异步模式等讲座。

0 人收藏 0 人点赞
#python

datasette 1.0a28

Simon Willison's Blog · 2026-04-17 缓存

Datasette 1.0a28 alpha 版本修复了前一个 alpha 版本中发现的兼容性错误和资源管理问题,包括修复 execute_write_fn() 回调、数据库清理方法,以及新增用于测试中自动清理的 pytest 插件。

0 人收藏 0 人点赞
#python

llm-anthropic 0.25

Simon Willison's Blog · 2026-04-16 缓存

llm-anthropic 0.25 发布,支持 Claude Opus 4.7,新增 thinking_effort 和 thinking_display 选项,增加默认 max_tokens,并移除过时的 beta 头。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈