标签
介绍了SAG(SQL-Retrieval Augmented Generation),一种基于SQL动态超边的新型检索增强生成架构,相比传统RAG和GraphRAG在多跳推理上更高效、成本更低,已在GitHub开源并取得不错评测结果。
本文讨论了AI agent演示往往成功,而生产部署却暴露出关键的安全和授权问题,强调模型质量并不能解决诸如访问控制、数据泄露和可审计性等问题。
Salvatore Sanfilippo 回顾了他早前的预测:RAG 会逐渐消退,而原始向量搜索仍有价值,如今 RAG 的热潮已经消退。
介绍Agent memory创业的几种主流思路,并推荐EverMind团队的开源项目EverOS,它提供以Markdown为源的本地记忆操作系统,支持双轨记忆、多模态摄取和自演化能力。
PixelRAG 是一种新型开源工具,它绕过传统 HTML 解析,直接通过对网页截图并使用视觉模型从像素中提取答案,并支持 Claude Code 插件,让 Claude 具备视觉能力。
介绍了五个开源工具(MarkItDown、MinerU、Docling、marker、surya),用于将PDF、Office文档等转换为Markdown或JSON,以便直接供RAG或AI代理使用。
腾讯开源了企业级知识平台 WeKnora,具备 RAG 智能问答、ReAct 自主 Agent 和自维护 Wiki+知识图谱三大功能,可将原始文档转化为可推理、可生长的知识资产。
作者提出以IdeaBlock(问题-答案+治理字段)替代传统chunk来改进RAG知识单元,已开源Blockify工具,可减少40倍语料、3倍token并提升2.3倍相关性。
@DeRonin_在推文中为2026年的AI工程师提供建议,强调交付真实应用、掌握核心技能、使用廉价模型、广泛部署、开源项目以及聚焦单一职业赛道。
PixelRAG是一种开源检索系统,它通过截取网页截图并使用视觉语言模型直接从像素中读取答案,从而绕过HTML解析,声称相比基于文本的RAG有显著的准确率提升。
一个推文串,解释了8种不同的RAG架构(Naive、Multimodal、HyDE、Corrective、Graph、Hybrid、Adaptive、Agentic)及其使用场景,并暗示了一种改进的索引技术。
阿里开源了内部使用多年的向量数据库Zvec,支持十亿向量毫秒级检索,无需单独服务即可嵌入应用进程,完全免费,替代Pinecone等付费服务。
Elasticsearch博客文章描述了构建一个持久化智能体记忆层,包含三种记忆类型(情景记忆、语义记忆、程序记忆),在QA评估中实现0.89召回率,并利用混合召回和DLS隔离实现了零租户泄漏。
一条解释构建生产级AI系统所需的六个关键AI概念(token、嵌入、向量搜索等)的推文串,强调理解这些概念可以避免像API成本失控等代价高昂的失败。
推文宣布了一个RAG播放列表,涵盖从基础RAG到高级技术(如使用LangChain和LangGraph的CRAG和Self-RAG)的主题,评论区附有链接。
Codelf 是一个开源的桌面 AI 助理,可用自然语言描述需求,自动拆解步骤并调用工具完成开发、文件操作、浏览器操控等任务,同时提供完整的编辑器与终端功能,支持 DeepSeek、Claude、ChatGPT 等模型,对国内网络友好,具备本地 RAG 知识库能力。
代理型RAG通过AI代理在循环中驱动检索过程,实现多步推理、自动选择数据源和优化查询,解决了标准RAG在处理多跳问题、模糊查询和多数据源时的局限性。
LlamaIndex 推出了基于 LlamaParse Index 的智能体检索,结合语义搜索和 grep,构建灵活的智能体框架。6月30日的网络研讨会将演示这些工具。
一条推文宣布了LLM-Evaluation,这是一个公共GitHub仓库,包含用于评估LLM、生成式AI和RAG系统的研讨会幻灯片、示例笔记本、提示词和参考链接,旨在提供评估工作流的实用地图。