@techwith_ram:正在观看这场关于智能体搜索与上下文工程的演讲,主讲人是@helloiamleonie。看了一半,真的…
摘要
一个关于智能体搜索技术的研讨会,教授如何使用langchain和Elasticsearch,让AI智能体决定从文件、数据库、内存和网络中检索哪些上下文。
查看缓存全文
缓存时间: 2026/05/09 01:41
看了这个关于 Agentic Search for Context Engineering 的演讲,主讲人是 @helloiamleonie。演讲内容非常精彩,前半部分已经讲得很好了。主要讨论了智能体如何决定从文件、数据库、内存和网络中获取内容,以及这种选择为什么往往比模型本身更重要。她的演讲幻灯片可以在这里获取:https://github.com/iamleonie/workshop-agentic-search.git…
iamleonie/workshop-agentic-search
来源:https://github.com/iamleonie/workshop-agentic-search
工作坊:用于上下文工程的智能搜索
本工作坊讨论了用于上下文工程的不同智能搜索技术。
学习成果: 完成本工作坊后,你将能够
- 尝试在不同上下文来源中搜索上下文的不同方法
- 了解如何通过 Agent Skills 和额外的 CLI 工具扩展搜索功能
- 对不同搜索工具的权衡取舍形成直观理解
环境配置
1. 创建并激活 Python 虚拟环境
python3 -m venv .venv
source .venv/bin/activate
2. 安装依赖
本notebook使用 langchain v1.2.12 和 langchain-openai v1.1.11。
pip install -r requirements.txt
3. 配置 Elasticsearch
本工作坊使用本地 Elasticsearch 实例作为外部上下文来源之一。
在本地运行 Elasticsearch 最简单的方式是使用 start-local 脚本,它会通过 Docker 单行命令设置 Elasticsearch(可选包括 Kibana):
curl -fsSL https://elastic.co/start-local | sh
这将创建一个 elastic-start-local 文件夹,其中包含配置文件和启动脚本。启动 Elasticsearch:
cd elastic-start-local
./start.sh
预期输出:
✔ Container es-local-dev Healthy
✔ Container kibana-local-dev Healthy
4. 环境变量和 API 密钥
本工作坊需要三类环境变量,需要添加到 .env 文件中(参见 .env.example)
- LLM API 密钥: 这些 notebook 通过 LiteLLM 使用 OpenAI 模型。你也可以选择任何支持工具使用的 LLM。
- Jina API 密钥: 你可以从 Jina 官方页面(https://jina.ai/api-dashboard/embedding)免费获取 Jina API 密钥,无需注册。
- Elasticsearch 凭证: 在设置本地 Elasticsearch 实例时,你将获得密码(用户名和 URL 保持不变)。
5. 数据准备
工作坊的示例基于 AI Engineer Europe 会议日程,数据位于 data 文件夹下的 session.json(下载地址:https://www.ai.engineer/europe/schedule)。
本工作坊将数据存储和文件系统作为上下文来源。要准备 Elasticsearch 数据存储和本地文件系统,请运行数据准备 notebook。
课程大纲
| 主题 | 上下文来源 | 检索工具 | Notebook |
|---|---|---|---|
| Vanilla 智能搜索 | 本地 Elasticsearch 集群 | 语义搜索工具 | 01_vanilla_agentic_search.ipynb |
| 带数据库查询工具的智能搜索 | 本地 Elasticsearch 集群 | ESQL 查询执行工具 (+ Agent Skills) | 02_advanced_agentic_search.ipynb |
| 带 Shell 工具的智能搜索 | 本地文件系统 | Shell 工具 (+ jina-grep-cli) | 03_agentic_search_with_bash_tool.ipynb |
补充资源
- Shell 工具不是上下文工程的万能解决方案(https://www.elastic.co/search-labs/blog/search-tools-context-engineering)
- 为上下文工程构建有效的数据库检索工具(https://www.elastic.co/search-labs/blog/database-retrieval-tools-context-engineering)
- Elasticsearch 快速入门(https://www.elastic.co/docs/reference/elasticsearch/clients/python/getting-started)
- Elastic Agent Skills(https://github.com/elastic/agent-skills/tree/main)
jina-grepCLI(https://github.com/jina-ai/jina-grep-cli)
相似文章
AI智能体的有效上下文工程
Anthropic发布指南,将上下文工程定义为提示工程的演进,侧重于为AI智能体筛选最优上下文token,以在多轮推理过程中保持性能和专注度。
大多数关于“智能体 AI”的讨论都感觉太抽象了。这里是我的智能体研究系统的实际样子
作者分享了他为识别和评估公司内 AI 用例而构建的智能体研究系统的实际分解。该系统使用六个智能体进行发现、评估和上下文提取,强调人在决策环中,而非完全自主。
Show HN: 上下文工程的完整参考实现
上下文工程的完整参考实现——这是一门设计、检索和向 AI 系统注入组织上下文的学科,用于生成准确的、特定领域的输出。该仓库展示了五个组件(语料库、检索、注入、输出、执行)与 Amazon Bedrock 和 Claude 的整合。
@JeremyNguyenPhD:佛蒙特大学研究者@girayaslim与@emily_beam带来的Agentic AI训练营,共2场×90分钟……
佛蒙特大学研究人员举办2×90分钟Agentic AI训练营,聚焦将Claude Code与Codex集成进科研与教学流程。
@SoundHound:掌握自主智能体 AI 时代。SoundHound AI 企业业务执行副总裁为希望成功部署 AI 智能体的商业领袖分享建议…
SoundHound AI 联合行业领袖举办点播网络研讨会,解析自主智能体 AI,分享真实落地案例,并为商业领袖提供消费者洞察。