标签
一条解释构建生产级AI系统所需的六个关键AI概念(token、嵌入、向量搜索等)的推文串,强调理解这些概念可以避免像API成本失控等代价高昂的失败。
本帖子全面介绍了AI代理的上下文工程技术,阐述了上下文管理对代理性能的关键作用,以及如何优化Token使用以避免性能退化。
GSD Core 是一个开源的工作流框架,通过「讨论-规划-执行-验证-交付」五步循环和独立上下文的子代理,解决 Claude Code 等 AI 编码工具在长任务中上下文被污染、代码质量下降的问题,已在 GitHub 获得 64K Stars。
本文评估了企业工具使用工作流中LLM代理的上下文工程配置,表明选择性修剪的摘要化相比全上下文基线实现了91.6%的准确率,同时将令牌使用量减少了60%以上。
Datadog的AI报告强调,了解AI系统(包括多模型路由、可靠性问题、可观测性、上下文工程和复合工程)的高级工程师将拥有显著优势。
阐述了传统后端如何增加AI代理的token使用量,并展示了一种上下文工程方法,该方法无需更改模型或提示词即可将Claude Code会话成本降低2.5倍。
awesome-harness-engineering 是一个收录了来自 OpenAI、Anthropic、微软、Meta 等公司关于 AI agent harness 工程(上下文管理、工具设计、验证回路、记忆系统等)实践资料的精选资源列表,旨在帮助开发者构建可靠的 agent 框架。
Sentra CEO Ashwin Gopinath 认为,AI代理的记忆应定义为保留的后果,其中目的决定哪些过去信息影响未来行为,并在企业环境中区分知识、上下文和记忆。
KACE 引入了一种知识自适应上下文工程方法,通过认知树和分层自一致性将存储与使用分离,在 AIME 2025 上达到了 62.2% 的准确率——相比固定自一致性提升了 10.4 个百分点。
这篇文章由Leonie Monigatti撰写,讨论了agentic搜索在AI智能体上下文工程中的作用,追溯了从固定RAG流水线到agentic RAG和上下文整理的演变。它提供了关于agentic系统中使用的各种搜索工具优缺点的直观认识。
这篇文章由 yan5xu(前 ManusAI)撰写,提出了 LLM 工程范式的螺旋演进模型:从 Prompt Engineering(2022-2024)到 Context Engineering(2025),再到 Harness Engineering(2026-),并讨论了各阶段的瓶颈与驱动因素。
文章讨论了LLM工程从Prompt Engineering发展到Harness Engineering的三个阶段,反映了AI工程实践的演进。
这是一篇 Hugging Face 博客文章,旨在定义并厘清 AI Agent 领域的关键术语,如 scaffolding、harness、context engineering 和 tool use,力求在快速演进中实现词汇标准化。
对五种AI自由职业技能(上下文工程、代理编排、AI流水线架构、语音/品牌复制、AI成本工程)的详细分析,这些技能在2026年已经达到每小时200-500美元,预计到2027年1月将成为资深AI自由职业者的基准。
一份关于AI智能体的全面指南,涵盖基础知识、ReAct循环、任务分解、上下文工程以及自主性光谱,面向初学者和构建生产系统的人员。
此工具为AI编程助手提供上下文工程,通过将任何代码库转换为可查询的交互式图表,兼容Claude Code、Codex和Antigravity,并且100%开源。
Sourcegraph 基于 1281 次 agent 运行数据发现,大型代码库中 coding agent 失败的主要原因是基础设施不足而非模型能力,典型模式为“迷失在代码库”中,需改进代码检索、导航和上下文工程。
Akshay Pachaar阐释了三个不同的AI工程概念——提示工程(消息)、上下文工程(记忆)和封装工程(机器)——解释了它们在构建基于LLM的智能体中的角色与相互作用,并附有一篇关于智能体封装工程的深入文章链接。
上下文工程被认为是AI智能体成功的最关键领域,并断言模型已经足够强大,但失败的原因在于缺乏适当的上下文。该讨论列出了有效上下文的四个关键要素。
OpenCollider的研究人员展示了上下文工程技术可以提高原创性,现在GBrain利用嵌入向量,通过其'brainstorm'和'brainstorm with lsd mode'功能帮助用户找到反主流想法。