标签
推荐QodoAI的播客《Agentic Review》,内容涵盖关于AI生成代码和软件开发生命周期的坦诚对话。
在对抗性POMDP(CybORG CAGE-2)中对复合LLM智能体设计进行了一项受控研究,系统性地在五个模型系列中变化上下文、推理与层次结构。主要发现:程序化状态抽象每token产生巨大回报,无推理工具的层次结构实现了最佳绝对性能,并且上下文工程比深度推理更具成本效益。
本文提出了一种上下文工程中的范式转变,将其形式化为一个推荐问题。作者介绍了神经协同上下文工程(NCCE),该框架利用协同过滤动态分配实例特定的上下文,从而提升LLM任务准确性。
这篇文章强调了 Andrej Karpathy 在 AI Ascent 2026 上的一句引言,指出“上下文工程”是使用 Claude Code 等 AI 编程助手时优化成本的新标准,而不仅仅是切换到更便宜的模型。
本文指出,大多数 CLAUDE.md 文件都是“倒着写”的,里面堆满了过往失败的规则,而非精简的前瞻性上下文。文章主张只保留少量核心内容:当前目标、身份设定以及那些隐蔽但依然活跃的故障模式。
Andrej Karpathy 强调了‘智能体工程师’的崛起,指出得益于语境工程、工具路由以及编排器-子代理工作流这一新栈,他们的生产力可达传统10倍速工程师的100倍。
文章指出,上下文工程(Context Engineering)——即对提供给 AI 的信息和记忆进行结构化处理——比单纯的提示词工程(Prompt Engineering)对性能的影响更为关键。本文系统地概述了一门课程,该课程旨在教导如何通过管理会话历史和持久记忆等上下文层来构建可靠的 AI 系统。
本文概述了2026年大语言模型(LLM)工程的路线图,详细阐述了包括提示词工程、RAG系统、上下文管理在内的八大关键支柱,并为每项支柱提供了精选的免费及开源资源。
一个关于智能体搜索技术的研讨会,教授如何使用langchain和Elasticsearch,让AI智能体决定从文件、数据库、内存和网络中检索哪些上下文。
用户把后端上下文层换成 Insforge Skills + CLI 后,Claude Code 的 token 用量减少 64%,错误归零,成本从 9.21 美元降到 2.81 美元。
上下文工程的完整参考实现——这是一门设计、检索和向 AI 系统注入组织上下文的学科,用于生成准确的、特定领域的输出。该仓库展示了五个组件(语料库、检索、注入、输出、执行)与 Amazon Bedrock 和 Claude 的整合。
# Consensus 使用 GPT-5 和 Responses API 在几分钟内完成数周的研究 来源:[https://openai.com/index/consensus/](https://openai.com/index/consensus/) 每年都有数百万篇新的科学论文发表——远远超过任何一个人能阅读的数量。对于科学家来说,挑战不在于获取知识的途径,而在于寻找、解释和关联信息的繁重任务。突破发生在已知领域的边界,然而研究人员大部分时间都在寻找
本文解释了从提示工程到技能工程的转变,并介绍了用于训练、维护和优化技能的方法,如 SkillOpt、SkillOps 和 SkillMOO。
本文系统梳理了AI Agent架构与工程实践,涵盖控制流、上下文工程、工具设计、记忆、多Agent组织、评测、追踪和安全,基于OpenClaw实现展开,强调Harness(测试验证基础设施)对系统稳定性的关键作用。
Anthropic发布指南,将上下文工程定义为提示工程的演进,侧重于为AI智能体筛选最优上下文token,以在多轮推理过程中保持性能和专注度。