标签
一项实验用同一个关于LENR和超导性的研究提示词,通过5种语言的6个AI系统运行,揭示了显著的语言偏差——非英语查询会呈现出纯英语搜索所遗漏的真实工业承诺信息。
文章指出,上下文工程(Context Engineering)——即对提供给 AI 的信息和记忆进行结构化处理——比单纯的提示词工程(Prompt Engineering)对性能的影响更为关键。本文系统地概述了一门课程,该课程旨在教导如何通过管理会话历史和持久记忆等上下文层来构建可靠的 AI 系统。
该文章分析了arXiv上《Dive into Claude Code》论文,讨论了Claude Code这类编码Agent系统在真实环境中的工程实现重点,包括shell执行、文件修改和外部服务调用等功能。
文章认为,到2028年底,完全自动化的AI研发(即AI系统无需人类参与即可构建自己的后继者)的可能性很高(60%以上),引用了SWE-Bench等编码基准的证据以及AI自主性的趋势。