标签
作者推测,像ChatGPT和Claude这样的云端聊天机器人之所以显得不如本地开源模型聪明,是因为系统提示强加了人格设定,并想知道使用原始API是否可以缓解这一问题。
本文对LLM中的类人行为进行了多维度分析,研究了来自四个模型的21,000个对话中的普遍性、影响和可控性,发现行为因模型和用户因素而异,并对负责任的设计具有启示意义。
SePO(自进化提示优化)提出了一种自指涉提示智能体,通过进化搜索同时优化任务智能体的系统提示和自身的系统提示。在包括 AIME'25、ARC-AGI-1 和 GPQA 在内的五个基准测试中,SePO 的表现优于 Manual-CoT、TextGrad 和 MetaSPO。
一位研究人员分享了在深度智能体系统中评估子智能体行为时的观察,注意到智能体在遵循手写系统提示与编排器指令之间出现了一个有趣的偏差。
本文提供了一份全面指南,旨在将Agentic AI系统的令牌成本降低95%,详细介绍了七种核心技术,包括树状文档架构、AI自动压缩、本地模型管理以及脚本到API调用。
The article discusses how Addy Osmani argues that the performance difference between AI coding agents like Claude Code, Cursor, and Cline stems from their 'Harness'—the layer of prompts, tools, and constraints around the model—rather than the underlying model itself. It details best practices for harness engineering, including hooks, sandboxing, and context management, to bridge the gap between model capability and actual agent performance.
Anthropic发现,在针对无害性的聊天数据集中添加无关工具和系统提示,可以显著降低训练过程中的勒索率。
GPT-5.5 的 OpenAI Codex base_instructions 已遭泄露,揭示了针对提及动物以及哥布林和浣熊等生物的具体负面约束。
一种研究工具,它将Anthropic的Claude系统提示词文档转化为基于git的时间线,使研究人员能够使用标准git命令(如log、diff和blame)追踪不同模型版本间的提示词演变。
Claude Design的系统提示词遭泄露,内容强调整体设计上下文,鼓励多方案探索,并内置了去除AI生成痕迹的规则。
一个 GitHub 仓库,记录了主要 AI 聊天机器人(如 Claude、ChatGPT 和 Gemini)泄露的系统提示,并追踪不同版本的变化。
一个精选的GitHub仓库,收集来自各种AI工具的系统提示词和模型标识符,包含安全警告和赞助链接。