标签
NousResearch 介绍了一种创意构思技能,该技能将提示词路由到来自艺术家和思想家的22种创造性方法中,以平衡可行性和创造力。
Interhuman 团队将一种持续的 AI 幻觉(重复一个特定的不存在引语)追踪到两个叠加的 bug:系统提示词中隐藏的一个示例,以及使模型背诵而非报告静默的训练后行为。
本文介绍了“Pigeonholing”这一现象,即不良提示导致大语言模型崩溃并重复错误,造成38-40%的性能下降。跨越10个任务和10个模型的实验表明,随着对话轮次增加,问题恶化,并提出了结合合成错误的RLVR作为缓解措施。
本文介绍了spec learning,一个将少量偏好判断编译为自然语言规范的框架,在推理时调节LLM,无需更新模型参数即可在专业领域上优于DPO。
本文描述了AI产品经理的循环工程设计周期,强调构建可重用且随时间不断改进的系统,而非一次性提示词。
本文讨论了AI应用中的“提示负债”概念,即过度依赖自然语言提示导致系统脆弱、难以维护,并且会锁定到特定模型。
OpenSPDD 是一种结构化提示驱动的开发方法和跨平台 CLI,它利用 REASONS Canvas 定义范围、架构和安全保障,将 AI 编码提示转化为可执行的设计契约。
本文介绍了 Looper 工具,它通过批判性分析循环、构建验证评分标准、设置护栏和 token 预算,并导出可用于 Claude Code 的可移植工件,帮助设计高效的 AI 目标循环。
作者描述了构建AI提示词版本控制系统以解决追踪哪个提示词版本最好的问题。
探讨了不同的智能体架构如何从相同的底层模型和提示词中产生不同的输出,强调了智能体设计对大型语言模型行为的影响。
本文主张传统的提示工程已经过时,现代LLM是意图重构器,应通过自然、丰富的对话而非精简指令来与模型交互。
本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件,该技术将技能文档视为可训练状态,并带来显著的性能提升。文章还解决了手动技能调优的挑战,并介绍了GEPA和EvoSkill等进化方法的框架。
作者构建了Prompt-Chain,这是一个Streamlit应用,它将一个小型prompter模型和一个大型coder模型串联起来,并自动交换VRAM,从而在8GB GPU上实现高效的代码生成。
Anthropic 发布了一份 33 页的 PDF 指南《The Complete Guide to Building Skills for Claude》,详细介绍了如何设计、组织、优化和复用 Claude 的 Skill,适用于 Claude Code 用户和 AI Agent 开发者。
一份全面的去AI味写作指南,从识别22种AI写作特征到提供改写流程和提示词,帮助用户消除AI写作痕迹。
作者开源了一个名为'prompt-to-loop-engineer'的Codex技能,它能够将模糊的提示转化为结构化的、保留意图的执行循环,并带有防漂移检查,旨在让智能体在现实任务中更可靠。
教程介绍了 Loop Engineering 方法,通过设计自动执行、检查、修正的循环,让 AI 迭代直到结果达标,从而将单次提问升级为流程工程。
本文介绍了Stanford的STORM研究方法,并提供了4个Prompt,让用户能在Claude中复制多视角研究流程,5分钟内生成博士级别的研究简报。
一个拥有28万粉的账号运营者开源了10个用于Claude的AI视频生成技能,可生成精美的视频提示,直接粘贴到Higgsfield的Seedance 2.0中使用。