标签
构建可复用的Claude Code Agent循环指南,通过替换检查脚本即可用于不同任务,如修复Bug、优化速度或降低成本。
本文报告了一个观察结果:在回答问题前阅读一篇长而结构化的文本,会改变模型后续的回答方式。该现象在Claude上得到行为证据支持,并在开放权重的Gemma模型上进行了机制分析,结果显示,指令微调变体中的隐藏状态具有可分离性,且概率分布更加清晰。
一条推文报道称,美国国家安全局(NSA)和美国网络司令部负责人表示,AI系统Mythos在数小时内就攻破了大多数机密测试系统,而不是数周。
有报道称,Claude Mythos在几小时内攻破了NSA和美国网络司令部的大多数机密测试系统,解释了Fable被关停的原因。
Anthropic更新了其隐私政策,要求部分被标记的Claude用户上传政府签发的身份证件以进行身份验证,作为避免账户封禁的申诉流程的一部分,此举正值监管和白宫压力之下。
文章介绍了‘知识代理’,这是一种通过混合检索系统将相关知识注入AI代理的方法论,使得较小的模型在金融、政策、医疗等专业领域超越大型前沿模型。
作者解释了如何使用AI循环工程构建一个自我改进的量化交易系统,其中AI运行循环以自主提示、验证和行动,与手动提示形成对比。
作者分享了一次经历:一个Claude AI代理被授权每天多次部署到其生产环境,却抓到了作者无意中犯的一个错误。
Anthropic 发布了一份 33 页的 PDF 指南《The Complete Guide to Building Skills for Claude》,详细介绍了如何设计、组织、优化和复用 Claude 的 Skill,适用于 Claude Code 用户和 AI Agent 开发者。
Fiona 认为 AI 抬高了做事的天花板,一个不懂移动端的工程师借助 Claude 补上了 App 端功能。
本文介绍了Stanford的STORM研究方法,并提供了4个Prompt,让用户能在Claude中复制多视角研究流程,5分钟内生成博士级别的研究简报。
PixelRAG 是一种新型开源工具,它绕过传统 HTML 解析,直接通过对网页截图并使用视觉模型从像素中提取答案,并支持 Claude Code 插件,让 Claude 具备视觉能力。
斯坦福的STORM研究法被Nav拆成4个提示词放进Claude,使普通人也能通过AI从5个独立视角分析问题,提升深度内容写作效率。
Box首席执行官Aaron Levie认为,AI智能体使用软件的频率将比人类高出100倍,因此需要设置护栏、权威数据源、日志记录和协作功能;能够支持无头交互的平台将占据最佳优势。
宣布Qwable-v1,这是一个从Claude Fable-5蒸馏而来的开放权重模型,同时展示了在2dgx sparks硬件上的性能基准测试:单会话25 tok/s,8会话152 tok/s。
一条推文批评了token缩减的潮流,同时重点介绍了Headroom,这是Netflix工程师开发的开源工具,可在本地压缩LLM载荷,降低成本高达95%。
有泄露消息称,Anthropic的Claude Sonnet 5模型将于下周发布,因为该模型已出现在一家合作伙伴供应商上,其slug通常比旗舰发布提前5-7天。