@xsser_w: 陆奇还是太强了, 1年前让我做沙盒/容器安全,我没意识到啥意思,现在看看 真的。。。我太傻逼了 他还有很多远见, 其中很多都是现在被验证了。我了个去 放到现在来看 做harness 的核心就是沙盒和验证 你在沙盒里可以看到一切轨迹和边界的…
摘要
作者称赞陆奇一年前提出的沙盒/容器安全观点至今被验证,强调沙盒在观测reward hacking中的核心作用。
查看缓存全文
缓存时间: 2026/05/24 02:19
陆奇还是太强了, 1年前让我做沙盒/容器安全,我没意识到啥意思,现在看看 真的。。。我太傻逼了 他还有很多远见, 其中很多都是现在被验证了。我了个去😀 放到现在来看 做harness 的核心就是沙盒和验证 你在沙盒里可以看到一切轨迹和边界的探测,能观测整个reward hacking过程。
相似文章
@vintcessun: 安全团队最头疼的是漏洞发现流程里假阳性太多、修复验证不闭环,Anthropic这个参考实现直接把整个流程拆成可审计的七阶段管道。核心设计不是堆功能,而是构建了一条验证链——每个发现都要经过独立沙箱复现、去重、评分,最后补丁也要通过回归测试…
Anthropic 发布了开源的漏洞发现与修复参考实现,基于 Claude 构建了一个包含七阶段管道的验证链,旨在减少误报并确保修复验证闭环。
@LangChain: .@MukilLoganathan’s Interrupt keynote on Sandboxes. https://youtu.be/IIchUA5T3gs In 20 minutes, you’ll learn how to run…
LangChain 的 Mukil Loganathan 在 Interrupt 大会上介绍 LangSmith 沙箱,用于安全执行代理代码,具备低延迟、安全隔离、持久化和快照恢复等核心功能。
@wquguru: 重度使用ultracode再次深深感受到Claude Code无以替代的伟大。此外,Harness发展的趋势不言自明——更少的人为干预,更多的agent自主能力,更长时间的无干预运行: Cursor的yolo模式 OpenSpec的SDD…
作者分享重度使用Ultracode后的感受,强调Claude Code的不可替代性,并讨论Harness框架下AI自主能力增强的趋势,包括Cursor YOLO模式、OpenSpec SDD、Ralph Loop等技术。
@Potatoloogs: https://x.com/Potatoloogs/status/2057391224592667051
本文深度拆解了Agent Harness的概念,即包裹在LLM外部的工程基础设施,包括编排循环、工具调用、记忆系统、上下文管理等12个组件。文章引用Anthropic、OpenAI、LangChain等公司的实践,论证了harness对生产级AI Agent的关键作用。
@Yuancheng: ➤ 最近还是不断有新的 Agent Harness 思路和实践在出现。 这两天看到 **OpenSquilla**,一个开源、能本地托管的 AI Agent。 ① 它有智能模型路由——同样的任务,token 成本比 OpenClaw 省 …
OpenSquilla 是一个开源、可本地托管的 AI Agent,具有智能模型路由功能,可在不同模型间分配任务以节省 token 成本,并引入 MetaSkill 机制让 Agent 自动组织技能。