harness

标签

Cards List
#harness

@AYi_AInotes: 说个反常识的判断, 80% 的 Agent 生产崩溃,跟模型智商没半毛钱关系, 基本都死在上下文溢出、工具调错、子代理失控上, 2026 年真正的分水岭在 Harness 和 Loop,不是模型啊, 兄弟@wizardly_ai 这篇工程…

X AI KOLs Timeline · 9小时前 缓存

这篇文章指出80%的AI Agent生产崩溃并非模型智商问题,而是由上下文溢出、工具调错、子代理失控引起。作者强调2026年的分水岭在于Harness(办公室制度、安保系统)和Loop(自动循环机制),而非模型本身。

0 人收藏 0 人点赞
#harness

你是评估整个框架还是它的各个部分?

Reddit r/AI_Agents · 昨天

这是一个讨论问题,关于是评估机器学习框架的整体,还是分别评估其各个组成部分。

0 人收藏 0 人点赞
#harness

你现在到底在评估什么:提示词、上下文,还是整个框架?

Reddit r/AI_Agents · 昨天

关于AI评估焦点的讨论,质疑从业者是在优化提示词、上下文还是整个框架,并指出正转向整体优化。

0 人收藏 0 人点赞
#harness

2025年:将LLM API集成到你的测试工具中;2026年:设计测试工具以便在你的Agent中运行

X AI KOLs Following · 2天前 缓存

一个简短的预测:2025年工程师会将LLM API集成到他们的测试工具中,而2026年他们会设计测试工具以便在Agent中运行。

0 人收藏 0 人点赞
#harness

即将到来的循环

Armin Ronacher · 2天前 缓存

讨论了使用外部控制循环将AI编码代理会话扩展到正常边界之外的新兴模式,并批评了当前的代码质量问题。

0 人收藏 0 人点赞
#harness

@akshay_pachaar: https://x.com/akshay_pachaar/status/2069118430582866051

X AI KOLs Following · 3天前 缓存

本文解释了AI代理中的循环工程概念,强调核心循环很简单,但关键工作在于模型周围的“束具”,包括知道何时停止以及防止上下文腐败。

0 人收藏 0 人点赞
#harness

@dongxi_nlp: https://x.com/dongxi_nlp/status/2068922428516892998

X AI KOLs Timeline · 3天前 缓存

本文是系列文章第六篇,详细解释了subagent的概念、工作原理及其在coding agent中的作用,包括tool call和runtime机制,以及不同subagent类型(fresh child、forked child、partial fork)的适用场景。

0 人收藏 0 人点赞
#harness

@AntCaveClub: Harness 到底是什么 Harness = 评测框架(Evaluation Harness)。 在AI领域,"harness"是行业黑话——指一套用来"套住"模型、跑标准化评测的工具。 行业标准品是 EleutherAI 的 lm-e…

X AI KOLs Timeline · 4天前 缓存

本文深入解释AI领域评测框架(Harness)的重要性,分析DeepSeek自建Harness团队的战略意义,并对比了开源lm-evaluation-harness与自建系统的区别。

0 人收藏 0 人点赞
#harness

@QingQ77: 把任何一个 GitHub 仓库变成它自己的 AI Agent——带专属 CLI、MCP 服务、记忆和签名认证,能直接 npm 发布。 https://github.com/ruvnet/agent-harness-generator… 你…

X AI KOLs Timeline · 5天前 缓存

MetaHarness converts any GitHub repository into a custom AI agent harness with CLI, MCP service, memory, and signing, allowing deployment on multiple agent platforms.

0 人收藏 0 人点赞
#harness

@DavidOndrej1: Matt Pocock 刚刚解释了为什么大家都纠结错了重点,不是模型而是工具,快看这…

X AI KOLs Following · 2026-06-18 缓存

Matt Pocock 认为 AI 社区过度关注模型本身,而真正的关键在于围绕模型的工具(框架)。

0 人收藏 0 人点赞
#harness

@dongxi_nlp: https://x.com/dongxi_nlp/status/2066991890348572950

X AI KOLs Following · 2026-06-16 缓存

本文是“Context Is A Projection Harness”系列的第6篇,深入探讨了coding agent中context management的核心问题,提出了将完整历史投影为模型所需的小视野的Harness方法,包括Large-Result Preview、Idle-Gap Microcompact、Old-Span Collapse和Auto-Compact Near The Limit等关键技术。

0 人收藏 0 人点赞
#harness

@sheriyuo: 现在 DeepSeek Harness 组真的很缺人,所以想去 DeepSeek 的人得抓紧时间入场了 简直不像是 DeepSeek 的招人风格,Harness 和非 Harness 分开招了

X AI KOLs Timeline · 2026-06-16 缓存

DeepSeek Harness 组急需人才,招聘政策改为 Harness 与非 Harness 分开进行。

0 人收藏 0 人点赞
#harness

从零搭建本地AI编程代理

Reddit r/ArtificialInteligence · 2026-06-15 缓存

一份逐步指南,介绍如何构建一个完全本地运行的最小化AI编码代理,使用llama.cpp、GGUF模型和自定义工具框架,演示如何设置工具并调用模型执行实际任务,例如创建着陆页。

0 人收藏 0 人点赞
#harness

@yuanhao: https://x.com/yuanhao/status/2066341005847142674

X AI KOLs Timeline · 2026-06-15 缓存

Yoyo是一个在GitHub Action上每8小时自我演进的AI agent,其成功关键在于一个无状态agent加持久化状态(git仓库)的harness设计。文章深入分析了记忆、上下文、反馈、验证等问题的朴素解法,强调持久化状态比模型本身更关键。

0 人收藏 0 人点赞
#harness

为客户端构建这些AI代理一年后,我基本上确定:一个代理就是一个markdown文件文件夹

Reddit r/AI_Agents · 2026-06-14

作者认为,AI代理最好理解为一个包含业务知识和指令的markdown文件文件夹,与模型和工具框架分离,从而能够在快速改进的框架之间实现可移植性。

0 人收藏 0 人点赞
#harness

@DailyDoseOfDS_: Claude Code 完全解剖!伦敦大学学院的研究人员逆向工程了泄露的Claude源代码。他们的发现改变了……

X AI KOLs Timeline · 2026-06-13

伦敦大学学院的研究人员对Claude Code进行了逆向工程,发现只有1.6%的代码库是AI决策逻辑,而98.4%是操作基础设施,这揭示了一种设计理念,即优先考虑丰富的确定性框架而非模型驱动路由。

0 人收藏 0 人点赞
#harness

我们向AI智能体展示了它自己的治理记录,结果它开始用了起来

Reddit r/AI_Agents · 2026-06-12

一项针对AI编码智能体的本地治理框架实验表明,当智能体自身的治理记录在其上下文中呈现时,智能体会开始自我纠偏,遵循策略并请求意图声明,而无需强制执行。

0 人收藏 0 人点赞
#harness

@dongxi_nlp: https://x.com/dongxi_nlp/status/2065200644802101633

X AI KOLs Timeline · 2026-06-11 缓存

文章提出在Coding Agent中,工具调用应视为契约而非简单函数,强调Harness在验证、权限、生命周期管理等环节的裁决作用,并详细讨论了工具契约的组成和生命周期。

0 人收藏 0 人点赞
#harness

HarnessBridge: LLM智能体的可学习双向控制器

Hugging Face Daily Papers · 2026-06-11 缓存

介绍了HarnessBridge,一种可学习的双向控制器,它将智能体-环境接口参数化,用于LLM智能体。在Terminal-Bench和SWE-bench上,它以更少的计算开销达到了与专用框架相当的性能。

0 人收藏 0 人点赞
#harness

@HarperSCarroll: 到底是什么将聊天机器人变成了AI智能体?AI模型(大型语言模型,即LLM)周围的“框架”。我…

X AI KOLs Following · 2026-06-10 缓存

本视频解释了AI智能体框架的概念:LLM核心、记忆、工具,以及实现迭代决策以达到目标的循环。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈