@Voxyz_ai: 等不及这个gbrain功能了。这是循环:智能体使用技能尝试任务 ↓ gbrain评估或LLM作为裁判…
摘要
Voxyz宣布了一项新的GBrain功能,该功能使智能体能够通过LLM作为裁判的评估和隔夜优化循环,迭代改进技能。
等不及这个gbrain功能了。这是循环:
智能体使用技能尝试任务
↓
gbrain评估或LLM作为裁判对结果打分
↓
梦想循环在夜间运行优化器
↓
提出对SKILL.md的小修改
↓
如果新版本得分更高,则接受
↓
提交改进后的技能,下次运行时使用
查看缓存全文
缓存时间: 2026/05/26 20:57
对这个gbrain功能真是迫不及待了。这是它的循环逻辑: agent 使用 skill 尝试执行任务 ↓ gbrain 评估或 LLM-as-judge 给结果打分 ↓ dream cycle 在夜间运行优化器 ↓ 对 SKILL.md 提出小幅修改建议 ↓ 如果新版本得分更高,接受修改 ↓ 提交改进后的 skill,下次运行时直接使用
笑死,完蛋。我安慰自己说这是在搞研发。
相似文章
@Voxyz_ai:用 gbrain 很久,今天才点开 soul-audit 技能(给 openclaw/hermes 用的),跑完结果比预期好
用户分享首次体验 gbrain 的「soul-audit」技能:通过 6 阶段访谈,根据回答生成专属 AI 智能体。
@garrytan: GBrain SkillOpt 现在有4个端到端评估验证其功能 https://github.com/garrytan/gbrain-evals/blob/main/docs/benc…
Garry Tan 的 gbrain-evals 是一个用于 gbrain(AI 代理的长期记忆)的开源测试套件,包含4个端到端评估验证 SkillOpt 功能,在多个基准测试中实现了高召回率和高精确度。
@PSkinnerTech: 简而言之;GBrain 为 AI 智能体提供合成分析、差距分析、自连线类型化知识图谱、混合搜索以及夜间梦境周期等能力。
GBrain 是一款工具,能够增强 AI 智能体的合成分析、差距分析、自连线类型化知识图谱、混合搜索以及夜间梦境周期等功能,并且这一切都建立在 Obsidian 中现有的 .md 文件之上。
SkillLearnBench:面向真实任务代理技能生成的持续学习方法基准
SkillLearnBench 推出首个评估 LLM 代理持续技能学习的基准,覆盖 20 项真实任务,结果显示尚无方法全面领先,单纯扩大模型规模也无法保证技能提升。
@garrytan: GBrain 现在能做到的一件有趣的事情:如果你有技能 + 代码 + 测试 + 解析器 + 解析器触发器 + 评估,你想要…
GBrain 现在可以将技能、代码、测试和评估打包成一个 SKILLPACK tarball,其他人可以通过一个简单的命令安装它。