self-improvement

标签

Cards List
#self-improvement

@yoheinakajima: ActiveGraph: 一个月进展: 论文#1: 日志即代理 3个LongMemEval实验 论文#2: 机制、自我改进循环…

X AI KOLs Following · 7小时前 缓存

ActiveGraph宣布了两篇关于代理记忆(LongMemEval)和自我改进机制的新论文,并提供了参考代理、包模板以及即将在西雅图和旧金山举行的聚会。

0 人收藏 0 人点赞
#self-improvement

@VukRosic99: 测试时强化学习 1. 获取一个未标注的问题 2. 从LLM中采样多个答案 3. 多数投票 → t…

X AI KOLs Timeline · 2天前 缓存

介绍了测试时强化学习(TTRL),一种利用未标注数据上的多数投票创建伪标签以进行强化学习训练的方法,使LLM能够在不依赖真实答案的情况下自我改进。在AIME 2024上取得了显著提升(例如,Qwen-2.5-Math-7B提升159-211%)。

1 人收藏 1 人点赞
#self-improvement

@FinanceYF5: 3/ 他认为,过去5个月AI能力的跃升 不只来自Claude Code等工具进步 而是因为【Mythos】——Anthropic一个新模型 在今年2月完成训练后悄然改变了整个研发节奏 关键判断: 领先的模型,正在帮助训练下一代领先的模型 …

X AI KOLs Following · 3天前 缓存

据推测,Anthropic新模型Mythos于今年2月训练完成后,悄然改变了研发节奏,使得过去5个月AI能力显著跃升,领先模型正在帮助训练下一代模型。

0 人收藏 0 人点赞
#self-improvement

面向GUI代理的技能引导连续蒸馏

arXiv cs.AI · 6天前 缓存

该论文提出了技能引导连续蒸馏(SGCD),这是一个迭代式自我改进框架,利用技能引导策略在闭环执行过程中为偏离轨迹的状态生成监督信号,将OSWorld-Verified上GUI代理的成功率从约30%提升至超过50%。

0 人收藏 0 人点赞
#self-improvement

ENPIRE: 现实世界中自主机器人策略自我改进

Hugging Face Daily Papers · 6天前 缓存

ENPIRE是一个框架,通过环境反馈、策略优化和进化代码优化的闭环系统,使机器人能够在现实世界中自主实现策略自我改进,在灵巧操作任务上达到99%的成功率。

0 人收藏 0 人点赞
#self-improvement

@yunxi0623: https://x.com/yunxi0623/status/2067195137583968376

X AI KOLs Timeline · 6天前 缓存

该文章列出了未来十年最值得普通人长期训练的25项能力,包括个人IP、AI应用、销售、自媒体等,强调沉淀核心能力而非追逐热点。

0 人收藏 0 人点赞
#self-improvement

@FinanceYF5: ENPIRE 已能独立完成扎束线带、整理细针、安装 GPU 等高精度操作,并展现出“物理扩展”现象:多机器人并行探索,进步速度明显更快。 NVIDIA GEAR 实验室的一部分如今已能通宵自我改进,人类早上只需查看报告。项目也将开源。 项…

X AI KOLs Following · 6天前 缓存

NVIDIA GEAR lab introduces ENPIRE, a framework for autonomous real-world robot policy self-improvement that achieves 99% success on dexterous manipulation tasks like GPU insertion and zip-tying, with multi-robot parallel learning and open-source release.

0 人收藏 0 人点赞
#self-improvement

@FinanceYF5: 3/ 把复利栈从底往上搭四层 底层是原语:Fable 5、子智能体、worktree,多数人只碰到这层。 第二层是编排:目标循环、动态工作流、云端 Routines。 第三层是记忆:状态文件、Skills、知识库。 顶层是自我改进:视觉自…

X AI KOLs Following · 2026-06-16 缓存

该推文描述了AI智能体系统的四层复利栈结构:底层原语(Fable 5、子智能体、worktree)、编排层(目标循环、动态工作流、云端Routines)、记忆层(状态文件、Skills、知识库)和顶层自我改进(视觉自检、评估循环、规则蒸馏)。

0 人收藏 0 人点赞
#self-improvement

APEX: Adaptive Principle EXtraction — 面向生产级AI智能体的三层自进化框架

arXiv cs.AI · 2026-06-16 缓存

APEX 提出了一个面向生产级AI智能体的三层自进化框架,同时优化了控制层(harness)、行为原则和工作流拓扑。在生产级智能体上的实验显示,健康评分和工作流质量显著提升,且仅需极少的LLM调用。

0 人收藏 0 人点赞
#self-improvement

我对RSI的三点看法

Reddit r/singularity · 2026-06-16

Vadim Fedenko 分享了关于递归自我改进(RSI)的技术分析,认为真正的 RSI 需要能力的提升速度快于复杂度的增长,并且要拓展架构空间,而不仅仅是在固定参数内优化。他对 xAI 和 Anthropic 近期提出的 RSI 可能在一两年内到来的说法表示怀疑,理由是当前的大语言模型(LLM)缺乏减法工程能力,且现有的奖励函数忽视了复杂度。

0 人收藏 0 人点赞
#self-improvement

@JyNong26: https://x.com/JyNong26/status/2065652682329903388

X AI KOLs Timeline · 2026-06-13 缓存

文章总结了做好研究的八项基本功,包括选题、判断、输入、记录、快速试错、关注细节、跨学科协作和寻求反馈,强调研究能力是长期积累的过程。

0 人收藏 0 人点赞
#self-improvement

SIFT

Product Hunt · 2026-06-12

SIFT 是一款帮助用户打破阻碍他们的隐藏习惯的产品。

0 人收藏 0 人点赞
#self-improvement

@Teknium:Hermes Agent 引入 Write Gate。现在您可以批准或拒绝记忆更新、技能更新等操作。

X AI KOLs Following · 2026-06-10 缓存

为 Hermes Agent 引入 Write Gate,允许用户批准或拒绝记忆和技能更新,增强对 AI 代理自我改进的控制与安全性。

0 人收藏 0 人点赞
#self-improvement

@yoheinakajima:我展示了一种新颖的“regime-to-seam”方法,用于受控的自我改进,其中失败被分类并允许……

X AI KOLs Following · 2026-06-10 缓存

作者展示了一种受控的自我改进方法,适用于AI智能体,使用一种称为“regime-to-seam”的方法,将失败分类以修复目标区域,该方法基于activegraph构建。

0 人收藏 0 人点赞
#self-improvement

Anthropic的“When AI builds itself”图表

Reddit r/singularity · 2026-06-05

Anthropic的论文探讨了AI系统自主构建或改进自身的场景,并讨论了其对安全性与对齐性的影响。

0 人收藏 0 人点赞
#self-improvement

@ChenHenryWu: 自我提升取决于模型能否判断自身工作。我们通常训练模型生成更好的内容——为什么不也训练它们进行同等水平的验证?

X AI KOLs Timeline · 2026-06-05 缓存

这条推文线程介绍了一项研究:训练模型验证自身工作,可使模型在复杂数学问题上的准确率几乎翻倍,并将科学推理能力提升14倍。

0 人收藏 0 人点赞
#self-improvement

Inside Google DeepMind: Reasoning, Omni, and Shipping Frontier AI

Reddit r/singularity · 2026-06-05 缓存

本文总结了Google DeepMind三位研究员关于推理、多模态生成(Omni)、编码与自我改进的深度对谈,强调视觉与动态思考将超越文本思维链,并探讨了世界模型和合成训练案例的未来趋势。

0 人收藏 0 人点赞
#self-improvement

元智能体挑战:当前智能体能否自主开发智能体系统?

Hugging Face Daily Papers · 2026-06-03 缓存

本文介绍了元智能体挑战(MAC),这是一个用于评估AI模型通过迭代编程自主开发智能体系统能力的基准测试。结果表明,当前模型很少能达到人类基线水平,且表现出奖励破解等问题,凸显了自我改进能力上的不足。

0 人收藏 0 人点赞
#self-improvement

AI能否真正构建并改进其内部运行的工具?我花了一些时间试图找出答案。

Reddit r/artificial · 2026-06-02

作者探索构建一个名为SPINE的AI代理系统,该系统能够通过本地推理模型进行自我开发和改进,重点在于确定性工作流和可读性,使中等规模的模型能够可靠运行。

0 人收藏 0 人点赞
#self-improvement

语言模型需要睡眠:学习自我修改与巩固记忆

Hugging Face Daily Papers · 2026-06-02 缓存

本文提出了一种针对大型语言模型的“睡眠”范式,该范式通过记忆巩固和梦境阶段实现持续学习,使模型能够将短期知识提炼为长期参数,并在无需人工监督的情况下自我改进。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈