skill-evolution

#skill-evolution

SkillAudit：基于成对轨迹审计的无真值技能进化

arXiv cs.AI ↗ · 5天前缓存

SkillAudit 引入了一个框架，通过成对轨迹审计和对比评估，在没有真实反馈的情况下进化 LLM 智能体技能。该框架在 89 个任务上实现了 73.9% 的平均任务奖励，优于基线方法。

0 人收藏 0 人点赞

#skill-evolution

VisualClaw: 面向物理世界的实时个性化智能体

Hugging Face Daily Papers ↗ · 5天前缓存

VisualClaw是一种自我进化的多模态智能体，通过混合编码和技能进化降低部署成本，同时在多个基准测试中提高了视频问答的准确性。

0 人收藏 0 人点赞

#skill-evolution

SkillCAT：对比性评估与拓扑感知的LLM智能体技能自我进化

arXiv cs.CL ↗ · 2026-06-12 缓存

SkillCAT是一个无需训练的LLM智能体技能自我进化框架，通过三个阶段解决单轨迹偏差、未经验证的合并和全语料库加载等问题：对比因果提取、评估增强进化和拓扑感知任务执行，在基准测试上实现高达40.40%的提升。

0 人收藏 0 人点赞

#skill-evolution

SkillChain：闭环实现基于图像的电商AI助手的技能演化

arXiv cs.CL ↗ · 2026-06-12 缓存

SkillChain自动化了基于图像的电商AI助手中按意图技能规范的生命周期，通过迭代优化和路由对齐提高了响应质量和用户参与度。

0 人收藏 0 人点赞

#skill-evolution

Bayesian-Agent：后验引导的LLM代理技能进化框架

Hugging Face Daily Papers ↗ · 2026-06-06 缓存

Bayesian-Agent 提出了一种框架，将可重复使用的技能和SOP视为假设，通过贝叶斯推理指导代理行为，并利用后验引导的框架优化提升任务性能。使用deepseek-v4-flash在多个基准上取得了显著改进。

0 人收藏 0 人点赞

#skill-evolution

Verilog-Evolve: 反馈驱动与技能演进的Verilog生成

arXiv cs.CL ↗ · 2026-05-27 缓存

Verilog-Evolve 是一个反馈驱动的框架，通过迭代优化大型语言模型生成的 Verilog 代码，利用功能仿真、综合和时序指标促进更优候选方案的选出，并跨任务演进可复用的修复技能。

0 人收藏 0 人点赞

#skill-evolution

@9hills: 尝试了多种Agent Memory实现，只有两种我觉得还有点用： 1. Hermes 这种严格限制长度的条目级记忆和会话召回，用来解决个人助理所需的记忆。但是这种和Coding没关系。 2. 根据轨迹沉淀 skill 和 skill 进化…

X AI KOLs Timeline ↗ · 2026-05-25 缓存

作者分享了尝试多种Agent Memory实现后的心得，认为只有严格限制长度的条目级记忆（如Hermes）和基于轨迹沉淀的技能进化两种方法比较有用，其他图谱类或卡片类的方法效果不佳。

0 人收藏 0 人点赞

#skill-evolution

SkillsVote：从收集、推荐到演化的智能体技能生命周期治理

Hugging Face Daily Papers ↗ · 2026-05-18 缓存

SkillsVote 是一个面向长周期LLM智能体的治理框架，通过结构化的收集、推荐和演化来管理可复用技能，在不更新模型的情况下提升了 Terminal-Bench 2.0 和 SWE-Bench Pro 的性能。

0 人收藏 0 人点赞

#skill-evolution

SkillFlow：流程驱动的递归技能演化用于智能体编排

arXiv cs.AI ↗ · 2026-05-15 缓存

SkillFlow 提出了一种基于流程驱动的递归技能演化框架，用于基于大语言模型的智能体编排，采用 Tempered Trajectory Balance 来防止策略崩溃并提供透明的信用分配。在 14 个数据集上的实验表明，在问答、数学、代码和决策制定任务中，该框架显著优于基线方法。

0 人收藏 0 人点赞

#skill-evolution

SkillClaw：让技能通过智能体进化器集体进化

Papers with Code Trending ↗ · 2026-04-09 缓存

SkillClaw 提出了一个框架，用于多用户 LLM 智能体系统中的集体技能进化，通过聚合交互和反馈，实现自主更新和跨用户知识转移，以提升整个生态系统的性能。

0 人收藏 0 人点赞

skill-evolution

提交意见反馈