标签
MOSS 为自我进化智能体引入了源代码级重写,能够修复文本层进化无法触及的结构性故障。在 OpenClaw 上,它仅通过一个周期就将四项任务的评分均值从 0.25 提升至 0.61,且无需人工干预。
Hermes Agent 被宣传为一款具有多层记忆、自我进化技能、全天候自主运行以及跨会话回忆能力的 AI 项目,其定位更像是一位运营者而非工具。
FlyRoute是一种自我进化的画像框架,通过动态更新来自实际流量的代理能力描述,改进多智能体系统中基于LLM的任务路由,相比静态画像取得了显著的准确率提升。
GenEvolve是一个自我进化的图像生成框架,它利用工具编排的轨迹和视觉经验蒸馏来迭代提升生成能力,取得了最先进的性能。
SEMA-RAG是一种自进化多智能体RAG框架,用于医学问答,它将解读、探索和裁决解耦为三个专业智能体,在多个基准测试中相较于基线取得了显著的准确率提升。
flux-genotype 是一个开源AI内核,能在CPU上协调本地LLM,通过MetaDesigner模块实现自身架构的自我修改。
DrugSAGE是一个框架,能够积累并复用跨任务记忆,高效构建最先进的药物发现模型,在保留任务上比基线智能体性能提升10-30%。
TopoEvo 是一种面向微服务根因分析、感知拓扑结构且自我进化的多智能体框架,它将图表示学习与结构化、受拓扑约束的推理相结合。在多个数据集上,根因定位准确率绝对提升了 3.44%,故障类型分类性能提升了 4.39% 到 16.81%。
PaSaMaster 是一个自演化智能文献检索系统,通过迭代优化搜索意图并生成基于证据的论文排序,以1%的成本实现比GPT-5.2提升30%的性能,且零幻觉。
TACO 提出了一种自我演化压缩框架,可自动学习压缩冗余的终端交互历史,在 TerminalBench 及其他代码智能体基准上将 token 开销降低约 10%,准确率提升 1–4%。
NVIDIA 研究人员提出首个自我进化的逻辑综合框架,多智能体 LLM 可自主优化 ABC EDA 工具代码库。
# 论文页面 - Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence 来源:[https://huggingface.co/papers/2604.18292](https://huggingface.co/papers/2604.18292) 发布于 4 月 20 日 · 提交者[https://huggingface.co/dongguanting](https://huggingface.co/dongguanting) [](https://huggingface.co/dongguanting) [KABI](https://huggingface.co/donggua
# 论文页面 - EvoMaster:构建可进化大规模自主科学智能体的基础框架 来源:[https://huggingface.co/papers/2604.17406](https://huggingface.co/papers/2604.17406) 作者:,,,,,,,,,,,,,,,,,,,,, ## 摘要 EvoMaster 是一个可扩展、自我进化的智能体框架,专为大规模科学发现设计,支持在实验周期中迭代优化假设并持续积累知识。大语言模型与智能体的融合正在催生“智能体科学”新时代。
本文介绍了 GenericAgent,这是一种旨在最大化上下文信息密度的自我演进式大语言模型智能体系统。它通过分层记忆、可复用的标准操作流程(SOP)以及高效压缩技术,解决了长周期任务的局限性,在与领先智能体的对比中,以更少的 Token 消耗实现了更优的性能表现。
研究者推出BEHEMOTH基准与CluE聚类提示优化,使LLM能从多样化任务中抽取并保留异构记忆,相比既往自演化框架提升9%。