hexo-ai/sia

GitHub Trending (daily) 工具

self-improving-ai ai-agent open-source python llm benchmark optimization

摘要

SIA是一个自我改进的AI框架，通过元智能体、目标智能体和反馈智能体，自动提升在基准任务上的性能，在LawBench、GPU内核优化和单细胞RNA去噪方面取得了显著提升。

SIA是一个自我改进的AI框架，可自动提升任何AI系统（模型/智能体）在基准任务上的性能。

查看原文

查看缓存全文

缓存时间: 2026/06/11 13:34

Meta、Target 和 Feedback 代理在连续世代间的控制流。

OpenAI MLE-Bench Hard：一项严苛的Kaggle真实机器学习竞赛挑战，代理需编写、运行并迭代完整的机器学习管线。SIA在所有测试世代中均排名第一。

LawBench：根据中国法院案件描述预测刑事指控，涵盖191个指控类别。SIA-W+H达到70.1%的Top-1准确率，超越先前SOTA的45%。

AlphaFold-3 TriMul Triton内核：实现并优化三角形乘法更新作为Triton内核，在保持正确性的同时达成H100延迟目标。SIA-W+H实现相比基线14倍加速。

scRNA-seq去噪：对单细胞RNA测序数据中缺失的基因表达值进行插补。SIA-W+H取得0.289 MSEnorm分数，超越先前SOTA的0.220。

相似文章

Hugging Face Daily Papers

一种自我改进的人工智能框架，通过语言模型反馈代理同时更新模型权重和任务特定的智能体架构，在法律分类、GPU优化和生物去噪任务上取得了显著提升。

X AI KOLs Following

HexoAI 发布了 SIA，一个开源的自我改进型人工智能，能够通过递归自我提升来实现任何目标。

X AI KOLs Following

本文介绍了SIA，一种自我改进的AI循环，它结合了脚手架重写和权重更新（通过LoRA）以提升任务性能。在三个不同的任务上测试，它优于仅使用脚手架改进的设置。

X AI KOLs Following

Higgsfield AI 推出了 Supercomputer，一个云原生的自学习 AI 智能体，能够将任务分解为子任务，并将每个子任务分配给最适合的模型（例如，推理任务交给 Opus，视频任务交给 Seedance，图像任务交给 GPT），并配备三层记忆机制，实现跨会话的上下文持久化。

X AI KOLs Timeline

文章探讨了 Sakana AI 和 Meta 关于自我改进型 AI 智能体的最新研究，具体涉及达尔文-哥德尔机器（Darwin-Gödel Machine）和超智能体（Hyperagents），它们能够自主重写自身代码和基础设施以提升性能，且无需人工干预。