hexo-ai/sia

GitHub Trending (daily) 工具

摘要

SIA是一个自我改进的AI框架,通过元智能体、目标智能体和反馈智能体,自动提升在基准任务上的性能,在LawBench、GPU内核优化和单细胞RNA去噪方面取得了显著提升。

SIA是一个自我改进的AI框架,可自动提升任何AI系统(模型/智能体)在基准任务上的性能。
查看原文
查看缓存全文

缓存时间: 2026/06/11 13:34

Meta、Target 和 Feedback 代理在连续世代间的控制流。

OpenAI MLE-Bench Hard:一项严苛的Kaggle真实机器学习竞赛挑战,代理需编写、运行并迭代完整的机器学习管线。SIA在所有测试世代中均排名第一。

LawBench:根据中国法院案件描述预测刑事指控,涵盖191个指控类别。SIA-W+H达到70.1%的Top-1准确率,超越先前SOTA的45%。

AlphaFold-3 TriMul Triton内核:实现并优化三角形乘法更新作为Triton内核,在保持正确性的同时达成H100延迟目标。SIA-W+H实现相比基线14倍加速。

scRNA-seq去噪:对单细胞RNA测序数据中缺失的基因表达值进行插补。SIA-W+H取得0.289 MSEnorm分数,超越先前SOTA的0.220。

相似文章

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2054201045346287766

X AI KOLs Timeline

文章探讨了 Sakana AI 和 Meta 关于自我改进型 AI 智能体的最新研究,具体涉及达尔文-哥德尔机器(Darwin-Gödel Machine)和超智能体(Hyperagents),它们能够自主重写自身代码和基础设施以提升性能,且无需人工干预。