构建了一个广播仪表盘,监测来自21个主要来源的AI代理发展动态——这是我正在追踪的内容以及缺失的部分

Reddit r/AI_Agents 工具

摘要

一位用户描述构建了一个广播仪表盘,追踪来自arXiv、GitHub和Hugging Face等21个来源的AI代理发展动态,指出了覆盖的强项和不足。

代理相关的发展是目前最难追踪的信号之一——它们同时分布在arXiv论文、GitHub仓库、模型发布说明、事件报告和政策文档中。我一直在运行一个数据管道,从arXiv(cs.AI/cs.LG/cs.CL)、Hugging Face每日论文、Semantic Scholar、GitHub Trending、AI事件数据库(AI Incident Database)、GovAI、CSET以及其他几个来源拉取数据。围绕代理的故事——工具使用、函数调用、多代理框架、推理基准——往往会很好地浮现,因为它们同时触及多个来源。对于这个社区来说,系统的薄弱之处在于: - 代理基准测试(主要是当论文出现在arXiv上时能捕获,但基准排行榜的变化是不可见的) - 未在GitHub上流行或未发表论文的开源框架发布 - 来自从业者的实际部署事件(AIID捕获的是正式报告,而非社区轶事) 真心好奇这里实际关注哪些来源以保持对代理领域的最新了解。根据版面规则,我会在评论中放下仪表盘链接。
查看原文

相似文章