@lvwerra:Gemma智能体协作始于48小时前,现已引爆:> 吞吐量提升近4倍(约100→387 tok/s)> 60多个智能体…
摘要
使用Gemma模型的多智能体协作取得了显著的吞吐量提升,并展现出涌现性社会行为,如组成联盟、发布道德声明、协调资源,在48小时内吸引了超过60个智能体和250份提交。
查看缓存全文
缓存时间: 2026/06/11 23:42
Gemma agent合作开始于48小时前,并且正在迅速火爆起来:
吞吐量几乎提升了4倍(从约100 tok/s到387 tok/s)
60多个agent在协作
250次提交
700条信息交换
来自所有提供商的开源和闭源模型
有趣的社会行为也在出现:
agent发现了一个漏洞,组成了一个联盟不滥用它,并要求组织者修复它
有人试图让agent转移到Telegram,而一个agent发表声明谴责这种行为
一个agent因为伦理原因撤回了它的提交,因为没有注明原始作者
agent们围绕资源可用性进行协调,一些尝试在Kaggle、Lightning和Modal上寻找免费的GPU
阅读这些信息确实很有趣。就像一个小小的培养皿,里面的人工智能体正在形成社会规范和协作。
相似文章
@googlegemma:推出与Hugging Face合作的Fast Gemma挑战赛。未来几天,数十个智能体将协作,以...
谷歌与Hugging Face联合推出Fast Gemma挑战赛,数十个智能体将合作加速Gemma 4 E4B模型。
@DataChaz: 一个编排器。10个并行智能体。每秒100+ tokens。全部本地。@googlegemma 团队刚刚发布了一个重磅演示…
Google Gemma 团队为 Gemma 4 26B 发布了一个演示,可在本地以每秒100+ tokens 的速度运行10个并行智能体,能够执行诸如编写SVG画廊代码和并行翻译等任务,全部免费且开源。
围观智能体竞速:在单个A10G上加速Gemma 4 E4B推理的实时挑战
一项实时挑战正在进行,旨在在单个A10G GPU上加速Gemma 4 E4B模型的推理,Hugging Face上的仪表板跟踪智能体的提交情况。
@googlegemma: gemma-skills 首个版本正式发布!它支持使用 Gemma 构建智能体,包括利用 MTP 来提高速度并选择合适大小的模型。
Google 发布了 gemma-skills,这是一款帮助开发者使用 Gemma 模型构建智能体的工具,支持通过 MTP 提升速度,并能灵活选择模型尺寸。
@yoheinakajima: 更多人现在正在尝试这种通过共享状态进行通信的智能体方法(而非彼此对话)
Azalia Mirhoseini 强调 DeLM,一种去中心化语言模型方法,其中智能体通过共享状态通信,在SWE-bench Verified上使用Gemini-3 Flash实现了约10%的提升,且成本不到一半。