agentic-llm

#agentic-llm

@jinyuhou0: 在主流基准测试中，我们的30B模型与规模大20-30倍的系统（gpt-5.4-xhigh、DeepSeek-V3.2、Kimi-K2.5）匹敌，而……

X AI KOLs Timeline ↗ · 2026-05-22 缓存

一款新的30B模型在主流基准测试中与规模大20-30倍的系统匹敌，同时相比同类30/32B智能体大语言模型，使用的推理令牌减少高达95%。这是通过一个学习型配置器实现的，该配置器决定何时以及如何进行推理。模型和代码已开放。

0 人收藏 0 人点赞

#agentic-llm

Hugging Face Daily Papers ↗ · 2026-05-15 缓存

AstraFlow是一个面向数据流的强化学习系统，支持智能体大语言模型的高效多策略协同训练与弹性扩展，训练速度相比现有系统提升2.7倍。

0 人收藏 0 人点赞

#agentic-llm

Hugging Face Daily Papers ↗ · 2026-05-11 缓存

HAGE引入了一种加权多关系记忆框架，能够在统一关系记忆图上实现查询条件化的遍历，通过自适应记忆检索和基于强化学习的优化来提高长程推理准确性。

0 人收藏 0 人点赞