agentic-llm

标签

Cards List
#agentic-llm

@jinyuhou0: 在主流基准测试中,我们的30B模型与规模大20-30倍的系统(gpt-5.4-xhigh、DeepSeek-V3.2、Kimi-K2.5)匹敌,而……

X AI KOLs Timeline · 2026-05-22 缓存

一款新的30B模型在主流基准测试中与规模大20-30倍的系统匹敌,同时相比同类30/32B智能体大语言模型,使用的推理令牌减少高达95%。这是通过一个学习型配置器实现的,该配置器决定何时以及如何进行推理。模型和代码已开放。

0 人收藏 0 人点赞
#agentic-llm

AstraFlow:面向数据流的智能体大语言模型强化学习系统

Hugging Face Daily Papers · 2026-05-15 缓存

AstraFlow是一个面向数据流的强化学习系统,支持智能体大语言模型的高效多策略协同训练与弹性扩展,训练速度相比现有系统提升2.7倍。

0 人收藏 0 人点赞
#agentic-llm

HAGE: 通过强化学习驱动加权图演化利用智能体记忆

Hugging Face Daily Papers · 2026-05-11 缓存

HAGE引入了一种加权多关系记忆框架,能够在统一关系记忆图上实现查询条件化的遍历,通过自适应记忆检索和基于强化学习的优化来提高长程推理准确性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈