trajectory-scaling

标签

Cards List
#trajectory-scaling

扩展视野而非参数:以35B智能体达到万亿参数性能

Hugging Face Daily Papers · 6天前 缓存

介绍了Agents-A1,一个35B混合专家智能体模型,通过长视野轨迹缩放和三阶段训练方法(包括SFT、领域级教师和多教师蒸馏)实现了万亿参数级别的性能。在长视野智能体基准测试中,该模型表现优于或媲美更大规模的模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈