trajectory-scaling

#trajectory-scaling

扩展视野而非参数：以35B智能体达到万亿参数性能

Hugging Face Daily Papers ↗ · 6天前缓存

介绍了Agents-A1，一个35B混合专家智能体模型，通过长视野轨迹缩放和三阶段训练方法（包括SFT、领域级教师和多教师蒸馏）实现了万亿参数级别的性能。在长视野智能体基准测试中，该模型表现优于或媲美更大规模的模型。

0 人收藏 0 人点赞