autonomous-training

标签

Cards List
#autonomous-training

EvoTrainer:面向自主智能体强化学习的LLM策略与训练框架协同进化

arXiv cs.AI · 18小时前 缓存

EvoTrainer提出了一种自主训练框架,通过经验反馈协同进化LLM策略与训练框架,在数学推理、代码生成以及长期软件工程任务上超越了人工设计的强化学习基线。

0 人收藏 0 人点赞
#autonomous-training

我设计了一种方法,用于(自主地)在单个消费级GPU上训练Transformer语言模型。

Reddit r/openclaw · 3天前

一种在单个消费级GPU上自主训练Transformer语言模型的方法,分为六个阶段,设有验证门和AGENTS.md规范,适用于OpenClaw等编排框架。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈