code-agents

标签

Cards List
#code-agents

是什么使交互轨迹对训练终端智能体有效?

arXiv cs.AI · 3天前 缓存

本文研究了什么使交互轨迹对训练基于终端的AI智能体有效,介绍了Terminal-Lego流程,并揭示了一个教学悖论:较弱的智能体可以产生更好的训练数据。研究发现,环境基础监督(而非教师性能)是学生泛化能力的关键。

0 人收藏 0 人点赞
#code-agents

@gneubig: Claude 动态工作流看起来很酷,我想要一个开源版本,所以就做了一个。这个改进了测试覆盖率…

X AI KOLs Following · 2026-05-29 缓存

OpenHands 发布了一个受 Claude 动态工作流启发的开源软件智能体 SDK,使开发者能够构建用于测试覆盖率改进等代码任务的智能体。

0 人收藏 0 人点赞
#code-agents

SkillOpt 将 markdown 技能文件视为可训练参数并配备适当的优化机制

Reddit r/LocalLLaMA · 2026-05-26

一篇新论文通过将 markdown 技能文件视为可训练参数并使用经过保留集验证的有界编辑,将智能体的技能优化形式化。该方法在不同模型间迁移良好,并提升了程序化基准测试的性能。

0 人收藏 0 人点赞
#code-agents

@m0d8ye: 说一个有意思的事情,由于过去十几年里开源社区对各种翻墙软件的不断贡献,相关协议和实现早已内化到大模型里了。比如你买个阿里云国际的服务器,在本地用任何一款国产 code agent 都可以十分钟内部署好服务器和客户端。愿意折腾的话甚至可以帮…

X AI KOLs Timeline · 2026-05-17

一条推文指出,由于开源社区对翻墙软件多年的贡献,相关协议和实现已被大模型内化;现在可以用国产代码代理在十分钟内部署阿里云国际服务器及客户端,甚至定制混淆协议。

0 人收藏 0 人点赞
#code-agents

你自己会提交的那个 PR

Hugging Face Blog · 2026-04-16 缓存

Hugging Face 发布了一项新的「Skill」和测试框架,旨在帮助将语言模型从 transformers 库迁移到 mlx-lm,利用代码智能体来简化开源贡献流程。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈