标签
本文研究了什么使交互轨迹对训练基于终端的AI智能体有效,介绍了Terminal-Lego流程,并揭示了一个教学悖论:较弱的智能体可以产生更好的训练数据。研究发现,环境基础监督(而非教师性能)是学生泛化能力的关键。
OpenHands 发布了一个受 Claude 动态工作流启发的开源软件智能体 SDK,使开发者能够构建用于测试覆盖率改进等代码任务的智能体。
一篇新论文通过将 markdown 技能文件视为可训练参数并使用经过保留集验证的有界编辑,将智能体的技能优化形式化。该方法在不同模型间迁移良好,并提升了程序化基准测试的性能。
一条推文指出,由于开源社区对翻墙软件多年的贡献,相关协议和实现已被大模型内化;现在可以用国产代码代理在十分钟内部署阿里云国际服务器及客户端,甚至定制混淆协议。
Hugging Face 发布了一项新的「Skill」和测试框架,旨在帮助将语言模型从 transformers 库迁移到 mlx-lm,利用代码智能体来简化开源贡献流程。