@julien_c:今天我要发布一个名为 SynthTraces 的新项目,它是一个极简的代码库,用于生成合成编码智能体会话轨迹…
摘要
Julien Chaumond 发布了 SynthTraces,这是一个极简的代码库,通过让一个开放模型(通过 HF Inference Providers)与一个本地小模型(通过 llama.cpp)在真实开源代码库上交互,生成合成编码智能体会话轨迹,已产出超过 2,000 个 Pi 会话轨迹,可用于训练和微调大语言模型。
查看缓存全文
缓存时间: 2026/06/05 07:11
今天,我发布了一个名为 SynthTraces 的新项目。
这是一个极简代码库,用于利用 Pi(来自 @badlogicgames)生成合成的编码智能体会话轨迹。
我想要大量的编码智能体轨迹,因此我搭建了一个小型框架,让两个模型相互对话:
- 一个开放模型(通过 HF Inference Provider 提供服务)扮演编码智能体。它拥有对一个真实开源代码库(huggingface 的 OSS 项目)的读取和 bash 访问权限。
- 一个小型本地模型(llama.cpp)扮演人类用户,提出诸如“如何运行这个?”或“CI 是如何设置的?”之类的简单问题。
结果产生了超过 2,000 条 Pi 会话轨迹,可用于训练或微调 LLM,并针对 Pi 进行优化。
当然,所有内容都已发布在 @huggingface 上。
相似文章
@benhylak:我们构建了第一个本地调试智能体的合理方法。你可以查看你的追踪记录。codex/claude code 也可以。这允许……
一个新的开源工具可以通过查看追踪记录实现AI智能体的本地调试,允许使用codex和Claude code等工具自动编写评估并进行测试。
@ClementDelangue:我们需要开放追踪数据,让每个人都能训练开放的智能体模型!cc @steipete @badlogicgames @thdxr @matanSF @hwchase17
Clement Delangue 呼吁开放追踪数据,以普及开放智能体模型的训练。
我从零重建了一个Claude Code风格的编程代理——整个代理循环只有6行代码。20章,约5000行代码,无框架,也支持本地模型
一位开发者分享了一个20章的教程,从头重建了一个Claude Code风格的编程代理,展示了整个代理循环(约6行代码),并支持本地模型和多种LLM API。
@EBorgnia:今天,我们推出了 Jacq。这是一个编码代理,与我们一直在@relace_ai 训练的小模型一起构建,用于……
Jacq 是一个基于云的编码代理,与 Slack、Linear、GitHub、电子邮件和其他工具集成,使用 Relace AI 训练的小模型从连接的设备中提取上下文,并维护持久线程以记录工作历史。
@JiaZhihao: 推出 Motus Tracing:AI 代理的开源可观测性。没有追踪,代理就是消耗 token 的黑盒……
Motus Tracing 是一个完全开源的可观测层,专为 AI 代理设计,能够捕获每一次模型调用、工具调用、沙箱交互和错误,提供统一的跨度模型,支持本地开发和云部署,零设置成本。