@julien_c:今天我要发布一个名为 SynthTraces 的新项目,它是一个极简的代码库,用于生成合成编码智能体会话轨迹…

X AI KOLs Following 工具

摘要

Julien Chaumond 发布了 SynthTraces,这是一个极简的代码库,通过让一个开放模型(通过 HF Inference Providers)与一个本地小模型(通过 llama.cpp)在真实开源代码库上交互,生成合成编码智能体会话轨迹,已产出超过 2,000 个 Pi 会话轨迹,可用于训练和微调大语言模型。

今天我要发布一个名为 SynthTraces 的新项目 它是一个极简的代码库,使用 Pi(来自 @badlogicgames)生成合成编码智能体会话轨迹 我想要大量的编码智能体轨迹,所以我构建了一个小型框架,让两个模型相互对话: - 一个开放模型(通过 HF Inference Providers 提供)扮演编码智能体。它可以读取和通过 bash 访问一个真实的开源代码库(huggingface OSS 项目) - 一个本地小模型(通过 llama.cpp)扮演人类用户,提出简单问题,比如“如何运行这个?”或“CI 是如何设置的?” 结果是超过 2,000 个 Pi 会话轨迹,可用于训练或微调大语言模型,并针对 Pi 进行优化 当然,所有内容都已发布在 @huggingface 上
查看原文
查看缓存全文

缓存时间: 2026/06/05 07:11

今天,我发布了一个名为 SynthTraces 的新项目。

这是一个极简代码库,用于利用 Pi(来自 @badlogicgames)生成合成的编码智能体会话轨迹。

我想要大量的编码智能体轨迹,因此我搭建了一个小型框架,让两个模型相互对话:

  • 一个开放模型(通过 HF Inference Provider 提供服务)扮演编码智能体。它拥有对一个真实开源代码库(huggingface 的 OSS 项目)的读取和 bash 访问权限。
  • 一个小型本地模型(llama.cpp)扮演人类用户,提出诸如“如何运行这个?”或“CI 是如何设置的?”之类的简单问题。

结果产生了超过 2,000 条 Pi 会话轨迹,可用于训练或微调 LLM,并针对 Pi 进行优化。

当然,所有内容都已发布在 @huggingface 上。

相似文章