@cjzafir:在 Claude Fable 5 被禁之前,我把我所有的微调研究和实验变成了一个产品:http://Finetuner…
摘要
开发者 @cjzafir 宣布推出 Finetuner.dev,一个 CLI 工具,利用 Codex 5.5 等编排模型以及中国模型生成高质量、手工精制的数据集,用于微调小语言模型(1B-30B),声称成本降低 10 倍,质量提升 5 倍。
查看缓存全文
缓存时间: 2026/06/16 01:13
在 Claude Fable 5 被封禁之前,我将自己所有的微调研究和实验转变成了一款产品:http://Finetuner.dev (一个用于生成数据集以微调 AI 模型的 CLI 工具)。
Finetuner 使用 Codex 5.5 或 Opus 4.8 作为编排器,并利用国产模型(DeepSeek v4 Pro、Kimi K2.7、MiMo v2.5 等)生成数据集行。
该系统的独特之处在于这些数据集并非由 Python 脚本改写而来。每一行数据都是由国产模型根据编排器模型的指令精心手工生成的。
现在,任何人都可以生成数据集来微调小型语言模型(1B 到 30B 参数)。
我实现了 10 倍的成本降低和 5 倍的数据集质量提升。
产品将在几天后发布。(我会将相关技能开源。)
finetuner.dev — 将一个想法转化为微调数据集
来源:https://www.finetuner.dev/ 用于数据集生成的 CLI,以微调模型。v1.0.0
无需排队等待,即将在几天后上线。
相似文章
@cjzafir: 这是我的微调数据集生成流程:> Codex 5.5 作为编排器 > Deepseek v4 Pro 作为生成器 简而言之…
本文描述了一个微调数据集生成流程,使用 Codex 5.5 作为编排器,Deepseek v4 Pro 作为生成器,通过自主质量门控和迭代改进,以低成本生成高质量合成数据。
@cjzafir: 我日常使用的模型:> Codex 5.5 high (fast) > Deepseek v4 pro via API > Kimi 2.6 via API 我正在微调的模型...
用户分享了一份日常使用的AI模型列表(Codex 5.5、Deepseek v4 pro、Kimi 2.6)以及用于微调的模型(Qwen 3.5系列、Gemma4 E4B、GPT-oss 20B),目标是微调小型语言模型(SLM)成为专家语言模型(ELM)。
@shadcn:你只有几天时间使用 Claude Fable。以下是如何充分利用它。介绍 /improve:使用你最强的模型……
介绍 /improve,这是一个工具,它利用 Claude 的最强模型来审查你的代码库,识别 bug、性能问题、技术债务、缺失的测试,并编写计划供更便宜的模型执行。
Claude Fable 5 基准测试
Anthropic 发布了 Claude Fable 5(一款新的人工智能模型)的基准测试,显示出显著的性能提升。
@natolambert: Claude 5 Fable性能的巨大飞跃证明了那些说Opus 4.5并觉得‘是的,我该(大部分…’的人是正确的。
Nathan Lambert强调了Claude 5 Fable性能的显著提升,暗示这验证了从手动编码转向的必要性。