@neural_avb: 我最好的新习惯是让我的代理记录我在训练模型时使用的所有技巧和秘籍。我有日志……

X AI KOLs Timeline 新闻

摘要

作者分享了一个习惯:使用代理记录所有训练技巧和秘籍,包括超参数调整和数据集升级,以保持事实日志供日后参考和教程制作。

我最好的新习惯是让我的代理记录我在训练模型时使用的所有技巧和秘籍。 对于每一次超参数调整、数据集升级及其结果,我都有日志。 这是一个非常有教育意义的事件链,以后可以回顾,并且在我制作 YouTube 教程时保持事实和诚实。
查看原文
查看缓存全文

缓存时间: 2026/06/18 20:21

我最近养成的最好习惯是让智能体记录下我训练模型时使用的所有技巧和捷径。

我记录了每次超参数调整、数据集升级及其结果。

这是一条非常有教育意义的事件链,以后可以随时回顾。而且在制作YouTube教程时,也能让内容保持真实客观。

AVB (@neural_avb): 我逐步构建了这个135M参数的小型推理SLM,依次经历了CPT、SFT、DPO,现在正在做RL。

在这个数据和模型流程上投入了好几天。它居然真的有效!能以300 tok/s的速度执行研究文本的窄域目标任务。

好了,如果你们不介意,我要去制作超棒的YouTube内容了!

相似文章