@neural_avb:观看这个45分钟的视频,学习如何创建合成数据集并训练针对狭窄任务的小型(1亿参数)本地语言模型…
摘要
一个45分钟的视频教程,关于创建合成数据集并训练针对狭窄任务的小型(1亿参数)本地语言模型,提供了代码和资源。
观看这个45分钟的视频,学习如何创建合成数据集并训练针对狭窄任务的小型(1亿参数)本地语言模型。
代码、数据集、模型、工具框架均在评论区中。https://t.co/JFpVB1MOMK
查看缓存全文
缓存时间: 2026/05/29 08:00
观看这个45分钟的视频,学习如何创建合成数据集,并训练擅长狭窄任务的小型(1亿参数)本地语言模型。代码、数据集、模型、测试工具均在评论区。https://t.co/JFpVB1MOMK
相似文章
@neural_avb: 下一个视频是关于训练小型(<1B)模型用于偏好调优。以及如何使用本地模型生成偏好数据集…
宣布即将发布一个关于训练小型模型用于偏好调优的视频,涵盖奖励模型、RLHF、DPO、ORPO,以及Unsloth和TRL的使用。
@phosphenq:Andrej Karpathy 这段 2 小时视频,比今年你刷过的所有 AI 教程加起来还管用
OpenAI 联合创始人 Andrej Karpathy 发布了一段 2 小时教学视频,承诺让观众大幅提升大语言模型的实战能力。
从零开始在8GB显存上训练LLM。我开心
构建了一个仓库,用于在8GB显存上从零训练一个微型语言模型(25M参数),支持MTP,但指出mHC和BitNet的局限性。
CS336:从零开始的语言建模
斯坦福大学提供一门综合课程CS336,学生将从零开始构建语言模型,涵盖数据收集、Transformer构建、训练和评估。
@TDataScience:跟随@neural_avb的全方位深度解析,了解“递归语言模型(RLM)是什么、为何它们会在长上下文基准测试中持续胜出……”
一篇关于递归语言模型(RLM)的教育性深度文章,解释了RLM是什么、为何它们能在长上下文基准测试中胜出,以及它们与现有智能体框架(如ReAct或CodeAct)的不同之处,并通过一个简单的案例研究进行说明。