从零开始使用MLX构建大语言模型
摘要
一份关于使用Apple的MLX框架从零开始构建大语言模型的指南。
暂无内容
相似文章
从零构建一个复古风格的LLM
作者记录了从零构建一个340M参数LLM的过程,该模型仅使用1900年以前的文本进行训练,包括自定义数据集、训练脚本,并开源了模型和代码。
LLM Wiki v2(16分钟阅读)
本文介绍了一种利用LLM构建个人知识库的模式,为在大语言模型辅助下进行知识管理提供了结构化方法。
@tut_ml: 最佳大型语言模型课程 - https://mltut.com/best-large-language-models-courses/…
一篇博客文章列出了10个最佳大型语言模型(LLM)课程和培训资源,包括来自Coursera、DataCamp、Udacity以及Vanderbilt等大学的课程。
rasbt/LLMs-from-scratch
该仓库提供开源代码,用于从零开始构建、预训练和微调一个类似GPT的大型语言模型,是Sebastian Raschka同名书籍的官方代码配套。
@_rohit_tiwari_: 这本115页的书揭示了LLM微调的秘密。https://drive.google.com/file/d/1cS5sWZw9XUDRI4uRh02-28Xq4-P…
一本全面介绍大语言模型微调的115页指南,涵盖理论与实践。