标签
一本开源书籍,构建了大型语言模型的数学基础,涵盖线性代数、微积分、概率和Transformer架构,包含超过1000页的清晰解释和实用示例。
一条推文宣布了一个GitHub仓库,该仓库使用源码映射解析Claude Code的架构,提供了一本关于Anthropic的AI编程代理内部机制的18章节教育书籍。
本文介绍了MiniGPT,这是一个基于PyTorch从头实现的紧凑型GPT风格自回归语言模型,其构建参考了nanoGPT的研究。该模型在Tiny Shakespeare数据集上使用字符级分词进行评估,在10.77M参数配置下达到了1.4780的验证损失。
一条推文强调,Citadel 每年向掌握概率论和偏微分方程技能的量化分析师支付 80 万美元,并推荐一场关于随机微分方程的 MIT 讲座。
发现一个GitHub开源项目hello-agents,它整理了一套从理论到实践的AI Agent开源课程,涵盖Agentic RL、SFT、GRPO等核心技能,登上GitHub热榜。
一个名为Transformer Explainer的免费交互式工具,在浏览器中运行实时GPT-2模型,通过桑基图和实时推理可视化Transformer的内部工作原理。
本文来自哈佛大学的 CS 61 课程,涵盖了 Unix 中的管道、Fork 和僵尸进程概念,解释了在关闭时管道如何自动终止程序,以及如何使用管道实现对子进程的阻塞等待。
一篇博客文章指导读者如何搭建树莓派集群进行分布式训练和推理,这是系列教程的一部分,旨在利用实惠的硬件让分布式AI变得可及。
LLMs-from-scratch 是一个 GitHub 仓库,配套《Build a Large Language Model》一书,提供从零用 PyTorch 实现 GPT 的完整代码,涵盖预训练、微调、RLHF 等全流程,已获 93K+ stars,适合想深入理解大模型原理的开发者。
Tiny-Lua-Compiler 是一个用于教学的、自举的 Lua 5.1 编译器和虚拟机,完全用纯 Lua 编写。其设计目标是体积足够小以便于研究,同时又功能完备到足以处理真实的语言特性。
本指南解释了大语言模型的端到端推理管线,作为理解文本生成的模拟面试资源。
本文介绍了行为克隆(Behavioral Cloning),这是一种模仿学习技术,用于从专家演示中训练策略。文章讨论了其在最大似然估计中的理论基础,以及其在 AlphaGo 等历史应用中的使用情况。
一个GitHub仓库,提供复杂系统设计概念的视觉化和简单解释,涵盖API、负载均衡、HTTP和网络等主题。
一个全面、免费、开源的人工智能工程课程,包含20个阶段的428节课程,涵盖从数学基础到使用Python、TypeScript、Rust和Julia实现的自主集群。
该仓库提供开源代码,用于从零开始构建、预训练和微调一个类似GPT的大型语言模型,是Sebastian Raschka同名书籍的官方代码配套。
Datawhale社区发布的开源中文教程《从零开始构建智能体》,系统性讲解AI原生智能体的理论与实践,涵盖从基础原理到自研框架HelloAgents的完整学习路径。