deep-learning

#deep-learning

Aurora：一种针对矩形矩阵的杠杆感知优化器

Lobsters Hottest ↗ · 11小时前缓存

Tilde Research 推出了 Aurora，这是一种新型优化器，旨在在保持正交性的同时防止 MLP 层中的神经元死亡，在 nanoGPT 基准测试中取得了最新成果，并在 1B 模型上实现了 100 倍的数据效率。

0 人收藏 0 人点赞

#deep-learning

@QingQ77: 《动手学深度学习》是很好的入门书，但更新速度已经有些跟不上这个领域的发展。Transformer 之后，CLIP、Diffusion、vLLM 等等内容越来越多，网上资料虽然丰富，却很零散，今天看 Attention，明天学 LoRA，后…

X AI KOLs Timeline ↗ · 昨天缓存

该项目是一个系统化的深度学习笔记仓库，涵盖 PyTorch、Transformer、生成模型等内容，旨在解决学习资料碎片化问题，并提供代码实现与实践指南。

0 人收藏 0 人点赞

#deep-learning

@wsl8297: 加州大学开放课程《大语言模型的强化学习》，用“理论 + 实战”的方式，把 AI 训练的关键技术从零到一讲透，帮你系统建立从强化学习到 LLM 训练的完整框架。课程内容覆盖全面，配套资源齐全：讲座幻灯片、完整视频、实践练习一应俱全，学完就…

X AI KOLs Timeline ↗ · 昨天缓存

加州大学助理教授Ernest K. Ryu推出《大语言模型的强化学习》开放课程，结合理论与实践全面解析RLHF、PPO/DPO等LLM训练关键技术及配套资源。该课程为开发者与研究者提供了从基础算法到实战部署的系统学习路径。

0 人收藏 0 人点赞

#deep-learning

@ickma2311: 高效AI 第12讲：Transformer 与 LLM 本讲不仅介绍 LLM 的工作原理，还深入讲解其底层构建模块……

X AI KOLs Timeline ↗ · 昨天缓存

一门高效AI课程的第12讲笔记，涵盖 Transformer 与 LLM 基础知识，包括多头注意力机制、位置编码、KV 缓存，以及模型架构与推理效率之间的关联。内容阐释了 Transformer 中的设计选择如何影响内存占用、延迟表现和硬件效率。

0 人收藏 0 人点赞

#deep-learning

@tenderizzation：这简直超出了预期！YOLOv3 回归

X AI KOLs Following ↗ · 昨天缓存

这条社交媒体帖子表达了对 YOLOv3 目标检测模型回归或重新受到关注的兴奋之情。

0 人收藏 0 人点赞

#deep-learning

@yifan_zhang_: Jane Street 是当之无愧的王者。正如 Rohan @_arohan_ 所提到的，优秀的研究人员尊重他人的工作。量化研究…

X AI KOLs Timeline ↗ · 昨天缓存

文章强调了 Jane Street 通过量化研究推动深度学习前沿的贡献，并着重指出优秀研究人员对此类工作的尊重。

0 人收藏 0 人点赞

#deep-learning

@Ai_Tech_tool：Andrej Karpathy 本可以收这门课 2000 美元的。但他将其免费发布在 YouTube 上。涵盖完整训练栈、分词技术……

X AI KOLs Timeline ↗ · 昨天

介绍了 Andrej Karpathy 发布的免费三小时 YouTube 课程，内容涵盖大语言模型（LLM）基础，包括分词、神经网络底层原理、RLHF 及强化学习。强调深入理解这些核心架构原理，相比仅仅会调用现成的 AI 工具，能为职业发展带来显著的竞争优势。

0 人收藏 0 人点赞

#deep-learning

@neil_xbt: Andrej Karpathy 本可以收 1000 美元讲授这堂计算机视觉课！他却免费放在了 YouTube 上。这位从零打造 Tesla Autopilot、联合创立 OpenAI 的人，花了多年时间将他在讲解的架构应用于实际，规模之大多数工程师只能从文章里读到。

X AI KOLs Timeline ↗ · 2天前

Andrej Karpathy 在 YouTube 免费发布了一堂计算机视觉讲座，涵盖图像描述、定位、分割和迁移学习，内容源于他在 Tesla 和 OpenAI 的生产实践经验。

0 人收藏 1 人点赞

#deep-learning

@tom_doerr：AI、机器学习和大语言模型学习的结构化路线图 https://github.com/bishwaghimire/ai-learning-roadmaps…

X AI KOLs Timeline ↗ · 2天前缓存

一个全面且开源的 GitHub 仓库，提供结构化的学习路线图与精选资源，助力学习者从入门到精通掌握 AI、机器学习、深度学习及大语言模型。该资源面向学生与专业人士设计，内容涵盖基础概念、编程框架、职业发展路径以及前沿 AI 议题。

0 人收藏 0 人点赞

#deep-learning

@tetsuoai: 四十分钟的白板讲解。完整的Transformer架构。然后打开Vim并用C语言编写。

X AI KOLs Timeline ↗ · 2天前缓存

一段40分钟的讲解通过白板图完整介绍了Transformer架构，并演示了如何在Vim中使用C语言进行实际实现。

0 人收藏 0 人点赞

#deep-learning

基于优化深度学习与 LLM 驱动智能 AI 在计算受限系统上进行膝关节骨关节炎严重程度分级

arXiv cs.AI ↗ · 2天前缓存

本文介绍了一种用于分级膝关节骨关节炎严重程度的自动化诊断系统，该系统使用通过 TensorFlow Lite 部署在边缘设备上的优化 ResNet-18 模型。它集成了使用 Gemini 2.0 Flash 的大型语言模型（LLM）接口，在提供结构化解释性发现的同时，保持了在资源受限环境下的离线能力。

0 人收藏 0 人点赞

#deep-learning