@charles_irl: 在忙碌中竟然错过了这个。很酷的演示!

X AI KOLs Following 工具

摘要

一位开发者使用自建ML框架,基于Rust后端和CUDA内核,包含Flash Attention和AdamW,从零训练了一个1200万参数的LLM。

在忙碌中错过了这个。 很酷的演示!https://t.co/CWsyssqk09
查看原文
查看缓存全文

缓存时间: 2026/06/08 07:17

不知为何在忙碌中错过了这个。

非常酷的演示!https://t.co/CWsyssqk09

Aadi Kulshrestha (@MankyDankyBanky): 我用自己构建的机器学习框架训练了一个12M参数的LLM,后端基于Rust,并使用了CUDA内核实现Flash Attention、AdamW等。

从头编写了完整的Transformer架构和BPE分词器。

该框架特性包括:

  • 自定义CUDA内核(Flash Attention、fused

相似文章