@ekzhang1: 致敬karpathy加入Anthropic：制作了一个浏览器内（WebGPU）版本的著名char-rnn 'Unreasonable effectiveness of RNNs'演示，在莎士比亚数据集上训练

X AI KOLs Following 2026/05/20 04:59 工具

webgpu char-rnn in-browser demo karpathy anthropic rnn

摘要

创建了一个在浏览器中运行的WebGPU版本的经典char-rnn演示，在莎士比亚数据集上训练，以向加入Anthropic的Karpathy致敬。

致敬karpathy加入Anthropic：制作了一个浏览器内（WebGPU）版本的著名char-rnn 'Unreasonable effectiveness of RNNs'演示，在莎士比亚数据集上训练 :) 啊，这和我学生时代在2016年玩keras时一样酷 https://t.co/zittY9bBnv

查看原文

查看缓存全文

缓存时间: 2026/05/20 12:29

致敬卡帕西加入Anthropic：我制作了一个浏览器内（webgpu）版本的著名 char-rnn 演示（“RNNs 的非凡有效性”），在莎士比亚作品上训练 :)

啊，这和我2016年还是个学生玩Keras时一样酷 https://t.co/zittY9bBnv

相似文章

@charles_irl: 在忙碌中竟然错过了这个。很酷的演示！

X AI KOLs Following

一位开发者使用自建ML框架，基于Rust后端和CUDA内核，包含Flash Attention和AdamW，从零训练了一个1200万参数的LLM。

@ekzhang1：我看着像这个家伙一样写真正的GPU内核的人 :)

X AI KOLs Timeline

AI模型Claude被用于使用pyptx DSL编写FlashAttention前向内核，在NVIDIA B200硬件上实现了与手工调优的FlashAttention-4近乎相同的性能。

@evanyou: https://x.com/evanyou/status/2060409444123729935

X AI KOLs Following

一位开发者分享了一个有趣的案例：在浏览器中运行LLM以检查其内部工作原理，强调了客户端AI的一个有意义场景。

@ngxson: Qwen3.6-27B 在 WebGPU 上 100% 运行。速度不是最快，但仍然不错

X AI KOLs Following

一位开发者演示在浏览器中完全通过 WebGPU 运行 Qwen3.6-27B AI 模型，尽管速度并非最优。

我构建了一个工具，用于在8GB GPU上自动交换VRAM，将小型Prompter和大型Coder串联成一个流水线，避免手动切换模型

Reddit r/LocalLLaMA

作者构建了Prompt-Chain，这是一个Streamlit应用，它将一个小型prompter模型和一个大型coder模型串联起来，并自动交换VRAM，从而在8GB GPU上实现高效的代码生成。

相似文章

@charles_irl: 在忙碌中竟然错过了这个。很酷的演示！

@ekzhang1：我看着像这个家伙一样写真正的GPU内核的人 :)

@evanyou: https://x.com/evanyou/status/2060409444123729935

@ngxson: Qwen3.6-27B 在 WebGPU 上 100% 运行。速度不是最快，但仍然不错

我构建了一个工具，用于在8GB GPU上自动交换VRAM，将小型Prompter和大型Coder串联成一个流水线，避免手动切换模型

提交意见反馈