@ekzhang1: 致敬karpathy加入Anthropic:制作了一个浏览器内(WebGPU)版本的著名char-rnn 'Unreasonable effectiveness of RNNs'演示,在莎士比亚数据集上训练
摘要
创建了一个在浏览器中运行的WebGPU版本的经典char-rnn演示,在莎士比亚数据集上训练,以向加入Anthropic的Karpathy致敬。
致敬karpathy加入Anthropic:制作了一个浏览器内(WebGPU)版本的著名char-rnn 'Unreasonable effectiveness of RNNs'演示,在莎士比亚数据集上训练 :)
啊,这和我学生时代在2016年玩keras时一样酷 https://t.co/zittY9bBnv
查看缓存全文
缓存时间: 2026/05/20 12:29
致敬卡帕西加入Anthropic:我制作了一个浏览器内(webgpu)版本的著名 char-rnn 演示(“RNNs 的非凡有效性”),在莎士比亚作品上训练 :)
啊,这和我2016年还是个学生玩Keras时一样酷 https://t.co/zittY9bBnv
相似文章
@charles_irl: 在忙碌中竟然错过了这个。很酷的演示!
一位开发者使用自建ML框架,基于Rust后端和CUDA内核,包含Flash Attention和AdamW,从零训练了一个1200万参数的LLM。
@evanyou: https://x.com/evanyou/status/2060409444123729935
一位开发者分享了一个有趣的案例:在浏览器中运行LLM以检查其内部工作原理,强调了客户端AI的一个有意义场景。
@ngxson: Qwen3.6-27B 在 WebGPU 上 100% 运行。速度不是最快,但仍然不错
一位开发者演示在浏览器中完全通过 WebGPU 运行 Qwen3.6-27B AI 模型,尽管速度并非最优。
@yoheinakajima: 全新的 http://di.gg 看起来很棒!
这是来自 Digg 的热门 AI 新闻汇总,涵盖了 Neuralink 脑机接口植入物、NVIDIA 针对 Claude Code 的性能修复、Anthropic 的政策立场以及 Flowception 视频建模代码的发布等话题。
@karpathy:我正在录制我的 nanochat 视频时意识到,“先从我喜欢的提供商那里启动一台 8XH100!”会立即让所有人卡在视频的第一步…
Andrej Karpathy 指出,他的 nanochat 教程中常见的第一个步骤(启动一台 8XH100 GPU)会让初学者无从下手,凸显了 AI 开发的进入门槛。