@nicodotdev:关于 Transformers.js 你一直想了解的一切,都在一个视频中。我深入探讨了 AI 模型如何从…运行
摘要
一个深入探讨的视频,解释如何使用 Transformers.js 从 JavaScript 运行 AI 模型,涵盖张量、ONNX、量化、WebGPU/WASM 等。
查看缓存全文
缓存时间: 2026/05/29 19:55
关于 Transformers.js,你想知道的一切,都在这个视频里。
我深入探讨了 AI 模型如何在 JavaScript 中运行:张量、ONNX、量化、pipeline()、WebGPU/WASM、预处理、后处理以及底层的运作机制。
观看:
相似文章
@gordic_aleksa: 新深度博文时刻:Inside the Transformer: The Life of a Token 对现代密集Transformer的深入探讨,我…
一篇深入探讨现代密集Transformer内部工作原理的博文,涵盖YaRN(位置信息)、混合注意力(实现160k上下文长度)、soft capping、QK归一化,以及Transformer数学(包括FLOPs/Token公式和集群规模估算)。
@juleslogs: 想理解现代AI?从这里开始:1. Transformers → Illustrated Transformer 2. LLMs → Build a Large Language Mo…
一条推文,整理了理解现代AI的基础资源,涵盖从Transformer到物理AI的主题,包括关键论文和模型。
@AlphaSignalAI: 这个免费的交互式解释器刚刚揭示了GPT实际上是如何工作的。大多数人把Transformer当作魔法。你输入…
一个名为Transformer Explainer的免费交互式工具,在浏览器中运行实时GPT-2模型,通过桑基图和实时推理可视化Transformer的内部工作原理。
@DamiDefi: 一位开发者刚刚绘制了支撑Claude、ChatGPT以及你正在构建的每个智能体栈的所有AI概念。20个概念…
一位开发者制作了一个免费的40分钟详解,解释了Claude和ChatGPT等模型背后的20个关键AI概念,涵盖了tokenization(分词)、attention(注意力机制)、RAG(检索增强生成)、智能体等,旨在为构建者提供实用的心智模型。
@AndrewYNg: 新课程:Transformers in Practice。你将获得对基于Transformer的LLM工作方式的实践理解,从而能够推理…
deeplearning.ai与AMD合作推出的新课程《Transformers in Practice》,教授对基于Transformer的LLM的实践理解,涵盖文本生成、注意力机制以及量化(quantization)和KV缓存等推理优化技术。