pytorch

标签

Cards List
#pytorch

SOLAR:AI驱动的光速性能分析

arXiv cs.LG · 11小时前 缓存

SOLAR是一个框架,它利用LLM前端和确定性分析,从PyTorch和JAX源代码自动推导经过验证的光速性能界限,从而为深度学习工作负载提供余量分析和优化洞察。

0 人收藏 0 人点赞
#pytorch

Kuma:将PyTorch模型编译为自包含的WebGPU可执行文件 [P]

Reddit r/MachineLearning · 19小时前

Kuma是一个编译器/运行时,它将导出的PyTorch模型编译成自包含的WebGPU可执行文件,从而实现无需Python或服务器依赖的直接浏览器推理。

0 人收藏 0 人点赞
#pytorch

@PyTorch:一个运行时,多种GPU架构,零厂商特定模型代码。在这篇博文中,TokenSpeed团队 @l…

X AI KOLs Following · 昨天 缓存

TokenSpeed-Kernel是一个可移植、高性能的内核系统,用于LLM推理,实现零厂商特定模型代码,并支持多种GPU架构,在AMD MI355X上实现高达3.6倍的吞吐量提升。

0 人收藏 0 人点赞
#pytorch

@PyTorch:两天。数百名#AI从业者。一个社区。#PyTorchCon 北美大会即将在加利福尼亚州圣何塞举办,10月…

X AI KOLs Following · 3天前 缓存

PyTorchCon 北美大会将于2026年10月20日至21日在加利福尼亚州圣何塞举行,早鸟注册截止到7月31日。

0 人收藏 0 人点赞
#pytorch

带注释的 PyTorch 训练循环

Hacker News Top · 3天前 缓存

一份构建正确 PyTorch 训练循环的详细指南,重点介绍常见错误和正确的操作顺序。

0 人收藏 0 人点赞
#pytorch

以数据为中心的调试:面向训练神经网络的团队 [P]

Reddit r/MachineLearning · 4天前

WeightsLab 是一个开源、PyTorch 原生的工具,允许团队在训练过程中暂停、检查实时损失信号,并在数据问题(如标签错误和类别不平衡)影响模型性能之前发现它们。它专为处理图像、视频和 LiDAR 点云的计算机视觉工程师而设计。

0 人收藏 0 人点赞
#pytorch

在 diffusers 库中学习 FLUX 很难,所以我构建了一个更小的开源版本 [P]

Reddit r/MachineLearning · 5天前 缓存

一个简化的开源 PyTorch 实现,包含可逐行验证的源代码映射,专为教育目的设计。

0 人收藏 0 人点赞
#pytorch

@PierceZhang34: GitHub 上面一份机器学习系统笔记 作者过去几个月,深入研究了机器学习系统,主要围绕大语言模型的训练和推理。这份笔记集涵盖分布式计算、并行化、量化以及PyTorch内部机制,大部分内容来自作者实验 1. 分布式技术 - 涵盖分布式训练…

X AI KOLs Timeline · 6天前 缓存

分享一份GitHub上的机器学习系统笔记,涵盖大语言模型训练推理相关的分布式计算、并行化、量化和PyTorch内部机制,适合对ML系统感兴趣的学习者。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 自动调优是Helion的支柱,Helion是PyTorch用于性能可移植ML内核的DSL。目前Helion搜索利用…

X AI KOLs Following · 2026-06-18 缓存

本文探讨了使用LLM引导的自动调优来加速PyTorch的Helion DSL中的内核配置搜索,取代了较慢的Likelihood-Free Bayesian Optimization方法。

0 人收藏 0 人点赞
#pytorch

@ben_burtenshaw: https://x.com/ben_burtenshaw/status/2067615361428545566

X AI KOLs Timeline · 2026-06-18 缓存

一份关于监督微调(SFT)训练AI代理的详细教程,完全基于纯PyTorch从零构建,使用Qwen3-0.6B模型,解释了下一个词元预测和标签掩码的机制。

0 人收藏 0 人点赞
#pytorch

@FakeMaidenMaker: 炸裂!这个开源项目能给自部署的大模型推理大幅提速、还省显存 GitHub 狂揽 9.2K star,已经加入 PyTorch 基金会,NVIDIA 的 Dynamo 也集成了它。 GitHub:https://github.com/LMC…

X AI KOLs Timeline · 2026-06-18 缓存

LMCache 是一个 KV 缓存管理层,通过缓存并复用 KV cache 来加速大模型推理、降低显存消耗,已获 9.2K star 并加入 PyTorch 基金会,被 NVIDIA Dynamo 集成。

0 人收藏 0 人点赞
#pytorch

@ZhengyangGeng: 你永远可以相信Kaiming的质量标准。写作、代码、数据、配方、检查点…… https://github.com/PeppaKing8/minit2i-…

X AI KOLs Timeline · 2026-06-17 缓存

MiniT2I 是一个极简的直接RGB文本到图像生成器,使用像素空间MM-JiT去噪器,结合流匹配和冻结的FLAN-T5-Large文本令牌,并开源了JAX/Flax和PyTorch实现以及检查点。

0 人收藏 0 人点赞
#pytorch

@jino_rohit: 理解 torch.compile 堆栈 torch.compile 是一种加速 PyTorch 代码的技术。torch.compile 通过…

X AI KOLs Timeline · 2026-06-17 缓存

本文解释了 PyTorch 中的 torch.compile 堆栈,详述了从 API 到 Dynamo、FX 图、ATen 操作以及用于 JIT 编译的 Torch Inductor 的各个步骤。

0 人收藏 0 人点赞
#pytorch

@PyTorch:还剩24小时,提名自己或他人为PyTorch Foundation Ambassador PyTorch Foundation Ambassador…

X AI KOLs Following · 2026-06-17 缓存

PyTorch Foundation正在为大使计划征集提名,该计划支持组织活动、创作内容、指导新手以及为开源做贡献的社区领袖。申请开放至2026年6月18日,重点关注代表性不足的地区。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 弥合模型优化与生产部署之间的差距——本教程将介绍一个典型的端到端…

X AI KOLs Following · 2026-06-16 缓存

本教程来自NVIDIA,介绍了将FP8量化PyTorch模型转换为TensorRT推理引擎用于生产部署的端到端工作流程,涵盖ONNX导出和性能分析。

0 人收藏 0 人点赞
#pytorch

owensong/Inflect-Nano-v1

Hugging Face Models Trending · 2026-06-16 缓存

Inflect-Nano-v1 是一个极小的英文文本转语音模型,总推理参数(包括其声码器)为 4.63M,专为本地高效的语音合成实验而设计。

0 人收藏 0 人点赞
#pytorch

@jichiep: privacy-filter.cpp 与 PyTorch 实现的性能对比。大约快 1.6 倍至 18 倍:

X AI KOLs Following · 2026-06-16 缓存

privacy-filter.cpp 在性能上比 PyTorch 实现快约 1.6 倍至 18 倍。

0 人收藏 0 人点赞
#pytorch

@_rohit_tiwari_: PyTorch 基础:动手深度学习的第一步。Github (900+ 星): https://github.com/analyticalr…

X AI KOLs Timeline · 2026-06-16 缓存

一个适合初学者的GitHub仓库,涵盖PyTorch基础,包括张量初始化、运算、索引和重塑,拥有超过900颗星。

0 人收藏 0 人点赞
#pytorch

@NFTCPS: 天天喊着搞AI,结果你连Transformer是个啥都说不清? 有个仓库够狠,从零手搓一个GPT,不调任何高级库。Attention、多头、前馈、Embedding、残差、Layer Norm,怎么拼起来的全摊给你看。而且不止模型,整条链…

X AI KOLs Timeline · 2026-06-16 缓存

一个GitHub开源项目,从零实现完整的GPT训练流程,包含数据预处理、预训练、SFT和RLHF后训练,全部基于原生PyTorch,适合想深入理解Transformer原理的开发者。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 首次PyTorch Meetup新加坡活动汇聚了工程师、研究人员和社区建设者,共同探讨了……

X AI KOLs Following · 2026-06-12 缓存

首次PyTorch Meetup新加坡活动汇聚了AI从业者,围绕vLLM更新、主权智能和开源交流进行了技术讲座。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈