pytorch

标签

Cards List
#pytorch

@PyTorch: 首次PyTorch Meetup新加坡活动汇聚了工程师、研究人员和社区建设者,共同探讨了……

X AI KOLs Following · 2026-06-12 缓存

首次PyTorch Meetup新加坡活动汇聚了AI从业者,围绕vLLM更新、主权智能和开源交流进行了技术讲座。

0 人收藏 0 人点赞
#pytorch

@yihong0618: 我今天中午按照顺序读大哥的文章,4 年前大哥还在照着吴恩达的课程一点一点学,在一篇的最后大哥写下了这段话,没想到 4 年过去了,大哥真的已经是在顶刊发论文的科研大牛,有点感慨。https://zhouyifan.net/2022/05/3…

X AI KOLs Timeline · 2026-06-12 缓存

作者感慨一位大哥从四年前跟着吴恩达课程学习到如今在顶刊发表论文的成长历程,并引用了一篇风格迁移论文讲解与PyTorch实现的博客。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 实现更智能、更长时间思考的智能体 通过缩短CPU执行时间规模化智能体AI和强化学习,在…

X AI KOLs Following · 2026-06-11 缓存

NVIDIA推出搭载神经分支预测器的Vera CPU,通过缩短CPU执行时间、提高AI工厂吞吐量,加速智能体AI和强化学习工作负载。

0 人收藏 0 人点赞
#pytorch

PyTorch 性能分析(第 2 部分):从 nn.Linear 到融合 MLP

Hugging Face Blog · 2026-06-11 缓存

本篇博文继续 PyTorch 性能分析系列内容,探讨 nn.Linear、MLP 块以及使用 Triton 内核的融合技术,以优化性能。

0 人收藏 0 人点赞
#pytorch

TorchCodec 0.14:适用于CPU和CUDA的HDR视频解码以及快速WAV解码器

Hacker News Top · 2026-06-10 缓存

TorchCodec 0.14 新增了适用于CPU和CUDA的HDR视频解码功能,以及一个快速的WAV解码器,能够高效地将视频和音频数据转换为PyTorch张量,用于机器学习工作流。

0 人收藏 0 人点赞
#pytorch

WWDC 2026 上的 Siri AI

Simon Willison's Blog · 2026-06-08 缓存

苹果在 WWDC 2026 上发布了新一代 Siri AI 功能,包括基于 Gemini 的定制模型和集成 PyTorch 的全新 Core AI 库,该库运行在 Google Cloud 的 NVIDIA GPU 上,置于 Private Cloud Compute 环境中。

0 人收藏 0 人点赞
#pytorch

@QingQ77: 将阿里达摩院的 ZipEnhancer 降噪模型从 ModelScope pipeline 中剥离,封装为高性能 FastAPI 降噪服务。 https://github.com/gyj1201/zipEnhancer… 阿里达摩院的 Z…

X AI KOLs Timeline · 2026-06-08 缓存

本项目将阿里达摩院的ZipEnhancer降噪模型从ModelScope pipeline剥离,用纯PyTorch重写推理逻辑并封装为FastAPI服务,支持FP16半精度和长音频分段处理,提供多种降噪模型切换和API接口。

0 人收藏 0 人点赞
#pytorch

NanoQuant的一种实现:一种灵活的二进制量化方法

Reddit r/LocalLLaMA · 2026-06-08

NanoQuant是一种灵活的二进制量化方法,可将稠密Transformer压缩至每个权重低于1比特。本仓库提供了一个PyTorch实现,仍在开发中,能够量化Qwen3-0.6B和Qwen3-4B等模型。

0 人收藏 0 人点赞
#pytorch

@DanKornas:深入学习PyTorch的更好方式——跟随完整的YouTube课程系列,而非零散片段。……

X AI KOLs Timeline · 2026-06-05 缓存

一份精心策划的指南,通过完整的YouTube直播课程系列来学习使用PyTorch进行深度学习,内容涵盖从张量到生成对抗网络,共分为六个部分。

0 人收藏 0 人点赞
#pytorch

@_rohit_tiwari_:用PyTorch从头构建类似GPT的LLM > 将LLM架构拆分为简单部分 > 对初学者友好 > Fu…

X AI KOLs Timeline · 2026-06-05 缓存

一个对初学者友好的动手GitHub仓库,将类似GPT的LLM架构拆分为简单部分,包含10个Jupyter笔记本,涵盖分词、注意力机制、Transformer块以及用PyTorch实现的微型GPT。

0 人收藏 0 人点赞
#pytorch

Hi Reddit, I posted my Build Your Own LLM workshop to Youtube (GPT2 & Qwen3.6 style)

Reddit r/LocalLLaMA · 2026-06-05 缓存

Justin Angel 发布了一个完整的 YouTube 工作坊,教你从零构建自己的大语言模型(基于 GPT-2 和 Qwen3.6 风格),涵盖 Transformer 架构、训练流程,并提供 Excel 手动操作和 Python/PyTorch 代码实践,无需数学或 ML 先修知识。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 关于教程的更多详情 https://pldi26.sigplan.org/details/pldi-2026-tutorials/1/Writing-Performance-Portable-K…

X AI KOLs Following · 2026-06-04 缓存

Helion 是一个 Python 领域特定语言(DSL),可编译为优化的 Triton 代码,用于实现性能可移植的 GPU 内核。本教程将在 PLDI 2026 上介绍 Helion 的架构、自动调优以及 CuteDSL 后端。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 6月15日(周一),PyTorch Foundation 项目 Helion 将在 PLDI 2026(第47届 ACM SIGPLAN 会议…)上举办 Helion DSL 教程。

X AI KOLs Following · 2026-06-04 缓存

PyTorch Foundation 项目 Helion 将在丹佛举办的 PLDI 2026 上开设 Helion DSL 教程。这是一个互动式工作坊,面向编译器研究人员、内核作者和机器学习系统工程师,参与者将编写、自动调优并运行真实的 Helion 内核。

0 人收藏 0 人点赞
#pytorch

@DanKornas:不要通过零散的教程学习 LLM。LLM from Scratch 是一个面向开发者的实践性 PyTorch 课程,适合那些想要……

X AI KOLs Timeline · 2026-06-02 缓存

一个实践性 PyTorch 课程,教授从 Transformer 基础到微调和对齐的 LLM 训练,包括 RLHF 和 GRPO。

0 人收藏 0 人点赞
#pytorch

我为 PyTorch 训练循环构建调试器所学到的东西,以及它如何改变我对故障诊断的思考 [D]

Reddit r/MachineLearning · 2026-05-30

作者分享了构建 NeuralDBG 的经验,这是一个针对 PyTorch 训练循环的开源调试器,通过监测逐层梯度范数的变化而非全局损失来检测局部故障,如梯度消失/爆炸。文中包含实用代码片段和社区问题。

0 人收藏 0 人点赞
#pytorch

PyTorch 中的性能分析(第一部分):torch.profiler 初学者指南

Hugging Face Blog · 2026-05-29 缓存

这是一份初学者友好的指南,介绍如何使用 PyTorch 的 torch.profiler 对神经网络操作进行性能分析和优化,从矩阵乘法和偏置加法开始。它解释了如何读取分析器跟踪并理解 CPU/GPU 交互。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 激动宣布EAGLE 3.1 - 来自@EagleCorp的推测解码下一代演进,由@hongyangzh开发,…

X AI KOLs Following · 2026-05-27

EAGLE 3.1,推测解码的下一代演进,引入了新的FC归一化以提高效率,由EagleCorp与PyTorch、vLLM和TorchSpec合作开发。

0 人收藏 0 人点赞
#pytorch

@PyTorch: 模型优化与训练后量化 模型量化是一种减少VRAM使用并提高...

X AI KOLs Following · 2026-05-26 缓存

这篇来自NVIDIA的文章介绍了如何使用NVIDIA Model Optimizer库,通过训练后量化方法将CLIP模型量化为FP8格式,从而减少VRAM使用并提升在消费级GPU上的推理性能。

0 人收藏 0 人点赞
#pytorch

@PyTorch: PyTorch 成员 Meta 刚刚开源了一个 GPU 内核,使注意力在 NVIDIA Blackwell 上加速 2.3 倍。TLX Block Atte…

X AI KOLs Following · 2026-05-26 缓存

Meta 开源了 TLX Block Attention,这是一个 warp 特化的 Triton 内核,在 NVIDIA Blackwell GPU 上为块对角自注意力实现了 2.3 倍的加速,与旋转嵌入融合时加速可达 3.5 倍。

0 人收藏 0 人点赞
#pytorch

Thermocompute 常量时间推理 [P]

Reddit r/MachineLearning · 2026-05-24 缓存

Thermocompute 是一个用于热力学概率计算的 PyTorch 仿真器,通过利用并行的热力学底层,使神经网络层能够实现恒定的建模物理时间推理,并立即提供可用于 GPU 的随机层。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈