triton-kernels

标签

Cards List
#triton-kernels

@raphaelsrty:在GPU上计算最大相似度(ColBERT、ColPali的评分步骤)可以被优化,这正是@tonywu_71所做的。我……

X AI KOLs Following · 2天前 缓存

Tony Wu发布了late-interaction-kernels (LIK):用于MaxSim的融合Triton内核,MaxSim是ColBERT和ColPali背后的评分步骤,已集成到PyLate和colpali-engine中,提供了内存效率和性能提升。

0 人收藏 0 人点赞
#triton-kernels

Wall Attention(GitHub 仓库)

TLDR AI · 2026-06-03 缓存

Wall Attention 是一种新的注意力变体,具有每个通道、每个时间步的乘法衰减,提供内容相关的遗忘率,以及在Triton中实现的高效训练/解码内核。

0 人收藏 0 人点赞
#triton-kernels

@akshay_pachaar:PyTorch Autograd 与 Unsloth Triton 内核对比。UnslothAI 背后的核心工程一直令人印象深刻!它并未……

X AI KOLs Following · 2026-04-20 缓存

技术解析:对比 PyTorch 默认的 autograd 与 UnslothAI 使用 OpenAI Triton 语言编写的自定义反向传播内核,以实现更高效的 LLM 微调。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈