triton-kernels

#triton-kernels

@raphaelsrty：在GPU上计算最大相似度（ColBERT、ColPali的评分步骤）可以被优化，这正是@tonywu_71所做的。我……

X AI KOLs Following ↗ · 2天前缓存

Tony Wu发布了late-interaction-kernels (LIK)：用于MaxSim的融合Triton内核，MaxSim是ColBERT和ColPali背后的评分步骤，已集成到PyLate和colpali-engine中，提供了内存效率和性能提升。

0 人收藏 0 人点赞

#triton-kernels

TLDR AI ↗ · 2026-06-03 缓存

Wall Attention 是一种新的注意力变体，具有每个通道、每个时间步的乘法衰减，提供内容相关的遗忘率，以及在Triton中实现的高效训练/解码内核。

0 人收藏 0 人点赞

#triton-kernels

X AI KOLs Following ↗ · 2026-04-20 缓存

技术解析：对比 PyTorch 默认的 autograd 与 UnslothAI 使用 OpenAI Triton 语言编写的自定义反向传播内核，以实现更高效的 LLM 微调。

0 人收藏 0 人点赞