sglang-jax

标签

Cards List
#sglang-jax

@ying11231:在TPU上令人印象深刻的性能。

X AI KOLs Timeline · 昨天 缓存

LMSYS Org 的一篇博客文章详细介绍了使用 SGLang-JAX 在 TPU v7x 上优化 Ling-2.6-1T(一个 1 万亿参数的混合 MoE 模型),通过单个 Pallas 内核将 MoE 数据移动隐藏在计算之后,从而实现高效的推理。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈