energy-efficient

#energy-efficient

@hardmaru: 人脑极其高效，因为它只激活特定思维所需的神经元。现代LLM…

X AI KOLs Timeline ↗ · 23小时前缓存

本文介绍了TwELL和Hybrid稀疏格式，配合自定义CUDA内核，有效利用LLM中的非结构化稀疏性，在H100 GPU上实现了训练和推理速度提升超过20%，同时降低了能耗和内存使用。

0 人收藏 0 人点赞

#energy-efficient

Reddit r/LocalLLaMA ↗ · 昨天缓存

Skymizer发布HTX301，一款能够本地运行700B参数大语言模型、拥有高内存和低功耗的PCIE推理卡。

0 人收藏 0 人点赞