hardware-efficiency

标签

Cards List
#hardware-efficiency

@Snixtp: 针对单张 RTX 3090 的更多能效测试 长文速读:- 我在单张 RTX 3090 上测试了 8 个本地大语言模型(LLM),功率限制从 100W 到 45…

X AI KOLs Following · 昨天

本文展示了 8 个本地大语言模型在 RTX 3090 上的基准测试结果,显示功率能效在约 225W 时达到峰值,而在满功率下收益递减。

0 人收藏 0 人点赞
#hardware-efficiency

@no_stp_on_snek: 长上下文实验的小更新:我在单个 MI300X droplet 上使用开源栈成功将 MRCR v2 运行到 1M 上下文长度。

X AI KOLs Following · 2天前

作者报告成功在单个 MI300X 上使用 Qwen2.5-32B 和 FAISS 运行 MRCR v2,实现 1M 上下文长度,并以低成本获得有竞争力的分数。

0 人收藏 0 人点赞
#hardware-efficiency

KernelBench-X:评估LLM生成GPU内核的综合基准测试

Hugging Face Daily Papers · 4天前 缓存

KernelBench-X是一个用于评估LLM生成GPU内核的新基准,揭示了任务结构对正确性的影响大于方法设计,且正确性并不保证硬件效率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈