power-efficiency

标签

Cards List
#power-efficiency

小型LLM基准测试:Jetson Orin Nano Super 8GB - 四种功率模式 × 八种模型

Reddit r/LocalLLaMA · 2天前

一项对8个小型LLM(参数规模从1.35亿到约10亿)在售价250美元的Jetson Orin Nano Super上进行的深入基准测试,涵盖四种功率模式,发现25W是帕累托最优模式,其中SmolLM2-135M达到165.1 tok/s,效率最高。

0 人收藏 0 人点赞
#power-efficiency

RTX 5090(600/475/400W)与 RTX 6000 PRO MaxQ(325W)以及 RTX 6000 PRO WS/SE(600W)完整算力(Anima)小对比

Reddit r/LocalLLaMA · 2026-05-26

一位用户对 RTX 5090 和 RTX 6000 PRO 系列 GPU 进行 AI 扩散任务基准测试,比较不同功耗限制下的性能,展示了速度与功耗之间的权衡。

0 人收藏 0 人点赞
#power-efficiency

探寻4x 3090的甜点

Reddit r/LocalLLaMA · 2026-05-15

一位用户分享了在运行Qwen3.6-27B与vLLM的4x RTX 3090平台上进行的功耗限制测试,发现220W是在最小化吞吐量损失下实现峰值效率的甜点。

0 人收藏 0 人点赞
#power-efficiency

[基准测试] 5090RTX:提示解析、Token 生成与功耗等级

Reddit r/LocalLLaMA · 2026-05-14

一位用户使用 llama.cpp 对 Nvidia 5090 RTX GPU 进行 LLM 推理基准测试,测量了不同功耗水平下的提示处理和 token 生成情况,发现提示处理对功耗限制更为敏感,而 token 生成相对不敏感,并指出了与 4090 RTX 的差异。

0 人收藏 0 人点赞
#power-efficiency

双 DGX Spark(华硕 GX10)MiniMax M2.7 实测

Reddit r/LocalLLaMA · 2026-04-21

用户实测两台华硕 GX10(DGX Spark)运行 MiniMax-M2.7-AWQ-4bit,每块仅约 100 W,生成速度 30–40 tokens/s,彻底替代嘈杂的多 GPU 机架。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈