moe-models

标签

Cards List
#moe-models

@TensordyneInc: https://x.com/TensordyneInc/status/2066567307984531834

X AI KOLs Following · 2天前 缓存

Tensordyne推出了Napier,一种在硅片上使用对数数学的推理系统,声称对MoE和推理模型有巨大的效率提升,并采用风冷机架。

0 人收藏 0 人点赞
#moe-models

为什么缺乏新的100B-120B模型?

Reddit r/LocalLLaMA · 3天前

分析AI模型尺寸趋势,指出100-120B参数范围存在空白,近期发布主要聚焦于较小(25-35B)或较大(200B+)的模型。

0 人收藏 0 人点赞
#moe-models

Windows 11与Linux下llama.cpp的速度差异:中型和大型MoE模型其实没有差别

Reddit r/LocalLLaMA · 2026-05-31

用户评测表明,使用llama.cpp运行大型MoE模型时,Windows 11与Linux之间并无显著速度差异,打破了一个常见迷思。在多GPU配置下,使用Qwen 3.5 122B、397B和MiniMax 2.7等模型进行测试,提示处理和令牌生成速度几乎相同。

0 人收藏 0 人点赞
#moe-models

@0xSero:本地部署(一)—— Apple Silicon Mac 拥有大内存池可跑大模型,但 token 生成速度会……

X AI KOLs Following · 2026-04-22 缓存

Apple Silicon Mac 提供大内存池运行大模型,但 token 生成较慢,最适合活跃参数量低的大型 MoE 模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈