flash-streaming

标签

Cards List
#flash-streaming

@tom_doerr: 在 16GB 内存 Mac 上运行 35B 模型 https://github.com/walter-grace/mac-code…

X AI KOLs Timeline · 2026-05-11 缓存

该工具支持通过从 SSD 流式加载模型权重,在 16GB Mac 上运行 Qwen3.5-35B 等大型语言模型,经优化配置后最高可达 30 tok/s。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈