8gb-vram

标签

Cards List
#8gb-vram

@VincentLogic: 一台 8GB 显存的入门笔记本 现在可以跑一个完全自主的 AI Agent 方法:Gemma 4 26B + Hermes Desktop 本地跑 26B 模型,8GB 显存 + 16GB 内存就够 接上 Hermes 之后它能做什么: …

X AI KOLs Timeline · 昨天 缓存

介绍使用 Gemma 4 26B 模型与 Hermes Desktop 工具在 8GB 显存入门笔记本上运行完全自主的 AI Agent,实现本地文件操作、代码修改、网页浏览等功能,显著降低了本地 Agent 的门槛。

0 人收藏 0 人点赞
#8gb-vram

从零开始在8GB显存上训练LLM。我开心

Reddit r/LocalLLaMA · 2026-05-29

构建了一个仓库,用于在8GB显存上从零训练一个微型语言模型(25M参数),支持MTP,但指出mHC和BitNet的局限性。

0 人收藏 0 人点赞
#8gb-vram

在老款GTX 1080(8GB显存,128k上下文)上,约30B的MoE模型达到24+ tok/s的推理速度

Reddit r/LocalLLaMA · 2026-05-13

一位开发者展示了如何使用llama.cpp,通过MoE卸载和TurboQuant KV缓存量化技术,在老款GTX 1080(8GB显存)上以128k上下文运行Qwen 3.6 35B-A3B和Gemma 4 26B-A4B等MoE模型,达到24+ tok/s的推理速度,并揭示了针对Gemma MTP投机解码的优化技巧。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈