low-vram

#low-vram

从零开始开发开源大语言模型：从预训练到RLHF（PPO/GRPO）

Reddit r/LocalLLaMA ↗ · 昨天

一位开发者分享了从零开始训练一个70亿参数开源大语言模型的进展，该模型基于DeepSeek架构并针对低显存进行了优化，目标是推动AI开发的民主化，并最终超越大型专有模型。

0 人收藏 0 人点赞

#low-vram

Reddit r/LocalLLaMA ↗ · 2026-04-21

作者分享了一套在 8GB RTX 4060 上跑 35B-MoE Qwen3.6 的可用 llama-server 配置，重点提示因内部推理无限制而耗尽 max_tokens 的陷阱，并给出用 per-request thinking_budget_tokens 的解决方案。

0 人收藏 0 人点赞