如何为7人规模的企业搭建本地大语言模型服务器？

Reddit r/LocalLLaMA 2026/05/15 16:14 工具

local-llm llm-server business scaling hardware self-hosting rag

摘要

用户询问如何为7人企业搭建本地LLM服务器，考虑Gemma 4和Qwen 3.6等模型、5090或MacBook Pro等硬件选项，以及并发用户扩展问题。

好吧，我潜水这个板块有一段时间了，偶尔会在我的笔记本（不是最好的）上跑一些小型的2-8B模型玩玩。但假设我在公司的职责是搭建一个本地LLM，因为我们显然不想让机密数据泄露给其他公司等等。主要用途是查询、RAG、通用使用，没什么特别复杂的，除了可能有一两个人会用它做编程。我在考虑Gemma 4 26/31或Qwen 3.6 27/35。这些模型在并发用户下表现如何？我知道我可以在5090加一些扩展或者用48GB统一内存的MacBook Pro上跑这些模型，但不确定多用户情况下扩展性如何。

查看原文

如何为7人规模的企业搭建本地大语言模型服务器？

相似文章

@songjunkr：分享我的个人本地LLM配置：设备：MacStudio M2 Ultra 64GB，加载模型：SuperQwen3.6 35b mlx 4bit…

为本地运行大语言模型挑选 Mac Mini——你实际会买哪款？

我看到很多人问“本地 LLM 真的能做些有用的事吗？”

高端私有本地 LLM 方案真的值得吗？

在单个16GB GPU + 64GB RAM上的本地LLM自动补全与代理式编码

提交意见反馈