标签
作者构建了TinyHarness,这是一个低内存占用的AI工具集,兼容Ollama、Llama.cpp和vllm,旨在与pi和opencode等工具竞争。
一位开发者创建了一个免费、开源的AI助手,浮动在macOS桌面上,通过Ollama使用Gemma和Qwen等模型完全本地运行,无需API密钥或订阅,确保数据隐私和离线能力。
Ollama 被披露存在关键安全漏洞,包括被称为“Bleeding Llama”的内存泄漏利用漏洞以及 Windows 远程代码执行(RCE)漏洞,亟需用户紧急升级。
Oh My PPT 是一款纯本地运行的 AI 幻灯片生成工具,支持通过文档或主题自动创建演示文稿,并兼容 Ollama 离线运行。
The article argues that vLLM has overtaken Ollama in usability due to the rapid pace of new model releases, finding it more practical than alternatives like DeepSpeed or TensorRT.
指南介绍了如何使用 LM Studio、Ollama 等工具,在拥有 24GB 内存的 M4 MacBook 上运行 Qwen 3.5-9B 等本地 AI 模型,并提供了优化性能的具体配置建议。
推荐开源项目 awesome-llm-apps,收录100+ AI Agent与RAG应用,最新合并了基于本地Ollama的浏览器自动化MCP代理。
本文是一份本地大模型部署指南,涵盖硬件选择、内存计算、Runtime 工具对比及模型量化选择,帮助用户从入门到优化本地推理体验。
作者分享了一个使用 Python、Gemini 和 Ollama 构建的可本地运行的 AI 伴侣,其特色是基于全局工作空间理论和集成信息理论代理的定制认知架构,用于人格建模。
开发者用 Qwen3.6 35B 为核心,配合 little-coder 脚手架搭建路由本地环境,在 10 个真实 Go 任务中拿到 9/10 通过率,证明本地模型搭配合适工具链也能逼近前沿代码模型。
开发者 Ivan Fioravanti 展示如何在 Apple Silicon 上本地运行 Andrej Karpathy 的 autoresearch 项目,使用 6bit 量化 Gemma-4-26B 模型,暗示已成功训练 Gemma 4 E2B IT 变体。
一篇社区讨论帖,征求关于购买哪种 Mac Mini 配置(M4、M2 Pro 或 M1 Max)以配合 Ollama 和编程助手运行本地大语言模型的建议;由于传闻 M5 即将发布且当前存在供应短缺,使得选购决策变得复杂。
开发者分享使用 MCP、Strapi、TanStack 和 Ollama 配合 Gemma 4 构建本地优先知识库的经验,并提到可轻松切换到 Claude 等前沿模型。
无论是 opencode、VS Code Copilot 扩展还是其他任何“开源”AI 工具,我很少见到 llama.cpp 被当作一级支持的提供商。它们全部支持 ollama,偶尔还有 LMStudio。从工程角度来看,把 llama.cpp 列在和 ollama 同样的位置几乎零成本。或者更棒的做法是,提供一个不依赖特定标签的 OpenAI API 兼容端点,让我自行填写端口号和端点地址。这确实令人恼火,因为 ollama 就是个窃取 llama.cpp 成果的低劣叛徒,尽管明眼人都看得出它根本不是 OSS 生态的好成员,却依然占据着极高的用户关注度。不过如今的 llama.cpp 对普通开发者(当前主要用户群)已经非常实用,对普通大众也完全够用。我真的强烈希望这篇帖子能被开发这些工具的工程师们看到。