标签
Gemma 4 12b 模型现已可通过 Ollama 获取,提供多种量化版本用于本地 AI 推理。
Built a Tauri v2 desktop chat shell for local LLMs that can connect to Ollama, llama.cpp, or any OpenAI-compatible endpoint. The project is MIT licensed and produces a ~12 MB binary.
一条推文串,整理了10个免费学习AI工程的资源,从哈佛的CS50 AI课程到Karpathy的神经网络教程、fast.ai、Hugging Face课程,以及像Ollama这样的本地工具,提供了一条从入门到掌握就业技能的清晰路径。
一名开发者用Qwen3.6-27B替代Claude运行多智能体编排器两周,发现它作为推理层可行,但执行层不可靠,工具调用错误率达12%且存在长上下文漂移。
一个轻量级Python框架,使用Ollama和Phi-3进行本地LLM角色扮演,具有上下文保留和原生流式传输功能,防止角色漂移。
一位开发者使用 Ollama 构建了一个本地自主编码代理,结合了微调个性模型(Eve)进行对话和 MiniMax M3 处理重活,实现了 40 轮代理循环,包含 16 个工具,9 个测试全部一次通过。
Eve Agent V2 Unleashed 是一个开源自主编程代理,通过 Ollama 在本地运行,具有 40 轮工具循环、112 个子代理和可选的云端扩展功能。它可以在无需人工干预的情况下计划、编写、测试和验证代码,快速启动只需不到 5 分钟。
演示了如何在llama.cpp中使用-ncmoe标志,显著提高了Qwen3.6在消费级GPU上的推理速度,在RTX 4070 12GB上达到70 tok/s,而Ollama仅为21 tok/s。
Atomic Memory是一个工具,它通过每轮更新、语义召回、冲突检测和低成本GPU使用来升级Ollama的记忆系统,解决了Hermes内置记忆的局限性。它使用一个小型专用模型,为个人或团队提供高效且无限制的记忆管理。
一位律师使用Raspberry Pi 5、Ollama和Phi-3-mini构建了一台成本50美元的便携式离线AI设备,以999美元的价格出售给需要安全文档分析的律师事务所。本指南将逐步说明如何复现该设置。
Anubis OSS 是一款用于本地 LLM 基准测试的 Apple Silicon Mac 应用,现在支持通过 UI 中的“浏览模型”按钮直接从 ollama.com 库下载模型。开发者正在寻找测试人员,以确认安装和功能正常运行。
LiquidAI 发布了其 LFM2.5-8B-A1B 模型的 GGUF 量化版本,并提供了在多个推理引擎上的使用说明。
一位开发者给TradingAgents多智能体LLM股票分析框架构建了本地Web GUI,支持多种LLM提供商,并添加了实时管线可视化、报告阅读器和多会话聊天等功能。
free-claude-code 是一个开源工具,通过将 Claude Code 的流量代理到 DeepSeek、Kimi、Ollama 等10多个免费或本地后端,实现永久免费使用 Claude Code,支持 CLI、VSCode、JetBrains 和 Discord。
一位用户分享了一个技巧:在代理工作流程中使用 Ollama 本地的 llama3.1:8b 模型压缩对话上下文,相较于将上下文发送给提供商,能降低延迟并减少 token 使用量。
作者介绍了 hollow-agentOS,一个 Docker 化的开源多智能体系统,可在本地运行,使智能体能够自主编写 Python 工具,使用“痛苦分数”来防止无限逻辑循环,并采用共识驱动的治理机制进行代码修改。
本地AI编程代理使用Hermes编排器与看板工作流,结合SmallCode(Mac mini上的Ollama)处理小型任务,以及Claude/Codex处理繁重工作,所有内容都在一个看板中跟踪。
swm 是一个开源工具,通过一键安装ComfyUI、Ollama等框架来简化云GPU的使用,并能在会话之间自动保存整个工作区,从而实现跨提供商的无缝迁移。
flux-genotype 是一个开源AI内核,能在CPU上协调本地LLM,通过MetaDesigner模块实现自身架构的自我修改。
Ollama现在原生支持Codex,让你可以完全免费且本地运行OpenAI Codex应用,无需订阅、无需API密钥、数据不离开你的笔记本电脑。