lm-studio

#lm-studio

LM Studio Bionic：面向开放模型的AI智能体

Hacker News Top ↗ · 2026-07-16 缓存

LM Studio推出Bionic，这是一个面向开放模型的AI智能体，支持编码、文档处理和离线语音转录，具备灵活的模型执行和零数据保留特性。

0 人收藏 0 人点赞

#lm-studio

如果你使用 Open Code 或其他代理程序，但没有并行使用代理，那么你会损失大量的 t/s。基准测试：RTX5090，通过 LM Studio 加载 Qwen3.6 35B，并行任务数设为 8

Reddit r/LocalLLaMA ↗ · 2026-07-12

基准测试表明，在 RTX 5090 上使用 LM Studio 并行运行 4-5 个代理可最大化吞吐量，而更多代理会因显存和计算分割导致收益递减。

0 人收藏 0 人点赞

#lm-studio

本地LLM推理优化：完整指南

Reddit r/LocalLLaMA ↗ · 2026-06-21 缓存

一份关于在消费级硬件上优化本地LLM推理的全面指南，涵盖llama.cpp、vLLM和LM Studio等工具，并提供关于内存层次结构、层放置和常见故障模式的实用建议。

0 人收藏 0 人点赞

#lm-studio

如何复制自己的写作风格

Reddit r/LocalLLaMA ↗ · 2026-06-15

用户询问，在本地LLM中提供其写作风格的样本，是放在对话中更有效，还是放在系统提示中更有效。

0 人收藏 0 人点赞

#lm-studio

我搭建了一个完全离线的语音循环，对接Ollama和LM Studio——100% CPU，无需GPU，数据绝不离开你的电脑（Silero VAD + Parakeet STT + Supertonic TTS 3）

Reddit r/LocalLLaMA ↗ · 2026-06-11

一个完全离线、仅使用CPU的语音循环，用于本地大模型，采用Silero VAD、Parakeet STT和Supertonic TTS，通过一条命令整合安装。兼容Ollama、LM Studio以及多种代理框架。

0 人收藏 0 人点赞

#lm-studio

@yagilb: 我今年有幸在WWDC上演讲，在舞台上现场演示@lmstudio即将推出的聚类功能…

X AI KOLs Following ↗ · 2026-06-10 缓存

Yagil Bubrovnik在WWDC上演讲，现场演示了LM Studio即将推出的聚类功能，并对MLX团队的工作表示感谢。

0 人收藏 0 人点赞

#lm-studio

@Saboo_Shubham_: 这是未来。在手机上运行本地模型，借用你的MacBook的计算能力。100%免费，适用于…

X AI KOLs Following ↗ · 2026-06-05 缓存

LM Studio让你可以在手机上运行本地开源AI模型，通过借用你的MacBook的计算能力，完全免费。

0 人收藏 0 人点赞

#lm-studio

@ai_xiaomu: macbook 16g 就能跑的满血多模态本地模型来了： 1. 下载LM studio； 2. 搜索gemma 4 12B 并下载安装； 3. 告诉codex帮你配置好本地api参数； 4. 接下体验token自由的感觉吧。

X AI KOLs Timeline ↗ · 2026-06-05 缓存

指导用户在MacBook 16GB上通过LM Studio和Codex运行Gemma 4 12B多模态本地模型，实现自由使用token。

0 人收藏 0 人点赞

#lm-studio

@lmstudio: Gemma 4 12B 来了！一款紧凑的中型 Gemma 模型，可直接在你的笔记本上运行——由 @google 以 Apache 2.0 许可证发布…

X AI KOLs Timeline ↗ · 2026-06-03 缓存

Google 发布了 Gemma 4 12B，这是一款紧凑的中型模型，可在笔记本上运行，采用 Apache 2.0 许可证，现在已在 LM Studio 中可用。

0 人收藏 0 人点赞

#lm-studio

qwen3.6-35b-a3b-mtp 在 GTX 1060 6GB 上运行

Reddit r/LocalLLaMA ↗ · 2026-05-24

一位用户成功在一台使用十年的旧工作站上（配备 GTX 1060 6GB），在 Windows 上使用 LMStudio 运行了 Qwen3.6-35B-a3b-MTP 模型，实现了可接受的聊天速度。

0 人收藏 0 人点赞

#lm-studio

@lmstudio: MTP 已在 LM Studio 0.4.14 中可用。请打开声音。

X AI KOLs Timeline ↗ · 2026-05-22 缓存

LM Studio 0.4.14 引入了 MTP（多轮提示）支持，增强了其本地 AI 模型能力。

0 人收藏 0 人点赞

#lm-studio

LM Studio 终于支持 MTP 推测解码

Reddit r/LocalLLaMA ↗ · 2026-05-20

LM Studio 在最新的 Beta 更新中增加了对 MTP 推测解码的支持，提升了本地大语言模型的推理速度。

0 人收藏 0 人点赞

#lm-studio

@lmstudio: 视觉模型的批处理功能在我们的最新MLX引擎更新中现已进入Beta测试阶段。此更新还带来了主要……

X AI KOLs Following ↗ · 2026-05-14 缓存

LM Studio 宣布其 MLX 引擎的 Beta 更新，引入了视觉模型的批处理功能和改进的缓存，以加速推理。

0 人收藏 0 人点赞

#lm-studio

在配备 24GB 内存的 M4 芯片上运行本地模型

Hacker News Top ↗ · 2026-05-10 缓存

指南介绍了如何使用 LM Studio、Ollama 等工具，在拥有 24GB 内存的 M4 MacBook 上运行 Qwen 3.5-9B 等本地 AI 模型，并提供了优化性能的具体配置建议。

0 人收藏 0 人点赞

#lm-studio

@CuiMao: 你别说，你真别说，本地跑LM studio接一个Claude code，效果相当满意，5090开64k上下文，能跑200+token。

X AI KOLs Timeline ↗ · 2026-04-20 缓存

用户分享在本地使用LM Studio配合Claude Code的运行体验，称使用RTX 5090可实现64k上下文并达到每秒200+ token的生成速度，效果令人满意。

0 人收藏 0 人点赞

lm-studio

LM Studio Bionic：面向开放模型的AI智能体

如果你使用 Open Code 或其他代理程序，但没有并行使用代理，那么你会损失大量的 t/s。基准测试：RTX5090，通过 LM Studio 加载 Qwen3.6 35B，并行任务数设为 8

本地LLM推理优化：完整指南

最新的LM Studio更新导致MTP性能下降

如何复制自己的写作风格

我搭建了一个完全离线的语音循环，对接Ollama和LM Studio——100% CPU，无需GPU，数据绝不离开你的电脑（Silero VAD + Parakeet STT + Supertonic TTS 3）

@yagilb: 我今年有幸在WWDC上演讲，在舞台上现场演示@lmstudio即将推出的聚类功能…

@Saboo_Shubham_: 这是未来。在手机上运行本地模型，借用你的MacBook的计算能力。100%免费，适用于…

@ai_xiaomu: macbook 16g 就能跑的满血多模态本地模型来了： 1. 下载LM studio； 2. 搜索gemma 4 12B 并下载安装； 3. 告诉codex帮你配置好本地api参数； 4. 接下体验token自由的感觉吧。

@lmstudio: Gemma 4 12B 来了！一款紧凑的中型 Gemma 模型，可直接在你的笔记本上运行——由 @google 以 Apache 2.0 许可证发布…

qwen3.6-35b-a3b-mtp 在 GTX 1060 6GB 上运行

@lmstudio: MTP 已在 LM Studio 0.4.14 中可用。请打开声音。

LM Studio 终于支持 MTP 推测解码

@lmstudio: 视觉模型的批处理功能在我们的最新MLX引擎更新中现已进入Beta测试阶段。此更新还带来了主要……

在配备 24GB 内存的 M4 芯片上运行本地模型

@CuiMao: 你别说，你真别说，本地跑LM studio接一个Claude code，效果相当满意，5090开64k上下文，能跑200+token。

提交意见反馈