@Prince_Canuma: 关于进水情况的快速更新:M3 Ultra和Titan(RTX6000 Pro)似乎已恢复,几乎没有可见损坏……

X AI KOLs Timeline 新闻

摘要

关于硬件进水损坏修复的个人更新,展示MLX-VLM在本地RTX6000 Pro上运行Qwen3-4B-Instruct,以约300 tok/s的速度通过Zed IDE实现自动补全和git提交信息生成。

关于进水情况的快速更新 \n\nM3 Ultra和Titan(RTX6000 Pro)似乎已恢复,几乎没有可见损坏。\n\n主要问题是我的MacBook正在维修中,以及Titan CPU在空闲时温度高于平均水平(从进水前的35°C上升到58°C)。\n\n总之,这是一个视频,展示MLX-VLM在Titan上运行Qwen3-4B-Instruct(约300 tok/s),通过Zed IDE完全本地实现自动补全和git提交信息生成。
查看原文
查看缓存全文

缓存时间: 2026/05/19 02:37

快速更新一下水浸情况

M3 Ultra 和 Titan (RTX6000 Pro) 似乎已经恢复,几乎没有明显的损坏。

主要问题出在我的 MacBook 上,它正在维修中,以及 Titan 的 CPU 在待机时温度高于平均值(从水浸前的 35°C 上升到 58°C)。

总之,这里有一个视频展示在 Titan 上通过 MLX-VLM 运行 Qwen3-4B-Instruct(约 300 tok/s),用于在 Zed IDE 中完全本地完成自动补全和 git commit 消息生成。

相似文章

@Snixtp: https://x.com/Snixtp/status/2055734339346768225

X AI KOLs Timeline

某用户使用llama.cpp在单张RTX 3090上对Qwen3.6 27B的MTP变体与普通版本进行了基准测试,发现MTP在长上下文(32k-64k)下生成速度最高可提升2.37倍,但预填充较慢且暂不支持并发。

找到了冷却 DGX 的方法

Reddit r/LocalLLaMA

有用户报告称,在运行 Qwen3.5-122b 模型且 GPU 高负载的情况下,成功使用自来水为 DGX 服务器降温,并维持了安全的温度水平。