@badlogicgames: GPT 在 mlx-c 0.31.2 中发现了一个 bug。现在我在想是否应该提交一个随意的 PR(slop PR),因为我本人还没有深入调查这个问题…
摘要
GPT 模型在 mlx-c 0.31.2 中发现了一个 bug,作者正在考虑提交一个未经亲自验证的拉取请求(PR)。
GPT 在 mlx-c 0.31.2 中发现了一个 bug。现在我在想是否应该提交一个随意的 PR(slop PR),因为我本人还没有调查过这个问题(不过分析听起来挺靠谱的:p)https://t.co/zjg8AudnbU
查看缓存全文
缓存时间: 2026/05/31 09:04
gpt 在 mlx-c 0.31.2 中发现了一个 bug。现在我在犹豫要不要发一个混子 PR,因为我还没亲自去查这个问题(不过分析听起来有道理啦 :p)https://t.co/zjg8AudnbU
相似文章
vllm-project/vllm v0.19.2rc0:[错误修复] 修复 GLM-ASR 中 k_proj 的偏置问题(#40160)
vLLM v0.19.2rc0 候选版本包含了对 GLM-ASR 模型中 k_proj 偏置处理的错误修复,解决了 LLM 服务框架中的一个特定兼容性问题。
Bun 的问题可能在于公开开发
一篇分析 Bun 实验性使用 LLM 将其 Zig 代码库转译到 Rust 所引发的争议的文章,强调公众的强烈反应源于透明的开发实践而非实验本身。
Command A+ (218B MoE) 在 Apple Silicon 上运行 — MLX 移植,PR 已开放
mlx-lm 的一个 PR 为 Cohere 的 Command A+ (218B MoE) 模型在 Apple Silicon 上增加了支持,并附有架构实现细节。
@Fenng: 使用 Codex 调一个看似简单的 Bug 但反复调不对,这时候你该看看用的是什么模型,如果是 GPT-5.4,就新起个会话切到 GPT-5.3-Codex,可能很快就解决了。 不用谢。
Fenng suggests switching from GPT-5.4 to GPT-5.3-Codex when debugging simple bugs that persist, implying model version can affect code-fixing performance.
SYCL: 从 CUDA 后端移植多列 MMVQ(在 Intel Arc 上获得约 45% 的推测解码加速)by masonmilby · Pull Request #21845 · ggml-org/llama.cpp
一个针对 llama.cpp 的拉取请求,将多列 MMVQ 从 CUDA 移植到 SYCL,在 Intel Arc GPU 上实现了约 45% 的推测解码加速。