pull-request

#pull-request

ui: 聊天中的Mermaid图表与交互预览 (由allozaur提交 · PR #24032 · ggml-org/llama.cpp)

Reddit r/LocalLLaMA ↗ · 20小时前缓存

新增在聊天中渲染Mermaid图表的功能，并在llama.cpp网页界面中提供交互预览。

0 人收藏 0 人点赞

#pull-request

StepFun 3.5 MTP 由 pwilkin 提交 · 拉取请求 #23274 · ggml-org/llama.cpp

Reddit r/LocalLLaMA ↗ · 昨天缓存

为 llama.cpp 添加 StepFun 3.5 MTP 模型支持的拉取请求。

0 人收藏 0 人点赞

#pull-request

llama: 限制 `llama_context` 的最大输出数 by am17an · Pull Request #23861 · ggml-org/llama.cpp

Reddit r/LocalLLaMA ↗ · 2天前缓存

llama.cpp 是一个开源的 LLM 推理引擎，使用 C/C++ 编写，依赖极少，支持多种硬件和量化方法。此拉取请求限制了 llama_context 的最大输出数。

0 人收藏 0 人点赞

#pull-request

@FinanceYF5: 太酷了！ Peter Steinberger 把 Codex 调教成了全自动 QA 机器人。现在每次代码提交后，它会自己生成测试用例、模拟用户操作跑测试，发现 bug 还能直接写修复代码提 PR。开发效率直接拉满了！

X AI KOLs Following ↗ · 3天前缓存

Peter Steinberger利用Codex构建了全自动QA机器人，每次代码提交后自动生成测试、运行测试，并能在发现bug时自动修复并提交PR，大幅提升开发效率。

0 人收藏 0 人点赞

#pull-request

llama: 使用f16掩膜进行FA以节省VRAM（作者 am17an）· 拉取请求 #23764 · ggml-org/llama.cpp

Reddit r/LocalLLaMA ↗ · 6天前缓存

此拉取请求针对llama.cpp推理引擎，实现了使用f16掩膜的Flash Attention以减少VRAM使用。

0 人收藏 0 人点赞

#pull-request

由zhangtao2-1添加MiniCPM5分词器支持 · Pull Request #23384 · ggml-org/llama.cpp

Reddit r/LocalLLaMA ↗ · 2026-05-27 缓存

此Pull Request为llama.cpp添加了MiniCPM5分词器支持，扩展了该工具对MiniCPM模型系列的兼容性。

0 人收藏 0 人点赞

#pull-request

Strix Halo 用户：一个被拒绝的 PR 可使 MOE 的 PP 速度提升高达 30%。

Reddit r/LocalLLaMA ↗ · 2026-05-26

一个针对 llama.cpp 的被拒绝的 PR 可在 AMD Strix Halo 硬件上为 MOE 模型提供高达 30% 的提示处理速度提升，但增益会随上下文长度增加而递减。

0 人收藏 0 人点赞

#pull-request

CUDA: 添加快速 Walsh-Hadamard 变换（作者 am17an）· Pull Request #23615 · ggml-org/llama.cpp

Reddit r/LocalLLaMA ↗ · 2026-05-25 缓存

此拉取请求为 llama.cpp（一个流行的开源 LLM 推理引擎）添加了 CUDA 上的快速 Walsh-Hadamard 变换实现。该优化提升了在 NVIDIA GPU 上某些计算操作的性能。

0 人收藏 0 人点赞

#pull-request

给所有使用 OpenCode / Pi 的用户——这是你的 prompt processing 修复方案！

Reddit r/LocalLLaMA ↗ · 2026-05-21

一个针对 llama.cpp 的拉取请求修复了使用 OpenCode 或 Pi 时出现的持续 prompt processing 问题。

0 人收藏 0 人点赞

#pull-request

llama: 在 MTP 中避免在提示解码期间复制 logits · 由 am17an 提交 · PR #23198 · ggml-org/llama.cpp

Reddit r/LocalLLaMA ↗ · 2026-05-17 缓存

此拉取请求通过避免在多令牌预测的提示解码过程中不必要地复制 logits，优化了 llama.cpp，从而提升推理性能。

0 人收藏 0 人点赞

#pull-request

MTP 支持已合并至 llama.cpp

Reddit r/LocalLLaMA ↗ · 2026-05-16

为 llama.cpp 添加 MTP（多令牌预测）支持的拉取请求已合并至 master 分支。

0 人收藏 0 人点赞

#pull-request

MTP PR 已合并！！！

Reddit r/LocalLLaMA ↗ · 2026-05-16

与 LLaMA 模型相关的 MTP（可能指模型训练管道或类似内容）拉取请求已合并，标志着一个里程碑。

0 人收藏 0 人点赞

#pull-request

llama + spec: 由 am17an 提交的 MTP 支持 · Pull Request #22673 · ggml-org/llama.cpp

Reddit r/LocalLLaMA ↗ · 2026-05-16 缓存

拉取请求为 llama.cpp 添加多令牌预测（MTP）支持，启用推测解码以加速推理。

0 人收藏 0 人点赞

#pull-request

@LangChain: 这个AI监控自己的代码库，标记缺失的监测器，并自动创建PR修复发现的漏洞。@Shevchenkoaalex 在 @TryR…

X AI KOLs Following ↗ · 2026-05-11 缓存

一个基于LangChain构建的AI代理持续监控自己的代码库，标记缺失的监测器，并自动创建PR修复发现的漏洞，如Ramp公司的Alex Shevchenko所述。

0 人收藏 0 人点赞

pull-request

提交意见反馈