pull-request

标签

Cards List
#pull-request

ui: 聊天中的Mermaid图表与交互预览 (由allozaur提交 · PR #24032 · ggml-org/llama.cpp)

Reddit r/LocalLLaMA · 20小时前 缓存

新增在聊天中渲染Mermaid图表的功能,并在llama.cpp网页界面中提供交互预览。

0 人收藏 0 人点赞
#pull-request

StepFun 3.5 MTP 由 pwilkin 提交 · 拉取请求 #23274 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 昨天 缓存

为 llama.cpp 添加 StepFun 3.5 MTP 模型支持的拉取请求。

0 人收藏 0 人点赞
#pull-request

llama: 限制 `llama_context` 的最大输出数 by am17an · Pull Request #23861 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 2天前 缓存

llama.cpp 是一个开源的 LLM 推理引擎,使用 C/C++ 编写,依赖极少,支持多种硬件和量化方法。此拉取请求限制了 llama_context 的最大输出数。

0 人收藏 0 人点赞
#pull-request

@FinanceYF5: 太酷了! Peter Steinberger 把 Codex 调教成了全自动 QA 机器人。 现在每次代码提交后,它会自己生成测试用例、模拟用户操作跑测试,发现 bug 还能直接写修复代码提 PR。 开发效率直接拉满了!

X AI KOLs Following · 3天前 缓存

Peter Steinberger利用Codex构建了全自动QA机器人,每次代码提交后自动生成测试、运行测试,并能在发现bug时自动修复并提交PR,大幅提升开发效率。

0 人收藏 0 人点赞
#pull-request

llama: 使用f16掩膜进行FA以节省VRAM(作者 am17an)· 拉取请求 #23764 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 6天前 缓存

此拉取请求针对llama.cpp推理引擎,实现了使用f16掩膜的Flash Attention以减少VRAM使用。

0 人收藏 0 人点赞
#pull-request

由zhangtao2-1添加MiniCPM5分词器支持 · Pull Request #23384 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 2026-05-27 缓存

此Pull Request为llama.cpp添加了MiniCPM5分词器支持,扩展了该工具对MiniCPM模型系列的兼容性。

0 人收藏 0 人点赞
#pull-request

Strix Halo 用户:一个被拒绝的 PR 可使 MOE 的 PP 速度提升高达 30%。

Reddit r/LocalLLaMA · 2026-05-26

一个针对 llama.cpp 的被拒绝的 PR 可在 AMD Strix Halo 硬件上为 MOE 模型提供高达 30% 的提示处理速度提升,但增益会随上下文长度增加而递减。

0 人收藏 0 人点赞
#pull-request

CUDA: 添加快速 Walsh-Hadamard 变换(作者 am17an)· Pull Request #23615 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 2026-05-25 缓存

此拉取请求为 llama.cpp(一个流行的开源 LLM 推理引擎)添加了 CUDA 上的快速 Walsh-Hadamard 变换实现。该优化提升了在 NVIDIA GPU 上某些计算操作的性能。

0 人收藏 0 人点赞
#pull-request

给所有使用 OpenCode / Pi 的用户——这是你的 prompt processing 修复方案!

Reddit r/LocalLLaMA · 2026-05-21

一个针对 llama.cpp 的拉取请求修复了使用 OpenCode 或 Pi 时出现的持续 prompt processing 问题。

0 人收藏 0 人点赞
#pull-request

llama: 在 MTP 中避免在提示解码期间复制 logits · 由 am17an 提交 · PR #23198 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 2026-05-17 缓存

此拉取请求通过避免在多令牌预测的提示解码过程中不必要地复制 logits,优化了 llama.cpp,从而提升推理性能。

0 人收藏 0 人点赞
#pull-request

MTP 支持已合并至 llama.cpp

Reddit r/LocalLLaMA · 2026-05-16

为 llama.cpp 添加 MTP(多令牌预测)支持的拉取请求已合并至 master 分支。

0 人收藏 0 人点赞
#pull-request

MTP PR 已合并!!!

Reddit r/LocalLLaMA · 2026-05-16

与 LLaMA 模型相关的 MTP(可能指模型训练管道或类似内容)拉取请求已合并,标志着一个里程碑。

0 人收藏 0 人点赞
#pull-request

llama + spec: 由 am17an 提交的 MTP 支持 · Pull Request #22673 · ggml-org/llama.cpp

Reddit r/LocalLLaMA · 2026-05-16 缓存

拉取请求为 llama.cpp 添加多令牌预测(MTP)支持,启用推测解码以加速推理。

0 人收藏 0 人点赞
#pull-request

@LangChain: 这个AI监控自己的代码库,标记缺失的监测器,并自动创建PR修复发现的漏洞。@Shevchenkoaalex 在 @TryR…

X AI KOLs Following · 2026-05-11 缓存

一个基于LangChain构建的AI代理持续监控自己的代码库,标记缺失的监测器,并自动创建PR修复发现的漏洞,如Ramp公司的Alex Shevchenko所述。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈