实验性“Preserve Thinking” Jinja 模板，用于 llama.cpp 中的 Gemma4 31B

Reddit r/LocalLLaMA 2026/05/23 05:21 工具

jinja-template llama-cpp gemma4 multi-turn-tool-calls experimental community-contribution

摘要

这是一个实验性 Jinja 模板，用于 llama.cpp 中的 Gemma4 31B，通过修复常见的 thinking tag 问题来提升多轮工具调用的稳定性。欢迎社区反馈，但 Google 不推荐使用。

[https://huggingface.co/stevelikesrhino/gemma-4-31B-it-nvfp4-GGUF/blob/main/gemma4-improved.jinja](https://huggingface.co/stevelikesrhino/gemma-4-31B-it-nvfp4-GGUF/blob/main/gemma4-improved.jinja) 欢迎各位尝试并提供反馈。在我自己的 Pi-coding-agent 测试中，我不再遇到“忘记关闭 thinking tag”、“忘记开启 thinking”、“过早关闭 thinking”的问题。在多轮提示内的多轮工具调用中更加稳定。免责声明：Google 不推荐使用。

查看原文

实验性“Preserve Thinking” Jinja 模板，用于 llama.cpp 中的 Gemma4 31B

相似文章

Gemma 4 Chat Template 现在支持保留思考

PSA：Gemma 4 12B 在编程和工具调用方面并非完全不可用，你需要特殊的聊天模板

[WIP] Gemma 4 MTP

Gemma 4 2B 通过 Spring AI / LM Studio 正确处理结构化 JSON 输出、工具调用和推理轨迹——包括在代码审查中识别出一个真实的 Java 错误

google/gemma-4-26B-A4B-it-assistant

提交意见反馈