Gemma4_31b_fp8 在我自己的评测框架中与 Sonnet_4.6_medium 持平。

Reddit r/LocalLLaMA 2026/06/08 03:06 模型

benchmark fp8 gemma sonnet graph-traversal agentic tool-calling

摘要

一位用户报告称，Gemma4_31b 在 FP8 精度下，于自定义评测框架中与 Sonnet_4.6_medium 相当或持平，涉及任务包括 Cypher 查询生成、实体抽取、智能体工具调用、代码编写以及多向量检索合成。

https://preview.redd.it/9t0qvx6k5z5h1.png?width=1400&format=png&auto=webp&s=88dd83cdd6aa484dcf102bf078f7a80bebb4f7a2 * 用于图遍历的 Cypher 查询（neo4j） * 从文本块中提取实体（网页查询、图查询、向量） * 智能体工具调用（技能选择/在 Pi 中成功运行） * 代码编写（Python） * 多向量检索的合成/摘要（Gemma/Qwen 在 FP8 下）这让我很开心

查看原文

Gemma4_31b_fp8 在我自己的评测框架中与 Sonnet_4.6_medium 持平。

相似文章

Gemma 4 31B 的能力让我惊讶

Gemma 4 12B 是我的新主力

yuxinlu1/gemma-4-12B-agentic-fable5-composer2.5-v2-3.5x-tau2-GGUF

@leopardracer: GEMMA 4 26B 在 RTX 4060 上运行，拥有 248K Token 上下文窗口，每秒 20 个 Token，上下文窗口大得可以……

yuxinlu1/gemma-4-12B-coder-fable5-composer2.5-v1-GGUF

提交意见反馈