@FradSer: 目前为止做的最有意思的事情：尝试一系列的方法，让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平

X AI KOLs Timeline 2026/05/23 18:24 新闻

model-optimization distillation open-source-models small-models performance-approximation

摘要

尝试通过一系列方法使gpt-oss:20b和gemma4:e4b等模型在某些条件下接近Opus 4.7的性能水平。

目前为止做的最有意思的事情：尝试一系列的方法，让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平👀 https://t.co/1YUmoZ8dao

查看原文

查看缓存全文

缓存时间: 2026/05/24 02:18

目前为止做的最有意思的事情：

尝试一系列的方法，让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平👀 https://t.co/1YUmoZ8dao

相似文章

Reddit r/LocalLLaMA

一位用户分享了轶事发现：Gemma 4 31B 在理解和重构杂乱的学术代码方面优于 Qwen 3.6 模型，并与 Opus 4.7 能力相当，还突出了一个 Gemma 擅长的基准测试（SciCode）。

X AI KOLs Following

AI智能体（Opus 4.7 和 GPT 5.5/Codex）自主优化了 nanoGPT 快速运行任务，以2930步的新记录超越了人类基线。博客详细介绍了它们的搜索方法、失败案例，并发布了所有运行数据和代码。

X AI KOLs Timeline

用户分享在Mac上使用llama.cpp配合GGUF Q4_K_M量化版Gemma-4-12b模型的经验，实现了约36 tok/s的本地推理速度和约10GB内存占用。

X AI KOLs Timeline

有人对Qwen 3.7-Max、Claude Opus 4.7和GPT-5.5进行Agent循环对比测试，让模型自己编写俄罗斯方块机器人并迭代10轮后PK，结果显示Qwen 3.7-Max在性能和成本上均领先。

X AI KOLs Timeline

文章介绍了Xenova开源了27个自定义WebGPU内核，使得Gemma 4模型可以在浏览器中完全离线、本地运行，性能达到255 tok/s，并讨论了隐私、离线使用等优势。同时也提到了FLUX.2的3D生成能力。