@FradSer: 目前为止做的最有意思的事情: 尝试一系列的方法,让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平
摘要
尝试通过一系列方法使gpt-oss:20b和gemma4:e4b等模型在某些条件下接近Opus 4.7的性能水平。
目前为止做的最有意思的事情:
尝试一系列的方法,让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平👀 https://t.co/1YUmoZ8dao
查看缓存全文
缓存时间: 2026/05/24 02:18
目前为止做的最有意思的事情:
尝试一系列的方法,让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平👀 https://t.co/1YUmoZ8dao
相似文章
Gemma 4 31B 的能力让我惊讶
一位用户分享了轶事发现:Gemma 4 31B 在理解和重构杂乱的学术代码方面优于 Qwen 3.6 模型,并与 Opus 4.7 能力相当,还突出了一个 Gemma 擅长的基准测试(SciCode)。
@eliebakouch: 我们让 Opus 4.7 和 GPT 5.5 在 nanoGPT 优化器快速运行上运行:约1万次运行,14k H200小时,239亿个token。Opus 达到2…
AI智能体(Opus 4.7 和 GPT 5.5/Codex)自主优化了 nanoGPT 快速运行任务,以2930步的新记录超越了人类基线。博客详细介绍了它们的搜索方法、失败案例,并发布了所有运行数据和代码。
@mylifcc: 我已经在mac上用上Gemma-4-12b了,技术栈是: llama.cpp + GGUF Q4_K_M + Metal 32K context,本地 OpenAI-compatible API 实测约 36 tok/s,常驻 RSS 约…
用户分享在Mac上使用llama.cpp配合GGUF Q4_K_M量化版Gemma-4-12b模型的经验,实现了约36 tok/s的本地推理速度和约10GB内存占用。
@WEB3_furture: COOL ! 有人拿 新发布Qwen 3.7-Max和Claude Opus 4.7、GPT-5.5 做 Agent 循环对比:让模型自己写俄罗斯方块机器人、自己测试、连续迭代 10 轮后直接 PK,结果: Qwen 3.7-Max:+$…
有人对Qwen 3.7-Max、Claude Opus 4.7和GPT-5.5进行Agent循环对比测试,让模型自己编写俄罗斯方块机器人并迭代10轮后PK,结果显示Qwen 3.7-Max在性能和成本上均领先。
@hank_aibtc: 猛啊!在浏览器里跑 Gemma 4,堪比 ChatGPT?! 完全零服务器、零数据上传、离线使用、纯WebGPU本地推理! Xenova把 Fable 5写的27个自定义WebGPU内核 全部开源了: - Gemma 4 E2B(23亿参…
文章介绍了Xenova开源了27个自定义WebGPU内核,使得Gemma 4模型可以在浏览器中完全离线、本地运行,性能达到255 tok/s,并讨论了隐私、离线使用等优势。同时也提到了FLUX.2的3D生成能力。