还有谁注意到 gemma-4-26b-a4b 在单次提示(one-shot)生成 three.js 代码方面有多厉害?

Reddit r/LocalLLaMA 新闻

摘要

讨论强调了 Gemma-4-26b-a4b 模型通过单次提示(one-shot prompting)生成 Three.js 代码以创建生成艺术演示的能力。

我编写了一个简单的 Python 应用程序,用于循环运行如下所示的一系列提示词:|使用来自 CDN 的 three.js 的单文件 HTML。中心放置一个旋转的 MeshNormalMaterial 环形结。在投影到屏幕的某个位置放置一个明亮的 Sprite(启用 AdditiveBlending,具有柔和圆形画布纹理),并在该位置与屏幕中心的连线上放置 6 个较小的 sprite,每个 sprite 的大小和色调各不相同。每帧更新位置。| |:-| 我在一个 .csv 文件中放了大约 80 个这样的小提示词供循环使用——程序会将代码写入一个模拟终端窗口,必要时检测崩溃,然后展示并归档生成的 HTML 文件。玩起来真的很有趣。上面的链接指向一个静态演示,GitHub 页面在此处 [https://github.com/RowanUnderwood/auto_demo_scener](https://github.com/RowanUnderwood/auto_demo_scener) 没有特意筛选,所以存档里可能混入了一些失败的案例 :D
查看原文
查看缓存全文

缓存时间: 2026/05/10 18:20

# AI Demoscener — 存档 来源:https://rowanunderwood.github.io/auto_demo_scener/ DEMOWRITER 1.0 — 存档 — / — 加载中 初始化← 前一篇 · → / 空格 后一篇

相似文章

Gemma 4 12B 是我的新主力

Reddit r/LocalLLaMA

作者分享了从 Qwen 3.6 切换到 Gemma 4 12B(Unsloth Q5_K_XL)进行本地编程的体验,称赞其即插即用的设置、更好的语法准确性以及可控的 VRAM 使用,尽管在速度上略有取舍。

Gemma 4 26B 在单块 RTX 5090 上达到 600 Tok/s

Reddit r/LocalLLaMA

一项基准测试显示,使用 vLLM 搭配 DFlash 投机解码,在单块 RTX 5090 上将 Gemma 4 26B 的推理速度提升至约 578 tokens/s,相比基线实现了 2.56 倍的加速。

google/gemma-4-26B-A4B-it-assistant

Hugging Face Models Trending

Google DeepMind 发布了 Gemma 4 MTP 草稿模型(drafter),适用于 Gemma 4 系列模型,通过推测解码(speculative decoding)实现显著的解码加速,同时保持完全一致的生成质量,适用于低延迟应用场景。