还有谁注意到 gemma-4-26b-a4b 在单次提示(one-shot)生成 three.js 代码方面有多厉害?
摘要
讨论强调了 Gemma-4-26b-a4b 模型通过单次提示(one-shot prompting)生成 Three.js 代码以创建生成艺术演示的能力。
我编写了一个简单的 Python 应用程序,用于循环运行如下所示的一系列提示词:|使用来自 CDN 的 three.js 的单文件 HTML。中心放置一个旋转的 MeshNormalMaterial 环形结。在投影到屏幕的某个位置放置一个明亮的 Sprite(启用 AdditiveBlending,具有柔和圆形画布纹理),并在该位置与屏幕中心的连线上放置 6 个较小的 sprite,每个 sprite 的大小和色调各不相同。每帧更新位置。| |:-| 我在一个 .csv 文件中放了大约 80 个这样的小提示词供循环使用——程序会将代码写入一个模拟终端窗口,必要时检测崩溃,然后展示并归档生成的 HTML 文件。玩起来真的很有趣。上面的链接指向一个静态演示,GitHub 页面在此处 [https://github.com/RowanUnderwood/auto_demo_scener](https://github.com/RowanUnderwood/auto_demo_scener) 没有特意筛选,所以存档里可能混入了一些失败的案例 :D
查看缓存全文
缓存时间: 2026/05/10 18:20
# AI Demoscener — 存档
来源:https://rowanunderwood.github.io/auto_demo_scener/
DEMOWRITER 1.0 — 存档
— / —
加载中
初始化← 前一篇 · → / 空格 后一篇
相似文章
喜欢 Gemma4 模型的朋友们——你们都是怎么用的?
一位开发者分享了在本地运行 Gemma4 和 Qwen 进行编程任务的复杂体验,指出了工具集成、循环处理和任务完成方面存在的问题,并向社区寻求更优化的使用策略。
Gemma 4 12B 是我的新主力
作者分享了从 Qwen 3.6 切换到 Gemma 4 12B(Unsloth Q5_K_XL)进行本地编程的体验,称赞其即插即用的设置、更好的语法准确性以及可控的 VRAM 使用,尽管在速度上略有取舍。
Qwen3.6:27b 一次尝试即修复了 CSS UI 错误,而 Gemma4:26B 却无用空转了 15 分钟
用户分享了一份详细的本地编码性能对比,指出 Qwen3.6-27B 仅用一次尝试就修复了 CSS 错误,而 Gemma4-26B 则陷入了递归错误循环。该帖子强调了在 Apple Silicon 硬件上密集模型(Dense models)与混合专家模型(MoE)之间的权衡。
Gemma 4 26B 在单块 RTX 5090 上达到 600 Tok/s
一项基准测试显示,使用 vLLM 搭配 DFlash 投机解码,在单块 RTX 5090 上将 Gemma 4 26B 的推理速度提升至约 578 tokens/s,相比基线实现了 2.56 倍的加速。
google/gemma-4-26B-A4B-it-assistant
Google DeepMind 发布了 Gemma 4 MTP 草稿模型(drafter),适用于 Gemma 4 系列模型,通过推测解码(speculative decoding)实现显著的解码加速,同时保持完全一致的生成质量,适用于低延迟应用场景。