Granite 4.1 3B SVG 鹈鹕画廊
摘要
IBM 在 Apache 2.0 许可下发布了 Granite 4.1 系列 LLM,Simon Willison 尝试使用该 3B 模型的 21 种不同量化变体生成骑自行车的鹈鹕 SVG 图像。
暂无内容
查看缓存全文
缓存时间: 2026/05/08 06:37
# Granite 4.1 3B SVG 鹈鹕画廊
来源:https://simonwillison.net/2026/May/4/granite-41-3b-svg-pelican-gallery/
2026年5月4日 \- 链接博客
**Granite 4.1 3B SVG 鹈鹕画廊 (https://simonw.github.io/granite-4.1-3b-gguf-pelicans/)**。IBM 几天前发布了其 Granite 4.1 系列 (https://research.ibm.com/blog/granite-4-1-ai-foundation-models) 大语言模型。这些模型采用 Apache 2.0 许可证,并提供 3B、8B 和 30B 三种尺寸。
Granite 4.1 大语言模型:构建方式 (https://huggingface.co/blog/ibm-granite/granite-4-1) 由 Granite 团队成员 Yousaf Shah 详细描述了训练过程。
Unsloth 发布了 unsloth/granite-4.1-3b-GGUF (https://huggingface.co/unsloth/granite-4.1-3b-GGUF) 集合,其中包含 3B 模型的 GGUF 编码量化变体——共 21 个不同的模型文件,大小从 1.2GB 到 6.34GB 不等。
这 21 个 Unsloth 文件总计 51.3GB,这促使我终于尝试了一个我想做很久的实验:针对同一模型的不同量化变体,提示“生成一个骑自行车的鹈鹕的 SVG 图像”,看看结果会是什么样子。
老实说,结果 (https://simonw.github.io/granite-4.1-3b-gguf-pelicans/) 并没有我预期的那么有趣。质量与模型大小之间没有明显的规律——它们都相当糟糕!
六张来自不同模型的 SVG 图像,大小从 1.67GB 到 1.2GB 不等。它们几乎都是抽象的形状集合——奇怪的是,最小的模型在自行车方面表现最好,而最大的模型则稍微有点像鹈鹕。
我以后可能会用更擅长画鹈鹕的模型再次尝试这个实验。
相似文章
Granite 4.0 3B Vision:面向企业文档的紧凑型多模态智能模型
IBM 发布 Granite 4.0 3B Vision,这是一款专为理解企业文档而设计的紧凑型视觉语言模型,具备表格提取、基于 ChartNet 的图表解读以及键值对 grounding 等专业能力。
ibm-granite/granite-4.1-8b · Hugging Face
IBM 发布 Granite-4.1-8B:Apache 2.0 许可的 80 亿参数长上下文 Instruct 模型,工具调用与多语言能力全面升级。
Granite 4.1 LLMs:技术架构解析
本文详细介绍了 IBM Granite 4.1 大语言模型的技术架构与训练流程,涵盖预训练、SFT(监督微调)及 RL(强化学习)阶段。文章指出,该 8B 稠密模型在性能上超越了更大的 MoE(混合专家)模型,并提及模型以 Apache 2.0 许可证开源发布。
我的笔记本上的Qwen3.6-35B-A3B画出的鹈鹕比Claude Opus 4.7更好
Simon Willison对比了在MacBook Pro上本地运行的Qwen3.6-35B-A3B与Claude Opus 4.7,发现Qwen生成的骑自行车的鹈鹕和骑独轮车的火烈鸟的SVG插图更好,不过他指出这个狭窄的基准测试并不能反映更广泛的模型能力。
模型:Granite4 Vision,作者 gabe-l-hart · 拉取请求 #23545 · ggml-org/llama.cpp
此拉取请求为 llama.cpp(一个开源 LLM 推理引擎)增加了对 Granite4 Vision 模型的支持。