Granite 4.1 3B SVG 鹈鹕画廊

Simon Willison's Blog 模型

摘要

IBM 在 Apache 2.0 许可下发布了 Granite 4.1 系列 LLM,Simon Willison 尝试使用该 3B 模型的 21 种不同量化变体生成骑自行车的鹈鹕 SVG 图像。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/05/08 06:37

# Granite 4.1 3B SVG 鹈鹕画廊 来源:https://simonwillison.net/2026/May/4/granite-41-3b-svg-pelican-gallery/ 2026年5月4日 \- 链接博客 **Granite 4.1 3B SVG 鹈鹕画廊 (https://simonw.github.io/granite-4.1-3b-gguf-pelicans/)**。IBM 几天前发布了其 Granite 4.1 系列 (https://research.ibm.com/blog/granite-4-1-ai-foundation-models) 大语言模型。这些模型采用 Apache 2.0 许可证,并提供 3B、8B 和 30B 三种尺寸。 Granite 4.1 大语言模型:构建方式 (https://huggingface.co/blog/ibm-granite/granite-4-1) 由 Granite 团队成员 Yousaf Shah 详细描述了训练过程。 Unsloth 发布了 unsloth/granite-4.1-3b-GGUF (https://huggingface.co/unsloth/granite-4.1-3b-GGUF) 集合,其中包含 3B 模型的 GGUF 编码量化变体——共 21 个不同的模型文件,大小从 1.2GB 到 6.34GB 不等。 这 21 个 Unsloth 文件总计 51.3GB,这促使我终于尝试了一个我想做很久的实验:针对同一模型的不同量化变体,提示“生成一个骑自行车的鹈鹕的 SVG 图像”,看看结果会是什么样子。 老实说,结果 (https://simonw.github.io/granite-4.1-3b-gguf-pelicans/) 并没有我预期的那么有趣。质量与模型大小之间没有明显的规律——它们都相当糟糕! 六张来自不同模型的 SVG 图像,大小从 1.67GB 到 1.2GB 不等。它们几乎都是抽象的形状集合——奇怪的是,最小的模型在自行车方面表现最好,而最大的模型则稍微有点像鹈鹕。 我以后可能会用更擅长画鹈鹕的模型再次尝试这个实验。

相似文章

Granite 4.1 LLMs:技术架构解析

Hugging Face Blog

本文详细介绍了 IBM Granite 4.1 大语言模型的技术架构与训练流程,涵盖预训练、SFT(监督微调)及 RL(强化学习)阶段。文章指出,该 8B 稠密模型在性能上超越了更大的 MoE(混合专家)模型,并提及模型以 Apache 2.0 许可证开源发布。