SenseNova U1 推出面向信息图的微调模型

Reddit r/LocalLLaMA 模型

摘要

SenseNova U1 发布了其 U1-8B-MoT 基础模型的信息图专用微调版本,在信息图准确性、图表理解和文本渲染方面实现了显著的基准提升。

这是同一个 U1-8B-MoT 基础模型,但增加了专注于结构化视觉输出的扩展多任务(MT)训练阶段。基准测试提升显著:IGenBench I-ACC(信息图准确性):4.2👉17.0(4倍)图表理解:51.3👉69.5 文本渲染:39.8👉46.6 整体美观度:53.8👉53.3 仓库:https://github.com/OpenSenseNova/SenseNova-U1 github(信息图模型文档):https://github.com/OpenSenseNova/SenseNova-U1/blob/main/docs/u1\_infographic\_model.md
查看原文

相似文章

sensenova/SenseNova-U1-8B-MoT

Hugging Face Models Trending

SenseNova U1 是基于 NEO-Unify 框架构建的新一代原生多模态模型系列,在单一架构内统一了理解与生成能力,无需单独的视觉编码器或 VAE。

推出 Nano Banana Pro

Google DeepMind Blog

Google DeepMind 推出 Nano Banana Pro,这是一款基于 Gemini 3 Pro 打造的全新顶尖图像生成与编辑模型。该模型具备更出色的文本渲染能力、增强的世界知识整合能力以及高保真视觉能力,可在 Google 各产品中体验。

Nano Banana 2:将 Pro 级能力与闪电般的速度相结合

Google DeepMind Blog

Google DeepMind 发布 Nano Banana 2,这是一款图像生成模型,融合了 Nano Banana Pro 的先进能力与 Gemini Flash 的速度。该模型具备改进的主体一致性、精准的文字渲染能力,并已集成到 Gemini、Search 等 Google 产品中。