SenseNova U1 推出面向信息图的微调模型
摘要
SenseNova U1 发布了其 U1-8B-MoT 基础模型的信息图专用微调版本,在信息图准确性、图表理解和文本渲染方面实现了显著的基准提升。
这是同一个 U1-8B-MoT 基础模型,但增加了专注于结构化视觉输出的扩展多任务(MT)训练阶段。基准测试提升显著:IGenBench I-ACC(信息图准确性):4.2👉17.0(4倍)图表理解:51.3👉69.5 文本渲染:39.8👉46.6 整体美观度:53.8👉53.3 仓库:https://github.com/OpenSenseNova/SenseNova-U1 github(信息图模型文档):https://github.com/OpenSenseNova/SenseNova-U1/blob/main/docs/u1\_infographic\_model.md
相似文章
@heyshrutimishra: 新消息:一个边画边思考的模型。SenseNova U1 是一个统一处理理解、推理和生成…
SenseNova U1 是一个统一模型,在同一个架构中处理文本和图像的理解、推理与生成,能够端到端地完成规划信息图等任务。
sensenova/SenseNova-U1-8B-MoT
SenseNova U1 是基于 NEO-Unify 框架构建的新一代原生多模态模型系列,在单一架构内统一了理解与生成能力,无需单独的视觉编码器或 VAE。
SenseNova-U1:基于 NEO-unify 架构统一多模态理解与生成
本文介绍了 SenseNova-U1,这是一种统一的多模态架构,整合了理解与生成任务。我们发布了两个变体(8B 和 30B),在感知能力和图像合成方面均表现出竞争力的性能。
推出 Nano Banana Pro
Google DeepMind 推出 Nano Banana Pro,这是一款基于 Gemini 3 Pro 打造的全新顶尖图像生成与编辑模型。该模型具备更出色的文本渲染能力、增强的世界知识整合能力以及高保真视觉能力,可在 Google 各产品中体验。
Nano Banana 2:将 Pro 级能力与闪电般的速度相结合
Google DeepMind 发布 Nano Banana 2,这是一款图像生成模型,融合了 Nano Banana Pro 的先进能力与 Gemini Flash 的速度。该模型具备改进的主体一致性、精准的文字渲染能力,并已集成到 Gemini、Search 等 Google 产品中。