@heyshrutimishra: Luma 发布的 Uni-1.1 中无人关注的关键细节:该模型在训练过程中引入了好莱坞 cinematographer 和 VFX 艺术家的反馈…
摘要
Luma 的 Uni-1.1 模型通过与好莱坞摄影师和 VFX 艺术家进行反馈闭环训练来实现差异化。这一策略表明,在图像 AI 领域,经过精心筛选的人类审美品味可能成为超越传统基准测试的关键竞争壁垒。
查看缓存全文
缓存时间: 2026/05/10 02:29
Luma 发布 Uni-1.1 时,没人注意到的关键细节:
该模型在训练过程中引入了好莱坞电影摄影师和视觉特效(VFX)艺术家进行闭环反馈。
其他所有实验室都在竞相比拼参数量和基准测试指标。而在图像生成 AI 领域,下一道护城河将是模型学到了谁的审美品味。
https://t.co/m7sU2cuqVC
相似文章
@heyshrutimishra: 在这里试试 →
Luma AI 推出了其 API,为 Ray3.14 和 Photon 等图像和视频生成模型提供按量付费和预留吞吐量的定价模式。
@Suryanshti777: NVIDIA刚刚揭秘了它们用来让LLM微调显著加速的隐藏技巧。不是新GPU。不是大…
NVIDIA和Unsloth发布了一篇技术指南,详细介绍了三种底层优化方法,可将LLM微调速度提升高达25%,包括打包序列缓存、双缓冲检查点存储和优化的MoE路由。该指南提供了深入的系统级解释和基准测试,面向机器学习工程师和开发者。
HiDream-ai/HiDream-O1-Image
HiDream-ai 已开源 HiDream-O1-Image(8B),这是一款基于像素级统一 Transformer(UiT)构建的统一图像生成基础模型,原生支持文本生成图像、图像编辑以及主体驱动的个性化生成,分辨率最高可达 2048×2048,无需外部 VAE 或独立文本编码器。该模型在 Artificial Analysis 文生图竞技场中首次亮相即位列第 8,是目前领先的开放权重文生图模型之一。
@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...
Yann LeCun的团队发布了LeWorldModel,一个仅有1500万参数的物理模型,在单张GPU上训练数小时,在规划速度和物理合理性上超越了价值数十亿美元的基础模型,挑战了主流的规模扩展范式。
@elonmusk:人类感知的 RGB 图像为图 1,而特斯拉 AI 光子计数重建图像为图 2。这就是 Tesla FSD 能够……
Elon Musk 解释说,Tesla FSD 利用 AI 光子计数重建技术而非标准 RGB,从而在低光照和强眩光条件下实现更卓越的性能。