SPRITE:从静态设计稿到引擎就绪的游戏 UI
摘要
SPRITE 提出一套流程,利用视觉-语言模型与 YAML 中间格式,将静态游戏 UI 截图转换为可编辑的引擎资源,自动处理复杂布局与深层嵌套。
查看缓存全文
缓存时间: 2026/04/22 06:17
论文页面 - SPRITE:从静态原型到引擎就绪的游戏 UI
来源:https://huggingface.co/papers/2604.18591
摘要
SPRITE 通过将视觉-语言模型与结构化 YAML 表示相结合,自动将游戏 UI 截图转换为可编辑的引擎资产,能够处理复杂布局与深层嵌套。
游戏 UI 的实现需要将风格化的原型转化为可交互的引擎实体。然而,当前的“截图转代码”工具往往难以应对游戏界面中常见的不规则几何形状与深度视觉层级。为填补这一空白,我们提出 SPRITE——一条将静态截图转化为可编辑引擎资产的流水线。通过将视觉-语言模型(VLMs)与结构化 YAML 中间表示相结合,SPRITE 显式捕获复杂的容器关系与非矩形布局。我们在精选的游戏 UI 基准上对 SPRITE 进行了评估,并邀请专业开发者进行专家评审,以衡量重建保真度与原型效率。结果表明,SPRITE 通过自动化繁琐编码、解析复杂嵌套,显著简化开发流程。凭借在引擎内的快速迭代能力,SPRITE 有效模糊了游戏开发中艺术设计与技术实现之间的界限。项目主页:https://baiyunshu.github.io/sprite.github.io/
查看 arXiv 页面(https://arxiv.org/abs/2604.18591)
查看 PDF(https://arxiv.org/pdf/2604.18591)
项目主页(https://baiyunshu.github.io/sprite.github.io/)
添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2604.18591)
在智能体中获取该论文:
hf papers read 2604.18591
尚未安装最新 CLI?
curl -LsSf https://hf.co/cli/install.sh | bash
引用本论文的模型 0
暂无模型引用该论文
在模型 README.md 中引用 arxiv.org/abs/2604.18591,即可在此页面显示链接。
引用本论文的数据集 0
暂无数据集引用该论文
在数据集 README.md 中引用 arxiv.org/abs/2604.18591,即可在此页面显示链接。
引用本论文的 Spaces 0
暂无 Space 引用该论文
在 Space README.md 中引用 arxiv.org/abs/2604.18591,即可在此页面显示链接。
收录本论文的合集 0
暂无合集收录该论文
将该论文添加到合集(https://huggingface.co/new-collection),即可在此页面显示链接。
相似文章
@VraserX: 这看起来是AI设计领域的一大步。让我印象深刻的是,这不仅仅是生成漂亮的……
Genspark推出Genspark Design,这是一款由Claude Opus 4.7驱动的AI设计工具,可以创建UI原型、海报、视频、HTML动画,并将设计转换为代码,旨在成为完整的创意生产工具。
像1993年那样制作图形
一位开发者详细介绍了如何构建《Catlantean 3D》——一款采用1993年时代图形技术(256色、320x240分辨率、手工制作资产、无人工智能)的第一人称射击游戏,计划在Steam上发布,重点讲解调色板渲染和资产创建。
@Designarena: 宣布在Design Arena上推出Agentic Game Development——我们最新的多文件、多轮评估。抢先看…
Design Arena宣布推出Agentic Game Development,这是一种新的多文件、多轮评估,可访问资产目录、内置库(如Howler和Tween.js),并扩展了用于精灵生成和资产发现的工具调用。
GUICrafter:弱监督GUI智能体,利用海量未标注截图
GUICrafter提出了一种弱监督GUI智能体,利用海量未标注截图和两阶段课程学习框架,减少对昂贵人工标注的依赖,仅用UI-TARS系统0.1%的数据即达到了与之竞争的性能。
Genspark Design
Genspark Design 是一款生成UI原型、视频和海报的AI工具。