SPRITE:从静态设计稿到引擎就绪的游戏 UI

Hugging Face Daily Papers 论文

摘要

SPRITE 提出一套流程,利用视觉-语言模型与 YAML 中间格式,将静态游戏 UI 截图转换为可编辑的引擎资源,自动处理复杂布局与深层嵌套。

游戏 UI 的实现需要将风格化的设计稿转化为可交互的引擎对象。然而,现有的“截图转代码”工具在面对游戏界面常见的不规则几何形状与深层视觉层级时往往力不从心。为此,我们推出 SPRITE——一条把静态截图变成可编辑引擎资源的自动化管线。通过将视觉-语言模型(VLM)与结构化 YAML 中间表示相结合,SPRITE 显式捕获复杂的容器关系与非矩形布局。我们在精选的游戏 UI 基准上对 SPRITE 进行评估,并邀请专业开发者进行专家评审,以衡量重建保真度与原型迭代效率。结果表明,SPRITE 通过自动化繁琐编码、解析复杂嵌套,显著加速开发流程。借助快速的引擎内迭代,SPRITE 有效模糊了游戏开发中艺术设计与技术实现的边界。项目主页:https://baiyunshu.github.io/sprite.github.io/
查看原文
查看缓存全文

缓存时间: 2026/04/22 06:17

论文页面 - SPRITE:从静态原型到引擎就绪的游戏 UI

来源:https://huggingface.co/papers/2604.18591

摘要

SPRITE 通过将视觉-语言模型与结构化 YAML 表示相结合,自动将游戏 UI 截图转换为可编辑的引擎资产,能够处理复杂布局与深层嵌套。

游戏 UI 的实现需要将风格化的原型转化为可交互的引擎实体。然而,当前的“截图转代码”工具往往难以应对游戏界面中常见的不规则几何形状与深度视觉层级。为填补这一空白,我们提出 SPRITE——一条将静态截图转化为可编辑引擎资产的流水线。通过将视觉-语言模型(VLMs)与结构化 YAML 中间表示相结合,SPRITE 显式捕获复杂的容器关系与非矩形布局。我们在精选的游戏 UI 基准上对 SPRITE 进行了评估,并邀请专业开发者进行专家评审,以衡量重建保真度与原型效率。结果表明,SPRITE 通过自动化繁琐编码、解析复杂嵌套,显著简化开发流程。凭借在引擎内的快速迭代能力,SPRITE 有效模糊了游戏开发中艺术设计与技术实现之间的界限。项目主页:https://baiyunshu.github.io/sprite.github.io/

查看 arXiv 页面(https://arxiv.org/abs/2604.18591)
查看 PDF(https://arxiv.org/pdf/2604.18591)
项目主页(https://baiyunshu.github.io/sprite.github.io/)
添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2604.18591)

在智能体中获取该论文:

hf papers read 2604.18591

尚未安装最新 CLI?
curl -LsSf https://hf.co/cli/install.sh | bash

引用本论文的模型 0

暂无模型引用该论文

在模型 README.md 中引用 arxiv.org/abs/2604.18591,即可在此页面显示链接。

引用本论文的数据集 0

暂无数据集引用该论文

在数据集 README.md 中引用 arxiv.org/abs/2604.18591,即可在此页面显示链接。

引用本论文的 Spaces 0

暂无 Space 引用该论文

在 Space README.md 中引用 arxiv.org/abs/2604.18591,即可在此页面显示链接。

收录本论文的合集 0

暂无合集收录该论文

将该论文添加到合集(https://huggingface.co/new-collection),即可在此页面显示链接。

相似文章

像1993年那样制作图形

Hacker News Top

一位开发者详细介绍了如何构建《Catlantean 3D》——一款采用1993年时代图形技术(256色、320x240分辨率、手工制作资产、无人工智能)的第一人称射击游戏,计划在Steam上发布,重点讲解调色板渲染和资产创建。

Genspark Design

Product Hunt

Genspark Design 是一款生成UI原型、视频和海报的AI工具。