JD Oxygen AI Item Center (Oxygen AIIC) V1:一种工业级、以LLM/VLM为核心的物品理解、管理和应用解决方案

arXiv cs.AI 论文

摘要

本文介绍了JD Oxygen AI Item Center (Oxygen AIIC),一个工业级平台,利用LLM/VLM进行物品知识生产和服务,实现了高精度和高召回率,并在京东的搜索、推荐和运营中带来了可衡量的收益。

arXiv:2606.28070v1 公告类型:新 摘要:JD.com是全球最大的电子商务平台之一,服务超过7亿活跃用户和数百万商家,拥有数百亿SKU的商品目录。在这种规模下,高质量、结构化的物品知识支撑着更好的消费者体验、更低的管理成本和更高的运营效率——然而,生产和提供这种知识面临着三个工业级的挑战:快速涌现的新概念、海量SKU的高质量知识生产以及多样化的下游需求。为了应对这些挑战,我们提出了JD Oxygen AI Item Center (Oxygen AIIC),一个基于LLM/VLM构建的工业级物品知识生产与服务平台。Oxygen AIIC围绕四大核心支柱构建:(i) 高效人机协作驱动的本体工程,支持拥有数百万条目的本体动态演化与敏捷扩展;(ii) 一种"语义搜索后判别"(S2D)的知识识别架构,结合吞吐量提升策略,实现了可扩展、可延展、高吞吐的AI物品库生产,覆盖数百亿SKU;(iii) 自我进化的物品理解LLM/VLM,以稳定可控的方式持续改进,实现了94.2%的精度和82.8%的召回率的知识生产;(iv) 统一的物品通道,作为数据和服务枢纽。Oxygen AIIC现已覆盖数万个京东品类,并在华为昇腾NPU上每天处理数亿次物品更新。它积累了数千亿的物品知识资产。部署在核心业务场景中——包括搜索、推荐、运营、品类规划——Oxygen AIIC在大规模应用中带来了可衡量的收益。搜索流量覆盖率达到80.4%,物品信息质量问题下降37%,商品上架时核心属性的自动填充率超过80%。
查看原文
查看缓存全文

缓存时间: 2026/06/29 05:28

# \productfontAI Item Center (\productfontOxygen AIIC) V1: 一个工业级以LLM/VLM为核心的物品理解、管理与应用方案  
来源:https://arxiv.org/html/2606.28070  

\[ Path = \./fonts/, UprightFont = TimesNewRoman\-Regular\.ttf, BoldFont = TimesNewRoman\-Bold\.ttf, ItalicFont = TimesNewRoman\-Italic\.ttf, BoldItalicFont = TimesNewRomanBold\-Italic\.ttf, Ligatures = TeX \]  

\[ Path = \./fonts/, UprightFont = Inter\-Regular\.ttf, BoldFont = Inter\-Bold\.ttf, \]  

Oxygen AIIC, Chan Long, Chao Liu, Chaofan Chen, Chaohui Dong, Chunyuan Guo, Danping Liu, Debin Liu, Deping Xiang, Fulai Xu, Guangyue Liu, Hao Li, Huichun Hu, Jian Yang, Jianan Wang, Jianbo Zhao, Jiaoyang Li, Jiaxing Wang, Jinglong Li, Jinjin Guo, Jun Fang, Jun Liu, Kai Zhou, Li Wang, Lili Gao, Liying Chen, Luning Yang, Mengdi Zhou, Pengzhang Liu, Qi Lv, Qianyun Wang, Qixia Jiang, Ruyue Li, Shimu Liang, Shuxing Wang, Sijie Zhang, Siqi Li, Tianhao Gao, Wang Ke, Weihu Huang, Wencan Lai, Wenjie Zhang, Xiaohui Zhang, Xiaojing Dong, Ya Liu, Yifeng Zhang, Yixiang Wang, Yongtai Zhang, Yongyi Liao, Zhaoru Chen, Zhen Chen, Zhiyong Ma, Zhiyuan Liu, Zhongwei Liu, Ziyan Xing  

oxygen\-aiic@jd\.com  

###### 摘要  

京东¹,作为全球最大的电商平台之一,服务超过7亿活跃用户和数百万商家,拥有数百亿SKU的商品目录。在此规模下,高质量、结构化的商品知识是支撑更好用户体验、更低管理成本和更高运营效率的基础——然而,其生产与服务面临着三个工业级挑战:快速涌现的新概念、海量SKU的高质量知识生产,以及多样化的下游需求。为应对这些挑战,我们提出了京东Oxygen AI Item Center(\productfontOxygen AIIC),这是一个构建在LLM/VLM之上的工业级平台,用于商品知识的生产与服务。  

\productfontOxygen AIIC围绕四大核心支柱构建:(i) 由高效人机协作驱动的本体工程,支持包含数百万条目的本体动态演化与敏捷扩展;(ii) “语义搜索后判别”(S2D\mathsf{S}^{2}\mathsf{D})知识识别架构,结合吞吐量提升策略,实现了针对数百亿SKU的可扩展、可延展、高吞吐的AI商品库生产;(iii) 自我演进的商品理解LLM/VLM,以稳定可控的方式持续提升,实现94.2%的精确率和82.8%的召回率的知识生产;(iv) 统一商品隧道,作为数据和服务枢纽,按层级新鲜度交付商品知识。  

\productfontOxygen AIIC现已覆盖数万个京东类目,每天在华为昇腾NPU上处理数亿次商品更新。它积累了数千亿的商品知识资产,并将商品信息丰富度提升至之前的3.35倍。部署在搜索、推荐、运营、品类规划等核心业务场景后,\productfontOxygen AIIC已在大规模应用中取得可量化收益。例如,搜索流量覆盖率达80.4%,商品信息质量问题减少37%,商品上架时核心属性自动填充率超过80%,商品创意的智能优化使点击率提升9%。  

## 1 引言  

京东是全球领先的电商平台,服务超过7亿活跃用户和数百万商家,管理着数百亿SKU的商品目录。为实现“多、快、好、省”的零售价值主张,京东将“成本、效率、体验”作为核心战略重点。随着电商的快速增长,传统商品知识系统已无法有效支撑这一战略,在需求端、供给端和运营端产生了三大工业级瓶颈,如图1所示:  

- • **需求端:商品信息不完整与语义鸿沟。** 商品信息不完整,加上用户描述需求的多样性——例如,“炭灰色” vs. “莫兰迪色系”——导致语义不匹配,降低了用户体验和流量分配效率(Nigam et al., 2019)。  
- • **供给端:商品管理成本高,流量获取效率低。** 商家需要提供并持续维护多维度的商品信息。然而,手动操作使得这一过程成本高、效率低,导致商品信息质量下降,限制了商家获取流量的能力。  
- • **运营端:市场趋势变化快,精细化运营需求增长。** 频繁的趋势变化和日益精细的运营要求使得趋势感知和商品运营更加困难,最终制约了平台的效率。  

为应对这些瓶颈,早期的工业系统采用了传统的NLP技术和预训练模型,例如基于BERT架构的命名实体识别(NER)(Luo et al., 2020)。然而,这些方法在两大方面仍存在局限性。首先,由于模型容量有限且依赖特定任务的微调,它们难以弥合异构电商数据源之间的分布差异,且对新兴概念缺乏鲁棒性。其次,它们存在“人工标注瓶颈”,系统准确性与昂贵且不可持续的人工标注紧密耦合。因此,这些方法难以在降低成本的同时保持高质量的大规模部署。  

图1:传统商品知识系统在需求端、供给端和运营端的典型失败案例。  

LLM/VLM的快速进步为摆脱长期以来高人力成本和弱泛化能力的困境提供了出路(Brown et al., 2020; Ouyang et al., 2022; Radford et al., 2021; Liu et al., 2023)。凭借广泛的世界知识、强大的零样本/少样本泛化能力和推理能力,这些模型使得更准确、更全面、更及时的本体工程和商品知识生产成为可能。学术界和工业界已在四个方向推进智能商品理解:(1) *领域专用基础模型*,将电商知识注入通用LLM/VLM,使其具备零售领域知识(Shi et al., 2025; Peng et al., 2024; Herold et al., 2024);(2) *自动化本体扩展*,将传统专家驱动范式转变为半自动化的人机协作,实现动态本体演化(Shen et al., 2020; Mao et al., 2020; Er-Rahmadi et al., 2023);(3) *大规模属性抽取*,将商品属性识别从封闭领域实体抽取推进到检索增强生成(RAG)和多模态理解(Zheng et al., 2018; Wang et al., 2020a; Zhang et al., 2025);(4) *网络级商品知识图谱*,构建连接商品、属性和复杂用户意图的大规模、良好对齐的零售知识网络(Luo et al., 2020; 2021; Zalmout et al., 2021)。  

图2:\productfontOxygen AIIC在商品全生命周期中的概览。本体和AI商品库共同支持品类规划、商家工作流、用户理解、搜索、推荐和平台运营。  

这些努力证实了大模型用于智能商品理解的可行性。然而,在几乎涵盖所有零售品类并管理数百亿商品的京东平台上部署它们仍然充满挑战。为了构建高可用、高吞吐的商品知识基础设施,必须解决以下三个基本挑战:  

- • **本体演化以跟上异构来源和快速涌现的新概念。** 商品知识是多源异构的,分散在商品信息(标题、主图、详情页等)、用户查询和公共网络内容中。新的市场细分和概念不断出现,所需的细节粒度也在不断增加。全面及时地捕获这些知识,同时足够快速地扩展本体骨干以跟上步伐,是工业部署面临的第一个挑战。  
- • **在海量商品规模下实现可扩展、高吞吐、低成本和高质量的知识生产。** 在数百亿商品的规模上,AI商品库必须同时满足多项严格要求:必须随着本体的演化无缝扩展,在整个目录上维持高吞吐生产,将推理成本和延迟控制在紧预算内,同时始终保持高质量。直接调用大模型进行商品知识的生产和更新将带来高昂的推理成本和难以接受的延迟(Dao et al., 2022; Kwon et al., 2023b),并且质量仍可能不足。因此,构建工业级AI商品库需要一个在设计中即可扩展且可延展的解决方案。  
- • **高效支持通用和场景特定需求。** 京东的下游生态系统对商品知识的格式和新鲜度提出了高度多样化的需求。这些场景共享一个知识基础,但各自有独特的服务要求:商品治理(例如信息预填和合规检查)依赖实时服务;搜索和推荐需要高吞吐的近线特征;品类运营则需要由业务逻辑驱动的离线后处理。一个单一平台必须同时服务所有这些高度并发、领域特定的需求,在高效利用场景共性的同时支持其独特性。  

为了弥合LLM/VLM潜力与工业部署现实之间的差距,我们构建了京东Oxygen AI Item Center(\productfontOxygen AIIC)。\productfontOxygen AIIC构建了包含数百万条目的商品本体,并在数万个品类和数百亿SKU上以高吞吐生产高质量商品知识。它在华为昇腾NPU上实现了94.2%/82.8%的知识生产精确率/召回率,吞吐效率提升超过10倍,并积累了数千亿的洁净商品知识资产,将商品信息丰富度提升至之前的3.35倍。如图2所示,\productfontOxygen AIIC作为商品全生命周期的知识枢纽。在搜索场景中,\productfontOxygen AIIC覆盖80.4%的流量,并将商品信息质量问题减少37%,从而改善购物体验。对于品类规划,与人工工作流程相比,\productfontOxygen AIIC将决策周期从数周缩短至数天。核心属性的自动填充率超过80%,商品创意的优化使点击率提升约9%。  

本文介绍了LLM/VLM在商品知识基础设施中的工业级部署。我们的主要贡献有三点:  

- • **一个可扩展、可泛化且自我演进的商品理解LLM/VLM框架。** 利用大模型广泛的世界知识和强大的推理能力,我们通过增量学习和模型自我演进开发了商品理解LLM/VLM,从而以持续可控的方式提升知识生产质量。  
- • **在数百亿商品规模上的知识生产。** 我们通过人机协作快速丰富本体,通过S2D\mathsf{S}^{2}\mathsf{D}机制将其与模型参数解耦以适应本体的持续变化并缓解模型幻觉,并降低计算成本,使得百亿规模的知识生产保持高效。  
- • **统一商品隧道与应用矩阵。** 为应对跨业务场景的多样化需求,我们构建了“商品隧道”作为共享数据和服务枢纽。它通过分层服务级别维护数据新鲜度,并结合应用矩阵支持广泛的下游应用,形成一个可持续的业务生态系统。  

## 2 架构概览  

\productfontOxygen AIIC采用高内聚低耦合的模块化架构:核心能力模块解耦,可独立迭代,提高了开发效率、可维护性以及平台稳定可控演进的能力。如图3所示,该架构由五个紧密协调的模块组成:  

图3:京东Oxygen AI Item Center整体架构。\productfontOxygen AIIC将本体工程、AI商品库、商品理解LLM/VLM、商品隧道和应用矩阵集成为一个闭环工业系统。  

##### 本体工程  
本体是\productfontOxygen AIIC的知识基础,决定了商品知识质量和应用潜力的上限。通过高效的人机协作,\productfontOxygen AIIC结合了京东超过20年的专家知识与LLM/VLM的世界知识和推理能力,生成了一个高质量、全面且及时的本体。专家专注于提炼行业知识,而算法则从中学习以扩展本体构建并驱动持续演进。  

##### AI商品库  
AI商品库将商品映射到本体,并作为下游应用的商品知识来源。面对不断演进的本体和数百亿商品,我们通过构建联合优化的模型-数据-工程管线,实现了可扩展、高吞吐的生产。将本体与模型参数解耦减少了幻觉并提高了泛化能力,而计算负载降低、缓存重用和异步管线并行确保了大规模高效生产。  

##### 商品理解LLM/VLM  
商品理解LLM/VLM支持本体构建和AI商品库生产,是\productfontOxygen AIIC数据质量持续提升的基础。我们将\productfontOxygen AIIC所需的算法能力集成到一个高度泛化且可扩展的基础模型中。通过增量学习和模型自我演进,系统填补目标知识缺口并缓解灾难性遗忘,使模型能力以稳定可控的方式演进。  

##### 商品隧道  
商品隧道是连接\productfontOxygen AIIC

相似文章

jdopensource/JoyAI-Echo

Hugging Face Models Trending

京东开源发布了JoyAI-Echo(Echo-LongVideo),这是一个文本到音视频扩散模型,能够生成分钟级的多镜头视频,保持角色身份和声音一致,并利用DMD蒸馏实现了7.5倍的速度提升。

JoyAI-VL-Interaction: 实时视觉-语言交互智能

Hugging Face Daily Papers

本文介绍了JoyAI-VL-Interaction,一个开源8B规模的视觉-语言模型,可实时持续运行,自主决定何时响应或委派。它包含一个完整的可部署系统和一个训练配方,在人类评估中优于Doubao和Gemini。

Lium AI

Product Hunt

Lium AI 是一款专为处理复杂数据而设计的 AI 工具,曾在 ProductHunt 上亮相。