OneRank：面向多任务推荐的统一原生Transformer排序架构

Hugging Face Daily Papers 2026/06/15 00:00 论文

摘要

OneRank提出了一种原生Transformer的多任务排序框架，该框架将特征编码与预测相结合，以减少任务间干扰并提升推荐系统中的排序性能。

多任务学习（MTL）在推荐系统中至关重要，它能够对不同用户反馈进行互补学习。虽然现代工业实践已从DNN转向以Transformer为中心的架构，以增强序列建模和扩展能力，但它们仍然将特征编码与多任务预测解耦，将Transformer视为与任务无关的编码器。这种设计通过以下方式从根本上限制了性能和可扩展性：(1) 在异构任务目标下造成信息瓶颈，(2) 引发梯度干扰，导致跷跷板现象，(3) 强制数据流转换，即基于注意力的上下文自适应表示学习被转换为静态的前馈任务预测，并伴有不兼容的信息读写动态。我们提出了OneRank，这是一个原生Transformer多任务排序框架，它消除了编码器-预测器分离，并为前向表示学习和后向优化引入了任务私有通道，从而实现任务专用学习，同时减少任务间干扰。在前向传递中，OneRank通过基于任务条件的信息选择、候选感知上下文化和受控跨任务交互，自底向上学习任务特定表示。在后向传递中，跨任务梯度分离将任务私有参数更新与共享知识提取模块隔离，防止负迁移。我们进一步用基于动态匹配的评分替换静态的任务特定MLP评分器，以实现上下文感知的个性化排序。通过将多任务推理内化到Transformer堆栈中，OneRank建立了一个统一且可扩展的架构范式。在大规模工业数据集上的离线和在线实验表明，OneRank在保持计算效率的同时，显著优于最先进的基线。

查看原文

查看缓存全文

缓存时间: 2026/06/16 11:33

Paper page - OneRank: 统一原生Transformer多任务推荐排序架构

来源：https://huggingface.co/papers/2606.16838 作者：

, , , , , , , , ,

摘要

OneRank 提出了一种原生 Transformer 的多任务学习框架，将特征编码与预测融为一体，旨在减少任务间干扰，提升推荐系统中的排序性能。

多任务学习 (https://huggingface.co/papers?q=Multi-task%20learning)（MTL）在推荐系统 (https://huggingface.co/papers?q=recommender%20systems) 中不可或缺，它能促进不同用户反馈间的互补学习。尽管现代工业实践已从 DNN 转向以 Transformer (https://huggingface.co/papers?q=Transformer) 为核心的架构来强化序列建模与扩展能力，但仍将特征编码与多任务预测分离，将 Transformer (https://huggingface.co/papers?q=Transformer) 视为与任务无关的编码器。这种设计从根本上限制了性能与可扩展性，原因是：(1) 在异质任务目标下形成信息瓶颈；(2) 引发梯度干扰，导致跷跷板现象；(3) 迫使数据流转换，使基于注意力的上下文自适应表示学习被转换为具有不兼容信息读写动态的静态前馈任务预测。我们提出 OneRank，一种原生 Transformer (https://huggingface.co/papers?q=Transformer) 的多任务排序框架，消除了编码器与预测器的分离，引入任务私有通道 (https://huggingface.co/papers?q=task-private%20channels) 用于前向表示学习与反向优化，在实现任务专门化学习的同时减少任务间干扰。在前向传播中，OneRank 通过任务条件信息选择 (https://huggingface.co/papers?q=task-conditioned%20information%20selection)、候选感知上下文化 (https://huggingface.co/papers?q=candidate-aware%20contextualization) 以及受控跨任务交互 (https://huggingface.co/papers?q=cross-task%20interaction) 自底向上学习任务特定表示。在反向传播中，跨任务梯度分离 (https://huggingface.co/papers?q=gradient%20detachment) 将任务私有的参数更新与共享知识提取模块隔离，防止负迁移 (https://huggingface.co/papers?q=negative%20transfer)。我们进一步用动态匹配评分 (https://huggingface.co/papers?q=dynamic%20matching-based%20scoring) 取代静态的任务特定 MLP 评分器，实现上下文感知的个性化排序。通过在 Transformer (https://huggingface.co/papers?q=Transformer) 堆栈内部完成多任务推理，OneRank 建立了一个统一且可扩展的架构范式。在大规模工业数据集上的离线与在线实验表明，OneRank 在保持计算效率的同时显著优于最先进的基线方法。

查看 arXiv 页面 (https://arxiv.org/abs/2606.16838) 查看 PDF (https://arxiv.org/pdf/2606.16838) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.16838)

在您的 agent 中获取这篇论文：

hf papers read 2606\.16838

没有最新的 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用本论文的模型0

没有模型链接到本论文

请在模型 README.md 中引用 arxiv.org/abs/2606.16838 以从此页面链接。

引用本论文的数据集0

没有数据集链接到本论文

请在数据集 README.md 中引用 arxiv.org/abs/2606.16838 以从此页面链接。

引用本论文的 Spaces0

没有 Space 链接到本论文

请在 Space README.md 中引用 arxiv.org/abs/2606.16838 以从此页面链接。

包含本论文的收藏集0

没有收藏集包含本论文

请将本论文添加到一个收藏集 (https://huggingface.co/new-collection) 中以从此页面链接。

OneRank：面向多任务推荐的统一原生Transformer排序架构

Paper page - OneRank: 统一原生Transformer多任务推荐排序架构

摘要

引用本论文的模型0

引用本论文的数据集0

引用本论文的 Spaces0

包含本论文的收藏集0

相似文章

扩展更多，收缩更少：为推荐系统中密集扩展塑造有效秩动态

基于微调Transformer的无响应项目难度建模用于多项选择题：组件表示与多任务学习

打破过滤气泡：面向多目标推荐的语义Pareto-DQN框架

迈向原生多模态建模：路线图

使用 Sentence Transformers 的多模态 Embedding 与 Reranker 模型

提交意见反馈