OneRank:面向多任务推荐的统一原生Transformer排序架构
摘要
OneRank提出了一种原生Transformer的多任务排序框架,该框架将特征编码与预测相结合,以减少任务间干扰并提升推荐系统中的排序性能。
查看缓存全文
缓存时间: 2026/06/16 11:33
Paper page - OneRank: 统一原生Transformer多任务推荐排序架构
来源:https://huggingface.co/papers/2606.16838 作者:
, , , , , , , , ,
摘要
OneRank 提出了一种原生 Transformer 的多任务学习框架,将特征编码与预测融为一体,旨在减少任务间干扰,提升推荐系统中的排序性能。
多任务学习 (https://huggingface.co/papers?q=Multi-task%20learning)(MTL)在推荐系统 (https://huggingface.co/papers?q=recommender%20systems) 中不可或缺,它能促进不同用户反馈间的互补学习。尽管现代工业实践已从 DNN 转向以 Transformer (https://huggingface.co/papers?q=Transformer) 为核心的架构来强化序列建模与扩展能力,但仍将特征编码与多任务预测分离,将 Transformer (https://huggingface.co/papers?q=Transformer) 视为与任务无关的编码器。这种设计从根本上限制了性能与可扩展性,原因是:(1) 在异质任务目标下形成信息瓶颈;(2) 引发梯度干扰,导致跷跷板现象;(3) 迫使数据流转换,使基于注意力的上下文自适应表示学习被转换为具有不兼容信息读写动态的静态前馈任务预测。我们提出 OneRank,一种原生 Transformer (https://huggingface.co/papers?q=Transformer) 的多任务排序框架,消除了编码器与预测器的分离,引入任务私有通道 (https://huggingface.co/papers?q=task-private%20channels) 用于前向表示学习与反向优化,在实现任务专门化学习的同时减少任务间干扰。在前向传播中,OneRank 通过任务条件信息选择 (https://huggingface.co/papers?q=task-conditioned%20information%20selection)、候选感知上下文化 (https://huggingface.co/papers?q=candidate-aware%20contextualization) 以及受控跨任务交互 (https://huggingface.co/papers?q=cross-task%20interaction) 自底向上学习任务特定表示。在反向传播中,跨任务梯度分离 (https://huggingface.co/papers?q=gradient%20detachment) 将任务私有的参数更新与共享知识提取模块隔离,防止负迁移 (https://huggingface.co/papers?q=negative%20transfer)。我们进一步用动态匹配评分 (https://huggingface.co/papers?q=dynamic%20matching-based%20scoring) 取代静态的任务特定 MLP 评分器,实现上下文感知的个性化排序。通过在 Transformer (https://huggingface.co/papers?q=Transformer) 堆栈内部完成多任务推理,OneRank 建立了一个统一且可扩展的架构范式。在大规模工业数据集上的离线与在线实验表明,OneRank 在保持计算效率的同时显著优于最先进的基线方法。
查看 arXiv 页面 (https://arxiv.org/abs/2606.16838) 查看 PDF (https://arxiv.org/pdf/2606.16838) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.16838)
在您的 agent 中获取这篇论文:
hf papers read 2606\.16838
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用本论文的模型0
没有模型链接到本论文
请在模型 README.md 中引用 arxiv.org/abs/2606.16838 以从此页面链接。
引用本论文的数据集0
没有数据集链接到本论文
请在数据集 README.md 中引用 arxiv.org/abs/2606.16838 以从此页面链接。
引用本论文的 Spaces0
没有 Space 链接到本论文
请在 Space README.md 中引用 arxiv.org/abs/2606.16838 以从此页面链接。
包含本论文的收藏集0
没有收藏集包含本论文
请将本论文添加到一个收藏集 (https://huggingface.co/new-collection) 中以从此页面链接。
相似文章
扩展更多,收缩更少:为推荐系统中密集扩展塑造有效秩动态
本文提出RankElastor,一种新颖的架构,通过引入参数化全混合和GLU改进的P-FFN,缓解推荐模型密集扩展中的嵌入坍塌,实现鲁棒扩展并在大规模数据集上提升性能。
基于微调Transformer的无响应项目难度建模用于多项选择题:组件表示与多任务学习
本文提出对Transformer编码器进行端到端微调,用于多项选择阅读理解项目的无响应项目难度建模,包括组件变体和多任务变体,表明多任务学习在小样本情况下有所改进。
打破过滤气泡:面向多目标推荐的语义Pareto-DQN框架
提出一种多目标强化学习框架,结合语义嵌入与Pareto-DQN,在推荐中平衡参与度、多样性和公平性,缓解过滤气泡问题。
迈向原生多模态建模:路线图
本文提出了一份正式的路线图,用于从晚期融合多模态方法向统一Transformer框架内的原生多模态建模(NMM)转型,根据输入-输出对偶性对现有模型进行分类,并系统性地讨论了架构协调、数据整理、训练方案和评估。
使用 Sentence Transformers 的多模态 Embedding 与 Reranker 模型
Sentence Transformers v5.4 引入了对多模态嵌入和重排序的支持,允许用户使用统一的 API 对文本、图像、音频和视频进行编码和比较。