encoder-decoder

标签

Cards List
#encoder-decoder

大规模端到端上下文压缩

Hugging Face Daily Papers · 3天前 缓存

本文提出隐上下文语言模型(LCLMs),这是一系列编码器-解码器压缩器,通过架构搜索和大规模预训练高效处理长上下文,在准确性、速度和内存使用上优于传统KV缓存方法。

0 人收藏 0 人点赞
#encoder-decoder

Task-Routed Mixture-of-Experts 与认知评价理论在隐式情感分析中的应用

arXiv cs.CL · 2026-05-21 缓存

本文提出了一种结合认知评价理论的 Task-Routed Mixture-of-Experts 模型用于隐式情感分析,通过引入辅助任务来改善从上下文中推理情感的能力,并优于现有方法。

0 人收藏 0 人点赞
#encoder-decoder

物理信息卷积神经网络用于多孔介质流体流动

arXiv cs.LG · 2026-05-21 缓存

本文提出了一种物理信息卷积编码器-解码器网络,用于从多孔介质几何结构预测孔隙尺度速度场,并证明使用网络预测初始化格子玻尔兹曼模拟可在超过90%的情况下加速收敛。

0 人收藏 0 人点赞
#encoder-decoder

Block-Based Double Decoders

arXiv cs.LG · 2026-05-20 缓存

提出了一种基于块的雙解碼器(block-based double decoders),这是一种使用双重因果块注意力掩码的新型Transformer架构,结合了解码器仅训练效率与编码器-解码器推理效率,实现了强大的扩展性能并减少了KV缓存内存。

0 人收藏 0 人点赞
#encoder-decoder

面向MT的无参考强化学习微调:Seq2Seq视角

arXiv cs.CL · 2026-05-18 缓存

本文将组相对策略优化(GRPO)应用于编码器-解码器Seq2Seq模型,用于机器翻译微调,使用无需并行数据的无参考奖励(LaBSE和COMET-Kiwi),并在13种语言上取得了一致的改进。

0 人收藏 0 人点赞
#encoder-decoder

@lateinteraction: 猜猜NVIDIA在这里使用了什么?一种"基于注意力的编码器-解码器,可直接从其内部表示中检索…

X AI KOLs Following · 2026-05-08 缓存

NVIDIA采用了后期交互(一种稀疏注意力形式),用于基于注意力的编码器-解码器,以直接从内部表示中进行检索。

0 人收藏 0 人点赞
#encoder-decoder

内部检索:注意力模型的内在能力

Hugging Face Daily Papers · 2026-05-08 缓存

INTRA 表明,注意力模型可以直接从内部表示中进行检索,从而统一检索与生成,同时提高证据召回率和答案质量。

0 人收藏 0 人点赞
#encoder-decoder

SAM 3D Body:鲁棒的全人体网格恢复

Papers with Code Trending · 2026-02-17 缓存

SAM 3D Body 是一个可提示的3D人体网格恢复模型,采用新颖的参数化表示(MHR)和编码器-解码器架构,实现了最先进的性能并具备强泛化能力。该模型支持辅助提示,并且是开源的。

0 人收藏 0 人点赞
#encoder-decoder

T5Gemma:一种新的编码器-解码器 Gemma 模型集合

Google DeepMind Blog · 2025-10-25 缓存

Google 推出 T5Gemma,这是一组新的编码器-解码器模型,基于 Gemma 2 纯解码器架构改进而来,在摘要和翻译等任务上提供了更好的质量-效率权衡。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈