cost-aware

标签

Cards List
#cost-aware

Translate-R1:基于强化学习的成本感知翻译工具使用

arXiv cs.CL · 3天前 缓存

Translate-R1引入了一种基于强化学习的方法,用于大语言模型中的成本感知翻译工具使用。该模型根据自身的理解能力和一个成本敏感性参数,学会决定何时翻译输入,从而在多种语言之间实现帕累托最优权衡。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈