stochastic-generation

标签

Cards List
#stochastic-generation

从采样结果到能力分布:重新思考LLM路由的监督

arXiv cs.LG · 2026-06-08 缓存

本文提出DARS,一个从模型行为的分布视角构建路由监督的框架,旨在解决LLM路由中单次标签不可靠的问题。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈