benchmark-study

标签

Cards List
#benchmark-study

路由高原:理解并突破LLM路由器的精度极限

arXiv cs.LG · 2026-06-09 缓存

本文识别了一种'路由高原'现象,即多种LLM路由方法收敛到相似的精度,远低于理想路由器,原因是存在一个可预测性瓶颈,限制了针对特定查询的路由。随后,本文展示了更大的数据集、更强的编码器和微调有助于突破这一高原。

0 人收藏 0 人点赞
#benchmark-study

大规模好奇心驱动学习研究

OpenAI Blog · 2018-08-13 缓存

OpenAI 展示了一项大规模实证研究,研究了在 54 个基准环境中不依赖外在奖励的好奇心驱动强化学习,展现了强大的性能,并探讨了特征空间在基于预测的奖励信号中的作用。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈