regret-analysis

标签

Cards List
#regret-analysis

流式知识编译:面向时变LLM维基的主动重要性评分固定

arXiv cs.LG · 昨天 缓存

本文形式化了LLM维基的流式知识编译,引入了一个重要性信号,用于在token预算下从流式语料库中主动固定重要文档。它证明了O(√(T log K))的遗憾界,并在金融和维基百科领域验证了该方法,表明遗憾分析是一种可靠的评估指标。

0 人收藏 0 人点赞
#regret-analysis

面向上下文LLM级联的在线Pandora's Box

arXiv cs.AI · 3天前 缓存

本文介绍了一种面向自适应查询和选择LLM API的在线上下文Pandora's Box模型,提出了一种结合GMM估计与UCB风格置信区间的学习方法,并证明了维度相关的遗憾界。

0 人收藏 0 人点赞
#regret-analysis

面向移动众包中LLM微调的真实在线偏好聚合

arXiv cs.LG · 2026-05-26 缓存

提出了一种用于移动众包中LLM微调的真实在线偏好聚合机制,解决了策略性工人误报问题,并实现了次线性遗憾。

0 人收藏 0 人点赞
#regret-analysis

当行列式不够用时:私有稀有切换

arXiv cs.LG · 2026-05-25 缓存

本笔记分享了一个研究瞬间,Codex 帮助找到了私有线性赌博机中一种新的稀有切换规则,利用广义瑞利商克服了因高斯噪声导致的行列式单调性失效问题。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈