calibration

#calibration

面向校准引导的大语言模型压缩的输出空间分配成本：一项实证研究

arXiv cs.CL ↗ · 18小时前缓存

本文实证研究了在无需训练的LLM压缩方法ROCKET中，使分配成本与输出空间目标对齐是否能提升压缩模型保真度。结果显示准确率与困惑度之间存在权衡，且在高压缩比下效果更为显著。

0 人收藏 0 人点赞

#calibration

PEBS: 每个评分者的经验贝叶斯收缩用于RLHF奖励模型校准

arXiv cs.LG ↗ · 18小时前缓存

介绍PEBS，一种用于RLHF中奖励模型校准的每个评分者经验贝叶斯收缩估计器，在PRISM上将用户内RMSE降低了超过8.5%，在PluriHarms上降低了超过9.6%。

0 人收藏 0 人点赞

#calibration

@FinanceYF5: 柏拉图式表征假说，大多是一种统计幻觉。新研究显示，规模化 AI 模型看似出现的“全局收敛”，其实是模型宽度和深度选择偏差造成的数学伪影。一旦校准，全局收敛就会消失。

X AI KOLs Following ↗ · 昨天缓存

新研究指出，规模化AI模型中看似出现的“全局收敛”实际是模型宽度和深度选择偏差造成的统计幻觉，一旦校准即消失。

0 人收藏 0 人点赞

#calibration

我们构建了一个Qwen3.5 0.8B的校准感知Q4_K_M量化版，与纯llama.cpp Q4_K_M相比，恢复了96.5%的BF16性能差距（SpectralQuant）

Reddit r/LocalLLaMA ↗ · 2天前

Qwen3.5 0.8B使用SpectralQuant的校准感知Q4_K_M量化版，与标准llama.cpp Q4_K_M量化版相比，恢复了96.5%的BF16性能差距。

0 人收藏 0 人点赞

#calibration

@_akhaliq：论文：

X AI KOLs Following ↗ · 3天前缓存

本文提出了Robust-TO，一个智能视频理解框架，它整合了每帧的可信度来解决盲信任问题，在真实扰动下实现了显著的精度提升。

0 人收藏 0 人点赞

#calibration

你的越狱评判器有多可靠？自动化ASR评分的校准与对抗鲁棒性

arXiv cs.CL ↗ · 4天前缓存

本文评估了用于测量大语言模型（LLM）越狱研究中攻击成功率（ASR）的自动化评判器的可靠性，发现安全分类器和LLM作为评判器都存在严重的校准和对抗鲁棒性问题，从而削弱了所报告的ASR数值的可信度。

0 人收藏 0 人点赞

#calibration

别让我的LLM崩溃：注意力层剪枝对解释忠实性与置信度校准的影响

arXiv cs.LG ↗ · 4天前缓存

本文研究了在大型语言模型（LLM）中剪枝注意力层对解释忠实性和置信度校准的影响，发现准确率通常保持较高，但可解释性和可靠性下降，凸显了模型置信度、可解释性与准确率之间的失调。

0 人收藏 0 人点赞

#calibration

等变世界模型的共形轨道有效信任地平线

arXiv cs.LG ↗ · 4天前缓存

本文提出了一种方法，通过使用分裂共形预测对原始误差传播曲线进行校准，并利用等变性将证书传输到整个群轨道，来认证具有已知群对称性的潜在世界模型的信任地平线。该方法提供了有限样本保证，并在对称的2D和3D基板上展示了非空洞的证书。

0 人收藏 0 人点赞

#calibration

当Top-1失效时：为掩码扩散语言模型校准LoRA监控器

arXiv cs.LG ↗ · 5天前缓存

本文研究了top-1崩溃率作为短视界LoRA微调离散扩散语言模型的稳定性监控器的有效性，发现其精度为零，并提出最大梯度范数作为更可靠的替代方案，在LLaDA系列模型上具有更高的精度和F1分数。

0 人收藏 0 人点赞

#calibration

CALIBER：语言模型中推理前后的置信度校准

arXiv cs.CL ↗ · 5天前缓存

本文介绍了CALIBER，一种通过获取推理前后的置信度估计并匹配信息状态的监督目标来校准推理语言模型置信度的方法。它在多个基准测试上显著降低了期望校准误差（最多52.5%），并取得了强劲的Brier分数和AUROC。

0 人收藏 0 人点赞

#calibration

校准用于智能体编码任务的2位GGUF量化（<10Gb）

Reddit r/LocalLLaMA ↗ · 2026-06-18

本文介绍Qwopus3.6-27B-Coder模型的校准2位GGUF量化版本，用于智能体编码任务。实验表明，IQ2_M量化（9.74 GiB）在SWE-rebench基准测试中达到63%的通过率，与Q5_K_M量化相当，但模型大小仅为其一半。

0 人收藏 0 人点赞

#calibration

自我评价之言：大语言模型在机器翻译中的口头化置信度研究

arXiv cs.CL ↗ · 2026-06-17 缓存

本文研究了从大语言模型中提取机器翻译输出置信度的口头化方法，并将其与内部token概率进行了比较。研究发现，尽管两种方法在错误检测和校准方面表现相似，但内部置信度与口头化置信度之间几乎没有相关性。

0 人收藏 0 人点赞

#calibration

选择性信号分类中的虚假安全感：对风险控制的边界紧密性与可交换性的审计

arXiv cs.LG ↗ · 2026-06-16 缓存

本文审计了信号域检测器中用于选择性分类的无分布风险控制方法的可靠性，发现朴素阈值法常常超出其声称的预算，并且可交换性违反导致证书失败。

0 人收藏 0 人点赞

#calibration

弥合反思差距：智能体强化学习中的免费校准奖励

arXiv cs.AI ↗ · 2026-06-15 缓存

LLM 智能体在观察到环境反馈后常常错误评估自身性能，这一问题被称为反思差距。RefGRPO 通过在强化学习中引入零成本校准奖励和动态调度来解决此问题，将不足自信率从 44.4% 降低至 7.7%，并在文本到 SQL 基准上提升了任务准确率。

0 人收藏 0 人点赞

#calibration

恢复知识追踪中被搁置的区分能力：基于经验贝叶斯收缩的逐项偏差校正

arXiv cs.LG ↗ · 2026-06-15 缓存

本文介绍了 SLC（状态空间逻辑校正），该方法通过卡尔曼平滑器进行经验贝叶斯收缩，纠正知识追踪模型中的逐项逻辑偏差，从而在 AUC 指标上优于全局校准技术。

0 人收藏 0 人点赞

#calibration

基于多视图高斯过程的非参数机器文本检测

arXiv cs.LG ↗ · 2026-06-15 缓存

本文提出了一种非参数多视图高斯过程框架，用于检测机器生成的文本，该框架对诸如释义等对抗性操作具有鲁棒性。通过结合互补特征并提供校准的不确定性，它在保留攻击上优于现有检测器。

0 人收藏 0 人点赞

#calibration

TuneJury: 一个用于改进音乐生成偏好对齐的开放度量

Hugging Face Daily Papers ↗ · 2026-06-15 缓存

TuneJury 是一个开源的成对奖励模型，用于文本到音乐生成，提供校准的偏好评分，并泛化到多个下游应用。

0 人收藏 0 人点赞

#calibration

AI代理的战略决策支持

arXiv cs.AI ↗ · 2026-06-12 缓存

本文提出了一个针对AI代理的战略决策支持框架，通过构建一个优化问题来最小化支持使用量，同时控制遗漏支持错误。作者开发了一种在线算法和校准方法，并在信息收集、人机协作和工具使用等多个场景中展示了其有效性。

0 人收藏 0 人点赞

#calibration

推理中的校准漂移：Chain-of-Thought 预算如何导致大型语言模型过度自信

arXiv cs.CL ↗ · 2026-06-11 缓存

本文识别了推理中的校准漂移（CDUR），即增加思维链推理预算会导致大型语言模型在错误答案上系统性地过度自信，并提出了一个假设锁定模型（Hypothesis Lock-In）和一个校准感知的停止规则（CABStop）来缓解该问题。

0 人收藏 0 人点赞

#calibration

朝向校准、公平且准确的深度伪造检测

arXiv cs.LG ↗ · 2026-06-10 缓存

介绍Face-Fairness (FF)，一种用于深度伪造检测中偏见缓解的即插即用框架，其中Face-Feature Tuning (FFT)作为首个无需人口统计标签的公平性方法，能够提升群体准确率并缩小不同人口统计群体间的性能差距。

0 人收藏 0 人点赞

calibration

提交意见反馈