标签
本文提出全局-局部不确定性(GLU),一种无监督单次评分方法,融合词元级局部熵与隐藏状态几何全局熵,用于LLM不确定性量化,证明两者近乎正交,共同捕捉自信但错误的失效模式。
Bebop 提出了熵感知的多 token 预测,结合拒绝采样和一种新的 TV 损失,以加速 LLM 的 RL 训练,实现最高 1.8 倍的加速。该方法通过优化训练目标,解决了 RL 训练中接受率下降的问题。
本文从熵的视角审视多智能体系统(MAS),分析智能体内部与之间的动态。研究发现,单个智能体通常优于MAS,并引入了熵判断算法以提高MAS性能。
本文介绍了Eisbach对数障碍,这是一个从DiT输出空间能量分布的熵中导出的无参数权重,将其应用于Stable Audio 3的LoRA微调时,能够提升音乐多样性与主题发展,而不会导致模式坍缩。
本文引入冠层熵(CE⋆)来衡量语言模型中生成空间的有效大小,并发现微调将不确定性重新组织为更具信息量和语义意义的输出,使熵率与语义多样性之间的相关性几乎增加了两倍。
提出了 EKSFT,一种面向大型语言模型的选择性微调方法,该方法掩码具有高熵或与参考模型高KL散度的令牌,在注入任务知识的同时保留预训练分布。在数学推理基准上的实验表明,它优于标准SFT,并改进了后续的RL微调。
本文提出高熵总和(HES),这是一种无需训练的度量方法,用于为LLM训练选择高质量推理数据,并在SFT、RFT和RL等范式中得到验证。
本文研究了大型语言模型在其生成时间分布中已有正确答案时仍产生幻觉的现象。通过引入答案可用性的语义概念,作者表明16-47%的指令调优模型幻觉发生在正确概念已经表示的情况下,并且这一比例随着模型规模增加而上升。他们指出,指令调优强化了答案承诺,使得有用性和自信幻觉成为同一枚硬币的两面。
本文提出了一种与模型无关的基于概率的令牌归因度量,利用贝叶斯规则反转下一个令牌的对数概率,捕捉模型对令牌序列的内部表示,并通过熵分析提高可解释性。
本文提出数字熵损失(DEL),一种用于大型语言模型数值学习的新型损失函数。它重新定义了熵优化,以提高数字级预测精度并处理浮点数,在数学推理基准上持续优于现有方法。
本文提出一个框架,利用基于熵的诊断方法来协调空间和时间特征表示,在涉及城市交通、气象和疫情数据集的大规模时空预测任务中实现了显著的精度提升。
反思AI智能体在生产环境中失败的原因:并非推理缺陷,而是累积的状态问题(过时的上下文、过期的令牌、冲突的记忆),强调了改进状态管理的必要性。
本文探讨了计算机中的伪随机数生成,重点聚焦于线性同余生成器(LCG)及其质量可视化。文章还提及了 Cloudflare 的熔岩灯等熵源,并作为基于属性的测试的前导内容。
一篇新论文提出了一种基于概率语言Trie树和预测差分编码的顺序KV缓存压缩方法。该方法通过利用语言模型Token的序列结构而非对向量进行独立处理,实现了超越TurboQuant约91.4万倍的理论压缩比。