entropy

标签

Cards List
#entropy

整合局部与全局熵的LLM不确定性量化

arXiv cs.LG · 3天前 缓存

本文提出全局-局部不确定性(GLU),一种无监督单次评分方法,融合词元级局部熵与隐藏状态几何全局熵,用于LLM不确定性量化,证明两者近乎正交,共同捕捉自信但错误的失效模式。

0 人收藏 0 人点赞
#entropy

突破熵界:通过带拒绝采样的多 token 预测加速 RL 训练

Hugging Face Daily Papers · 4天前 缓存

Bebop 提出了熵感知的多 token 预测,结合拒绝采样和一种新的 TV 损失,以加速 LLM 的 RL 训练,实现最高 1.8 倍的加速。该方法通过优化训练目标,解决了 RL 训练中接受率下降的问题。

0 人收藏 0 人点赞
#entropy

多智能体协作何时有效?熵的视角

arXiv cs.AI · 5天前 缓存

本文从熵的视角审视多智能体系统(MAS),分析智能体内部与之间的动态。研究发现,单个智能体通常优于MAS,并引入了熵判断算法以提高MAS性能。

0 人收藏 0 人点赞
#entropy

Lobsters Hottest · 6天前 缓存

一篇技术博文,探讨随机性、Linux熵以及构建一个名为morerandom的工具,该工具使用WASM插件来为系统熵池提供熵。

0 人收藏 0 人点赞
#entropy

熵作为结构先验:DiT置信空间上的对数障碍如何驱动音乐多样性与发展

Hugging Face Daily Papers · 2026-06-05 缓存

本文介绍了Eisbach对数障碍,这是一个从DiT输出空间能量分布的熵中导出的无参数权重,将其应用于Stable Audio 3的LoRA微调时,能够提升音乐多样性与主题发展,而不会导致模式坍缩。

0 人收藏 0 人点赞
#entropy

微调提升了语言模型的信息传递能力

arXiv cs.CL · 2026-06-01 缓存

本文引入冠层熵(CE⋆)来衡量语言模型中生成空间的有效大小,并发现微调将不确定性重新组织为更具信息量和语义意义的输出,使熵率与语义多样性之间的相关性几乎增加了两倍。

0 人收藏 0 人点赞
#entropy

基于熵-KL散度的令牌掩码:一种用于大型语言模型选择性微调的新方法

arXiv cs.AI · 2026-05-29 缓存

提出了 EKSFT,一种面向大型语言模型的选择性微调方法,该方法掩码具有高熵或与参考模型高KL散度的令牌,在注入任务知识的同时保留预训练分布。在数学推理基准上的实验表明,它优于标准SFT,并改进了后续的RL微调。

0 人收藏 0 人点赞
#entropy

面向LLM推理的统一数据选择

arXiv cs.CL · 2026-05-22 缓存

本文提出高熵总和(HES),这是一种无需训练的度量方法,用于为LLM训练选择高质量推理数据,并在SFT、RFT和RL等范式中得到验证。

0 人收藏 0 人点赞
#entropy

幻觉作为承诺失败:大型语言模型在知晓答案的情况下仍然犯错

arXiv cs.CL · 2026-05-22 缓存

本文研究了大型语言模型在其生成时间分布中已有正确答案时仍产生幻觉的现象。通过引入答案可用性的语义概念,作者表明16-47%的指令调优模型幻觉发生在正确概念已经表示的情况下,并且这一比例随着模型规模增加而上升。他们指出,指令调优强化了答案承诺,使得有用性和自信幻觉成为同一枚硬币的两面。

0 人收藏 0 人点赞
#entropy

大规模语言模型的概率归因

arXiv cs.CL · 2026-05-22 缓存

本文提出了一种与模型无关的基于概率的令牌归因度量,利用贝叶斯规则反转下一个令牌的对数概率,捕捉模型对令牌序列的内部表示,并通过熵分析提高可解释性。

0 人收藏 0 人点赞
#entropy

DEL:大型语言模型数值学习的数字熵损失

arXiv cs.CL · 2026-05-21 缓存

本文提出数字熵损失(DEL),一种用于大型语言模型数值学习的新型损失函数。它重新定义了熵优化,以提高数字级预测精度并处理浮点数,在数学推理基准上持续优于现有方法。

0 人收藏 0 人点赞
#entropy

维度平衡提升大规模时空预测性能

arXiv cs.LG · 2026-05-20 缓存

本文提出一个框架,利用基于熵的诊断方法来协调空间和时间特征表示,在涉及城市交通、气象和疫情数据集的大规模时空预测任务中实现了显著的精度提升。

0 人收藏 0 人点赞
#entropy

熔岩灯的徒劳:随机性的真正含义

Lobsters Hottest · 2026-05-16

一篇探讨随机性哲学与实用意义的文章,以熔岩灯作为计算中熵生成的隐喻。

0 人收藏 0 人点赞
#entropy

生产环境中的智能体出错并非因为能力不足,而是因为无人管理熵增

Reddit r/AI_Agents · 2026-05-16

反思AI智能体在生产环境中失败的原因:并非推理缺陷,而是累积的状态问题(过时的上下文、过期的令牌、冲突的记忆),强调了改进状态管理的必要性。

0 人收藏 0 人点赞
#entropy

什么是随机生成?

Lobsters Hottest · 2026-05-11 缓存

本文探讨了计算机中的伪随机数生成,重点聚焦于线性同余生成器(LCG)及其质量可视化。文章还提及了 Cloudflare 的熔岩灯等熵源,并作为基于属性的测试的前导内容。

0 人收藏 0 人点赞
#entropy

KV缓存压缩比TurboQuant与逐向量香农极限高出900000倍

Hacker News Top · 2026-04-21 缓存

一篇新论文提出了一种基于概率语言Trie树和预测差分编码的顺序KV缓存压缩方法。该方法通过利用语言模型Token的序列结构而非对向量进行独立处理,实现了超越TurboQuant约91.4万倍的理论压缩比。

0 人收藏 0 人点赞
#entropy

衡量人工智能的自由

ML at Berkeley · 2022-10-09

本文利用强化学习探讨了人工智能代理中的“价值自由”概念,将其定义为基于 Q 值衍生出的不可预测性和熵的度量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈