entropy

标签

Cards List
#entropy

利用熵提升大语言模型的创意写作能力

Reddit r/LocalLLaMA · 昨天 缓存

本文介绍了一种通过修改采样过程利用熵来改进大语言模型创意写作的技术,旨在减少生成文本中常见的“大语言模型风格”。

0 人收藏 0 人点赞
#entropy

@snowboat84: 几年来我一直在思考这个问题。统计力学和AI之间的关系。统计力学用分子动力学的统计方式,复现了热力学优美的基本定理,尤其是复现了一些热力学里极为漂亮的宏观量之间的关系,比如熵、自由能,当然还有温度、压强等。 问题是,AI是否有这些热力学的宏…

X AI KOLs Timeline · 2026-06-25 缓存

这篇推文探讨了统计力学与人工智能之间的关系,并引用了一篇论文,该论文提出了机器学习系统的热力学理论,引入了温度、熵和能量等概念,将训练过程视为相变。

0 人收藏 0 人点赞
#entropy

超越熵:从令牌级分布偏差中学习以提升LLM推理

arXiv cs.AI · 2026-06-20 缓存

提出独立组合令牌(ICT)框架,利用令牌logit分布之间的Jensen-Shannon散度识别关键分支点,防止RLVR在LLM推理中的熵坍缩和熵爆炸。在Qwen模型上实现了高达14.9%的pass@4改进。

0 人收藏 0 人点赞
#entropy

@johnschulman2: PPO在LLM时代迎来了第二波,原因超出了原始论文的预期——重要性比率目标会修正由数值误差、异步训练和前向传播噪声引起的偏差——而裁剪目标通过一种我们当初发表时未知的机制影响熵(DAPO, https://arxiv.org/abs/2509.26114)

X AI KOLs Following · 2026-06-18 缓存

本文揭示了PPO和GRPO中的裁剪机制在LLM的RLVR中引入了熵偏差:低裁剪增加熵,高裁剪减少熵。作者证明,即使在随机奖励的情况下,标准裁剪也会降低熵,并表明调整低裁剪可以防止熵塌陷并促进探索。

0 人收藏 0 人点赞
#entropy

@snowboat84: 若干年前,耗散系统和非线性复杂系统在学术界和文化界曾经非常火热。要全面回顾耗散系统,不得不从非耗散的热力学说起。热力学第二定律(熵定律)说,一切都该走向混乱、走向死寂。可生命在生长,森林在演替,连数据中心里的大模型,也在不断"学"出秩序。…

X AI KOLs Timeline · 2026-06-18 缓存

这是一篇长达两万五千余字的科普文章,从熵的起源讲起,回顾了耗散系统理论的发展历程,并探讨了AI是否属于耗散系统的三层分析(硬件层、训练层、静态模型)。

0 人收藏 0 人点赞
#entropy

整合局部与全局熵的LLM不确定性量化

arXiv cs.LG · 2026-06-10 缓存

本文提出全局-局部不确定性(GLU),一种无监督单次评分方法,融合词元级局部熵与隐藏状态几何全局熵,用于LLM不确定性量化,证明两者近乎正交,共同捕捉自信但错误的失效模式。

0 人收藏 0 人点赞
#entropy

突破熵界:通过带拒绝采样的多 token 预测加速 RL 训练

Hugging Face Daily Papers · 2026-06-10 缓存

Bebop 提出了熵感知的多 token 预测,结合拒绝采样和一种新的 TV 损失,以加速 LLM 的 RL 训练,实现最高 1.8 倍的加速。该方法通过优化训练目标,解决了 RL 训练中接受率下降的问题。

0 人收藏 0 人点赞
#entropy

多智能体协作何时有效?熵的视角

arXiv cs.AI · 2026-06-08 缓存

本文从熵的视角审视多智能体系统(MAS),分析智能体内部与之间的动态。研究发现,单个智能体通常优于MAS,并引入了熵判断算法以提高MAS性能。

0 人收藏 0 人点赞
#entropy

Lobsters Hottest · 2026-06-07 缓存

一篇技术博文,探讨随机性、Linux熵以及构建一个名为morerandom的工具,该工具使用WASM插件来为系统熵池提供熵。

0 人收藏 0 人点赞
#entropy

熵作为结构先验:DiT置信空间上的对数障碍如何驱动音乐多样性与发展

Hugging Face Daily Papers · 2026-06-05 缓存

本文介绍了Eisbach对数障碍,这是一个从DiT输出空间能量分布的熵中导出的无参数权重,将其应用于Stable Audio 3的LoRA微调时,能够提升音乐多样性与主题发展,而不会导致模式坍缩。

0 人收藏 0 人点赞
#entropy

微调提升了语言模型的信息传递能力

arXiv cs.CL · 2026-06-01 缓存

本文引入冠层熵(CE⋆)来衡量语言模型中生成空间的有效大小,并发现微调将不确定性重新组织为更具信息量和语义意义的输出,使熵率与语义多样性之间的相关性几乎增加了两倍。

0 人收藏 0 人点赞
#entropy

基于熵-KL散度的令牌掩码:一种用于大型语言模型选择性微调的新方法

arXiv cs.AI · 2026-05-29 缓存

提出了 EKSFT,一种面向大型语言模型的选择性微调方法,该方法掩码具有高熵或与参考模型高KL散度的令牌,在注入任务知识的同时保留预训练分布。在数学推理基准上的实验表明,它优于标准SFT,并改进了后续的RL微调。

0 人收藏 0 人点赞
#entropy

面向LLM推理的统一数据选择

arXiv cs.CL · 2026-05-22 缓存

本文提出高熵总和(HES),这是一种无需训练的度量方法,用于为LLM训练选择高质量推理数据,并在SFT、RFT和RL等范式中得到验证。

0 人收藏 0 人点赞
#entropy

幻觉作为承诺失败:大型语言模型在知晓答案的情况下仍然犯错

arXiv cs.CL · 2026-05-22 缓存

本文研究了大型语言模型在其生成时间分布中已有正确答案时仍产生幻觉的现象。通过引入答案可用性的语义概念,作者表明16-47%的指令调优模型幻觉发生在正确概念已经表示的情况下,并且这一比例随着模型规模增加而上升。他们指出,指令调优强化了答案承诺,使得有用性和自信幻觉成为同一枚硬币的两面。

0 人收藏 0 人点赞
#entropy

大规模语言模型的概率归因

arXiv cs.CL · 2026-05-22 缓存

本文提出了一种与模型无关的基于概率的令牌归因度量,利用贝叶斯规则反转下一个令牌的对数概率,捕捉模型对令牌序列的内部表示,并通过熵分析提高可解释性。

0 人收藏 0 人点赞
#entropy

DEL:大型语言模型数值学习的数字熵损失

arXiv cs.CL · 2026-05-21 缓存

本文提出数字熵损失(DEL),一种用于大型语言模型数值学习的新型损失函数。它重新定义了熵优化,以提高数字级预测精度并处理浮点数,在数学推理基准上持续优于现有方法。

0 人收藏 0 人点赞
#entropy

维度平衡提升大规模时空预测性能

arXiv cs.LG · 2026-05-20 缓存

本文提出一个框架,利用基于熵的诊断方法来协调空间和时间特征表示,在涉及城市交通、气象和疫情数据集的大规模时空预测任务中实现了显著的精度提升。

0 人收藏 0 人点赞
#entropy

熔岩灯的徒劳:随机性的真正含义

Lobsters Hottest · 2026-05-16

一篇探讨随机性哲学与实用意义的文章,以熔岩灯作为计算中熵生成的隐喻。

0 人收藏 0 人点赞
#entropy

生产环境中的智能体出错并非因为能力不足,而是因为无人管理熵增

Reddit r/AI_Agents · 2026-05-16

反思AI智能体在生产环境中失败的原因:并非推理缺陷,而是累积的状态问题(过时的上下文、过期的令牌、冲突的记忆),强调了改进状态管理的必要性。

0 人收藏 0 人点赞
#entropy

什么是随机生成?

Lobsters Hottest · 2026-05-11 缓存

本文探讨了计算机中的伪随机数生成,重点聚焦于线性同余生成器(LCG)及其质量可视化。文章还提及了 Cloudflare 的熔岩灯等熵源,并作为基于属性的测试的前导内容。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈