phase-transition

标签

Cards List
#phase-transition

我们衡量了AI能力在模型规模扩大时如何相互作用。在3.5B以下,推理与真实性相互对抗。超过这个规模,它们协同合作。这种转变是可工程化的。(2篇论文 + 交互式仪表盘 + 7个可证伪预测)

Reddit r/artificial · 11小时前

研究人员发现了一个关键规模(约35亿参数),在该规模下,AI模型的推理与真实性之间的权衡从对抗转向合作。他们提供了一个框架、交互式仪表板以及开源引导工具,用于识别并纠正小规模下出现的错误输出。

0 人收藏 0 人点赞
#phase-transition

LoRA如何记忆?面向LLM微调的参数化记忆定律

Hugging Face Daily Papers · 2026-05-28 缓存

本文使用LoRA作为探针,研究了大语言模型中参数化记忆的定量极限,建立了幂律关系,并引入了一种名为MemFT的阈值引导优化方法,以提升记忆性能。

0 人收藏 0 人点赞
#phase-transition

大语言模型何时进行推理?基于熵相变的动力系统视角

arXiv cs.LG · 2026-05-25 缓存

本文探讨了思维链推理在何时对大语言模型有益,表明早期熵动力学能够可靠地指示推理效用,并介绍了EDRM,这是一个轻量级、无需训练的框架,可自适应选择推理策略,在保持或提升准确率的同时显著节省token。

0 人收藏 0 人点赞
#phase-transition

谎言只是一个阶段:语言模型缩放中的隐藏对齐转变

arXiv cs.LG · 2026-05-20

本文识别了语言模型缩放中的一种相变:在低于关键参数数量时,推理和真实性呈负相关,但高于该值时则相互协作。它提供了用于改进跨模型家族对齐的诊断和干预措施。

0 人收藏 0 人点赞
#phase-transition

HalluSAE:利用稀疏自编码器检测大型语言模型中的幻觉

arXiv cs.CL · 2026-04-21 缓存

北京航空航天大学等机构的研究人员提出了HalluSAE,这是一个结合稀疏自编码器与相变理论的框架。该框架通过将生成过程建模为穿越势能地形的轨迹,来检测大型语言模型(LLM)中的幻觉,并精准定位发生事实性错误的关键过渡区域。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈