internal-representations

#internal-representations

通过稀疏内部快照实现骨干均衡的扩散模型异常检测

arXiv cs.LG ↗ · 2天前缓存

本文提出了一种公平比较基于扩散模型的异常检测器的协议，并提出了规范特征快照（CFS），该算法利用稀疏的内部激活状态实现高效的异常检测。

0 人收藏 0 人点赞

#internal-representations

X AI KOLs Following ↗ · 2026-05-08 缓存

神经网络表面会说英文，但内部在几何空间里组织信息（曲线、环、曲面、流形），理解“神经几何”可能是理解、调试和控制模型的关键。

0 人收藏 0 人点赞

#internal-representations

arXiv cs.CL ↗ · 2026-04-20 缓存

本论文提出了一个利用内部表示而非输出层统计的LLM共形预测框架，引入层级信息（LI）评分作为非一致性度量，在分布偏移下改进有效性-效率权衡。该方法在QA基准上相比文本级基线展现出更强的对校准-部署不匹配的鲁棒性。

0 人收藏 0 人点赞

#internal-representations

arXiv cs.CL ↗ · 2026-04-20 缓存

本文介绍了SIVR（序列内部方差表示），一个有监督框架，通过分析隐层状态中的逐token和逐层方差模式来检测LLM中的幻觉现象，无需依赖严格的架构假设。该方法聚合完整序列方差特征来学习事实错误的时间模式，并在较小训练集上表现出更好的泛化能力。

0 人收藏 0 人点赞