internal-representations

标签

Cards List
#internal-representations

通过稀疏内部快照实现骨干均衡的扩散模型异常检测

arXiv cs.LG · 2天前 缓存

本文提出了一种公平比较基于扩散模型的异常检测器的协议,并提出了规范特征快照(CFS),该算法利用稀疏的内部激活状态实现高效的异常检测。

0 人收藏 0 人点赞
#internal-representations

@FinanceYF5: 神经网络会说英文,但它们用“形状”思考 1/ 神经网络不是按词思考 它们表面上会说英文,内部却可能是在几何空间里组织信息:曲线、环、曲面、流形。 理解 neural geometry,可能是理解、调试和控制模型的关键。

X AI KOLs Following · 2026-05-08 缓存

神经网络表面会说英文,但内部在几何空间里组织信息(曲线、环、曲面、流形),理解“神经几何”可能是理解、调试和控制模型的关键。

0 人收藏 0 人点赞
#internal-representations

超越表面统计:通过内部表示实现LLM鲁棒共形预测

arXiv cs.CL · 2026-04-20 缓存

本论文提出了一个利用内部表示而非输出层统计的LLM共形预测框架,引入层级信息(LI)评分作为非一致性度量,在分布偏移下改进有效性-效率权衡。该方法在QA基准上相比文本级基线展现出更强的对校准-部署不匹配的鲁棒性。

0 人收藏 0 人点赞
#internal-representations

从大型语言模型的序列内部离散中学习不确定性

arXiv cs.CL · 2026-04-20 缓存

本文介绍了SIVR(序列内部方差表示),一个有监督框架,通过分析隐层状态中的逐token和逐层方差模式来检测LLM中的幻觉现象,无需依赖严格的架构假设。该方法聚合完整序列方差特征来学习事实错误的时间模式,并在较小训练集上表现出更好的泛化能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈