geometric-analysis

#geometric-analysis

@dair_ai：为什么LLM的强化学习训练即使看起来步骤正确却仍然崩溃？来自Qwen背后的阿里巴巴团队的GEOALIGN指出…

X AI KOLs Following ↗ · 6天前缓存

来自Qwen背后的阿里巴巴团队的GEOALIGN指出，LLM强化学习中的不稳定性通常源于少数不良的rollout导致更新方向冲突，并提出了一种基于方向一致性来筛选rollout的轻量级方法，从而提升训练稳定性和性能。

0 人收藏 0 人点赞

#geometric-analysis

可观测模式并非解释：隐式推理模型的因果几何分析

arXiv cs.CL ↗ · 2026-06-12 缓存

本文分析了隐式推理模型（LRM），并论证隐状态中的可观测模式并非推理的因果解释；它倡导在可解释性研究中采用匹配对照和因果测试。

0 人收藏 0 人点赞

#geometric-analysis

KV缓存量化下的对齐崩溃：诊断与缓解

arXiv cs.LG ↗ · 2026-06-10 缓存

本文揭示了低比特KV缓存量化会悄无声息地破坏经过指令微调的大语言模型的安全对齐，并提出了一种诊断方法（PCR）对失效模式进行分类，以及一种无需训练的缓解方案，可恢复高达97%的丢失对齐。

0 人收藏 0 人点赞

#geometric-analysis

贡献权重：自注意力Transformer的几何分析

arXiv cs.LG ↗ · 2026-06-09 缓存

介绍贡献权重（Contribution Weights），这是一种基于投影的度量，它考虑了注意力权重、值向量的幅度和方向对齐，从而更准确地衡量Transformer大语言模型中的token重要性，揭示了注意力阱（attention sinks）的主动功能角色。

0 人收藏 0 人点赞

#geometric-analysis

角度-范数分解下的激活转向几何解释

arXiv cs.AI ↗ · 2026-06-08 缓存

本文通过将干预分解为角度和径向分量，分析了语言模型中的线性激活转向。研究发现概念主要编码在角度结构中，但范数调整对稳定性至关重要，支持球形转向方法的同时表明加性系数混淆了几何特性。

0 人收藏 0 人点赞

#geometric-analysis

反事实行为的几何视角：决策边界接近性与局部数据支撑的交互作用

arXiv cs.LG ↗ · 2026-06-04 缓存

本文通过几何视角审视机器学习模型中的反事实行为，表明预测性能相似的模型，由于决策边界接近性与局部数据支撑之间的交互作用，其反事实结果可能大相径庭。研究结果将反事实行为视为与预测性能不同的独立维度，对模型选择及反事实解释方法的可靠性具有启示意义。

0 人收藏 0 人点赞

#geometric-analysis

LLM-as-Judge的几何学：为何LLM间共识并非人类对齐

arXiv cs.CL ↗ · 2026-06-03 缓存

本文从几何角度分析了为何作为裁判的LLM彼此之间高度一致，但与人类仅弱相关，发现LLM间共识在主观评分标准上反映的是坍塌子空间，而非真正的人类对齐。基于人类数据的后验校准提高了对齐，但即使经过校准的LLM也未达到人类的可靠性。

0 人收藏 0 人点赞

#geometric-analysis

MoE专业化中的几何不对称性：功能去相关与表示重叠

arXiv cs.LG ↗ · 2026-05-19 缓存

本文提出一个Jacobian-PCA-Grassmann框架，用于分析混合专家（MoE）Transformer中专家专业化的几何结构。研究发现，专家表现出强烈的功能去相关，而其表示存在重叠，并且路由稀疏性显著影响这一几何结构。

0 人收藏 0 人点赞

#geometric-analysis

大多数注入检测器逐条打分，我做了个追踪完整会话几何轨迹的，这是实测结果

Reddit r/artificial ↗ · 2026-04-20

开发者构建了 Arc Gate——一款基于 Fisher 信息流形几何的 LLM 监控代理，可在会话层面检测提示注入攻击，通过追踪 t 值相对相变阈值 t*=1.2247 的变化，识别 Crescendo 式渐进操控，而非逐句关键词匹配。

0 人收藏 0 人点赞

#geometric-analysis

单细胞CRISPR扰动的几何一致性揭示调控架构并预测细胞应激

Hugging Face Daily Papers ↗ · 2026-04-17 缓存

# 论文页面 - 单细胞CRISPR扰动的几何一致性揭示调控架构并预测细胞应激来源：[https://huggingface.co/papers/2604.16642](https://huggingface.co/papers/2604.16642) ## 摘要尽管基因组工程在序列层面已达成卓越精度，预测扰动后细胞将占据的转录组状态仍是未解难题。单细胞CRISPR筛选可测量细胞偏离未扰动状态的程度，但这一效应幅度忽略了一个根本问题：细胞是否协同移动？若一个扰动将细胞沿共同轨迹一致推进，而另一个将其分散到表达空间各处，即使幅度相同，结果也可能截然不同。

0 人收藏 0 人点赞

geometric-analysis

提交意见反馈