information-flow

#information-flow

忠实性作为信息流：评估与训练忠实的思维链推理

arXiv cs.LG ↗ · 2026-05-26 缓存

本文提出一个框架，通过控制信息流来评估和提升思维链推理的忠实性，使用基于熵、KL散度和梯度的诊断方法，并引入训练干预措施（注意力掩码、梯度掩码、对抗扰动），使推理更加透明，减少对捷径的依赖。

0 人收藏 0 人点赞

#information-flow

X AI KOLs Timeline ↗ · 2026-05-24 缓存

推荐两个免费开源工具：TrendRadar（中文区，58k+ stars）和Horizon（英文区，4.6k+ stars），能自动抓取全网热点、AI筛选高价值内容、生成翻译与分析简报并一键推送至多种平台。

0 人收藏 0 人点赞

#information-flow

Hugging Face Daily Papers ↗ · 2026-05-20 缓存

本文提出扩散自适应路由（DAR），这是一种可学习的、时间步自适应的残差替换方法，旨在改善扩散Transformer中的跨层信息流动，从而显著加速训练并提升质量。

0 人收藏 0 人点赞

#information-flow

arXiv cs.CL ↗ · 2026-04-20 缓存

本文研究了文本到图像模型中语义信息在文本词元间的分布情况，发现信息集中程度和跨条目交互显著影响图像生成的语义对齐。作者采用修补技术证明，在编码阶段进行简单干预即可提升对齐质量。

0 人收藏 0 人点赞