information-flow

#information-flow

从感知到决策：多模态大语言模型中听觉与视觉感知的信息流

arXiv cs.AI ↗ · 5天前缓存

本文研究了音频与视觉信息在音频-视觉大语言模型（AVLLMs）中的流动方式，揭示了AVLLMs根据输入配置采取顺序或并行路由，并且某些token在信息传输后可被丢弃以提高效率。

0 人收藏 0 人点赞

#information-flow

arXiv cs.LG ↗ · 2026-05-26 缓存

本文提出一个框架，通过控制信息流来评估和提升思维链推理的忠实性，使用基于熵、KL散度和梯度的诊断方法，并引入训练干预措施（注意力掩码、梯度掩码、对抗扰动），使推理更加透明，减少对捷径的依赖。

0 人收藏 0 人点赞

#information-flow

X AI KOLs Timeline ↗ · 2026-05-24 缓存

推荐两个免费开源工具：TrendRadar（中文区，58k+ stars）和Horizon（英文区，4.6k+ stars），能自动抓取全网热点、AI筛选高价值内容、生成翻译与分析简报并一键推送至多种平台。

0 人收藏 0 人点赞

#information-flow

Hugging Face Daily Papers ↗ · 2026-05-20 缓存

本文提出扩散自适应路由（DAR），这是一种可学习的、时间步自适应的残差替换方法，旨在改善扩散Transformer中的跨层信息流动，从而显著加速训练并提升质量。

0 人收藏 0 人点赞

#information-flow

arXiv cs.CL ↗ · 2026-04-20 缓存

本文研究了文本到图像模型中语义信息在文本词元间的分布情况，发现信息集中程度和跨条目交互显著影响图像生成的语义对齐。作者采用修补技术证明，在编码阶段进行简单干预即可提升对齐质量。

0 人收藏 0 人点赞