information-flow

标签

Cards List
#information-flow

忠实性作为信息流:评估与训练忠实的思维链推理

arXiv cs.LG · 2026-05-26 缓存

本文提出一个框架,通过控制信息流来评估和提升思维链推理的忠实性,使用基于熵、KL散度和梯度的诊断方法,并引入训练干预措施(注意力掩码、梯度掩码、对抗扰动),使推理更加透明,减少对捷径的依赖。

0 人收藏 0 人点赞
#information-flow

@WEB3_furture: 如何高效获取中英文区最有价值的信息流? 这两个是社区普遍推荐的免费开源工具,能自动抓取中英文区全网热点、AI筛选高价值内容、生成翻译+深度分析简报并一键推送 1. TrendRadar(58k+ stars) 中文区:自动抓取知乎、抖音、…

X AI KOLs Timeline · 2026-05-24 缓存

推荐两个免费开源工具:TrendRadar(中文区,58k+ stars)和Horizon(英文区,4.6k+ stars),能自动抓取全网热点、AI筛选高价值内容、生成翻译与分析简报并一键推送至多种平台。

0 人收藏 0 人点赞
#information-flow

重新思考扩散Transformer中的跨层信息路由

Hugging Face Daily Papers · 2026-05-20 缓存

本文提出扩散自适应路由(DAR),这是一种可学习的、时间步自适应的残差替换方法,旨在改善扩散Transformer中的跨层信息流动,从而显著加速训练并提升质量。

0 人收藏 0 人点赞
#information-flow

随流而动:文本到图像模型中文本词元间的信息流动

arXiv cs.CL · 2026-04-20 缓存

本文研究了文本到图像模型中语义信息在文本词元间的分布情况,发现信息集中程度和跨条目交互显著影响图像生成的语义对齐。作者采用修补技术证明,在编码阶段进行简单干预即可提升对齐质量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈