scaling-properties

标签

Cards List
#scaling-properties

Transformer中隐式演绎推理的缩放特性

Hugging Face Daily Papers · 2026-05-05 缓存

本研究探讨了带有双向掩码的深度Transformer如何实现与显式思维链方法相媲美的隐式演绎推理。研究表明,算法对齐的模型能够在多种图拓扑结构和问题宽度上扩展推理能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈