hierarchical-reasoning

#hierarchical-reasoning

HRM Seems To Be Going Off Right Now

Reddit r/LocalLLaMA ↗ · 2026-05-19 缓存

Sapient Intelligence发布了HRM-Text，一个1B参数的文本生成模型，仅用0.04万亿token训练（成本约1000美元），在多个推理基准上超越训练数据多100-1000倍的更大模型，标志着AI训练新范式的开始。

0 人收藏 0 人点赞

#hierarchical-reasoning

Reddit r/LocalLLaMA ↗ · 2026-05-19 缓存

HRM-text 是 Sapient Intelligence 提出的 1B 参数分层推理语言模型，通过内部潜在空间高效思考，以极低训练成本实现超越多数同尺寸模型的性能。

0 人收藏 0 人点赞

#hierarchical-reasoning

Hugging Face Models Trending ↗ · 2026-05-17 缓存

Sapient Intelligence 发布了 HRM-Text-1B，这是一个拥有10亿参数的语言模型，采用新颖的双时间尺度循环架构（分层推理模型），以有限的参数数量提供无限的计算深度。预对齐检查点已在 Hugging Face 上开放获取。

0 人收藏 0 人点赞

#hierarchical-reasoning

arXiv cs.CL ↗ · 2026-05-15 缓存

本文提出了ProcedureVQA，一个面向视觉程序问答的基准测试，以及Chain-of-Procedure（CoP），一种分层推理框架，通过视觉线索检索相关指令，并借助语义分解细化步骤，相较于基线方法实现了最高13%的性能提升。

0 人收藏 0 人点赞