hierarchical-recurrent

标签

Cards List
#hierarchical-recurrent

@vintcessun: 预训练原来可以这么省?1B模型、~$1000就能从零训出可用的基础模型,计算和数据量直接砍掉数百倍。核心不靠堆算力,而是层次递归架构加上潜在空间推理,配合PrefixLM packing和FA3把效率拉满。有点离谱,但论文和代码都开源了。

X AI KOLs Timeline · 12小时前 缓存

HRM-Text发布了一个1B参数的基础模型,声称仅需约$1000即可从零完成预训练,计算量和数据量减少数百倍,采用层级递归架构、潜在空间推理和PrefixLM packing等高效技术,论文与代码均已开源。

0 人收藏 0 人点赞
#hierarchical-recurrent

HRM-Text: 仅用1千美元和400亿token训练,采用受大脑启发的分层潜在架构

Reddit r/singularity · 2026-05-19 缓存

HRM-Text是一个10亿参数文本生成模型,采用受大脑启发的分层循环架构,仅用400亿token和约1000美元即可实现高效预训练,大幅降低计算和数据需求,使得基础模型训练更加可及。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈