fsdp2

标签

Cards List
#fsdp2

HRM-Text: 仅用1千美元和400亿token训练,采用受大脑启发的分层潜在架构

Reddit r/singularity · 2026-05-19 缓存

HRM-Text是一个10亿参数文本生成模型,采用受大脑启发的分层循环架构,仅用400亿token和约1000美元即可实现高效预训练,大幅降低计算和数据需求,使得基础模型训练更加可及。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈