activation-parameters

标签

Cards List
#activation-parameters

@0xcherry: https://x.com/0xcherry/status/2067610347633025281

X AI KOLs Timeline · 2天前 缓存

本文分析智谱GLM-5.2性能飞跃的原因,认为其40B激活参数在扣除固定开销后提供更大有效容量,使RL后训练更有效;同时回顾中国AI模型发展史,指出大模型路线最终获胜。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈