BitTide
首页
最新
模型
工具
新闻
产品
论文
事件
今日日报
搜索
订阅
English
登录
dense-moe
标签
Cards
List
#dense-moe
@oneill_c: 1/ 我们微调了很多客户模型,因此我们决定系统地尝试找出一些微调的最佳实践…
X AI KOLs Following
↗
· 5天前
缓存
该帖子分享了关于微调最佳实践的系统性实验结果,一次改变一个SFT变量,涵盖密集模型和MoE模型(参数规模达235B),在四个真实客户数据集上使用自定义评估来消除混淆因素。
0 人收藏
0 人点赞
← 返回首页
意见反馈
×
提交意见反馈
感谢您的反馈!
提交