geometric-entropy-mixing

标签

Cards List
#geometric-entropy-mixing

GEM:用于最优LLM数据策展的几何熵混合

arXiv cs.LG · 2026-05-27 缓存

GEM将LLM数据策展重新表述为超球面上的变分问题,使用几何熵混合和最小化-最大化算法来发现平衡的语义簇,在数据混合策略中实现了高达1.2%平均下游准确率的最先进改进。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈