centrality

标签

Cards List
#centrality

中心与边缘:基于网络图中心性的预训练数据选择

arXiv cs.CL · 2026-06-11 缓存

本文介绍了WebGraphMix,一个轻量级框架,利用来自Common Crawl的网络图中心性分数来选择预训练数据,实验表明混合中心文档与边缘文档能够提升语言模型性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈