data-mining

标签

Cards List
#data-mining

C-Mining:通过几何错位无监督发现文化数据合成的种子

arXiv cs.CL · 2026-04-20 缓存

C-Mining提出了一个无监督框架,通过利用嵌入空间中的跨语言几何错位来发现LLM训练数据中的文化种子,实现可扩展的合成数据生成以支持文化对齐,无需手动或LLM监督。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈