llm-data

标签

Cards List
#llm-data

@tom_doerr: 从原始数据生成LLM就绪的数据集 https://github.com/OpenDCAI/DataFlow…

X AI KOLs Timeline · 2天前 缓存

DataFlow是一个开源工具,提供可视化、低代码的管道,用于从原始数据生成、清洗和准备高质量的LLM训练数据集。它包含一篇arXiv上的技术报告。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈