data-preparation

标签

Cards List
#data-preparation

@tom_doerr: 从原始数据生成LLM就绪的数据集 https://github.com/OpenDCAI/DataFlow…

X AI KOLs Timeline · 2天前 缓存

DataFlow是一个开源工具,提供可视化、低代码的管道,用于从原始数据生成、清洗和准备高质量的LLM训练数据集。它包含一篇arXiv上的技术报告。

0 人收藏 0 人点赞
#data-preparation

DataFlow:面向数据为中心AI时代的统一数据准备与工作流自动化的LLM驱动框架

Papers with Code Trending · 2025-12-18 缓存

DataFlow是一个LLM驱动的框架,用于自动化数据准备和工作流工程,具备近200个可复用算子和六个领域通用流程,可在数学、代码和Text-to-SQL等任务上提升LLM性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈