data-mining

#data-mining

@Vtrivedy10: 有一个非常令人兴奋的未来智能体配方，用于构建低成本到无需计量的智能，应用于提取信…

X AI KOLs Following ↗ · 2026-06-15 缓存

该帖子概述了一个未来智能体配方，通过微调高效、专业化的开源模型，在LLM-as-a-judge任务上超越前沿性能，并将其应用于从追踪数据中提取信号以实现持续学习。LangChain Labs 和 FireworksAI 发布了展示这一方法的新工作。

0 人收藏 0 人点赞

#data-mining

arXiv cs.LG ↗ · 2026-06-11 缓存

本文介绍了FewRS，一种基于重采样的方法，它大幅减少了统计可靠数据挖掘所需的重采样数据集数量，在保持严格错误发现控制和高统计功效的同时，实现了高达两个数量级的加速。

0 人收藏 0 人点赞

#data-mining

arXiv cs.CL ↗ · 2026-04-20 缓存

C-Mining提出了一个无监督框架，通过利用嵌入空间中的跨语言几何错位来发现LLM训练数据中的文化种子，实现可扩展的合成数据生成以支持文化对齐，无需手动或LLM监督。

0 人收藏 0 人点赞