data-quality

#data-quality

修订RVL-CDIP：量化错误与测试-训练重叠

arXiv cs.CL ↗ · 5小时前缓存

本文识别并纠正了RVL-CDIP文档分类数据集中的标签错误和测试-训练重叠，发现12%的标签错误和35%的重复。修正后提高了分类准确率和分布外泛化能力。

0 人收藏 0 人点赞

#data-quality

农业已为AI做好准备，但数据尚未跟上

MIT Technology Review ↗ · 21小时前缓存

人工智能在农业领域潜力巨大，但其效果依赖于干净且完整的数据基础；该行业面临来自物联网设备、天气数据源和土地特定变量的独特数据挑战。

0 人收藏 0 人点赞

#data-quality

@Phoenixyin13: 这篇来自Meta FAIR的最新重磅论文，旨在告诉AI行业一句重要的风向标： “大模型数据，正在迎来智能科学家时代。” 在这篇论文里，一个经过 Autodata 精准洗礼的 4B小模型，在法律推理任务上，不仅碾压了传统合成数据训练出来的…

X AI KOLs Timeline ↗ · 4天前缓存

Meta FAIR最新论文提出Autodata方法，通过智能数据科学家Agent自主生成和优化高质量数据，使4B小模型在法律推理任务上击败397B大模型，预示数据质量可弥补参数量鸿沟，为数据pipeline和scaling提供新思路。

0 人收藏 0 人点赞

#data-quality

神经软件缺陷预测模型在耦合数据质量问题下的训练动态

arXiv cs.LG ↗ · 6天前缓存

本文研究了软件缺陷预测中神经网络的训练动态如何受到类不平衡和类重叠等耦合数据质量问题的影响，并提出了一种交互感知的实证协议。

0 人收藏 0 人点赞

#data-quality

AI在分析方面越来越强，但问题仍然在于数据。

Reddit r/ArtificialInteligence ↗ · 6天前

作者认为，AI分析的质量更多受到数据获取和可靠性的限制，而非推理能力；结构化数据集能显著提升输出效果。

0 人收藏 0 人点赞

#data-quality

谷歌显示2026年世界杯错误国旗

Hacker News Top ↗ · 2026-06-20 缓存

谷歌的2026年世界杯赛程小部件显示了挪威、英格兰等国家的错误国旗，这可能是由于数据映射或资源管理不当所致，突显了自动化数据质量检查中的漏洞。

0 人收藏 0 人点赞

#data-quality

大多数AI功能失败的原因不在于模型本身

Reddit r/artificial ↗ · 2026-06-20

一个用于工单分类的AI功能失败并非模型问题，而是由于管道变更导致的数据过期，这凸显了跨团队集成监控的必要性。

0 人收藏 0 人点赞

#data-quality

一个4b模型现在在网络研究上击败30b模型，原因不在于规模

Reddit r/artificial ↗ · 2026-06-17

来自Apodex家族的一个40亿参数开放模型在网页研究基准上优于300亿参数模型，这归因于精心构建的训练数据和自我验证技术，而非原始规模，表明AI能力发展趋向更民主化。

0 人收藏 0 人点赞

#data-quality

在大型非科技公司中，AI 采用的实际进展如何？它真的具有变革性，还是只是管理层在胡说八道？

Reddit r/AI_Agents ↗ · 2026-06-16

一位 FTSE100 公司的员工对 AI 采用面临的挑战表示沮丧，指出尽管公司施压要求使用 AI，但基本的数据质量和用户采用方面仍困难重重，并质疑变革是否真的会发生。

0 人收藏 0 人点赞

#data-quality

一种用于自主上下文感知数据质量评估的智能体检索框架

arXiv cs.AI ↗ · 2026-06-15 缓存

一篇研究论文，提出了一种统一的智能体检索框架，用于自主上下文感知数据质量评估。该框架解释自然语言使用描述，通过多智能体工作流生成可执行验证逻辑，并使用可行性验证来确保可靠性。

0 人收藏 0 人点赞

#data-quality

我们是否过早信任了智能体推荐？

Reddit r/AI_Agents ↗ · 2026-06-11

一篇观点文章，质疑我们是否过度依赖自信的智能体推荐（无论是人类还是AI），而底层数据往往杂乱且不完整，建议智能体应表达不确定性。

0 人收藏 0 人点赞

#data-quality

DeMix：通过影响向量调试混合错误类型的训练数据

arXiv cs.LG ↗ · 2026-06-11 缓存

DeMix 是一个新颖的框架，通过分析影响向量来检测错误训练样本并识别其具体错误类型（标签错误、特征错误、虚假关联），在数据修复后实现了调试F1分数提升22.61%和任务性能提升9.32%。

0 人收藏 0 人点赞

#data-quality

AI智能体的执行质量在多大程度上实际上是一个数据问题？

Reddit r/AI_Agents ↗ · 2026-06-05

作者反思了为什么在演示中表现良好的AI智能体在实际工作流中经常失败，认为执行质量可能更多地与数据问题（任务示例、工具轨迹、评估集）相关，而不仅仅是推理或规划，并指出他们正在通过OpenDCAI/DataFlow项目探索这个问题。

0 人收藏 0 人点赞

#data-quality

AI智能体拥有强大的记忆能力，但毫无记忆卫生可言。六个月后会是什么样？没人谈论这一点。

Reddit r/AI_Agents ↗ · 2026-06-03

探讨了AI智能体中被忽视的记忆卫生问题——长期存储导致上下文过时且不可靠，并质疑行业是否在忽视一个即将到来的全球性问题。

0 人收藏 0 人点赞

#data-quality

检索前先修复数据

Reddit r/AI_Agents ↗ · 2026-05-30

本文认为，修复底层数据质量比改进AI代理的检索方法更为关键，并介绍了一个平台，该平台持续审计知识库，通过API作为单一事实来源。

0 人收藏 0 人点赞

#data-quality

我为中小企业构建的AI就绪检查清单（5大支柱，20个问题）

Reddit r/AI_Agents ↗ · 2026-05-30

一份供中小企业评估AI代理就绪性的检查清单，涵盖数据、集成、流程、工具和人员五大支柱，包含20个是否问题及评分指导。

0 人收藏 0 人点赞

#data-quality

@cwolferesearch: 评估不应该是静态的。我们需要随着时间的推移不断演变评估集/基准，使其保持相关性……

X AI KOLs Following ↗ · 2026-05-29

讨论了通过难度、质量和多样性细化来演进AI评估基准的必要性，并引用MMLU-Pro、MMLU-Redux、BIG-Bench Extra Hard、RealMath、MathArena和DatBench等示例。

0 人收藏 0 人点赞

#data-quality

@0xCodez: https://x.com/0xCodez/status/2058911661973454915

X AI KOLs Timeline ↗ · 2026-05-25 缓存

一份详细指南，解释构建大型语言模型的五个阶段流程，强调数据质量和工程实践比架构更为重要。

0 人收藏 0 人点赞

#data-quality

如果你的内部数据仍然一团糟，就别再试图把AI硬塞进你的MVP了。

Reddit r/AI_Agents ↗ · 2026-05-24

一位开发者主张，如果企业的底层数据基础设施很差，就应该停止将AI强行塞入最小可行产品，而是专注于用确定性代码或数据清理来解决特定瓶颈，然后再追求定制的AI集成。

0 人收藏 0 人点赞

#data-quality

我认为AI训练比人们想象的要容易得多

Reddit r/artificial ↗ · 2026-05-23

作者认为，由于廉价的GPU租赁和AI驱动的工具，AI训练如今已经广泛可及，但许多人盲目使用未经验证的低质量数据，导致结果不佳和资源浪费。

0 人收藏 0 人点赞

data-quality

提交意见反馈