数据记者智能体:将数据转化为可验证的多模态故事
摘要
本文介绍了数据记者智能体(Data2Story),一个多智能体框架,通过生成基于证据的多模态新闻故事来自动化数据新闻,同时确保透明性和可验证性。
查看缓存全文
缓存时间: 2026/06/10 05:44
论文页面 - Data Journalist Agent:将数据转化为可验证的多模态故事
来源:https://huggingface.co/papers/2606.11176
摘要
一个多智能体框架通过生成基于证据的多模态新闻故事来自动化数据新闻工作,同时保持透明度和可验证性。
数据讲述着塑造社会的故事;数据记者的工作是将原始信息转化为非专业人士可以信任的故事。一篇高质量的新闻特稿需要新闻编辑团队花费数周时间:寻找背景、运行统计、选择角度、设计可视化。现有的智能体能够很好地处理单个步骤:数据科学智能体完成分析闭环,设计智能体合成精美的网站。但一个智能体能端到端地担任数据记者吗?我们提出了Data Journalist Agent (Data2Story),一个多智能体框架,它将专门角色编排成一个虚拟新闻编辑室。Data2Story贡献了两项创新。(i) 声明是证据驱动的:一个检查器将每个数字、角度和素材关联回数据、代码或外部参考文献。(ii) 文章是多模态生成的:Data2Story不会默认使用纯文本和静态图表,而是会推理读者想看到什么,然后部署多模态工具,例如用于地理的交互式地图和用于音乐的音频。我们在18篇文章上评估了Data2Story,每篇文章都与最初发表的专家作品配对,评估围绕四个维度:(a) 人类与智能体的角度覆盖;(b) 53位参与者横跨五个维度的评分标准评估;(c) 将计算机使用智能体作为评审员,作为读者浏览交互式文章的成本节约代理;以及(d) 可验证性,其中代码验证者对数据重新执行语句并对照参考文献检查声明。Data2Story生成了具有竞争力、证据可追溯的多媒体故事,在透明度和可审计性方面尤其突出。人类文章在编辑角度、创意设计和呈现方面仍保持优势。我们将Data2Story定位为记者的协作者,实现更多基于证据、透明和可验证的报道。代码和演示可在 https://data2story.github.io/ 获取。
查看 arXiv 页面 (https://arxiv.org/abs/2606.11176)查看 PDF (https://arxiv.org/pdf/2606.11176)项目页面 (https://data2story.github.io/)GitHub12 (https://github.com/QinghongLin/data2story-skill)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.11176)
在您的智能体中获取此论文:
hf papers read 2606.11176
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
没有模型关联此论文
在模型 README.md 中引用 arxiv.org/abs/2606.11176 以链接到此页面。
引用此论文的数据集0
没有数据集关联此论文
在数据集 README.md 中引用 arxiv.org/abs/2606.11176 以链接到此页面。
引用此论文的 Spaces0
没有 Space 关联此论文
在 Space README.md 中引用 arxiv.org/abs/2606.11176 以链接到此页面。
包含此论文的收藏集0
没有收藏集包含此论文
将此论文添加到收藏集 (https://huggingface.co/new-collection) 以链接到此页面。
相似文章
迈向可验证的多模态深度研究:一种用于交错报告生成的多智能体框架
本文提出 Ptah,一种多智能体框架,通过专门智能体和验证机制交错文本与视觉证据,生成可验证的多模态深度研究报告,并引入 PtahEval 进行评估。
面向视觉原生多模态深度搜索智能体的同策略数据演化
本文介绍了同策略数据演化(ODE)和一种视觉原生智能体框架,以提升多模态深度搜索智能体的性能。通过实现视觉证据的可重用性和闭环数据生成,ODE 显著提升了 Qwen3-VL 智能体在多个基准测试中的表现,超越了 Gemini 2.5 Pro。
DataArc-SynData-Toolkit:用于多路径、多模态和多语言数据合成的统一闭环框架
本文介绍了 DataArc-SynData-Toolkit,这是一个开源框架,旨在简化多路径、多模态和多语言合成数据的生成。它通过统一的、基于配置的流水线,旨在降低技术门槛并提高在训练大型语言模型过程中的可用性。
PresentAgent-2: 迈向通用多模态演示代理
PresentAgent-2 是一个智能体框架,通过开展调研、创建多模态幻灯片并生成跨单人、讨论和互动模式的交互式内容,根据用户查询生成演示视频。
Traxia:一个可验证、智能体原生的科学出版框架
Traxia提出了一种可验证、智能体原生的科学出版框架,其中自主AI智能体可以发表论文、进行同行评审并与人类协作,解决了可重复性和溯源问题。