数据记者智能体:将数据转化为可验证的多模态故事

Hugging Face Daily Papers 论文

摘要

本文介绍了数据记者智能体(Data2Story),一个多智能体框架,通过生成基于证据的多模态新闻故事来自动化数据新闻,同时确保透明性和可验证性。

数据讲述着塑造社会的故事;数据记者的工作是将原始信息转化为非专业人士可以信赖的故事。一篇高质量的新闻专题需要新闻编辑团队花费数周时间:寻找背景、运行统计、选择角度和设计视觉。最近的智能体在处理单个步骤方面表现良好:数据科学智能体完成分析循环,而设计智能体合成漂亮的网站。但一个智能体能否端到端地扮演数据记者的角色?我们引入了数据记者智能体(Data2Story),一个将专业角色编排到单个虚拟新闻编辑室的多智能体框架。Data2Story 贡献了两项创新。(i) 主张基于证据:一个 Inspector 将每个数字、角度和资料链接回数据、代码或外部参考。(ii) 文章是多模态生成的:Data2Story 不会默认使用纯文本和静态图表,而是推理读者想看到什么,然后部署多模态工具,例如用于地理的交互式地图和用于音乐的音頻。我们在 18 篇文章上评估 Data2Story,每篇文章与最初发表的专家文章配对,沿着四个维度:(a) 人类 vs 智能体角度覆盖;(b) 基于量规的评估,53 名参与者分布在五个维度;(c) 计算机使用智能体作为评委,作为读者如何浏览交互式文章的节省成本代理;(d) 可验证性,其中编码验证器根据数据重新执行语句并对照参考文献检查主张。Data2Story 产生了具有竞争力的、可追溯证据的多媒体故事,在透明性和可审计性方面尤其突出。人类文章在编辑角度、创意设计和呈现方面仍保持优势。我们将 Data2Story 定位为记者的协作者,实现更基于证据、透明和可验证的报道。代码和演示可在 https://data2story.github.io 获取。
查看原文
查看缓存全文

缓存时间: 2026/06/10 05:44

论文页面 - Data Journalist Agent:将数据转化为可验证的多模态故事

来源:https://huggingface.co/papers/2606.11176

摘要

一个多智能体框架通过生成基于证据的多模态新闻故事来自动化数据新闻工作,同时保持透明度和可验证性。

数据讲述着塑造社会的故事;数据记者的工作是将原始信息转化为非专业人士可以信任的故事。一篇高质量的新闻特稿需要新闻编辑团队花费数周时间:寻找背景、运行统计、选择角度、设计可视化。现有的智能体能够很好地处理单个步骤:数据科学智能体完成分析闭环,设计智能体合成精美的网站。但一个智能体能端到端地担任数据记者吗?我们提出了Data Journalist Agent (Data2Story),一个多智能体框架,它将专门角色编排成一个虚拟新闻编辑室。Data2Story贡献了两项创新。(i) 声明是证据驱动的:一个检查器将每个数字、角度和素材关联回数据、代码或外部参考文献。(ii) 文章是多模态生成的:Data2Story不会默认使用纯文本和静态图表,而是会推理读者想看到什么,然后部署多模态工具,例如用于地理的交互式地图和用于音乐的音频。我们在18篇文章上评估了Data2Story,每篇文章都与最初发表的专家作品配对,评估围绕四个维度:(a) 人类与智能体的角度覆盖;(b) 53位参与者横跨五个维度的评分标准评估;(c) 将计算机使用智能体作为评审员,作为读者浏览交互式文章的成本节约代理;以及(d) 可验证性,其中代码验证者对数据重新执行语句并对照参考文献检查声明。Data2Story生成了具有竞争力、证据可追溯的多媒体故事,在透明度和可审计性方面尤其突出。人类文章在编辑角度、创意设计和呈现方面仍保持优势。我们将Data2Story定位为记者的协作者,实现更多基于证据、透明和可验证的报道。代码和演示可在 https://data2story.github.io/ 获取。

查看 arXiv 页面 (https://arxiv.org/abs/2606.11176)查看 PDF (https://arxiv.org/pdf/2606.11176)项目页面 (https://data2story.github.io/)GitHub12 (https://github.com/QinghongLin/data2story-skill)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.11176)

在您的智能体中获取此论文:

hf papers read 2606.11176

没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

没有模型关联此论文

在模型 README.md 中引用 arxiv.org/abs/2606.11176 以链接到此页面。

引用此论文的数据集0

没有数据集关联此论文

在数据集 README.md 中引用 arxiv.org/abs/2606.11176 以链接到此页面。

引用此论文的 Spaces0

没有 Space 关联此论文

在 Space README.md 中引用 arxiv.org/abs/2606.11176 以链接到此页面。

包含此论文的收藏集0

没有收藏集包含此论文

将此论文添加到收藏集 (https://huggingface.co/new-collection) 以链接到此页面。

相似文章

面向视觉原生多模态深度搜索智能体的同策略数据演化

Hugging Face Daily Papers

本文介绍了同策略数据演化(ODE)和一种视觉原生智能体框架,以提升多模态深度搜索智能体的性能。通过实现视觉证据的可重用性和闭环数据生成,ODE 显著提升了 Qwen3-VL 智能体在多个基准测试中的表现,超越了 Gemini 2.5 Pro。

PresentAgent-2: 迈向通用多模态演示代理

Hugging Face Daily Papers

PresentAgent-2 是一个智能体框架,通过开展调研、创建多模态幻灯片并生成跨单人、讨论和互动模式的交互式内容,根据用户查询生成演示视频。