阿拉伯女性社会赋权与福祉的受众参与:十年语料库

arXiv cs.CL 论文

摘要

本文介绍了阿拉伯女性与社会语料库,该语料库收集了十年来超过25万条与女性赋权和社会福祉相关的阿拉伯语Facebook帖子,并包含互动指标,可用于分析性别话语和情感倾向。

arXiv:2605.22204v1 公告类型:新 摘要:本文介绍了阿拉伯女性与社会语料库,该语料库收集了2013年至2024年间来自77个国家51,660个页面的252,487条公开阿拉伯语Facebook帖子,内容涉及女性赋权和社会福祉,产生了超过2.67亿次用户互动。每条帖子都包含分享、评论和情感反应等互动指标,为分析受众情绪和社会关注度提供了独特视角。数据通过自动化流水线处理,包括语言识别、规范化与元数据清洗,确保可靠性与可重复性。该语料库支持对阿拉伯语各方言中的性别话语、社会改革和情感参与进行大规模分析,适用于阿拉伯语自然语言处理、计算社会科学和数字传播研究。数据集及附带文档将根据研究申请提供。
查看原文
查看缓存全文

缓存时间: 2026/05/22 08:45

# 受众参与阿拉伯女性社会赋权与福祉:十年语料库
来源:https://arxiv.org/abs/2605.22204
查看 PDF (https://arxiv.org/pdf/2605.22204)

> 摘要:本文介绍了“阿拉伯女性与社会语料库”,这是一个跨越十年、包含 252,487 条阿拉伯语公共 Facebook 帖子的集合,内容涉及女性赋权和社会福祉。该语料库收集自 2013 年至 2024 年间 77 个国家的 51,660 个页面,产生了超过 2.67 亿次用户互动。每条帖子都包含分享、评论和情感反应等参与度指标,提供了对受众情绪和社会关注的独特视角。数据通过自动化流水线处理,包括语言识别、标准化和元数据清洗,以确保可靠性和可复现性。该语料库支持对阿拉伯方言中的性别话语、社会改革和情感参与进行大规模分析。它有助于阿拉伯语自然语言处理、计算社会科学和数字传播研究。该数据集及其附带文档将在研究申请后发布。

## 提交历史

来自:Wajdi Zaghouani [查看电子邮件](https://arxiv.org/show-email/4fdede53/2605.22204) **\[v1\]** 2026年5月21日星期四 09:10:09 UTC (427 KB)

相似文章