computational-social-science

#computational-social-science

在线药物使用社区中药物使用者自我污名的认知、情感和行为表达

arXiv cs.CL ↗ · 2026-06-25 缓存

本文开发了针对药物使用者的自我污名编码手册，并分析了72,115条Reddit帖子，以考察认知、情感和行为污名指标的普遍性、共现性和时间模式，发现自我污名表现为一种整合现象，行为指标通常先于核心指标出现。

0 人收藏 0 人点赞

#computational-social-science

量化25年来警务相关死亡新闻报道中的媒体呈现动态

arXiv cs.CL ↗ · 2026-06-08 缓存

本文展示了对加拿大25年来涉及警察的死亡事件新闻报道的最大规模计算分析，引入了一种新模型（PerspectiveGap），该模型量化了媒体叙事中国家官僚视角相对于平民声音的主导地位。

0 人收藏 0 人点赞

#computational-social-science

基于研究者指定协变量的LLM文本分析的条件假设生成

arXiv cs.CL ↗ · 2026-06-03 缓存

本文介绍了条件假设生成（Conditional Hypothesis Generation），这是一个结合研究者指定协变量的框架，用于引导基于LLM的文本分析发现有意义的子组差异，同时解决诸如层不平衡和符号反转等混杂因素。

0 人收藏 0 人点赞

#computational-social-science

面向计算社会科学与人文学科的负责任且基于认识论的多语言LLM

arXiv cs.CL ↗ · 2026-06-02 缓存

本文讨论了在计算社会科学与人文学科应用中，需要具有认识论基础且负责任的多语言LLM。

0 人收藏 0 人点赞

#computational-social-science

口号还是立场？面向中国国企演讲中创业话语测量的轻标注诊断方法

arXiv cs.CL ↗ · 2026-05-29 缓存

本文提出了一种轻标注测量诊断方法，用于评估流行的文本分析方法（词典、主题模型、词嵌入、大语言模型）在创业话语测量中捕捉实质性立场与象征性修辞的能力。研究使用了80场中国国企演讲语料库，并利用同一公司不同演讲者配对的自然实验。作者发现，零样本大语言模型表现出更高的敏感性，但效应中相当一部分可能源于演讲者个人语言风格而非实质性立场。

0 人收藏 0 人点赞

#computational-social-science

阿拉伯女性社会赋权与福祉的受众参与：十年语料库

arXiv cs.CL ↗ · 2026-05-22 缓存

本文介绍了阿拉伯女性与社会语料库，该语料库收集了十年来超过25万条与女性赋权和社会福祉相关的阿拉伯语Facebook帖子，并包含互动指标，可用于分析性别话语和情感倾向。

0 人收藏 0 人点赞

#computational-social-science

代理预设：从语义嵌入到有效的社会测量

arXiv cs.CL ↗ · 2026-05-11 缓存

本文批评了自然语言处理（NLP）中的“代理预设”，即错误地将几何嵌入属性与社会构念等同起来。文章提出了结构效度协议（Construct Validity Protocol）和反事实中立化（Counterfactual Neutralization）方法，以确保对源自语义嵌入的社会测量进行严格的验证。

0 人收藏 0 人点赞

computational-social-science

在线药物使用社区中药物使用者自我污名的认知、情感和行为表达

量化25年来警务相关死亡新闻报道中的媒体呈现动态

基于研究者指定协变量的LLM文本分析的条件假设生成

面向计算社会科学与人文学科的负责任且基于认识论的多语言LLM

口号还是立场？面向中国国企演讲中创业话语测量的轻标注诊断方法

阿拉伯女性社会赋权与福祉的受众参与：十年语料库

代理预设：从语义嵌入到有效的社会测量

提交意见反馈