标签
本文开发了针对药物使用者的自我污名编码手册,并分析了72,115条Reddit帖子,以考察认知、情感和行为污名指标的普遍性、共现性和时间模式,发现自我污名表现为一种整合现象,行为指标通常先于核心指标出现。
本文展示了对加拿大25年来涉及警察的死亡事件新闻报道的最大规模计算分析,引入了一种新模型(PerspectiveGap),该模型量化了媒体叙事中国家官僚视角相对于平民声音的主导地位。
本文介绍了条件假设生成(Conditional Hypothesis Generation),这是一个结合研究者指定协变量的框架,用于引导基于LLM的文本分析发现有意义的子组差异,同时解决诸如层不平衡和符号反转等混杂因素。
本文讨论了在计算社会科学与人文学科应用中,需要具有认识论基础且负责任的多语言LLM。
本文提出了一种轻标注测量诊断方法,用于评估流行的文本分析方法(词典、主题模型、词嵌入、大语言模型)在创业话语测量中捕捉实质性立场与象征性修辞的能力。研究使用了80场中国国企演讲语料库,并利用同一公司不同演讲者配对的自然实验。作者发现,零样本大语言模型表现出更高的敏感性,但效应中相当一部分可能源于演讲者个人语言风格而非实质性立场。
本文介绍了阿拉伯女性与社会语料库,该语料库收集了十年来超过25万条与女性赋权和社会福祉相关的阿拉伯语Facebook帖子,并包含互动指标,可用于分析性别话语和情感倾向。
本文批评了自然语言处理(NLP)中的“代理预设”,即错误地将几何嵌入属性与社会构念等同起来。文章提出了结构效度协议(Construct Validity Protocol)和反事实中立化(Counterfactual Neutralization)方法,以确保对源自语义嵌入的社会测量进行严格的验证。