扩展社会科学研究

OpenAI Blog 工具

摘要

OpenAI 发布了 GABRIEL,这是一个开源工具包,利用 GPT 将非结构化的定性数据(文本、图像)转换为定量测量,供社会科学家和经济学家使用。该工具通过自动化重复的标注任务,使研究人员能够更高效地分析大规模的定性数据集,同时保留人类数据的丰富性。

GABRIEL 是 OpenAI 推出的一个全新开源工具包,它利用 GPT 将定性文本和图像转换为定量数据,帮助社会科学家大规模分析研究。
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:52

# 扩展社会科学研究 来源:https://openai.com/index/scaling-social-science-research/ OpenAI 一款新工具,帮助研究人员将定性数据转化为可分析的量化数值。 我们在 OpenAI 的核心工作之一是让科学家能够更快地推进研究、解决更棘手的问题。今天,我们的经济研究团队发布了 **GABRIEL**:一个开源工具包,利用 GPT 将非结构化的文本和图像转换为定量测量结果。它专为经济学家、社会科学家和数据科学家设计,用于大规模研究定性数据。 定性数据讲述了关于这个世界最丰富的故事——人们说了什么、写了什么、教了什么、争论了什么、经历了什么。它涵盖了从课程大纲、访谈记录到社交媒体帖子和照片的方方面面。这类数据数量庞大,但将其转化为严谨的证据却极其耗时,甚至常常根本不可行。在太多情况下,社会科学家不得不放弃重要的研究方向,不是因为数据不存在,而是因为根本无法分析。 GABRIEL 的构建目标就是让定性数据变得更加易于利用。研究人员可以用日常语言描述他们想测量的内容——例如“这份招聘启事对家庭友好程度如何?”——然后让工具一致地对成千上万(甚至数百万)份文档应用同一个问题,并返回每份文档的评分。这使得研究人员可以减少花在重复性数据标注上的时间,更多地投入在真正需要专业知识的工作上:选择要测量的指标、验证结果以及谨慎得出结论。 例如,GABRIEL 可以分析大量科学论文,查看其中使用了哪些具体方法以及这些方法如何随时间演变;可以检查课程大纲,衡量不同学科或技能受到的重视程度;可以提取欧洲每个小镇的结构化历史细节;也可以审视一大波客户评论,发现人们最看重什么模式。在我们的论文(在新窗口中打开)中,我们让 GPT 在许多用例上对定性数据进行标注基准测试,发现其准确度很高。 除了这类测量功能外,GABRIEL 还提供了研究人员经常需要的实用工具。这些功能包括:在列名不匹配的情况下合并数据集、智能去重、段落编码、构思新的科学理论,以及从文本中移除个人身份信息以保护隐私。 GABRIEL 现已作为开源 Python 库(在新窗口中打开)提供,并附带一个入门教程 Notebook(在新窗口中打开)。它的设计对技术背景要求极低。我们将根据学术界的反馈持续改进 GABRIEL。希望这个工具能够帮助更多研究人员将丰富的定性数据和人类故事融入他们的工作中。

相似文章

ChatGPT 用于研究

OpenAI Blog

OpenAI Academy 推出 ChatGPT 用于研究,具备 Search 和 Deep Research 功能,帮助用户通过来源整合、引文生成和结构化报告制作,从问题走向有证据支持的见解。

赋能团队更快地解锁洞察 - OpenAI

OpenAI Blog

OpenAI 开发了一个内部研究助手,它将仪表板与对话式 GPT-5 界面相结合,帮助团队在几分钟内分析数百万支持工单并生成洞察,而不是花费数周时间。该工具在整个团队中实现了数据分析民主化,允许非技术用户用自然语言提问并获得关于产品反馈、客户情感和趋势的可行性报告。

OpenAI 经济影响研究

OpenAI Blog

OpenAI 发起征集外部研究人员研究 GPT-3、ChatGPT 和 DALL-E 2 等大型语言模型的经济影响,发布研究议程并邀请博士级别的合作者研究 AI 部署对劳动力市场、不平等和政策的影响。

使用ChatGPT进行研究

OpenAI Blog

OpenAI Academy 推出了 ChatGPT 的两项研究功能:Search 用于实时网络信息检索,Deep Research 用于全面的多步骤分析。这些工具帮助用户比传统浏览更高效地从网络上收集、综合和引用信息。

使用ChatGPT分析数据

OpenAI Blog

OpenAI Academy发布了一份关于使用ChatGPT进行数据分析的指南,用户可上传文件并通过自然语言提问来探索、清理和可视化数据,无需掌握公式或仪表板专业知识。