扩展社会科学研究

OpenAI Blog 2026/02/13 09:00 工具

open-source gpt-4 research qualitative-data social-science python-library

摘要

OpenAI 发布了 GABRIEL，这是一个开源工具包，利用 GPT 将非结构化的定性数据（文本、图像）转换为定量测量，供社会科学家和经济学家使用。该工具通过自动化重复的标注任务，使研究人员能够更高效地分析大规模的定性数据集，同时保留人类数据的丰富性。

GABRIEL 是 OpenAI 推出的一个全新开源工具包，它利用 GPT 将定性文本和图像转换为定量数据，帮助社会科学家大规模分析研究。

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:52

# 扩展社会科学研究来源：https://openai.com/index/scaling-social-science-research/ OpenAI 一款新工具，帮助研究人员将定性数据转化为可分析的量化数值。我们在 OpenAI 的核心工作之一是让科学家能够更快地推进研究、解决更棘手的问题。今天，我们的经济研究团队发布了 **GABRIEL**：一个开源工具包，利用 GPT 将非结构化的文本和图像转换为定量测量结果。它专为经济学家、社会科学家和数据科学家设计，用于大规模研究定性数据。定性数据讲述了关于这个世界最丰富的故事——人们说了什么、写了什么、教了什么、争论了什么、经历了什么。它涵盖了从课程大纲、访谈记录到社交媒体帖子和照片的方方面面。这类数据数量庞大，但将其转化为严谨的证据却极其耗时，甚至常常根本不可行。在太多情况下，社会科学家不得不放弃重要的研究方向，不是因为数据不存在，而是因为根本无法分析。 GABRIEL 的构建目标就是让定性数据变得更加易于利用。研究人员可以用日常语言描述他们想测量的内容——例如“这份招聘启事对家庭友好程度如何？”——然后让工具一致地对成千上万（甚至数百万）份文档应用同一个问题，并返回每份文档的评分。这使得研究人员可以减少花在重复性数据标注上的时间，更多地投入在真正需要专业知识的工作上：选择要测量的指标、验证结果以及谨慎得出结论。例如，GABRIEL 可以分析大量科学论文，查看其中使用了哪些具体方法以及这些方法如何随时间演变；可以检查课程大纲，衡量不同学科或技能受到的重视程度；可以提取欧洲每个小镇的结构化历史细节；也可以审视一大波客户评论，发现人们最看重什么模式。在我们的论文（在新窗口中打开）中，我们让 GPT 在许多用例上对定性数据进行标注基准测试，发现其准确度很高。除了这类测量功能外，GABRIEL 还提供了研究人员经常需要的实用工具。这些功能包括：在列名不匹配的情况下合并数据集、智能去重、段落编码、构思新的科学理论，以及从文本中移除个人身份信息以保护隐私。 GABRIEL 现已作为开源 Python 库（在新窗口中打开）提供，并附带一个入门教程 Notebook（在新窗口中打开）。它的设计对技术背景要求极低。我们将根据学术界的反馈持续改进 GABRIEL。希望这个工具能够帮助更多研究人员将丰富的定性数据和人类故事融入他们的工作中。

扩展社会科学研究

相似文章

ChatGPT 用于研究

赋能团队更快地解锁洞察 - OpenAI

OpenAI 经济影响研究

使用ChatGPT进行研究

使用ChatGPT分析数据

提交意见反馈