标签
这项基准研究评估了46个大型语言模型与人类专家在编码定性人道主义数据方面的表现,发现通过结构化提示和推理,LLM可以达到与人类相当的可靠性,但对于细微主题仍需仔细监督。
Anthropic推出月度Claude用户调研,收集AI如何改变工作的定性数据,以更好理解AI的经济影响。
OpenAI 发布了 GABRIEL,这是一个开源工具包,利用 GPT 将非结构化的定性数据(文本、图像)转换为定量测量,供社会科学家和经济学家使用。该工具通过自动化重复的标注任务,使研究人员能够更高效地分析大规模的定性数据集,同时保留人类数据的丰富性。