代码合成大语言模型的危害分析框架

OpenAI Blog 2022/07/25 07:00 论文

code-synthesis llm-safety hazard-analysis codex ai-alignment risk-assessment code-generation

摘要

OpenAI 提出了一套危害分析框架，用于评估 Codex 等代码合成 LLM 相关的安全风险，通过创新的代码生成能力评估方法论来审视技术、社会、政治和经济影响。

暂无内容

查看缓存全文

缓存时间: 2026/04/20 14:46

# 代码合成大语言模型的危害分析框架来源: https://openai.com/index/a-hazard-analysis-framework-for-code-synthesis-large-language-models/ ## 摘要 Codex 是一个在各种代码库上训练的大语言模型 (LLM)，在代码合成和生成方面超越了之前的技术水平。尽管 Codex 提供了众多优势，但能够大规模生成代码的模型存在重大局限性、对齐问题、被滥用的可能性，以及可能加快某些技术领域发展进度的风险，而这些领域本身可能具有破坏稳定性或被滥用的潜力。然而，这些安全影响尚未被充分了解或仍需进一步探索。本文概述了 OpenAI 构建的危害分析框架，用于发现像 Codex 这样的模型部署可能带来的危害或安全风险，包括技术、社会、政治和经济方面的影响。该分析得到了一个新颖的评估框架的支持，该框架可以确定先进代码生成技术在规范提示的复杂性和表达性方面的能力，以及它们理解和执行这些提示相对于人类能力的能力。

代码合成大语言模型的危害分析框架

相似文章

评估代码生成模型经济影响的研究议程

评估在代码上训练的大型语言模型

在OpenAI安全运行Codex

关于语言模型安全性和滥用的经验教训

@OpenAI：切换到 Codex 的另一个理由。

提交意见反馈