大语言模型部署最佳实践

OpenAI Blog 新闻

摘要

Cohere、OpenAI 和 AI21 Labs 联合发布了大语言模型开发和部署的初步最佳实践,涵盖使用指南、安全措施、偏差缓解、文档、多元化团队和伦理劳动标准。

Cohere、OpenAI 和 AI21 Labs 制定了一套初步的最佳实践,适用于任何开发或部署大语言模型的组织。
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:55

# 语言模型部署的最佳实践 来源:https://openai.com/index/best-practices-for-deploying-language-models/ Cohere、OpenAI 和 AI21 Labs 制定了一套初步的最佳实践,适用于任何开发或部署大型语言模型的组织。能够读写的计算机已经出现,它们有潜力从根本上改变日常生活。人机交互的未来充满可能性和前景,但任何强大的技术都需要谨慎部署。 下面的联合声明代表了迈向解决 AI 进步所带来的全球挑战的社区建设的一步,我们鼓励其他希望参与的组织与我们联系。 我们建议了多项关键原则,以帮助大型语言模型 (LLM) 提供商减轻这项技术的风险,从而充分发挥其增强人类能力的潜力。 虽然这些原则是根据我们通过 API 提供 LLM 的经验专门制定的,但无论采用什么发布策略(例如开源或公司内部使用),我们希望它们都能有所帮助。我们预计这些建议会随着时间的推移发生重大变化,因为 LLM 的商业用途和随之而来的安全考虑都是新的且不断演变的。我们正在积极了解和解决 LLM 的限制和滥用途径,并将与更广泛的社区合作更新这些原则和实践。 我们分享这些原则,希望其他 LLM 提供商可以从中学习和采纳,并推进关于 LLM 开发和部署的公众讨论。 **发布使用指南和使用条款**,禁止对个人、社区和社会的实质性伤害,如垃圾邮件、欺诈或虚假宣传。使用指南还应说明哪些领域需要额外审查,并禁止不适当的高风险用例,例如基于受保护特征对人进行分类。 **建立系统和基础设施来执行使用指南**。这可能包括速率限制、内容过滤、生产访问前的应用程序批准、异常活动监控和其他缓解措施。 **主动减轻有害的模型行为**。最佳实践包括全面的模型评估以正确评估限制、最小化训练语料库中的潜在偏差来源,以及最小化不安全行为的技术,例如通过从人类反馈中学习。 **记录已知的弱点和漏洞**,例如偏差或生成不安全代码的能力,因为在某些情况下,任何程度的预防措施都无法完全消除意外伤害的可能性。文档还应包括特定于模型和用例的安全最佳实践。 **建立具有多元背景的团队**并征求广泛意见。需要多元视角来描述和解决语言模型在现实世界中的运作方式,如果不加制约,这些模型可能会强化偏差或对某些群体失效。 **公开披露有关 LLM 安全和滥用的经验教训**,以促进广泛采用并帮助跨行业迭代最佳实践。 **尊重语言模型供应链中的所有劳动力**。例如,提供商应对内部审查模型输出的人员的工作条件有高标准,并要求供应商遵守明确规定的标准(例如,确保标注员能够退出特定任务)。 作为 LLM 提供商,发布这些原则代表了在协作指导更安全的大型语言模型开发和部署方面迈出的第一步。我们很高兴能继续与彼此以及其他方合作,以确定其他机会来减少语言模型造成的无意伤害并防止恶意使用。 > "虽然 LLM 很有前景,但它们存在重大的固有安全问题,需要解决。这些最佳实践是最小化这些模型伤害和最大化其潜在益处的重要一步。" —Anthropic > "随着大型语言模型 (LLM) 变得越来越强大和富有表现力,风险缓解变得越来越重要。我们欢迎这些以及其他主动寻求减轻伤害并突出需要额外谨慎的领域的努力。这里概述的原则是对全球对话的重要贡献。" —John Bansemer,CyberAI 项目主任,安全与新兴技术中心 (CSET) 高级研究员 > "Google 肯定了在分析模型和训练数据以减轻伤害、偏差和误导风险方面采取综合策略的重要性。这些 AI 提供商为推动 AI 安全的原则和文档而采取的深思熟虑的一步。" —Google > "为了实现大型语言模型的前景,我们必须继续作为一个行业进行协作,并分享如何负责任地开发和部署它们同时减轻潜在风险的最佳实践。我们欢迎这些以及其他推动整个行业深思熟虑和实际行动的努力,向学术界、民间社会和政府的关键利益相关者学习并与之合作。" —Microsoft > "基础模型(如大型语言模型)的安全是一个日益增长的社会关切。我们赞扬 Cohere、OpenAI 和 AI21 Labs 从模型开发者的角度为负责任的开发和部署概述高层次原则迈出的第一步。还有很多工作要做,我们认为从学术界、行业和民间社会吸收更多声音来制定更详细的原则和社区规范是必要的。正如我们在最近的博客文章 (https://crfm.stanford.edu/2022/05/17/community-norms.html) 中所述,重要的不仅仅是最终结果,还有流程的合法性。" —Percy Liang,斯坦福基础模型研究中心 (CRFM) 主任 如果您正在开发语言模型或在努力减轻其风险,我们很想与您交流。请通过 [[email protected]](mailto:[email protected]) 与我们联系。

相似文章

关于语言模型安全性和滥用的经验教训

OpenAI Blog

OpenAI 分享了在语言模型安全性和滥用方面吸取的经验教训,讨论了衡量风险的挑战、现有基准的局限性,以及他们开发的新型毒性和政策违规评估指标。该文章还强调了对劳动力市场影响的担忧,以及继续研究大规模AI部署社会影响测量的必要性。

让AI为所有人服务,无处不在:我们的本地化方法

OpenAI Blog

OpenAI通过国家AI计划(OpenAI for Countries)宣布其AI本地化方法,使政府能够构建适应本地环境的主权AI系统,同时保持全球前沿模型水平。该公司发布了详细的模型规范指南,其中包含红线原则,以确保所有部署中的人类安全、权利和事实准确性。

通过在精选数据集上进行训练来改进语言模型行为

OpenAI Blog

OpenAI 研究表明,通过在针对特定行为价值观的小型精选数据集(<100 个示例)上进行微调,可以显著改进语言模型的行为,且效果随着模型规模增大而提高。该方法为用户提供了工具,以便根据特定应用调整模型以符合《宪章》的价值观。

网络上的大型语言模型:资源受限下的协作智能

Hugging Face Daily Papers

本文探讨了分布式大型语言模型(LLMs)如何在设备和云端之间协同工作以应对资源限制的协作智能范式。文章涵盖了垂直方向的设备-云端协作、水平方向的多智能体协作、路由策略,以及在可扩展且可信的协作式人工智能方面的开放研究挑战。