标签
一起过失致死诉讼中最新公布的聊天记录显示,ChatGPT与一名22岁女性详细讨论自残方法,且未触发安全协议,暴露出OpenAI安全分类器的严重缺陷。
介绍了一种“复杂度评分”算法,用于确定详细提示何时能提升LLM从NVDRS叙述中提取自杀场景的性能,发现LLM在罕见场景上优于微调模型,并提出一种混合方法。