安全护栏持续改进,但如果开源权重模型超越基于云的模型会发生什么?

Reddit r/artificial 新闻

摘要

本文探讨了开源权重模型在性能上可能超越基于云的模型的影响,同时指出安全护栏正在改进。

暂无内容
查看原文

相似文章

开源安全防护模型基准测试:全面评估

arXiv cs.CL

本文对14个开源安全防护模型进行了全面评估,在包含79331个样本的精选基准数据集上覆盖了NIST的8个安全类别,发现模型大小与检测性能无关,且Qwen Guard(4B)取得了最高的召回率。