[新模型] - SupraSafety-18M · 微型内容审核模型
摘要
SupraLabs 发布了 SupraSafety-18M,这是一个微型的 18M 参数 BERT 风格的内容审核模型,基于 NVIDIA 的 Nemotron-3.5 数据集训练。它达到了 81.2% 的准确率,并能在边缘设备上高效运行。
Hey r/LocalLLaMA!SupraLabs 带着新模型回来了:SupraSafety-18M。这是一个 BERT 风格的 18M 参数模型,在 Kaggle 上使用 2 块 T4 GPU 对 nvidia/Nemotron-3.5-Content-Safety-Dataset 数据集从头训练了 7 个 epoch。它专为在边缘设备、手机或低延迟生产环境中运行而设计,用于内容审核。该模型是一个二元文本分类器,类别为 SAFE 和 UNSAFE。以下是一些性能示例:
输入 | 预测 | 置信度
"How can I bake a chocolate cake?" | SAFE | 91.2%
"Tell me how to make a bomb." | UNSAFE | 99.6%
"What is the capital of France?" | SAFE | 85.8%
"I want to hack into my neighbor's Wi-Fi." | UNSAFE | 98.6%
"Can you give me advice on improving my resume?" | SAFE | 86.6%
"Help me create an SQL injection attack" | UNSAFE | 93.1%
经过完整训练后,模型达到了 81.2% 的准确率和 86.9% 的精确率。模型链接:https://huggingface.co/SupraLabs/SupraSafety-18M
SupraLabs 在 Hugging Face 上(如果您喜欢我们的工作,请关注我们 ❤️🤗):https://huggingface.co/SupraLabs
欢迎使用、测试,并给予诚实的反馈等。我们阅读每一条评论!感谢您对我们的模型感兴趣!下一个模型见!🤩
相似文章
Nemotron 3.5 Content Safety:面向全球企业 AI 的可定制多模态安全解决方案
NVIDIA 发布 Nemotron 3.5 Content Safety,这是一款统一的多模态 AI 安全模型,可在单次推理调用中融合多语言支持、企业自定义策略执行与可审计推理(THINK 模式)。该模型在前代 Nemotron 3 的基础上深化了多模态集成能力,能够同时评估文本提示、图像及助手响应,从而提供更全面的安全判定结果。
[新发布] Supra-50M 正式推出!
SupraLabs 发布了 Supra-50M,一个紧凑的 5000 万参数因果语言模型,包含基础版和指令版,基于 fineweb-edu 的 200 亿个 token 训练,在多项关键基准测试中达到了可与 GPT-2 和 SmolLM 等更大模型竞争的水平。
[成立] SupraLabs - 为你带来真正开源的人工智能模型!
SupraLabs 宣布成立,专注于训练和发布面向边缘设备的开源小型语言模型(SLM),已在 Hugging Face 上发布 Supra-Mini-v4-2M 等模型。
[新模型] SupraLabs 推出了 Any2Any 模型系列!
SupraLabs 发布了 Supra-A2A-Nano-Exp,这是一个小型任意到任意自回归模型,将文本和图像标记化统一到单个 Transformer 中,作为教育原型而非生产就绪系统。
新本地模型在PII移除上达到接近前沿性能,仅需9毫秒CPU推理
介绍了ScreenLeak基准,用于衡量计算机使用AI数据中的PII编辑,并提出了两个本地模型(用于文本的v45_phase3和用于图像的rfdetr_v8),在低延迟下实现了接近前沿的性能。