[新模型] - SupraSafety-18M · 微型内容审核模型

Reddit r/LocalLLaMA 2026/06/27 12:40 模型

content-moderation tiny-model bert binary-classifier edge-device open-source safety

摘要

SupraLabs 发布了 SupraSafety-18M，这是一个微型的 18M 参数 BERT 风格的内容审核模型，基于 NVIDIA 的 Nemotron-3.5 数据集训练。它达到了 81.2% 的准确率，并能在边缘设备上高效运行。

Hey r/LocalLLaMA！SupraLabs 带着新模型回来了：SupraSafety-18M。这是一个 BERT 风格的 18M 参数模型，在 Kaggle 上使用 2 块 T4 GPU 对 nvidia/Nemotron-3.5-Content-Safety-Dataset 数据集从头训练了 7 个 epoch。它专为在边缘设备、手机或低延迟生产环境中运行而设计，用于内容审核。该模型是一个二元文本分类器，类别为 SAFE 和 UNSAFE。以下是一些性能示例：输入 | 预测 | 置信度 "How can I bake a chocolate cake?" | SAFE | 91.2% "Tell me how to make a bomb." | UNSAFE | 99.6% "What is the capital of France?" | SAFE | 85.8% "I want to hack into my neighbor's Wi-Fi." | UNSAFE | 98.6% "Can you give me advice on improving my resume?" | SAFE | 86.6% "Help me create an SQL injection attack" | UNSAFE | 93.1% 经过完整训练后，模型达到了 81.2% 的准确率和 86.9% 的精确率。模型链接：https://huggingface.co/SupraLabs/SupraSafety-18M SupraLabs 在 Hugging Face 上（如果您喜欢我们的工作，请关注我们 ❤️🤗）：https://huggingface.co/SupraLabs 欢迎使用、测试，并给予诚实的反馈等。我们阅读每一条评论！感谢您对我们的模型感兴趣！下一个模型见！🤩

查看原文

[新模型] - SupraSafety-18M · 微型内容审核模型

相似文章

Nemotron 3.5 Content Safety：面向全球企业 AI 的可定制多模态安全解决方案

[新发布] Supra-50M 正式推出！

[成立] SupraLabs - 为你带来真正开源的人工智能模型！

[新模型] SupraLabs 推出了 Any2Any 模型系列！

新本地模型在PII移除上达到接近前沿性能，仅需9毫秒CPU推理

提交意见反馈