guardrail

标签

Cards List
#guardrail

@AdinaYakup: 蚂蚁集团 @AntLingAGI 的 SingGuard 一个多模态护栏,其中安全策略作为输入,而非固定权重。 - ...

X AI KOLs Timeline · 2天前 缓存

SingGuard 是蚂蚁集团的一款多模态护栏系统,将安全策略视为输入,支持通过自然语言进行动态调整。该产品采用 Apache 2.0 许可证,覆盖文本和图像模态。

0 人收藏 0 人点赞
#guardrail

CHILLGuard:面向细粒度中文大模型安全护栏的可扩展数据构建与模型感知偏好对齐

arXiv cs.CL · 2026-06-16 缓存

本文介绍了CHILLGuard,一个基于新的5大类、31小类风险分类体系和可扩展多阶段数据构建流程的细粒度中文大模型内容安全护栏。该模型实现了最先进的性能,在F1分数上相比现有基线提升了15.92%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈