model-hardening

标签

Cards List
#model-hardening

增强 Gemini 的安全保护

Google DeepMind Blog · 2025-05-20 缓存

Google DeepMind 宣布为 Gemini 推出高级安全改进措施,通过模型加固、自适应评估和分层防御机制来防御间接提示注入攻击。该方法结合了对抗场景的微调和系统级防护栏,在保持模型性能的同时构建了内在的抗御能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈