model-hardening

#model-hardening

增强 Gemini 的安全保护

Google DeepMind Blog ↗ · 2025-05-20 缓存

Google DeepMind 宣布为 Gemini 推出高级安全改进措施，通过模型加固、自适应评估和分层防御机制来防御间接提示注入攻击。该方法结合了对抗场景的微调和系统级防护栏，在保持模型性能的同时构建了内在的抗御能力。

0 人收藏 0 人点赞