标签
智能体指令协议(AIP)提出将 AI 智能体技能建模为带有 schema 验证 YAML 规范的有向执行图,以取代自由形式的文本指令。实验表明,AIP 编译将 Claude Sonnet 在 27 个真实智能体任务上的平均任务奖励从 0.60 提升至 0.71,通过率从 53% 提升至 67%。
本文提出了GRID,一个端到端的框架,用于从网络威胁情报(CTI)文章中使用大型语言模型(LLM)构建安全知识图谱。引入了一种任务库奖励训练方法,无需昂贵的LLM作为裁判即可提升精确率和召回率。该方法在来自五个来源的249篇CTI文章的基准测试中取得了强劲的结果。
本文提出了 Agent-BOM,一种用于基于大语言模型(LLM)的智能体系统进行安全审计的统一图表示方法。它通过建模静态能力和动态运行时状态,解决了事后审计中的语义鸿沟问题,能够检测记忆投毒和工具误用等复杂的攻击链。