标签
本文提出 TRACE,一种面向长周期 LLM 智能体的轨迹级安全检测方法,通过将完整轨迹证据压缩为潜在状态,更好地聚合分散的风险信号,在多个基准上达到最先进的准确率。
开发者发布“Job Bro”v0.1.8,这款悲观的 AI 职位评估器会标记领域错配、隐形初创风险和薪资红线,抑制过度乐观的 AI 匹配。
ICAF 是一个追踪多轮对话演化结构的框架,用于发现逐条消息评估所遗漏的缓慢累积风险。