dialogue-grounded

标签

Cards List
#dialogue-grounded

PolicyGuard:面向LLM代理政策遵从性的对话基础子代理验证器

Hugging Face Daily Papers · 4天前 缓存

PolicyGuard是一种子代理验证器,通过在多轮交互中提供上下文推理和对话特定反馈,增强LLM代理的政策遵从性,在tau^2-BENCH基准上取得了显著改进。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈