user-simulation

标签

Cards List
#user-simulation

RealUserSim:通过真实用户模拟弥合智能体基准测试中的现实差距

arXiv cs.AI · 2026-05-22 缓存

本文介绍了RealUserSim,一个将基于LLM的用户模拟扎根于来自14,000+真实对话的人类行为数据中的框架,旨在弥合智能体基准测试中的现实差距。研究表明,基于真实数据的模拟将行为匹配率从24.2%提升至45.3%,并揭示了协作型模拟器无法发现的失效机制。

0 人收藏 0 人点赞
#user-simulation

SalesSim:基准测试并对齐多模态语言模型作为零售用户模拟器

arXiv cs.CL · 2026-05-12 缓存

本文介绍了 SalesSim,这是一个用于评估多模态大型语言模型(MLLM)作为零售用户模拟器的框架和基准,旨在揭示角色对齐方面的不足,并提出了一种名为 UserGRPO 的新型强化学习方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈