grounded-simulation

#grounded-simulation

RealUserSim：通过真实用户模拟弥合智能体基准测试中的现实差距

arXiv cs.AI ↗ · 2026-05-22 缓存

本文介绍了RealUserSim，一个将基于LLM的用户模拟扎根于来自14,000+真实对话的人类行为数据中的框架，旨在弥合智能体基准测试中的现实差距。研究表明，基于真实数据的模拟将行为匹配率从24.2%提升至45.3%，并揭示了协作型模拟器无法发现的失效机制。

0 人收藏 0 人点赞