标签
本文提出方程到行为提示和强化学习,引导大型语言模型模拟说服游戏中多样的人类决策模式,显示出改进的信念准确性和训练结果。
Edu-Theater是一种数据高效的智能体框架,利用基于LLM的生成式智能体模拟教育场景中的学习者行为。它采用了一种群体感知的点名范式,以更少的数据和计算资源推断学习者状态,实现了更高的模拟精度。
OdysSim对人类行为模拟的行为基础模型进行了系统研究,引入了Soul分类法、一个包含2140万次交互的语料库以及一种训练方法,该方法在23个基准任务中的8个上达到了最先进水平,同时生成更类人的输出。