behavioral-modeling

标签

Cards List
#behavioral-modeling

通过行为微调对语言模型中的病理样行为模式进行建模

arXiv cs.CL · 2026-05-22 缓存

本文介绍了一个行为诱导框架,通过在结构化决策任务上微调语言模型,以引发生成分布中稳定的、上下文无关的偏移,从而模拟抑郁和偏执等病理样行为模式。

0 人收藏 0 人点赞
#behavioral-modeling

量化逆强化学习中潜在观测缺失问题

arXiv cs.LG · 2026-05-14 缓存

本文识别了逆强化学习(IRL)中观测缺失的问题,该问题可能导致专家行为看似次优,并提出了一种实用算法,用于量化使专家行为显得最优所需的最小扰动,并在合成任务、癌症治疗模拟和ICU数据上进行了验证。

0 人收藏 0 人点赞
#behavioral-modeling

行为曲线中的辛普森悖论:聚合如何扭曲用户动态的参数模型

arXiv cs.LG · 2026-05-13 缓存

这篇学术论文识别并表征了行为曲线建模中的辛普森悖论,展示了由于生存偏差,聚合如何系统性地扭曲对用户动态的参数估计。作者们在 Goodreads 和 Amazon Electronics 等数据集上验证了这种失真,并提出了分层峰值估计方法来缓解这一问题。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈