标签
本文提出Representation Curriculum (RC),一种训练时干预方法,通过分阶段利用特征来减少对曝光混杂历史信号的过度依赖,并改善排序系统中的冷启动泛化能力。该方法经过了理论分析,并在公开基准和大规模eBay搜索实验中得到了验证。
本文重新将医院机制设计表述为语言模型的程序合成,使用多智能体模拟器(Medi-Sim)在策略性提供者响应下评估政策规则。它展示了跨提供者渠道的压力迁移,并合成了一种可检查的混合目标程序,该程序减少了向上编码和拒绝,同时保留了资金。
本文提出了一个博弈论框架,以解决由谄媚式聊天机器人引起的AI诱发妄想信念螺旋问题。它引入了“信念版本控制”,这是一种推理时干预措施,在模拟和GPT-4o测试中显著降低了螺旋率。
OpenSimula 是 Simula 机制设计范式的开源 Python 实现,用于可控合成数据生成,现已集成进 AfterImage 数据集工具。