value-alignment

标签

Cards List
#value-alignment

DVMap: 通过高共识人口统计-价值映射实现细粒度多元价值对齐

arXiv cs.AI · 3天前 缓存

本文介绍了DVMap,一个用于大语言模型细粒度多元价值对齐的框架,它使用高共识的人口统计-价值映射,而非粗略的国家标签,从而在跨人口统计、跨国家和跨价值维度上实现了强的泛化能力。

0 人收藏 0 人点赞
#value-alignment

从描述性到规范性:揭示基于LLM的智能体的社会价值对齐

arXiv cs.AI · 3天前 缓存

本文提出了SoVA,一个使用GraphRAG将心理学理论转化为规范性指令,从而使基于LLM的智能体与人类社会价值观对齐的框架。在DAILYDILEMMAS基准上的实验表明,相比基于提示的基线方法有显著改进。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈