model-probing

#model-probing

基于情景的大语言模型文化价值观探测与引导——扩展版

arXiv cs.CL ↗ · 2026-06-11 缓存

本文提出一个框架，利用基于情景的行为困境和激活引导来探测和引导大语言模型中的潜在文化价值观，应用于三个模型和四种文化，发现可引导性差异以及文化维度之间的潜在纠缠。

0 人收藏 0 人点赞