标签
本文提出一种基于Transformer的模型,可将德语文本的政治倾向映射到从左到右的连续频谱上,在包含德国联邦议院全体会议记录、Wahl-O-Mat、报纸和推文等多个语料库上实现了高准确率。
本研究论文分析了大型语言模型中的“政治可塑性”,发现当提供用户示例时,较新的模型展现出可靠的意识形态适应性,而较旧的模型则表现出有限或不稳定的反应。
研究人员构建了一个开源的政治坐标基准,包含14个政策领域的98个结构化问题,用于评估前沿LLM(GPT-5.3、Claude Opus 4.6、KIMI K2)。关键发现:拒绝模式与选择退出选项显著改变了模型定位。GPT-5.3在提供选择退出选项时100%拒绝回答问题,而KIMI K2虽然在其它方面表现进步立场,但在台湾/新疆问题上表现出特定主题的审查。
OpenAI 推出了一个全面的框架来定义和评估 LLM 中的政治偏见,引入了跨越 5 个偏见轴线、包含 100 个主题的 500 条提示评估。结果显示 GPT-5 模型相比之前的版本实现了 30% 的偏见减少,少于 0.01% 的生产环境中的 ChatGPT 回复存在政治偏见。
Anthropic详细介绍了其确保Claude在选举期间保持公正和安全的各项举措,包括对Opus 4.7和Sonnet 4.6的偏见评估、与外部智库的合作,以及针对虚假信息的使用政策执行。