BitTide
首页
最新
模型
工具
新闻
产品
论文
事件
今日日报
搜索
订阅
English
登录
centroid-difference
标签
Cards
List
#centroid-difference
阿谀奉承的双立场评估:同意的结构与干预的界限
arXiv cs.LG
↗
· 2026-06-11
缓存
本文引入了双立场评估,以测试为减少阿谀奉承而进行的激活引导是否也会抑制与事实正确陈述的同意,发现引导方向无法有区别地针对阿谀奉承的同意与事实上的同意。
0 人收藏
0 人点赞
← 返回首页
意见反馈
×
提交意见反馈
感谢您的反馈!
提交