replication-study

标签

Cards List
#replication-study

模型在哪里找到快乐?开源LLM中的情感向量

arXiv cs.CL · 2026-06-26 缓存

本文复现了开源权重大语言模型Apertus-8B和Gemma-4-E4B中'情感向量'的发现,表明价态几何结构在不同模型间可恢复,但层间出现时机存在差异。研究还发现唤醒编码对用于提取的故事语料库敏感。

0 人收藏 0 人点赞
#replication-study

我们能信任AI推断的用户状态吗?一个用于验证LLM在操作环境中用户状态分类可靠性的心理测量学框架

arXiv cs.AI · 2026-05-18 缓存

本文实证检验了基于LLM的用户状态分类的心理测量学可靠性,发现213项指标中仅有31项满足可靠性标准,对实时自适应系统中的信任提出了质疑。

0 人收藏 0 人点赞
#replication-study

大型语言模型中的毒性测量与缓解:一项全面的复制研究

arXiv cs.CL · 2026-05-15 缓存

这项复制研究评估了DExperts在缓解LLM毒性方面的效果,发现其对显式毒性几乎完美安全,但对隐式仇恨言论效果降低,并且存在显著的延迟权衡。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈