replication-study

#replication-study

模型在哪里找到快乐？开源LLM中的情感向量

arXiv cs.CL ↗ · 2026-06-26 缓存

本文复现了开源权重大语言模型Apertus-8B和Gemma-4-E4B中'情感向量'的发现，表明价态几何结构在不同模型间可恢复，但层间出现时机存在差异。研究还发现唤醒编码对用于提取的故事语料库敏感。

0 人收藏 0 人点赞

#replication-study

arXiv cs.AI ↗ · 2026-05-18 缓存

本文实证检验了基于LLM的用户状态分类的心理测量学可靠性，发现213项指标中仅有31项满足可靠性标准，对实时自适应系统中的信任提出了质疑。

0 人收藏 0 人点赞

#replication-study

arXiv cs.CL ↗ · 2026-05-15 缓存

这项复制研究评估了DExperts在缓解LLM毒性方面的效果，发现其对显式毒性几乎完美安全，但对隐式仇恨言论效果降低，并且存在显著的延迟权衡。

0 人收藏 0 人点赞