features

标签

Cards List
#features

扩展单义性:从Claude 3 Sonnet中提取可解释特征

arXiv cs.AI · 2026-05-29 缓存

本文展示稀疏自编码器能够从生产级语言模型Claude 3 Sonnet中提取可解释特征,解决了字典学习方法在扩展性方面的担忧。这些特征具有多语言、多模态特性,并涵盖欺骗、谄媚等安全相关概念,且对模型输出具有因果影响。

0 人收藏 0 人点赞
#features

@cambridgemike: 你希望群聊还有哪些其他功能?

X AI KOLs Following · 2026-05-24 缓存

用户询问群聊功能建议,提及XChat即将推出的管理员设置,该设置仅允许管理员发送消息。

0 人收藏 0 人点赞
#features

andreasjansson/clip-features

Replicate Explore · 2026-05-08 缓存

一个在Replicate上的模型,输出文本和图像的CLIP ViT-L/14特征,支持输入间的相似度计算。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈