标签
作者批评了让智能体记住一切的想法,并介绍了TrueMemory,这是一个将记忆转化为带有置信度和证据的特质主张的系统,旨在更好地校准智能体行为。
一位开发自主计费代理的开发者讨论了事后重建代理决策原因的困难,并描述构建了一个工具(Attova),该工具记录决策的证据、替代方案和置信度,以改进调试和人工审查。
本文研究了前沿大语言模型是否表现出个体化元认知——即超越共享信号评估自身项目级别能力的能力。通过对20个模型和六个基准进行因子分析和成对校准,作者未发现此类元认知的证据;置信度差异归结为一个单一的共享难度因子,表明模型依赖于共同的难度信号而非模型特定的自我认知。
反思许多AI模型如何更注重听起来自信而非真实,以Claude为例,它似乎更注重内部一致性和逻辑诚实。
提出了CSR,一种直接在语义空间中使用新颖的语义校准奖励来校准LLM的框架,在多个数据集上将ECE降低了高达40%,并将AUROC相较于口头化置信度基线提升了高达31%。
阿明·罗纳赫(@mitsuhiko)建议,人们在提交拉取请求时应坦诚说明自己对话题的实际理解,因为AI工具(称为'clanker')让人很容易在缺乏真正知识的情况下显得很自信。
文章讨论了一场宴会上,富二代被安排在马斯克和黄仁勋旁边却缺乏交流,对比第一代创业者如马云、张朝阳等人的自信,引发对两代企业家差异的讨论。
本文发现语言模型中的策略蒸馏(OPD)因训练与部署信息不匹配导致严重过度自信,提出校准感知框架 CaOPD,在提升性能的同时显著增强置信度可靠性。