标签
本文立场是,强化学习研究者需区分求解模拟器和将模拟器作为真实部署的代理使用,并指出若不加以区分会引发的问题。
本立场文件认为,术语“机器遗忘”在大型语言模型研究中被过度使用,主张采用更严格的术语,将其与数据集定义的删除和重训练等价性保证挂钩。
亚利桑那州立大学的Subbarao Kambhampati教授及研究人员在一篇立场论文中提出,LLM中的思维链推理制造了一种推理假象,业界需要超越昂贵的token生成,转向替代推理机制。
这篇ICML 2026 spotlight立场论文识别了图像生成对齐中的一个失败模式:美学偏好优化会覆盖用户的明确意图,将其称为'逆向对齐',并在反美学提示上进行了测试。
这篇立场论文认为,当前的人工智能范式不足以应对全球系统性风险,并提出以地球为中心的AI(PCAI)作为一种新的设计理念,将地球的互联系统视为首要关注对象。
这篇观点文章认为,整合与人类海马体记忆类似的显式记忆,对于推动LLMs迈向AGI至关重要。它借鉴神经科学,提出高阶认知功能需要超越隐式统计学习的显式记忆。
这篇立场论文认为,当前评估人工智能资源使用的方法不足,并倡导采用生命周期评估(LCA)来正确核算整个机器学习流程(从硬件制造到训练和推理)中的能源和环境成本。
这篇立场论文主张,大型语言模型应从个性化而非聚合的人类偏好中学习,指出社会选择理论中的理论局限性以及人口多样性带来的实际问题。它提出了有边界的个性化框架,在尊重个体自主性的同时维护普遍的安全约束。
这篇立场论文认为,对AI的科学理解必须超越事后分析,转而研究塑造模型行为的训练动态,这对于预测、干预和设计训练过程以获取期望特性(如能力和安全性)具有重要意义。
本立场论文认为,贝叶斯神经网络中基于采样的推理已在计算效率上与基于优化的方法持平,并即将取代后者,提供更优的不确定性量化和预测性能。
这篇立场论文主张开发‘数据探针’——来自随机过程的合成序列——以系统性地研究数据特征如何影响LLM性能,旨在超越经验启发式方法。
这篇观点论文认为,当前大型语言模型的不确定性量化方法本质上属于无监督聚类,测量的是内部一致性而非外部正确性,因此无法检测出自信的幻觉。作者主张进行范式转变,将不确定性建立在客观真理之上。
这篇立场论文认为,机器学习研究应优先考虑思想而非基准和理论保证,提出了一种“Ideas First”框架,该框架重视行为特征和定制实验,以促进公平性和科学理解。
本文立场是,将元认知作为设计原则可以构建更准确、更安全、更高效的人工智能系统,并通过联邦学习案例研究及一个实验软件框架展示了这一概念。
作者提出了两种架构,即内部KV-Sphere架构(IKSA)和背景微调(BMFT),使得LLMs能够从个人互动中持续学习,无需GPU且无灾难性遗忘。
这篇观点论文认为,包含记忆、推理、工具使用、自我改进和对齐的自主AI系统,是比单纯扩展单一模型更可预见的AGI路径,并将这些组件形式化为具有不同瓶颈的可分离轴。
本文主张,可解释性研究应基于“可操作性”进行评估,即研究成果在多大程度上能够促成具体的决策与干预措施。作者提出了一套与实际应用结果相一致的评估标准框架,以解决当前可解释性工作缺乏现实影响力的问题。
Bert Hubert分享了他为荷兰众议院关于Solvinity收购及其对DigiD影响的圆桌会议准备的立场文件,其中他警告政府不要对私营IT公司产生运营依赖。