标签
本文通过观点论证,指出大型语言模型并非独立于世界模型的新范式,而是世界模型的一种退化特例。文章提出了一条从下一词元预测到潜空间架构(如JEPA)的连续频谱,并探讨了该路径上数据和架构层面的挑战。
本文提出了一种热力学智能度量,将智能定义为让罕见但有效的未来更有可能出现的能力。它引入了一个名为“罕见有效提升”的度量,用于量化系统相较于被动基线,产生罕见但可接受结果的频率提高了多少。
本文提出了一种智能的热力学度量,定义为'rare-valid lift',并论证了递归自模拟对于高热力学智能是必要且近乎充分的,从而使智能可以在通用尺度上衡量。
这是一篇长达两万五千余字的科普文章,从熵的起源讲起,回顾了耗散系统理论的发展历程,并探讨了AI是否属于耗散系统的三层分析(硬件层、训练层、静态模型)。
本文提出了一种基于树结构的形式化框架,用于对多智能体人机交互中的互补性进行建模,并证明了在自然条件下,互补性在回归任务中可以实现,但在分类任务中受到阻碍——这些条件涉及局部聚合规则和损失函数。