标签
本文探讨了语言模型能否独立发现零的概念,作为分布外泛化的一种形式。研究发现,GPT-2大小的模型在测试时无法做到,但通过零的示例训练后会有显著提升,并且语言预训练减少了所需示例的数量。
本文深入探讨了具身智能的概念、思想源头(哲学、认知科学、AI机器人)和历史发展(符号主义的失败与Brooks的包容架构),分析了它与纯粹软件AI的区别及面临的挑战。
本文认为,最近声称神经网络已解决Fodor和Pylyshyn的系统性挑战的结论为时过早。作者表明,用于组合性的元学习模型在分布外泛化方面失败,甚至在分布内问题上也表现出非系统性行为,从而得出结论:该挑战仍未解决。
本文介绍了Theory of Mind Utility (ToM-U),一种通过构建Local Epistemic World Models (LEWMs)来推断他人认知状态的形式化计算层级规范。它不同于Bayesian ToM和模拟理论,提供了一种领域无关的信念推断机制,而不依赖于算法实现。
本文讨论了Transformer注意力机制中执行控制的不足,强调了Transformer在处理序列依赖关系方面的局限性。
本文开发了一个几何动力学框架,用于模拟预测性AI辅助如何通过稳定自我生成探索之前的轨迹来改变探索性认知,从而导致探索响应性降低、滞后现象以及辅助撤回后的延迟恢复。
本研究使用语言模型嵌入来量化自定步速阅读和脑电图数据中的语义关联,探讨不同实现方式如何影响阅读难度的测量指标。
本研究探讨了主动探索是否能帮助成年人克服因果推理中的“合取性缺陷”,并在blicket探测器任务中将人类表现与大语言模型进行比较。结果表明,主动探索改善了成年人的合取推理能力,尽管仍存在一些差距,而大语言模型接近人类的准确性,但探索效率较低。
一条推文重点介绍了 Chris Potts 关于大型语言模型如何学习语言结构的演讲,进一步强化了 LLM 能够捕捉句法和语义的观点。
本文提出了关于 Machine Theory of Mind 的正式定义与元模型,旨在为人工智能系统中推理他人心理状态提供结构化框架。
关于人工智能和哲学中框架问题的概述,追溯其作为逻辑型AI中一个技术问题的起源,以及心灵哲学家对其进行的更广泛重新诠释。
The Cognitive Categorical Transformer (CCT) 使用范畴理论组件增强GPT-2 Small,在匹配训练条件下在WikiText-103上实现了12%的相对困惑度降低,其中单纯消息传递贡献了84%的改进。
本文介绍了YoCausal,一个基于认知科学中的违反预期(Violation of Expectation)范式的基准,用于评估视频扩散模型是否真正理解因果关系,还是仅仅过拟合于时间模式。对13个最先进模型的评估显示,与人类级别的因果认知相比,存在显著差距。
本文介绍了SAPS(合成算法预测系统)框架,认为现代AI系统不是在思考,而是在分词并计算统计模式,并阐明了人工系统与合成系统之间的关键区别。
本文倡导将能动方法融入人工智能的感知与认知领域,重点阐述了四个关键概念:经验、行动与感知的不可分割性、自主性和具身性。研究发现与强化学习存在共鸣,但建议更广泛地整合能动思想。
本文提出了一种基于迭代状态变换和语义等价的认知过程建模的结构动力学框架,融合了动力系统、范畴论和反馈机制,将认知建模为朝着稳定解释演化的过程。
本文利用fMRI数据和多种LLM,研究了英语、中文和法语中的大脑-LLM对齐,发现训练语言主导性和类型距离(而非英语固有的优势)驱动了对齐模式。