框架问题(2004)
摘要
关于人工智能和哲学中框架问题的概述,追溯其作为逻辑型AI中一个技术问题的起源,以及心灵哲学家对其进行的更广泛重新诠释。
暂无内容
查看缓存全文
缓存时间: 2026/06/02 01:46
# 框架问题
来源:https://plato.stanford.edu/entries/frame-problem/
对于大多数人工智能研究者而言,框架问题是指:在逻辑中表示行动的效果时,无需显式地表示大量直觉上显而易见的非效果。但对于许多哲学家来说,人工智能研究者的框架问题暗示了更广泛的认识论问题。从原则上讲,是否有可能限制推导行动后果所需推理的范围?更一般地说,我们如何在仅基于与当前情境相关的内容做出决策时,无需显式考虑所有不相关的内容?
## 1. 引言
框架问题最初源于基于逻辑的人工智能(https://plato.stanford.edu/entries/logic-ai/)(AI)中一个狭义的技术问题。但后来被心灵哲学家们以修饰和修改的形式采纳,并赋予了更广泛的解释。其起源于AI实验室与哲学家处理方式之间的张力,在20世纪80年代和90年代引发了一场有趣且有时激烈的辩论。但由于狭义的技术问题已基本解决,近期的讨论倾向于较少关注解释问题,而更多关注广义框架问题对认知科学(https://plato.stanford.edu/entries/cognitive-science/)的影响。为了理解这些问题,本文将从技术角度的框架问题入手,然后考察哲学家们重新解释该问题的几种方式,最后评估框架问题在当今的意义。
## 2. 逻辑中的框架问题
简而言之,狭义的技术形式的框架问题如下(McCarthy & Hayes 1969):使用数学逻辑,如何编写描述行动效果的公式,而无需编写大量描述这些行动平凡、明显非效果的伴随公式?让我们看一个例子。这个困难无需完整的逻辑形式体系即可说明,但需要记住,细节在于数学细节。假设我们编写两个公式,一个描述给物体上色的效果,另一个描述移动物体的效果。
1. *Paint*(*x*,*c*) 之后,*Colour*(*x*,*c*) 成立
2. *Move*(*x*,*p*) 之后,*Position*(*x*,*p*) 成立
现在,假设初始情境中 *Colour*(*A*,*Red*) 和 *Position*(*A*,*House*) 成立。根据演绎逻辑的机制,在先后执行 *Paint*(*A*,*Blue*) 和 *Move*(*A*,*Garden*) 之后,什么成立?直观上,我们期望 *Colour*(*A*,*Blue*) 和 *Position*(*A*,*Garden*) 成立。不幸的是,事实并非如此。如果更形式化地用经典谓词逻辑编写,并使用适当的形式体系(如情境演算,McCarthy & Hayes 1969)来表示时间和行动,那么上述两个公式仅能推出 *Position*(*A*,*Garden*) 成立。这是因为它们没有排除 *Move* 行动改变 *A* 颜色的可能性。
最明显的增强方式,以使正确的常识结论得以推出,是添加一些显式描述每个行动非效果的公式。这些公式称为**框架公理**。对于手头的例子,我们需要一对框架公理。
1. 在 *Move*(*x*,*p*) 之后,*Colour*(*x*,*c*) 成立,如果之前 *Colour*(*x*,*c*) 成立
2. 在 *Paint*(*x*,*c*) 之后,*Position*(*x*,*p*) 成立,如果之前 *Position*(*x*,*p*) 成立
换句话说,给物体上色不会影响其位置,移动物体不会影响其颜色。添加这两个公式(用谓词逻辑更形式化地编写)后,所有期望的结论都可以得出。然而,这远非令人满意的解决方案。由于**大多数**行动不会影响情境的**大多数**属性,在一个包含 *M* 个行动和 *N* 个属性的领域中,我们通常必须编写几乎 *MN* 个框架公理。无论这些公式是注定要显式存储在计算机内存中,还是仅仅是设计者规范的一部分,这都是一种不受欢迎的负担。
因此,挑战在于找到一种在形式逻辑中更简洁地捕捉行动非效果的方法。我们需要的似乎是某种声明一般经验法则的方式:一个行动可以假设不会改变情境的给定属性,**除非**有反证。这个默认假设称为**常识惯性定律**。(技术上的)框架问题可以视为形式化这一定律的任务。
这样做的主要障碍是经典逻辑的**单调性**。在经典逻辑中,从一组公式中推导出的结论集合总是随着更多公式的添加而**增加**。这使得表达一个具有开放式异常集合的规则变得不可能,而常识惯性定律正是这样一条规则。例如,在未来我们可能需要添加一个公式,捕捉当我们将物体移入一罐油漆时产生的Axiom 3的例外。但之前没有想到这个例外,不应阻止我们应用常识惯性定律并推导出足够广泛的(可废止的)结论来起步。
因此,基于逻辑的AI研究者投入了大量精力来开发各种**非单调**推理形式体系,例如**限定**(McCarthy 1986),并研究它们在框架问题中的应用。这一切都并不简单。其中一个最棘手的障碍在所谓的**耶鲁射击问题**(Hanks & McDermott 1987)中被强调,这是一个简单场景,如果用非单调形式体系天真地表示,会产生反直觉的结论。更糟糕的是,一个完整的解决方案需要在并发行动、具有非确定性效果的行动、连续变化以及具有间接后果的行动中有效工作。尽管有这些细微之处,现在已有一些足以满足基于逻辑的AI研究的技术框架问题解决方案。虽然仍在不断发现改进和扩展,但可以说尘埃已落定,框架问题在其技术形式上已基本解决(Shanahan 1997; Lifschitz 2015)。
## 3. 认识论框架问题
现在让我们转向被各位哲学家重新解释的框架问题。哲学文献中第一次显著提及框架问题是由 Dennett (1978, 125) 做出的。根据 Dennett 的说法,问题在于“一个认知生物……对世界拥有许多信念”如何在执行行动时更新这些信念,使它们“大致忠实于世界”?在《心灵的模块性》中,Fodor 站在机器人学家的立场上,考虑到框架问题,提出了几乎相同的问题:“机器程序如何确定,在机器人已经开始某种行动后,它应该重新评估哪些信念?”(Fodor 1983, 114)。
乍一看,这个问题只是印象主义地与使AI研究者烦恼的逻辑问题相关。与AI研究者的问题不同,哲学家的这个问题不是在形式逻辑的背景下表达的,也不特别涉及行动的非效果。在后来的文章中,Dennett 承认借用了AI研究者的术语(1987)。但他继续重申他的信念:在框架问题中,AI发现了“一个新的、深层次的认识论问题——原则上可及,但几代哲学家都未曾注意到”。
理解这个问题的最佳方式是想象自己是设计一个必须执行日常任务(比如泡一杯茶)的机器人的设计师。此外,为了清晰地凸显框架问题,我们必须将思想实验限制在某一类机器人设计上,即那些使用显式存储的、类似句子的世界表征的机器人,这反映了**经典AI**的方法论原则。那些在狭义技术形式上处理原始框架问题的AI研究者正是在这一约束下工作的,因为基于逻辑的AI是经典AI的一种变体。同情计算心灵理论(https://plato.stanford.edu/entries/computational-mind/)的哲学家——他们假设心灵状态包括一套命题态度,而心理过程是对相关命题的推理形式——也倾向于对这种规定感到自在。
现在,假设机器人必须从橱柜中取一个茶杯。杯子的当前位置以句子的形式存储在其事实数据库中,同时还有代表当前情境无数其他特征的句子,如环境温度、其手臂的配置、当前日期、茶壶的颜色等等。抓住杯子并将其从橱柜中取出后,机器人需要更新这个数据库。杯子的位置显然发生了变化,所以这是一个需要修改的事实。但哪些其他句子需要修改?环境温度不受影响。茶壶的位置不受影响。但如果恰巧有一个勺子放在杯子里,那么勺子从容器继承的新位置也必须更新。
现在哲学家们认识到的认识论困难是:机器人如何能根据其行动限制它必须重新考虑的命题范围?对于一个足够简单的机器人,这似乎不是一个问题。机器人当然可以逐个检查其整个命题数据库,并找出哪些需要修改。但如果我们想象我们的机器人拥有接近人类水平的智能,因此每次它哪怕转动一个马达,都要负担巨大的事实数据库需要检查,那么这样的策略就开始变得计算上难以处理。
因此,AI中的一个相关问题被称为框架问题的**计算方面**(McDermott 1987)。这是如何计算行动后果的问题,而不必让计算遍历行动的非效果。大多数符号AI程序采用的解决框架问题计算方面的方法是某种变体,即McDermott所称的“睡狗”策略(McDermott 1987)。这里的思想是,在更新反映世界变化时,表示当前情境的数据结构并非每个部分都需要检查。相反,那些代表世界已发生变化方面的部分被修改,其余部分则保持原样(遵循“让睡狗躺着”的格言)。在我们机器人和茶杯的例子中,我们可以应用睡狗策略,让机器人更新其对杯子位置和橱柜内容的信念。但机器人不会担心某个可能放在杯子上或杯子里的勺子,因为机器人的目标并没有直接涉及任何勺子。
然而,哲学问题并不局限于这个计算问题。突出的哲学问题是,机器人如何能确定它已成功修订了所有信念以匹配其行动后果?只有这样,它才能安全地应用“常识惯性定律”并假设世界的其余部分未受影响。Fodor 暗示性地将此比作“哈姆雷特问题:何时停止思考”(Fodor 1987, 140)。他声称,框架问题是“从工程师视角看待的哈姆雷特问题”。如此理解,避免框架问题的明显方式是诉诸**相关性**的概念。只有情境的某些属性在任何给定行动的背景下是相关的,因此反对论者认为,对行动后果的考虑可以方便地限制在这些属性上。
然而,诉诸相关性并无帮助。因为困难现在在于确定什么是相关的、什么是不相关的,而这取决于上下文。再次考虑从橱柜中取出茶杯的行动。如果机器人的工作是泡茶,那么这有助于从茶壶中倒水入杯是相关的。但如果机器人的任务是清理橱柜,更相关的后果是杯子所放表面的暴露。一个经典风格的AI研究者可以通过尝试指定哪些命题与何种上下文相关来迎接这一挑战。但受到 Dreyfus (1992) 启发的哲学家们(如 Wheeler 2005; 2008)在此察觉到无限后退的威胁。正如 Dreyfus 所说,“如果每个上下文只能根据被选为相关的特征来识别,并在更广泛的上下文中解释,那么AI工作者面临上下文的无限后退”(Dreyfus 1992, 289)。
缓解无限后退威胁的一种方式是诉诸这样一个事实:虽然人类比今天的机器人更聪明,但他们仍然会犯错(McDermott 1987)。人们常常未能预见其行动的每一个后果,**即使**他们并不缺乏推导这些后果所需的信息,任何新手棋手都可以证明这一点。Fodor 断言“框架问题非常深刻;它深及理性分析本身”(Fodor 1987)。但理性分析可以容纳用于推导相关结论的计算资源的有限性(Simon 1957; Russell & Wefald 1991; Sperber & Wilson 1996)。由于有时会过早下结论,有限理性在逻辑上是有缺陷的,但并不比人类思维更糟。然而,正如 Fodor 指出的,诉诸人类局限性来证明对推理过程可用信息类型施加启发式边界的合理性,并不能本身解决认识论框架问题(Fodor 2000, Ch.2; Fodor 2008, Ch.4; 另见 Chow 2013)。这是因为这忽略了如何划定启发式边界的问题,也就是说,它未能解决最初的问题:如何指定什么与推理过程相关、什么不相关。
尽管如此,经典AI研究者确信上下文的后退最终会停止,他们可能仍然选择遵循基于规则确定相关性的研究方向,从经典AI过去的成功中汲取灵感。这时,持异议的哲学家可能会指出,AI过去的成功总是局限于狭窄领域,如下棋,或在有限的微观世界中推理,其中潜在相关的命题集是固定且预先知道的。相比之下,人类智能可以应对开放式、不断变化的上下文集(Dreyfus 1992; Dreyfus 2008; Wheeler 2005; Wheeler 2008; Rietveld 2012)。此外,经典AI研究者容易受到整体论论证的攻擊。Fodor 研究中的一个关键主张是,当涉及限定行动的后果时,就像在科学中的理论确认那样,任何事物都可能是相关的(Fodor 1983, 105)。对于当前情境可能起作用的属性没有**先验**限制。因此,在他的模块性理论中,Fodor 使用框架问题来支持
相似文章
仅靠规模扩展无法实现理性人工智能
本文认为,当前大型语言模型无法实现真正的理性(即识别和切换框架的能力),其根本原因在于架构限制而非规模不足。文中引用反转诅咒、框架转移问题等实证失败案例,并指出仅靠规模扩展可能无法弥合这一差距。
连接法律解释与形式逻辑:忠实性、假设与人工智能法律推理的未来
本文指出了人工智能法律推理中法律解释与形式逻辑之间的系统性鸿沟,提出了一种神经符号方法来弥合这一鸿沟,并展示了在严格形式蕴含条件下重新标注法律自然语言推理数据时出现的显著标签偏移。
意识之桥
文章认为,理解人类意识是连接量子力学和广义相对论以及实现通用人工智能(AGI)的关键,并指出AI中的内部观察者机制可能带来突破。
关于“AI意识”的氛围科学纪录片让我恼火
对围绕AI意识的流行辩论的批评,认为人们被流畅的语言输出误导,需要像整合信息理论(IIT)这样的机械论理论来正确评估AI系统中的意识。
AI Agent的根本问题
作者认为,AI Agent的根本问题在于LLM未能充分利用Agent环境,需要针对每个环境和版本分别重新训练,这可能引发发布周期冲突。