打破概率的枷锁:Neutrosophic Logic作为大语言模型中认知不确定性的新框架

arXiv cs.AI 论文

摘要

本文研究了Neutrosophic Logic作为大语言模型中认知状态建模的框架,证明了它能够捕捉超越传统概率约束的'hyper-truth'状态,从而带来更透明、更具伦理意识的AI系统。

arXiv:2605.24053v1 Announce Type: new 摘要:大语言模型(LLMs)主要受概率框架支配,其中结果概率之和被约束为1。这种由Softmax层强加的架构限制导致了不确定性的坍缩,使得难以区分认知不确定性、悖论和模糊性。我们提出了对Neutrosophic Logic应用的实证研究,该框架将真值(T)、不确定值(I)和假值(F)视为三个独立维度,用于建模LLMs中的认知状态。我们在四个OpenAI GPT模型家族上进行了实验,涵盖五种语言现象:逻辑悖论、认知无知、模糊性、伦理矛盾和未来偶然事件,并在三种提示策略下进行:Neutrosophic提示、概率提示和熵推导提示。我们的发现表明,Neutrosophic方法通过允许T+I+F > 1(我们称之为hyper-truth状态),提供了模型内部状态的更丰富表示。在35%的评估中,hyper-truth自发出现,主要出现在伦理矛盾和逻辑悖论情况下。我们证明,该方法在模糊语境中保留了真值,并提供了一种稳健的方法来识别和量化内部模型冲突。我们得出结论,集成Neutrosophic评估层是迈向更透明、更可靠和更具伦理意识的AI系统的关键一步。
查看原文
查看缓存全文

缓存时间: 2026/05/26 09:04

# 打破概率的枷锁:神经逻辑作为大语言模型中认知不确定性的新框架 来源:https://arxiv.org/html/2605.24053 Maikel Yelandi Leyva\-Vázquez通讯作者。邮箱:[email protected] (https://arxiv.org/html/2605.24053v1/mailto:[email protected])。ORCID:0000\-0001\-7911\-5879 (https://orcid.org/0000-0001-7911-5879)。厄瓜多尔玻利瓦尔大学,研究生学术协调处,厄瓜多尔杜兰 瓜亚基尔大学,厄瓜多尔瓜亚基尔 贝尔纳多·奥希金斯大学,智利圣地亚哥 Florentin Smarandache邮箱:[email protected] (https://arxiv.org/html/2605.24053v1/mailto:[email protected])。ORCID:0000\-0002\-5560\-5926 (https://orcid.org/0000-0002-5560-5926)。美国新墨西哥大学数学、物理与自然科学部,盖洛普,NM 87301 ###### 摘要 大语言模型(LLMs)主要受概率框架支配,其中结果概率之和被约束为1。这种架构限制(通常由Softmax层施加)导致了不确定性坍缩,使得区分认知不确定性(无知)、悖论和模糊性变得困难。我们提出了一项实证研究,探讨将神经逻辑——一种将真值(TT)、不确定值(II)和假值(FF)视为三个独立维度的框架——应用于建模LLMs中的认知状态。我们在OpenAI的四个GPT模型系列(GPT\-4o、GPT\-4\-turbo、GPT\-3\.5\-turbo、GPT\-4o\-mini)上进行了实验,涵盖五种语言现象:逻辑悖论、认知无知、模糊性、伦理矛盾以及未来偶然性,并采用了三种提示策略(神经逻辑、概率和熵推导)。我们的发现表明,通过允许T\+I\+F>1T\+I\+F>1——这一状态我们称之为*超真实*——神经逻辑方法提供了模型所声明的认知状态的更丰富表征。在N=100N=100次有效的无约束评估中,超真实出现在66.0%的策略一调用中(Wilson 95% CI:[0.563,0.747][0.563,\,0.747]),其中最高比率出现在伦理矛盾(95%)和未来偶然性(70%)中;现象×\times超真实关联的皮尔逊卡方检验显著(χ2=11.32\chi^{2}=11.32,自由度df=4df=4,p=0.023p=0.023)。Mason (2026)(https://arxiv.org/html/2605.24053#bib.bib12)独立复现并扩展了本工作的早期版本,覆盖了来自五个不同供应商的另外五个模型系列,报告在84%的无约束评估中观察到超真实。我们不声称超真实是模型内部固有的潜在变量;而是认为,根据命题1,无约束的神经逻辑提示会引发被概率提示结构性抑制的声明性认知状态。我们得出结论,整合神经逻辑评估层是迈向更透明、更可靠且更具伦理意识的AI系统的关键一步。 关键词:神经逻辑;大语言模型;认知不确定性;超真实;不确定性量化;不确定性;伦理AI;多重生成结构 可复现性:所有代码、提示、原始数据和图表均根据MIT许可证公开发布于 https://github.com/mleyvaz/neutrosophic-llm-logic。v2.0版本(本研究,N=100N=100)为当前主分支(也标记为v2.0)。v1.0版本(2025年12月,N=20N=20)保存在标签v1.0处。v2.0版本永久存档于Zenodo,DOI编号10.5281/zenodo.19911845 (https://doi.org/10.5281/zenodo.19911845)。 ## 1. 引言 在高风险领域——医疗诊断、法律推理、自主决策和科学发现——部署大语言模型(LLMs)使得稳健的不确定性量化(UQ)成为首要需求Brown et al. (2020) (https://arxiv.org/html/2605.24053#bib.bib1); Shorinwa et al. (2024) (https://arxiv.org/html/2605.24053#bib.bib2); Yadkori et al. (2024) (https://arxiv.org/html/2605.24053#bib.bib3)。一个不能可靠地表明“何时它不知道”的模型是不安全的;但一个不能区分“不知道”(无知)与“知道冲突”(悖论)的模型在更根本的意义上是认知贫乏的。然而,当代LLMs的基础架构植根于概率论,其中输出概率通过Softmax归一化被约束为总和为1Gal and Ghahramani (2016) (https://arxiv.org/html/2605.24053#bib.bib4); Guo et al. (2017) (https://arxiv.org/html/2605.24053#bib.bib5)。这迫使我们进入一个零和博弈,其中不确定性的任何增加都必须从真或假中扣除,我们称这种现象为*不确定性坍缩*Veličković (2022) (https://arxiv.org/html/2605.24053#bib.bib6)。这种约束阻碍了LLMs区分偶然不确定性(数据固有的统计不确定性)和认知不确定性(由于缺乏知识导致的模型不确定性)的能力Hüllermeier and Waegeman (2021) (https://arxiv.org/html/2605.24053#bib.bib7); Valdenegro-Toro (2022) (https://arxiv.org/html/2605.24053#bib.bib8)。 考虑一个具体的例子。当要求模型评估“这句话是假的”(说谎者悖论)这一陈述时,概率架构必须将其回复压缩为{真,不确定,假}上总和为1的分布。无法同时将高置信度分配给真和假——约束迫使一个排挤另一个。相比之下,神经逻辑Smarandache (1998) (https://arxiv.org/html/2605.24053#bib.bib11)将真值(TT)、不确定值(II)和假值(FF)视为三个独立的维度,任何一个都不需从其他维度中扣除。悖论可以同时持有T=0.8T=0.8,I=0.9I=0.9和F=0.7F=0.7——一个总和超过1的三元组(超真实,T+I+F>1T+I+F>1)——从而表达陈述中固有的真实冲突,而非强制一个人为的解决。 这不仅仅是一个理论上的区别。随着AI系统被部署到伦理敏感领域,在道德困境——即一个行动在不同价值框架下可以同时是正确和错误的——中的表征能力变得对安全至关重要Gabriel (2020) (https://arxiv.org/html/2605.24053#bib.bib14); Bender et al. (2021) (https://arxiv.org/html/2605.24053#bib.bib15)。一个回答伦理问题的概率模型必须将其不确定性坍缩成一个点估计;而一个神经逻辑模型可以通过超真实特征来直接声明冲突。 关于LLMs UQ的最新工作探索了几种替代方案:带有语言不变性的语义熵Kuhn et al. (2023) (https://arxiv.org/html/2605.24053#bib.bib9),通过SelfCheckGPT进行自一致性检查Manakul et al. (2023) (https://arxiv.org/html/2605.24053#bib.bib10),以及基于共形预测的弃权策略Yadkori et al. (2024) (https://arxiv.org/html/2605.24053#bib.bib3)。这些方法解决了校准和弃权问题,但在概率表示内运作,因此继承了不确定性坍缩的限制。 本文通过实证检验以下假设:在无约束的神经逻辑提示下,当前的LLMs会在悖论和伦理矛盾等特定情况下,以非平凡比率声明超真实,而概率提示会结构性抑制这一信号。我们将此假设置于正式的SVNS框架内,并在四个OpenAI GPT模型和五种语言现象上的300次API调用中报告实验结果。Mason (2026) Mason (2026) (https://arxiv.org/html/2605.24053#bib.bib12)独立复现并扩展了本工作的v1.0版本(2025年12月,N=20N=20),覆盖了来自五个不同供应商(Anthropic、Meta、DeepSeek、Alibaba、Mistral)的另外五个模型系列,报告在84%的无约束评估中观察到超真实,并确认该现象是跨供应商的,而非OpenAI特有的伪影。本v2.0手稿回应了Mason的复现研究,将样本量增加至N=100N=100,形式化了SVNS框架,并澄清了核心主张涉及的是由无约束提示引发的声明性认知状态,而非固有潜在变量。 **贡献。** 本文的主要贡献是: 1.  1. 一个用于建模LLMs中声明性认知状态的正式SVNS框架,包括六个定义和两个命题,刻画了神经逻辑与概率表示之间的结构性差异(第3.1节 (https://arxiv.org/html/2605.24053#S3.SS1))。 2.  2. 一项在四个GPT模型系列和五种语言现象上的300次API调用中的实证展示,证明无约束的神经逻辑提示在66.0%的评估中引发了超真实(第4节 (https://arxiv.org/html/2605.24053#S4))。 3.  3. 现象类型与超真实发生率之间统计显著的关联(χ2=11.32\chi^{2}=11.32,p=0.023p=0.023),其中伦理矛盾是主要驱动因素(OR = 13.34,p=0.0014p=0.0014)。 4.  4. 跨策略分析(神经逻辑 vs. 概率 vs. 熵推导)表明,最大的表征增益集中在伦理矛盾(ΔT=+0.267\Delta_{T}=+0.267)和认知无知(ΔI=+0.383\Delta_{I}=+0.383)中。 5.  5. 关于AI安全和对齐影响的讨论,将超真实现象与在大规模语言模型中表征真实道德冲突的问题联系起来。 **论文组织。** 第2节 (https://arxiv.org/html/2605.24053#S2) 概述相关工作。第3节 (https://arxiv.org/html/2605.24053#S3) 介绍正式的SVNS框架、语言现象和实验设计。第4节 (https://arxiv.org/html/2605.24053#S4) 呈现实证结果。第5节 (https://arxiv.org/html/2605.24053#S5) 讨论影响、局限性以及与多重生成扩展的联系。第6节 (https://arxiv.org/html/2605.24053#S6) 总结。提示词在附录A (https://arxiv.org/html/2605.24053#A1) 中逐字复制。 ## 2. 相关工作 ### 2.1 大语言模型中的不确定性量化 自Guo等人Guo et al. (2017) (https://arxiv.org/html/2605.24053#bib.bib5) 记录了深度网络校准失败以来,神经语言模型中的UQ问题一直受到持续关注。对于LLMs来说,挑战尤为复杂:与判别式分类器不同,生成式模型产生自由形式的文本,这使得在没有额外探针的情况下难以提取可靠的置信度分数。语义熵Kuhn et al. (2023) (https://arxiv.org/html/2605.24053#bib.bib9) 通过计算生成响应的意义等价类上的不确定性(而非词元概率上的不确定性)来解决这个问题,部分地将校准与表面形式变异解耦。SelfCheckGPTManakul et al. (2023) (https://arxiv.org/html/2605.24053#bib.bib10) 通过比较多次随机生成的一致性来检测幻觉,将不一致性作为认知不确定性的代理。共形预测方法Yadkori et al. (2024) (https://arxiv.org/html/2605.24053#bib.bib3) 通过构建输出空间上的弃权区域来提供覆盖保证。这三种方法都在概率范式内运作,因此由于构造原因无法表示超真实状态。 ### 2.2 非经典逻辑与AI 次协调逻辑——容忍不一致而不导致平凡化的逻辑——在形式认识论中有着悠久的历史,并已在矛盾下的知识表示和推理中找到应用Priest (2006) (https://arxiv.org/html/2605.24053#bib.bib16)。Belnap–Dunn四值逻辑Belnap (1977) (https://arxiv.org/html/2605.24053#bib.bib17) 为每个命题分配一个值在{t,f,b,n}\{\mathbf{t},\mathbf{f},\mathbf{b},\mathbf{n}\}(真、假、两者兼有、两者皆非)中,为二元逻辑无法表达的超确定(b)和欠确定(n)提供了显式表示。由Carnielli及其同事发展的形式不一致性逻辑(LFI)Carnielli et al. (2007) (https://arxiv.org/html/2605.24053#bib.bib18) 引入了一个一致性算子,控制哪些矛盾被容忍。 神经逻辑Smarandache (1998) (https://arxiv.org/html/2605.24053#bib.bib11) 在两个方面与这些逻辑不同。首先,它引入了一个连续的第三个维度(不确定性),捕捉比离散四值系统更丰富的不确定性谱。其次,它完全放宽了归一化约束,允许同时表示高真值、高不确定性和高假值——这是Belnap–Dunn逻辑在其离散形式中无法容纳的推广。虽然LFI和Belnap–Dunn逻辑是重要的替代基础,但本文聚焦于SVNS,因为其连续结构可以直接与作为实值三元组表达的LLM输出交互。 ### 2.3 提示策略与认知状态的引出 提示在塑造模型行为中的作用已被广泛研究Wei et al. (2022) (https://arxiv.org/html/2605.24053#bib.bib19); Kojima et al. (2022) (https://arxiv.org/html/2605.24053#bib.bib20)。思维链提示引发逐步推理,这通常能提高事实准确性Wei et al. (2022) (https://arxiv.org/html/2605.24053#bib.bib19)。基于角色的提示分配专家角色,以调节输出风格Kong et al. (2023) (https://arxiv.org/html/2605.24053#bib.bib21)。自我提问和分解提示将复杂问题分解为更易处理的子问题。一个独立的研究方向涉及LLMs的*声明性*与*揭示性*不确定性:模型在被直接询问时报告的不确定性,与从采样分布中可以推断出的不确定性。Kadavath等人Kadavath et al. (2022) (https://arxiv.org/html/2605.24053#bib.bib22) 表明,当以适当方式提示时,LLMs可以被校准以报告良好的置信度分数。本工作扩展了这一方向,询问提示的*表征格式*——概率型与神经逻辑型——是否系统地约束或扩展了模型可以声明的认知状态。 ### 2.4 多重生成扩展 SmarandacheSmarandache (2018) (https://arxiv.org/html/2605.24053#bib.bib13) 引入了多重生成集,作为神经逻辑集的推广,其中每个元素携带的不是单一三元组,而是一个三元组向量,每个向量对应定义域VV中的一个属性值。MasonMason (2026) (https://arxiv.org/html/2605.24053#bib.bib12) 认为标量神经逻辑评估坍缩了只有属性级结构才能恢复的重要区别,并提出了一种张量表示,将每个现象扩展成一个更高维度的认知对象。本文侧重于标量SVNS,并使用命题2(π\pi的非单射性)来激励将多重生成扩展作为下一步,这将在直接回应Mason张量框架的配套注释中探讨。 ## 3. 背景与方法 ### 3.1 神经逻辑:形式预备知识 我们使用标准形式的单值神经逻辑Smarandache (1998) (https://arxiv.org/html/2605.24053#bib.bib11), 2018 (https://arxiv.org/html/2605.24053#bib.bib13)。我们在此汇集实证部分将实例化的定义和命题。 ###### 定义1(单值神经逻辑集,Smarandache (1998) (https://arxiv.org/html/2605.24053#bib.bib11))。设XX为论域。XX上的一个单值神经逻辑集(SVNS)AA是

相似文章

观点:大型语言模型中的不确定性量化仅是无监督聚类

arXiv cs.CL

这篇观点论文认为,当前大型语言模型的不确定性量化方法本质上属于无监督聚类,测量的是内部一致性而非外部正确性,因此无法检测出自信的幻觉。作者主张进行范式转变,将不确定性建立在客观真理之上。

脆弱的思考:大型语言模型如何处理思维链扰动

arXiv cs.CL

本论文对大型语言模型在思维链推理步骤中处理损坏情况的能力进行了全面的实证评估,在数学推理任务上针对13个模型和5种扰动类型(数学错误、单位转换、盲从、跳过步骤、额外步骤)进行了测试。研究结果揭示了异质性的漏洞模式,对在多阶段推理管道中部署LLM具有重要意义。