@FinanceYF5: 神经网络会说英文,但它们用“形状”思考 1/ 神经网络不是按词思考 它们表面上会说英文,内部却可能是在几何空间里组织信息:曲线、环、曲面、流形。 理解 neural geometry,可能是理解、调试和控制模型的关键。

X AI KOLs Following 论文

摘要

神经网络表面会说英文,但内部在几何空间里组织信息(曲线、环、曲面、流形),理解“神经几何”可能是理解、调试和控制模型的关键。

🧵神经网络会说英文,但它们用“形状”思考 1/🧠 神经网络不是按词思考 它们表面上会说英文,内部却可能是在几何空间里组织信息:曲线、环、曲面、流形。 理解 neural geometry,可能是理解、调试和控制模型的关键。👇 https://t.co/eHb6tQ4vkF
查看原文
查看缓存全文

缓存时间: 2026/05/08 23:39

🧵神经网络会说英文,但它们用“形状”思考

1/🧠 神经网络不是按词思考

它们表面上会说英文,内部却可能是在几何空间里组织信息:曲线、环、曲面、流形。

理解 neural geometry,可能是理解、调试和控制模型的关键。👇 https://t.co/eHb6tQ4vkF

相似文章

LLM神经解剖学第三部分 - LLMs似乎以几何而非语言思考

Reddit r/LocalLLaMA

研究人员分析了LLMs在8种语言和多个模型中的内部表示,发现概念思考发生在transformer中间层的几何空间中,且与输入语言无关,这支持了类似于乔姆斯基理论的普遍深层结构假说,而非萨丕尔-沃尔夫语言相对论。

@vincemask: 串起来看,就是 AI 的完整链路: 底层原理 → 模型运作 → 能力优化 → 产品落地 拆成 4 层就清楚了: 1. 原理层:AI 的地基 神经网络、分词、嵌入、注意力、Transformer。 解决的是:模型如何理解文字、语义和上下文。…

X AI KOLs Timeline

该帖将AI的完整链路分为四个层次:原理层、LLM运作层、优化层和系统层,分别解释模型如何理解语言、生成答案、优化性能以及落地产品。

@FinanceYF5: Mira Murati说了一件很准的事: 现在的AI模型在思考的时候,基本上是聋的瞎的——它听不到你在说什么,感知不到任何新信息。 人和人之间不是这样的。沉默、打断、同时说话,这些都是信息。 真正的人机协作需要的是"时间型交互"——AI持…

X AI KOLs Following

Mira Murati指出当前AI模型在思考时无法实时感知新信息,真正的协作需要时间型交互,持续接收并输出多模态信息。