llm-limitations

#llm-limitations

不要轻信大上下文窗口

Hacker News Top ↗ · 2026-06-14 缓存

分析表明，LLM 声称的大上下文窗口具有误导性，因为有效注意力在约 10 万 token 时会下降。为开发者提供实用建议：通过使用工件（artifacts）和切换（handoffs）将会话保持在“智能区”。

0 人收藏 0 人点赞

#llm-limitations

一位客户付钱让我把他们工具中的AI移除。

Reddit r/AI_Agents ↗ · 2026-06-08

一位开发者构建了一个基于LLM的工单路由工具，但支持团队不信任其黑箱决策。客户付费将LLM替换为简单的规则引擎，结果准确率更高、成本更低、用户信任度也更高。

0 人收藏 0 人点赞

#llm-limitations

自主AI驱动的杀人无人机能否具备道德观念？ | 无人机（军事）

Reddit r/ArtificialInteligence ↗ · 2026-06-03 缓存

本文探讨了将道德观念编程到自主AI驱动的军用无人机中所面临的伦理和技术挑战，并引用专家的观点，他们认为当前的AI系统（包括大型语言模型）从根本上无法进行道德决策。

0 人收藏 0 人点赞

#llm-limitations

如果你无法纠正AI的信念，那你拥有的就不是记忆系统，而只是一个只写日志。

Reddit r/AI_Agents ↗ · 2026-05-29

本文批评当前AI记忆系统仅仅只是无法被纠正、更新或溯源至来源的只写日志，认为真正的记忆需要一个治理层。

0 人收藏 0 人点赞

#llm-limitations

更大的上下文窗口并未解决企业记忆问题——原因如下

Reddit r/ArtificialInteligence ↗ · 2026-05-22

本文批评了LLM中不断扩大上下文窗口的趋势，认为由于检索退化、数据量和缺乏结构，这并不能解决企业知识问题。文章主张在检索之前建立知识建模层，以映射关系和意图。

0 人收藏 0 人点赞

#llm-limitations

规模、计划与人员——无人满意

Reddit r/artificial ↗ · 2026-05-20 缓存

一项深度分析，探讨为何AI公司在知名研究者宣称缩放时代结束且收益递减已被广泛承认后，仍持续扩展系统，审视驱动该行业的结构与财务激励。

0 人收藏 0 人点赞

#llm-limitations

@omarsar0: 每次让我10岁的孩子使用编程代理，他都感到非常失望。原来他只想……

X AI KOLs Following ↗ · 2026-05-18 缓存

一位开发者指出，编程代理始终无法帮助他10岁的孩子构建创意模拟器，这揭示了LLM在处理分布外用例方面的不足，并认为关于即将实现AGI的说法被夸大了。

0 人收藏 0 人点赞

#llm-limitations

仅靠规模扩展无法实现理性人工智能

Reddit r/ArtificialInteligence ↗ · 2026-05-18

本文认为，当前大型语言模型无法实现真正的理性（即识别和切换框架的能力），其根本原因在于架构限制而非规模不足。文中引用反转诅咒、框架转移问题等实证失败案例，并指出仅靠规模扩展可能无法弥合这一差距。

0 人收藏 0 人点赞

#llm-limitations

自回归大语言模型正式与鱼共眠（Yann LeCun是对的）

Reddit r/AI_Agents ↗ · 2026-05-15

CETI项目使用大语言模型的架构解码抹香鲸的咔嗒声，揭示了其语音字母表，但也凸显出AI的统计模式匹配缺乏真正的理解。文章认为，AGI需要具身化、多模态的根基，而不仅仅是基于文本的模型扩展。

0 人收藏 0 人点赞

#llm-limitations

@haider1: Yann LeCun 表示，LLMs 在语言本身就是推理基础的领域（如数学和代码）中最强…

X AI KOLs Following ↗ · 2026-05-15 缓存

Yann LeCun 指出，LLMs 在语言作为推理基础的领域（如数学和代码）中最强，但它们并非有创造力的数学家、软件架构师或计算机科学家。

0 人收藏 0 人点赞

#llm-limitations

RoPE 在长上下文中既无法区分位置也无法区分词元，可证明

Hugging Face Daily Papers ↗ · 2026-05-15 缓存

本文证明，基于RoPE的注意力机制在长上下文中无法区分词元位置和身份，解释了LLM在宣称的上下文长度内失败的原因。实验验证表明，针对检索优化的模型在简单列表任务上表现困难。

0 人收藏 0 人点赞

#llm-limitations

如果 AI 只是公关做得更好的自动补全呢？

Reddit r/artificial ↗ · 2026-05-13

本文认为，现代 AI 本质上是由概率和矩阵乘法驱动的高级自动补全系统，批评业界将语言流畅性误认为是真正的推理能力或智能。

0 人收藏 0 人点赞

#llm-limitations

@mattpocockuk: 这段视频的观看时长已达 96,000 小时相当于超过十年有时候我仍然觉得难以置信

X AI KOLs Following ↗ · 2026-05-10 缓存

Matt Pocock argues that effective AI-assisted development requires respecting LLM limitations, specifically the 'intelligence zone' and amnesiac context windows, advocating for small tasks and clear system prompts over vague specifications.

0 人收藏 0 人点赞

#llm-limitations

我们正撞墙：试图强迫 Transformer 执行真正的逻辑 [D]

Reddit r/MachineLearning ↗ · 2026-05-09

作者对行业依赖提示词工程和扩展规模来解决基于 Transformer 的大语言模型（LLM）逻辑推理缺陷表示沮丧，认为这些概率模型从根本上缺乏确定性逻辑的架构。

0 人收藏 0 人点赞

#llm-limitations

还有人觉得AI基准测试在预测实际性能方面越来越没用了吗？

Reddit r/ArtificialInteligence ↗ · 2026-05-07

本文讨论了AI基准测试高分与实际真实表现之间日益扩大的差距，重点强调了诸如一致性、延迟和上下文处理等问题。

0 人收藏 0 人点赞

#llm-limitations

为什么代理一旦离开聊天框，可靠性就会急剧下降？

Reddit r/AI_Agents ↗ · 2026-05-07

文章讨论了AI代理从沙盒测试迁移到生产环境时可靠性下降的问题，指出编排层包含的错误往往比模型本身更多。

0 人收藏 0 人点赞

#llm-limitations

使用扩散模型生成/编辑AST？[D]

Reddit r/MachineLearning ↗ · 2026-05-07

一位用户提议使用扩散模型生成或编辑抽象语法树（AST），以确保代码生成的语法正确性，并与当前LLM基于token的限制形成对比。

0 人收藏 0 人点赞

#llm-limitations

@rohanpaul_ai：哥伦比亚大学计算机系 Vishal Misra 教授解释为何 LLM 无法提出全新科学构想

X AI KOLs Following ↗ · 2026-04-21 缓存

哥伦比亚大学计算机系教授 Vishal Misra 认为，LLM 只能在已习得的贝叶斯流形内插值，无法构建全新概念图谱，因此无法产生真正原创的科学突破。

0 人收藏 0 人点赞

llm-limitations

不要轻信大上下文窗口

一位客户付钱让我把他们工具中的AI移除。

同类相食

自主AI驱动的杀人无人机能否具备道德观念？ | 无人机（军事）

如果你无法纠正AI的信念，那你拥有的就不是记忆系统，而只是一个只写日志。

更大的上下文窗口并未解决企业记忆问题——原因如下

规模、计划与人员——无人满意

@omarsar0: 每次让我10岁的孩子使用编程代理，他都感到非常失望。原来他只想……

仅靠规模扩展无法实现理性人工智能

自回归大语言模型正式与鱼共眠（Yann LeCun是对的）

@haider1: Yann LeCun 表示，LLMs 在语言本身就是推理基础的领域（如数学和代码）中最强…

RoPE 在长上下文中既无法区分位置也无法区分词元，可证明

如果 AI 只是公关做得更好的自动补全呢？

@mattpocockuk: 这段视频的观看时长已达 96,000 小时相当于超过十年有时候我仍然觉得难以置信

我们正撞墙：试图强迫 Transformer 执行真正的逻辑 [D]

还有人觉得AI基准测试在预测实际性能方面越来越没用了吗？

为什么代理一旦离开聊天框，可靠性就会急剧下降？

使用扩散模型生成/编辑AST？[D]

@rohanpaul_ai：哥伦比亚大学计算机系 Vishal Misra 教授解释为何 LLM 无法提出全新科学构想

提交意见反馈