llm-architecture

#llm-architecture

LLMs 现在变得复杂了

Hacker News Top ↗ · 2026-06-20 缓存

文章讨论了LLMs如何变得越来越复杂，从简单的Transformer堆栈演变为融入多种注意力变体、混合专家模型和多模态编码器，与推荐系统进行了类比，并强调了像FlexAttention这样可组合内核优化的必要性。

0 人收藏 0 人点赞

#llm-architecture

@rewind02: 一位斯坦福教授刚刚做了一场公开讲座，详细讲解了GPT、Claude和LLaMA在底层是如何构建的，无需内部权限…

X AI KOLs Timeline ↗ · 2026-06-14 缓存

一位斯坦福教授举办了一场公开讲座，全面剖析了GPT、Claude和LLaMA等现代LLM的底层构建方式，让大众也能了解先进的架构。

0 人收藏 0 人点赞

#llm-architecture

@MaximeRivest: 当前的LLM架构很蠢（如果不算蠢，至少也是浪费）。以下三个包含4个上下文块的提示词：…

X AI KOLs Following ↗ · 2026-06-09 缓存

一条推文批评了当前LLM架构因依赖顺序的上下文而导致浪费的重计算，并提出将上下文单元分开编码，以实现与顺序无关的高效缓存和生成。

0 人收藏 0 人点赞

#llm-architecture

@shabnam_774: https://x.com/shabnam_774/status/2058517919760355729

X AI KOLs Timeline ↗ · 2026-05-24 缓存

本文提供了关于现代大型语言模型（如ChatGPT和Claude）从零开始构建的全面逐步解析，涵盖了数据收集、分词、Transformer架构、训练、对齐和部署。

0 人收藏 0 人点赞

#llm-architecture

@shao__meng: 昨晚用 Cursor (Opus 4.7) + Remotion 做一个视频，第一个版本完成后，问题比较多，字体和背景色重合、文字重叠等。。然后我话说的重了点，大概是说：很糟糕，问题很多，你输出前没有做检查吗？再加上几个举例的问题。 …

X AI KOLs Following ↗ · 2026-05-11 缓存

The article shares a personal experience using Cursor and Opus 4.7 to generate videos, highlighting the agent's rigorous self-correction process. It then transitions into a technical discussion on 'Agent = Model + Harness,' arguing that engineering systems like ratchets and context management are more critical to AI agent performance than the underlying model alone.

0 人收藏 0 人点赞

#llm-architecture