标签
一种受大脑启发的人工智能架构有望实现更快计算,同时功耗大幅降低,可能推动节能型AI硬件的发展。
探索为什么绘制大脑连接组是有价值的,认为与AI系统不同(AI的设计在权重之外的代码中),大脑必须物理地编码所有设计,因此结构是理解的关键。
Vadim Fedenko 分享了关于递归自我改进(RSI)的技术分析,认为真正的 RSI 需要能力的提升速度快于复杂度的增长,并且要拓展架构空间,而不仅仅是在固定参数内优化。他对 xAI 和 Anthropic 近期提出的 RSI 可能在一两年内到来的说法表示怀疑,理由是当前的大语言模型(LLM)缺乏减法工程能力,且现有的奖励函数忽视了复杂度。
用户推荐斯坦福的AI架构开放课程,认为其讲解精彩,令人目不转睛。
苹果宣布对其Apple Intelligence平台进行重大改革,发布了一套与谷歌合作、基于Gemini技术共同开发的基础模型构建的新AI架构,该架构支持多模态能力,并通过Private Cloud Compute实现隐私保护的设备端与服务器端处理。
一份精心挑选的阅读清单,包含基础和现代资源,用于理解代理架构,融合了经典分布式系统概念与当前AI代理模式。
该推文讨论了AI代理框架中的臃肿问题,赞同Kaffu提出的框架变成‘富人的玩具’的批评,并倡导一种由小型可替换工作者组成的可组合架构,以减少漂移,保持系统廉价且易于调试。
对Kimi K2.6的逆向工程分析显示,其架构优先考虑编排和技能注入,而非原始参数数量,通过多智能体协作无需再训练即可获得高SWE-Bench分数。
这篇评论文章尖锐指出,类似Claude的AI智能体缺乏真正软件架构所需的上下文判断力和说“不”的能力,警告人们不要让它们在缺乏人类监督的情况下设计系统。
一条引用推文讨论了 gBrain 对特定用例是最先进的,在 Hermes Agent 下采用共享内存层架构。
本文指出,大多数所谓的“智能体化”系统实际上只是配备工具的单智能体,并强调了多智能体架构带来的高昂成本和复杂性。文章梳理了三种有效的多智能体模式——编排者-工作者、流水线以及点对点模式,并提供了判断何时采用多智能体而非单智能体的标准。
本文批评了“多智能体编排”这一术语的过度使用,指出许多实现实际上仅仅是单一智能体使用函数调用,而非真正的分布式系统。文章强调了一些经过生产环境验证的实用模式,如顺序流水线和人机协作工作流,作为复杂但低效架构的替代方案。
文章认为,下一场重大AI辩论应聚焦于代表性和机构架构,提出三个层次(感知、核心、驱动)来应对AI系统如何捕获现实、推理及合法行动的问题,而非仅仅模拟智能。
本文主张AI子代理不应自动继承其父代理的全部权限,而是提倡采用明确范围、工具限制和审计跟踪的弱化委托方式,以增强多代理系统的安全性。
作者详细阐述了不让LLM生成最终事实核查判定的决定,转而采用混合架构:LLM负责数据提取,确定性Python层负责评分,并指出了随机不稳定性和可审计性的问题。
这篇文章概述了一个全面的9层AI生产架构,强调了如RAG管道、安全守卫、可观测性和评估等组件,以区分健壮的生产系统与简单的演示。
The article discusses how Addy Osmani argues that the performance difference between AI coding agents like Claude Code, Cursor, and Cline stems from their 'Harness'—the layer of prompts, tools, and constraints around the model—rather than the underlying model itself. It details best practices for harness engineering, including hooks, sandboxing, and context management, to bridge the gap between model capability and actual agent performance.
这篇文章探讨了 Andrej Karpathy 提出的“LLM Wiki”概念,认为这是传统 RAG 的范式转变,主张通过维护一个持久且不断演化的知识基底,可以实现知识的复合式理解,而非无状态的检索。