标签
2026年年中持续学习现状与未来展望的概述,涵盖记忆方法(包括外部记忆、状态内记忆和权重更新),并分析了TTT、Titans和Dragon Hatchling等各类模型。
一种新方法揭示,单个皮质神经元可以区分猫与狗、识别口语单词并解决10比特奇偶校验问题,而这些任务此前被认为需要整个神经网络才能完成。
一项新研究分析了 Reddit 和 Hacker News 上的 2500 万条评论,发现对 'AI slop' 的指责急剧上升,这些指责往往针对人类评论且没有证据,其作用更像是一种社交把关,而非准确的 AI 检测。
GENIE 是一种细粒度评估指标,用于衡量大语言模型在特定任务特征上的响应新颖性,相比整体性指标能提供更多洞察。
谷歌已开源DiffusionGemma,这是一种基于扩散的新型文本生成模型,采用块扩散和高效的编解码器技术,康奈尔大学的研究人员也做出了贡献。
Recommends following @FengmingLuPE for insights on China's economy and EV industry; his new article argues that strategic alliances between local governments and private firms, not top-down policy, drove China's EV dominance.
这条推文强调了一个 Paper Breakdown 功能,该功能允许用户跳转到 LLM 获取信息的 PDF 中的确切位置,提供简洁的答案以及直接链接到段落的链接,适用于单篇或多篇论文会话。
本文使用因果影响图正式定义了从AI系统中获取潜知识(ELK)的问题,并证明了一个不可能性定理:没有任何仅依赖智能体行为的基于反馈的训练策略能够保证智能体诚实,即使训练反馈完美无缺。
MoCA-Agent是一种声明市场代码智能体,通过将问题分解为原子声明并使用专业智能体买卖这些声明来改进金融和数值推理,在使用固定Qwen 3.6-27B主干的情况下,在多个基准测试中取得了强劲结果。
介绍潜在上下文语言模型(LCLMs),该模型将16个token编码为1个潜在token,以提高性能、速度和内存使用。
Parallax 是一种新的参数化局部线性注意力形式,去除了数值求解器,在解码方面与 FlashAttention 2/3 相匹配。其有效性取决于优化器,与 Muon 配合有效,但与 AdamW 配合无效,这凸显了优化器几何形状的作用。
Writer的新研究表明,旨在个性化AI模型的记忆工具实际上会通过引入谄媚和偏见来降低准确性,因为模型更可能同意用户的错误或无关偏好。
Anthropic发布了其Fable模型,这是专注于网络安全的Mythos模型的受限版本,但网络安全研究人员批评其过于严格的护栏,甚至阻止了无害的任务。
关于2026年世界杯Trionda球(阿迪达斯首款四片式设计)的新研究显示,其独特的空气动力学特性会影响轨迹和阻力,可能对比赛产生影响。
Waymo 与代尔夫特理工大学在《自然·通讯》上发表论文,描述了一种名为ReD的认知模型,该模型模拟人类驾驶员在避免碰撞时瞬间做出决策的过程,可作为自动驾驶系统的基准。
PNAS上的一项新研究引入了通过遥感数据测量的'都市脉搏'概念,揭示了城市化的三个关键生命体征,可为城市规划政策提供参考。
麻省理工学院媒体实验室的一项新研究发现,依赖AI聊天机器人验证新闻的人,在独立识别虚假信息方面反而变得更差,凸显了“AI依赖悖论”。