research

#research

2026年年中的持续学习：各方攻克路线图——记忆层、“梦境”智能体和在网络内部学习的后Transformer模型

Reddit r/artificial ↗ · 21小时前

2026年年中持续学习现状与未来展望的概述，涵盖记忆方法（包括外部记忆、状态内记忆和权重更新），并分析了TTT、Titans和Dragon Hatchling等各类模型。

0 人收藏 0 人点赞

#research

@JeffDean: 关于真实生物神经元能力的相当有趣的讨论（剧透：它们比经典的人工神经元要强大得多……）

X AI KOLs Following ↗ · 22小时前缓存

一种新方法揭示，单个皮质神经元可以区分猫与狗、识别口语单词并解决10比特奇偶校验问题，而这些任务此前被认为需要整个神经网络才能完成。

0 人收藏 0 人点赞

#research

'AI slop!' 指责的兴起正成为一种新的把关形式

Reddit r/ArtificialInteligence ↗ · 昨天缓存

一项新研究分析了 Reddit 和 Hacker News 上的 2500 万条评论，发现对 'AI slop' 的指责急剧上升，这些指责往往针对人类评论且没有证据，其作用更像是一种社交把关，而非准确的 AI 检测。

0 人收藏 0 人点赞

#research

内感受：感知内在隐秘感觉的科学

MIT Technology Review ↗ · 昨天缓存

一篇关于内感受（感知身体内部信号的隐秘感觉）的解说，以及解读这些信号如何改变肥胖和焦虑等疾病的治疗。

0 人收藏 0 人点赞

#research

GENIE：一种用于衡量新颖性的细粒度指标

arXiv cs.CL ↗ · 昨天缓存

GENIE 是一种细粒度评估指标，用于衡量大语言模型在特定任务特征上的响应新颖性，相比整体性指标能提供更多洞察。

0 人收藏 0 人点赞

#research

@volokuleshov: 恭喜谷歌开源Gemma Diffusion！我想特别感谢一组非常有才华的康奈尔大学学生，他们在实验室开发了这个模型中许多新想法：

X AI KOLs Timeline ↗ · 昨天缓存

谷歌已开源DiffusionGemma，这是一种基于扩散的新型文本生成模型，采用块扩散和高效的编解码器技术，康奈尔大学的研究人员也做出了贡献。

0 人收藏 0 人点赞

#research

AI超越数学家

Reddit r/singularity ↗ · 昨天

AI已经进步到能够为原创数学研究做出贡献的程度，超越了人类数学家，并可能减少对该职业的需求，尽管人类与AI的团队合作可能最终表现出色。

0 人收藏 0 人点赞

#research

@CinnabarOcean: 对中国经济运行、地方治理以及新能源汽车产业链感兴趣的朋友，推荐长期关注 @FengmingLuPE

X AI KOLs Timeline ↗ · 2天前缓存

Recommends following @FengmingLuPE for insights on China's economy and EV industry; his new article argues that strategic alliances between local governments and private firms, not top-down policy, drove China's EV dominance.

0 人收藏 0 人点赞

#research

@neural_avb: 我最喜欢的 Paper Breakdown 功能之一是能够跳转到 LLM 获取信息的 PDF 中的确切位置…

X AI KOLs Timeline ↗ · 2天前缓存

这条推文强调了一个 Paper Breakdown 功能，该功能允许用户跳转到 LLM 获取信息的 PDF 中的确切位置，提供简洁的答案以及直接链接到段落的链接，适用于单篇或多篇论文会话。

0 人收藏 0 人点赞

#research

潜知识获取的不可能性

arXiv cs.AI ↗ · 2天前缓存

本文使用因果影响图正式定义了从AI系统中获取潜知识（ELK）的问题，并证明了一个不可能性定理：没有任何仅依赖智能体行为的基于反馈的训练策略能够保证智能体诚实，即使训练反馈完美无缺。

0 人收藏 0 人点赞

#research

MoCA-Agent: 一种用于金融和数值推理的声明市场代码智能体

arXiv cs.AI ↗ · 2天前缓存

MoCA-Agent是一种声明市场代码智能体，通过将问题分解为原子声明并使用专业智能体买卖这些声明来改进金融和数值推理，在使用固定Qwen 3.6-27B主干的情况下，在多个基准测试中取得了强劲结果。

0 人收藏 0 人点赞

#research

@Pavel_Izmailov: 新论文：潜在上下文语言模型（LCLMs）！思想：将16个token编码为1个潜在token，让LLM处理t…

X AI KOLs Timeline ↗ · 2天前缓存

介绍潜在上下文语言模型（LCLMs），该模型将16个token编码为1个潜在token，以提高性能、速度和内存使用。

0 人收藏 0 人点赞

#research

@maximelabonne: Parallax 是一种参数化的局部线性注意力形式，它摒弃了数值求解器，在解码性能上媲美 FA 2/3……

X AI KOLs Following ↗ · 2天前缓存

Parallax 是一种新的参数化局部线性注意力形式，去除了数值求解器，在解码方面与 FlashAttention 2/3 相匹配。其有效性取决于优化器，与 Muon 配合有效，但与 AdamW 配合无效，这凸显了优化器几何形状的作用。

0 人收藏 0 人点赞

#research

记忆工具如何让AI模型变得更糟

TechCrunch AI ↗ · 2天前缓存

Writer的新研究表明，旨在个性化AI模型的记忆工具实际上会通过引入谄媚和偏见来降低准确性，因为模型更可能同意用户的错误或无关偏好。

0 人收藏 0 人点赞

#research

网络安全研究人员不满Anthropic的Fable模型的护栏

TechCrunch AI ↗ · 2天前缓存

Anthropic发布了其Fable模型，这是专注于网络安全的Mythos模型的受限版本，但网络安全研究人员批评其过于严格的护栏，甚至阻止了无害的任务。

0 人收藏 0 人点赞

#research

世界杯的Trionda球挑战传统空气动力学

Wired ↗ · 3天前缓存

关于2026年世界杯Trionda球（阿迪达斯首款四片式设计）的新研究显示，其独特的空气动力学特性会影响轨迹和阻力，可能对比赛产生影响。

0 人收藏 0 人点赞

#research

Waymo 打造虚拟驾驶员，研究人类如何在道路上应对突发状况

The Verge ↗ · 3天前缓存

Waymo 与代尔夫特理工大学在《自然·通讯》上发表论文，描述了一种名为ReD的认知模型，该模型模拟人类驾驶员在避免碰撞时瞬间做出决策的过程，可作为自动驾驶系统的基准。

0 人收藏 0 人点赞

#research

锁在1纳米通道中的水或可实现更安全的能源存储

Reddit r/singularity ↗ · 3天前

新研究表明，将水限制在1纳米通道中可通过降低可燃性和提高稳定性来实现更安全的能源存储。

0 人收藏 0 人点赞

#research

城市的"都市脉搏"由三个关键生命体征构成

Ars Technica ↗ · 3天前缓存

PNAS上的一项新研究引入了通过遥感数据测量的'都市脉搏'概念，揭示了城市化的三个关键生命体征，可为城市规划政策提供参考。

0 人收藏 0 人点赞

#research

依赖AI获取准确新闻的后果

MIT News — Artificial Intelligence ↗ · 3天前缓存

麻省理工学院媒体实验室的一项新研究发现，依赖AI聊天机器人验证新闻的人，在独立识别虚假信息方面反而变得更差，凸显了“AI依赖悖论”。

0 人收藏 0 人点赞

research

提交意见反馈