neural-networks

#neural-networks

@kmeanskaran: 今天平衡ML和AI的最佳方法：> Python（特别是Pydantic）> 神经网络基础 > RNN, LSTM, …

X AI KOLs Timeline ↗ · 2026-06-10 缓存

Karan（@kmeanskaran）的一条推文，概述了平衡ML和AI的学习路线，涵盖Python、神经网络、NLP、LLMs、部署和智能体AI，并附有Amit寻求初学者指导的回复。

0 人收藏 0 人点赞

#neural-networks

通过相变的涌现：机制景观与复杂系统中的通用收敛

arXiv cs.LG ↗ · 2026-06-09 缓存

本文介绍了层次涌现框架（HEF），该框架解释了在物理和信息约束下，通过机制景观中的相变，神经网络和生物进化等多样系统如何收敛到相似的内部表示。该框架通过111个grokking实验进行了实证验证，这些实验确认了通用收敛，并识别出一个临界能量阈值。

0 人收藏 0 人点赞

#neural-networks

Flatland：大步长梯度下降的冒险

arXiv cs.LG ↗ · 2026-06-08 缓存

本文探讨了在非L-光滑目标上梯度下降收敛的最大步长这一开放问题，引入了在稳定性边缘运行且能够全局最小化尖锐度的自适应方法。

0 人收藏 0 人点赞

#neural-networks

FP8注意力中的P-Cast精度：凹陷引发的崩溃与S=2^8的最优性

arXiv cs.AI ↗ · 2026-06-08 缓存

本文分析了在将softmax输出转换为FP8（E4M3）时，由于注意力凹陷现象导致的FP8注意力精度损失。它表明正向KV迭代会导致非凹陷注意力值下溢，并提出反向迭代和静态缩放因子S=256来消除下溢，实现了3-10倍的MSE改进。

0 人收藏 0 人点赞

#neural-networks

@jakevin7: 现在所有人都在聊 AI，但很少有人知道，这个领域的奠基人曾经被整个世界当成疯子扔掉。 Geoffrey Hinton 在 2024 年拿了诺贝尔物理学奖。有记者问他：你等了多少年？他说：大概四十年。 1969 年，神经网络被一本书干死…

X AI KOLs Following ↗ · 2026-06-08 缓存

本文回顾了 Geoffrey Hinton 在神经网络被学术界抛弃的 AI 寒冬中坚持研究长达三十年，最终凭借 AlexNet 在 2012 年 ImageNet 大赛中一举成名，并在 2024 年获得诺贝尔物理学奖的历程。

0 人收藏 0 人点赞

#neural-networks

@zhaisf: 这是 @geoffreyhinton 提出的蒸馏方法的一些神奇结果，当我第一次看到它们时，真的让我震惊，而且……

X AI KOLs Following ↗ · 2026-06-07 缓存

本文讨论了模型蒸馏对训练分布的惊人鲁棒性，即使与目标分布的重叠很小，以及其对在线/离线策略蒸馏的影响。

0 人收藏 0 人点赞

#neural-networks

@incrementaliser：刚看完@ChrisGPotts 的一场精彩演讲——“在大型语言模型中寻找语言结构”，我现在完全相信……

X AI KOLs Following ↗ · 2026-06-06

一条推文重点介绍了 Chris Potts 关于大型语言模型如何学习语言结构的演讲，进一步强化了 LLM 能够捕捉句法和语义的观点。

0 人收藏 0 人点赞

#neural-networks

Transformers 本质上是简洁的

Hacker News Top ↗ · 2026-06-05 缓存

本文认为 Transformer 架构本质上是简洁的，意味着它们比其他模型能更高效地表示某些函数。本文提供了理论分析和证明。

0 人收藏 0 人点赞

#neural-networks

探索视觉嵌入

Hacker News Top ↗ · 2026-06-05 缓存

本文通过生成与特定嵌入方向对应的图像，利用梯度优化和增强策略来反转模型，探索了DINOv3视觉嵌入。

0 人收藏 0 人点赞

#neural-networks

交换关联泛函的导数信息学习

arXiv cs.LG ↗ · 2026-06-04 缓存

这篇ICML 2026论文介绍了Derivative Informed XC-Loss（DI-Loss），这是一种用于机器学习交换关联泛函的训练方法，它在密度矩阵的格拉斯曼流形上引入了一阶和二阶导数监督。在四种架构上，与仅使用能量和密度监督相比，DI-Loss将总能量平均绝对误差（MAE）降低了66%，并改善了TDDFT计算中的激发态预测。

0 人收藏 0 人点赞

#neural-networks