neural-networks

#neural-networks

TILT: 协变量偏移下的目标诱导损失倾斜

arXiv cs.LG ↗ · 2026-05-15 缓存

TILT提出了一种新颖的目标函数，用于在协变量偏移下进行无监督域适应，该函数对未标记目标数据上的辅助组件施加惩罚，隐式实现了具有有界估计量的自定位重要性加权。理论保证和在偏移CIFAR-100上的实验表明，目标域性能优于基线方法。

0 人收藏 0 人点赞

#neural-networks

@GoodfireAI：神经网络通过旋转形状进行数学运算。我们发现了一个隐藏在大语言模型中的旋转形状计算器——而且它被用于……

X AI KOLs Following ↗ · 2026-05-14 缓存

GoodfireAI发现，神经网络通过旋转形状进行数学运算，并在一个大语言模型中发现了一个旋转形状计算器，该计算器不仅用于数学。

0 人收藏 0 人点赞

#neural-networks

@DeRonin_: Jane Street 每年支付75万美元给能够跨数千市场信号运行神经网络的量化交易员。这1小时的康奈尔大学讲座…

X AI KOLs Timeline ↗ · 2026-05-14 缓存

Marcos Lopez de Prado 的康奈尔大学讲座分享了量化交易框架，该框架使用神经网络，正是 Jane Street 量化交易员所用的，潜在年收入可达75万美元。

0 人收藏 0 人点赞

#neural-networks

AGOP 作为解释：从特征学习到图像分类器中的逐样本归因

arXiv cs.LG ↗ · 2026-05-14 缓存

本文介绍了 AGOP-Weighted，这是一种事后归因方法，它将每个样本的梯度乘以训练分布先验，以抑制噪声并突出重要像素，并在合成和逼真的基准测试中展示了相较于现有方法的显著改进。

0 人收藏 0 人点赞

#neural-networks

@AnatoliKopadze: AI 教父："如果你今晚睡得很香，那你可能没听懂这场讲座。" 这场 47 分钟的讲座是过去几个月里我看到的最好的…

X AI KOLs Timeline ↗ · 2026-05-13

杰弗里·辛顿警告称，AI 正在发展出非预期的能力，并在认知任务上超越人类，而本文提供了一份有效使用 Claude 的实用指南。

0 人收藏 0 人点赞

#neural-networks

牛顿之灯：一种用于微调交流潮流热启动模型的强化学习框架

arXiv cs.LG ↗ · 2026-05-13 缓存

本文介绍了牛顿之灯，这是一种强化学习框架，用于微调热启动模型，以更高效地解决交流潮流问题，尤其是在接近电压崩溃的情况下。

0 人收藏 0 人点赞

#neural-networks

QuIDE：通过主动优化掌握量化智能权衡

arXiv cs.LG ↗ · 2026-05-13 缓存

本文介绍了 QuIDE 框架，该框架利用智能指数来评估量化神经网络在压缩、准确性和延迟之间的权衡。研究证明，最佳位宽因任务而异：对于大型语言模型（LLM）和简单任务，4-bit 是最理想的；而对于复杂的卷积神经网络（CNN），8-bit 则更为合适。

0 人收藏 0 人点赞

#neural-networks

Compute Optimal Tokenization (2分钟阅读)

TLDR AI ↗ · 2026-05-13 缓存

本文通过训练近1300个模型，系统推导了压缩感知的神经缩放定律，证明了广泛使用的每参数20个词元的启发式方法是由特定分词器造成的。作者提出了基于字节的分词器无关缩放定律，为跨多样语言和模态的计算高效训练提供了新框架。

0 人收藏 0 人点赞

#neural-networks

用于预测三维火焰皱褶度和湍流燃烧速度的层次化多保真度学习

arXiv cs.LG ↗ · 2026-05-12 缓存

本文介绍了 MuFiNNs，这是一种层次化多保真度神经网络框架，旨在利用稀疏的实验数据预测三维火焰皱褶度和湍流燃烧速度。该方法将低保真度的物理趋势与高保真度修正相结合，从而在数据有限的燃烧状态下实现稳健的预测和外推。

0 人收藏 0 人点赞

#neural-networks

通信动力学神经网络：通过快速傅里叶变换对角化层减少参数数量并改善海森矩阵条件数

arXiv cs.LG ↗ · 2026-05-12 缓存

本文介绍了 CDLinear，这是一种分块循环神经网络层，通过快速傅里叶变换对角化技术减少参数量并改善海森矩阵条件数，并在 MNIST 数据集上结合理论证明进行了验证。

0 人收藏 0 人点赞

#neural-networks

一个图灵完备神经网络的 PyTorch 库

arXiv cs.LG ↗ · 2026-05-12 缓存

一个 PyTorch 库，可根据图灵机描述编译神经网络，从而实现无需训练的精确模拟。

0 人收藏 0 人点赞

#neural-networks

结合均衡传播的树突神经网络

arXiv cs.LG ↗ · 2026-05-12 缓存

本文探讨了将树突神经网络与均衡传播相结合，表明与标准均衡传播相比，这种具有生物学合理性的方法在具有挑战性的数据集上提高了性能。

0 人收藏 0 人点赞

#neural-networks

利用深度学习在无几何参数条件下预测微流控装置中的惯性升力

arXiv cs.LG ↗ · 2026-05-12 缓存

本文提出了一种新颖的深度学习方法来预测微流控装置中的惯性升力，无需显式几何参数，与以前的模型相比，该方法能够更好地泛化到未见过的通道横截面。

0 人收藏 0 人点赞

#neural-networks

@AnimaAnandkumar: TorchLean 代码库现已开放！TorchLean 是一个用于可验证神经网络软件的 Lean 4 框架。它支持……

X AI KOLs Following ↗ · 2026-05-11 缓存

TorchLean 是一款全新发布的 Lean 4 框架，可实现神经网络软件的形式化验证，具备类型化张量、可验证自动微分、PyTorch 互操作性及 GPU 执行等特性。此次发布进一步扩展了对扩散模型、GPT 风格 Transformer 和状态空间模型等现代架构的支持，将实际的机器学习工作流与数学证明检查紧密连接。

0 人收藏 0 人点赞

#neural-networks