neural-networks

标签

Cards List
#neural-networks

TILT: 协变量偏移下的目标诱导损失倾斜

arXiv cs.LG · 2026-05-15 缓存

TILT提出了一种新颖的目标函数,用于在协变量偏移下进行无监督域适应,该函数对未标记目标数据上的辅助组件施加惩罚,隐式实现了具有有界估计量的自定位重要性加权。理论保证和在偏移CIFAR-100上的实验表明,目标域性能优于基线方法。

0 人收藏 0 人点赞
#neural-networks

@GoodfireAI:神经网络通过旋转形状进行数学运算。我们发现了一个隐藏在大语言模型中的旋转形状计算器——而且它被用于……

X AI KOLs Following · 2026-05-14 缓存

GoodfireAI发现,神经网络通过旋转形状进行数学运算,并在一个大语言模型中发现了一个旋转形状计算器,该计算器不仅用于数学。

0 人收藏 0 人点赞
#neural-networks

@DeRonin_: Jane Street 每年支付75万美元给能够跨数千市场信号运行神经网络的量化交易员。这1小时的康奈尔大学讲座…

X AI KOLs Timeline · 2026-05-14 缓存

Marcos Lopez de Prado 的康奈尔大学讲座分享了量化交易框架,该框架使用神经网络,正是 Jane Street 量化交易员所用的,潜在年收入可达75万美元。

0 人收藏 0 人点赞
#neural-networks

AGOP 作为解释:从特征学习到图像分类器中的逐样本归因

arXiv cs.LG · 2026-05-14 缓存

本文介绍了 AGOP-Weighted,这是一种事后归因方法,它将每个样本的梯度乘以训练分布先验,以抑制噪声并突出重要像素,并在合成和逼真的基准测试中展示了相较于现有方法的显著改进。

0 人收藏 0 人点赞
#neural-networks

@AnatoliKopadze: AI 教父:"如果你今晚睡得很香,那你可能没听懂这场讲座。" 这场 47 分钟的讲座是过去几个月里我看到的最好的…

X AI KOLs Timeline · 2026-05-13

杰弗里·辛顿警告称,AI 正在发展出非预期的能力,并在认知任务上超越人类,而本文提供了一份有效使用 Claude 的实用指南。

0 人收藏 0 人点赞
#neural-networks

牛顿之灯:一种用于微调交流潮流热启动模型的强化学习框架

arXiv cs.LG · 2026-05-13 缓存

本文介绍了牛顿之灯,这是一种强化学习框架,用于微调热启动模型,以更高效地解决交流潮流问题,尤其是在接近电压崩溃的情况下。

0 人收藏 0 人点赞
#neural-networks

QuIDE:通过主动优化掌握量化智能权衡

arXiv cs.LG · 2026-05-13 缓存

本文介绍了 QuIDE 框架,该框架利用智能指数来评估量化神经网络在压缩、准确性和延迟之间的权衡。研究证明,最佳位宽因任务而异:对于大型语言模型(LLM)和简单任务,4-bit 是最理想的;而对于复杂的卷积神经网络(CNN),8-bit 则更为合适。

0 人收藏 0 人点赞
#neural-networks

Compute Optimal Tokenization (2分钟阅读)

TLDR AI · 2026-05-13 缓存

本文通过训练近1300个模型,系统推导了压缩感知的神经缩放定律,证明了广泛使用的每参数20个词元的启发式方法是由特定分词器造成的。作者提出了基于字节的分词器无关缩放定律,为跨多样语言和模态的计算高效训练提供了新框架。

0 人收藏 0 人点赞
#neural-networks

用于预测三维火焰皱褶度和湍流燃烧速度的层次化多保真度学习

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 MuFiNNs,这是一种层次化多保真度神经网络框架,旨在利用稀疏的实验数据预测三维火焰皱褶度和湍流燃烧速度。该方法将低保真度的物理趋势与高保真度修正相结合,从而在数据有限的燃烧状态下实现稳健的预测和外推。

0 人收藏 0 人点赞
#neural-networks

通信动力学神经网络:通过快速傅里叶变换对角化层减少参数数量并改善海森矩阵条件数

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 CDLinear,这是一种分块循环神经网络层,通过快速傅里叶变换对角化技术减少参数量并改善海森矩阵条件数,并在 MNIST 数据集上结合理论证明进行了验证。

0 人收藏 0 人点赞
#neural-networks

一个图灵完备神经网络的 PyTorch 库

arXiv cs.LG · 2026-05-12 缓存

一个 PyTorch 库,可根据图灵机描述编译神经网络,从而实现无需训练的精确模拟。

0 人收藏 0 人点赞
#neural-networks

结合均衡传播的树突神经网络

arXiv cs.LG · 2026-05-12 缓存

本文探讨了将树突神经网络与均衡传播相结合,表明与标准均衡传播相比,这种具有生物学合理性的方法在具有挑战性的数据集上提高了性能。

0 人收藏 0 人点赞
#neural-networks

利用深度学习在无几何参数条件下预测微流控装置中的惯性升力

arXiv cs.LG · 2026-05-12 缓存

本文提出了一种新颖的深度学习方法来预测微流控装置中的惯性升力,无需显式几何参数,与以前的模型相比,该方法能够更好地泛化到未见过的通道横截面。

0 人收藏 0 人点赞
#neural-networks

@AnimaAnandkumar: TorchLean 代码库现已开放!TorchLean 是一个用于可验证神经网络软件的 Lean 4 框架。它支持……

X AI KOLs Following · 2026-05-11 缓存

TorchLean 是一款全新发布的 Lean 4 框架,可实现神经网络软件的形式化验证,具备类型化张量、可验证自动微分、PyTorch 互操作性及 GPU 执行等特性。此次发布进一步扩展了对扩散模型、GPT 风格 Transformer 和状态空间模型等现代架构的支持,将实际的机器学习工作流与数学证明检查紧密连接。

0 人收藏 0 人点赞
#neural-networks

有趣的 BDH 之问:如果 LLM 的记忆驻留在网络权重中,而非不断膨胀的 KV cache 里,会怎样?

Reddit r/singularity · 2026-05-11

本文分析了 Jan Chorowski 提出的 BDH 架构方案,该方案探讨了一种替代传统 KV cache 的思路:利用稀疏高维 key-query 空间,将 LLM 的记忆直接嵌入到网络权重中。

0 人收藏 0 人点赞
#neural-networks

@techNmak: 如今构建神经网络变得极其容易,以至于人们在完全不了解其工作原理的情况下也能完成。我们生活在一个以 'import torch' 为标志的时代……

X AI KOLs Timeline · 2026-05-11

作者批评了在使用 PyTorch 等高级库时缺乏对底层机制理解的现象,并推荐 Simon J.D. Prince 的笔记集合,以弥合语法应用与第一性原理工程实践之间的差距。

0 人收藏 0 人点赞
#neural-networks

模糊 ARTMAP 中的流式对抗鲁棒性:机制对齐评估、渐进式训练及可解释诊断

arXiv cs.LG · 2026-05-11 缓存

本文通过引入与机制对齐的白盒攻击代理 WB-Softmax,研究了流式神经架构模糊 ARTMAP 中的对抗鲁棒性。本文评估了渐进式训练和选择性更新策略,以在不进行数据重放的情况下提高鲁棒性,同时为结构性失效提供可解释的诊断。

0 人收藏 0 人点赞
#neural-networks

用 Swift 训练大语言模型,第一部分:将矩阵乘法从 Gflop/s 提升到 Tflop/s

Hacker News Top · 2026-05-10 缓存

作者详细介绍了在 Apple Silicon 上优化 Swift 自定义矩阵乘法内核以训练大语言模型的过程,旨在通过利用 CPU、SIMD、AMX 和 GPU 能力,实现超越 C 实现的性能。

0 人收藏 0 人点赞
#neural-networks

@knowledgefxg: 学机器学习最痛苦的事情是什么?是对着一堆公式发呆,死记硬背,项目作者把神经网络、逻辑回归等这些经典算法,从数学第一原理开始推导,一步一步写成 Jupyter Notebook,然后把整个训练过程可视化出来,让你在学习的时候有个直观的感觉。…

X AI KOLs Timeline · 2026-05-10 缓存

推荐一个机器学习学习资源,该项目从数学第一原理推导经典算法,并通过 Jupyter Notebook 逐步实现和可视化训练过程,帮助学习者直观理解。

0 人收藏 0 人点赞
#neural-networks

@satyanadella: Excel 在很长一段时间里就已经悄然实现了图灵完备。很高兴看到它现在正迈向“AI 完备”——SGD、注意力机制、……

X AI KOLs Following · 2026-05-10

Satya Nadella 指出,Excel 正在通过直接在单元格中实现 SGD、注意力机制和下一个标记预测功能,变得“AI 完备”。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈