标签
本文介绍了一个统一的决策理论预训练框架,用于基于神经网络的时间序列估计器,该框架在分层模拟上进行训练以逼近近最优决策规则。实验表明,所得估计器在合成和现实基准上均优于最大似然估计等传统方法。
一条推文,推广从零开始在C++中构建神经网络的指南,旨在提供关于神经网络工作原理的清晰而实用的解释。
新研究指出,规模化AI模型中看似出现的“全局收敛”实际是模型宽度和深度选择偏差造成的统计幻觉,一旦校准即消失。
Garry Tan 分享了 GBrain 的完整架构,这是一个 AI 模型。
一套覆盖神经网络核心概念的四张卡片:神经元、前向传播、激活函数和反向传播,旨在帮助学习者理解从感知机到Transformer等模型的工作原理。
一位微软AI研究员在《帝国时代II》中使用山羊构建了一个简单的神经网络,以论证如果这样的系统可以被视为有意识,那么聊天机器人中关于AI意识的主张同样荒谬。
提出RGNet,一种基于重整化群理论的神经网络架构,用于特征空间的分层粗粒化,以解决故障诊断中的类别不平衡和噪声问题。在AI4I数据集上的实验结果表明,RGNet提供了可解释且具有竞争力的性能。
Microcrad 用C语言重新实现了 Karpathy 的 micrograd 自动微分引擎,提供了一个教育性的标量值自动微分库,带有引用计数和小型神经网络,旨在帮助在标量层面理解反向传播。
作者描述了实现由 Geoffrey Hinton 提出的生物上合理的神经网络训练算法。
这篇博客文章介绍了幅度-方向(MD)解耦方法,该方法将神经网络权重矩阵分解为方向分量和幅度分量,并使用独立的学习率进行优化。实验表明,该方法在Adam和Muon优化器上均提升了性能,实现了跨模型宽度的自动学习率迁移,并在大规模混合专家模型中展现了缩放优势。
本文介绍了LANTERN,这是一个神经网络框架,用于从不规则纵向数据中估计健康状态转移概率,并应用于长期护理保险。在严重残疾和死亡预测的区分度和校准方面,它优于传统方法。
一名中国交易员在TikTok上展示AI神经网络可视化时,无意中暴露了自己用于套利的加密货币交易钱包,该钱包过去30天盈利36.7万美元,引发广泛追踪和讨论。
本文提出了一种新颖框架,利用大语言模型从科学文献中提取解析物理先验知识,并将其蒸馏到一个轻量级神经网络中,即使在数据有限的情况下,也能实现对制造过程-属性的高精度实时预测。
感知机是最简单的神经网络构建块。本教程从零开始用Python实现一个感知机,通过清晰的示例解释权重、偏置和学习过程。
MeshWeaver 提出了一种自回归网格生成框架,它使用多级稀疏体素编码器直接预测顶点,为高多边形网格实现了最先进的压缩率和几何保真度。
提出了摊销因子推理网络(AFINs),这是一类编码-合并-解码推理网络,能够泛化到不同的先验、似然和维度,在计算量少得多的条件下实现与NUTS相当的后验精度。
Thermocompute 是一个用于热力学概率计算的 PyTorch 仿真器,通过利用并行的热力学底层,使神经网络层能够实现恒定的建模物理时间推理,并立即提供可用于 GPU 的随机层。
AutoMCU是一个利用LLM的多智能体系统,可自动为微控制器单元设计神经网络,在确保硬件约束可行性的同时显著缩短定制时间。
VirtualPC 是一个开源8位计算机模拟器,能够从汇编代码训练小型神经网络,在裸机层面展示机器学习。