neural-network

#neural-network

模拟体：用于近最优时间序列预测与推断的决策理论预训练

arXiv cs.LG ↗ · 19小时前缓存

本文介绍了一个统一的决策理论预训练框架，用于基于神经网络的时间序列估计器，该框架在分层模拟上进行训练以逼近近最优决策规则。实验表明，所得估计器在合成和现实基准上均优于最大似然估计等传统方法。

0 人收藏 0 人点赞

#neural-network

@chessMan786: 如何在C++中从零开始构建神经网络你是否在寻找关于神经网络实际工作原理的清晰且实用的解释？

X AI KOLs Timeline ↗ · 昨天缓存

一条推文，推广从零开始在C++中构建神经网络的指南，旨在提供关于神经网络工作原理的清晰而实用的解释。

0 人收藏 0 人点赞

#neural-network

@FinanceYF5: 柏拉图式表征假说，大多是一种统计幻觉。新研究显示，规模化 AI 模型看似出现的“全局收敛”，其实是模型宽度和深度选择偏差造成的数学伪影。一旦校准，全局收敛就会消失。

X AI KOLs Following ↗ · 昨天缓存

新研究指出，规模化AI模型中看似出现的“全局收敛”实际是模型宽度和深度选择偏差造成的统计幻觉，一旦校准即消失。

0 人收藏 0 人点赞

#neural-network

@himanshutwtxs: Garry Tan 的 GBrain 完整架构

X AI KOLs Timeline ↗ · 3天前缓存

Garry Tan 分享了 GBrain 的完整架构，这是一个 AI 模型。

0 人收藏 0 人点赞

#neural-network

@tetsuoai: 神经网络的核心就在四张卡片上。神经元、前向传播、激活函数、反向传播。学会这四个概念，你就能……

X AI KOLs Timeline ↗ · 6天前缓存

一套覆盖神经网络核心概念的四张卡片：神经元、前向传播、激活函数和反向传播，旨在帮助学习者理解从感知机到Transformer等模型的工作原理。

0 人收藏 0 人点赞

#neural-network

《帝国时代II》中以山羊为基础的神经网络凸显了AI意识主张的局限性。

Reddit r/ArtificialInteligence ↗ · 2026-06-21 缓存

一位微软AI研究员在《帝国时代II》中使用山羊构建了一个简单的神经网络，以论证如果这样的系统可以被视为有意识，那么聊天机器人中关于AI意识的主张同样荒谬。

0 人收藏 0 人点赞

#neural-network

用于类别不平衡故障诊断的重整化群神经网络实现

arXiv cs.LG ↗ · 2026-06-18 缓存

提出RGNet，一种基于重整化群理论的神经网络架构，用于特征空间的分层粗粒化，以解决故障诊断中的类别不平衡和噪声问题。在AI4I数据集上的实验结果表明，RGNet提供了可解释且具有竞争力的性能。

0 人收藏 0 人点赞

#neural-network

Show HN: Microcrad – 用C语言重新实现的Micrograd

Hacker News Top ↗ · 2026-06-17 缓存

Microcrad 用C语言重新实现了 Karpathy 的 micrograd 自动微分引擎，提供了一个教育性的标量值自动微分库，带有引用计数和小型神经网络，旨在帮助在标量层面理解反向传播。

0 人收藏 0 人点赞

#neural-network

我实现了诺贝尔奖得主 Jeff Hinton 提出的生物上可能的网络训练算法

Reddit r/artificial ↗ · 2026-06-17

作者描述了实现由 Geoffrey Hinton 提出的生物上合理的神经网络训练算法。

0 人收藏 0 人点赞

#neural-network

通过解耦权重向量的幅度和方向改进神经网络训练 | Alexander Hägele

Reddit r/LocalLLaMA ↗ · 2026-06-15 缓存

这篇博客文章介绍了幅度-方向（MD）解耦方法，该方法将神经网络权重矩阵分解为方向分量和幅度分量，并使用独立的学习率进行优化。实验表明，该方法在Adam和Muon优化器上均提升了性能，实现了跨模型宽度的自动学习率迁移，并在大规模混合专家模型中展现了缩放优势。

0 人收藏 0 人点赞

#neural-network

一种纵向属性条件神经网络，用于建模时间不规则数据中的健康状态转移概率：LANTERN框架

arXiv cs.LG ↗ · 2026-06-15 缓存

本文介绍了LANTERN，这是一个神经网络框架，用于从不规则纵向数据中估计健康状态转移概率，并应用于长期护理保险。在严重残疾和死亡预测的区分度和校准方面，它优于传统方法。

0 人收藏 0 人点赞

#neural-network

@7mood10061: 一个中国交易员，本想在TikTok炫耀自己的AI神经网络可视化，结果不小心把自己的印钞机暴露给了全世界他录了一条2分钟的视频，展示一个发光的神经网络：节点闪烁、隐藏层交织、蓝色的突触像神经一样流动，看起来像一个普通的AI技术演示。视频…

X AI KOLs Timeline ↗ · 2026-06-11 缓存

一名中国交易员在TikTok上展示AI神经网络可视化时，无意中暴露了自己用于套利的加密货币交易钱包，该钱包过去30天盈利36.7万美元，引发广泛追踪和讨论。

0 人收藏 0 人点赞

#neural-network

基于大语言模型的物理蒸馏神经网络用于制造过程-属性预测建模

arXiv cs.LG ↗ · 2026-06-11 缓存

本文提出了一种新颖框架，利用大语言模型从科学文献中提取解析物理先验知识，并将其蒸馏到一个轻量级神经网络中，即使在数据有限的情况下，也能实现对制造过程-属性的高精度实时预测。

0 人收藏 0 人点赞

#neural-network

你能构建的最小大脑：Python中的感知机

Hacker News Top ↗ · 2026-06-08 缓存

感知机是最简单的神经网络构建块。本教程从零开始用Python实现一个感知机，通过清晰的示例解释权重、偏置和学习过程。

0 人收藏 0 人点赞

#neural-network

MeshWeaver: 稀疏体素引导的表面编织用于自回归网格生成

Hugging Face Daily Papers ↗ · 2026-06-03 缓存

MeshWeaver 提出了一种自回归网格生成框架，它使用多级稀疏体素编码器直接预测顶点，为高多边形网格实现了最先进的压缩率和几何保真度。

0 人收藏 0 人点赞

#neural-network

摊销因子推理网络用于后验推理

arXiv cs.LG ↗ · 2026-05-27 缓存

提出了摊销因子推理网络（AFINs），这是一类编码-合并-解码推理网络，能够泛化到不同的先验、似然和维度，在计算量少得多的条件下实现与NUTS相当的后验精度。

0 人收藏 0 人点赞

#neural-network

Thermocompute 常量时间推理 [P]

Reddit r/MachineLearning ↗ · 2026-05-24 缓存

Thermocompute 是一个用于热力学概率计算的 PyTorch 仿真器，通过利用并行的热力学底层，使神经网络层能够实现恒定的建模物理时间推理，并立即提供可用于 GPU 的随机层。

0 人收藏 0 人点赞

#neural-network

AutoMCU：基于LLM的多智能体系统的可行性优先MCU神经网络定制

arXiv cs.LG ↗ · 2026-05-22 缓存

AutoMCU是一个利用LLM的多智能体系统，可自动为微控制器单元设计神经网络，在确保硬件约束可行性的同时显著缩短定制时间。

0 人收藏 0 人点赞

#neural-network

一台从电脑文件夹运行、可训练小型LLM的迷你计算机

Reddit r/artificial ↗ · 2026-05-17

VirtualPC 是一个开源8位计算机模拟器，能够从汇编代码训练小型神经网络，在裸机层面展示机器学习。

0 人收藏 0 人点赞

#neural-network

Show HN: 观看神经网络学习玩贪吃蛇

Hacker News Top ↗ · 2026-05-14 缓存

一个基于网页的工具，可实时可视化神经网络（使用PPO算法）学习玩贪吃蛇，支持可配置参数和3D渲染。

0 人收藏 0 人点赞

neural-network

提交意见反馈