@probnstat: 每位机器学习工程师都应了解的一个定理:Johnson-Lindenstrauss 引理。它指出,高维数据可以……
摘要
本文重点介绍了 Johnson-Lindenstrauss 引理,解释了其在帮助机器学习工程师理解降维、随机投影和嵌入效率方面的重要性。
每位机器学习工程师都应了解的一个定理:Johnson-Lindenstrauss 引理。该定理指出,高维数据可以被投影到一个低得多的维度空间中,同时近似保持点与点之间的距离。
为何它很重要:
• 解释了随机投影为何有效
• 使高维空间中的可扩展学习成为可能
• 应用于嵌入(embeddings)、压缩学习和近似最近邻(ANN)搜索
• 有助于对抗维度灾难
令人惊讶的是:你可以大幅降低维度而不破坏数据的几何结构。这就是为什么许多机器学习系统即使面对巨大的特征空间也能高效运行的原因。
现代表征学习(representation learning)与这一思想密切相关:优质的嵌入在压缩信息的同时保留结构。在机器学习中,压缩往往并不意味着智能的损失,而是冗余的去除。
相似文章
@Hesamation: 3Blue1Brown 的新视频解释了为什么每个LLM实际上都是一台压缩机器。每个人都把预训练描述为“下一个...”
3Blue1Brown 的新视频解释了LLM本质上是压缩机器,将下一个词预测与人类知识的高效编码联系起来,从而带来更好的抽象和推理能力。
@rohanpaul_ai: 陶哲轩表示,如今LLMs背后的数学其实很简单。训练和运行它们主要用到线性代数,…
陶哲轩指出,现代LLMs背后的数学很简单,主要使用基本的线性代数和微积分,但模型在不同任务上的性能不可预测性仍是一个谜,原因在于自然语言数据的复杂本质。
高维几何正在变革MRI行业(2017)[pdf]
2017年David Donoho在美国数学会(AMS)的一个演讲讨论了高维几何如何彻底改变MRI行业,很可能通过压缩感知及相关数学技术。
@Tabbu_ai: https://x.com/Tabbu_ai/status/2058145123444347339
一篇教育性推文串,解释了理解和从头构建LLM架构的11个关键课程,涵盖token、嵌入、注意力、位置编码、数据质量和常见误解。
任意维度不变普适性
本文开发了一个系统框架,用于建立处理可变维度输入(例如,具有不同节点数的图)的机器学习模型的普适性。论文表明许多现有架构不具有普适性,并提出了简单的修改来恢复普适性。