normalization

#normalization

高效小型语言模型的Wiola架构

arXiv cs.AI ↗ · 2天前缓存

Wiola是一种新颖的小型语言模型（SLM）架构，引入了五个独立设计的组件——SRPE、GCLA、ATM、DSFF和WiolaRMSNorm——旨在提高效率和连贯性，发布了从1.2亿到15亿参数的多个规模，并与HuggingFace Transformers集成。

0 人收藏 0 人点赞

#normalization

Lobsters Hottest ↗ · 2026-06-12 缓存

本文讨论了在Subversion版本控制系统中，不同操作系统之间Unicode文件名组合（NFC与NFD）面临的挑战，并提出了处理这些差异的解决方案。

0 人收藏 0 人点赞

#normalization

arXiv cs.AI ↗ · 2026-06-08 缓存

本文提出TOPSIS-RAD，这是TOPSIS方法的一种改进版本，引入了决策者定义的参考水平（VPL和DPL），以解决与偏好不一致、异常值敏感性和排名逆转等问题。

0 人收藏 0 人点赞

#normalization

Lobsters Hottest ↗ · 2026-06-01 缓存

文章比较了归一化RGB值的两种方法（除以255 vs 除以256），并解释了浮点数转换和舍入的后果，包括在极端值处不均匀的区间宽度。

0 人收藏 0 人点赞

#normalization

Hugging Face Daily Papers ↗ · 2026-05-26 缓存

本文系统地研究了LLM归一化层中的缩放向量，揭示了它们通过自放大预条件效应优化训练，并提出了三种轻量级改进方案，在几乎不增加开销的情况下提升性能和扩展行为。

0 人收藏 0 人点赞

#normalization

arXiv cs.LG ↗ · 2026-05-18 缓存

本文提出了一种新的用于线性逆问题的基于能量的模型，该模型学习归一化后验密度，克服了扩散模型的局限性。它实现了无偏采样、自适应采样和盲退化估计，在ImageNet、CelebA和AFHQ上具有竞争力的性能。

0 人收藏 0 人点赞

#normalization

Hacker News Top ↗ · 2026-04-22 缓存

本文将列式存储重新定义为数据库规范化的极端形式，展示了把属性拆分为位置对齐的数组如何与基于隐式序数主键连接的规范化表如出一辙。

0 人收藏 0 人点赞