标签
本文将书籍视为句子嵌入空间中的点,并将从原著到续集的变换分解为可解释的轴,揭示续集类型(公式化、集中型、复合型)的分类法。该方法应用于十三组作者对,并通过《汤姆·索亚历险记》到《哈克贝利·费恩历险记》的作者意图验证了该几何结构。
东京工业大学已免费公开机器学习课程材料,涵盖回归、神经网络、支持向量机、聚类和主成分分析等主题,并附有使用NumPy、scikit-learn和PyTorch的实践代码。
Shuo Yang 及其团队发布了 FlashLib,这是一个 GPU 库,可以加速 KMeans、KNN、HDBSCAN、PCA 和 t-SNE 等经典机器学习算子,声称加速比高达 208 倍。
Shard是一个即插即用的HuggingFace缓存,通过使用PCA加int4量化处理K(键),以及Hadamard旋转加向量量化处理V(值),为Llama-3.1-8B实现了10倍的KV缓存压缩,且在基准测试中无精度损失。
本文系统研究了不同评估目标(准确率、轮廓系数、PCA重构损失)以及子集大小正则化方向如何影响多目标无监督特征选择中的搜索动态与解质量,结果表明基于轮廓的公式倾向于产生琐碎的低基数解,而PCA损失则能生成紧凑且具有竞争性准确率的子集。
介绍 AdaPaD,一种用于 LoRA 微调的并行秩-1 缩减方法,使得低秩线性回归组件可以并行计算而非顺序计算,提高了效率。
对 24 张图像的柯达 PCD0992 图集进行首次逐图 PCA 分解,发现其在通道间冗余度上跨越两个数量级的精心策划。
谱调整(SpecTemp)提出了一种无需学习的密集段落检索嵌入压缩方法,该方法基于信噪比分析自适应地确定最优的谱缩放系数,性能优于PCA和白化等固定超参数方法。