标签
对AI导师Koji的批评,突出了其数学教学方法的缺陷,例如允许学生毫无指导地摸索,以及遗漏关键的概念性解释。
Geomatic 是一个命令驱动的几何工作室,利用自动微分实现交互式几何操作。
本文介绍了LOES(逐层最优嵌入选择)和GeoReg(几何正则化损失)方法,这些方法从深度模型中选择并融合与任务相关的中间层,以提升迁移学习性能,并在多种架构和模态上展现出一致的性能提升。
本文引入表示差距(Representation Gap),一个具有更好渐近动态的神经网络泛化误差度量。通过几何视角和最优量化理论,作者证明该度量由任务的内在维度主导,并在合成和真实数据集上进行了实证验证。
OpenAI声称其未发布的推理模型解决了数学中具有80年历史的平面单位距离问题,并产生了一个优于传统基于网格排列的原始证明。
StampFormer 是一种物理引导的深度学习框架,融合几何和材料属性,在不到一秒内预测板料冲压的有限元分析结果,相对误差低于8.5%,实现了高保真度。
本文研究了是否可以通过无监督几何方法对齐不同被试视觉皮层的fMRI表示,发现了个体间近似等距结构的证据,将柏拉图式表示假说扩展到人脑。
本文利用形状分析工具,刻画了不同数据增强策略如何重塑神经网络表征的几何结构,发现增强强度和类型会在形状空间中产生截然不同且具有良好规律的轨迹。
本文提出了一个统一的几何框架,证明加权InfoNCE目标可以解释为距离几何问题,从而精确刻画了有监督和弱监督对比学习方法的最优嵌入,并揭示了这些嵌入何时在几何上可实现、退化或不一致。
# 大语言模型几何表示鲁棒性评测 来源:[https://arxiv.org/html/2604.16421](https://arxiv.org/html/2604.16421) Vedant Jawandhia 计算机科学与信息系统系,BITS Pilani \{f20220627, dhruv\.kumar, yash\.sinha\}@pilani\.bits\-pilani\.ac\.in Yash Sinha 计算机科学与信息系统系,BITS Pilani \{f20220627, dhruv\.kumar, yash\.sinha\}@pilani\.bits\-pilani\.ac\.in Ankan Pal 数学系,BITS Pilani
RDP-LoRA 通过几何轨迹分析与 Ramer-Douglas-Peucker 算法,自动挑出对参数高效微调最关键的层,效果优于全层及随机 LoRA 基线。
研究人员分析了LLMs在8种语言和多个模型中的内部表示,发现概念思考发生在transformer中间层的几何空间中,且与输入语言无关,这支持了类似于乔姆斯基理论的普遍深层结构假说,而非萨丕尔-沃尔夫语言相对论。