icml-2026

标签

Cards List
#icml-2026

基于局部披露的具有策略性主体的离线策略评估

arXiv cs.AI · 3天前 缓存

本文研究当决策主体(智能体)为了回应策略而策略性地修改其协变量时的离线策略评估(OPE)。该方法利用事后解释进行局部披露,以揭示智能体的前策略协变量,并构建策略价值的双重稳健估计量。

0 人收藏 0 人点赞
#icml-2026

@steverab:非常激动地分享,我们的论文《迈向AI智能体可靠性科学》已被ICML 2026接收!首尔见……

X AI KOLs Timeline · 6天前 缓存

一篇分析AI智能体可靠性的论文,已被ICML 2026接收。研究发现,即使是最新的前沿模型(GPT 5.5、Gemini 3.1 Pro、Claude Opus 4.7),相较于早期版本也仅有微小的可靠性提升,结果一致性较低,且智能体框架中依然存在持续性问题。

0 人收藏 0 人点赞
#icml-2026

交换关联泛函的导数信息学习

arXiv cs.LG · 2026-06-04 缓存

这篇ICML 2026论文介绍了Derivative Informed XC-Loss(DI-Loss),这是一种用于机器学习交换关联泛函的训练方法,它在密度矩阵的格拉斯曼流形上引入了一阶和二阶导数监督。在四种架构上,与仅使用能量和密度监督相比,DI-Loss将总能量平均绝对误差(MAE)降低了66%,并改善了TDDFT计算中的激发态预测。

0 人收藏 0 人点赞
#icml-2026

RT-Lynx:以正确方式将GEMM稀疏性应用于扩散模型

Hugging Face Daily Papers · 2026-05-26 缓存

RT-Lynx提出利用激活稀疏性而非权重稀疏性来加速扩散模型,在线性层上实现了高达1.55倍的加速,同时保持生成质量,并被ICML 2026接收。

0 人收藏 0 人点赞
#icml-2026

@elliotchen100: 翻译一下盛大旗下 MiroMind 这个工作。 post-training 的下一站,可能就是科学发现本身。 简单说,就是训练一个模型,让它能在不同学科里自己提出科研假设。物理化学生物都能用一套方法,论文中了 ICML 2026,代码开源…

X AI KOLs Timeline · 2026-05-19 缓存

该论文提出了一种可扩展的监督微调方法,用于训练语言模型跨学科提出科研假设,已被ICML 2026接收,代码已开源。

0 人收藏 0 人点赞
#icml-2026

MOOSE-Star (ICML 2026): 7B模型 + 108K论文数据集用于科学假设发现

Reddit r/LocalLLaMA · 2026-05-14

MOOSE-Star 提出了一个从 DeepSeek-R1-Distill-Qwen-7B 微调而来的 7B 模型,用于科学假设发现,同时附带一个包含 108K NCBI 论文的数据集。该模型在灵感检索准确率上达到了最先进水平,超越了像 GPT-5.4 和 Gemini-3 Pro 这样更大的模型。

0 人收藏 0 人点赞
#icml-2026

@JulieKallini: Fast Byte Latent Transformer 被 ICML 2026 接收!字节级语言模型有望摆脱子词分词器,但解码……

X AI KOLs Following · 2026-05-11 缓存

快速字节潜在变换器(BLT-D)已被 ICML 2026 接收,它引入了一种文本扩散方法,用于并行字节级解码,以克服传统字节级语言模型的速度限制。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈