标签
本文介绍了重复策略遗憾(RP-Regret),一种用于自适应对手重复博弈中遗憾最小化的博弈论度量,并提出了三种算法来最小化它,表明这样做可以导致如猎鹿博弈中的合作均衡。
GLENS是一种数据高效的全局搜索方法,利用扩散模型通过将中间求解器迭代作为免费数据增强,为非凸优化问题中的局部最小值生成多样且高质量的初始猜测。
本文首次建立了使用小批量SGD和带有相关噪声的DP-SGD训练的Kolmogorov-Arnold网络的总体风险界,推动了在隐私敏感领域对KAN的理论理解。