标签
立场论文:主张为MILP决策引擎增加一个求解后鲁棒性层,形式化扰动下的可行邻域和解的平滑性,并呼吁采用经过认证的内部近似和对抗鲁棒性裕度。
本文系统分析了工具调用评估对随机种子、多轮模板等微小实现选择的敏感性,揭示这些因素可能导致性能大幅变化。同时,识别了基于强化学习的工具调用训练中的计算浪费来源,并介绍了在不牺牲性能的情况下加速训练的技术。
QUIVER 提出了一种形式化框架,用于量化在结构化为计算图的复合AI系统中扰动的传播方式,定义了灵敏度矩阵、轨迹发散、分岔阈值和分布忠实性,并在生产管道和公共管道上进行了验证。
一位16岁的开发者创建了sage-explainer,这是一个Python包,用于近似黑盒模型(如随机森林和XGBoost)对特征的预测灵敏度,提供比中心有限差分更稳定的结果。