标签
本文系统研究了常见变异来源下,大型语言模型评估中提示排名的稳定性,发现表现最佳的提示经常发生变化。为此,提出了一种基于下置信界的稳定性感知选择策略,以提高鲁棒性。
文章介绍了BeefAPI作为AI API中转服务的实际使用体验,强调了其稳定性、副模型一键配置、额度计算器等功能,并提及端午节优惠活动。
本文分析了循环(权重共享)变换器中的残差缩放问题,表明权重共享需要比标准残差网络更强的缩放(1/N),并推导出一种因式参数化方法,使得超参数可以在不同循环次数之间迁移,无需重新调参。
GHC团队概述了使GHC升级更简单的进展,重点关注Big Stability Goal和Base Package Goal,以将基础包从编译器发布中解耦。
本文提供了理论解释,说明为什么扩散模型可以在没有显式噪声水平条件的情况下生成干净的样本,将其归因于高维几何,并分析为什么某些模型参数化成功而其他模型崩溃。
该线程讨论了AI中的'Jagged Intelligence'概念,将其视为AI学习是一个不适定逆问题的结果,并认为像脚手架和验证这样的外部稳定器是必不可少的。
本文揭示了,即使在条件良好的设置下,使用非二次正则化项的 Mirror Descent 比 Gradient Descent 对初始化敏感得多(指数级),这对强化学习和LLM后训练中的可重复性具有重要意义。
OpenClaw 2026.6.5 引入了免费的内置 Parallel Search,并在渠道、提供商、状态管理和应用行为方面进行了大量稳定性修复。
文章基于AI Agent(Skill)的工程化方法,提出将确定性的任务固化为脚本,减少大模型运行时的新判断,从而提升稳定性和Token效率。以视频字幕处理为例,展示了四步工程化流程。
本文提出了一种李群嵌入动态神经网络(LieEDNN)及其基于梯度下降和光滑流形度量投影的学习算法,能够在SO(3)和SE(3)等李群上实现稳定动力学,用于机器人学和控制应用。
ETH Zurich 研究人员利用中性原子开发了一种超稳定的几何交换门,在17,000个量子比特对上实现了99.91%的精度,这标志着向容错量子计算迈出了重要一步。
介绍HPML,一种将多智能体系统的联合更新场投影到度量梯度分量上以稳定和改进多智能体强化学习的方法。它提供了理论保证,并在CTDE基准测试上展示了改进的稳定性和回报。
介绍了ChainzRule,一种使用多项式引擎和微分正则化的神经架构,用于平衡准确性、硬件效率和功能稳定性,以15.5倍的参数减少和更平滑的梯度优于标准模型。
本文提出了GESD,一种面向过程的公平性度量,用于衡量不同子组之间解释稳定性的差异,并将其集成到一个多目标优化框架中,以联合优化效用、结果公平性和解释公平性。
本文诊断了大语言模型强化学习中的训练-推理不匹配(TIM),表明训练和推理阶段令牌概率之间的微小数值差异可能导致训练崩溃,并提出了补救措施。
Naver AI 推出了 Stable-GFlowNet,这是一种通过对比轨迹平衡来消除生成流网络中不稳定的配分函数估计,从而改善 LLM 红队测试的方法。
在两个Intel Core Ultra 9 285K CPU在几个月内相继故障后,作者转而使用AMD Ryzen 9950X3D,指出英特尔当前CPU存在广泛的稳定性问题。
关于 Intel Core Ultra 9 285K CPU 在 ASUS Z890 主板上稳定性问题的详细报告,包括崩溃和调试步骤,提醒潜在买家。