stability

#stability

论大型语言模型评估中提示排名的稳定性

arXiv cs.CL ↗ · 昨天缓存

本文系统研究了常见变异来源下，大型语言模型评估中提示排名的稳定性，发现表现最佳的提示经常发生变化。为此，提出了一种基于下置信界的稳定性感知选择策略，以提高鲁棒性。

0 人收藏 0 人点赞

#stability

@MMMusol: 用顶级AI，就像点一碗牛肉粉第一次看到这句话的时候笑了一下，但现在回头想想，这可能是我见过最实诚的AI产品描述了。我是从去年开始重度使用 Claude Code 和 Codex 做开发，官方 API 的价格大家都知道，Opus 级别…

X AI KOLs Following ↗ · 4天前缓存

文章介绍了BeefAPI作为AI API中转服务的实际使用体验，强调了其稳定性、副模型一键配置、额度计算器等功能，并提及端午节优惠活动。

0 人收藏 0 人点赞

#stability

关于循环变换器中残差缩放：稳定性与可迁移性

arXiv cs.LG ↗ · 2026-06-18 缓存

本文分析了循环（权重共享）变换器中的残差缩放问题，表明权重共享需要比标准残差网络更强的缩放（1/N），并推导出一种因式参数化方法，使得超参数可以在不同循环次数之间迁移，无需重新调参。

0 人收藏 0 人点赞

#stability

让GHC升级更简单

Lobsters Hottest ↗ · 2026-06-17 缓存

GHC团队概述了使GHC升级更简单的进展，重点关注Big Stability Goal和Base Package Goal，以将基础包从编译器发布中解耦。

0 人收藏 0 人点赞

#stability

@docmilanfar: 我非常喜欢我们最近关于"Geometry of Noise"的论文的解释性文章 arXiv:2602.18428

X AI KOLs Timeline ↗ · 2026-06-17 缓存

本文提供了理论解释，说明为什么扩散模型可以在没有显式噪声水平条件的情况下生成干净的样本，将其归因于高维几何，并分析为什么某些模型参数化成功而其他模型崩溃。

0 人收藏 0 人点赞

#stability

@BetaTomorrow: https://x.com/BetaTomorrow/status/2066435380623385000

X AI KOLs Timeline ↗ · 2026-06-15 缓存

该线程讨论了AI中的'Jagged Intelligence'概念，将其视为AI学习是一个不适定逆问题的结果，并认为像脚手架和验证这样的外部稳定器是必不可少的。

0 人收藏 0 人点赞

#stability

Mirror Descent 超越欧几里得稳定性：初始化敏感性的指数级分离

arXiv cs.LG ↗ · 2026-06-11 缓存

本文揭示了，即使在条件良好的设置下，使用非二次正则化项的 Mirror Descent 比 Gradient Descent 对初始化敏感得多（指数级），这对强化学习和LLM后训练中的可重复性具有重要意义。

0 人收藏 0 人点赞

#stability

OpenClaw 2026.6.5 版本摘要 | 免费 Parallel Search | 大量稳定性修复

Reddit r/openclaw ↗ · 2026-06-10

OpenClaw 2026.6.5 引入了免费的内置 Parallel Search，并在渠道、提供商、状态管理和应用行为方面进行了大量稳定性修复。

0 人收藏 0 人点赞

#stability

@jinchenma_ai: https://x.com/jinchenma_ai/status/2061835131107860582

X AI KOLs Timeline ↗ · 2026-06-02 缓存

文章基于AI Agent（Skill）的工程化方法，提出将确定性的任务固化为脚本，减少大模型运行时的新判断，从而提升稳定性和Token效率。以视频字幕处理为例，展示了四步工程化流程。

0 人收藏 0 人点赞

#stability

通过监督投影流形学习的李群嵌入神经动力学规划

arXiv cs.LG ↗ · 2026-05-27 缓存

本文提出了一种李群嵌入动态神经网络（LieEDNN）及其基于梯度下降和光滑流形度量投影的学习算法，能够在SO(3)和SE(3)等李群上实现稳定动力学，用于机器人学和控制应用。

0 人收藏 0 人点赞

#stability

ETH Zurich 构建了一个横跨17,000个量子比特对的超稳定量子门

Reddit r/ArtificialInteligence ↗ · 2026-05-26 缓存

ETH Zurich 研究人员利用中性原子开发了一种超稳定的几何交换门，在17,000个量子比特对上实现了99.91%的精度，这标志着向容错量子计算迈出了重要一步。

0 人收藏 0 人点赞

#stability

用于稳定多智能体策略学习的度量梯度投影

arXiv cs.LG ↗ · 2026-05-20

介绍HPML，一种将多智能体系统的联合更新场投影到度量梯度分量上以稳定和改进多智能体强化学习的方法。它提供了理论保证，并在CTDE基准测试上展示了改进的稳定性和回报。

0 人收藏 0 人点赞

#stability

逐层导数控制网络

arXiv cs.LG ↗ · 2026-05-18 缓存

介绍了ChainzRule，一种使用多项式引擎和微分正则化的神经架构，用于平衡准确性、硬件效率和功能稳定性，以15.5倍的参数减少和更平滑的梯度优于标准模型。

0 人收藏 0 人点赞

#stability

GESD：超越结果导向的公平性

arXiv cs.LG ↗ · 2026-05-18 缓存

本文提出了GESD，一种面向过程的公平性度量，用于衡量不同子组之间解释稳定性的差异，并将其集成到一个多目标优化框架中，以联合优化效用、结果公平性和解释公平性。

0 人收藏 0 人点赞

#stability

诊断大语言模型强化学习中的训练-推理不匹配

arXiv cs.LG ↗ · 2026-05-15 缓存

本文诊断了大语言模型强化学习中的训练-推理不匹配（TIM），表明训练和推理阶段令牌概率之间的微小数值差异可能导致训练崩溃，并提出了补救措施。

0 人收藏 0 人点赞

#stability

@HuggingPapers: Stable-GFlowNet：通过对比轨迹平衡实现多样化且鲁棒的 LLM 红队测试 Naver AI 消除了不稳定的…

X AI KOLs Following ↗ · 2026-05-09 缓存

Naver AI 推出了 Stable-GFlowNet，这是一种通过对比轨迹平衡来消除生成流网络中不稳定的配分函数估计，从而改善 LLM 红队测试的方法。

0 人收藏 0 人点赞

#stability

别了英特尔，你好AMD！两块英特尔CPU报废后我彻底放弃

Michael Stapelberg ↗ · 2025-09-07 缓存

在两个Intel Core Ultra 9 285K CPU在几个月内相继故障后，作者转而使用AMD Ryzen 9950X3D，指出英特尔当前CPU存在广泛的稳定性问题。

0 人收藏 0 人点赞

#stability

Intel 9 285K 在 ASUS Z890 上：不稳定！

Michael Stapelberg ↗ · 2025-03-19 缓存

关于 Intel Core Ultra 9 285K CPU 在 ASUS Z890 主板上稳定性问题的详细报告，包括崩溃和调试步骤，提醒潜在买家。

0 人收藏 0 人点赞

stability

提交意见反馈