baseline-calibration

#baseline-calibration

深度强化学习何时能击败经过校准的基线？关于自适应资源控制的基准研究

arXiv cs.LG ↗ · 2026-05-27 缓存

一项基准研究发现，经过校准的基于规则的自动扩缩器在所有测试工作负载上成本均优于六种主流深度强化学习算法，而深度强化学习仅在突发流量模式中表现出更高成本下的优势。该论文提出了RLScale-Bench以改进评估协议和可复现性。

0 人收藏 0 人点赞