标签
OpenAI 提出进化策略(ES)作为一种可扩展的黑箱优化方法,可替代强化学习用于训练神经网络策略。进化策略通过将策略训练视为随机参数搜索来简化优化问题,该搜索基于奖励反馈反复采样并选择更优的参数配置。
Linera 推出 microchain,彻底消除区块空间竞争,为 AI 代理和去中心化应用提供实时性能保障。