标签
本文通过代码示例解释了为什么 Windows Runtime 异步活动的取消是异步的,以及它如何避免死锁,尤其是在进度回调触发取消时。
CONCORD是一个异步稀疏聚合框架,用于设备-云设置中文档隔离下的检索增强生成(RAG)。它将云视为异步到达的证据源而非持续同步的协同生成器,从而大幅提升吞吐量并将通信量减少数个数量级。
一条推文强调了通过hillclimb(爬山算法)RLMs来激励启动代码块的潜力,并引用了一种新的去中心化语言模型(DeLM)方法,其中多个智能体通过共享上下文进行异步协调。
本文介绍了RACE-Sched,一种异步智能体框架,它将实时反应式调度与基于LLM的深思熟虑推理解耦,以处理动态作业车间调度问题,在DRL和其他基准方法上取得了更优的性能。
本文提出了PushCen-ADFL,一种通信高效的异步去中心化联邦学习框架,它使用基于质心的消息传递和偏差纠正,在异构条件下提高准确性并降低通信开销。
本文介绍了AsyncTool,一个用于评估基于LLM的智能体在多任务场景下具有延迟工具响应的异步函数调用能力的基准测试。它提出了面向效率的度量指标,并识别了当前工具使用智能体的关键失败模式。
D-VLA 提出了一种高并发分布式异步强化学习框架,用于视觉-语言-动作模型,采用平面解耦和泳道管线提升大规模具身智能训练中的吞吐量和效率。
AReaL是一个用于LLM推理的完全异步强化学习系统,相比同步系统实现了高达2.57倍的训练加速,同时保持或提升了性能。它将生成与训练解耦以提高GPU利用率,并包含诸如staleness-enhanced PPO等优化。