边缘AI驱动的学习排序方法用于循环智能制造的分散式任务分配

arXiv cs.LG 论文

摘要

本文提出了一种面向循环智能制造的边缘AI驱动分散式任务分配框架,该框架利用学习排序方法来匹配赢家选择的排序性质。仿真结果表明,在高负载和紧截止期限场景下,延迟、截止时间满足率和能源效率均得到改善。

arXiv:2605.16433v1 Announce Type: new Abstract: 任务分配在智能制造系统中需要在分散决策、动态工作负载和共享资源约束下运行。在循环制造环境中,平衡运营效率与资源和能源可持续性的需求进一步加剧了这些挑战。虽然已经探索了基于学习的方法,但许多方法侧重于预测绝对性能指标,这些指标并不一定能转化为改进的分配结果,因为分散分配由候选机器的相对排序决定。本文提出了一种基于排序感知协商的边缘AI驱动分散式任务分配框架,其中轻量级决策智能嵌入机器层面,以实现低延迟协调而无需集中控制。该框架逐步开发:首先,资源感知启发式建立了分散投标结构;然后,基于边缘AI的回归模型提供了学习的局部投标近似;最后,排序感知公式重新塑造了学习目标,以匹配赢家选择的排序性质。每台机器使用本地信息(包括处理能力、队列状态和资源争用)评估传入任务。通过离散事件仿真在高负载和紧截止期限场景下评估了延迟、截止时间违规、吞吐量和能源消耗。结果显示在高负载下延迟和截止时间遵守情况得到改善,在更严格的约束下能源效率提高,从而实现更资源高效的运行,符合循环制造目标。这些发现表明,将学习目标与分散决策结构对齐对于有效的协商驱动型任务分配至关重要。
查看原文
查看缓存全文

缓存时间: 2026/05/19 06:42

# 面向循环智能制造的去中心化任务分配的边缘AI驱动学习排序方法 来源: https://arxiv.org/html/2605.16433 \\undefine@key newfloatplacement\\undefine@keynewfloatname\\undefine@keynewfloatfileext\\undefine@keynewfloatwithin Mohammadhossein Ghahramani, Yan Qiao, and Mengchu ZhouM\. Ghahramani 与英国伯明翰城市大学合作, \(电子邮箱: mohammadhossein\.ghahramani@bcu\.ac\.uk\)Yan Qiao 与澳门科技大学澳门系统工程研究所及智能科学与系统协同实验室合作, 澳门, 中国 \(电子邮箱: yqiao@must\.edu\.mo\)\.M\. C\. Zhou 与 Helen and John C\. Hartmann 电气与计算机工程系, 新泽西理工学院, 纽瓦克, NJ 07102, 美国 \(电子邮箱: zhou@njit\.edu\)\. ###### 摘要 智能制造系统中的任务分配需要在去中心化决策、动态工作负载和共享资源约束下运行。在循环制造环境中,这些挑战因需要在运营效率与资源和能源可持续性之间取得平衡而进一步加剧。虽然基于学习的方法已被探索,但许多方法侧重于预测绝对性能指标,这些指标不一定能转化为更好的分配结果,因为去中心化分配由候选机器的相对排序决定。本文提出了一种基于排序感知协商的边缘AI驱动去中心化任务分配框架,其中轻量级决策智能嵌入在机器层面,使得无需集中控制即可实现低延迟协调。该框架逐步构建:首先,一种资源感知启发式方法建立了去中心化投标结构;然后,一个基于边缘AI的回归模型提供学习到的本地投标近似值;最后,一个排序感知公式重塑学习目标,以与基于排序的赢家选择保持一致。每台机器使用本地信息(包括处理能力、队列状态和资源争用)评估传入任务。通过离散事件仿真,在高负载和紧截止期限场景下,基于延迟、截止期限违反率、吞吐量和能耗进行评估。结果显示,在高负载下延迟和截止期限遵守情况有所改善,在更严格的约束下能效提高,从而实现了与循环制造目标更一致的资源高效运行。这些发现表明,将学习目标与去中心化决策结构对齐对于有效的协商驱动任务分配至关重要。00footnotetext: ###### 索引术语: 边缘AI, 循环制造, 资源分配, 去中心化建模, 智能系统。 ## I 引言 智能制造系统的特点是动态工作负载、异构处理能力和严格的操作约束[1 (https://arxiv.org/html/2605.16433#bib.bib1),2 (https://arxiv.org/html/2605.16433#bib.bib2),3 (https://arxiv.org/html/2605.16433#bib.bib3),4 (https://arxiv.org/html/2605.16433#bib.bib4)]。在新兴的循环制造环境中,这些挑战因需要在运营效率与资源利用和能源可持续性之间取得平衡而进一步加剧[5 (https://arxiv.org/html/2605.16433#bib.bib5),6 (https://arxiv.org/html/2605.16433#bib.bib6)]。在此类环境中,高效的任务分配对于确保系统响应性、吞吐量稳定性和能源效率至关重要。经典的任务分配方法通常被表述为集中式优化或调度问题,其中全局控制器基于完整的系统信息分配任务[7 (https://arxiv.org/html/2605.16433#bib.bib7),8 (https://arxiv.org/html/2605.16433#bib.bib8),9 (https://arxiv.org/html/2605.16433#bib.bib9)]。虽然此类方法在静态或适度动态条件下可以实现高质量解决方案,但由于可扩展性挑战、通信开销以及实时决策的需求,它们在现代制造系统中的适用性受限。这些限制推动了去中心化任务分配机制的发展,其中机器作为自主智能体运行,并基于部分系统信息做出本地决策[10 (https://arxiv.org/html/2605.16433#bib.bib10),11 (https://arxiv.org/html/2605.16433#bib.bib11),12 (https://arxiv.org/html/2605.16433#bib.bib12)]。在这些方法中,基于协商的方法,特别是基于投标的方法,可以成为一种灵活且可扩展的范式[13 (https://arxiv.org/html/2605.16433#bib.bib13),14 (https://arxiv.org/html/2605.16433#bib.bib14)]。在此类系统中,机器根据本地状态变量(如处理能力、队列条件和预期完成时间)评估传入任务,并提交引导分配过程的投标。这种分布式机制无需全局协调即可实现自适应行为。尽管有优势,但去中心化的基于协商的方法在捕捉系统级交互方面面临根本性挑战。在实际制造环境中,机器通常共享有限的资源,如工具、缓冲区或专用设备,这些资源在原本独立的决策之间引入了隐式耦合。从循环制造的角度来看,这些共享资源可以解释为可重复使用的生产资产,其高效利用至关重要。纯粹的本地投标策略无法完全考虑此类交互,导致在高负载条件或紧调度约束下出现次优分配。此外,近年来的进展探索了将基于学习的技术集成到去中心化决策中[15 (https://arxiv.org/html/2605.16433#bib.bib15)]。然而,许多现有方法侧重于预测绝对性能指标,如完成时间或成本,这些指标不一定能转化为更好的分配结果。这是因为任务分配决策本质上是比较性的:它们依赖于候选机器的相对排序,而不是其评估的绝对值。因此,未与此决策结构对齐的学习公式可能无法以有意义的方式影响系统行为。为解决这些挑战,我们提出了一种基于排序感知协商的边缘AI驱动去中心化任务分配框架。边缘AI是指在系统边缘(靠近数据源)直接执行智能决策,从而实现低延迟和去中心化操作[16 (https://arxiv.org/html/2605.16433#bib.bib16)]。在所提出的框架中,决策在机器层面使用轻量级模型本地执行,无需依赖集中协调。该方法保留了基于投标机制的灵活性,同时增加了捕捉候选机器之间相对偏好的学习组件。我们不是学习绝对的投标值,而是将决策制定公式化为候选机器上的排序问题,从而直接影响分配结果。此外,资源感知性被纳入协商过程,使得智能体能够在保持去中心化操作的同时隐式考虑共享资源争用。值得注意的是,虽然基于排序的学习在信息检索和推荐系统等领域已被广泛研究,但其在去中心化、基于协商的任务分配中的作用仍然在很大程度上未被探索。在此类系统中,分配决策完全由候选机器的相对排序而非预测值的绝对大小决定。因此,排序不仅仅是一种替代的学习公式,而是一个结构上对齐的目标,直接决定系统行为。本工作利用这一观察来重新设计学习组件,使其成为去中心化分配中的决策塑造机制。重要的是,所提出的框架并非作为独立分配方法的集合而开发。相反,它遵循逐步构建的方式。首先,一种资源感知启发式方法建立了去中心化投标结构。然后,一个基于边缘AI的回归模型用学习到的本地近似替代了手工制作的投标估计。最后,排序感知公式修改了学习目标本身,使得学习的组件与去中心化赢家选择的基于排序的性质对齐。本文旨在对分布式任务分配领域做出以下贡献: 1. 1. 提出了一种基于自主机器之间协商的去中心化任务分配框架,专为动态和资源受限的智能制造环境设计; 2. 2. 引入了一种渐进的边缘AI学习公式,从学习到的本地投标近似过渡到排序感知的决策塑造,使机器能够学习直接影响任务分配结果的相对偏好; 3. 3. 开发了一种资源感知协商机制,将共享资源争用纳入去中心化决策,无需集中协调; 4. 4. 通过实证分析表明,学习的益处不仅来自预测精度的提高,更来自将学习目标与去中心化决策的比较结构对齐。此外,本工作识别出现有基于学习方法的一个关键局限性,即绝对值预测与分配决策固有的基于排序性质之间的错位。它进一步提供了跨多个场景的全面实验评估,证明所提出的方法在保持竞争性吞吐量的同时,改善了延迟、截止期限遵守情况和能源效率。这些改进有助于更高效地利用共享资源,这与循环智能制造的目标一致。本文的其余部分组织如下:第二节 (https://arxiv.org/html/2605.16433#S2) 回顾了去中心化任务分配和基于协商的协调的相关工作。第三节 (https://arxiv.org/html/2605.16433#S3) 提出了正式的问题公式化。第四节 (https://arxiv.org/html/2605.16433#S4) 描述了所提出的框架。第五节 (https://arxiv.org/html/2605.16433#S5) 概述了实验设置。第六节 (https://arxiv.org/html/2605.16433#S6) 呈现并分析了结果。最后,第七节 (https://arxiv.org/html/2605.16433#S7) 对本文进行总结。 ## II 相关工作 制造系统中的任务分配和调度已在广泛的范式中得到广泛研究,包括集中式优化、分布式协调和基于学习的决策[17 (https://arxiv.org/html/2605.16433#bib.bib17),18 (https://arxiv.org/html/2605.16433#bib.bib18),19 (https://arxiv.org/html/2605.16433#bib.bib19)]。这些挑战应在循环智能制造的背景下审视,其中共享资源的高效利用和重用以及能量敏感操作发挥着越来越重要的作用。制造系统中任务分配的经典方法通常被表述为集中式优化问题,其中全局调度器基于完整的系统信息将任务分配给机器[9 (https://arxiv.org/html/2605.16433#bib.bib9)]。这些方法包括数学规划、启发式调度和基于规则的调度策略[7 (https://arxiv.org/html/2605.16433#bib.bib7)]。虽然此类方法在受控和静态条件下可以实现高质量解决方案,但由于可扩展性约束、计算复杂性和实时响应的需求,它们在现代制造环境中的适用性受限。为解决集中式方法的局限性,人们提出了分布式和多智能体系统,其中机器作为自主决策实体运行。在这些框架中,任务分配基于本地信息执行,并在动态环境中提高了可扩展性和鲁棒性。例如,Canzini 等人开发了一个用于夹具布局规划的多智能体学习框架,在复杂制造任务中展示了改进的优化性能[20 (https://arxiv.org/html/2605.16433#bib.bib20)]。Yan 等人提出了一种事件触发通信下多智能体系统的自适应控制方案,重点是在保持系统稳定性的同时减少通信开销[21 (https://arxiv.org/html/2605.16433#bib.bib21)]。Zhang 等人研究了网络攻击和延迟下非线性多智能体系统的安全共识。他们引入了事件触发控制机制以增强鲁棒性和效率[22 (https://arxiv.org/html/2605.16433#bib.bib22)]。尽管有这些进展,但大多数现有研究侧重于控制稳定性、优化或通信效率,并未明确解决学习公式如何影响去中心化决策和任务分配结果。此外,由于系统可见性有限以及智能体之间缺乏显式协调,特别是在存在共享资源或相互依赖约束的情况下,它们可能难以实现全局高效的结果。鉴于这些限制,基于协商的机制(即基于拍卖和投标策略)为去中心化协调提供了一种灵活且可扩展的方法。在此类系统中,智能体提交反映其估计执行成本或效用的投标,任务根据选择规则(通常基于投标最小化)进行分配。Tang 等人在一个基于拍卖的学习框架内提出了一种多智能体投标策略,利用聚类技术增强可扩展性和投标效率[13 (https://arxiv.org/html/2605.16433#bib.bib13)]。类似地,Xu 等人为车辆互联网系统中的数据任务分配引入了一种迭代双边拍卖机制,在优化社会福利的同时实现分布式决策[23 (https://arxiv.org/html/2605.16433#bib.bib23)]。尽管有这些进展,但现有的基于拍卖的方法主要侧重于效率、可扩展性或收敛性质,并未明确解决学习公式如何影响投标排序和去中心化任务分配结果。它们依赖于主要反映本地机器状态(如队列长度或处理能力)的手工制作公式。因此,它们可能无法捕捉系统级交互,特别是在具有共享资源或耦合约束的环境中。这一限制在循环制造环境中变得尤为相关,其中共享资产的高效重用需要超越纯粹本地推理的协调。最近,基于学习的方法已被探索用于改善动态环境中的任务分配决策[24 (https://arxiv.org/html/2605.16433#bib.bib24),25 (https://arxiv.org/html/2605.16433#bib.bib25)]。这些方法通常采用学习机制来估计性能指标,如完成时间、成本或效用,然后用于指导调度决策。然而,许多现有基于学习方法的一个根本局限性在于它们侧重于预测绝对性能值。在去中心

相似文章

低成本标签,可靠选择:用于作业车间调度的Rollout校准超启发式算法

arXiv cs.AI

本文提出了一种用于作业车间调度的门控超启发式算法,该算法使用遗憾归一化的滚动标签和上下文KNN不确定性估计,以降低标签生成成本,并避免在预测改进不可信时切换出强默认规则。实验表明,该门控选择器实现了较低的均值相对百分比偏差,同时显著降低了计算成本。

AI系统学会让仓库机器人交通顺畅运行

MIT News — Artificial Intelligence

来自MIT和Symbotic的研究人员开发了一种深度强化学习系统,用于优化自主仓库中的机器人交通。该系统通过动态优先调度机器人来避免拥堵,实现了比现有方法高出25%的吞吐量提升。