作为一种新兴的计算模式,边缘计算将计算能力从云中心转移到网络边缘侧,不仅解决了传感器设备计算能力不足的问题,而且满足了大规模工业生产过程中对延迟敏感应用日益增长的需求。然而,传感器设备数量的激增导致卸载到边缘服务器的任务量超过其计算能力,工业应用的服务质量无法得到保证。随着硬件技术的发展,部分传感器设备的计算能力得以提升。因此,本文引入了一种新的概念——计算回载,即将边缘服务器上的部分计算任务分配给具有较强计算能力的传感器设备。以往涉及计算迁移的研究大多局限于根据传感器设备的静态位置进行计算任务的分配。然而,传感器设备的位置通常具有极高的时空移动性,往往导致边缘服务器的计算任务不断地被重新分配,造成较大的时延,影响整体的工业生产效率。本文将计算任务的分配建模为最优化问题,针对单时间片和多时间片两种不同的场景,通过对传感器设备的位置进行预测来获取需要辅助边缘服务器完成计算任务的传感器设备的最优组合。基于真实数据集的实验表明,与其它的计算任务分配方法相比,本文提出的算法不仅具有高可行性,还能有效地降低系统时延。
该成果“CRSM: Computation Reloading Driven by Spatial-temporal Mobility in Edge-assisted Automated Industrial Cyber-Physical Systems”已被期刊IEEE Transactions on Industrial Informatics(TII)录用,IEEE TII是工业物联网领域的SCI一区期刊,2020年影响因子为10.215。
论文链接:
https://ieeexplore.ieee.org/document/9756249
背景与动机
万物互联时代的兴起与发展极大地促进了各式各样的传感器设备数目爆炸式增长。根据国际数据中心统计,到2025年全世界已经存在超过750亿的传感器设备联网。与此同时,传感器技术的智能化发展和传感器设备的庞大数目促进了工业4.0的发展,进而引发了工业生产业务数量的急速上升。然而,传感器设备电源能量受限、通信能力有限以及计算和存储资源的匮乏极大地减缓了工业生产能力,无法按时有效地完成日益迅猛增长的工业生产任务量。为了解决此问题,部分现有的研究工作是将计算任务直接卸载到云中心执行,有效地提高了工业生产力,并且改善了生产任务的日完成率。虽然云中心具有巨大的存储空间以及丰富的计算资源,但是云中心通常与各个传感器设备之间的距离较远,并且可能存在传输链路不可靠情形,由此不免引发了通信延迟,增加了通信开销,甚至对工业生产效率产生一定的消极影响。
近年来,边缘计算的引入明显减少了传感器设备直接访问云中心的频次。边缘计算核心思想是将具备一定计算和存储能力的边缘服务器部署到传感器设备的网络边缘侧。具体而言,传感器设备通过接入点(例如:基站或者WiFi)与边缘服务器进行连接,并且将计算任务卸载到边缘服务器使其为自身服务。事实证明,对于资源受限的工业传感器设备而言,将绝大部分生产任务卸载到边缘服务器中完成,不仅能够显著地降低通信延迟,更是提高了整个工业生产性能和效率。
然而,相比云中心,边缘服务器的计算能力、通信能力和存储能力是有限的。并且只能够为在其有限的通信范围之内的部分传感器设备提供服务。因此,面对工业物联网中数以万计的传感器设备所加载的计算任务,一些工业传感器设备不得不勉强依赖远程的云中心为其提供服务,从而减缓了整个工业系统的运行效率。幸运的是,随着硬件技术的迅速发展,部分厂商已经推出了可以应用到传感器设备中的人工智能芯片,极大地提高了传感器设备的计算能力。鉴于此,当边缘服务器的任务过载时,将原本属于传感器设备的少部分任务重新迁移到计算能力强的传感器设备上执行可以有效地解决大规模工业化生产过程中边缘服务器资源受限的问题。受此启发,我们引入了一个新的概念——计算回载。与计算卸载恰好相反,计算回载是指将计算任务从资源丰富的代理服务器迁移到计算能力较强的设备上执行。
当进行计算回载时,由边缘服务器选中的计算能力较强的传感器设备需要加载相关数据,由此便会引发相应的通信延迟。为了提高通信效率,一方面在保证完成计算任务的前提下,需要尽可能地减少计算迁移的次数。另一方面,由于传感器设备的移动是具有一定规律的,所以可以根据掌握的历史数据对传感器设备的运动轨迹进行预测,并且提前选定由哪些传感器设备来完成计算任务。因此,计算回载所存在的一个显著挑战便是如何根据传感器设备的移动性来动态地分配和迁移计算任务。除此之外,某些工业生产任务的时效性要求较高。也就是说,被分配计算任务的传感器设备需要在规定的时间内尽可能快地完成相应服务。
设计与实现
图1 边缘计算辅助的工业物联网系统概略图
在工业物联网中,边缘计算辅助的工业物联网系统概略图如图1所示,传感器设备的位置通常具有极高的时空移动性,然而以往涉及计算迁移的研究大多局限于根据传感器设备的静态位置进行计算任务的分配,这往往导致边缘服务器的计算任务不断地被重新分配,造成较大的时延,影响整体的工业生产效率。
面对该问题,假设被选中的传感器设备完成的任务量和参与计算的时间成正比,即由边缘服务器选中的传感器设备参与任务的时间片应该覆盖计算任务所要求的时间段。我们将计算任务的分配建模为一个通用的计算回载决策模型,以满足随时空动态变化的工业传感器设备位置的理想属性。除此之外,我们还考虑了单时间窗口和多时间窗口两种不同的情景。具体而言:一、针对单时间窗口,我们设计了一种动态规划算法来帮助边缘服务器选择可以完成计算任务的传感器设备;二、我们设计了一种近似的贪心算法来解决多时间窗口条件下的这个NP难问题。基于真实数据集的实验表明,与其它的计算任务分配方法相比,本文提出的算法不仅具有高可行性,还能有效地降低系统时延。
为了验证算法的有效性,我们设置了模拟实验,我们首先证明所提出的预测算法的准确性,实验结果如图2所示。我们将边缘服务器分配给传感器设备的计算任务持续的时间段从15个时间单位增加到60个时间单位(增量为5个时间单位),分别测量了单时间片和多时间片情况下预测的准确度,其计算方法是成功预测的位置数除以传感器设备中轨迹的位置数。从图2可以看出,预测的准确性随着计算任务周期的增加而降低。然而,在单时间窗口(STS)的情况下,预测的准确性总是大于90%。而在多时间窗口(MTS)的情况下,预测精度高于80%。总的来说,我们提出的算法的预测精度高于贝叶斯网络。因此,根据预测结果提前选择传感器设备和分配计算任务是可行的。
图2 预测准确度
接下来,我们通过实验得到了使用不同的算法进行计算回载所产生的时延,该时延不包括边缘服务器选择传感器设备所产生的时延,实验结果如图3所示。从图3中可以看出,无论是在STS还是MTS的情况下,我们提出的算法的系统延迟总是小于其他三个方法的系统延迟。此外,所选择的三种方法的系统延迟几乎相同。当边缘服务器随机分配计算任务给传感器设备时,系统延迟主要包括传输延迟和排队延迟。RVFDC算法和RMAMTS算法分别对传输延迟和排队延迟进行了优化。因此,我们可以得到这样的结论:在我们的问题中,传输延迟和排队延迟不是导致系统延迟的主要因素。
(a) 单时间片 (b) 多时间片
图3 不同时间片下的延迟
除了传输延迟和排队延迟外,计算任务的迁移也会导致延迟。因此,我们对不同算法进行计算重载时的计算迁移次数进行了统计。实验结果如图4所示,从图4中可以看出,在不同的情况下,我们提出的算法的迁移次数要比其他三种比较算法少。此外,MTS情况下的迁移次数比STS情况下的迁移次数要少。这是因为在MTS的情况下,传感器设备可以多次完成计算任务,从而减少了迁移的次数。这也为我们今后的研究指明了方向。在进行计算重载时,应该尽量减少迁移的数量,以减少系统延迟。
(a) 单时间片 (b) 多时间片
图4 不同时间片下计算迁移的次数
详细内容请参见:
Xin Niu, Chen Yu, Hai Jin. “CRSM: Computation Reloading Driven by Spatial-temporal Mobility in Edge-assisted Automated Industrial Cyber-Physical Systems”, IEEE Transactions on Industrial Informatics, 2022,
doi: 10.1109/TII.2022.3166795
网友评论已有0条评论, 我也要评论