CN116405373A - 去中心化的多智能体平台及其实现方法 - Google Patents
去中心化的多智能体平台及其实现方法 Download PDFInfo
- Publication number
- CN116405373A CN116405373A CN202310260098.3A CN202310260098A CN116405373A CN 116405373 A CN116405373 A CN 116405373A CN 202310260098 A CN202310260098 A CN 202310260098A CN 116405373 A CN116405373 A CN 116405373A
- Authority
- CN
- China
- Prior art keywords
- node
- task
- load
- agent
- backup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000000737 periodic effect Effects 0.000 claims description 65
- 238000011084 recovery Methods 0.000 claims description 32
- 238000013508 migration Methods 0.000 claims description 25
- 230000005012 migration Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000004083 survival effect Effects 0.000 claims 1
- 230000001419 dependent effect Effects 0.000 abstract description 2
- 239000003795 chemical substances by application Substances 0.000 description 93
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Hardware Redundancy (AREA)
Abstract
本发明涉及一种去中心化的多智能体平台及其实现方法。去中心化的多智能体平台,包括:主节点、备主节点、从节点;故障判断系统;去中心化系统;冗余备份系统。根据本发明,能够在多个节点同时故障时,确保多智能体平台的稳定运行,通过去中心化解决了平台严重依赖主节点和备主节点的情况,通过冗余备份提升多智能体平台抵抗故障的能力。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种去中心化的多智能体平台及其实现方法。
背景技术
多智能体系统的节点一般可以分为主节点和从节点。主节点负责全局工作(如智能体管理和目录服务等)和本节点的本地工作(如消息传输、本地智能体管理等),从节点只负责本节点的本地工作。在系统运行过程中,主节点和从节点都面临着硬件故障风险。由于节点特殊性,一旦主节点出现故障就很可能导致整个系统无法继续运行,而从节点故障时,该节点将丧失继续完成其业务的能力。
为了避免上述情况发生,现有技术中采用了如下方式:为了避免系统无法运行,进行了预设备主节点;为了避免重要节点丧失业务能力,进行了冗余节点备份。但当主节点发生故障时,如果预设备主节点发生故障,系统丧失全部功能;当从节点发生故障时,如果冗余从节点不在线,系统将丧失该故障节点全部功能。
发明内容
基于此,有必要针对上述技术问题,提供一种去中心化的多智能体平台及其实现方法。本发明能够在多节点故障时,确保多智能体系统的稳定性,通过多智能体平台的去中心化,解决平台严重依赖主节点和备主节点的情况;通过多智能体平台的冗余备份,提升多智能体平台抵抗故障的能力。
本发明一方面的去中心化的多智能体平台,包括:实现平台主从结构的主节点、备主节点、从节点;故障判断系统,用于判断节点是否发生故障;去中心化系统,用于在主节点和/或备主节点发生故障时或故障恢复时,设置产生新主节点和/或新备主节点;冗余备份系统,用于将平台中重要节点中的智能体和任务备份于多个不同的备份节点中。
进一步地,从节点负责本地工作,所述主节点、备主节点负责本地工作以及全局工作;故障判断系统,通过节点之间的心跳信息判断节点是否发生故障;去中心化系统,用于在主节点和/或备主节点发生故障或故障恢复时根据存活节点的优先级,选择最高优先级的节点作为主节点、次高优先级节点作为备主节点。
进一步地,冗余备份系统还包括多节点冗余备份节点故障处理模块和多节点冗余备份节点故障恢复模块。多节点冗余备份节点故障处理模块,用于当重要节点故障时根据备份节点的优先级由高到低依次向在线备份节点发送发生故障的重要节点的迁移信息,直至迁移完成或没有可用备份节点;多节点冗余备份节点故障恢复模块,用于重要节点故障恢复后对重要节点原有的智能体与任务进行回迁;多节点冗余备份节点故障处理模块发送迁移信息时,通过对备份节点进行调整使得各备份节点的负载不超过该备份节点的负载阈值。
进一步地,优先级的计算方法为:
其中n为节点ID,Ln、Sn和Zn分别为节点n的负载、网络传输速率和硬件性能,α、β和γ为预设权重,Lth为节点n预设的负载阈值,pr(n)的值越小,节点n优先级越高;当Ln>Lth时,代表节点n的任务负载超过其硬件处理能力,故将其优先级设为正无穷以避免节点超负荷,当Ln≤Lth时,节点n能够安全处理任务负载。
进一步地,负载的计算方法为:
在节点n中有M个智能体,智能体集合:A={Al,..Ai,..AM},其中1≤i≤M;
节点n上第i个智能体Ai内的任务集(1≤i≤M)描述如下:Ai={A_Ti,P_Ti};
A_Ti表示智能体内的非周期任务集,A_Ti={τi,l,...τi,j,...τi,x},|A_Ti|为智能体Ai任务集的非周期任务数,1≤j≤|A_Ti|;
P_Ti表示智能体内的周期任务集,P_Ti={υi,l,...υi,k,...υi,y},|P_Ti|为智能体Ai任务集的周期任务数,1≤k≤|P_Ti|;
1)非周期任务负载
非周期性任务τi,j的负载可采用下列两种计算公式中任意一种进行计算:
其中ri,j为非周期任务τi,j就绪时刻,t为当前时刻,Ci,j表示非周期任务τi,j的剩余执行时间,WCi,j为非周期任务τi,j的最坏情况执行时间,Di,j为非周期任务τi,j的相对截止期,di,j为非周期任务τi,j的绝对截止期di,j=Di,j+ri,j。
2)周期任务负载
周期任务υi,k的负载计算方法如下:
其中Ci,k为任务υi,k执行时间,Pi,k为任务υi,k的周期。
3)智能体Ai的任务负载
智能体Ai的非周期任务负载为:
智能体Ai的周期任务负载为:
4)节点n的任务负载
节点n的非周期任务负载为:
节点n的周期任务负载为:
5)节点n的负载是该节点非周期任务负载和周期任务负载之和,即:
Ln=Ln_a+Ln_p
本发明一方面的去中心化的多智能体平台的实现方法,包括:
设置主节点、备主节点和从节点以实现平台的主从结构;故障判断步骤,用于判断节点是否发生故障;去中心化步骤,用于在主节点和/或备主节点发生故障时或故障恢复时,设置产生新主节点和/或新备主节点;冗余备份步骤,用于将平台中重要节点中的智能体和任务备份于多个不同的备份节点中。
本发明一方面的计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现上述的去中心化的多智能体平台的实现方法。
本发明一方面的计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的去中心化的多智能体平台的实现方法。
通过实施本发明的上述方案,可以得到以下有益效果:
1.多智能体平台去中心化功能,根据故障情况自动产生新的主节点或备主节点,通过将全局工作迁移到合适的节点中以保证平台稳定运行;
2.多智能体平台多节点冗余备份功能,将重要智能体与任务进行多节点备份,使得在多个节点出现故障时仍能将重要智能体与任务迁移到尚能正常工作的备份节点中,从而保障业务运行的可靠性,提升多智能体平台抵抗故障的能力。
附图说明
图1是示出本发明的去中心化的多智能体平台的一些实施例的框架图;
图2是示出了多节点冗余备份节点故障处理流程图;
图3是示出了多节点冗余备份节点故障恢复流程图;
图4是示出了非周期任务运行示意图;
图5是示出了周期任务运行示意图;
图6是示出了本发明一些实施例发生故障时主节点和备主节点选取流程图;
图7是示出了本发明一些实施例故障恢复时主节点和备主节点选取流程图;
图8是示出本发明的去中心化的多智能体平台的实现方法的一些实施例的流程图;
图9是示出用于实现本发明一些实施例的计算机设备的内部结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1示出本发明的去中心化的多智能体平台的一些实施例的框架图;
如图1所示,去中心化的多智能体平台包括:
实现平台主从结构的主节点、备主节点、从节点;
故障判断系统100,用于判断节点是否发生故障;
去中心化系统200,用于在主节点和/或备主节点发生故障时或故障恢复时,设置产生新主节点和/或新备主节点;
冗余备份系统300,用于将平台中重要节点中的智能体和任务备份于多个不同的备份节点中。
其中从节点提供消息传输、本地智能体管理、本地节点管理等功能。在从节点的基础之上,主节点与备主节点还负责全局信息的维护管理工作,包括服务信息、智能体信息、任务信息等。当节点内智能体、任务或服务信息改变时,将节点信息上传至主节点与备主节点。备主节点在主节点存在时,仅对接收到的全局信息进行存储。系统可预设主节点和备主节点,例如对所有节点进行优先级排列并将两个最高优先级在线节点分别设定为主节点和备主节点。其中重要节点可以是主节点、备主节点或从节点。
在一些实施例中,冗余备份系统还包括多节点冗余备份节点故障处理模块和多节点冗余备份节点故障恢复模块;
多节点冗余备份节点故障处理模块故障处理的具体方式如下:
将需要备份的节点记为节点A,节点A的备份节点分别记为B1、B2…Bn。节点A启动后,注册冗余备份节点B1、B2…Bn,节点B1、B2…Bn进行节点A的智能体与任务的备份。当节点A故障时,(1)如果节点A的冗余备份节点均不在线,则设定节点A为断连未迁移状态;(2)否则节点A有在线冗余备份节点,将节点A的最高优先级在线冗余备份节点设为迁移目的地节点;(3)向迁移目的地节点发送迁移信息(包括故障节点A待迁移的智能体与任务);(4)如果迁移目的地节点反馈迁移完毕,则设定节点A为断连迁移状态,标记所有承担节点A智能体与任务的节点为节点A的迁移节点,结束多节点冗余备份节点故障处理;(5)如果迁移目的地节点反馈未迁移完毕,则查找是否存在优先级低于迁移目的地节点的可用在线冗余备份节点;(6)如不存在优先级低于迁移目的地节点的可用在线冗余备份节点,则撤销(2)-(4)步节点A已迁移的所有智能体与任务、设定节点A为断连未迁移状态并反馈不存在可行的迁移方案,结束多节点冗余备份节点故障处理;(7)如存在优先级低于迁移目的地节点的可用在线冗余备份节点,将已成功迁移的智能体与任务从待迁移的智能体与任务中移除,将节点A优先级仅次于迁移目的地节点的在线冗余备份节点作为新迁移目的地节点;(8)重复(3)-(7)步直至多节点冗余备份节点故障处理结束。
图2示出了多节点冗余备份节点故障处理流程图。
多节点冗余备份节点故障恢复模块恢复处理的具体方式如下:
当故障节点(记为节点A)恢复时,根据A的状态进行处理。如果A为断连迁移状态,则查找节点A的所有迁移节点并向这些节点发送相应回迁信息以将节点A原本负责的智能体与任务全部回迁;待完成全部回迁后,将节点A设为在线状态。如果节点A为断连未迁移状态,主节点回迁原本由节点A负责的智能体与任务,将并将节点A设为在线状态。当节点A未进行任务与智能体备份时,节点A执行正常节点注册流程,并设定节点A为在线状态。
图3示出了多节点冗余备份节点故恢复流程图。
在一些实施例中,所述故障判断系统通过节点之间的心跳信息判断节点是否发生故障。具体判断方式如下:各个节点设定心跳间隔时间,定时发送心跳信息。主节点与备主节点每隔心跳间隔时间定时相互发送心跳信息,每个从节点每隔心跳间隔时间定时向主节点和备主节点发送心跳信息。主节点与备主节点设置各节点的心跳阈值,并维护各节点对应的心跳计数值。主节点每隔心跳间隔时间将备主节点和各从节点的心跳计数值加一,备主节点每隔心跳间隔时间将主节点和各从节点的心跳计数值加一。当主节点接收到备主节点或从节点发送的心跳信息时,主节点将心跳信息对应节点的心跳计数值置零。当备主节点接收到主节点或从节点发送的心跳信息时,备主节点将心跳信息对应节点的心跳计数值置零。当任意节点心跳计数值大于其设定的心跳阈值时,判定该节点发生故障。
在一些实施例中,本发明的去中心化的多智能体平台在节点发生故障时的工作方式如下:
当主节点正常但备主节点故障时,首先利用多智能体平台的去中心化功能,将最高优先级的从节点选为新备主节点。在新备主节点确定后,再利用多智能体平台的多节点冗余备份功能,由主节点将故障备主节点中的智能体与任务迁移至对应的一个或多个备份节点中以保证故障备主节点的用户业务继续正常运行。
当主节点故障但备主节点正常时,首先利用多智能体平台中的去中心化功能,由备主节点替代主节点进行全局信息维护,并将最高优先级的从节点选为新备主节点。在新主节点与新备主节点确定后,再利用多智能体平台中的多节点冗余备份功能,由新主节点将故障主节点中的智能体与任务迁移至对应的一个或多个备份节点中以保证故障主节点的用户业务继续正常运行。
当主节点和备主节点均故障时,首先利用多智能体平台中的去中心化功能,将最高优先级和次高优先级的两个从节点分别选为新主节点与新备主节点。在新主节点与新备主节点确定后,再利用多智能体平台中的多节点冗余备份功能,由新主节点将故障主节点和故障备主节点中的智能体与任务迁移至对应的一个或多个备份节点中以保证故障主节点和故障备主节点的用户业务继续正常运行。
当从节点故障时,利用多智能体平台中的多节点冗余备份功能,由主节点将故障从节点中的智能体与任务迁移至对应的备份节点中以保证故障从节点的用户业务继续正常运行。
当故障节点恢复时,更新节点优先级。如果恢复节点的优先级大于主节点,则将恢复节点设为新主节点、原主节点设为新备主节点、原备主节点设为从节点;如果恢复节点的优先级不大于主节点但大于备主节点,则将恢复节点设为新备主节点、原备主节点设为从节点;否则将恢复节点设为从节点。完成上述节点设定后,如果未产生新主节点或新备主节点,则仅回迁恢复节点原本负责的用户业务,否则进行全局工作转移并回迁恢复节点原本负责的用户业务。。
在一些实施例中,优先级的获取方式如下:
(1)优先级计算
节点任务负载、网络传输速率和硬件性能对该节点是否适合承担全局工作有重要影响。因此,基于节点任务负载L、网络传输速率S和硬件性能Z计算优先级。对于节点n,其优先级如下
其中n为节点ID,Ln、Sn和Zn分别为节点n的任务负载、网络传输速率和硬件性能,α、β和γ为预设权重,Lth为节点n的基于调度策略预设的负载阈值。pr(n)的值越小,节点n优先级越高。Lth可基于节点采用的调度策略进行预设。当Ln>Lth时,代表节点n的任务负载超过其硬件处理能力,故将其优先级设为正无穷以避免节点超负荷。当Ln≤Lth时,节点n能够安全处理任务负载。Sn和Zn取决于节点网络和硬件参数且容易获取。节点任务负载则需要实时计算其本地工作和预期承担的全局工作产生的总负载,即选取主节点(或备主节点)时应计入主节点(或备主节点)承担的全局工作产生的负载。为进行节点任务负载计算,需定义系统模型和负载算法。当两个节点的优先级相等时,可依据事先给定的规则设定相对优先级,如编号小的节点优先级高。
(2)系统模型
多智能体系统同时运行有若干智能体,每个智能体负责执行若干任务。
根据任务就绪规律,任务被分为周期任务P_T(Periodic Task)与非周期任务A_T(Aperiodic Task)。以固定时间间隔重复就绪的任务被称为周期任务。与周期任务相对,就绪时间不固定的任务被称为非周期任务。
例如,系统中存在至少一个能够承担智能体平台全局工作的从节点,在节点n中,有M个智能体(含本地工作和预期承担的全局工作)需要执行,即智能体集合:
A={Al,..Ai,..AM)
其中:1≤i≤M。
节点n上第i个智能体Ai内的任务集(1≤i≤M)描述如下。
Ai={A_Ti,P_Ti}
其中:
A_Ti表示智能体内的非周期任务集,A_Ti={τi,l,...τi,j,...τi,x},|A_Ti|为智能体Ai任务集的非周期任务数,1≤j≤|A_Ti|
P_Ti表示智能体内的周期任务集,P_Ti={υi,l,...υi,k,...υi,y},|P_Ti|为智能体Ai任务集的周期任务数,1≤k≤|P_Ti|
非周期任务τi,j可以形式化的描述为以下四元组:τi,j={ri,j,Ci,j,WCi,j,Di,j}。其中ri,j表示任务的就绪时刻,Ci,j表示任务的剩余执行时间,WCi,j表示任务的最坏情况执行时间,Di,j表示任务的相对截止期。WCi,j,Di,j可在系统设计阶段根据应用场景设置,ri,j,Ci,j在系统运行阶段动态获得。
周期任务υi,k可以形式化的描述为以下三元组:υi,k={Ci,k,Di,k,Pi,k}。其中Ci,k表示任务执行时间,Di,k表示任务的相对截止期,Pi,k表示任务周期。Ci,k,Di,k,Pi,k可在系统设计阶段根据应用场景设置。在大多数场景下,相对截止期被认为与周期相等,本发明假设Di,k=Pi,k。
(3)负载算法
3.1)非周期任务负载
图4示出了非周期任务运行示意图。
其中ri,j为非周期任务τi,j就绪时刻,t为当前时刻,Ci,j表示非周期任务τi,j的剩余执行时间,WCi,j为非周期任务τi,j的最坏情况执行时间,Di,j为非周期任务τi,j的相对截止期,di,j为非周期任务τi,j的绝对截止期di,j=Di,j+ri,j。
非周期性任务τi,j的负载可采用两种计算方法。
方法一:
方法二:
其中,t为当前时刻。
应注意方法一和方法二不可混用,即不允许一部分非周期任务采用方法一计算负载而另一部分非周期任务采用方法二计算负载。
智能体Ai的非周期任务负载为:
当前时刻,节点n的非周期任务负载为:
3.2)周期任务负载
图5示出了周期任务运行示意图。
其中ri,k为任务υj,k就绪时刻,Ci,k为任务υj,k执行时间,Pi,k为任务υi,k的周期,Di,k为任务υi,k的相对截止期,Di,k=Pi,k。
周期任务υi,k的负载计算方法如下。
智能体Ai的周期任务负载为:
节点n的周期任务负载为:
节点n负载是该节点非周期任务负载和周期任务负载之和,即Ln=Ln_a+Ln_p
在本发明中,通过在系统运行过程中将最高优先级的节点作为主节点、次高优先级节点作为备主节点,直到不存在合适的从节点承担全局工作为止,实现了多智能体平台的去中心化。
图6示出了本发明一些实施例发生故障时主节点和备主节点选取流程图。
如图6所示,计算所有在线节点优先级,将两个最高优先级在线节点分别设定为主节点和备主节点。
当主节点故障时,如果备主节点正常,则将备主节点切换为新主节点,将最高优先级的从节点设为新备主节点并由新主节点传递全局信息给新备主节点,否则将最高优先级和次高优先级的两个从节点分别设为新主节点与新备主节点,在新主节点与新备主节点搜集所有从节点信息后新主节点开始进行全局工作。
当备主节点故障但主节点正常时,将最高优先级的从节点设为新备主节点,然后由主节点传递全局信息给新备主节点。
如果发生故障的节点进行过多节点冗余备份,则继续执行多节点冗余备份节点故障处理流程,否则结束节点故障处理流程。
图7示出了本发明一些实施例故障恢复时主节点和备主节点选取流程图。
如图7所示,当故障节点恢复时,更新节点优先级。如果恢复节点的优先级大于主节点,主节点向恢复节点发送全局信息并将恢复节点设为新主节点,将原主节点设为新备主节点、原备主节点设为从节点,新主节点负责全局工作,删除原备主节点中的全局信息。如果恢复节点的优先级不大于主节点但大于备主节点,主节点向恢复节点发送全局信息并将恢复节点设为新备主节点,将原备主节点设为从节点,删除原备主节点中的全局信息。如果恢复节点的优先级不大于主节点和备主节点,则正常启动从节点。如果恢复节点进行过多节点冗余备份,则继续执行多节点冗余备份节点故障恢复流程,否则结束节点故障恢复流程。
图8示出本发明的去中心化的多智能体平台的实现方法的一些实施例的流程图;
如图8所示,去中心化的多智能体平台的实现方法包括:
步骤S100,设置主节点、备主节点和从节点以实现平台的主从结构;步骤S200,故障判断步骤,判断节点是否发生故障;步骤S300,去中心化步骤,在主节点和/或备主节点发生故障时或故障恢复时,设置产生新主节点和/或新备主节点;步骤S400,冗余备份步骤,将平台中重要节点中的智能体和任务备份于多个不同的备份节点中。
在一些实施例中,从节点负责本地工作,主节点、备主节点负责本地工作以及全局工作;故障判断步骤通过节点之间的心跳信息判断节点是否发生故障;去中心化步骤,用于在主节点和/或备主节点发生故障或故障恢复时根据存活节点的优先级,选择最高优先级的节点作为主节点、次高优先级节点作为备主节点。
在一些实施例中,冗余备份步骤还包括多节点冗余备份节点故障处理模块和多节点冗余备份节点故障恢复模块;多节点冗余备份节点故障处理模块,用于当重要节点故障时根据备份节点的优先级由高到低依次向在线备份节点发送发生故障的重要节点的迁移信息,直至迁移完成或没有可用备份节点;多节点冗余备份节点故障恢复模块,用于重要节点故障恢复后对重要节点原有的智能体与任务进行回迁;多节点冗余备份节点故障处理模块发送迁移信息时,通过对备份节点进行调整使得各备份节点的负载不超过该备份节点的负载阈值。
在一些实施例中,优先级的计算方法为:
其中n为节点ID,Ln、Sn和Zn分别为节点n的负载、网络传输速率和硬件性能,α、β和γ为预设权重,Lth为节点n预设的负载阈值,pr(n)的值越小,节点n优先级越高;当Ln>Lth时,代表节点n的任务负载超过其硬件处理能力,故将其优先级设为正无穷以避免节点超负荷,当Ln≤Lth时,节点n能够安全处理任务负载。
在一些实施例中,负载的计算方法为:
在节点n中有M个智能体,智能体集合:A={Al,..Ai,..AM},其中1≤i≤M;
节点n上第i个智能体Ai内的任务集(1≤i≤M)描述如下:Ai={A_Ti,P_Ti};
A_Ti表示智能体内的非周期任务集,A_Ti={τi,l,...τi,j,...τi,x},|A_Ti|为智能体Ai任务集的非周期任务数,1≤j≤|A_Ti|;
P_Ti表示智能体内的周期任务集,P_Ti={υi,l,...υi,k,...υi,y},|P_Ti|为智能体Ai任务集的周期任务数,1≤k≤|P_Ti|;
1)非周期任务负载
非周期性任务τi,j的负载可采用下列两种计算公式中任意一种进行计算:
其中ri,j为非周期任务τi,j就绪时刻,t为当前时刻,Ci,j表示非周期任务τi,j的剩余执行时间,WCi,j为非周期任务τi,j的最坏情况执行时间,Di,j为非周期任务τi,j的相对截止期,di,j为非周期任务τi,j的绝对截止期di,j=Di,j+ri,j。
2)周期任务负载
周期任务υi,k的负载计算方法如下:
其中Ci,k为任务υi,k执行时间,Pi,k为任务υi,k的周期。
3)智能体Ai的任务负载
智能体Ai的非周期任务负载为:
智能体Ai的周期任务负载为:
4)节点n的任务负载
节点n的非周期任务负载为:
节点n的周期任务负载为:
5)节点n的负载是该节点非周期任务负载和周期任务负载之和,即Ln=Ln_a+Ln_p
关于去中心化的多智能体平台的实现方法的具体限定可以参见上文中对于去中心化的多智能体平台的限定,在此不再赘述。
上述去中心化的多智能体平台中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明还提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述的去中心化的多智能体平台的实现方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。本领域技术人员可以理解,图9中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的去中心化的多智能体平台的实现方法。
本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)、直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
至此,已经详细描述了本发明的实施例。为了避免遮蔽本发明的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改或者对部分技术特征进行等同替换。本发明的范围由所附权利要求来限定。
Claims (9)
1.一种去中心化的多智能体平台,其特征在于,包括:
实现平台主从结构的主节点、备主节点、从节点;
故障判断系统,用于判断节点是否发生故障;
去中心化系统,用于在主节点和/或备主节点发生故障时或故障恢复时,设置产生新主节点和/或新备主节点;
冗余备份系统,用于将平台中重要节点中的智能体和任务备份于多个不同的备份节点中。
2.根据权利要求1所述的去中心化的多智能体平台,其特征在于,
所述从节点负责本地工作,所述主节点、备主节点负责本地工作以及全局工作;
所述故障判断系统通过节点之间的心跳信息判断节点是否发生故障;
所述去中心化系统,用于在主节点和/或备主节点发生故障或故障恢复时根据存活节点的优先级,选择最高优先级的节点作为主节点、次高优先级节点作为备主节点。
3.根据权利要求1所述的去中心化的多智能体平台,其特征在于,
所述冗余备份系统还包括多节点冗余备份节点故障处理模块和多节点冗余备份节点故障恢复模块:
所述多节点冗余备份节点故障处理模块,用于当重要节点故障时根据备份节点的优先级由高到低依次向在线备份节点发送发生故障的重要节点的迁移信息,直至迁移完成或没有可用备份节点;
所述多节点冗余备份节点故障恢复模块,用于重要节点故障恢复后对重要节点原有的智能体与任务进行回迁。
4.根据权利要求3所述的去中心化的多智能体平台,其特征在于,
所述多节点冗余备份节点故障处理模块发送迁移信息时,通过对备份节点进行调整使得各备份节点的负载不超过该备份节点的负载阈值。
6.根据权利要求5所述的去中心化的多智能体平台,其特征在于,
所述负载的计算方法为:
在节点n中有M个智能体,智能体集合:A={A1,..Ai,..AM},其中1≤i≤M;
节点n上第i个智能体Ai内的任务集(1≤i≤M)描述如下:Ai={A_Ti,P_Ti};
A_Ti表示智能体内的非周期任务集,A_Ti={τi,1,…τi,j,…τi,x},|A_Ti|为智能体Ai任务集的非周期任务数,1≤j≤|A_Ti|;
P_Ti表示智能体内的周期任务集,P_Ti={υi,1,…υi,k,…υi,y},|P_Ti|为智能体Ai任务集的周期任务数,1≤k≤|P_Ti|;
1)非周期任务负载
非周期性任务τi,j的负载可采用下列两种计算公式中任意一种进行计算:
其中ri,j为非周期任务τi,j就绪时刻,t为当前时刻,Ci,j表示非周期任务τi,j的剩余执行时间,WCi,j为非周期任务τi,j的最坏情况执行时间,Di,j为非周期任务τi,j的相对截止期,di,j为非周期任务τi,j的绝对截止期di,j=Di,j+ri,j;
2)周期任务负载
周期任务υik的负载计算方法如下:
其中Ci,k为任务υi,k执行时间,Pi,k为任务υi,k的周期;
3)智能体Ai的任务负载
智能体Ai的非周期任务负载为:
智能体Ai的周期任务负载为:
4)节点n的任务负载
节点n的非周期任务负载为:
节点n的周期任务负载为:
5)节点n的负载是该节点非周期任务负载和周期任务负载之和,即:
Ln=Ln_+Ln_。
7.一种去中心化的多智能体平台的实现方法,其特征在于,包括:
设置主节点、备主节点和从节点以实现平台的主从结构;
故障判断步骤,判断节点是否发生故障;
去中心化步骤,在主节点和/或备主节点发生故障时或故障恢复时,设置产生新主节点和/或新备主节点;
冗余备份步骤,将平台中重要节点中的智能体和任务备份于多个不同的备份节点中。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求7所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求7所述的方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310260098.3A CN116405373A (zh) | 2023-03-17 | 2023-03-17 | 去中心化的多智能体平台及其实现方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202310260098.3A CN116405373A (zh) | 2023-03-17 | 2023-03-17 | 去中心化的多智能体平台及其实现方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN116405373A true CN116405373A (zh) | 2023-07-07 |
Family
ID=87018977
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202310260098.3A Pending CN116405373A (zh) | 2023-03-17 | 2023-03-17 | 去中心化的多智能体平台及其实现方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN116405373A (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119739572A (zh) * | 2025-03-04 | 2025-04-01 | 北京通用人工智能研究院 | 智能体的任务故障恢复方法、装置、设备、介质及产品 |
| CN120614394A (zh) * | 2025-05-29 | 2025-09-09 | 中盈基金管理有限公司 | 一种多智能节点驱动集群决策方法、系统、设备和介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103813325A (zh) * | 2012-11-07 | 2014-05-21 | 株式会社理光 | 限定区域自组织网络的网络管理方法、通信设备和系统 |
| US20170127327A1 (en) * | 2015-11-03 | 2017-05-04 | Futurewei Technologies, Inc. | System and Method for Load Rebalancing |
| CN111078667A (zh) * | 2019-12-12 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 一种数据迁移的方法以及相关装置 |
| CN115550402A (zh) * | 2022-09-15 | 2022-12-30 | 中国科学院软件研究所 | 一种无人潜航器软件平台 |
-
2023
- 2023-03-17 CN CN202310260098.3A patent/CN116405373A/zh active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103813325A (zh) * | 2012-11-07 | 2014-05-21 | 株式会社理光 | 限定区域自组织网络的网络管理方法、通信设备和系统 |
| US20170127327A1 (en) * | 2015-11-03 | 2017-05-04 | Futurewei Technologies, Inc. | System and Method for Load Rebalancing |
| CN111078667A (zh) * | 2019-12-12 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 一种数据迁移的方法以及相关装置 |
| CN115550402A (zh) * | 2022-09-15 | 2022-12-30 | 中国科学院软件研究所 | 一种无人潜航器软件平台 |
Non-Patent Citations (1)
| Title |
|---|
| 潘文高;黄文明;: "基于相对资源量的集群系统的研究与实现", 现代计算机, no. 14, 15 May 2013 (2013-05-15) * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119739572A (zh) * | 2025-03-04 | 2025-04-01 | 北京通用人工智能研究院 | 智能体的任务故障恢复方法、装置、设备、介质及产品 |
| CN120614394A (zh) * | 2025-05-29 | 2025-09-09 | 中盈基金管理有限公司 | 一种多智能节点驱动集群决策方法、系统、设备和介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN103778031B (zh) | 一种云环境下的分布式系统多级故障容错方法 | |
| US10057339B2 (en) | Resource allocation protocol for a virtualized infrastructure with reliability guarantees | |
| CN116405373A (zh) | 去中心化的多智能体平台及其实现方法 | |
| CN1906593A (zh) | 用于故障解决的系统和方法 | |
| JP4491482B2 (ja) | 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム | |
| WO2021136422A1 (zh) | 状态管理方法、主备应用服务器的切换方法及电子设备 | |
| US11210150B1 (en) | Cloud infrastructure backup system | |
| CN112527567A (zh) | 系统容灾方法、装置、设备以及存储介质 | |
| CN103490938A (zh) | 一种基于分层的云服务组合失效的恢复系统和方法 | |
| CN103617269A (zh) | 一种容灾接管方法及容灾接管系统 | |
| WO2024148856A1 (zh) | 数据写入方法、系统、存储硬盘、电子设备及存储介质 | |
| CN105589756A (zh) | 批处理集群系统以及方法 | |
| CN116668271A (zh) | 容器集群管理系统的容器迁移方法、装置、设备及介质 | |
| CN117591014A (zh) | 数据读写控制方法、装置、设备及计算机可读存储介质 | |
| CN102185717A (zh) | 业务处理设备、方法及系统 | |
| JP2009116474A (ja) | ストレージシステムおよびストレージサブシステム | |
| CN114995958A (zh) | 一种虚拟化平台信息一致性的控制方法、装置及介质 | |
| Almeida et al. | Plan-based replication for fault-tolerant multi-agent systems | |
| CN103931139A (zh) | 一种冗余保护方法、装置、设备及系统 | |
| Oussane et al. | Fault tolerance in The IoT: a taxonomy based on techniques | |
| CN111581013A (zh) | 基于元数据和影子文件的系统信息备份与重构方法 | |
| WO2024041363A1 (zh) | 无服务器架构分布式容错系统、方法、装置、设备及介质 | |
| CN106777238B (zh) | 一种hdfs分布式文件系统的自适应容错调节方法 | |
| CN113703669B (zh) | 一种缓存分区的管理方法、系统、设备及存储介质 | |
| CN111930563B (zh) | 云仿真系统中的容错方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |