[go: up one dir, main page]

CN116170878A - 一种基于改进ibn网络的意图冲突协调化解方法 - Google Patents

一种基于改进ibn网络的意图冲突协调化解方法 Download PDF

Info

Publication number
CN116170878A
CN116170878A CN202211631308.7A CN202211631308A CN116170878A CN 116170878 A CN116170878 A CN 116170878A CN 202211631308 A CN202211631308 A CN 202211631308A CN 116170878 A CN116170878 A CN 116170878A
Authority
CN
China
Prior art keywords
intent
network
performance
time
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211631308.7A
Other languages
English (en)
Other versions
CN116170878B (zh
Inventor
李娜
武俊
胡敏
黄宏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202211631308.7A priority Critical patent/CN116170878B/zh
Publication of CN116170878A publication Critical patent/CN116170878A/zh
Application granted granted Critical
Publication of CN116170878B publication Critical patent/CN116170878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0446Resources in time domain, e.g. slots or frames
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种基于改进IBN网络的意图冲突协调化解方法,属于意图网络领域,包括以下步骤:S1:将用户的意图请求映射到网络资源的层面上,将意图冲突问题转化为资源分配问题;S2:将所述资源分配问题从时间维度上划分为时间容忍型意图和非时间容忍型意图;S3:针对时间容忍型意图,将其意图调整到与之相邻的其他时间片上去实现,并增加上一个时间段对该时间段的影响;S4:针对非时间容忍型意图,将多个性能意图冲突化解问题转化为关于网络资源调配的多目标优化问题,使用深度强化学习网络不断感知学习网络环境,调整更新网络中部署策略,解决意图冲突。

Description

一种基于改进IBN网络的意图冲突协调化解方法
技术领域
本发明属于意图网络领域,涉及一种基于改进IBN网络的意图冲突协调化解方法。
背景技术
网络技术的飞速发展,在为人们带来丰富多彩的生活以外,也导致了愈加复杂的网络结构。网络的配置、运维等需要的人力、时间成本将大大提高。可以理解用户需求、分析网络状况、执行网络策略以及闭环运维的自动化网络成为网络发展新趋势。软件定义网络(software-defined networking,SDN)的发展即是网络向自动化方向发展的重要一步,其将网络的控制平面和数据平面分离开来,更易于网络的统一快速部署。然而,面对复杂多变的网络环境,其仍旧不能满足用户多样的需求,更无法理解用户的意图需求。意图网络(intent-based networking,IBN)的提出,让用户直接向网络表达意图成为可能,也使得网络的自动化成为可能。IBN是一种全新的网络模型,网络可以分析用户表达的意图和网络中的网络性能意图等,IBN通过分析这些意图,将意图转译为与之相应的网络策略,并根据网络策略自动化配置网络,并对其进行检测和自优化。
意图是IBN的核心,IBN的运行过程都与意图紧密相关,用户只需叙述需求,而无需管理实现过程。网络自实现相关意图,并持续监控网络状态信息,不断优化调整,形成了网络的自动化闭环管理。在意图网络中可同时存在多个意图,检测这些意图并找到相互间的关联性可帮助网络更好的理解意图以及相互之间的关系。然而,这些意图间并不总是和谐的,而这些在网络中存在冲突的意图与意图转译、网络现有状态以及网络配置策略的制定等各方面都息息相关。因此,忽视意图间的冲突、舍弃存在冲突的意图、或者根据到达时序设置优先级等方式都是不合理的,其会严重影响到用户的使用体验,对用户满意度以及网络状态均会产生消极的影响。
2015年成立的美国开放网络基金会北向接口工作组(Open Network FoundationNorthBound Interface Working Group,ONF NBIWG),发表了基于意图的北向接口(IntentNBI)白皮书,提出一种面向用户网络操作意图的NBI概念,介绍了意图北向接口的使用、特点和基本架构。IntentNBI将用户表达的意图需求转换成对应领域和具体技术相关的网络配置细节,再根据其来完成配置。ONF主席Daivd Lenrow提出“Intent:Don’t TellMe What to Do!Tell Me What You Want!”的标准草案,指出意图网络就是只需告诉网络自身的需求,而不用了解如何配置。这明确了意图网路这个概念,为网络的发展带来新的方向与机遇,而后各界都展开了针对意图网路的研究,现在大部分针对意图网络的研究都是在软件定义网络的基础上展开的。在软件定义网络中,一些SDN控制器(ONOS,OpenDaylight等)也已经开放了北向用户意图接口。IBN可以看作是高级、智能的SDN,但是IBN不限于SDN,它是一种更加灵活、智能、自动化的网络模型。
随着对意图网络的深入研究,其与现有网络的研究的结合也更为紧密,关于网络性能指标和体验质量(Quality of Experience,QoE)的意图被不断提及,虞红芳等人提出了基于意图的软件定义网络的QoE监控系统,可以在提高用户体验的同时更加有效的利用网络资源。资源总是有限的,无论是带宽资源、缓存资源还是计算资源。然而,在有限资源的情况下,用户对于网络的期望确是不断上升的。如何在资源有限的情况下,平衡好网络中的多个意图需求,是意图网络中需要解决的一个关键问题,这将在极大程度上影响用户的使用体验和满意度。
Yang Hui等人提出了基于深度强化学习的自适应切片的生成与优化策略(SPG-RL)来生成满足意图的组合策略,同时以深度神经进化网络(DNEN)辅助模型(SPG-RL-DNEN)来重新配置不兼容的片以保证意图。C.Prakash等人提出了策略图抽象(PGA)来表示网络策略。PGA是一种简单直观的抽象图,利用图结构检测和解决策略冲突,通过将多个服务链需求合并成无冲突的组合链,对服务链策略进行建模和组合。Zhang Hao Di等人提出了基于意图的SDN的意图解析器,对接收到的意图进行分析,当网络中存在冲突的多个intent时,决定如何重新配置网络,实时优化运行方案,检测和解决意图间冲突。李宇衡等人提出了一种在新型北向接口Intent NBI的基础上解决意图下发一致性问题的方法。在Intent NBI上添加实现承诺理论的模块,用于解决SDN北向接口逻辑一致性问题。Zhang Jia Ming等人提出了QICR(Quadruple-based Intent Conflict Resolution)来解决网络建设初期同一网络中多个用户之间的意图冲突。通过构建网络意图四元组<SrcGroup,DstGroup>,<Filter>,<SFC>,<Constraint>,以及构建网络信息图、使用冲突解决算法的方式来化解意图冲突。
针对意图网路中存在意图冲突问题,现有解决方案是首先将意图需求映射到网络层面的需求,从而在以软件定义网络中的一些解决网络冲突的方案来解决意图冲突问题。将其需求以图的形式来展示,使用基于图形的理论来化解冲突问题。但其需要大量的人工参与,在一定程度上与意图网络的网络自动化和网络自治的理念相悖。且采用这些方式制定的网络策略往往在完成部署后,不会再继续保持意图,当网络状态发生变化时,用户的意图请求很难得到保障。
发明内容
有鉴于此,本发明的目的在于提供一种基于改进IBN网络的意图冲突协调化解方法,考虑现在物联网边缘计算中网络的实时变化,以及用户意图需求的保持与更迭,首先将用户的意图请求映射到网络资源的层面上,因为大多数用户在网络的需求其本质上大多都是与网络中的QoS方面相关的一些需求。意图间存在的冲突往往都是由于其在有限资源的情况下对资源的竞争使用而产生的冲突。基于以上分析考虑,在将意图冲突问题转化到资源分配问题后,首先将其从时间维度上划分,将其分为时间容忍型意图和非时间容忍型意图两种。针对时间容忍型意图,将其意图调整到与之相邻其他时间片上去实现,从而将因网络资源竞争产生冲突的意图从时间资源的角度去化解。针对无法从时间上化解的冲突,则将多个性能意图冲突化解问题转化为关于网络资源调配的多目标优化问题,使用深度强化学习的方法去解决。不断感知学习网络环境,调整更新网络中部署策略,既可以保证对在闭环条件下对意图的维持,也可以试下对其的优化调整。结合博弈论的思维,采取协调、合作的解决方式,在尽量满足各意图的需求下,保证资源利用率,制定最优化的资源调配策略,从而达到避免化解意图冲突的目标。
为达到上述目的,本发明提供如下技术方案:
一种基于改进IBN网络的意图冲突协调化解方法,包括以下步骤:
S1:将用户的意图请求映射到网络资源的层面上,将意图冲突问题转化为资源分配问题;
S2:将所述资源分配问题从时间维度上划分为时间容忍型意图和非时间容忍型意图;
S3:针对时间容忍型意图,将其意图调整到与之相邻的其他时间片上去实现,并增加上一个时间段对该时间段的影响;
S4:针对非时间容忍型意图,将多个性能意图冲突化解问题转化为关于网络资源调配的多目标优化问题,使用深度强化学习网络不断感知学习网络环境,调整更新网络中部署策略,解决意图冲突。
进一步,步骤S1所述将用户的意图请求映射到网络资源的层面上,将意图冲突问题转化为资源分配问题,首先构造意图物联网系统,包括意图管理服务器、边缘节点以及终端设备;所述边缘节点由一个微基站SBS与一个MEC服务器组成;所述意图管理服务器与边缘节点无线通信,边缘节点之间通过有线链路通信,各个终端设备与对应的微基站无线通信;
所述意图管理服务器通过意图引擎对用户意图进行解析与转译,然后根据当前的网络状态信息对网络策略进行验证,并对策略进行优化进而下发到实际网络设施中;
所述终端设备用于收集用户以各种形式输入的意图,并把各种形式的意图统一为标准的形式;
定义网络中有M个边缘节点,即M个MEC服务器和M个基站,
Figure BDA0004005793640000049
表示MEC服务器的集合;终端用户设备数为U,/>
Figure BDA00040057936400000410
表示终端设备的集合;将与基站m相关联的用户设备集合表示为/>
Figure BDA00040057936400000411
Figure BDA00040057936400000412
设定意图管理服务器的决策过程在离散时隙中进行,每个时隙t都有一个恒定的持续时间Ts
假设每个基站可以调配相同类型和数量的K种网络资源,其类型表示为
Figure BDA00040057936400000413
每个基站可以使用的网络资源VK的总量表示为/>
Figure BDA0004005793640000041
将/>
Figure BDA0004005793640000042
划分为容量为
Figure BDA0004005793640000043
的子资源块,用户设备在时隙t被调配的资源量表示为:
Figure BDA0004005793640000044
网络资源的调配向量表示为:
Figure BDA0004005793640000045
在时隙t时,网络中可以调配的所有资源的总量低于网络中可以调配的量,即为:
Figure BDA0004005793640000046
进一步,将用户的意图定义为与网络性能相关的性能意图,所述性能意图分为约束型意图和优化型意图,所述约束型意图分为尽力型意图和保证型意图,其中:
所述约束型意图为要求某些网络性能不低于或者不高于某阈值的意图;
所述优化型意图为要求将网络性能指标最大化或者最小化的意图;
所述尽力型意图为使网络性能指标尽力达到所期望的阈值的意图;
所述保证型意图为需要保证网络性能指标达到所期望的阈值的意图。
进一步,性能意图所描述的性能指标依赖于网络资源的调配以及与性能有关的其它变量集xn,在时隙t时,性能意图所描述的性能指标表示为:
Figure BDA0004005793640000047
其中Fn[*]是性能意图描述的性能指标的性能函数;将发生冲突的意图的性能函数表示为
Figure BDA0004005793640000048
其中l表示性能意图的个数;
t时刻的用户意图满意度定义如下:
Figure BDA0004005793640000051
其中,D(t)是t时刻的带宽,V(t)是t时刻的时延,L(t)为t时刻的丢包;αdvl别是各项网络资源的计算系数;
将多性能意图冲突避免问题表示为一个以优化型性能意图和尽力型性能意图为优化目标的优化问题,将保证型性能意图作为约束条件,通过将阈值型性能意图的性能函数不等式进行取反,将大于或不小于特定阈值的意图的性能函数转换为小于或不大于特定阈值的意图的性能函数,优化问题按如下表达:
Figure BDA0004005793640000052
Figure BDA0004005793640000053
yi(t)≥1,i∈Inec
其中Inec为保证型意图的集合。
进一步,所述步骤S3中针对时间容忍型意图的冲突化解包括如下步骤:
将处理后的意图信息按照时序信息展开,并考虑意图所涉及的操作对象、操作动作、网络性能指标等,将其映射为资源描述框架图RDF;
获得每个意图拆分后的信息;
将多个冲突的意图生成RDF图,并按照时序关系将其进行合并;
根据网络中的资源使用情况,并考虑各意图在时序上的需求,针对在时间资源上没有严格要求的意图,若其在网络资源上与其他意图产生竞争,则将该意图移到有空闲网络资源的相邻的时间片上去实现;
增加上一个时间段对该时间段的影响,即:上一个时间片中的成功配置的意图,并且在当前时间片中仍然存在的意图也要保证成功配置;在上一时间片中不能成功配置的意图的有效部分,在当前时间片中也有效时,不再为其进行配置。
进一步,步骤S4中,针对无法从时间上化解的意图冲突转换的资源竞争问题,转化为多目标联合优化问题,同时考虑资源利用率,将意图设计的性能指标、期望状态值以及资源利用率作为优化目标,制定约束条件下的最优的资源调配策略;
采用双延迟深度确定性策略梯度算法TD3对与优化、网络性能相关的冲突意图进行资源调配策略定制;TD3模型描述为一个智能体Agent,在当前状态state下,通过执行一个行为action与环境Environment进行交互,获得新的状态,同时从环境中获得对应奖励reward,Agent再根据即时奖励评估所执行动作,决定增加或减少奖励,通优化策略获得最多的奖励,即认为找到最优策略;
奖励函数为:
Figure BDA0004005793640000061
其中γ∈(0,1),用于确定短期奖励优先级的折扣因子;
Policy函数为:
π(a|s)=P(A=a|S=s),π(s,a)→[0,1]
状态价值函数通过贝尔曼方程递归的表示为:
Figure BDA0004005793640000062
动作价值函数通过贝尔曼方程递归的表示为:
Figure BDA0004005793640000063
TD3算法利用两套网络来表示不同的Q值,通过选取最小的那个作为更新的目标;
取其中值较小的作为Q-target或Q-value值,其更新目标为:
Figure BDA0004005793640000064
更新估值网络:
Figure BDA0004005793640000065
更新策略网络中,只使用其中一个估值函数为策略函数提供梯度:
Figure BDA0004005793640000066
将关键性能数值水平、网络资源容量限制、链路状态作为state,网络资源调配策略的参数设置作为action,将优化目标的当前数值和资源利用率作为reward。
本发明的有益效果在于:在针对意图网路的研究中,考虑了意图间出现冲突的情况,并根据不同的意图冲突情况,制定了相应的解决办法。同时,考虑到网络中资源的有限性能,将意图进行量化,实时检测网络状态,基于意图以及实际网络部署状况,量化用户满意度,同时,为减少资源浪费,将资源利用率也纳入考虑,既保证了用户的使用体验,也节省了资源,保障了网络的稳定性。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为意图网络IBN的定义图;
图2为意图网络模型结构示意图;
图3为TD3网络结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
如图1所示,意图网络IBN的定义主要包括四个部分,分别是转译和验证;自动化实施;网络状态感知;保障和自动化优化/补救。其中转译和验证是指系统从最终用户获取更高级别的业务策略,并将其转换为必要的网络配置,生成并验证最终的设计和配置以保证正确性。自动化实施指系统可以在现有网络基础设施上配置适当的网络变更,通过网络自动化或网络编排完成。在网络状态感知部分,系统为其管理控制下的系统提供实时网络状态,并且是协议和传输不可知的。保障和优化指系统持续验证原始意图实现情况,在所需意图无法实现时采取纠正措施。
本发明在IBN的定义的基础上,结合实际网络,设计了意图物联网系统框架,该体系结构主要由三层组成,分别为基础设施层、控制平面层以及应用层。各种终端物联网设备、网络设备所在层的即为基础设施层。应用程序平面则提供网络管理功能,如负载平衡、流量监控等。控制器管理所有接入点,从而促进网络策略的执行。此外,在该体系中,可实现网络的闭环管理,实时检测网络环境,不断优化调整网络策略及部署,从而保障用户意图的实现。
IBN的应用层主要负责收集用户以各种形式输入的意图,并把各种形式的意图统一为标准的形式,本发明中设计意图表达采用类似自然语言的形式。为保障更加准确的理解用户的意图,用户需要按照一定的规则来表达其意图需求。应用层面向的用户包括但不限于普通用户、网络管理员等。意图层是IBN的核心,是驱动IBN运行最为关键的因素。意图层的核心部件是意图引擎,主要负责用户意图的解析与转译,然后根据当前的网络状态信息对网络策略进行验证,并对策略进行优化进而下发到实际网络设施中。针对意图表达和转译,本框架使用INDIRA。其采用描述性语言的形式来定义意图,利用机器推理来理解用户的意图。
如图2所示,网络模型由意图管理服务器、边缘节点以及终端设备所组成。其中,每个边缘节点均由一个微基站(Smell cell base station,SBS)与一个MEC服务器所组成。其中每个微基站都有一个固定的覆盖范围,本实施例不考虑边缘节点间的重合情况。边缘节点之间为有线链路通信,各个终端设备间则采用无线链路的方式与其对应的微基站进行数据传输。
在本模型中,定义网络中有M个边缘节点,即M个MEC服务器和M个基站,
Figure BDA0004005793640000084
表示MEC服务器的集合。终端用户设备数为U,/>
Figure BDA0004005793640000085
表示终端设备的集合。假设用户设备均只能接入单个基站,因此将与基站m相关联的用户设备集合可以表示为/>
Figure BDA0004005793640000086
Figure BDA0004005793640000087
设定意图管理服务器的决策过程在离散时隙中进行,每个时隙t都有一个恒定的持续时间Ts
假设每个基站可以调配相同类型和数量的K种网络资源,其类型可以表示为
Figure BDA0004005793640000088
每个基站可以使用的网络资源VK的总量可以表示为/>
Figure BDA0004005793640000081
考虑将其划分为容量为/>
Figure BDA0004005793640000082
的子资源块。因此,用户设备在时隙t被调配的资源量可以表示为:
Figure BDA0004005793640000083
网络资源的调配向量可以表示为:
Figure BDA0004005793640000091
注意,在时隙t时,网络中可以调配的所有资源的总量应该低于网络中可以调配的量,即为:
Figure BDA0004005793640000092
在本实施例中所指的意图主要是与网络性能相关。针对所指的性能意图,可将其分为约束型意图和优化型意图。其中要求某些网络性能不低于或者不高于某阈值的,如要求传输时延不高于某个设定值,这类意图即为约束型意图。而要求将网络性能指标最大化或者最小化,如最大化网络传输速率,这类意图为优化型意图。针对约束型意图,其又可划分为尽力型意图和保证型意图。考虑将保证型意图即需要保证网络性能指标达到所期望的阈值,尽力型意图即网络性能指标尽力达到所期望的阈值。性能意图所描述的性能指标可以由特定的性能函数进行表示,此函数依赖于网络资源的调配以及与性能有关的其它变量集xn,例如链路传输距离、路径损耗指数等。因此,在时隙t时,将性能意图所描述的性能表示为:
Figure BDA0004005793640000093
其中Fn[*]是性能意图描述的性能指标的性能函数。将发生冲突的意图的性能函数表示为
Figure BDA0004005793640000094
其中l表示性能意图的个数。
对意图评估主要考虑网络参数等客观存在的因素,比如带宽、延时、丢包等,排除了用户主观感受等难以评估量化的因素。此外,意图网络中不同意图业务类型对于网络中资源的需求不同,不同用户对于意图分配资源的敏感度也会不同,意图满意度的影响因素还考虑到意图所映射的性能指标。因此,t时刻的用户意图满意度定义如下:
Figure BDA0004005793640000095
其中,D(t)是t时刻的带宽,V(t)是t时刻的时延,L(t)为t时刻的丢包。αdvl别是各项网络资源的计算系数。
多性能意图冲突避免问题可以表示为一个以优化型性能意图和尽力型性能意图为优化目标的优化问题。同时,此优化问题还以保证型性能意图作为约束条件。此外,通过将阈值型性能意图的性能函数不等式进行取反,可以将大于(或不小于)特定阈值的意图的性能函数转换为小于(或不大于)特定阈值的意图的性能函数。因此,优化问题按如下表达:
Figure BDA0004005793640000101
Figure BDA0004005793640000102
yi(t)≥1,i∈Inec
其中Inec为保证型意图的集合。
时间容忍型意图:意图网络的冲突化解问题,现有研究大多不考虑意图的时序信息,而只考虑其中涉及的操作对象、行为等。将处理后的意图信息按照时序信息展开,并考虑意图所涉及的操作对象、操作动作、网络性能指标等,将其映射为资源描述框架图(RDF图)。从而更加直观的展示意图间的时序关系。本实施例所指网络性能意图是与性能指标、期望状态等相关的意图,且假设已经获得每个意图拆分后的信息。将多个冲突的意图生成RDF图,并按照时序关系将其进行合并。根据网络中的资源使用情况,并考虑各意图在时序上的需求。针对在时间资源上没有严格要求的意图,若其在网络资源上与其他意图产生竞争,则考虑将该意图移到有空闲网络资源的相邻的时间片上去实现。为了增加时变意图各个时间段的关联,需要增加上一个时间段对该时间段的影响,即上一个时间片中的成功配置的意图,并且在当前时间片中仍然存在的意图也要保证成功配置;在上一时间片中不能成功配置的意图的有效部分,在当前时间片中也有效时,不需要再为其进行配置了。
非时间容忍型意图:针对无法从时间上化解意图冲突,由于资源有限情况下,发生冲突的意图不能被完全满足,为尽量保障用户的满意度,将该资源竞争问题转化为多目标联合优化问题,同时考虑资源利用率,将意图设计的性能指标、期望状态值以及资源利用率作为优化目标,制定约束条件下的最优的资源调配策略。由于网络具有时变性,优化目标函数、约束条件等都可能会随时间发生动态变化,使用数值算来求解该目标优化问题复杂度较高。因此,考虑使用深度强化学习(deep reinforcement learning,DRL)来应对网络的时变特性,根据优化目标制定满足用户意图需求的资源配置策略。拟采用双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient,TD3)算法来对与优化、网络性能等相关的冲突意图间进行资源调配策略定制。如图3所示,TD3是强化学习和深度学习的结合,强化学习的模型原理可具体描述为:一个智能体Agent,在当前状态state下,通过执行一个行为action与环境Environment进行交互,获得新的状态,同时从环境中获得对应奖励reward,Agent再根据即时奖励评估所执行动作,决定增加或减少奖励,通优化策略获得最多的奖励,即认为找到最优策略。
奖励函数:
Figure BDA0004005793640000111
其中γ∈(0,1),用于确定短期奖励优先级的折扣因子
Policy函数:π(a|s)=P(A=a|S=s),π(s,a)→[0,1]
状态价值函数通过贝尔曼方程递归的表示为:
Figure BDA0004005793640000112
动作价值函数通过贝尔曼方程递归的表示为:
Figure BDA0004005793640000113
TD3算法利用两套网络来表示不同的Q值,通过选取最小的那个作为更新的目标(Target Q Value),可抑制持续地过高估计。
由于两个网络参数是随机初始化的,所输出的Q值有大有小,取其中值较小的作为Q-target或Q-value值,其更新目标为:
Figure BDA0004005793640000114
更新估值网络:
Figure BDA0004005793640000115
更新策略网络中,只使用其中一个估值函数为策略函数提供梯度:
Figure BDA0004005793640000116
在本实施例中将关键性能数值水平、网络资源容量限制、链路状态作为state,网络资源调配策略的参数设置作为action,将优化目标的当前数值作为reward,即意图涉及的性能指标,如最大化用户平均传输速率、平均传输时延不高于某个阈值等。同时为避免制定策略时过度考虑用户满意度而造成资源浪费的情况,考虑将资源利用率也作为reward,在保障用户意图满意度的情况下,同时尽量减少资源浪费。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种智能化感知的IBN意图冲突协调化解方法,其特征在于:包括以下步骤:
S1:将用户的意图请求映射到网络资源的层面上,将意图冲突问题转化为资源分配问题;
S2:将所述资源分配问题从时间维度上划分为时间容忍型意图和非时间容忍型意图;
S3:针对时间容忍型意图,将其意图调整到与之相邻的其他时间片上去实现,并增加上一个时间段对该时间段的影响;
S4:针对非时间容忍型意图,将多个性能意图冲突化解问题转化为关于网络资源调配的多目标优化问题,使用深度强化学习网络不断感知学习网络环境,调整更新网络中部署策略,解决意图冲突。
2.根据权利要求1所述的基于改进IBN网络的意图冲突协调化解方法,其特征在于:步骤S1所述将用户的意图请求映射到网络资源的层面上,将意图冲突问题转化为资源分配问题,首先构造意图物联网系统,包括意图管理服务器、边缘节点以及终端设备;所述边缘节点由一个微基站SBS与一个MEC服务器组成;所述意图管理服务器与边缘节点无线通信,边缘节点之间通过有线链路通信,各个终端设备与对应的微基站无线通信;
所述意图管理服务器通过意图引擎对用户意图进行解析与转译,然后根据当前的网络状态信息对网络策略进行验证,并对策略进行优化进而下发到实际网络设施中;
所述终端设备用于收集用户以各种形式输入的意图,并把各种形式的意图统一为标准的形式;
定义网络中有M个边缘节点,即M个MEC服务器和M个基站,
Figure FDA0004005793630000011
表示MEC服务器的集合;终端用户设备数为U,/>
Figure FDA0004005793630000012
表示终端设备的集合;将与基站m相关联的用户设备集合表示为/>
Figure FDA0004005793630000013
设定意图管理服务器的决策过程在离散时隙中进行,每个时隙t都有一个恒定的持续时间Ts
假设每个基站可以调配相同类型和数量的K种网络资源,其类型表示为
Figure FDA0004005793630000014
每个基站可以使用的网络资源VK的总量表示为/>
Figure FDA0004005793630000015
将/>
Figure FDA0004005793630000016
划分为容量为
Figure FDA0004005793630000017
的子资源块,用户设备在时隙t被调配的资源量表示为:
Figure FDA0004005793630000018
网络资源的调配向量表示为:
Figure FDA0004005793630000019
在时隙t时,网络中可以调配的所有资源的总量低于网络中可以调配的量,即为:
Figure FDA0004005793630000021
3.根据权利要求1所述的基于改进IBN网络的意图冲突协调化解方法,其特征在于:将用户的意图定义为与网络性能相关的性能意图,所述性能意图分为约束型意图和优化型意图,所述约束型意图分为尽力型意图和保证型意图,其中:
所述约束型意图为要求某些网络性能不低于或者不高于某阈值的意图;
所述优化型意图为要求将网络性能指标最大化或者最小化的意图;
所述尽力型意图为使网络性能指标尽力达到所期望的阈值的意图;
所述保证型意图为需要保证网络性能指标达到所期望的阈值的意图。
4.根据权利要求3所述的基于改进IBN网络的意图冲突协调化解方法,其特征在于:性能意图所描述的性能指标依赖于网络资源的调配以及与性能有关的其它变量集xn,在时隙t时,性能意图所描述的性能指标表示为:
Figure FDA0004005793630000022
其中Fn[*]是性能意图描述的性能指标的性能函数;将发生冲突的意图的性能函数表示为
Figure FDA0004005793630000023
其中l表示性能意图的个数;
t时刻的用户意图满意度定义如下:
Figure FDA0004005793630000024
其中,D(t)是t时刻的带宽,V(t)是t时刻的时延,L(t)为t时刻的丢包;αdvl别是各项网络资源的计算系数;
将多性能意图冲突避免问题表示为一个以优化型性能意图和尽力型性能意图为优化目标的优化问题,将保证型性能意图作为约束条件,通过将阈值型性能意图的性能函数不等式进行取反,将大于或不小于特定阈值的意图的性能函数转换为小于或不大于特定阈值的意图的性能函数,优化问题按如下表达:
Figure FDA0004005793630000025
yi(t)≥1,i∈Inec
其中Inec为保证型意图的集合。
5.根据权利要求1所述的基于改进IBN网络的意图冲突协调化解方法,其特征在于:所述步骤S3中针对时间容忍型意图的冲突化解包括如下步骤:
将处理后的意图信息按照时序信息展开,并考虑意图所涉及的操作对象、操作动作、网络性能指标等,将其映射为资源描述框架图RDF;
获得每个意图拆分后的信息;
将多个冲突的意图生成RDF图,并按照时序关系将其进行合并;
根据网络中的资源使用情况,并考虑各意图在时序上的需求,针对在时间资源上没有严格要求的意图,若其在网络资源上与其他意图产生竞争,则将该意图移到有空闲网络资源的相邻的时间片上去实现;
增加上一个时间段对该时间段的影响,即:上一个时间片中的成功配置的意图,并且在当前时间片中仍然存在的意图也要保证成功配置;在上一时间片中不能成功配置的意图的有效部分,在当前时间片中也有效时,不再为其进行配置。
6.根据权利要求1所述的基于改进IBN网络的意图冲突协调化解方法,其特征在于:步骤S4中,针对无法从时间上化解的意图冲突转换的资源竞争问题,转化为多目标联合优化问题,同时考虑资源利用率,将意图设计的性能指标、期望状态值以及资源利用率作为优化目标,制定约束条件下的最优的资源调配策略;
采用双延迟深度确定性策略梯度算法TD3对与优化、网络性能相关的冲突意图进行资源调配策略定制;TD3模型描述为一个智能体Agent,在当前状态state下,通过执行一个行为action与环境Environment进行交互,获得新的状态,同时从环境中获得对应奖励reward,Agent再根据即时奖励评估所执行动作,决定增加或减少奖励,通优化策略获得最多的奖励,即认为找到最优策略;
奖励函数为:
Figure FDA0004005793630000031
其中γ∈(0,1),用于确定短期奖励优先级的折扣因子;
Policy函数为:
π(a|s)=P(A=a|S=s),π(s,a)→[0,1]
状态价值函数通过贝尔曼方程递归的表示为:
Figure FDA0004005793630000041
动作价值函数通过贝尔曼方程递归的表示为:
Figure FDA0004005793630000042
TD3算法利用两套网络来表示不同的Q值,通过选取最小的那个作为更新的目标;
取其中值较小的作为Q-target或Q-value值,其更新目标为:
Figure FDA0004005793630000043
更新估值网络:
Figure FDA0004005793630000044
更新策略网络中,只使用其中一个估值函数为策略函数提供梯度:
Figure FDA0004005793630000045
将关键性能数值水平、网络资源容量限制、链路状态作为state,网络资源调配策略的参数设置作为action,将优化目标的当前数值和资源利用率作为reward。
CN202211631308.7A 2022-12-19 2022-12-19 一种基于改进ibn网络的意图冲突协调化解方法 Active CN116170878B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211631308.7A CN116170878B (zh) 2022-12-19 2022-12-19 一种基于改进ibn网络的意图冲突协调化解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211631308.7A CN116170878B (zh) 2022-12-19 2022-12-19 一种基于改进ibn网络的意图冲突协调化解方法

Publications (2)

Publication Number Publication Date
CN116170878A true CN116170878A (zh) 2023-05-26
CN116170878B CN116170878B (zh) 2025-12-12

Family

ID=86417351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211631308.7A Active CN116170878B (zh) 2022-12-19 2022-12-19 一种基于改进ibn网络的意图冲突协调化解方法

Country Status (1)

Country Link
CN (1) CN116170878B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118509325A (zh) * 2024-07-19 2024-08-16 中国电子科技集团公司第十研究所 一种任务驱动的分布式网络智能管理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080008983A1 (en) * 2006-07-10 2008-01-10 Wright Barbara R System and method for resolving conflict
CN105471790A (zh) * 2014-08-04 2016-04-06 北京三星通信技术研究有限公司 适用于分布式天线系统的协作传输方法、基站及终端
US20160119927A1 (en) * 2014-10-24 2016-04-28 Newracom, Inc. Ofdma resource assignment rules to achieve robustness
CN115119332A (zh) * 2022-05-20 2022-09-27 北京邮电大学 意图驱动的无线网络资源冲突解决方法及其装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080008983A1 (en) * 2006-07-10 2008-01-10 Wright Barbara R System and method for resolving conflict
CN105471790A (zh) * 2014-08-04 2016-04-06 北京三星通信技术研究有限公司 适用于分布式天线系统的协作传输方法、基站及终端
US20160119927A1 (en) * 2014-10-24 2016-04-28 Newracom, Inc. Ofdma resource assignment rules to achieve robustness
CN115119332A (zh) * 2022-05-20 2022-09-27 北京邮电大学 意图驱动的无线网络资源冲突解决方法及其装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
QINGHUA ZHANG 等: "Intent-based Service Policy Conflict Management Algorithm", IEEE, 22 September 2022 (2022-09-22) *
李福亮 等: "基于意图的网络研究综述", 软件学报, 14 September 2020 (2020-09-14) *
肖法鲁: "意图驱动无线接入网络的冲突避免技术研究", 中国优秀硕士学位论文全文数据库 信息科技辑, 15 January 2022 (2022-01-15) *
贾学明 等: "一种模糊神经网络检测下的入侵容忍系统设计", 航空计算技术, no. 01, 15 January 2008 (2008-01-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118509325A (zh) * 2024-07-19 2024-08-16 中国电子科技集团公司第十研究所 一种任务驱动的分布式网络智能管理系统及方法

Also Published As

Publication number Publication date
CN116170878B (zh) 2025-12-12

Similar Documents

Publication Publication Date Title
CN112235836B (zh) 一种工业边缘网络系统架构和资源调度方法
Kim et al. Multi-agent reinforcement learning-based resource management for end-to-end network slicing
Sun et al. Autonomous resource slicing for virtualized vehicular networks with D2D communications based on deep reinforcement learning
CN116032767B (zh) 一种面向智融标识网络的算力服务链管控系统架构
Kherbache et al. Digital twin network for the IIoT using eclipse ditto and hono
WO2012072445A1 (en) Method and apparatus of communications
CN118612754B (zh) 可智能组网的三合一终端控制系统及方法
CN113341712A (zh) 无人机自主控制系统智能分层递阶控制选择方法
CN115119332A (zh) 意图驱动的无线网络资源冲突解决方法及其装置
CN112671865A (zh) 一种基于sdn的物联网微服务自动编排方法
CN119512766B (zh) 一种无线通信与计算资源协同优化方法和系统
Chakour et al. Strategic bandwidth allocation for QoS in IoT gateway: Predicting future needs based on IoT device habits
CN114726743A (zh) 一种基于联邦强化学习的服务功能链部署方法
Miuccio et al. On learning generalized wireless MAC communication protocols via a feasible multi-agent reinforcement learning framework
CN116193516A (zh) 一种物联网场景下用于高效联邦学习的成本优化方法
CN117880892A (zh) 基于数字孪生的车联网网络切片切换与资源分配方法
CN116170878A (zh) 一种基于改进ibn网络的意图冲突协调化解方法
CN101510152B (zh) 普适环境下面向体征状态识别的上下文感知中间件方法
CN115550181A (zh) 基于lstm和a2c的网络切片资源分配方法及系统
Priya et al. iRSL: Intelligent RAT selection framework for beyond 5G networks
Yang et al. The effect of QoS and QoE requirements for designing task processing controller based on fuzzy logic on IoT environments
CN111817975A (zh) 混合式网内动态负载均衡方法、装置及系统
Bakri et al. Mitigating xApp conflicts for efficient network slicing in 6G O-RAN: a graph convolutional-based attention network approach
Tong et al. Network consensus analysis and optimization of distributed FANETs based on multi-agent consensus theory
CN118450529A (zh) 一种面向工业异构数据协同传输的分布式多信道接入方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant