[go: up one dir, main page]

CN116436984B - 时间同步误差感知的边端协同分布式能源调控方法及系统 - Google Patents

时间同步误差感知的边端协同分布式能源调控方法及系统

Info

Publication number
CN116436984B
CN116436984B CN202310356525.8A CN202310356525A CN116436984B CN 116436984 B CN116436984 B CN 116436984B CN 202310356525 A CN202310356525 A CN 202310356525A CN 116436984 B CN116436984 B CN 116436984B
Authority
CN
China
Prior art keywords
model
time synchronization
distributed energy
relay
gateway
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310356525.8A
Other languages
English (en)
Other versions
CN116436984A (zh
Inventor
周振宇
王曌
姚子佳
舒乙凌
廖海君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN202310356525.8A priority Critical patent/CN116436984B/zh
Publication of CN116436984A publication Critical patent/CN116436984A/zh
Application granted granted Critical
Publication of CN116436984B publication Critical patent/CN116436984B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00001Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by the display of information or by user interaction, e.g. supervisory control and data acquisition systems [SCADA] or graphical user interfaces [GUI]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00002Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00006Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by information or instructions transport means between the monitoring, controlling or managing units and monitored, controlled or operated power network element or electrical equipment
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00006Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by information or instructions transport means between the monitoring, controlling or managing units and monitored, controlled or operated power network element or electrical equipment
    • H02J13/00028Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by information or instructions transport means between the monitoring, controlling or managing units and monitored, controlled or operated power network element or electrical equipment involving the use of Internet protocols
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00032Systems characterised by the controlled or operated power network elements or equipment, the power network elements or equipment not otherwise provided for
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for AC mains or AC distribution networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for AC mains or AC distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for AC mains or AC distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/46Controlling of the sharing of output between the generators, converters, or transformers
    • H02J3/466Scheduling the operation of the generators, e.g. connecting or disconnecting generators to meet a given demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/54Systems for transmission via power distribution lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/0635Clock or time synchronisation in a network
    • H04J3/0638Clock or time synchronisation among nodes; Internode synchronisation
    • H04J3/0658Clock or time synchronisation among packet nodes
    • H04J3/0661Clock or time synchronisation among packet nodes using timestamps
    • H04J3/0667Bidirectional timestamps, e.g. NTP or PTP for compensation of clock drift and for compensation of propagation delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/10Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Power Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Signal Processing (AREA)
  • Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)

Abstract

本发明涉及时间同步误差感知的边端协同分布式能源调控方法及系统,属于通信技术领域。本发明提出时间同步误差敏感的边端协同分布式能源调控方法,通过联合优化路由选择和设备调度策略以实现边侧网关和端侧设备协同的分布式能源调控模型训练,以最小化基于时间同步误差的全局损失函数和平均模型训练总时延的加权和为优化目标,动态权衡模型训练精度和时延,为智慧园区低碳运行提供低时延、高精度的分布式能源调控策略。并且提出时间同步误差感知的边端协同分布式能源调控系统,设备基于所提方法生成的路由选择和设备调度策略进行本地模型训练与上传,最终网关进行分布式能源调控全局模型的聚合,实现低时延、高精度分布式能源调控。

Description

时间同步误差感知的边端协同分布式能源调控方法及系统
技术领域
本发明涉及时间同步误差感知的边端协同分布式能源调控方法及系统,属于通信技术领域。
背景技术
目前,低碳智慧园区中部署大量的可再生能源、可控负荷和分布式储能等多能源主体,是实现碳减排、碳中和,以及绿色可持续发展的基本单元。然而,由于分布式资源如风电、光伏等属于间歇性能源,随机波动的分布式能源供给和负荷需求之间难以实现稳定的供需平衡,严重影响电网安全稳定运行。因此,亟需研究低碳智慧园区分布式能源调控方法,对分布式资源进行统一协同管理,以消除能源调度盲区,从而实现资源互补、时空关联,促进新能源消纳,确保电力稳定供应。
为支撑低碳智慧园区分布式能源调控,包含大量电力设备与传感器节点的终端层采集光伏板、充电桩、可控负荷的电压、电流、有功/无功功率等海量运行状态数据。基于这些采集数据,可利用联邦学习训练分布式能源调控模型,形成电网运行状态、负荷状态等到光伏并网、负荷投切、储能充放电等分布式能源调控策略的映射。基于联邦学习的分布式能源调控模型训练通过边端之间模型的共享聚合,避免了大量原始采集数据的交互。具体来说,边缘网关与终端设备分别训练分布式能源调控全局模型和本地模型,并以迭代交互的方式协同优化模型训练性能,每次迭代交互包括四个步骤,即边端时间同步、网关全局模型下发、设备本地模型训练和上传、网关全局模型聚合,利用聚合的全局模型生成分布式能源调控策略。模型训练时延和训练精度是影响分布式能源调控策略时效性和有效性的关键指标。其中,模型训练时延包括模型传输时延、本地模型训练时延、全局模型聚合时延;模型训练精度与上传的本地模型数量和边端时间同步误差有关。模型训练性能由包括路由管理、设备调度在内的网络资源管理策略决定,因此,需要对网关和设备之间的网络资源进行协同管理优化,以实现低时延、高精度的分布式能源调控模型训练。然而,分布式能源调控模型训练仍需解决以下挑战:
第一,园区中网关与设备之间基于电力线通信(power line communication,PLC)进行时间同步,然而时间同步过程容易受信道条件和电磁干扰等因素影响,造成较大的时间同步误差,从而导致参与全局模型聚合的设备数据不同步,降低分布式能源调控模型训练的精度。
第二,分布式能源调控模型训练时延依赖于网络资源管理策略,然而针对设备的路由管理存在对抗性竞争问题,当多个设备选择同一个中继进行本地模型上传时,会由于频谱和功率等资源的限制,导致中继和网关间较大的模型传输时延,从而影响分布式调控模型训练性能。
第三,为优化分布式能源调控策略,模型训练的精度和时延性能需要权衡。一方面,为确保模型的精度,网关需要调度更多的设备进行全局模型聚合以满足充分的环境观测需求,然而,如果被调度设备计算资源和信道条件较差会增大模型训练的时延,难以保障分布式能源调控策略的时效性;另一方面,调度少量设备以减小模型训练时延则会导致不充分的环境观测,从而降低模型训练精度,难以保障分布式能源调控策略的有效性。
有鉴于上述的缺陷,本发明以期创设一种时间同步误差感知的边端协同分布式能源调控方法及系统,使其更具有产业上的利用价值。
发明内容
为解决上述技术问题,本发明的目的是提供一种时间同步误差感知的边端协同分布式能源调控方法及系统。实现智慧园区分布式能源调控模型训练与策略优化,同时考虑时间同步误差的影响,利用惩罚竞争深度Q网络(PDDQN)解决路由选择的对抗性竞争,减少边端同步时延和同步误差,实现高精度、低时延的分布式能源调控模型训练,支撑低碳智慧园区分布式能源调控策略优化。
本发明的时间同步误差感知的边端协同分布式能源调控方法,具体调控步骤为:
获得边层时间同步信号,通过边缘网关从卫星或地面基站接收时间同步信号;
将所述边层时间同步信号传输至终端层,并基于边端协同训练分布式能源调控全局模型和本地模型,建立路由选择及时间同步模型、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型;
基于所述路由选择及时间同步模型中的长期时间同步误差约束、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型,获得边端协同下基于路由选择和设备调度策略优化的分布式能源调控模型训练优化问题模型;
将上述边端协同分布式能源调控模型训练优化问题模型基于伸缩和和虚拟队列进行转换,进一步转化为马尔可夫问题,并基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法进行求解,根据求解结果,获得所述路由选择与设备调度策略,以及训练后的所述分布式能源调控全局模型,确定时间同步误差感知的边端协同分布式能源调控。
进一步的,所述路由选择及时间同步模型具体为:
④基于PTP的网关与中继之间的时间同步过程
在第t次迭代中,网关m0通过PTP协议实现与中继sj之间的时间同步,获得两者之间Delay_req与Sync时间同步报文传输的时间戳则网关m0与中继sj之间的时间同步误差表示为:
其中,|UD(t)|为Delay_req报文的大小,|US(t)|为Sync报文的大小,分别为网关m0与中继sj之间的上行及下行传输速率;
⑤基于PTP的中继与设备之间的时间同步过程
同理,基于PTP的中继与设备之间的时间同步过程中获得时间同步报文传输时间戳分别为则第t次迭代中继sj与设备mi之间的时间同步误差表示为:
其中,分别为中继sj与设备mi之间的上行及下行传输速率;
综上,网关m0和设备mi之间的时间同步误差表示为:
⑥长期时间同步误差约束
长期时间同步误差约束为:
其中,Ei,max表示m0与mi之间的长期同步误差的最大阈值。
进一步的,所述基于时间同步误差的设备调度及本地模型训练模型具体为:
第t次迭代中,可调度设备的集合表示为即,Emax为短期时间同步误差约束,用于对设备的可调度性进行区分。设备调度指示变量用二进制变量ai(t)∈{0,1}表示,其中,ai(t)=1表示第t次迭代中设备mi参与模型训练,否则ai(t)=0;
网关m0通过所选择的中继下发全局模型ω(t-1)给被调度设备mi;然后,设备mi更新本地模型ωi(t)=ω(t-1)并基于状态信息数据样本集合执行本地模型训练,其中为设备mi的第k个数据样本,βi(t)为设备mi的在第t次迭代中数据样本的数量;为衡量本地模型训练的精度,定义设备mi在第t次迭代的本地损失函数为:
其中,表示训练样本的损失函数,随着Ei(t)的增大而增大,Fii(t),t,Ei(t))用于本地模型更新,基于梯度下降法,设备mi的本地模型为:
其中,σ为学习步长;
设备mi的本地模型训练时延表示为:
其中,ψ为训练一个数据样本所需的CPU周期数,fi(t)为mi可用计算资源。
进一步的,所述分布式能源调控全局聚合模型具体为:
本地模型训练结束后,设备mi通过对应的中继sj上传本地模型到网关m0,并在网关处执行全局模型聚合
评估全局模型训练精度的全局模型损失函数表示为:
其中,E(t)={Ei(t)|ai(t)=1}。
进一步的,所述模型训练时延模型具体为:
(1)上下行传输速率
在第t次迭代中,网关m0与中继sj之间下行传输速率为
其中,Ns为OFDM符号传输速率,为第t次迭代网关m0与中继sj之间的下行传输功率,为第t次迭代网关m0与中继sj之间的频率响应,表示网关m0与中继sj之间的信干噪比(signal to interference plus noise ratio,SINR)间隙,为第t次迭代网关m0与中继sj之间的电磁干扰功率,δ0为高斯白噪声功率;
同理,可将网关m0与中继sj之间上行传输速率、中继sj与设备mi之间的下行传输速率、中继sj与设备mi之间的上行传输速率分别表示为
(2)模型传输时延
在第t次迭代中,从网关m0到设备mi的全局模型下发时延包括从m0到sj的下行传输时延和从sj到mi的下行传输时延,表示为:
其中,|ω(t-1)|表示全局模型的大小;
在第t次迭代中,从设备mi到网关m0的本地模型上传时延包括从mi到sj的上行传输时延和从sj到m0的上行传输时延,表示为:
其中,|ωi(t)|表示本地模型的大小;
(3)分布式能源调控模型训练总时延
在第t次迭代中,设备mi的训练总时延包括全局模型下发时延、本地模型训练时延和本地模型上传时延,表示为:
全局模型聚合在被调度设备完成本地模型上传之后执行,因此,在第t次迭代中,分布式能源调控模型训练总时延表示为:
其中,τg为全局模型聚合时延。
进一步的,所述边端协同下基于路由选择和设备调度策略优化的分布式能源调控模型训练优化问题模型具体为:
定义路由选择和设备调度的优化变量分别为该优化问题可建模为:
P1:
其中,V是权重参数,用于动态权衡全局损失函数与平均模型训练总时延;C1,C2和C3为路由选择约束,表示每次迭代中网关最多只能为每个设备选择一个中继;C4和C5为设备调度约束,表示第t次迭代中仅集合内设备是可调度的;C6为长期时间同步误差约束。
基于伸缩和定理和虚拟队列,将长期优化目标变量F(ω(t),t,E(t))和长期时间同步误差约束C6进行解耦,P1转换为其中,VD是权衡队列波动和Π(t)最小化的权重。
进一步的,所述为马尔可夫问题包括状态空间、动作空间与奖励函数,具体定义如下:
1)状态空间:
基于PDDQN的路由选择优化的状态空间包括数据样本数量、时间同步误差最大阈值、Delay_Req报文大小、Sync报文大小和电磁干扰功率,即
基于DQN的设备调度优化的状态空间为其中,E'(t),G(t),β(t)分别为时间同步误差、同步误差赤字和可调度设备数据样本数量的集合,即,
2)动作空间:
定义路由选择优化的动作空间为其中,
定义设备调度优化问题的动作空间为Aa(t)=a(t);
3)奖励函数:
路由选择和设备调度优化的奖励函数定义为P2的优化目标RE(t)。
进一步的,所述基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法的具体步骤为:
①初始化阶段:初始化时间同步误差赤字Gi(t)、路由选择和设备调度变量x(t),a(t)为0;
②对抗性路由选择和时间同步阶段:每次迭代开始时,m0为每个设备选择具有最大的动作,当存在对抗性竞争即m0为不同设备选择同一中继时,将中继分配给Q值较大的设备,如果两个设备Q值相同,将中继随机分配给其中一个设备,对于未成功分配中继的设备,网关将基于该设备剩余Q值中的最大值进行中继分配直至所有中继都被分配,或全部设备都已被分配中继。随后,m0基于最终路由选择策略完成边端时间同步。
③设备调度决策阶段:m0根据得到mi的时间同步误差,并得到可调度设备集合随后,m0基于ε-greedy算法和Qa(Sa(t),Aa(t),νmain)选择时间同步误差敏感的设备调度策略
④模型训练阶段:基于路由选择和设备调度决策,m0下发全局模型给被调度设备;接着,mi根据执行本地模型训练并上传训练后的本地模型到m0;随后,m0根据执行全局模型聚合;最后,m0根据公式Gi(t+1)=max{Gi(t)+Ei(t)-Ei,max,0}更新时间同步误差赤字Gi(t+1)并根据计算奖励RE(t);
⑤对抗性PDDQN学习阶段:对于设备mi,m0将当前状态转换到下一状态同时,生成一个PDDQN样本存入经验回放池并覆盖之前的PDDQN样本其中,Z是的大小;设被分配给设备mi的中继为所提算法TARGET定义惩罚函数为:
其中,在第t次迭代中被选择分配给不同设备的次数,反映了对抗性竞争强度;基于惩罚函数,定义第z个PDDQN样本的TD误差为:
其中,γx是PDDQN的折扣因子;根据 越大表明在路由选择优化中被选择的次数越多,即对抗性竞争强度越大,而这产生的较大的TD误差使PDDQN沿着更倾向于避免选择的方向更新,解决了对抗性竞争问题;
m0在PDDQN经验回放池中随机抽取S个经验样本组成集合且满足S<Z,则PDDQN的损失函数为:
基于梯度下降法,m0更新为:
其中,为PDDQN学习速率;PDDQN目标网络每T0>1次迭代更新一次,更新为
⑥DQN学习阶段:m0将当前状态Sa(t)转换到下一状态Sa(t+1);同时,生成一个DQN样本存入经验回放池并覆盖之前的DQN样本其中,K是的大小;定义第k个DQN样本的TD误差为:
其中,γa为DQN折扣因子;
m0在DQN经验回放池中随机抽取H个经验样本组成集合且满足H<K;DQN的损失函数为:
基于梯度下降法,m0更新νmain为:
其中,为DQN学习速率;DQN目标网络每T0>1次迭代更新一次,更新为νtarget=νmain
重复上述步骤②到步骤⑥,直至T次迭代结束;随后,利用训练后的分布式能源调控模型,根据实时负载、储能单元状态、光照强度等输入,可以生成分布式能源调控策略,以改善能源供需平衡,并促进可再生能源利用。
时间同步误差感知的边端协同分布式能源调控系统,包括边层和终端层;
其中:
边层包括一个边缘网关;
边缘网关用于从卫星或地面基站接收时间同步信号,通过PLC对终端层进行授时,并负责进行分布式能源调控全局模型的聚合,边缘网关基于所提时间同步误差感知的边端协同分布式能源调控方法优化时间同步与模型交互的路由选择,以及优化参与全局模型聚合的设备调度,支撑低时延、高精度分布式能源调控模型训练;
终端层包括中继层和设备层;
中继层用于连接底层设备和网关,负责边端之间时间同步及模型转发;
设备层用于收集电气设备的状态信息并执行本地模型训练,并基于所提时间同步误差感知的边端协同分布式能源调控方法生成的路由选择和设备调度策略进本地模型上传。
一种时间同步误差感知的边端协同分布式能源调控装置,包括:
信号获取模块:用于获得边层时间同步信号,通过边缘网关从卫星或地面基站接收时间同步信号;
建模模块:用于将所述边层时间同步信号传输至终端层,并基于边端协同训练分布式能源调控全局模型和本地模型,建立路由选择及时间同步模型、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型;
优化建模模块:用于基于所述路由选择及时间同步模型中的长期时间同步误差约束、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型,获得边端协同下基于路由选择和设备调度策略优化的分布式能源调控模型训练优化问题模型;
转化计算模块:用于将上述边端协同分布式能源调控模型训练优化问题模型基于伸缩和和虚拟队列进行转换,进一步转化为马尔可夫问题,并基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法进行求解,根据求解结果,获得所述路由选择与设备调度策略,以及训练后的所述分布式能源调控全局模型,确定时间同步误差感知的边端协同分布式能源调控。
进一步的,
所述优化建模模块中,边端协同下基于路由选择和设备调度策略优化的分布式能源调控模型训练优化问题模型具体为:
P1:
其中,V是权重参数,用于动态权衡全局损失函数与平均模型训练总时延;C1,C2和C3为路由选择约束,表示每次迭代中网关最多只能为每个设备选择一个中继;C4和C5为设备调度约束,表示第t次迭代中仅集合内设备是可调度的;C6为长期时间同步误差约束。
借由上述方案,本发明至少具有以下优点:
1.本发明提出时间同步误差感知的边端协同分布式能源调控方法,通过联合优化路由选择和设备调度策略以实现边侧网关和端侧设备协同的分布式能源调控模型训练,以最小化基于时间同步误差的全局损失函数和平均模型训练总时延的加权和为优化目标,动态权衡模型精度和时延,为智慧园区低碳运行提供低时延、高精度的分布式能源调控策略。
2.本发明解决了分布式能源调控模型训练中对抗性竞争与时间同步感知的问题。通过网关协调与基于中继选择次数的惩罚函数设计,解决不同设备在路由选择中的对抗性竞争问题,缓解了因对抗性竞争导致的模型训练时延增长问题;通过短期与长期时间同步误差约束设置与虚拟赤字队列转换,筛选可调度设备集合,并基于时间同步误差赤字动态调整路由选择与设备调度策略,实现时间同步误差感知,缓解由于时间同步误差较大导致的模型训练精度下降问题。
3.本发明提出时间同步误差感知的边端协同分布式能源调控系统,包括边层和终端层。在边端协同的分布式能源调控模型训练与策略优化下,边层网关基于所提方法生成的路由选择和设备调度策略对中继和设备进行时间同步,并下发全局模型,设备基于所提方法生成的路由选择和设备调度策略进行本地模型训练与上传,最终网关进行分布式能源调控全局模型的聚合,实现低时延、高精度分布式能源调控。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某个实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明的系统模型图;
图2是本发明的算法流程图;
图3是本发明V2G调节前后的负荷曲线(TARGET);
图4是本发明V2G调节前后的负荷曲线(FCS-RMS);
图5是本发明V2G调节前后的负荷曲线(DS-RMS)。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
整个技术方案包括整体系统和具体方法两部分。
1.整体系统
如图1所示,时间同步误差感知的边端协同分布式能源调控系统包括边层和终端层。
边层包含一个边缘网关,边缘网关从卫星或地面基站接收时间同步信号,通过PLC对终端层进行授时,并负责进行分布式能源调控全局模型的聚合。边缘网关基于所提时间同步误差感知的边端协同分布式能源调控方法优化时间同步与模型交互的路由选择,以及优化参与全局模型聚合的设备调度,支撑低时延、高精度分布式能源调控模型训练。
终端层包含中继层和设备层。在中继层,中继连接终底层设备和网关,负责边端之间时间同步及模型转发。在设备层,设备收集光伏板、充电桩等电气设备的状态信息并执行本地模型训练,并基于所提时间同步误差感知的边端协同分布式能源调控方法生成的路由选择和设备调度策略进本地模型上传。
2.具体方法
本发明设计了一种时间同步误差感知的边端协同分布式能源调控方法,主要包括分布式能源调控训练模型构建、优化问题建模及转化以及基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法设计三阶段,具体介绍如下:
(1)分布式能源调控训练模型构建
本发明考虑智慧园区中时间同步误差敏感的边端协同分布式能源调控场景。边层网关m0接收卫星及地面基站的时间同步信号并通过PLC实现对端层设备的时间同步。J个中继连接设备和网关,其集合表示为I个设备收集光伏等电气设备的状态信息并执行本地模型训练,其集合表示为在分布式能源调控模型训练和策略优化过程中,共考虑T次迭代,集合表示为假设PLC信道状态在一次迭代中保持不变。每次迭代由如下五个步骤组成。
①路由选择及时间同步:网关为每个设备选择中继来实现基于高精度时间同步协议(Precision Time Protocol,PTP)的时间同步。
②设备调度及全局模型下发:网关基于时间同步误差进行设备调度,并将全局模型通过所选择的中继下发到被调度的设备。
③本地模型训练:被调度的设备基于全局模型及采集到的状态信息执行本地模型训练。
④本地模型上传:被调度的设备将训练好的本地模型通过所选择的中继上传到网关。
⑤全局模型聚合:网关基于上传的本地模型执行全局模型聚合。
在每次迭代中,网关m0通过协调路由选择及设备调度来优化分布式能源调控模型的训练精度及训练时延。
考虑路由选择及时间同步模型、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型,具体如下所述。
1)路由选择及时间同步模型
路由选择指示变量用二进制变量xj,i∈{0,1}表示,其中,xj,i(t)=1表示第t次迭代中选择中继sj来实现从m0到mi的时间同步报文和全局模型下发,同时实现从mi到m0的本地模型上传,否则xj,i(t)=0。基于PTP的时间同步过程及长期时间同步误差约束如下。
①基于PTP的网关与中继之间的时间同步过程
在第t次迭代中,网关m0通过PTP协议实现与中继sj之间的时间同步,获得两者之间Delay_req与Sync时间同步报文传输的时间戳则网关m0与中继sj之间的时间同步误差表示为
其中,|UD(t)|为Delay_req报文的大小,|US(t)|为Sync报文的大小,分别为网关m0与中继sj之间的上行及下行传输速率。
②基于PTP的中继与设备之间的时间同步过程
同理,基于PTP的中继与设备之间的时间同步过程中获得时间戳分别为则第t次迭代中继sj与设备mi之间的时间同步误差表示为
其中,分别为中继sj与设备mi之间的上行及下行传输速率。
综上,网关m0和设备mi之间的时间同步误差表示为
③长期时间同步误差约束
考虑到分布式能源调控对时间同步精度的严格要求,构建长期时间同步误差约束为
其中,Ei,max表示m0与mi之间的长期同步误差的最大阈值。
2)基于时间同步误差的设备调度及本地模型训练模型
具有较大时间同步误差的设备不应参与模型训练,因此设置短期时间同步误差约束Emax用于对设备的可调度性进行区分。当设备时间同步误差小于Emax时,该设备可被调度参与分布式能源调控模型训练。第t次迭代中,可调度设备的集合表示为即,设备调度指示变量用二进制变量ai(t)∈{0,1}表示,其中,ai(t)=1表示第t次迭代中设备mi参与模型训练,否则ai(t)=0。
网关m0通过所选择的中继下发全局模型ω(t-1)给被调度设备,如mi。然后,设备mi更新本地模型ωi(t)=ω(t-1)并基于状态信息数据样本集合执行本地模型训练,其中为设备mi的第k个数据样本,βi(t)为设备mi的在第t次迭代中数据样本的数量。为衡量本地模型训练的精度,定义设备mi在第t次迭代的本地损失函数为
其中,表示训练样本的损失函数,考虑到时间同步误差的影响,随着Ei(t)的增大而增大。Fii(t),t,Ei(t))用于本地模型更新。基于梯度下降法,设备mi的本地模型更新为
其中,σ为学习步长。
设备mi的本地模型训练时延表示为
其中,ψ为训练一个数据样本所需的CPU周期数,fi(t)为mi可用计算资源。
3)分布式能源调控全局聚合模型
本地模型训练结束后,设备mi通过对应的中继sj上传本地模型到网关m0,并在网关处执行全局模型聚合
评估全局模型训练精度的全局模型损失函数表示为
其中,E(t)={Ei(t)|ai(t)=1}。
4)模型训练时延
①上下行传输速率
本发明基于正交频分复用技术(orthogonal frequency divisionmultiplexing,OFDM)实现网关、中继和设备间时间同步报文、全局模型和本地模型传输。在第t次迭代中,网关m0与中继sj之间下行传输速率为
其中,Ns为OFDM符号传输速率,为第t次迭代网关m0与中继sj之间的下行传输功率,为第t次迭代网关m0与中继sj之间的频率响应。表示网关m0与中继sj之间的信干噪比(signal to interference plus noise ratio,SINR)间隙。为第t次迭代网关m0与中继sj之间的电磁干扰功率,δ0为高斯白噪声功率。
同理,可将网关m0与中继sj之间上行传输速率、中继sj与设备mi之间的下行传输速率、中继sj与设备mi之间的上行传输速率分别表示为
②模型传输时延
在第t次迭代中,从网关m0到设备mi的全局模型下发时延包括从m0到sj的下行传输时延和从sj到mi的下行传输时延,表示为
其中,|ω(t-1)|表示全局模型的大小。
在第t次迭代中,从设备mi到网关m0的本地模型上传时延包括从mi到sj的上行传输时延和从sj到m0的上行传输时延,表示为
其中,|ωi(t)|表示本地模型的大小。
③分布式能源调控模型训练总时延
在第t次迭代中,设备mi的训练总时延包括全局模型下发时延、本地模型训练时延和本地模型上传时延,表示为
全局模型聚合在被调度设备完成本地模型上传之后执行,因此,在第t次迭代中,分布式能源调控模型训练总时延表示为
其中,τg为全局模型聚合时延。
(2)优化问题建模与转换
1)问题建模
本发明的优化目标是在长期时间同步误差约束下,通过边端协同的路由选择和设备调度策略优化,最小化分布式能源调控模型训练全局损失函数和平均模型训练总时延的加权和。定义路由选择和设备调度的优化变量分别为该优化问题可建模为
其中,V是权重参数,用于动态权衡全局损失函数与平均模型训练总时延。C1,C2和C3为路由选择约束,表示每次迭代中网关最多只能为每个设备选择一个中继。C4和C5为设备调度约束,表示第t次迭代中仅集合内设备是可调度的。C6为长期时间同步误差约束。
2)问题转换
由于分布式能源调控模型训练优化策略与F(ω(t),t,E(t))及长期时间同步误差约束C6耦合,P1无法直接求解。因此,采用伸缩和定理解耦
其中,F(ω(t-1),t-1,E(t-1))在第t次迭代时为已知参量。
采用虚拟队列来解耦长期时间同步误差约束,即构建时间同步误差赤字虚拟队列为
Gi(t+1)=max{Gi(t)+Ei(t)-Ei,max,0} (17)
当Gi(t)平均速率稳定时,约束C6自动满足。
定义Lyapunov漂移加惩罚为
其中,VD是权衡队列波动和Π(t)最小化的权重。
因此,P1被转换为最大化ΔVDK(G(t))的负上界,即
(3)基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法设计
考虑到设备调度需要全部设备的时间同步误差信息,依赖路由选择策略,因此,路由选择和设备调度优化无法同时进行。本发明提出基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法TARGET解决上述优化问题,其中,采用PDDQN进行路由选择优化以解决不同设备中继选择的对抗性竞争问题,并采用DQN进行设备调度优化。
本发明将优化问题建模为马尔可夫过程(Markov decision process,MDP),状态空间、动作空间与奖励函数定义如下:
1)状态空间:
基于PDDQN的路由选择优化的状态空间包括数据样本数量、时间同步误差最大阈值、Delay_Req报文大小、Sync报文大小和电磁干扰功率,即
基于DQN的设备调度优化的状态空间为其中,E'(t),G(t),β(t)分别为时间同步误差、同步误差赤字和可调度设备数据样本数量的集合,即,
2)动作空间:
定义路由选择优化的动作空间为其中,
定义设备调度优化问题的动作空间为Aa(t)=a(t)。
3)奖励函数:
路由选择和设备调度优化的奖励函数定义为P2的优化目标RE(t)。
如图2所示,所提基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法的主体为网关m0。m0分别为每个设备维护PDDQN的一个评估网络和一个目标网络及经验回放池进行路由选择优化。此外,m0维护DQN的一个评估网络νmain和一个目标网络νtarget及经验回放池进行设备调度优化。
对于路由选择优化,所采用的PDDQN的Q值由两部分组成,分别是仅与状态有关的价值函数和与状态和动作有关的优势函数其中,分别为价值函数和优势函数的特定网络参数。因此,PDDQN的Q值表示为
PDDQN的Q值设置能有效解决不同动作对应相同Q值的对抗性问题,有利于网关优化中继选择策略以加快学习收敛速度。PDDQN的目标网络和经验回放池作用与传统的DQN相同。
对于设备调度优化问题,采用DQN评估网络实现“状态-动作”到Q值的映射,并利用目标网络协助训练评估网络以提高学习过程的收敛性和稳定性。此外,通过经验回放池机制克服经验数据的相关性和非平稳分布问题,提高DQN的学习效率。
本发明设计的基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法具体步骤如下:
①初始化阶段:初始化时间同步误差赤字Gi(t)、路由选择和设备调度变量x(t),a(t)为0。
②对抗性路由选择和时间同步阶段:每次迭代开始时,m0为每个设备选择具有最大的动作。具体而言,当存在对抗性竞争即m0为不同设备选择同一中继时,将中继分配给Q值较大的设备,如果两个设备Q值相同,将中继随机分配给其中一个设备,对于未成功分配中继的设备,网关将基于该设备剩余Q值中的最大值进行中继分配直至所有中继都被分配,或全部设备都已被分配中继。随后,m0基于最终路由选择策略完成边端时间同步。
③设备调度决策阶段:m0根据公式(3)得到mi的时间同步误差,并得到可调度设备集合随后,m0基于ε-greedy算法和Qa(Sa(t),Aa(t),νmain)选择时间同步误差敏感的设备调度策略
④模型训练阶段:基于路由选择和设备调度决策,m0下发全局模型给被调度设备。接着,mi根据公式(6)执行本地模型训练并上传训练后的本地模型到m0。随后,m0根据公式(8)执行全局模型聚合。最后,m0根据公式(17)更新时间同步误差赤字Gi(t+1)并根据公式(19)计算奖励RE(t)。
⑤对抗性PDDQN学习阶段:对于设备mi,m0将当前状态转换到下一状态同时,生成一个PDDQN样本存入经验回放池并覆盖之前的PDDQN样本其中,Z是的大小。设被分配给设备mi的中继为所提算法TARGET定义惩罚函数为
其中,在第t次迭代中被选择分配给不同设备的次数,反映了对抗性竞争强度。基于惩罚函数,定义第z个PDDQN样本的TD误差为
其中,γx是PDDQN的折扣因子。根据公式(21),越大表明在路由选择优化中被选择的次数越多,即对抗性竞争强度越大,而这产生的较大的TD误差使PDDQN沿着更倾向于避免选择的方向更新,解决了对抗性竞争问题。
m0在PDDQN经验回放池中随机抽取S个经验样本组成集合且满足S<Z,则PDDQN的损失函数为
基于梯度下降法,m0更新
其中,为PDDQN学习速率。PDDQN目标网络每T0>1次迭代更新一次,更新为
⑥DQN学习阶段:m0将当前状态Sa(t)转换到下一状态Sa(t+1)。同时,生成一个DQN样本存入经验回放池并覆盖之前的DQN样本其中,K是的大小。定义第k个DQN样本的TD误差为
其中,γa为DQN折扣因子。
m0在DQN经验回放池中随机抽取H个经验样本组成集合且满足H<K。DQN的损失函数为
基于梯度下降法,m0更新νmain
其中,为DQN学习速率。DQN目标网络每T0>1次迭代更新一次,更新为νtarget=νmain
重复上述步骤②到步骤⑥,直至T次迭代结束。随后,利用训练后的分布式能源调控模型,根据实时负载、储能单元状态、光照强度等输入,可以生成分布式能源调控策略,以改善能源供需平衡,并促进可再生能源利用。
本发明对上述提出的基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法,进行了如下仿真对比:
对比算法1为基于快速收敛调度的资源管理策略(the fast convergescheduling-based resource management strategy,FCS-RMS),该算法通过优化路由选择和设备调度来最小化全局损失函数和平均训练延迟的加权和,但忽略了路由选择中的对抗性竞争问题。对比算法2为基于设备调度的资源管理策略(device scheduling-basedresource management strategy,DS-RMS),该算法仅通过优化设备调度来最小化全局损失函数,而忽略了路由选择优化问题。此外,FCS-RMS和DS-RMS都无法保证长期时间同步误差约束。
本发明考虑典型分布式能源调控V2G(vehicle-to-grid)场景验证基于所提算法训练的分布式能源调控模型性能,假设100辆电动汽车通过充电桩面向电网充放电,其电池容量为60kWh,充放电功率为7kW。仿真结果如下。
图3、4、5分别展示了V2G场景中三种分布式能源调控策略应用前后的负荷曲线变化。其输入包括光伏出力、电价、负荷及可调控的电动汽车数量,应用训练好的分布式调控模型输出电动汽车充放电功率策略。与FCS-RMS和DS-RMS相比,应用TARGET的负荷率,即最大负荷与平均负荷之比,分别提升了10.33%和13.77%,说明电网运行稳定性更高。
以上所述仅是本发明的优选实施方式,并不用于限制本发明,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (3)

1.时间同步误差感知的边端协同分布式能源调控方法,其特征在于:具体调控步骤为:
获得边层时间同步信号,通过边缘网关从卫星或地面基站接收时间同步信号;
将所述边层时间同步信号传输至终端层,并基于边端协同训练分布式能源调控全局模型和本地模型,建立路由选择及时间同步模型、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型;
基于所述路由选择及时间同步模型中的长期时间同步误差约束、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型,获得边端协同下基于路由选择和设备调度策略优化的分布式能源调控模型训练优化问题模型;
将上述边端协同分布式能源调控模型训练优化问题模型基于伸缩和和虚拟队列进行转换,进一步转化为马尔可夫问题,并基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法进行求解,根据求解结果,获得所述路由选择与设备调度策略,以及训练后的所述分布式能源调控全局模型,确定时间同步误差感知的边端协同分布式能源调控;
所述路由选择及时间同步模型具体为:
①基于PTP的网关与中继之间的时间同步过程
在第t次迭代中,网关m0通过PTP协议实现与中继sj之间的时间同步,获得两者之间Delay_req与Sync时间同步报文传输的时间戳则网关m0与中继sj之间的时间同步误差表示为:
其中,|UD(t)|为Delay_req报文的大小,|US(t)|为Sync报文的大小,分别为网关m0与中继sj之间的上行及下行传输速率;
②基于PTP的中继与设备之间的时间同步过程
同理,基于PTP的中继与设备之间的时间同步过程中获得时间同步报文传输时间戳分别为则第t次迭代中继sj与设备mi之间的时间同步误差表示为:
其中,分别为中继sj与设备mi之间的上行及下行传输速率;
综上,网关m0和设备mi之间的时间同步误差表示为:
路由选择指示变量用二进制变量xj,i∈{0,1}表示,其中,xj,i(t)=1表示第t次迭代中选择中继sj来实现从m0到mi的时间同步报文和全局模型下发,同时实现从mi到m0的本地模型上传,否则xj,i(t)=0
③长期时间同步误差约束
长期时间同步误差约束为:
其中,Ei,max表示m0与mi之间的长期同步误差的最大阈值;
所述基于时间同步误差的设备调度及本地模型训练模型具体为:
第t次迭代中,可调度设备的集合表示为即,Emax为短期时间同步误差约束,用于对设备的可调度性进行区分;设备调度指示变量用二进制变量ai(t)∈{0,1}表示,其中,ai(t)=1表示第t次迭代中设备mi参与模型训练,否则ai(t)=0;
网关m0通过所选择的中继下发全局模型ω(t-1)给被调度设备mi;然后,设备mi更新本地模型ωi(t)=ω(t-1)并基于状态信息数据样本集合执行本地模型训练,其中为设备mi的第k个数据样本,βi(t)为设备mi的在第t次迭代中数据样本的数量;为衡量本地模型训练的精度,定义设备mi在第t次迭代的本地损失函数为:
其中,表示训练样本的损失函数,随着Ei(t)的增大而增大,Fii(t),t,Ei(t))用于本地模型更新,基于梯度下降法,设备mi的本地模型为:
其中,σ为学习步长;
设备mi的本地模型训练时延表示为:
其中,ψ为训练一个数据样本所需的CPU周期数,fi(t)为mi可用计算资源;
所述分布式能源调控全局聚合模型具体为:
本地模型训练结束后,设备mi通过对应的中继sj上传本地模型到网关m0,并在网关处执行全局模型聚合
评估全局模型训练精度的全局模型损失函数表示为:
其中,E(t)={Ei(t)|ai(t)=1};
所述模型训练时延模型具体为:
(1)上下行传输速率
在第t次迭代中,网关m0与中继sj之间下行传输速率为
其中,Ns为OFDM符号传输速率,为第t次迭代网关m0与中继sj之间的下行传输功率,为第t次迭代网关m0与中继sj之间的频率响应,表示网关m0与中继sj之间的信干噪比(signal to interference plus noise ratio,SINR)间隙,为第t次迭代网关m0与中继sj之间的电磁干扰功率,δ0为高斯白噪声功率;
同理,可将网关m0与中继sj之间上行传输速率、中继sj与设备mi之间的下行传输速率、中继sj与设备mi之间的上行传输速率分别表示为
(2)模型传输时延
在第t次迭代中,从网关m0到设备mi的全局模型下发时延包括从m0到sj的下行传输时延和从sj到mi的下行传输时延,表示为:
其中,|ω(t-1)|表示全局模型的大小;
在第t次迭代中,从设备mi到网关m0的本地模型上传时延包括从mi到sj的上行传输时延和从sj到m0的上行传输时延,表示为:
其中,|ωi(t)|表示本地模型的大小;
(3)分布式能源调控模型训练总时延
在第t次迭代中,设备mi的训练总时延包括全局模型下发时延、本地模型训练时延和本地模型上传时延,表示为:
全局模型聚合在被调度设备完成本地模型上传之后执行,因此,在第t次迭代中,分布式能源调控模型训练总时延表示为:
其中,τg为全局模型聚合时延;
所述边端协同下基于路由选择和设备调度策略优化的分布式能源调控模型训练优化问题模型具体为:
定义路由选择和设备调度的优化变量分别为x(t)={xj,i(t)|mi∈M,sj∈S}和 该优化问题可建模为:
其中,V是权重参数,用于动态权衡全局损失函数与平均模型训练总时延;C1,C2和C3为路由选择约束,表示每次迭代中网关最多只能为每个设备选择一个中继;C4和C5为设备调度约束,表示第t次迭代中仅集合内设备是可调度的;C6为长期时间同步误差约束;
基于伸缩和定理和虚拟队列,将长期优化目标变量F(ω(t),t,E(t))和长期时间同步误差约束C6进行解耦,P1转换为
s.t. C1~C5其中,VD是权衡队列波动和Π(t)最小化的权重;
所述为马尔可夫问题包括状态空间、动作空间与奖励函数,具体定义如下:
1)状态空间:
基于PDDQN的路由选择优化的状态空间包括数据样本数量、时间同步误差最大阈值、Delay_Req报文大小、Sync报文大小和电磁干扰功率,即
基于DQN的设备调度优化的状态空间为其中,E′(t),G(t),β(t)分别为时间同步误差、同步误差赤字和可调度设备数据样本数量的集合,即,
2)动作空间:
定义路由选择优化的动作空间为其中,
定义设备调度优化问题的动作空间为Aa(t)=a(t);
3)奖励函数:
路由选择和设备调度优化的奖励函数定义为P2的优化目标RE(t);
所述基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法的具体步骤为:
①初始化阶段:初始化时间同步误差赤字Gi(t)、路由选择和设备调度变量x(t),a(t)为0;
②对抗性路由选择和时间同步阶段:每次迭代开始时,m0为每个设备选择具有最大的动作,当存在对抗性竞争即为不同设备选择同一中继时,将中继分配给Q值较大的设备,如果两个设备Q值相同,将中继随机分配给其中一个设备,对于未成功分配中继的设备,网关将基于该设备剩余Q值中的最大值进行中继分配直至所有中继都被分配,或全部设备都已被分配中继,随后,m0基于最终路由选择策略完成边端时间同步;为PDDQN的一个评估网络,分别为价值函数和优势函数的网络参数;
③设备调度决策阶段:m0根据得到mi的时间同步误差,并得到可调度设备集合;随后,m0基于ε-greedy算法和Qa(Sa(t),Aa(t),vmain)选择时间同步误差敏感的设备调度策略vmain为DQN的一个评估网络;
④模型训练阶段:基于路由选择和设备调度决策,m0下发全局模型给被调度设备;接着,mi根据执行本地模型训练并上传训练后的本地模型到m0;随后,m0根据执行全局模型聚合;最后,m0根据公式Gi(t+1)=max{Gi(t)+Ei(t)-Ei,max,0}更新时间同步误差赤字Gi(t+1)并根据 计算奖励RE(t);
⑤对抗性PDDQN学习阶段:对于设备mi,m0将当前状态转换到下一状态 同时,生成一个PDDQN样本存入经验回放池并覆盖之前的PDDQN样本其中,Z是的大小;设被分配给设备mi的中继为所提算法TARGET定义惩罚函数为:
其中,在第t次迭代中被选择分配给不同设备的次数,反映了对抗性竞争强度;基于惩罚函数,定义第z个PDDQN样本的TD误差为:
其中,γx是PDDQN的折扣因子;根据 越大表明在路由选择优化中被选择的次数越多,即对抗性竞争强度越大,而这产生的较大的TD误差使PDDQN沿着更倾向于避免选择的方向更新,解决了对抗性竞争问题;
m0在PDDQN经验回放池中随机抽取S个经验样本组成集合且满足S<Z,则PDDQN的损失函数为:
基于梯度下降法,m0更新为:
其中,为PDDQN学习速率;PDDQN目标网络每T0>1次迭代更新一次,更新为
⑥DQN学习阶段:m0将当前状态Sa(t)转换到下一状态Sa(t+1);同时,生成一个DQN样本存入经验回放池并覆盖之前的DQN样本其中,K是的大小;定义第k个DQN样本的TD误差为:
其中,γa为DQN折扣因子;
m0在DQN经验回放池中随机抽取H个经验样本组成集合且满足H<K;DQN的损失函数为:
基于梯度下降法,m0更新vmain为:
其中,为DQN学习速率;DQN目标网络每T0>1次迭代更新一次,更新为vtarget=vmain
重复上述步骤②到步骤⑥,直至T次迭代结束;随后,利用训练后的分布式能源调控模型,根据实时负载、储能单元状态、光照强度输入,可以生成分布式能源调控策略,以改善能源供需平衡,并促进可再生能源利用。
2.时间同步误差感知的边端协同分布式能源调控系统,用于执行权利要求1所述的方法,其特征在于:包括边层和终端层;
其中:
边层包括一个边缘网关;
边缘网关用于从卫星或地面基站接收时间同步信号,通过PLC对终端层进行授时,并负责进行分布式能源调控全局模型的聚合,边缘网关基于所提时间同步误差感知的边端协同分布式能源调控方法优化时间同步与模型交互的路由选择,以及优化参与全局模型聚合的设备调度,支撑低时延、高精度分布式能源调控模型训练;
终端层包括中继层和设备层;
中继层用于连接底层设备和网关,负责边端之间时间同步及模型转发;
设备层用于收集电气设备的状态信息并执行本地模型训练,并基于所提时间同步误差感知的边端协同分布式能源调控方法生成的路由选择和设备调度策略进本地模型上传。
3.时间同步误差感知的边端协同分布式能源调控装置,用于执行权利要求1所述的方法,其特征在于:包括:
信号获取模块:用于获得边层时间同步信号,通过边缘网关从卫星或地面基站接收时间同步信号;
建模模块:用于将所述边层时间同步信号传输至终端层,并基于边端协同训练分布式能源调控全局模型和本地模型,建立路由选择及时间同步模型、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型;
优化建模模块:用于基于所述路由选择及时间同步模型中的长期时间同步误差约束、基于时间同步误差的设备调度及本地模型训练模型、分布式能源调控全局聚合模型和模型训练时延模型,获得边端协同下基于路由选择和设备调度策略优化的分布式能源调控模型训练优化问题模型;
转化计算模块:用于将上述边端协同分布式能源调控模型训练优化问题模型基于伸缩和和虚拟队列进行转换,进一步转化为马尔可夫问题,并基于PDDQN的时间同步误差敏感边端协同分布式能源调控算法进行求解,根据求解结果,获得所述路由选择与设备调度策略,以及训练后的所述分布式能源调控全局模型,确定时间同步误差感知的边端协同分布式能源调控。
CN202310356525.8A 2023-04-06 2023-04-06 时间同步误差感知的边端协同分布式能源调控方法及系统 Active CN116436984B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310356525.8A CN116436984B (zh) 2023-04-06 2023-04-06 时间同步误差感知的边端协同分布式能源调控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310356525.8A CN116436984B (zh) 2023-04-06 2023-04-06 时间同步误差感知的边端协同分布式能源调控方法及系统

Publications (2)

Publication Number Publication Date
CN116436984A CN116436984A (zh) 2023-07-14
CN116436984B true CN116436984B (zh) 2025-09-19

Family

ID=87086702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310356525.8A Active CN116436984B (zh) 2023-04-06 2023-04-06 时间同步误差感知的边端协同分布式能源调控方法及系统

Country Status (1)

Country Link
CN (1) CN116436984B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117202325B (zh) * 2023-08-21 2024-07-09 大连海事大学 一种工业物联网中自适应感知与协同传输方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120310559A1 (en) * 2011-05-31 2012-12-06 Cisco Technology, Inc. Distributed data collection for utility grids
CN114626306B (zh) * 2022-03-22 2023-01-24 华北电力大学 一种园区分布式能源调控信息新鲜度保障方法及系统
CN115102953B (zh) * 2022-04-13 2023-08-08 北京智芯微电子科技有限公司 配电网云边端协同管控系统及方法
CN114900264B (zh) * 2022-06-08 2025-04-29 华北电力大学 一种面向低碳园区群的智能分层时间同步方法及系统
CN115149586B (zh) * 2022-08-01 2024-07-19 华北电力大学 一种分布式能源聚合调控与自主调控协同优化方法及系统
CN115220351B (zh) * 2022-08-06 2023-07-21 郑州轻工业大学 一种基于云边端的建筑空调系统智能节能优化控制方法
CN115580577B (zh) * 2022-09-23 2024-07-02 华北电力大学 一种基于时间同步感知的智慧园区多态路由协议优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Zhao Wang ; Yiling Shu ; Haijun Liao ; Zhenyu Zhou ; Lei Lv ; Le Zhang.Edge-End Cooperative Network Resource Allocation With Time Synchronization Awareness for Federated Learning-Based Distributed Energy Regulation.《IEEE Transactions on Smart Grid》.2025,全文. *

Also Published As

Publication number Publication date
CN116436984A (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
JP7261507B2 (ja) 電気ヒートポンプ-熱電併給システムを最適化する調整方法及びシステム
CN109492791B (zh) 基于充电引导的城际高速路网光储充电站定容规划方法
CN105680474B (zh) 一种储能抑制光伏电站快速功率变化的控制方法
CN110890752B (zh) 一种可参与电网辅助服务的集中式云储能运行决策方法
CN114900264B (zh) 一种面向低碳园区群的智能分层时间同步方法及系统
CN108599194B (zh) 一种计及储能浅充浅放需求的调频控制方法
CN111641233A (zh) 一种考虑新能源及负荷不确定性的电力系统日内灵活调峰方法
CN114006399B (zh) 一种规模化5g基站参与配电网需求响应的优化调度方法
CN116683534A (zh) 一种考虑多类型柔性资源的配电网协同规划方法及装置
CN107302231A (zh) 一种小水电群接入电网的两目标随机经济调度方法
CN115310291A (zh) 考虑电动汽车动态接入特性的智能楼宇群能量管理方法
CN116436984B (zh) 时间同步误差感知的边端协同分布式能源调控方法及系统
CN110165713A (zh) 一种基于电网调峰需求的多能互补园区需求响应方法
JP7569704B2 (ja) 充放電要素の充放電制御方法、および、充放電制御装置
CN109886578A (zh) 一种停车场内电动汽车充电调度方法
CN115912430A (zh) 基于云边端协同的大规模储能电站资源分配方法及系统
CN119448299B (zh) 一种云储能与可持续分布式能源系统的运行方法及系统
CN119448215A (zh) 计及储能寿命的源荷储调度方法、装置、设备及存储介质
CN114977163B (zh) 基于5g网络的主动配电网需求响应的无线资源分配方法
CN118657316A (zh) 基于云-边-端架构协同多虚拟电厂的优化调度方法及系统
CN119813366A (zh) 考虑evcs储能及配电网灵活供需平衡的日前调度方法
CN117540852A (zh) 一种基于低碳和经济时空匹配的电力系统规划方法及系统
CN116579475A (zh) 一种考虑充电随机性下电动汽车充电调度与充电站配置联合优化方法
CN115133580A (zh) 基于用户负荷准线的考虑电动汽车入网的需求响应方法
Tetova Smart Home Energy Management Algorithm Including Renewable Energy Sources

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant