[go: up one dir, main page]

CN120336011B - 工业大数据的工业算法模型调度方法及系统 - Google Patents

工业大数据的工业算法模型调度方法及系统

Info

Publication number
CN120336011B
CN120336011B CN202510418712.3A CN202510418712A CN120336011B CN 120336011 B CN120336011 B CN 120336011B CN 202510418712 A CN202510418712 A CN 202510418712A CN 120336011 B CN120336011 B CN 120336011B
Authority
CN
China
Prior art keywords
algorithm
data
industrial
execution
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202510418712.3A
Other languages
English (en)
Other versions
CN120336011A (zh
Inventor
洪涌源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Yuzhou Guangdong Technology Service Co ltd
Original Assignee
Zhongke Xiaoding Guangdong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Xiaoding Guangdong Technology Co ltd filed Critical Zhongke Xiaoding Guangdong Technology Co ltd
Priority to CN202510418712.3A priority Critical patent/CN120336011B/zh
Publication of CN120336011A publication Critical patent/CN120336011A/zh
Application granted granted Critical
Publication of CN120336011B publication Critical patent/CN120336011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

本发明涉及工业大数据处理和算法调度技术领域,具体公开了工业大数据的工业算法模型调度方法及系统,其中,工业大数据的工业算法模型调度方法包括:构建多个工业算法组成的执行管道的算法依赖关系图,并通过关键路径分析算法识别影响整体性能的瓶颈节点;对依赖关系紧密的算法对进行操作融合;为不同算法确定最佳数据分区策略,并实现弹性执行管道;为关键路径上的算法操作分配最匹配的异构计算资源,并根据系统负载和运行场景实时调整算法操作的执行优先级;实现细粒度同步系统;本发明提高工业算法执行效率,满足工业大数据处理场景的高性能需求。

Description

工业大数据的工业算法模型调度方法及系统
技术领域
本发明涉及工业大数据处理和算法调度技术领域,更具体地说,涉及工业大数据的工业算法模型调度方法及系统。
背景技术
随着工业的发展和智能制造的普及,工业生产过程产生的数据量呈爆炸式增长,对数据处理和算法调度系统提出了更高要求。工业大数据具有体量大、类型多、时效性强等特点,需要多个专业算法协同处理才能提取有价值的信息,辅助决策和优化生产。
然而,现有的工业算法调度方法主要面临以下问题:工业算法管道中的复杂数据依赖关系导致单一算法优化无法实现端到端性能提升,缺乏全局优化视角;数据传输和格式转换过程中的多次内存拷贝造成系统开销大、延迟高;不同算法对数据访问模式存在差异,统一的分区策略导致并行效率低下;缺乏对异构计算资源的智能匹配和调度能力,资源利用率不高;大数据处理场景下算法管道的并行瓶颈限制了整体吞吐量。
因此,需要一种专门针对工业大数据环境的工业算法模型调度方法,能够从全局视角优化多算法协同执行过程,解决复杂依赖关系、降低数据传输开销、提高并行效率,从而满足工业大数据处理的高性能需求。
发明内容
本发明提供工业大数据的工业算法模型调度方法及系统,解决相关技术中的多算法协同执行过程中存在的复杂数据依赖、多次内存拷贝、缺乏全局优化、数据访问模式差异和并行瓶颈的技术问题。
本发明提供了工业大数据的工业算法模型调度方法,包括:
构建多个工业算法组成的执行管道的算法依赖关系图,其中图节点表示算法操作,边表示数据依赖关系,并通过关键路径分析算法识别影响整体性能的瓶颈节点;
针对识别出的瓶颈节点,基于数据依赖特性分析相邻算法操作间的数据交换模式,对依赖关系紧密的算法对进行操作融合,减少数据传输和拷贝开销;
根据算法的数据访问模式和并行加速比,为不同算法确定最佳数据分区策略,并实现弹性执行管道,在数据流处理过程中动态调整并行度;
基于算法计算特征向量和计算资源特性向量,为关键路径上的算法操作分配最匹配的异构计算资源,并根据系统负载和运行场景实时调整算法操作的执行优先级;
实现细粒度同步系统,将算法间数据依赖分解为更细粒度的部分依赖,使下游算法能够在上游算法产生部分结果时即开始处理,减少等待时间并提高并发度。
在一个优选实施方式中,所述关键路径分析算法包括以下步骤:
为每个算法节点分配执行时间权重,时间权重基于历史执行数据或性能模型估算获得;
计算从起始节点到终止节点的所有可能路径:
Path={Path1,Path2,...,Pathn};
其中,Path表示从起始节点到终止节点的所有可能路径,Path1、Path2、Pathn分别表示第1、2、n条完整执行路径,n表示总路径数量;
对于每条路径Pathi,计算其总执行时间:
T_path(Pathi)=∑v∈Pathiw(v);
其中,T_path(Pathi)表示路径Pathi的总执行时间,v表示路径Pathi上的算法节点,w(v)表示该节点的执行时间权重,∑表示对路径上所有节点的权重求和;
确定关键路径:
CirtPath=argmax(T_path(Pathi));
即具有最长总执行时间的路径,其中,CritPath表示关键路径,T_path(Pathi)表示第i条路径的总执行时间,argmax用于返回使函数取得最大值的变量值;
识别关键路径上的节点,这些节点是影响整体性能的瓶颈点。
在一个优选实施方式中,所述数据依赖特性通过数据依赖强度矩阵DS进行量化,其计算公式为:
其中,DS(i,j)表示算法i和算法j之间的数据依赖强度,Dsize(i,J)为数据交换大小,Faccess(i,j)为访问频率,Tinterval(i,j)为两算法间的执行时间间隔。
在一个优选实施方式中,所述数据分区策略基于算法对不同数据特性的加速比,加速比的计算公式为:
其中,S(v,D,PSi)表示算法v在处理数据集D时采用分区策略PSi的加速比,Tserial(v,D)为算法v处理数据D的串行执行时间,Tparallel(V,D,PSi,n)为采用分区策略PSi并行度为n时的执行时间。
在一个优选实施方式中,所述分配最匹配的异构计算资源通过算法资源匹配度矩阵ARM确定,其计算公式为:
其中,ARM(v,r)表示算法节点v与计算资源r之间的匹配度得分,k表示特征向量的维度数量,wi为第i个特征维度的权重,CFi(v)表示算法节点v的第i个计算特征分量,RFi(r)表示计算资源r的第i个资源特征分量,match(CFi(v),RFi(r))为算法特征向量与资源特征向量的匹配度函数。
在一个优选实施方式中,所述所述减少数据传输和拷贝开销包括以下步骤:
创建共享内存区域池,用于算法间数据交换;
对于每对需要数据交换的算法,分配共享内存区域;
修改算法的输出接口,使其数据直接写入共享内存区域而非本地内存;
修改接收算法的输入接口,使其直接从共享内存区域读取数据,避免数据拷贝。
在一个优选实施方式中,所述实现弹性执行管道,在数据流处理过程中动态调整并行度根据以下公式计算:
nt+1=nt+Δn;
Δn=f(Lsys,Pcur,Ptarget);
其中,nt+1为下一时间点t+1的调整后并行度,Δn为并行度的变化量,nt为当前并行度,f为调整函数,Lsys为系统负载,Pcur为当前性能,Ptarget为目标性能。
在一个优选实施方式中,所述实时调整算法操作的执行优先级通过以下公式计算:
其中,Priority(v,t)表示算法节点v在时间点t的实时优先级值,BP(v)为算法v的基础优先级,k表示影响优先级的调整因子数量,表示从i=1到k的连乘操作,αi为调整因子权重,afi(v,t)为在时间t算法v的第i个调整因子值。
在一个优选实施方式中,所述细粒度同步系统基于数据就绪条件确定算法执行时机,其条件表达式为:
Ready(v)=∧u∈pred(v)Complete(u,output(u,v));
其中,Ready(v)表示算法节点v的就绪状态,∧表示逻辑“与”操作,pred(v)为v的前驱节点集合,output(u,v)为节点u传递给v的输出数据,Complete(u,d)表示节点u已完成数据d的生成。
在一个优选实施方式中,工业大数据的工业算法模型调度系统,用于实现工业大数据的工业算法模型调度方法,包括:
算法依赖关系图构建模块,用于构建算法执行管道的依赖关系图并识别瓶颈节点;
零拷贝数据通道模块,用于实现算法间的高效数据传输;
自适应分区与调度模块,用于根据算法特性确定最佳数据分区策略并动态调整并行度;
异构资源匹配与优先级分配模块,用于为算法分配最匹配的计算资源并调整执行优先级;
细粒度同步模块,用于实现算法间的部分数据依赖和异步执行机制。
本发明的有益效果在于:
性能提升:通过减少算法间数据传输开销、优化执行路径和提高并行效率,使算法间数据传输开销减少65%,端到端处理延迟降低48%,系统整体吞吐量提升52%,处理大规模工业数据的能力显著增强。
资源利用率优化:通过全局性能瓶颈识别和精准资源分配,避免了部分资源过载而其他资源闲置的情况,计算资源利用率提高60%,系统运行更加均衡高效。
适应性增强:采用自适应数据分区策略和动态优先级调整机制,使系统能够根据算法特性和运行时环境变化,自动选择最佳执行策略,适应各类工业大数据处理场景,无需人工干预即可实现最优执行方案。
可扩展性提高:基于模块化设计和标准化接口,系统支持动态添加新的算法操作到已有管道中,且能自动进行全局重优化,使新增算法与现有算法高效协同工作,便于工业算法模型的持续演进和功能扩展。
稳定性保障:通过细粒度同步机制和数据一致性管理,即使在高并发执行条件下,也能确保计算结果的准确性和可靠性,满足工业控制和决策系统的严格要求。
附图说明
图1是本发明的工业大数据的工业算法模型调度方法的流程图;
图2是本发明的构建多个工业算法组成的执行管道的算法依赖关系图的详细流程图;
图3是本发明的对依赖关系紧密的算法对进行操作融合的详细流程图;
图4是本发明的为不同算法确定最佳数据分区策略的详细流程图;
图5是本发明的为关键路径上的算法操作分配最匹配的异构计算资源的详细流程图;
图6是本发明的算法间数据依赖分解为更细粒度的部分依赖的详细流程图。
具体实施方式
现在将参考示例实施方式讨论本文描述的工业大数据的工业算法模型调度方法。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。另外,一些示例所描述的特征在其他例子中也可以进行组合。
本发明的至少一个实施例中公开了工业大数据的工业算法模型调度方法,如图1至图6所示,具体包括以下步骤:
步骤1,构建多个工业算法组成的执行管道的算法依赖关系图,其中图节点表示算法操作,边表示数据依赖关系,并通过关键路径分析算法识别影响整体性能的瓶颈节点;
具体包括以下子步骤:
子步骤1.1,构建算法操作依赖关系图;
利用有向无环图表示多个工业算法组成的执行管道,其中图节点表示算法操作,边表示数据依赖关系。具体实现过程为:
收集工业环境中所有算法操作节点信息,包括算法标识符、算法类型、输入数据要求、输出数据类型等;
分析算法间的数据流转关系,确定哪些算法输出作为其他算法的输入;
创建有向边连接相关算法节点,形成完整的算法依赖关系图G(V,E),其中V为算法节点集合,E为数据依赖关系边集合。
子步骤1.2,执行关键路径分析;
应用关键路径分析算法对构建的依赖关系图进行处理,识别影响整体性能的瓶颈节点,计算过程如下:
为每个算法节点分配执行时间权重w(v),时间权重基于历史执行数据或性能模型估算获得;
计算从起始节点到终止节点的所有可能路径:
Path={Path1,Path2,...,Pathn};
其中,Path表示从起始节点到终止节点的所有可能路径,Path1、Path2、Pathn分别表示第1、2、n条完整执行路径,n表示总路径数量;
对于每条路径Pathi,计算其总执行时间:
T_path(Pathi)=∑v∈Pathiw(v);
其中,T_path(Pathi)表示路径Pathi的总执行时间,v表示路径Pathi上的算法节点,w(v)表示该节点的执行时间权重,∑表示对路径上所有节点的权重求和;
确定关键路径:
CritPath=argmax(T_path(Pathi)));
即具有最长总执行时间的路径,其中,CritPath表示关键路径,T_path(Pathi)表示第i条路径的总执行时间,argmax用于返回使函数取得最大值的变量值;
识别关键路径上的节点,这些节点是影响整体性能的瓶颈点。
关键路径分析算法的具体实现采用改进的深度优先搜索方法,具体如下:
算法:改进的关键路径分析;
输入:算法依赖关系图G(V,E),节点执行时间权重w(v);
输出:关键路径CritPath,关键节点集合CriticalNodes;
将图中所有节点的最早开始时间ES(v)初始化为0;
按拓扑排序遍历图中所有节点:
对于每个节点v:
ES(v)=max{ES(u)+w(u)|u∈前驱节点(v)};
其中,ES(v)表示节点v的最早开始时间,ES(u)表示前驱节点u的最早开始时间,w(u)表示前驱节点u的执行时间,max表示最大值;
将图中所有节点的最晚开始时间LS(v)初始化为ES(终止节点);
按逆拓扑排序遍历图中所有节点:
对于每个节点v:
LS(v)=max{LS(u)-w(v)|u∈后继节点(v)};
其中,LS(v)表示节点v的最晚开始时间,LS(u)表示后继节点u的最晚开始时间,w(v)表示节点v自身的执行时间,max表示最大值;
计算每个节点的时间松弛度:
Slack(v)=LS(v)-ES(v);
其中,Slack(v)表示节点v的时间松弛度,LS(v)表示节点v的最晚开始时间,ES(v)表示节点v的最早开始时间;
关键节点集合:
CriticalNodes={v|Slack(v)=0};
其中,CriticalNodes表示关键节点集合,v表示节点,Slack(v)表示节点v的时间松弛度;
关键路径CritPath为关键节点集合按依赖关系连接形成的路径。
在炼钢工艺算法管道中的应用示例:某钢铁厂生产控制系统使用多个算法协同工作,包括原料配比优化算法、温度控制算法、成分分析算法、质量预测算法和能耗优化算法。通过关键路径分析发现,成分分析算法是关键路径上的瓶颈节点,其执行时间占总执行时间的42%。针对性优化该算法后,整个管道的端到端处理延迟降低了31%,显著提高了生产效率。
子步骤1.3,计算节点资源消耗指标;
对每个算法节点进行资源消耗分析,确定其对系统资源的影响程度:
收集每个算法节点v的CPU使用率CPU(v)、内存占用MEM(v)、I/O操作量IO(v)等资源指标;
计算综合资源消耗指标:
R(v)=α·CPU(v)+β·MEM(v)+γ·IO(v);
其中,R(v)表示算法节点v的综合资源消耗指标,α表示CPU资源的权重系数、β表示内存MEM资源的权重系数,γ表示IO资源的权重系数;
将资源消耗指标与节点在关键路径上的位置结合,计算节点的性能影响因子:
PIF(v)=R(v)·IsCP(v);
其中,PIF(v)表示算法节点v的性能影响因子,R(v)表示算法节点v的综合资源消耗指标,IsCP(v)表示节点v是否在关键路径上。
通过以上分析,得到算法管道中各节点的性能瓶颈程度排序,为后续优化提供精确目标。
步骤2,针对识别出的瓶颈节点,基于数据依赖特性分析相邻算法操作间的数据交换模式,对依赖关系紧密的算法对进行操作融合,减少数据传输和拷贝开销;
包括以下子步骤:
子步骤2.1,分析算法操作间的数据依赖特性;
对算法操作间的数据依赖关系进行细粒度分析,识别可优化的数据传输模式:
分析每对相邻算法节点(v1,v2)之间的数据交换特性,包括数据量大小、数据结构类型、访问频率等;
构建数据依赖强度矩阵DS,其中元素DS(i,j)表示算法i与算法j之间的数据依赖强度,计算公式为:
其中,DS(i,j)表示算法i与算法j之间的数据依赖强度,Dsize(i,j)为数据交换大小,Faccess(i,j)为访问频率,Tinterval(i,j)为两算法间的执行时间间隔;
设定依赖强度阈值θ,当DS(i,j)>θ时,将相应的算法对标记为“强依赖对”,作为操作融合的候选。
子步骤2.2,执行算法操作融合;
针对识别出的强依赖算法对,执行算法操作融合,减少数据传输开销:
对每个强依赖算法对(v1,v2),分析其操作特性和资源需求的兼容性;
评估融合后的性能提升指标FP(v1,v2),计算公式为:
FP(v1,v2)=Texec(v1)+Texec(v2)+Tcomm(v1,v2)-Tfusion(v1,v2);
其中,PF(v1,v2)表示将算法v1和v2融合后的性能提升量,Texec(v1)、Texec(v2)分别表示单独执行算法v1、v2的时间开销,Tcomm(v1,v2)为数据传输时间,Tfusion(v1,v2)为融合后的执行时间;
当FP(v1,v2)>0时,创建融合操作单元F(v1,v2),合并两个算法的执行逻辑,消除中间数据传输步骤。
子步骤2.3,数据传输路径优化;
为支持更高效的工业算法间数据传输,对传输路径进行优化:
构建通信延迟矩阵L=[Tcomm(i,j)],其中Tcomm(i,j)表示从计算节点i到节点j的数据传输时间;
对于数据量超过阈值θ的传输任务,应用以下优化措施:
当Tcomm(i,j)>Tthreshold时,在节点i和j之间创建专用零拷贝数据通道DCij;
当Tcomm(i,j)≤Tthreshold时,使用标准数据传输机制;
对于频繁交互的节点对,建立持久化通信连接,减少连接建立开销。
在工业图像处理算法管道中的应用示例:某工厂的产品质检系统包含图像采集、预处理、特征提取、缺陷识别和结果分析等多个算法。其中图像预处理和特征提取算法间需传递大量图像数据(每秒约500MB)。实施零拷贝数据通道后,两算法间的数据传输时间从原来的75ms降低到8ms,CPU使用率降低28%,整体处理延迟减少36%,系统能够处理更高分辨率的图像而不增加硬件成本。
步骤3,根据算法的数据访问模式和并行加速比,为不同算法确定最佳数据分区策略,并实现弹性执行管道,在数据流处理过程中动态调整并行度;
包括以下子步骤:
子步骤3.1,分析算法数据访问模式;
对各算法的数据访问模式进行分析,识别其数据并行特性:
收集每个算法操作v对数据D的访问模式信息,包括顺序访问、随机访问、块访问等模式;
分析算法的数据依赖类型,包括元素级依赖、块级依赖、全局依赖等;
根据访问模式和依赖类型,评估算法的数据并行潜力DP(v,D),数值越高表示并行潜力越大。
子步骤3.2,计算并行加速比并确定最佳分区策略;
基于算法特性和数据特性,计算不同分区策略下的并行加速比:
对算法v和数据D,考虑n种可能的分区策略{PS1,PS2,...,PSn},其中,PS1、PS2、PSn分别表示第1、2、n种分区策略,n表示分区策略总数量;
对每种分区策略PSi,估算其并行执行时间Tparallel(V,D,PSi,n),其中Tparallel(V,D,PSi,n)表示在并行度为n的情况下,使用分区策略PSi并行执行算法v处理数据D的估计时间;
计算加速比:
其中,S(v,D,PSi)表示算法v在处理数据集D时采用分区策略PSi的加速比,Tserial(v,D)为算法v处理数据D的串行执行时间,Tparallel(V,D,PSi,n)为采用分区策略PSi并行度为n时的执行时间。
选择加速比最高的分区策略:
其中,PSopt表示在所有备选分区策略中,能够达到最大加速比的最优分区策略,表示取最大值时的自变量,表示在所有备选分区策略PSi中,选择能够使加速比S(v,D,PSi)达到最大值的分区策略作为最优策略PSopt
子步骤3.3,构建弹性执行管道;
实现能够动态调整并行度的弹性执行管道:
创建管道执行引擎PE,支持动态并行度配置;
实现分区数据管理器PDM,负责根据选定的分区策略PSopt对输入数据D进行分区;
建立并行任务调度器PTS,负责将分区后的数据分配给计算资源;
实现运行时监控模块RTM,收集执行性能指标和系统负载信息;
根据RTM收集的数据,动态调整并行度n和分区策略PSopt,公式为:
nt+1=nt+Δn;
Δn=f(Lsys,Pcur,Ptarget);
其中,nt+1为下一时间点t+1的调整后并行度,Δn为并行度的变化量,nt为当前并行度,f为调整函数,Lsys为系统负载,Pcur为当前性能,Ptarget为目标性能。
弹性执行管道系统的具体组成和工作流程如下:
系统组成:
管道执行引擎(PE):核心执行单元,包含任务队列和工作线程池;
分区数据管理器(PDM):实现多种数据分区策略,如哈希分区、范围分区、块分区等;
并行任务调度器(PTS):基于工作窃取算法的任务分配系统;
运行时监控模块(RTM):收集CPU使用率、内存使用、I/O吞吐量等指标;
负载均衡器(LB):根据监控数据调整并行度和分区策略;
工作流程:
初始化阶段:根据算法特性和数据规模设置初始并行度n0和分区策略PS0
执行阶段:
PDM按当前分区策略PS_t对输入数据进行分区;
PTS将分区任务分配给PE中的工作线程;
RTM实时监控执行性能和系统负载;
调整阶段:
每隔固定间隔T,触发一次调整评估;
计算性能偏差:δ=(P_target_P_cur)/P_target;其中,δ表示当前性能与目标性能的偏差程度,P_target表示期望达到的目标性能水平,P_cur表示当前系统的实际性能表现;
如果|δ|>阈值ε,则调整并行度和分区策略;
如果δ>0(性能不足):增加并行度或选择更高效的分区策略;
如果δ<0(资源浪费):减少并行度或调整分区粒度。
在工业物联网数据处理中的应用示例:某大型化工企业的设备监控系统每分钟需处理来自上万个传感器的数据,用于故障预测和效率优化。原有固定并行度的系统在负载高峰期响应延迟增加,低谷期资源浪费严重。应用弹性执行管道后,系统能根据数据流量自动调整并行处理能力,峰值期处理延迟减少52%,非高峰期资源占用降低41%,同时能够应对突发数据流量变化,峰谷比为8:1的情况下仍保持稳定的处理延迟。
步骤4,基于算法计算特征向量和计算资源特性向量,为关键路径上的算法操作分配最匹配的异构计算资源,并根据系统负载和运行场景实时调整算法操作的执行优先级;
包括以下子步骤:
子步骤4.1,分析算法计算特性与资源适配性;
对工业算法的计算特性进行分析,评估其在不同计算资源上的执行效率:
提取每个算法v的计算特征向量CF(v),包括计算密度、内存访问模式、分支预测难度、并行度等维度;
收集可用异构计算资源集合R={R1,R2,...,Rm}的特性向量RF(r),包括处理器类型、核心数量、内存带宽、缓存大小等,其中,R表示可用异构计算资源集合,R1、R2、Rm分别表示第1、2、m种可用异构计算资源,m表示资源总数量;
构建算法资源匹配度矩阵ARM,其中元素ARM(v,r)表示算法v在资源r上的执行效率,计算公式为:
其中,ARM(v,r)表示算法节点v与计算资源r之间的匹配度得分,k表示特征向量的维度数量,wi为第i个特征维度的权重,CFi(v)表示算法节点v的第i个计算特征分量,RFi(r)表示计算资源r的第i个资源特征分量,match(CFi(v),RFi(r))为算法特征向量与资源特征向量的匹配度函数。
子步骤4.2,计算关键路径操作的资源分配得分;
为关键路径上的操作分配最合适的计算资源:
对于关键路径上的每个操作节点v,计算其在每种资源r上的执行性能提升指标:
其中,S(v,r)表示将操作v分配到计算资源r上的性能提升得分,Tserial(v)为操作v的串行执行时间,Tparallel(v,r)为在资源r上的并行执行时间,Priority(v)为操作v的优先级权重;
选择得分最高的资源操作配对:(v*,r*)=argmaxv,rS(v,r),并将资源r分配给操作v,其中,(v*,r*)表示所有可能的资源操作配对(v,r)中,S(v,r)得分最高的那一对,argmaxv,r表示在所有可能的算法操作v和计算资源r的组合(v,r)中,找出能使目标函数S(v,r)达到最大值的那一对组合;
更新剩余资源集合和未分配操作集合,重复步骤2直至所有关键路径操作都获得资源分配。
子步骤4.3,实现动态优先级调整机制;
建立动态优先级调整系统,根据系统负载和执行情况实时调整算法优先级:
定义优先级调整因子集合AF={af1,af2,...,afk},包括等待时间、紧急程度、资源利用率等,其中,AF表示优先级调整因子集合,af1、af2、afk分别表示第1、2、k个优先级调整因子,k表示优先级调整因子总个数;
对于每个算法操作v,初始化其基础优先级BP(v);
实现优先级动态计算函数:
其中,Priority(v,t)表示在时间点t,算法操作v的动态优先级,BP(v)表示操作v的基础优先级,表示从i=1到k的连乘操作,αi为调整因子权重,afi(v,t)为在时间t算法v的第i个调整因子值;
在资源调度周期内,根据动态优先级排序执行算法操作。
通过异构资源匹配和动态优先级分配,系统能够充分利用多样化的计算资源,并针对工作负载变化做出响应,提高整体执行效率。
步骤5,实现细粒度同步系统,将算法间数据依赖分解为更细粒度的部分依赖,使下游算法能够在上游算法产生部分结果时即开始处理,减少等待时间并提高并发度;
包括以下子步骤:
子步骤5.1,构建异步数据预处理管道;
在上游算法执行过程中,异步预处理下游算法所需数据:
分析算法执行管道中的数据依赖关系图G(V,E),识别数据预处理机会;
对于每对数据相关的算法(v1,v2),在v1执行过程中,创建异步预处理任务P(v1,v2);
实现预处理任务管理器PTM,负责调度和执行预处理任务;
设计预处理策略,包括数据格式转换、维度重排、缓存预热等,为下游算法v2准备最优输入格式。
子步骤5.2,实现细粒度同步系统;
构建细粒度同步系统,最小化并行执行中的等待时间:
将数据依赖分解为更细粒度的部分依赖关系;
实现数据就绪通知系统,当上游算法v1产生部分结果时,立即通知下游算法v2
构建数据版本管理系统DVM,维护数据D的多个版本状态{D1,D2,...,Dn},支持并发读写其中,其中,D1、D2、Dn分别表示数据对象D的第1、2、n个历史版本,n表示历史版本总数量;
实现基于数据依赖的条件执行模型:
Ready(v)=∧u∈pred(v)Complete(u,output(u,v));
其中,Ready(v)表示算法节点v的就绪条件,pred(v)为v的前驱节点集合,output(u,v)为节点u传递给v的输出数据,Complete(u,d)表示节点u已完成数据v的生成,∧表示逻辑与运算。
细粒度同步系统的详细架构和实现如下:
系统组成:
依赖分解单元(DDU):负责将粗粒度数据依赖拆分为细粒度部分依赖;
数据就绪通知器(DRN):基于发布订阅模型的数据就绪事件通知系统;
版本管理器(VM):维护各数据对象的版本历史和状态;
条件执行控制器(CEC):管理算法的执行条件和触发逻辑;
主要数据结构:
数据块描述符(DBD):
{block_id:数据块唯一标识符,
data_ptr:数据块内存指针,
size:数据块大小,
version:版本号,
status:就绪状态,
producer:生产者算法标识,
consumers:消费者算法列表
}
依赖关系表(DRT):使用邻接表存储的依赖关系图
关键算法:
部分依赖识别算法:基于数据访问模式分析,识别可并行处理的数据块;
增量通知算法:仅在数据状态变化时触发通知,减少通信开销;
版本冲突解决算法:基于时间戳的多版本并发控制;
在智能制造生产线调度中的应用示例:某汽车零部件生产线使用多个优化算法协同进行生产计划排程。传统方法要求前序算法(如订单分类、物料需求计算)完全执行完毕后,才能启动后续算法(如资源分配、工序排程)。应用细粒度同步系统后,订单分类算法处理完前20%的订单数据后,资源分配算法即可开始处理这部分数据,无需等待全部订单处理完成。实际应用中,计划生成时间从原来的15分钟缩短至4分钟,系统响应性显著提升,能够更快地适应生产计划变更,减少生产线的等待时间。
子步骤5.3,确保数据一致性与并发控制;
实现数据一致性保障系统,确保高并发执行的正确性:
定义数据访问模式类型DAT={读共享、写独占、读写混合};
对每个算法操作v和数据对象d,标记其访问模式DAT(v,d);
实现基于访问模式的锁分配算法:
对于读共享模式,分配共享锁;
对于写独占模式,分配排他锁;
对于读写混合模式,实现多版本并发控制;
构建冲突检测与解决系统,当检测到数据访问冲突时,采用优先级或时间戳策略解决冲突。
通过异步数据预处理和细粒度同步机制,系统在保证数据一致性的同时,最大化并行执行机会,减少算法间的等待时间。
本实施方式的技术效果
性能提升:通过减少算法间数据传输开销、优化执行路径和提高并行效率,使算法间数据传输开销减少65%,端到端处理延迟降低48%,系统整体吞吐量提升52%,处理大规模工业数据的能力显著增强。
资源利用率优化:通过全局性能瓶颈识别和精准资源分配,避免了部分资源过载而其他资源闲置的情况,计算资源利用率提高60%,系统运行更加均衡高效。
适应性增强:采用自适应数据分区策略和动态优先级调整机制,使系统能够根据算法特性和运行时环境变化,自动选择最佳执行策略,适应各类工业大数据处理场景,无需人工干预即可实现最优执行方案。
可扩展性提高:基于模块化设计和标准化接口,系统支持动态添加新的算法操作到已有管道中,且能自动进行全局重优化,使新增算法与现有算法高效协同工作,便于工业算法模型的持续演进和功能扩展。
稳定性保障:通过细粒度同步机制和数据一致性管理,即使在高并发执行条件下,也能确保计算结果的准确性和可靠性,满足工业控制和决策系统的严格要求。
本实施方式的真实应用示例
本实施方式已在某大型钢铁企业的智能制造平台中得到应用,解决了钢铁生产过程中多算法协同运行的性能瓶颈问题。该平台需要实时运行多种工业算法,包括原料配比优化、炉温控制、质量预测、能耗优化和缺陷检测等核心算法,这些算法间存在复杂的数据依赖关系,且各自对计算资源的需求差异显著。
项目背景:该钢铁企业的生产智能化升级项目中,需要通过各类工业算法提升生产效率和产品质量。特别是在高端钢材生产线上,对算法的实时性、精度和可靠性要求极高。在升级前,各算法模型相互独立运行,数据通过中间文件或数据库交换,造成了明显的性能瓶颈:
算法之间的数据传输延迟高,影响整体响应时间;
缺乏全局资源调度,导致部分硬件资源过载而其他资源闲置;
无法针对不同工作负载动态调整执行策略,峰值处理能力受限;
复杂算法管道中的性能瓶颈难以识别和优化;
高并发场景下的数据一致性难以保证;
系统规模:该平台每天需处理约20TB的工业数据,支持30多个不同类型的工业算法模型协同运行,服务全厂5条生产线的实时控制和决策支持。系统硬件环境包括32台服务器,配置有CPU、GPU和FPGA等异构计算资源。
实现过程实例:
该项目实施了本发明的工业算法模型调度方法,主要实施过程如下:
算法依赖关系图构建与瓶颈识别:
首先,我们针对钢铁企业的核心生产线,构建了完整的算法依赖关系图。表1展示了部分关键算法节点信息:
表1:核心算法节点特性与瓶颈分析;
通过关键路径分析,识别出A3(成分分析)、A5(缺陷检测)和A4(质量预测)为主要性能瓶颈,优先进行优化。
零拷贝数据通道实施:
针对瓶颈分析结果,我们优先为关键路径上的算法对实施了零拷贝数据通道。表2展示了部分算法对之间的数据依赖强度及零拷贝通道实施情况:
表2:数据依赖强度与零拷贝通道实施;
实施结果表明,零拷贝数据通道平均减少了97.1%的数据传输时间,显著提升了算法间的数据流转效率。
自适应数据分区与并行调度实施:
对关键算法实施了自适应数据分区策略和弹性执行管道,表3展示了具体配置和效果:
表3:自适应数据分区与并行调度配置;
弹性执行管道能够根据系统负载自动调整并行度,在保持高性能的同时避免资源浪费。
异构资源匹配与优先级分配实施:
工业智能制造平台拥有多种异构计算资源,基于算法特性进行了针对性的资源匹配和动态优先级调整:
表4:异构资源匹配与优先级配置;
通过异构资源匹配和动态优先级调整,系统能够根据不同生产场景的需求,自动调整算法的执行优先级和资源分配策略。
细粒度同步系统实施:
针对关键算法间的数据依赖,实施了细粒度同步系统,减少了算法间的等待时间:
表5:细粒度同步配置与效果;
实施细粒度同步系统后,关键算法间的等待时间平均减少了69.1%,显著提高了系统的并行处理能力。
技术效果验证:
本发明的工业算法模型调度方法在钢铁企业智能制造平台的应用中,取得了显著的技术效果,主要体现在以下两个方面:
系统性能提升效果:
通过实施本发明的调度方法,系统整体性能得到大幅提升,如表6所示:
表6:系统性能改进效果对比;
实际生产效益:
本发明的实施为钢铁企业带来了显著的生产效益,表7展示了主要生产指标的改进效果:
表7:生产效益改进效果;
实施效果表明,本发明不仅提高了系统的技术性能,更带来了实实在在的经济效益,充分验证了本发明在工业大数据环境下的实用价值和创新性。
上面对本发明的实施例进行了描述,但是本实施例并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本实施例的启示下,还可做出更多形式的等同的实施例,均属于本实施例的保护之内。

Claims (10)

1.工业大数据的工业算法模型调度方法,其特征在于,包括以下步骤:
构建多个工业算法组成的执行管道的算法依赖关系图,其中图节点表示算法操作,边表示数据依赖关系,并通过关键路径分析算法识别影响整体性能的瓶颈节点;
针对识别出的瓶颈节点,基于数据依赖特性分析相邻算法操作间的数据交换模式,对依赖关系紧密的算法对进行操作融合,减少数据传输和拷贝开销;
根据算法的数据访问模式和并行加速比,为不同算法确定最佳数据分区策略,并实现弹性执行管道,在数据流处理过程中动态调整并行度;
基于算法计算特征向量和计算资源特征向量,为关键路径上的算法操作分配最匹配的异构计算资源,并根据系统负载和运行场景实时调整算法操作的执行优先级;
实现细粒度同步系统,将算法间数据依赖分解为更细粒度的部分依赖,使下游算法能够在上游算法产生部分结果时即开始处理,减少等待时间并提高并发度。
2.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述关键路径分析算法包括以下步骤:
为每个算法节点分配执行时间权重,时间权重基于历史执行数据或性能模型估算获得;
计算从起始节点到终止节点的所有可能路径:
其中,表示从起始节点到终止节点的所有可能路径,分别表示第条完整执行路径,表示总路径数量;
对于每条路径,计算其总执行时间:
其中,表示路径的总执行时间,表示路径上的算法节点,表示该节点的执行时间权重,表示对路径上所有节点的权重求和;
确定关键路径:
));
即具有最长总执行时间的路径,其中,表示关键路径,表示第条路径的总执行时间,用于返回使函数取得最大值的变量值;
识别关键路径上的节点,这些节点是影响整体性能的瓶颈点。
3.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述数据依赖特性通过数据依赖强度矩阵进行量化,其计算公式为:
其中,表示算法和算法之间的数据依赖强度,为数据交换大小,为访问频率,为两算法间的执行时间间隔。
4.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述数据分区策略基于算法计算不同数据特性的并行加速比,并行加速比的计算公式为:
其中,表示算法在处理数据集时采用分区策略的并行加速比,为算法处理数据的串行执行时间,为采用分区策略并行度为时的执行时间。
5.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述分配最匹配的异构计算资源通过算法资源匹配度矩阵确定,其计算公式为:
其中,表示算法节点与计算资源之间的匹配度得分,表示特征向量的维度数量,为第个特征维度的权重,表示算法节点的第个计算特征分量,表示计算资源的第个资源特征分量,为计算特征分量与资源特征分量的匹配度函数。
6.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述减少数据传输和拷贝开销包括以下步骤:
创建共享内存区域池,用于算法间数据交换;
对于每对需要数据交换的算法,分配共享内存区域;
修改算法的输出接口,使其数据直接写入共享内存区域而非本地内存;
修改接收算法的输入接口,使其直接从共享内存区域读取数据,避免数据拷贝。
7.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述实现弹性执行管道,在数据流处理过程中动态调整并行度根据以下公式计算:
其中,为下一时间点的调整后并行度,为并行度的变化量,为当前并行度,为调整函数,为系统负载,为当前性能,为目标性能。
8.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述实时调整算法操作的执行优先级通过以下公式计算:
其中,表示算法节点在时间点的实时优先级值,为算法的基础优先级,表示影响优先级的调整因子数量,表示从的连乘操作,为调整因子权重,为在时间算法的第个调整因子值。
9.根据权利要求1所述的工业大数据的工业算法模型调度方法,其特征在于,所述细粒度同步系统基于数据就绪条件确定算法执行时机,其条件表达式为:
其中,表示算法节点的就绪状态,表示逻辑“与”操作,的前驱节点集合,为节点传递给的输出数据,表示节点已完成数据的生成。
10.工业大数据的工业算法模型调度系统,用于实现权利要求1至9中任一项所述的工业大数据的工业算法模型调度方法,包括:
算法依赖关系图构建模块,用于构建算法执行管道的依赖关系图并识别瓶颈节点;
零拷贝数据通道模块,用于实现算法间的高效数据传输;
自适应分区与调度模块,用于根据算法特性确定最佳数据分区策略并动态调整并行度;
异构资源匹配与优先级分配模块,用于为算法分配最匹配的计算资源并调整执行优先级;
细粒度同步模块,用于实现算法间的部分数据依赖和异步执行机制。
CN202510418712.3A 2025-04-03 2025-04-03 工业大数据的工业算法模型调度方法及系统 Active CN120336011B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202510418712.3A CN120336011B (zh) 2025-04-03 2025-04-03 工业大数据的工业算法模型调度方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202510418712.3A CN120336011B (zh) 2025-04-03 2025-04-03 工业大数据的工业算法模型调度方法及系统

Publications (2)

Publication Number Publication Date
CN120336011A CN120336011A (zh) 2025-07-18
CN120336011B true CN120336011B (zh) 2025-10-17

Family

ID=96365101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202510418712.3A Active CN120336011B (zh) 2025-04-03 2025-04-03 工业大数据的工业算法模型调度方法及系统

Country Status (1)

Country Link
CN (1) CN120336011B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119292082A (zh) * 2024-12-13 2025-01-10 天津赛威工业技术有限公司 工业机器人分布式协同调试方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095588B (zh) * 2016-06-28 2019-03-15 北京大学深圳研究生院 基于gpgpu平台的cdvs提取过程加速方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119292082A (zh) * 2024-12-13 2025-01-10 天津赛威工业技术有限公司 工业机器人分布式协同调试方法及系统

Also Published As

Publication number Publication date
CN120336011A (zh) 2025-07-18

Similar Documents

Publication Publication Date Title
Deshmukh et al. Collaborative learning based straggler prevention in large‐scale distributed computing framework
CN105117286B (zh) MapReduce中任务的调度方法和流水化执行方法
CN118672790B (zh) 一种基于任务链和分治法的海量数据汇总方法及系统
CN119402440B (zh) 一种基于分布式通信的数据分析方法、系统、设备及介质
CN107193652A (zh) 容器云环境中流数据处理系统的弹性资源调度方法及系统
CN118034892B (zh) 一种集群文件系统客户端多核并发负载实现方法
CN108270805A (zh) 用于数据处理的资源分配方法及装置
Al Qassem et al. Containerized microservices: A survey of resource management frameworks
CN111026519A (zh) 基于分布式的任务优先级调度方法和系统及存储介质
CN118939391A (zh) 基于异构算力的自动模型并行调度策略生成方法及装置
CN119271369A (zh) 一种高效多核处理器任务分配方法
CN117194025A (zh) 针对深度学习服务的gpu时空共享方法
Perwej The ambient scrutinize of scheduling algorithms in big data territory
CN120336011B (zh) 工业大数据的工业算法模型调度方法及系统
CN114860417B (zh) 多核神经网络处理器及用于该处理器多任务分配调度方法
CN105740249B (zh) 一种大数据作业并行调度过程中的处理方法及其系统
CN119937436B (zh) 面向工业物联网的AloT云边端智能控制方法及系统
CN116166396A (zh) 调度模型的训练方法、装置、电子设备及可读存储介质
CN119396559B (zh) 一种异构设备的资源分配方法、系统、设备及存储介质
Han et al. An adaptive scheduling algorithm for heterogeneous Hadoop systems
CN120256083A (zh) 工作流并行计算执行方法、系统、终端设备与存储介质
Cheng et al. Research on Kubernetes Scheduler Optimization Based on Real Load
Zhang et al. Two-level task scheduling with multi-objectives in geo-distributed and large-scale SaaS cloud
Jin et al. AARC: Automated Affinity-aware Resource Configuration for Serverless Workflows
CN108052378A (zh) 面向复杂仿真工作流应用的利润敏感的任务调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20251209

Address after: 523000 Guangdong Province Dongguan City Songshan Lake Industrial Park No. 4, Second Road Building 1 Room 1503

Patentee after: Zhongke Yuzhou (Guangdong) Technology Service Co.,Ltd.

Country or region after: China

Address before: Room 1501, Building 1, No. 4, Headquarters Second Road, Songshan Lake Park, Dongguan City, Guangdong Province, 523000

Patentee before: Zhongke Xiaoding (Guangdong) Technology Co.,Ltd.

Country or region before: China