CN109635422A - 联合建模方法、装置、设备以及计算机可读存储介质 - Google Patents
联合建模方法、装置、设备以及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109635422A CN109635422A CN201811501956.4A CN201811501956A CN109635422A CN 109635422 A CN109635422 A CN 109635422A CN 201811501956 A CN201811501956 A CN 201811501956A CN 109635422 A CN109635422 A CN 109635422A
- Authority
- CN
- China
- Prior art keywords
- gradient value
- model
- loss gradient
- back end
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Geometry (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种联合建模方法、装置、设备和存储介质,包括:初始化模型参数,并将初始化的模型参数传递给各数据节点;获取中立协调方中的随机损失梯度值,将随机损失梯度值划分为与数据节点的总数量相等的各第一损失梯度值,并将各第一损失梯度值分配至各数据节点;基于模型参数和第一损失梯度值获取各数据节点的第二损失梯度值;将各第二损失梯度值传递到中立协调方,并根据各第二损失梯度值和随机损失梯度值确定数据节点的真实损失梯度值;基于真实损失梯度值更新模型参数以构建模型,并判断模型是否收敛;若模型收敛,则模型已构建完成。本发明达到了在多家公司进行信息共享且隐私数据不泄露的同时,也能进行不同类型数据答案预测的效果。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种联合建模方法、装置、设备以及计算机可读存储介质。
背景技术
互联网金融进几年得到了飞速发展,各类金融科技公司呈现百家争鸣、百花齐放的局面,伴随着产业的欣荣发展,公司需要了解的数据资源也越来越多,又由于目前没有哪家公司能够掌握风控所需的全部数据,所以信息共享问题随之而来,但是由于多家公司在进行信息共享时很容易导致自身的某些隐私信息泄露,所以虽然会有多家公司具有联合建立模型的需求,往往还是单独建立模型,并未与其它公司进行联合建立模型。并且联合建立模型技术虽然在现实中有提及,但还只是存在于理论中,未应用到实际生产中,且常常只是为解决某一单一问题的目的而进行联合建立模型。因此,如何解决在多家公司进行信息共享,且能保证各个公司隐私数据不泄露的同时,也能进行不同类型数据答案的预测,成为了目前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种联合建模方法、装置、设备和计算机存储介质,旨在解决在多家公司进行信息共享,且能保证各个公司隐私数据不泄露的同时,也能进行不同类型数据答案的预测。
为实现上述目的,本发明提供一种联合建模方法、装置、设备以及计算机可读存储介质,所述联合建模方法包括:
获取模型的模型参数和数据节点的总数量,并基于所述数据节点初始化模型参数,以确定初级模型参数;
获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;
基于各所述数据节点的第一损失梯度值,获取所述数据节点的总损失梯度值;
基于所述总损失梯度值和所述随机损失梯度值更新所述初级模型参数,并判断所述模型是否收敛;
若所述模型收敛,则所述模型已构建完成。
可选地,所述基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值的步骤,包括:
基于所述模型参数计算所述数据节点的迭代损失梯度值;
获取所述迭代损失梯度值和所述第一损失梯度值之间的和值,并将所述和值作为所述数据节点的第二损失梯度值。
可选地,所述根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值的步骤,包括:
获取所述中立协调方中的各所述第二损失梯度值之间的和值,并将所述和值作为总损失梯度值;
基于所述总损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值。
可选地,所述基于所述总损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值的步骤,包括:
获取所述总损失梯度值和所述随机损失梯度值之间的和值,并将所述和值作为所述数据节点的真实损失梯度值。
可选地,所述判断所述模型是否收敛的步骤之后,包括:
若所述模型不收敛,则继续获取所述数据节点新的真实损失梯度值,并更新所述模型的最新模型参数,直至所述模型收敛。
可选地,所述若所述模型不收敛,则继续获取所述数据节点新的真实损失梯度值的步骤,包括:
若所述模型不收敛,则获取模型的最新模型参数,并将所述最新模型参数传递到各数据节点,以获取所述数据节点新的真实损失梯度值。
可选地,所述若所述模型收敛,则所述模型已构建完成的步骤之后,包括:
获取各所述数据节点中的待预测样本特征,并将所述待预测样本特征输入所述已构建完成模型中进行在线预测,从而获取预测结果。
此外,为实现上述目的,本发明还提供一种联合建模装置,所述联合建模装置包括:
传递模块,用于初始化模型参数,并将初始化的模型参数传递给各数据节点;
分配模块,用于获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;
获取模块,用于基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;
确定模块,用于将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;
判断模块,用于基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;
收敛模块,用于若所述模型收敛,则所述模型已构建完成。
此外,为实现上述目的,本发明还提供一种联合建模设备;
所述联合建模设备包括:存储器、检测通道、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如上所述的联合建模方法的步骤。
此外,为实现上述目的,本发明还提供计算机存储介质;
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的联合建模方法的步骤。
本发明实施例提出的一种联合建模方法、装置、设备及可读存储介质,通过初始化模型参数,并将初始化的模型参数传递给各数据节点;获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;若所述模型收敛,则所述模型已构建完成。在本方案中通过获取各个数据节点中的损失梯度值来保证各个数据节点已参与联合建模,并在获取各个数据节点中的损失梯度值之前,会向各数据节点传输各第一损失梯度值,然后再获取各数据节点中的所有损失梯度值,并在第三方,即中立协调方中进行计算,以获取各个数据节点真正的损失梯度值,从而保证了各个数据节点数据的隐私性,并且由于是通过获取各个数据节点的损失梯度值来建立模型的,所以也能保证此模型能解决各数据节点的不同问题预测。从而解决各数据节点对应的公司在进行信息共享,且能保证各个公司隐私数据不泄露的同时,也能进行不同类型数据答案的预测。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端\装置结构示意图;
图2为本发明联合建模方法第一实施例的流程示意图;
图3为本发明联合建模方法第二实施例的流程示意图;
图4为本发明联合建模设备一实施例的系统结构示意图;
图5为本发明联合建模方法中各个远程工作节点向本地工作节点传递数据的场景示意图。
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端为联合建模设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在终端设备移动到耳边时,关闭显示屏和/或背光。当然,终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及联合建模程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的联合建模程序,并执行以下操作:
初始化模型参数,并将初始化的模型参数传递给各数据节点;
获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;
基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;
将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;
基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;
若所述模型收敛,则所述模型已构建完成。
本发明提供一种联合建模方法,在联合建模方法第一实施例中,参照图2,联合建模方法包括以下步骤:
步骤S10,初始化模型参数,并将初始化的模型参数传递给各数据节点;
在系统中,先获取多方样本特征X owner,并且对多个样本赋予其对应的类别标签Yowner,以便区分,其中N为owner-o样本数},dim表示样本特征维度大小,各方样本特征维度dim相等,各特征维度含义一致,如[贷款额、贷款时长、负债情况]。由于每个样本特征都有一个对应的数据节点,因此当获取到系统中各个样本特征的数量时,也就可以获取到数据节点的总数量。与此同时,还需要获取一个模型参数并进行初始化,然后再将初始化的模型参数传递到各个数据节点。
步骤S20,获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;
随机损失梯度值可以为在系统中随机获取到的损失函数值和梯度值。在系统中采用一个中立协调方,中立协调方生成随机数组loss_init(随机函数)和grad_init(梯度函数),即获取到中立协调方中的随机损失梯度值。并根据原先获取到的系统中数据节点的总数量时,需要将此随机损失梯度值划分为与数据节点的总数量相同的各个第一损失梯度值,即每个数据节点均有一个对应的第一损失梯度值,再将各个第一损失梯度值依次分配至各个数据节点中,以保证每个数据节点均能接收到中立协调方传递过来的第一损失梯度值。例如,当中立协调方生成随机数组loss_init和grad_init时,再将loss_init和grad_init分成n份,其中n为数据被切分后总共的节点数量,又由于每个数据拥有方的每份数据均对应于一个工作节点,所以,中立协调方将<loss_init>i与<grad_init>i传给第i个节点,即保证每个工作节点均有对应的loss_init和grad_init。
步骤S30,基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;
第二损失梯度值可以包括第二损失函数值和第二梯度值,第二损失函数值为在某一数据节点的数据样本中,计算本次迭代的迭代损失函数值,并将此迭代损失函数值和此数据节点接收到的第一损失函数值相加以获取第二损失函数值,同理,第二梯度值也是在某一数据节点的数据样本中,计算本次迭代的迭代梯度值,并将此迭代梯度值和此数据节点接收到的第一梯度值相加以获取第二梯度值,需要说明的是,第二损失函数值和第二梯度值是同时获取的,并且,在此系统中的所有数据节点中的第二损失函数值和第二梯度值获取方式相同,即获取各数据节点对应的第二损失梯度值的方式相同。其中,获取迭代损失函数值和迭代梯度值的方式都是通过数据节点上的模型参数计算得到的。
步骤S40,将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;
当已计算出各个数据节点的第二损失梯度值后,还需要将所有数据节点上的第二损失梯度值都传递到中立协调方,即将获取到的所有节点中的损失函数loss_init和梯度grad_init传递到中立协调方,并在中立协调方中计算各个第二损失梯度值的和值,即总损失梯度值,然后在中立协调方中将总损失梯度值减去随机损失梯度值,以获取到真正的节点损失梯度值,但是需要注意的是,在将总损失梯度值减去随机损失梯度值时,只能是损失函数与损失函数之间相减,梯度值与梯度值之间相减。其中,总损失梯度值可以包括总的损失值和总的梯度值。真实损失梯度值可以是各个数据节点自身所产生的损失值的汇总和梯度值的汇总。
步骤S50,基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;
当在中立协调方中获取到所有数据节点的真实损失梯度值后,还需要跟据此真实损失梯度值来更新模型参数,需要说明的是,采用真实损失梯度值更新模型参数不是直接将真实损失梯度值代替为模型参数,而是通过一定的计算方式来获取到新的模型参数,并将此新的模型参数传递到各个数据节点。并且会通过不断地更新模型参数来构建模型,直到模型收敛才会停止模型参数的更新,即可以认为模型已构建完成。也就是说在构建模型的过程中还需要判断模型是否收敛。
步骤S60,若所述模型收敛,则所述模型已构建完成。
当经过判断发现此模型已经收敛,则此模型已构建完成,从而可以结束收集各个数据节点的损失梯度值,并且需要将已构建好的模型参数传递给各个数据节点,各个数据节点将待预测样本输入此模型中进行运算,以得到各个数据节点的预测结果。
在本实施例中,通过初始化模型参数,并将初始化的模型参数传递给各数据节点;获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;若所述模型收敛,则所述模型已构建完成。在本方案中通过获取各个数据节点中的损失梯度值来保证各个数据节点已参与联合建模,并在获取各个数据节点中的损失梯度值之前,会向各数据节点传输各第一损失梯度值,然后再获取各数据节点中的所有损失梯度值,并在第三方,即中立协调方中进行计算,以获取各个数据节点真正的损失梯度值,从而保证了各个数据节点数据的隐私性,并且由于是通过获取各个数据节点的损失梯度值来更新模型参数的,所以也能保证此模型能解决各数据节点的不同问题预测。从而解决各数据节点对应的公司在进行信息共享,且能保证各个公司隐私数据不泄露的同时,也能进行不同类型数据答案的预测。
进一步地,在本发明第一实施例的基础上,提出了本发明联合建模方法的第二实施例,本实施例是本发明第一实施例的步骤S30的步骤细化,参照图3,所述步骤S30包括:
步骤S31,基于所述模型参数计算所述数据节点的迭代损失梯度值;
当在数据节点中获取到由中立协调方发送过来的模型参数后,还需要根据此模型参数来计算确定数据节点上的迭代损失梯度值,需要说明的是每个数据节点获取迭代损失梯度值的方式均相同,都是通过模型参数计算获取到的。其中,迭代损失梯度值可以是数据节点自身所产生的真正的损失梯度值。
步骤S32,获取所述迭代损失梯度值和所述第一损失梯度值之间的和值,并将所述和值作为所述数据节点的第二损失梯度值。
第二损失梯度值可以包括第二损失函数值和第二梯度值,第二损失函数值为在某一数据节点的数据样本中,计算本次迭代的迭代损失函数值,并将此迭代损失函数值和此数据节点接收到的第一损失函数值相加以获取第二损失函数值,同理,第二梯度值也是在某一数据节点的数据样本中,计算本次迭代的迭代梯度值,并将此迭代梯度值和此数据节点接收到的第一梯度值相加以获取第二梯度值,需要说明的是,第二损失函数值和第二梯度值是同时获取的,并且,在此系统中的所有数据节点中的第二损失函数值和第二梯度值获取方式相同,即获取各数据节点对应的第二损失梯度值的方式相同。
在本实施例中,通过获取各个数据节点的第二损失梯度值来确定总损失梯度值,从而保证获取到的总损失梯度值的准确性,并且由于只获取各数据节点的第二损失梯度值,从而保障了消息各数据节点的数据隐私保护。
进一步地,在本发明第一至第二实施例任意一个的基础上,提出了本发明联合建模方法的第三实施例,本实施例是本发明第一实施例的步骤S40,根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值的步骤的细化,包括:
步骤S41,获取所述中立协调方中的各所述第二损失梯度值之间的和值,并将所述和值作为总损失梯度值;
当在中立协调方中获取到由各个数据节点传递过来的第二损失梯度值后,还需要在中立协调方中对所有第二损失梯度值进行相加以获取其和值,并将此和值作为总损失梯度值。其中,需要说明的是,在计算总损失梯度值时,需要将损失值和梯度值分开来计算,以获取到总的损失值和总的梯度值。
为辅助理解获取总损失梯度值的工作原理,以下用一具体例子解释说明:
例如,如图5所示,当数据节点有四个中立协调方有一个时,并且此时这四个数据节点均将各自的第二损失梯度值传递到中立协调方时,需要在中立协调方中将这四个数据节点的第二损失梯度值相加以获取到总损失梯度值。
步骤S42,基于所述总损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值。
当获取到总损失梯度值后,还需要在中立协调方中将总损失梯度值减去随机损失梯度值,以得到所有数据节点的真实损失梯度值,即在中立协调方中,将总损失梯度值减去随机损失梯度值,以获取其差值,即将总损失梯度值中的总损失函数值减去随机损失梯度值中的随机损失函数值,与此同时,也将总损失梯度值中的总梯度值减去随机损失梯度值中的随机梯度值,并且,此差值即为各数据节点的真实损失梯度值。
在本实施例中,通过在中立协调方中获取总损失梯度值和随机损失梯度值之间的差值来确定各数据节点中真正的损失梯度值,并根据此真正的损失梯度值更新模型的模型参数,从而保证了各数据节点数据的隐私保护,避免了数据在传递过程出现泄漏现象的发生。
进一步地,在本发明第一至第三实施例任意一个的基础上,提出了本发明联合建模方法的第四实施例,本实施例是本发明第一实施例的步骤S50,判断所述模型是否收敛的步骤之后,包括:
步骤A10,若所述模型不收敛,则继续获取所述数据节点新的真实损失梯度值,并更新所述模型的最新模型参数,直至所述模型收敛。
当经过判断发现更新模型参数后的模型不收敛,则会继续新一轮的迭代,即将更新后的模型参数传递到各数据节点取代原先的模型参数,并继续由中立协调方将各个新的随机损失梯度值传递到各个数据节点中,并在各个数据节点中,再次计算数据节点的迭代损失梯度值和中立协调方分配给数据节点新的随机损失梯度值之间的和,并将其全部汇总到中立协调方中相加以获取到新总损失梯度值,并在中立协调方中采用同样的方法获取各个数据节点在此次迭代中真正的损失梯度值,并再次更新模型的最新模型参数,直到发现模型收敛或者达到最大迭代次数时,停止获取其它各个节点的损失梯度值,即停止更新模型参数。
在本实施例中,通过判断建立好的模型是否收敛,来确定是否更新模型参数,从而保证了模型能快速准确地构建完成,提高了模型构建的效率。
具体地,若所述模型不收敛,则继续获取所述数据节点新的真实损失梯度值的步骤,包括:
步骤A11,若所述模型不收敛,则获取模型的最新模型参数,并将所述最新模型参数传递到各数据节点,以获取所述数据节点新的真实损失梯度值。
当经过判断发现正在构建的模型不收敛,则需要再次获取模型中的最新模型参数,并将此最新模型参数传递到各个数据节点以替代原先的模型参数,并在各个数据节点中根据此最新模型参数,再次计算数据节点中的损失梯度值,并再次传递中中立协调方中,在中立协调方中确定再次计算确定数据节点新的真实损失梯度值,即在每次更新模型参数时,获取各个数据节点的真实损失函数值的步骤是一样的。
在本实施例中,通过将最新模型参数传递到各个数据节点,从而保证了每次获取到的真实损失梯度值都是不同的,提高了模型建立的效率。
进一步地,在本发明第一至第四实施例任意一个的基础上,提出了本发明广告文案生成优化方法的第五实施例,本实施例是本发明第一实施例的步骤S60若所述模型收敛,则所述模型已构建完成的步骤之后,包括:
步骤S80,获取各所述数据节点中的待预测样本特征,并将所述待预测样本特征输入所述已构建完成模型中进行在线预测,从而获取预测结果。
当经过判断发现,已建立好的模型达到收敛状态,则需要在此模型上获取已经训练好的参数,并将此参数传递到各个数据节点中,然后再在各个数据节点中,获取各数据节点的待预测样本特征,并将这些预测样本特征输入已构建完成模型中进行在线预测。
在本实施例中,通过将各数据节点中的待预测样本输入模型中进行在线预测,从而实现了多个数据方的准确预测,提高了用户的使用体验感。
此外,参照图4,本发明实施例还提出一种联合建模装置,所述联合建模装置包括:
传递模块,用于初始化模型参数,并将初始化的模型参数传递给各数据节点;
分配模块,用于获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;
获取模块,用于基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;
确定模块,用于将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;
判断模块,用于基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;
收敛模块,用于若所述模型收敛,则所述模型已构建完成。
可选地,所述获取模块,还用于:
基于所述模型参数计算所述数据节点的迭代损失梯度值;
获取所述迭代损失梯度值和所述第一损失梯度值之间的和值,并将所述和值作为所述数据节点的第二损失梯度值。
可选地,所述确定模块,还用于:
获取所述中立协调方中的各所述第二损失梯度值之间的和值,并将所述和值作为总损失梯度值;
基于所述总损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值。
可选地,所述确定模块,还用于:
获取所述总损失梯度值和所述随机损失梯度值之间的和值,并将所述和值作为所述数据节点的真实损失梯度值。
可选地,所述联合建模装置,还包括:
若所述模型不收敛,则继续获取所述数据节点新的真实损失梯度值,并更新所述模型的最新模型参数,直至所述模型收敛。
可选地,所述联合建模装置,还包括:
若所述模型不收敛,则获取模型的最新模型参数,并将所述最新模型参数传递到各数据节点,以获取所述数据节点新的真实损失梯度值。
可选地,所述联合建模装置,还包括:
获取各所述数据节点中的待预测样本特征,并将所述待预测样本特征输入所述已构建完成模型中进行在线预测,从而获取预测结果。
其中,联合建模装置的各个功能模块实现的步骤可参照本发明联合建模方法的各个实施例,此处不再赘述。
本发明还提供一种终端,所述终端包括:存储器、检测通道、处理器、通信总线以及存储在所述存储器上的联合建模程序:
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行所述联合建模程序,以实现上述联合建模方法各实施例的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述联合建模方法各实施例的步骤。
本发明计算机可读存储介质具体实施方式与上述联合建模方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种联合建模方法,其特征在于,所述联合建模方法包括以下步骤:
初始化模型参数,并将初始化的模型参数传递给各数据节点;
获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;
基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;
将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;
基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;
若所述模型收敛,则所述模型已构建完成。
2.如权利要求1所述的联合建模方法,其特征在于,所述基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值的步骤,包括:
基于所述模型参数计算所述数据节点的迭代损失梯度值;
获取所述迭代损失梯度值和所述第一损失梯度值之间的和值,并将所述和值作为所述数据节点的第二损失梯度值。
3.如权利要求1所述的联合建模方法,其特征在于,所述根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值的步骤,包括:
获取所述中立协调方中的各所述第二损失梯度值之间的和值,并将所述和值作为总损失梯度值;
基于所述总损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值。
4.如权利要求3所述的联合建模方法,其特征在于,所述基于所述总损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值的步骤,包括:
获取所述总损失梯度值和所述随机损失梯度值之间的和值,并将所述和值作为所述数据节点的真实损失梯度值。
5.如权利要求1所述的联合建模方法,其特征在于,所述判断所述模型是否收敛的步骤之后,包括:
若所述模型不收敛,则继续获取所述数据节点新的真实损失梯度值,并更新所述模型的最新模型参数,直至所述模型收敛。
6.如权利要求5所述的联合建模方法,其特征在于,所述若所述模型不收敛,则继续获取所述数据节点新的真实损失梯度值的步骤,包括:
若所述模型不收敛,则获取模型的最新模型参数,并将所述最新模型参数传递到各数据节点,以获取所述数据节点新的真实损失梯度值。
7.如权利要求1所述的联合建模方法,其特征在于,所述若所述模型收敛,则所述模型已构建完成的步骤之后,包括:
获取各所述数据节点中的待预测样本特征,并将所述待预测样本特征输入所述已构建完成模型中进行在线预测,从而获取预测结果。
8.一种联合建模装置,其特征在于,所述联合建模装置包括:
传递模块,用于初始化模型参数,并将初始化的模型参数传递给各数据节点;
分配模块,用于获取中立协调方中的随机损失梯度值,将所述随机损失梯度值划分为与所述数据节点的总数量相等的各第一损失梯度值,并将各所述第一损失梯度值分配至各所述数据节点;
获取模块,用于基于所述模型参数和所述第一损失梯度值获取各所述数据节点的第二损失梯度值;
确定模块,用于将各所述第二损失梯度值传递到所述中立协调方,并根据各所述第二损失梯度值和所述随机损失梯度值确定所述数据节点的真实损失梯度值;
判断模块,用于基于所述真实损失梯度值更新所述模型参数以构建模型,并判断所述模型是否收敛;
收敛模块,用于若所述模型收敛,则所述模型已构建完成。
9.一种联合建模设备,其特征在于,所述联合建模设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的联合建模程序,所述联合建模程序被所述处理器执行时实现如权利要求1至7中任一项所述的联合建模方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有联合建模程序,所述联合建模程序被处理器执行时实现如权利要求1至7中任一项所述的联合建模方法的步骤。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201811501956.4A CN109635422B (zh) | 2018-12-07 | 2018-12-07 | 联合建模方法、装置、设备以及计算机可读存储介质 |
| PCT/CN2019/116081 WO2020114184A1 (zh) | 2018-12-07 | 2019-11-06 | 联合建模方法、装置、设备以及计算机可读存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201811501956.4A CN109635422B (zh) | 2018-12-07 | 2018-12-07 | 联合建模方法、装置、设备以及计算机可读存储介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN109635422A true CN109635422A (zh) | 2019-04-16 |
| CN109635422B CN109635422B (zh) | 2023-08-25 |
Family
ID=66072239
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201811501956.4A Active CN109635422B (zh) | 2018-12-07 | 2018-12-07 | 联合建模方法、装置、设备以及计算机可读存储介质 |
Country Status (2)
| Country | Link |
|---|---|
| CN (1) | CN109635422B (zh) |
| WO (1) | WO2020114184A1 (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020114184A1 (zh) * | 2018-12-07 | 2020-06-11 | 深圳前海微众银行股份有限公司 | 联合建模方法、装置、设备以及计算机可读存储介质 |
| CN112182636A (zh) * | 2019-07-03 | 2021-01-05 | 北京百度网讯科技有限公司 | 一种联合建模训练的实现方法、装置、设备和介质 |
| CN112435755A (zh) * | 2020-11-23 | 2021-03-02 | 平安科技(深圳)有限公司 | 疾病分析方法、装置、电子设备及存储介质 |
| WO2021092980A1 (zh) * | 2019-11-14 | 2021-05-20 | 深圳前海微众银行股份有限公司 | 纵向联邦学习优化方法、装置、设备及存储介质 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113178191B (zh) * | 2021-04-25 | 2024-07-12 | 平安科技(深圳)有限公司 | 基于联邦学习的语音表征模型训练方法、装置、设备及介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20110046924A1 (en) * | 2009-08-24 | 2011-02-24 | International Business Machines Corporation | Method for joint modeling of mean and dispersion |
| CN108133294A (zh) * | 2018-01-10 | 2018-06-08 | 阳光财产保险股份有限公司 | 基于信息共享的预测方法及装置 |
| WO2018217635A1 (en) * | 2017-05-20 | 2018-11-29 | Google Llc | Application development platform and software development kits that provide comprehensive machine learning services |
| US20180365089A1 (en) * | 2015-12-01 | 2018-12-20 | Preferred Networks, Inc. | Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107330516B (zh) * | 2016-04-29 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 模型参数训练方法、装置及系统 |
| IL257381A (en) * | 2017-02-06 | 2018-03-29 | Neural Algorithms Ltd | System and method for automatically building data models |
| CN108491928B (zh) * | 2018-03-29 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 模型参数发送方法、装置、服务器及存储介质 |
| CN108520220B (zh) * | 2018-03-30 | 2021-07-09 | 百度在线网络技术(北京)有限公司 | 模型生成方法和装置 |
| CN109635422B (zh) * | 2018-12-07 | 2023-08-25 | 深圳前海微众银行股份有限公司 | 联合建模方法、装置、设备以及计算机可读存储介质 |
-
2018
- 2018-12-07 CN CN201811501956.4A patent/CN109635422B/zh active Active
-
2019
- 2019-11-06 WO PCT/CN2019/116081 patent/WO2020114184A1/zh not_active Ceased
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20110046924A1 (en) * | 2009-08-24 | 2011-02-24 | International Business Machines Corporation | Method for joint modeling of mean and dispersion |
| US20180365089A1 (en) * | 2015-12-01 | 2018-12-20 | Preferred Networks, Inc. | Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model |
| WO2018217635A1 (en) * | 2017-05-20 | 2018-11-29 | Google Llc | Application development platform and software development kits that provide comprehensive machine learning services |
| US20200125956A1 (en) * | 2017-05-20 | 2020-04-23 | Google Llc | Application Development Platform and Software Development Kits that Provide Comprehensive Machine Learning Services |
| CN108133294A (zh) * | 2018-01-10 | 2018-06-08 | 阳光财产保险股份有限公司 | 基于信息共享的预测方法及装置 |
Non-Patent Citations (2)
| Title |
|---|
| STEPHEN HARDY等: ""Private federated learning on vertically partitioned data via entity resolution and additively homomorphic encryption", ARXIV:1711.10766V1, pages 1 - 60 * |
| 张玉清;董颖;柳彩云;雷柯楠;孙鸿宇;: "深度学习应用于网络空间安全的现状、趋势与展望", 计算机研究与发展, no. 06, pages 1117 - 1142 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020114184A1 (zh) * | 2018-12-07 | 2020-06-11 | 深圳前海微众银行股份有限公司 | 联合建模方法、装置、设备以及计算机可读存储介质 |
| CN112182636A (zh) * | 2019-07-03 | 2021-01-05 | 北京百度网讯科技有限公司 | 一种联合建模训练的实现方法、装置、设备和介质 |
| CN112182636B (zh) * | 2019-07-03 | 2023-08-15 | 北京百度网讯科技有限公司 | 一种联合建模训练的实现方法、装置、设备和介质 |
| WO2021092980A1 (zh) * | 2019-11-14 | 2021-05-20 | 深圳前海微众银行股份有限公司 | 纵向联邦学习优化方法、装置、设备及存储介质 |
| CN112435755A (zh) * | 2020-11-23 | 2021-03-02 | 平安科技(深圳)有限公司 | 疾病分析方法、装置、电子设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN109635422B (zh) | 2023-08-25 |
| WO2020114184A1 (zh) | 2020-06-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109635422A (zh) | 联合建模方法、装置、设备以及计算机可读存储介质 | |
| WO2021228110A1 (zh) | 联邦建模方法、装置、设备及计算机可读存储介质 | |
| WO2022016964A1 (zh) | 纵向联邦建模优化方法、设备及可读存储介质 | |
| CN109377542B (zh) | 三维模型渲染方法、装置及电子设备 | |
| CN112418446B (zh) | 模型处理方法、系统、装置、介质及电子设备 | |
| TW201939366A (zh) | 推薦系統構建方法及裝置 | |
| WO2020181937A1 (zh) | 一种修改区块链网络配置的方法及系统 | |
| CN114998433B (zh) | 位姿计算方法、装置、存储介质以及电子设备 | |
| CN114332323B (zh) | 一种粒子效果渲染方法、装置、设备及介质 | |
| CN110211017B (zh) | 图像处理方法、装置及电子设备 | |
| CN111617473A (zh) | 虚拟攻击道具的显示方法和装置、存储介质和电子设备 | |
| CN115345294A (zh) | 图神经网络的训练方法、推荐方法及电子设备 | |
| WO2020233137A1 (zh) | 损失函数取值的确定方法、装置和电子设备 | |
| CN111278085B (zh) | 用于获取目标网络的方法及装置 | |
| US11281890B2 (en) | Method, system, and computer-readable media for image correction via facial ratio | |
| CN113010939A (zh) | 可视化bim模型的处理方法及其相关产品 | |
| CN113988158A (zh) | 一种基于ftrl和学习率的纵向联邦逻辑回归训练方法及装置 | |
| US9344733B2 (en) | Feature-based cloud computing architecture for physics engine | |
| CN112036722A (zh) | 装配式建筑工程进度远程管理方法、电子设备及相关产品 | |
| CN118886054A (zh) | 联邦学习隐私保护方法、装置、设备及存储介质 | |
| CN116612027A (zh) | 单张图像去反光方法、装置、设备及存储介质 | |
| CN114693885B (zh) | 三维虚拟对象生成方法、装置、设备、介质和程序产品 | |
| CN114119831B (zh) | 积雪模型的渲染方法、装置、电子设备及可读介质 | |
| CN120019841A (zh) | 游戏处理方法、装置、电子设备、存储介质及程序产品 | |
| CN111327472B (zh) | 用于获取目标网络的方法及装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |