CN110866696A - 商铺掉铺风险评估模型训练方法及装置 - Google Patents
商铺掉铺风险评估模型训练方法及装置 Download PDFInfo
- Publication number
- CN110866696A CN110866696A CN201911122189.0A CN201911122189A CN110866696A CN 110866696 A CN110866696 A CN 110866696A CN 201911122189 A CN201911122189 A CN 201911122189A CN 110866696 A CN110866696 A CN 110866696A
- Authority
- CN
- China
- Prior art keywords
- training
- model
- shop
- index
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种商铺掉铺风险评估模型训练方法及装置,所述方法包括:获取训练样本集,其中所述训练样本包括好样本和坏样本,每个样本中包含多个指标数据;基于所述训练样本训练初始模型以获得目标模型;所述目标模型用于商铺掉铺风险的评估。训练得到的模型可以直接对商铺的掉铺概率进行评估,提高对商铺掉铺的评估效率以及评估精度。
Description
技术领域
本申请涉及风险预警技术领域,尤其涉及一种商铺掉铺风险评估模型训练方法及装置。
背景技术
近年来,在经济平稳运行、消费持续升级的态势下,商业地产整体发展趋势依然向好。但在商业地产的运营中,往往面临着诸多风险及难题,如商家退租、业态调整以及物业管理问题等。其中,“掉铺”(商户退出经营)管理风险是许多商业地产企业面临的主要风险。出现“掉铺”不仅会减少租金收入,而且增加了维护成本和重新招商成本,给企业造成巨大的损失。如果能对“掉铺”进行风险监测及预警,及时对商铺进行帮扶避免其因经营困难而退租,或提前做好后续招商工作,就能减少商户退出经营带来的损失,增强企业竞争力。
目前传统的商铺掉铺分析方法主要是通过人工分析预测,往往需要经历数据搜集、数据整理、数据分析、结果对比、撰写报告等多个步骤,极大地占用了营销人员的工作时间,使得工作效率较低。现代商业加入大数据时代后,传统方法的弊端则愈加突显,使用传统人工分析方法从海量、高速、低价值密度的数据中提取有用信息难度极大,准确性及时效性也不高,更无法进行宏观风险情况监控。
发明内容
本发明提供的一种商铺掉铺风险评估模型训练方法及装置,利用训练得到的模型进行商铺掉铺风险预警,解决传统人工分析效率低的问题。
为了实现上述商铺掉铺评估的精确度和评估效率的提高,本发明实施例提供了以下技术方案:
本发明实施例提供一种商铺掉铺风险评估模型训练方法,所述方法包括:获取训练样本集,其中所述训练样本包括好样本和坏样本,每个样本中包含多个指标数据;基于所述训练样本训练初始模型以获得目标模型;所述目标模型用于商铺掉铺风险的评估。
可选的,所述多个指标分为多个指标维度,其中每个指标维度对应的所述多个指标中的部分指标;基于多个指标维度中的多个指标训练所述初始模型。
可选的,所述基于所述训练样本训练初始模型以获得目标模型的步骤包括:
划分时间区间,一个时间区间对应一个子模型;基于训练样本,按照相同的步骤训练得到每一个子模型;将训练得到的所有子模型进行集成,得到最终的目标模型。
本申请还提供一种商铺掉铺风险评估模型训练装置,其包括:获取模块,用于获取训练样本,其中所述训练样本包括好样本和坏样本,每个样本中包含多个指标数据;训练模块,用于基于所述训练样本训练初始模型以获得目标模型;所述目标模型用于商铺掉铺风险的评估。
与现有技术相比,本发明的有益效果:
1.通过获取到的关于正常运行商铺和已经发生掉铺的商铺的多个指标,基于多个指标对模型进行训练,训练后的模型可以直接对商铺的掉铺概率进行评估,提高商铺掉铺的评估效率以及评估准确度。
2.将多个指标划分成具有针对性多个指标维度,基于多个指标维度中的指标对模型进行训练,可以从训练后的模型对商铺掉铺评估的结果中获取到多个指标维度对商铺掉铺的影响,以使商铺可以根据评估结果改善经营策略,降低商铺掉铺风险。
3.在将训练样本输入至模型进行训练前,将训练样本中的所有指标通过做WOE分箱的方式对所有指标进行区分能力处理,将获取到的所有指标的IV值进行比较,只保留下区分能力强的指标,以使提高模型的训练效率和预测准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种电子设备;
图2为本申请实施例所提供的一种商铺掉铺风险评估模型训练方法的流程图;
图3为步骤S120的子步骤的流程示意图;
图4为步骤S122的子步骤的流程示意图;
图5为指标的筛选步骤的流程示意图;
图6为本申请提供的一种商铺掉铺风险评估模型训练装置的结构框图;
图7为本申请实施例提供的一种目标模型的结构示意图。
图8为实验例中ROC曲线图。
图9为实验例中PR曲线图。
图标:10-电子设备;12-处理器;14-存储器;100-商铺掉铺风险评估模型训练装置;110-获取模块;120-训练模块;130-检验模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本发明通过下述技术方案实现。
下面将结合附图对本发明技术方案进行详细描述。
请参阅图1,本申请实施例提供的一种电子设备10,所述电子设备包括存储器14和处理器12,所述存储器与所述处理器相互之间直接或间接的电性连接,以实现数据的传输或交互,其中,所述电子设备可以是服务器,也可以是终端设备,还可以是任意具有数据存储和处理能力的设备。
其中,所述存储器中存储有以软件或固件(Fimware)的形式存储于所述存储器中的软件功能模块,所述处理器通过运行存储在存储器内的软件程序以及模块,如本发明实施例中的商铺掉铺风险评估模型训练装置100,从而执行各种功能应用以及数据处理,即实现本发明实施例中的商铺掉铺风险评估模型训练方法。
请结合图2,图2为本申请实施例提供的一种商铺掉铺风险评估模型训练方法的流程示意图,所述电子设备实现所述商铺掉铺风险评估模型训练方法时,执行步骤S110-S130。
步骤S110,获取训练样本。
在本申请实施例中,可以从数据库中获取训练样本,其中训练样本包括有好样本(在正常运行的商铺)和坏样本(已经发生掉铺现象的商铺),以及好样本和坏样本中包括的多个指标数据。
在本申请实施例中,多个指标可以包括但不限于:一级业态、商户性质、合同天数、铺位类型、代理方式、营业额平均增长率、营业额改变量均值、客流量平均增长率、客流量最大回撤、媒体活动、同广场同行业店铺经营面积占比、城市类型、同广场同行业店铺营业额占比。
在本申请实施例中,可选的,基于数据库自有数据,结合业务逻辑和各种常用的指标构建技巧,将多个指标分为多个指标维度,其中每个指标维度对应多个指标中的部分指标。例如:将多个指标分为店铺特质、经营状况、活跃程度、竞争因素,其中店铺特征中对应的部分指标可以为一级业态、商户性质、合同天数、铺位类型、代理方式;经营状况中对应的部分指标可以为营业额平均增长率、营业额改变量均值;活跃程度对应的部分指标可以为客流量平均增长率、客流量最大回撤、媒体活动;竞争因素中对应的部分指标可以为同广场同行业店铺经营面积占比、城市类型、同广场同行业店铺营业额占比。
其中,①店铺特质:店铺与业态的关系,餐饮行业掉铺的概率大于生活精品掉铺的概率以及大于服装行业掉铺的概率。店铺面积与掉铺关系,当店铺面积在100平方米到150平方米之间时,该类店铺表现出了较低的掉铺可能性。而当店铺面积大于330平方米时,店铺可能会随着经营状况的恶化而提前终止合同。合同天数与掉铺关系,当签署的合同年数为三年左右的店铺,掉铺的概率相对较高。
②经营状况:营业额增长率与掉铺的关系,当每月平均营业额环比下降5%以上时,店铺掉铺的概率显著增加。营业额最大回撤与掉铺的关系,营业额近半年最大回撤越大,店铺掉铺的概率随之增加。营业额持续下降与掉铺的关系,如果营业额连续三个月持续下滑,店铺掉铺的概率随之增加。月坪效与掉铺的关系,月坪效与掉铺存在单调线性关系,店铺月坪效越高,掉铺概率越低。营收租金比与掉铺的关系,营收租金比与掉铺存在单调线性的关系,营收租金比越高,掉铺的概率越低。
③活跃程度:客流量增长率与掉铺的关系,月平均客流量增长率与掉铺存在单调线性关系,月平均客流量增长率越高,掉铺概率越低。客流量最大回撤与掉铺的关系,客流量最大回撤与掉铺存在单调线性关系,近半年客流量最大回撤越大,掉铺概率越高。客流量与掉铺的关系,月平均客流量与掉铺存在单调线性关系,月平均客流量越高,掉铺概率越低。客流量持续下降与掉铺的关系,如果店铺客流量连续三个月持续下降,店铺掉铺的概率讲变大。基于多个指标维度中的多个指标训练初始模型。
容易理解的,上述指标的选取以及维度的划分,仅是一种示意性的举例,基于不同的考量可以采用不同的指标或者更多的指标,也可以进行不同维度划分,本发明方法对此没有硬性要求。
在本申请实施例中,获取样本还包括样本抽样方式,鉴于坏样本(掉铺样本)并非小数量,并且数据库中提供的数据已经是平均抽样,遍布各类城市和广场,所以在对现有数据进行训练集合测试集划分时,本申请实施例直接采取随机划分的方法:
在本申请实施例中,将所有样本的90%用来当做训练数据集,剩余10%用来当做测试数据集(如果有了新数据,可以重新按比例分配)。为了保证模型的准确与稳定,减少系数偏差,采用Bootstrap抽样方法将好坏样本单按1:4的比例生成100组训练样本,并分别用每个训练样本训练初始模型,生成100组系数,对每一个系数求平均值,得到模型最终的输出值(系数)。
步骤S120,基于训练样本训练初始模型以获得目标模型。
在本申请实施例中,目标模型为初始模型经过若干次训练后而得到,目标模型用于商铺掉铺风险的评估。基于训练样本中的多个指标维度的多个指标训练初始模型,进而获取目标模型。
步骤S130,检验获得的目标模型。
在本申请实施例中,基于训练样本中的多个指标维度的多个指标训练初始模型并得到目标模型后,为确保模型的评估效果,可以对训练得到的目标模型进行检验。例如,将得到的整体模型在预留测试数据集上进行验证,通过绘制ROC曲线和PR曲线,计算分类AUC、精度和召回率来验证模型可靠性与准确性。如图8-9所示,利用训练样本数据和测试样本数据对目标模型进行分析,都表现出了较好的效果,即本发明方法所得到的目标模型对于商铺掉铺风险具有较高的预测能力。注意,本步骤为可选步骤,不是必要步骤。
请参阅图3,图3为步骤S120的子步骤的流程示意图。本实施例中所述的初始模型包括多个子模型,其中每个子模型对应一个时间区间。具体地,本步骤包括以下步骤:
步骤S121,划分时间区间,一个时间区间对应一个子模型。
本实施例中,以发生掉铺行为或者正常运营的合同结束的当月作为截止点,例如向前分别倒推1个月,2个月,3个月,4个月,5个月和6个月,基于店铺运营的不同时间截面的指标进行子模型的训练。
容易理解的,对于时间区间的划分以及子模型的个数设置,此处仅是一个示意性举例,可以有其他不同的处理方式,例如每两个月为一个时间区间,又例如可以是向前推一年时间而一个月为一个时间区间,继而得到12个子模型。
步骤S122,基于训练样本,按照相同的步骤训练得到每一个子模型。
请参阅图4,每个子模型训练步骤包括:
步骤S1221,输入训练样本。
在本发明实施例中,将训练样本输入至子模型中,其中训练样本中的多个指标为子模型对应时间区间中的指标。例如有6个模型对应的分别是一个月、两个月……六个月,一个模型对应的是时间节点前一个月,训练样本中的所有指标就应为店铺在这一个月中的指标。倘若一个子模型对应的是时间区间为两个月,训练样本中的所有指标就应为店铺在这两个月内的指标。
步骤S1222,基于训练样本中的多个指标进行处理,获取多个指标维度的评估值。
在本申请实施例中,多个指标维度的评估值相当于该店铺在这多个指标维度中的评估情况,可以通过评估值获得好样本和坏样本的掉铺概率。
可选的,基于多个指标进行评分,获取多个指标维度的评分值。多个指标维度的评分值为其中的多个指标的评分值总和。结合每个指标维度的评分值对多个指标维度进行权重分配,获取多个指标维度的权重。将每个指标维度的评分值以及权重作为评估值。
在本申请实施例中,基于训练样本中多个指标维度的多个指标对一个子模型采用逻辑回归算法进行训练。例如,指标维度为店铺特质,主要基于该指标维度的一系列指标进行建模。店铺特质包含:一级业态、二级业态、三级业态、经营面积对数、商户特质、合同天数、铺位类型、代理方式共计8个指标,将这个8个指标作为变量进行输入,按照逻辑回归算法训练得到并输出一个关于指标维度为店铺特质的一个评分值。以此通过逻辑回归算法基于其他指标维度训练该子模型。
在本申请实施例中,每个指标维度之间通过采用遗传算法对各个指标维度进行权重的分配,遗传算法的目标函数为信息熵。基于得到的权重,将各个指标维度的评分值进行叠加,从而得到基于某段时间点观测的子模型。
在一些实施例中,首先将若干个指标分成的上述四个指标维度分别训练一个子模型得到每个指标维度的评分。其次将这四个指标维度通过遗传算法,得到四个指标维度相应的权重,累计后得到一个子模型1,即基于店铺截止点前一个月(该子模型对应的时间段)的训练模型。为了在四个指标维度中得到一个最优(局部最优)的权重分配,保证四个权重之和为1,采用遗传学算法进行权重搜索。具体做法:设置遗传算法的最优化函数,此处采用交叉熵损失函数,设置初始种群大小,最大迭代次数,复制概率,变异概率和交叉概率,最后当优化函数收敛后自动停止迭代,返回最优结果权重。例如,在一个试验例中,上述四个指标维度的权重分别为0.271、0.239、0.24、0.24。
步骤S1223,对步骤S1222中得到的评估值进行检验,若评估值的误差达到设定的误差精度或者迭代次数达到设定值,则停止训练,否则返回步骤S1221,输入新的样本数据进行重复训练,直至训练结束。
步骤S123,将步骤S122训练得到的所有子模型进行集成,得到最终的目标模型。本实施例中,是将每个子模型之间通过采用遗传算法对各个子模型进行权重的分配,然后将各个子模型的评分值及其权重进行叠加,得到最终的目标模型,即能够预测商铺“掉铺”可能性的风险模型。该模型输出的是最终的商户半年内掉铺的预测概率,从0到1,表示该商户掉铺的概率从低到高。
上述步骤S110中,对于样本中所包含的指标的确定,可以在根据业务逻辑和先验知识初步确定后,再进行区分能力分析,剔除区分能力差的指标,保留区分能力强的指标。
结合参阅图5,图5为对指标的筛选步骤的流程示意图,具体筛选过程包括:
步骤S1101,对于初步确定的指标做WOE分箱处理,获得每个指标的IV值。
在本申请实施例中,在训练样本进入模型之前先对训练样本中所有指标数据做WOE分箱,将取值连续的变量分为离散的多个类,一个类为一个分箱,而对于取值离散的变量则一个取值为一个分箱,避免极端数据、异常数据、缺失数据对模型的干扰,提高模型的训练效率和预测准确度。基于WOE分箱可以测算单个变量的IV值来评估单个指标对于商铺的区分能力。
在一些实施例中,基于现有数据,共确定出58个指标并分成4大指标维度(店铺特质、经营状况、活跃程度和竞争因素),按照每个指标的IV值来看,大部分指标都表现出了很好的预测能力。进入模型之前先对测试集的所有字段数据做WOE分箱,将取值连续的变量分为离散的多个类。离散型数据分箱依照数据类型的个数进行分箱。每个离散型数据的类型都会作为WOE的一个箱。连续型数据如果可以被分为五箱,则分为五箱;若连续型变量不能被分为五箱(某一个数值出现多次的情况),则将改数值设为特殊值分为一箱,剩下数值的分为五箱。在上述操作依然无法成行的情况下,则将出现较多的前两个数值设为特殊值,分为单独的两箱,剩下的数据分为四箱。
步骤S1102,基于每个指标的IV值,根据预设的IV值区间,确定该指标的区分能力。
在本申请实施例中,基于获取到每个指标的IV值,通过预设的IV值区间,可以设置区分能力弱以及区分能力强的指标,还可以设置区分能力弱、中等、强的指标,预设的IV值可以通过需求自行设置。IV值表示变量在不同取值分组中好坏样本的占比差距,IV值越大说明该指标对好坏样本有越大的鉴别能力。IV值的预设区间例如可以是:IV处于[0.02,0.1),指标有弱的区分能力,IV处于[0.1,0.3),指标有中等的区分能力,IV大于或等于0.3,指标有强的区分能力。则删除弱区分能力的指标,保留中等区分能力以及强区分能力的指标。例如,媒体活动指标IV值0.000,表示该指标几乎完全不具有区分能力,因此入模的时候会筛除媒体活动指标;商户性质指标IV值0.334,表示该指标有强区分能力,保留商户性质指标。
请参阅图6,图6为本申请提供的一种商铺掉铺风险评估模型训练装置的结构示意图,所述装置包括获取模块、训练模块以及检验模块。
所述获取模块,用于获取训练样本,其中所述训练样本包括好样本和坏样本,每个样本中包含多个指标数据。
在本申请实施例中,所述获取模块用于执行图2中的步骤S110,关于所述获取模块的具体描述可以参照图2中对步骤S110的具体描述。
所述训练模块,用于基于所述训练样本训练初始模型以获得目标模型;所述目标模型用于商铺掉铺风险的评估。
在本申请实施例中,所述训练模块用于执行图2中的步骤S120,关于所述训练模块的具体描述可以参照图2中对步骤S120的具体描述。
所述检验模块,用于检验获得的目标模型。
在本申请实施例中,所述检验模块用于执行图2中的步骤S130,关于所述检验模块的具体描述可以参照图2中对步骤S130的具体描述。
在一些实施例中,所述初始模型包括多个子模型,其中每个子模型对应一个时间区间;训练模块中包括划分子模块、训练子模块以及集成子模块。
其中,划分子模块用于划分时间区间,一个时间区间对应一个子模型。例如以发生掉铺行为或者正常运营的合同结束的当月作为截止点,向前分别倒推1个月,2个月,3个月,4个月,5个月和6个月进行时间区间划分。
在本申请实施例中,所述划分子模块用于执行图3中的步骤S121,关于所述检验模块的具体描述可以参照图3中对步骤S121的具体描述。
训练子模块用于基于训练样本,按照相同的步骤训练得到每一个子模型。
在本申请实施例中,所述输入模块用于执行图3中的步骤S122,关于所述检验模块的具体描述可以参照图3中对步骤S122的具体描述。
集成子模块用于将训练得到的所有子模型进行集成,得到最终的目标模型。
在本申请实施例中,所述输入模块用于执行图3中的步骤S123,关于所述检验模块的具体描述可以参照图3中对步骤S123的具体描述。
请结合参阅图7,图7为本申请实施例提供的一种目标模型的结构示意图。
在本申请实施例中,店铺特征、经营状况、活跃程度、竞争因素为多个指标分成的针对性的指标维度。模型1、模型2、模型3、模型4、模型5以及模型6为六个子模型。截止点为商铺运营合同到期的日期,以及对应的截止点为每个子模型对应的时间区间。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种商铺掉铺风险评估模型训练方法,其特征在于,所述方法包括:
获取训练样本集,其中所述训练样本包括好样本和坏样本,每个样本中包含多个指标数据;
基于所述训练样本训练初始模型以获得目标模型;所述目标模型用于商铺掉铺风险的评估。
2.根据权利要求1所述的方法,其特征在于,所述多个指标分为多个指标维度,其中每个指标维度对应的所述多个指标中的部分指标;
基于多个指标维度中的多个指标训练所述初始模型。
3.根据权利要求2所述的方法,其特征在于,基于所述训练样本训练初始模型以获得目标模型的步骤包括:
划分时间区间,一个时间区间对应一个子模型;
基于训练样本,按照相同的步骤训练得到每一个子模型;
将训练得到的所有子模型进行集成,得到最终的目标模型。
4.根据权利要求3所述的方法,其特征在于,所述基于训练样本,按照相同的步骤训练得到每一个子模型的步骤包括:
输入训练样本,所述训练样本中的多个指标数据为该子模型所对应时间区间中的指标数据;
基于所述训练样本中的所述多个指标进行逻辑回归训练,获取所述多个指标维度的评估值;
对得到的评估值进行检验,若评估值的误差达到设定的误差精度或者迭代次数达到设定值,则停止训练,否则输入新的样本数据进行重复训练,直至训练结束。
5.根据权利要求3所述的方法,其特征在于,所述将训练得到的所有子模型进行集成的步骤包括:通过遗传算法对所有子模型进行权重分配,然后将各个子模型的评分值及其权重进行叠加,得到最终的目标模型。
6.根据权利要求1所述的方法,其特征在于,所述样本中的指标通过以下方式确定:
针对于每一个初步确定的指标,做WOE分箱处理,并获得每个指标的IV值;
根据预设的IV值区间确定每个指标的区分能力的强弱,保留区分能力强的指标,剔除区分能力弱的指标,所述样本中的指标即为保留下来的指标。
7.一种商铺掉铺风险评估模型训练装置,其特征在于,其包括:
获取模块,用于获取训练样本,其中所述训练样本包括好样本和坏样本,每个样本中包含多个指标数据;
训练模块,用于基于所述训练样本训练初始模型以获得目标模型;所述目标模型用于商铺掉铺风险的评估。
8.根据权利要求7所述的装置,其特征在于,所述多个指标分为多个指标维度,其中每个指标维度对应的所述多个指标中的部分指标;
基于多个指标维度中的多个指标训练所述初始模型。
9.根据权利要求8所述的装置,其特征在于,所述初始模型包括多个子模型,其中每个子模型对应一个时间区间;训练模块包括:
划分子模块,用于划分时间区间,一个时间区间对应一个子模型;
训练子模块,用于基于训练样本,按照相同的步骤训练得到每一个子模型;
集成子模块,用于将训练得到的所有子模型进行集成,得到最终的目标模型。
10.一种商铺掉铺风险评估模型,其特征在于,其是利用权利要求1至6任一项所述的商铺掉铺风险评估模型训练方法训练所得到,所述商铺掉铺风险评估用于商铺掉铺风险的评估。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911122189.0A CN110866696B (zh) | 2019-11-15 | 2019-11-15 | 商铺掉铺风险评估模型训练方法及装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911122189.0A CN110866696B (zh) | 2019-11-15 | 2019-11-15 | 商铺掉铺风险评估模型训练方法及装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN110866696A true CN110866696A (zh) | 2020-03-06 |
| CN110866696B CN110866696B (zh) | 2023-05-26 |
Family
ID=69654776
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201911122189.0A Active CN110866696B (zh) | 2019-11-15 | 2019-11-15 | 商铺掉铺风险评估模型训练方法及装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN110866696B (zh) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112561320A (zh) * | 2020-12-14 | 2021-03-26 | 中国建设银行股份有限公司 | 机构风险预测模型的训练方法、机构风险预测方法和装置 |
| CN113487414A (zh) * | 2021-07-07 | 2021-10-08 | 广东中盈盛达数字科技有限公司 | 一种风控评分卡建模区间的划分方法及其划分系统 |
| CN119809675A (zh) * | 2024-12-20 | 2025-04-11 | 中国建设银行股份有限公司青岛市分行 | 营商环境的确定方法、装置、存储介质及电子装置 |
Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104867017A (zh) * | 2015-05-16 | 2015-08-26 | 成都数联铭品科技有限公司 | 电子商务客户虚假评价识别系统 |
| CN105608590A (zh) * | 2016-03-04 | 2016-05-25 | 刘恺之 | 以crm核心构建的消费生态圈商业模式的运行方法 |
| CN106570631A (zh) * | 2016-10-28 | 2017-04-19 | 南京邮电大学 | 一种面向p2p平台运营风险评估的方法和系统 |
| WO2017115626A1 (ja) * | 2015-12-29 | 2017-07-06 | ビーエルデーオリエンタル株式会社 | 参加店舗評価装置及び該参加店舗評価装置を利用する参加型施設 |
| WO2017161897A1 (zh) * | 2016-03-24 | 2017-09-28 | 深圳市前海安测信息技术有限公司 | 基于健康管理的保险精算方法和系统 |
| WO2018214361A1 (en) * | 2017-05-25 | 2018-11-29 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for improvement of index prediction and model building |
| CN108921398A (zh) * | 2018-06-14 | 2018-11-30 | 口口相传(北京)网络技术有限公司 | 店铺质量评价方法及装置 |
| CN108932585A (zh) * | 2018-06-19 | 2018-12-04 | 腾讯科技(深圳)有限公司 | 一种商户运营管理方法及其设备、存储介质、电子设备 |
| CN109101989A (zh) * | 2018-06-29 | 2018-12-28 | 阿里巴巴集团控股有限公司 | 一种商户分类模型构建和商户分类方法、装置及设备 |
| CN109345368A (zh) * | 2018-08-22 | 2019-02-15 | 中国平安人寿保险股份有限公司 | 基于大数据的信用评估方法、装置、电子设备及存储介质 |
| CN109447461A (zh) * | 2018-10-26 | 2019-03-08 | 北京三快在线科技有限公司 | 用户信用评估方法及装置、电子设备、存储介质 |
-
2019
- 2019-11-15 CN CN201911122189.0A patent/CN110866696B/zh active Active
Patent Citations (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104867017A (zh) * | 2015-05-16 | 2015-08-26 | 成都数联铭品科技有限公司 | 电子商务客户虚假评价识别系统 |
| WO2017115626A1 (ja) * | 2015-12-29 | 2017-07-06 | ビーエルデーオリエンタル株式会社 | 参加店舗評価装置及び該参加店舗評価装置を利用する参加型施設 |
| JPWO2017115626A1 (ja) * | 2015-12-29 | 2018-10-18 | ビーエルデーオリエンタル株式会社 | 参加店舗評価装置及び該参加店舗評価装置を利用する参加型施設 |
| CN105608590A (zh) * | 2016-03-04 | 2016-05-25 | 刘恺之 | 以crm核心构建的消费生态圈商业模式的运行方法 |
| WO2017161897A1 (zh) * | 2016-03-24 | 2017-09-28 | 深圳市前海安测信息技术有限公司 | 基于健康管理的保险精算方法和系统 |
| CN106570631A (zh) * | 2016-10-28 | 2017-04-19 | 南京邮电大学 | 一种面向p2p平台运营风险评估的方法和系统 |
| WO2018214361A1 (en) * | 2017-05-25 | 2018-11-29 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for improvement of index prediction and model building |
| CN108921398A (zh) * | 2018-06-14 | 2018-11-30 | 口口相传(北京)网络技术有限公司 | 店铺质量评价方法及装置 |
| CN108932585A (zh) * | 2018-06-19 | 2018-12-04 | 腾讯科技(深圳)有限公司 | 一种商户运营管理方法及其设备、存储介质、电子设备 |
| CN109101989A (zh) * | 2018-06-29 | 2018-12-28 | 阿里巴巴集团控股有限公司 | 一种商户分类模型构建和商户分类方法、装置及设备 |
| CN109345368A (zh) * | 2018-08-22 | 2019-02-15 | 中国平安人寿保险股份有限公司 | 基于大数据的信用评估方法、装置、电子设备及存储介质 |
| CN109447461A (zh) * | 2018-10-26 | 2019-03-08 | 北京三快在线科技有限公司 | 用户信用评估方法及装置、电子设备、存储介质 |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112561320A (zh) * | 2020-12-14 | 2021-03-26 | 中国建设银行股份有限公司 | 机构风险预测模型的训练方法、机构风险预测方法和装置 |
| CN113487414A (zh) * | 2021-07-07 | 2021-10-08 | 广东中盈盛达数字科技有限公司 | 一种风控评分卡建模区间的划分方法及其划分系统 |
| CN119809675A (zh) * | 2024-12-20 | 2025-04-11 | 中国建设银行股份有限公司青岛市分行 | 营商环境的确定方法、装置、存储介质及电子装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN110866696B (zh) | 2023-05-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110988422A (zh) | 一种窃电识别方法、装置及电子设备 | |
| CN113762764A (zh) | 一种进口食品安全风险自动分级与预警系统及方法 | |
| CN111583012B (zh) | 融合文本信息的信用债发债主体违约风险评估方法 | |
| CN110210719B (zh) | 一种电力设备静态数据质量评估方法及系统 | |
| CN110866696A (zh) | 商铺掉铺风险评估模型训练方法及装置 | |
| CN113449942A (zh) | 客户体验评测方法、系统及管理平台 | |
| CN118277795B (zh) | 高负载下高压变频器的性能测试方法 | |
| CN114511250A (zh) | 一种基于机器学习的企业外迁风险预警方法及系统 | |
| CN113450004A (zh) | 电力信用报告生成方法、装置、电子设备及可读存储介质 | |
| CN118917390B (zh) | 基于知识大模型的服务知识库管理系统及方法 | |
| CN106056274A (zh) | 基于pca‑dea二维综合评价模型的电力施工主体效益分析方法 | |
| KR101438050B1 (ko) | 거래처 모니터링 시스템 | |
| CN112926816B (zh) | 供应商评价方法、装置、计算机设备和存储介质 | |
| CN119693035A (zh) | 基于业务全链大数据分析建模的窜货预警方法及装置 | |
| CN112488496A (zh) | 一种财务指标预测方法及装置 | |
| JP6975086B2 (ja) | 品質評価方法および品質評価装置 | |
| CN116384680A (zh) | 研发质量的可视化监测方法、装置、设备及可读存储介质 | |
| CN107256461A (zh) | 一种充电设施建设地址评价方法及系统 | |
| CN119647995A (zh) | 一种基于评价值优化的燃油设备替代设备的评估选择方法 | |
| CN112884301A (zh) | 企业风险分析的方法、设备及计算机存储介质 | |
| CN119884666A (zh) | 一种基于物联网的高低压配电箱故障诊断方法及系统 | |
| CN114139956B (zh) | 一种台区线损异常检测方法及装置 | |
| CN114511201A (zh) | 一种评估企业综合能力的方法 | |
| CN114418450A (zh) | 一种数据处理方法及装置 | |
| CN113673595A (zh) | 一种数据处理方法、装置及设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |