CN111913690A

CN111913690A - 一种基于马尔可夫聚类的软件模块划分方法

Info

Publication number: CN111913690A
Application number: CN202010544160.8A
Authority: CN
Inventors: 王攀; 余志强; 刘翔; 谢敏; 杨晶
Original assignee: Chengdu Aircraft Industrial Group Co Ltd
Current assignee: Chengdu Aircraft Industrial Group Co Ltd
Priority date: 2020-06-15
Filing date: 2020-06-15
Publication date: 2020-11-10

Abstract

本发明提出了一种基于马尔可夫聚类的软件模块划分方法，首先将软件离散为功能集合，通过功能之间的数据流动形成功能关系矩阵，以功能之间直接流动的数据项数表征功能之间的紧密程度；然后以功能关系矩阵为对象，通过马尔可夫聚类形成自适应的模块划分方法。本发明通过上述操作实现了不用事先设定模块个数，快速稳定的软件功能模块划分。

Description

一种基于马尔可夫聚类的软件模块划分方法

技术领域

本发明属于软件工程技术领域，具体地说，涉及一种基于马尔可夫聚类的软件模块划分方法。

背景技术

软件设计是软件全生命周期中一个非常重要的阶段。在软件设计中，一个重要的工作是进行模块的划分，将各个功能归入相应的功能模块中，形成软件架构。合理的模块划分可以优化软件系统架构，对于软件的开发、使用、维护都有十分重要的意义。软件的模块划分是围绕高内聚、低耦合的目标，对软件功能的一种组合。目前该工作大多仍依赖于设计人员的经验，划分结果不统一、划分结果缺乏依据。如何通过自动化的划分方法，在合理评估软件功能关系的前提下给出划分结果，是亟待解决的问题。

现有技术中，如专利“一种软件模块划分方法，CN 2016111403541”公开了一种基于粒子群算法的软件模块划分方法。该方法利用粒子群算法种群寻优的特性，对软件模块划分问题进行离散编码，通过优化获得软件模块划分的最优方案。该专利在模块划分中主要以代码中的方法、以及方法之间的调用关系为对象，建模过程较为复杂，且粒子群算法耗时较长。因此，有必要从功能及功能之间的数据关系入手，对软件模块进行快速的划分。

发明内容

本发明针对现有技术对软件功能划分结果不统一、划分缺乏依据、划分复杂耗时长等问题，提出了一种基于马尔可夫聚类的软件模块划分方法，通过数据流转间功能对功能的数据关系，实现了对软件模块快速的划分，在划分结果同意的同时其划分可作为划分分析依据。

本发明具体实现内容如下：

一种基于马尔可夫聚类的软件模块划分方法，首先将软件离散为多个功能的功能集合F，然后通过功能集合F中的功能之间的数据流动形成功能关系矩阵R，最后以功能矩阵R为对象，通过马尔可夫聚类形成自适应的软件功能划分模块。

为了更好地实现本发明，进一步地，所述将软件离散为多个功能的功能集合F的具体操作为：对于包含n个功能的软件，构建功能集合F＝{f₁，f₂，…，f_n}，其中f_i(1≤i≤n)、f_j(1≤j≤n)都是功能集合中的一个功能。

为了更好地实现本发明，进一步地，所述形成功能关系矩阵R的具体操作为：

首先设定功能关系矩阵R＝(r_ij)n×n；

然后设定r_ij的值为w，所述w为功能f_i与功能f_j之间直接流动的数据项个数。

为了更好地实现本发明，进一步地，所述以功能矩阵R为对象，通过马尔可夫聚类形成自适应的软件功能划分模块具体操作为：

首先根据功能关系矩阵R构建概率矩阵P；

然后对概率矩阵P进行归一化，得到归一化后的概率矩阵P’；

接着对概率矩阵P’重复进行多次迭代、膨胀操作直到概率矩阵P’稳定；

最后完成聚类，得到聚类结果，即各功能模块m₁，m₂，…，m_k，其中k是功能模块的个数，m_i(1≤i≤k)是某一个功能模块。

为了更好地实现本发明，进一步地，所述构建概率矩阵P的具体操作为：

首先设定构建概率矩阵P为P＝(p_ij)_n×n；

然后对P_ij进行取值计算，具体取值计算方法为，当i＝j的时候，P_ij值为1，当i≠j的时候，P_ij值为r_ij；

最后将P_ij计算得出值概率矩阵P＝(p_ij)_n×n中，得到概率矩阵P。

为了更好地实现本发明，进一步地，所述进行归一化的操作具体为：

对概率矩阵P进行归一化得到归一化后的概率矩阵P′＝(p_ij)_n×n，其中，所述P′_ij的计算过程为：首先对i取值在1到n范围内的P_ij求和，然后用P_ij除以求和后的值得到P′_ij。

为了更好地实现本发明，进一步地，所述迭代的具体操作为：设定迭代参数e，对概率矩阵P进行e次P′＝P′×P′操作。

为了更好地实现本发明，进一步地，所述膨胀的具体操作为：设定膨胀系数r，对迭代后的概率矩阵P′进行膨胀，用公式表达为：

本发明与现有技术相比具有以下优点及有益效果：

通过软件功能及功能之间的数据流动关系，将软件转化为功能集合以及功能关系矩阵，形成对软件的描述；然后由马尔可夫聚类的方法对功能进行聚类，获得各个模块，划分不需事先设定模块个数，且划分过程快速、稳定。

附图说明

图1为待划分的功能与功能之间的数据关系示意图；

图2为模块划分结果示意图。

具体实施方式

为了更清楚地说明本发明实施例的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，应当理解，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例，因此不应被看作是对保护范围的限定。基于本发明中的实施例，本领域普通技术工作人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：

一种基于马尔可夫聚类的软件模块划分方法，首先将软件离散为多个功能的功能集合F，然后通过功能集合F中的功能之间的数据流动形成功能关系矩阵R，最后以功能矩阵R为对象，通过马尔可夫聚类形成自适应的软件功能划分模块；具体操作为：

步骤S1.将软件离散为多个功能的功能集合F：对于包含n个功能的软件，构建功能集合F＝{f₁，f₂，…，f_n}，其中f_i(1≤i≤n)、f_j(1≤j≤n)都是功能集合中的一个功能。

步骤S2.形成功能关系矩阵R：

首先设定功能关系矩阵R＝(r_ij)_n×n；

步骤S3.以功能矩阵R为对象，通过马尔可夫聚类形成自适应的软件功能划分模块：

首先根据功能关系矩阵R构建概率矩阵P；

实施例2：

本发明在上述实施例1的基础上，为了更好地实现本发明，进一步地，所述构建概率矩阵P的具体操作为：

首先设定构建概率矩阵P为P＝(p_ij)_n×n；

所述进行归一化的操作具体为：

对概率矩阵P进行归一化得到归一化后的概率矩阵P′＝(p′_ij)_n×n，其中，所述P′_ij的计算过程为：首先对i取值在1到n范围内的P_ij求和，然后用P_ij除以求和后的值得到P′_ij。

所述迭代的具体操作为：设定迭代参数e，对概率矩阵P进行e次P＝P×P操作。

所述膨胀的具体操作为：设定膨胀系数r，对迭代后的概率矩阵P进行膨胀，用公式表达为：

本实施例的其他部分与上述实施例1相同，故不再赘述。

实施例3：

本发明在上述实施例1-2任一项的基础上，给出一个具体的实际划分举例：

如图1、图2所示，针对软件中的功能，具体模块划分步骤如下：

步骤1.对于包含30个功能的软件，构建其功能集合F＝{f₁，f₂，…，f₃₀}，其中f_i(1≤i≤30)是软件的一个功能。

步骤2.构建功能关系矩阵R＝(r_ij)_n×n，r_ij表示功能之间直接流动的数据项个数，其取值按照如下规则：

r_ij＝w。

式中：w为f_i和f_j之间直接流动的数据项个数

得到该软件的功能关系矩阵：

步骤3.构建概率矩阵P＝(p_ij)_n×n，其中：

步骤4.对P进行归一化得到P′＝(p′_ij)_n×n，其中：

步骤5.设定迭代参数e＝2，通过下列步骤对P′进行迭代：

步骤5-1.计算P′：

P′＝P′×P′。

步骤5-2.重复e次步骤5-1。

步骤6.设定膨胀参数r＝2，对P′进行进行膨胀，即：

步骤7.重复步骤5和步骤6，直到P′稳定，完成聚类。

步骤8.获得图2中的聚类结果，共包含5个模块，分别为m₁、m₂、m₃、m₄、m₅。各模块包含的功能如下表1所示：

模块	功能
		m<sub>1</sub>	f<sub>1</sub>、f<sub>2</sub>、f<sub>6</sub>、f<sub>7</sub>、f<sub>8</sub>、f<sub>9</sub>、f<sub>13</sub>、f<sub>14</sub>
m<sub>2</sub>	f<sub>3</sub>、f<sub>4</sub>、f<sub>5</sub>、f<sub>10</sub>、f<sub>11</sub>、f<sub>12</sub>、f<sub>15</sub>
		m<sub>3</sub>	f<sub>21</sub>、f<sub>22</sub>、f<sub>23</sub>、f<sub>24</sub>、f<sub>25</sub>、f<sub>26</sub>、f<sub>29</sub>
m<sub>4</sub>	f<sub>16</sub>、f<sub>17</sub>、f<sub>18</sub>、f<sub>19</sub>、f<sub>20</sub>
		m<sub>5</sub>	f<sub>27</sub>、f<sub>28</sub>、f<sub>30</sub>

表1

该实施实例表明，本发明提出的基于马尔可夫聚类的软件模块划分方法可用于软件模块划分，并能够取得较好的效果。

本实施例的其他部分与上述实施例1-2任一项相同，故不再赘述。

以上所述，仅是本发明的较佳实施例，并非对本发明做任何形式上的限制，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化，均落入本发明的保护范围之内。

Claims

1.一种基于马尔可夫聚类的软件模块划分方法，其特征在于，首先将软件离散为多个功能的功能集合F，然后通过功能集合F中的功能之间的数据流动形成功能关系矩阵R，最后以功能矩阵R为对象，通过马尔可夫聚类形成自适应的软件功能划分模块。

2.如权利要求1所述的一种基于马尔可夫聚类的软件模块划分方法，其特征在于，所述将软件离散为多个功能的功能集合F的具体操作为：对于包含n个功能的软件，构建功能集合F＝{f₁，f₂，…，f_n}，其中f_i(1≤i≤n)、f_j(1≤j≤n)都是功能集合中的一个功能。

3.如权利要求2所述的一种基于马尔可夫聚类的软件模块划分方法，其特征在于，所述形成功能关系矩阵R的具体操作为：

首先设定功能关系矩阵R＝(r_ij)_n×n；

4.如权利要求3所述的一种基于马尔可夫聚类的软件模块划分方法，其特征在于，所述以功能矩阵R为对象，通过马尔可夫聚类形成自适应的软件功能划分模块具体操作为：

首先根据功能关系矩阵R构建概率矩阵P；

5.如权利要求4所述的一种基于马尔可夫聚类的软件模块划分方法，其特征在于，所述构建概率矩阵P的具体操作为：

首先设定构建概率矩阵P为P＝(p_ij)_n×n；

6.如权利要求5所述的一种基于马尔可夫聚类的软件模块划分方法，其特征在于，所述进行归一化的操作具体为：

对概率矩阵P进行归一化得到归一化后的概率矩阵P′＝(p′_ij)_n×n，其中，所述P'_ij的计算过程为：首先对i取值在1到n范围内的P_ij求和，然后用P_ij除以求和后的值得到P'_ij。

7.如权利要求6所述的一种基于马尔可夫聚类的软件模块划分方法，其特征在于，所述迭代的具体操作为：设定迭代参数e，对概率矩阵P′进行e次P′＝P′×p′操作。

8.如权利要求7所述的一种基于马尔可夫聚类的软件模块划分方法，其特征在于，所述膨胀的具体操作为：设定膨胀系数r，对迭代后的概率矩阵P′进行膨胀，用公式表达为：