WO2018149114A1

WO2018149114A1 - 确定胎儿染色体中微缺失微重复的方法及设备

Info

Publication number: WO2018149114A1
Application number: PCT/CN2017/100423
Authority: WO
Inventors: 杜伯乐; 蒋馥蔓; 郭宇來; 韩颖鑫; 高晓峘; 李胜
Original assignee: Guangzhou Jingke Dx Co Ltd
Current assignee: Guangzhou Jingke Dx Co Ltd
Priority date: 2017-02-17
Filing date: 2017-09-04
Publication date: 2018-08-23
Anticipated expiration: 2019-08-17
Also published as: CN106778069B; CN106778069A

Abstract

一种确定胎儿染色体中微缺失微重复的方法及设备，包括：获得含有微缺失微重复片段的浓度fm；获得男/女性胎儿核酸浓度fy/fs；计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的比值rmY，或fm与女性胎儿核酸浓度fs的比值rms；根据缺失的拷贝数或重复的拷贝数计算rmY或rms，过滤掉假阳性；取rmY的小数部分dmY，或rms的小数部分dms，判断dmY/dms是否为阳性，否则过滤掉结果；计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY，或fm与女性胎儿核酸浓度fs的和为ams；根据判定原则对微缺失微重复片段进行过滤，过滤后得到胎儿染色体微缺失微重复片段。

Description

确定胎儿染色体中微缺失微重复的方法及设备

技术领域

本发明涉及生物医学领域，具体的，确定染色体中微缺失和微重复的方法及设备。

背景技术

在无创产前检测(NIPT)临床领域，胎儿微缺失微重复的筛查灵敏度较低。现有基于母亲外周血估算胎儿染色体微缺失微重复的方法主要分为以下两个方向：1)基于在母亲血浆中胚胎DNA序列比例的变化估算微缺失微重复。2)利用单核苷酸多态性(SNPs)位点表现的差异化，选择多个SNP位点进行估算。

现有的检测方法都存在一定的局限性，检测的方法1)精度较低，会出现大量的假阳性结果，由于结果仅根据某区域内片段的比例的变化来得出检测结果，缺乏有效的过滤方法，假阳性的出现很难避免。方法2)需要探针捕获和高深度测序，或者需要获得父源性信息，高深度捕获需要设计芯片，增加了实验的难度，高深度测序会增加一定的成本，未被捕获的部分则不能进行测定。

发明内容

本发明的目的在于，提供一种确定胎儿染色体中微缺失微重复的方法及设备，该方法通过计算胎儿微缺失微重复的片段浓度及胎儿本身核酸的浓度，对微缺失微重复进行评估，降低假阳性率，精准度高。

基于以上目的，本发明一方面提供一种确定胎儿染色体中微缺失重复的方法，包括以下步骤：

S1、获得含有微缺失微重复片段的浓度fm；

S2、获得男性胎儿核酸浓度fy或女性胎儿核酸浓度fs；

S3、计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的比值rmY＝fm/fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的比值rms＝fm/fs；

S4、根据缺失的拷贝数或重复的拷贝数计算rmY或rms，过滤掉假阳性；

S5、取rmY的小数部分dmY，或rms的小数部分dms，判断dmY或dms是否为阳性，否则过滤掉结果；

S6、计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY＝fm+fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的和为ams＝fm+fs；

S7、根据判定原则对微缺失微重复的片段进行过滤，过滤后得到胎儿染色体微缺失微重复片段。

本发明另一方面还提供一种确定胎儿染色体中微缺失微重复的设备，包括：

微缺失微重复片段浓度计算装置，用于获得含有微缺失微重复片段的浓度fm；

胎儿核酸浓度获得装置，用于获得男性胎儿核酸浓度fy或女性胎儿核酸浓度fs；

比值计算装置，用于计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的比值rmY＝fm/fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的比值rms＝fm/fs；

第一过滤装置，用于根据缺失的拷贝数或重复的拷贝数计算rmY或rms，过滤掉假阳性；

第二过滤装置，用于取rmY的小数部分dmY，或rms的小数部分dms，判断dmY或dms是否为阳性，否则过滤掉结果；

和值计算装置，用于计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY＝fm+fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的和为ams＝fm+fs；

第三过滤装置，用于根据判定原则对微缺失微重复片段进行过滤，过滤后得到胎儿染色体微缺失微重复片段。

本发明提供的方法及装置，能够精确的确定染色体中的微缺失微重复，尤其适用于确定孕妇外周血中的胎儿染色体的微缺失微重复。

同现有技术相比：

1、本发明不需要额外的芯片设计，节省了芯片设计的费用，并使得实验方法简单。

2、不需要高深度的测序，在用全基因组数据进行染色体非整倍性的基础上对数据进行后续的处理，能够直接得出准确的微缺失微重复结果，无需增加数据量。

3、克服了现有技术中采用snp的方法可能会遗漏一些捕获无法达到的区域，本发明可以在全基因组上进行检测。

4、首次实现了用全基因组测序的方法，判断胎儿微缺失微重复浓度。

5、降低了假阳性，提高了准确度。

6、去除了母体微缺失微重复对胎儿的影响，提高准确度。

附图说明

图1是本发明一实施例中确定胎儿染色体微缺失微重复的方法的流程图。

图2是图1实施例中的获得含有微缺失微重复的片段的浓度fm的方法的流程图。

图3是图1实施例中的获得含有微缺失微重复终极窗口的方法的流程图。

图4是图1实施例中的获得男性胎儿核酸浓度fy的方法的流程图。

图5是图1实施例中的获得女性胎儿核酸浓度fs的方法的流程图。

图6是图5方法中的获得预定范围的方法的流程图。

图7是图5方法中的获得预定的函数的方法的流程图。

图8是本发明另一实施例中确定胎儿染色体中微缺失微重复的设备的结构框图。

图9是图8实施例中的含有微缺失微重复片段的浓度计算装置的结构框图。

图10是图8实施例中的微缺失微重复所在终极窗口获得单元的结构框图。

图11是图8实施例中的男性胎儿核酸浓度fy获得单元的结构框图。

图12是图8实施例中的女性胎儿核酸浓度fs获得单元的结构框图。

图13是图8实施例中的预定范围确定元件的结构框图。

图14是图8实施例中的预定函数确定元件的结构框图。

图15是实施例2中19个样本微缺失微重复结果展示图。

主要元件符号说明

确定胎儿染色体中微缺失微重复的设备	100
微缺失微重复片段浓度计算装置	110
初极窗口获得单元	111
第一平均深度获得单元	112

第二平均深度获得单元	113
微缺失微重复片段浓度获得单元	114
微缺失微重复所在终极窗口获得单元	115
第一测序元件	1151
比对元件	1152
长度确定元件	1153
初级窗口确定元件	1154
第一统计元件	1155
修正元件	1156
第一合并元件	1157
第一过滤元件	1158
第二合并元件	1159
重复元件	1160
微缺失微重复终极窗口确定元件	1161
胎儿核酸浓度获得装置	120
男性胎儿核酸浓度fy获得单元	121
第二测序元件	1211
第一数目确定元件	1212
过滤模块	12121
第二统计元件	1213
平均深度获得元件	1214
男性胎儿核酸浓度获得元件	1215
女性胎儿核酸浓度fs获得单元	122
第三测序元件	1221
第二数目确定元件	1222
频率确定元件	1223

女性胎儿核酸浓度确定元件	1224
预定范围确定元件	1225
长度确定模块	12251
第一频率确定模块	12252
相关性系数确定模块	12253
预定范围确定模块	12254
预定函数确定元件	1226
第二频率确定模块	12261
拟合模块	12262
比值计算装置	130
第一过滤装置	140
假阳性判断单元	141
第二过滤装置	150
阳性判断单元	151
和值计算装置	160
第三过滤装置	170

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

下面详细描述本发明的实施例。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

需要说明的是，术语“初级”、“次级”、“终极”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“初级”、“次级”、“终极”的特征可以明示或者隐含地包括一个或更多个该特征。进一步地，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。本发明中的“唯一比对序列”、“唯一比对测序序列”有时也可称之为“序列”、“测序序列”。

术语“母体样品”在本文中是指这样的生物样品，其获自妊娠受试者，例如，妇女。

术语“微缺失微重复”是指染色体上出现长度为1.5kb-10Mb的缺失或重复。

术语“GC修正”是指对序列中的GC含量进行修正。

参见图1，本发明提供一种确定胎儿染色体微缺失微重复的方法，包括：

S1、获得含有微缺失微重复片段的浓度fm；

S2、获得男性胎儿核酸浓度fy或女性胎儿核酸浓度fs；

发明人惊奇的发现，利用本发明的方法能够精确的确定染色体中的微缺失微重复，尤其适用于确定孕妇外周血中的胎儿染色体的微缺失微重复。

参见图2，根据本发明的一个实施例，所述步骤S1中含有微缺失微重复片段的浓度fm通过如下步骤获得：

S11、根据含有微缺失微重复的初级窗口，获得不含微缺失微重复的初级窗口，计算含有微缺失微重复的初级窗口的总序列数和含有微缺失微重复的初级窗口的总数目，以及不含有微缺失微重复的初级窗口的总序列数和不含有微缺失微重复的初级窗口的总数目；

S12、获得含有微缺失微重复的初级窗口的平均深度d1，d1＝含有微缺失微重复的初级窗口的总序列数/含有微缺失微重复的初级窗口的总数目；

S13、获得不含微缺失微重复的初级窗口的平均深度d2，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的总数目；

S14、计算含有微缺失微重复片段的浓度fm，fm＝2×︱d2-d1︱/d2。

本领域技术人员可以理解的，所述不含微缺失微重复的初级窗口的总数目及序列数可由含有微缺失微重复终极窗口的方法推导得到。例如，终极窗口有个起始和终止位置的绝对坐标，根据与次级窗口的坐标的关系，找到次级窗口的坐标，然后确认次级窗口有多少初级窗口在，去掉最初和最后的初级窗口，以排除数据的波动，然后得到最终的初级窗口，计算得到总序列数。

参见图3，根据本发明的一个实施例，所述含有微缺失微重复的终极窗口通过以下步骤获得：

S111、对含有游离核酸的生物样本进行核酸测序，以便获得由多个测序数据构成的测序结果；

S112、将所述测序结果与参考基因组进行比对，以便构建唯一比对测序序列集，所述唯一比对测序序列集中的每一个测序序列仅能够与所述参考基因组的一个位置匹配；

S113、确定所述唯一比对测序序列集中各唯一比对测序序列的长度；

S114、按照预定长度将参考基因组划分为多个初级窗口，所述预定长度为1bp-5M；

S115、统计所述各唯一比对测序序列落入各个初级窗口的数目；

S116、对落入初级窗口中的序列数进行GC修正，以及对修正后的结果进行批次间调整；

S117、将预定数目个相邻的初级窗口合并为多个次级窗口，确定各个次级窗口中的序列数目；

S118、对各个次级窗口进行统计检验，计算出T1值，根据所述T1值过滤所述次级窗口；

S119、对过滤后的次级窗口进行统计检验，计算出T2值，根据所述T2值将相邻两个无显著性差异的次级窗口合并为终极窗口；

S120、重复步骤S118-S120，直至无法合并；

S121、对最终合并得到的终极窗口进行假设检验，获得含有微缺失微重复的终极窗口。

根据本发明的一个实施例，所述含有游离核酸的生物样本为孕妇外周血中的游离胎儿核酸。

根据本发明的一个实施例，所述核酸为DNA。

根据本发明的一个实施例，所述测序结果包括所述游离核酸的长度及碱基排列顺序。所述“长度”是指核酸的长度，可以用碱基对即bp作为单位。

根据本发明的一个实施例，所述测序为双末端测序、单末端测序或单分子测序。由此，容易得到游离核酸的长度，有利于后续步骤的进行。

本领域技术人员可以理解的，由于血样中游离胎儿DNA比较短，因需要获得所有游离DNA分子的长度，从而单末端测序需测通整条游离DNA分子，或者采用双末端测序。

根据本发明的一个实施例，所述步骤S114中的预定长度为1bp-5M，所述步骤S117中的预定数目为5-100个。优选所述预定长度为20-40Kb。

根据本发明的一个实施例，所述GC修正的方法包括采用局部加权回归法，线性回归法或逻辑回归法。

根据本发明的一个实施例，所述批次间调整为用测序的批次内所有样本计算对应的每个初级窗口的基线，根据基线对每个初级窗口内的唯一比对测序序列的数目进行加权修正。

根据本发明的一个实施例，所述步骤S118中T1值包括根据Z检验或T检验计算得到，所述过滤为将T1值在-3-3之间的次级窗口过滤掉。

根据本发明的一个实施例，所述步骤S119中T2值包括根据秩和检验、符号检验或游程检验计算得到，所述无显著性差异为相邻两个窗口的T2值在-3-3之间。

根据本发明的一个实施例，所述步骤S121中假设检验包括根据Z检验或T检验计算得到，所述检验阈值定义为3。也即，当检验的统计量>3或者<-3，判定为含有微缺失微重复的终极窗口。

参见图4，根据本发明的一个实施例，所述步骤S2中所述男性胎儿核酸浓度fy通过如下步骤获得：

S211、对含有游离核酸的生物样本进行测序，获得由多个测序数据构成的测序结果；

S212、根据所述测序结果确定所述样品中的Y染色体中唯一比对测序序列落入初级窗口的数目；

S213、统计Y染色体上各初级窗口中唯一比对测序序列的数目总和以及所述初级窗口的总数目；

S214、获得Y染色体中初级窗口的平均深度dy，dy＝Y染色体上唯一比对测序序列数目总和/Y染色体上初级窗口的数目；

S215、获得男性胎儿核酸浓度fy，fy＝2×dy/d2，所述d2为不含微缺失微重复的初级窗口的平均深度，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的数目。

本领域技术人员可以理解的，所述不含微缺失微重复的初级窗口的总数目及序列数可由含有微缺失微重复终极窗口的方法推导得到。

根据本发明的一个实施例，所述步骤S212进一步包括：按照预定长度将参考基因组划分为多个初级窗口，去除Y染色体中唯一比对序列数目大于平均序列数目5倍以上的初级窗口。优选的，所述初级窗口为经过GC修改调整后的初级窗口。

参见图5，根据本发明的一个实施例，所述步骤S2中女性胎儿核酸浓度fs通过如下步骤获得：

S221、对含有游离核酸的生物样本进行测序，获得由多个测序数据构成的测序结果；

S222、根据所述测序结果，确定所述样品中长度落入预定范围的唯一比对测序序列的数目；

S223、基于所述长度落入预定范围的唯一比对测序序列的数目，确定在所述预定范围内出现唯一比对测序序列的频率；

S224、根据所述预定范围内出现唯一比对测序序列的频率，根据预定函数，确定所述样本中女性胎儿核酸浓度fs。

参见图6，根据本发明的一个实施例，所述步骤S222中预定范围通过如下步骤确定：

S2221、确定所述多个对照样品中所包含的唯一比对测序序列的长度；

S2222、设定多个候选长度范围，并分别确定所述多个对照样品在各候选长度范围内出现的唯一比对测序序列的频率；

S2223、基于所述多个对照样品在各候选长度范围内出现唯一比对测序序列的频率以及所述对照样品中核酸的浓度，确定各所述候选长度范围与所述对照样品中核酸的浓度的相关性系数；

S2224、基于所述相关性系数的数值，确定至少一个候选长度范围或者候选长度范围组合作为所述预定范围。

根据本发明的一个实施例，所述预定范围是基于多个对照样品确定的，其中，所述对照样品中核酸的浓度是已知的，优选的，所述预定范围是基于至少20个对照样品确定的。

根据本发明的一个实施例，所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本，并且所述对照样品中核酸浓度是利用Y染色体确定的。

根据本发明的一个实施例，所述对照样品中游离胎儿核酸浓度是利用Y染色体确定，也即通过本发明上述男性胎儿核酸浓度fy的方法确定的。

根据本发明的一个实施例，所述S2222中候选长度范围的跨度为1-300bp，优选的为1-20bp。

根据本发明的一个实施例，所述多个候选长度范围的步长为1-2bp。

例如，所述候选长度范围分别为1-20，2-21，3-22……，其中跨度为20bp，步长为1bp。

根据本发明的一个实施例，所述步骤S222中预定范围为179bp-206bp。

参见图7，根据本发明的一个实施例，所述步骤S223中预定的函数通过如下步骤获得：

S2231、分别在所述多个对照样品中，确定在所述预定范围内出现唯一比对测序序列的频率；

S2232、将所述多个对照样品中在所述预定范围内出现唯一比对测序序列的频率与已知的核酸浓度进行拟合，以便确定所述预定的函数。

根据本发明的一个实施例，所述拟合为线性拟合。

根据本发明的一个实施例，所述预定函数为d＝-0.3215×p+1.62562，其中，d表示核酸浓度，p表示在所述预定范围内出现的唯一比对测序序列的频率。

根据本发明的一个实施例，所述步骤S4还包括：若根据所述缺失的拷贝数计算得到rmY≧2或所述重复的拷贝数计算得到rmY≧6，则判定为不可信，过滤掉假阳性结果；

或者，若根据所述缺失的拷贝数计算得到rms≧2或所述重复的拷贝数计算得到rms≧6，则判定为不可信，过滤掉假阳性结果。

根据本发明的一个实施例，所述步骤S5还包括：若dmY<0.13或dmY>0.85，则dmY为阳性；

或者，若dms<0.15或dms>0.791，则dms为阳性。

根据本发明的一个实施例，所述步骤S7中的判定原则为：若amY在0.95-1.05之间，则认为所述微缺失微重复的片段来自于母亲，过滤所述微缺失微重复的片段；

或者，若ams在0.93-1.06之间，则认为所述微缺失微重复的片段来自于母亲，过滤所述微缺失微重复的片段。

参见图8，本发明一方面还提供一种确定胎儿染色体中微缺失微重复的设备100，包括：

微缺失微重复片段浓度计算装置110，用于获得含有微缺失微重复片段的浓度fm；

胎儿核酸浓度获得装置120，用于获得男性胎儿核酸浓度fy或女性胎儿核酸浓度fs；

比值计算装置130，用于计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的比值rmY＝fm/fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的比值rms＝fm/fs；

第一过滤装置140，用于根据缺失的拷贝数或重复的拷贝数计算rmY或rms，过滤掉假阳性；

第二过滤装置150，用于取rmY的小数部分dmY，或rms的小数部分dms，判断dmY或dms是否为阳性，否则过滤掉结果；

和值计算装置160，用于计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY＝fm+fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的和为ams＝fm+fs；

第三过滤装置170，用于根据判定原则对微缺失微重复片段进行过滤，过滤后得到胎儿染色体微缺失微重复片段。

参见图9，根据本发明的一个实施例，所述微缺失微重复片段浓度计算装置110进一步包括：

初极窗口获得单元111，用于根据含有微缺失微重复的初级窗口，获得不含微缺失微重复的初级窗口，计算含有微缺失微重复的初级窗口的总序列数和含有微缺失微重复的初级窗口的总数目，以及不含微缺失微重复的初级窗口的总序列数和不含有微缺失微重复的初级窗口的数目；

第一平均深度获得单元112，用于获得含有微缺失微重复的初级窗口的平均深度d1，d1＝含有微缺失微重复的初级窗口的总序列数/含有微缺失微重复的初级窗口的数目；

第二平均深度获得单元113，用于获得不含微缺失微重复的初级窗口的平均深度d2，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的总数目；

微缺失微重复片段浓度获得单元114，用于计算含有微缺失微重复片段的浓度fm，fm＝2×︱d2-d1︱/d2。

根据本发明的一个实施例，所述微缺失微重复片段浓度计算装置110进一步包括微缺失微重复所在终极窗口获得单元115，参见图10，所述微缺失微重复所在终极窗口获得单元115包括：

第一测序元件1151，用于对含有游离核酸的生物样本进行核酸测序，以便获得由多个测序数据构成的测序结果；

比对元件1152，用于将所述测序结果与参考基因组进行比对，以便构建唯一比对测序序列集，所述唯一比对测序序列集中的每一个测序序列仅能够与所述参考基因组的一个位置匹配；

长度确定元件1153，用于确定所述唯一比对测序序列集中各唯一比对测序序列的长度；

初级窗口确定元件1154，用于按照预定长度将参考基因组划分为多个初级窗口，所述预定长度为1bp-5M；

第一统计元件1155，用于统计所述各唯一比对测序序列落入各个初级窗口的数目；

修正元件1156，用于对落入初级窗口中的序列数进行GC修正，以及对修正后的结果进行批次间调整；

第一合并元件1157，用于将预定数目个相邻的初级窗口合并为多个次级窗口，确定各个次级窗口中的序列数目；

第一过滤元件1158，用于对各个次级窗口进行统计检验，计算出T1值，根据所述T1值过滤所述次级窗口；

第二合并元件1159，用于对过滤后的次级窗口进行统计检验，计算出T2值，根据所述T2值将相邻两个无显著性差异的次级窗口合并为终极窗口；

重复元件1160，用于重复启动第一过滤元件1158、第二合并元件1159，直至无法合并；

微缺失微重复终极窗口确定元件1161，用于对最终合并得到的终极窗口进行假设检验，获得含有微缺失微重复的终极窗口。

根据本发明的一个实施例，所述第一合并元件1157中的预定数目为5-100个。优选所述预定长度为20-40Kb。

根据本发明的一个实施例，所述修正元件1156中的GC修正的方法包括采用局部加权回归法，线性回归法或逻辑回归法。

根据本发明的一个实施例，所述修正元件1156中的批次间调整为用测序的批次内所有样本计算对应的每个初级窗口的基线，根据基线对每个初级窗口内的唯一比对测序序列的数目进行加权修正。

根据本发明的一个实施例，所述第一过滤元件1158中T1值包括根据Z检验或T检验计算得到，所述过滤为将T1值在-3-3之间的次级窗口过滤掉。

根据本发明的一个实施例，所述第二合并元件1159中T2值包括根据秩和检验、符号检验或游程检验计算得到，所述无显著性差异为相邻两个窗口的T2值在-3-3之间。

根据本发明的一个实施例，所述微缺失微重复终极窗口确定元件1161中的假设检验包括根据Z检验或T检验计算得到，所述检验阈值定义为3。也即，当检验的统计量>3或者<-3，判定为含有微缺失微重复的终极窗口。

根据本发明的一个实施例，所述胎儿核酸浓度获得装置120进一步包括男性胎儿核酸浓度fy获得单元121，参见图11，所述男性胎儿核酸浓度fy获得单元121包括：

第二测序元件1211，用于对含有游离核酸的生物样本进行测序，获得由多个测序数据构成的测序结果；

第一数目确定元件1212，用于根据所述测序结果确定所述样品中的Y染色体中唯一比对测序序列落入初级窗口的数目；

第二统计元件1213，用于统计Y染色体上各初级窗口中唯一比对测序序列的数目总和以及所述初级窗口的总数目；

平均深度获得元件1214，用于获得Y染色体中初级窗口的平均深度dy，dy＝Y染色体上唯一比对测序序列数目总和/Y染色体上初级窗口的数目；

男性胎儿核酸浓度获得元件1215，用于获得男性胎儿核酸浓度fy，fy＝2×dy/d2，所述d2为不含微缺失微重复的初级窗口的平均深度，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的数目。

根据本发明的实施例，所述第一数目确定元件1212进一步包括过滤模块12121，所述过滤元件用于按照预定长度将参考基因组划分为多个初级窗口，去除Y染色体中唯一比对序列数目大于平均序列数目5倍以上的初级窗口。

根据本发明的一个实施例，所述胎儿核酸浓度获得装置120进一步包括女性胎儿核酸浓度fs获得单元122，参见图12，所述女性胎儿核酸浓度fs获得单元122包括：

第三测序元件1221，用于对含有游离核酸的生物样本进行测序，获得由多个测序数据构成的测序结果；

第二数目确定元件1222，用于根据所述测序结果，确定所述样品中长度落入预定范围的唯一比对测序序列的数目；

频率确定元件1223，用于基于所述长度落入预定范围的唯一比对测序序列的数目，确定在所述预定范围内出现唯一比对测序序列的频率；

女性胎儿核酸浓度确定元件1224，用于根据所述预定范围内出现的唯一比对测序序列的频率，根据预定的函数，确定所述样本中女性胎儿核酸浓度fs。

根据本发明的一个实施例，所述女性胎儿核酸浓度fs获得单元122进一步包括预定范围确定元件1225，参见图13，根据本发明的一个实施例，所述预定范围确定元件1225进一步包括：

长度确定模块12251，用于确定所述多个对照样品中所包含的唯一比对测序序列的长度；

第一频率确定模块12252，用于设定多个候选长度范围，并分别确定所述多个对照样品在各候选长度范围内出现的唯一比对测序序列的频率；

相关性系数确定模块12253，用于基于所述多个对照样品在各候选长度范围内出现唯一比对测序序列的频率以及所述对照样品中核酸的浓度，确定各所述候选长度范围与所述对照样品中核酸的浓度的相关性系数；

预定范围确定模块12254，用于基于所述相关性系数的数值，确定至少一个候选长度范围或者候选长度范围组合作为所述预定范围。

根据本发明的一个实施例，所述预定范围是基于多个对照样品确定的，其中，所述对照样品中核酸浓度是已知的，优选的，所述预定范围是基于至少20个对照样品确定的。

根据本发明的一个实施例，所述对照样品为已知游离胎儿核酸比例的怀有正常男胎的孕妇外周血样本，并且所述对照样品中游离胎儿核酸浓度是利用Y染色体确定的。也即通过本发明上述男性胎儿核酸浓度fy的方法确定的。

根据本发明的一个实施例，所述候选长度范围的跨度为1-300bp，优选的为1-20bp。

例如，所述候选长度范围分别为1-20,2-21,3-22……，其中跨度为20bp，步长为1bp。

根据本发明的一个实施例，所述预定范围为179bp-206bp。

根据本发明的一个实施例，所述女性胎儿核酸浓度fs获得单元122进一步包括预定函数确定元件1226，参见图14，所述预定函数确定元件1226包括：

第二频率确定模块12261，用于分别在所述多个对照样品中，确定在所述预定范围内出现唯一比对测序序列的频率；

拟合模块12262，用于将所述多个对照样品中在所述预定范围内出现唯一比对测序序列的频率与已知的核酸浓度进行拟合，以便确定所述预定的函数。

根据本发明的一个实施例，所述拟合为线性拟合。

根据本发明的一个实施例，所述预定函数为d＝-0.3215×p+1.62562，其中，d表示游离胎儿核酸浓度，p表示在所述预定范围内出现唯一比对测序序列的频率。

根据本发明的一个实施例，所述第一过滤装置140还包括假阳性判断单元141，用于若根据所述缺失的拷贝数计算得到rmY≧2或所述重复的拷贝数计算得到rmY≧6，则判定为不可信，过滤掉假阳性结果；

根据本发明的一个实施例，所述第二过滤装置150还包括阳性判断单元151，用于判断若dmY<0.13或dmY>0.85，则dmY为阳性；或者，若dms<0.15或dms>0.791，则dms为阳性。

根据本发明的一个实施例，所述第三过滤装置170中的判定原则为：若amY在0.95-1.05之间，则认为所述微缺失微重复的片段来自于母亲，过滤所述微缺失微重复的片段；

实施例1

一、获得微缺失微重复的片段的浓度fm；

1、对含有游离核酸的生物样本进行核酸测序，以便获得由多个测序数据构成的测序结果；

2、将所述测序结果与参考基因组进行比对，以便构建唯一比对测序序列集，所述唯一比对测序序列集中的每一个测序序列仅能够与所述参考基因组的一个位置匹配；

3、确定所述唯一比对测序序列集中各唯一比对测序序列的长度；

4、按照预定长度将参考基因组划分为多个初级窗口，所述预定长度为1bp-5M，优选的采用20kp-40kp为一个预定长度，例如(1-20bp,20-40bp,40-80bp,80-100bp,100-120bp,……,)；

5、统计所述各唯一比对测序序列的长度落入各个初级窗口的唯一比对测序序列的数目；

6、对落入初级窗口中的序列数进行GC修正，以及对修正后的结果进行批次间调整，所述GC修正的方法包括采用局部加权回归法，线性回归法或逻辑回归法；

7、将预定数目个相邻的初级窗口合并为多个次级窗口，确定各个次级窗口中的序列数目，所述预定数目为5-100个；例如以5个初级窗口合并为1个次级窗口，5个初级窗口分别为1-20bp,20-40bp,40-80bp,80-100bp,100-120bp，合并后的次级窗口为1-120bp。

8、对各个次级窗口进行统计检验，计算出T1值，所述T1值包括Z检验或T检验计算得到；

9、根据所述T1值过滤所述次级窗口，即将T1值在-3-3之间的次级窗口过滤掉；

10、对过滤后的次级窗口进行统计检验，计算出T2值，所述T2值包括但不限于根据秩和检验、符号检验或游程检验计算得到；

11、根据T2值将相邻两个无显著性差异的次级窗口合并为终极窗口，所述无显著性差异为两个窗口的T2在-3-3之间；

12、重复8-10，直至无法合并；

13、将最终合并得到的终极窗口进行假设检验，获得含有微缺失微重复的终极窗口，所述假设检验包括根据Z检验或T检验计算得到，即当检验的统计量>3或者<-3，判定为含有微缺失微重复的终极窗口。

14、根据含有微缺失微重复的初级窗口，获得不含微缺失微重复的初级窗口，计算含有微缺失微重复的初级窗口的总序列数和含有微缺失微重复的初级窗口的总数目，以及不含有微缺失微重复的初级窗口的总序列数和不含有微缺失微重复的初级窗口的总数目；

15、计算含有微缺失微重复的终极窗口的平均深度d1，d1＝含有微缺失微重复的初级窗口的总序列数/含有微缺失微重复的终极窗口的总数目；

16、计算不含微缺失微重复的初级窗口的平均深度d2，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的总数目；

17、计算微缺失微重复的片段的浓度fm，fm＝2×︱d2-d1︱/d2。

二、获得男性胎儿核酸浓度fy或女性胎儿核酸浓度fs；

1、确定待测样品中是否含有Y染色体，若含有，计算男性胎儿核酸浓度fy，若不含有，计算女性胎儿核酸浓度fs；

2、若含有Y染色体，计算男性胎儿核酸浓度fy。

(1)根据上述测序结果确定所述样品中的Y染色体中唯一比对测序序列落入初级窗口的数目；

(2)去除初级窗口中经GC修改调整后的唯一比对序列数目大于平均序列数目5倍以上的初级窗口；

(3)统计Y染色体上各初级窗口中唯一比对测序序列的数目总和以及所述初级窗口的总数目；

(4)获得Y染色体中初级窗口的平均深度dy，dy＝Y染色体上唯一比对测序序列数目总和/Y染色体上初级窗口的数目；

(5)获得男性胎儿核酸浓度fy，fy＝2×dy/d2，所述d2为不含微缺失微重复的初级窗口的平均深度，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的数目。

3、若不含有Y染色体，计算女性胎儿核酸浓度fs。

(1)确定所述含有游离核酸的生物样本中长度落入预定范围的唯一比对测序序列的数目；所述预定范围为179bp-206bp。

所述预定范围通过如下步骤获得：

a、选出至少20个对照样品，即包含已知的游离胎儿核酸浓度的样品，本实施例采用男性胎儿对照样品，所述对照样品中游离胎儿核酸浓度根据Y染色体确定，也即通过上述男性胎儿核酸浓度fy的方法确定的。

b、统计出所有对照样品中所包含的唯一比对测序序列的长度，从0bp到Mbp(M表示核酸的最长的长度)，并确定每个长度下出现的唯一比对测序序列的序列数；

c、以某个长度为候选长度范围，按照1-2bp的步长挪动划分多个候选长度范围，例如1bp，2bp，3bp，…，100bp，…，300bp，统计出所述对照样品在每个候选长度范围内出现的唯一比对测序序列的频率；

d、找出所述多个对照样品在各候选长度范围内出现唯一比对测序序列的频率与所述对照样品中核酸的浓度相关性比较强的候选长度范围或范围的组合，确定各所述候选长度范围与所述核酸的浓度的相关性系数；其中，相关性系数通过相关性计算得到，包括线性回归、逻辑回归、局部加权等方法计算得到。

其中，所述候选长度范围的跨度为1-300bp，优选的为1-20bp。多个候选长度范围的步长为1-2bp。

e、基于所述相关性系数的数值，确定至少一个候选长度范围或者候选长度范围组合作为所述预定范围。

(2)基于所述长度落入预定范围的唯一比对测序序列的数目，统计出所述预定范围内出现唯一比对测序序列的频率；

(3)基于所述预定范围内的唯一比对测序序列的频率，根据预定的函数，确定所述样本中女性胎儿核酸浓度fs。

所述预定函数通过如下步骤获得：

a、分别在所述多个对照样品中，确定在所述预定范围内出现唯一比对测序序列的频率，所述对照样品中的预定范围及唯一比对测序序列的频率通过前述预定范围确定方法得到；

b、将所述多个对照样品中在所述预定范围内出现唯一比对测序序列插入片段的频率与已知的核酸浓度进行线性拟合，以便确定所述预定的函数。

优选的，所述预定函数为d＝-0.3215×p+1.62562，其中，d表示游离胎儿核酸浓度，p表示在所述预定范围内出现唯一比对测序序列的频率。

三、计算微缺失微重复的片段的浓度fm与男性胎儿核酸浓度fy的比值rmY＝fm/fy，或计算含有微缺失微重复的片段的浓度fm与女性胎儿核酸浓度fs的比值rms＝fm/fs；

四、根据缺失的拷贝数计算得到rmY≧2或重复的拷贝数计算得到rmY≧6，则判定为不可信，过滤掉假阳性结果；

或者，若缺失的拷贝数计算得到rms≧2或重复的拷贝数计算得到rms≧6，则判定为不可信，过滤掉假阳性结果；

过滤假阳性是为了去除多拷贝的影响，使结果更准确。

五、取rmY的小数部分dmY，或rms的小数部分dms，判断dmY或dms是否为阳性，否则过滤掉结果：

若dmY<0.13或dmY>0.85，则dmY为阳性；

或者，若dms<0.15或dms>0.791，则dms为阳性；

六、计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY＝fm+fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的和为ams＝fm+fs；

七、若amY在0.95-1.05之间，则认为所述微缺失微重复的片段来自于母亲，过滤所述微缺失微重复的片段；

或者，若ams在0.93-1.06之间，则认为所述微缺失微重复的片段来自于母亲，过滤所述微缺失微重复的片段，过滤后得到胎儿染色体微缺失微重复片段。

实施例2

1、样品收集及处理

选择1个批次100个样本，提取外周血2ml进行血浆分离。

2、文库构建

可参照本领域人员熟知的血浆文库构建要求进行文库构建

3、测序

测序过程可参照本领域人员熟知的测序流程进行上机操作。

4、数据分析

通过双末端测序得到测序结果，经过以下分析得到初始的微缺失微重复的结果，步骤如下：

4.1 比对，将测序结果比对到参考基因组上，确定唯一比对测序序列的位置。

4.2 按照20kb的长度将参考基因组划分为多个初级窗口，统计每个初级窗口内的唯一比对测序序列数和GC含量，用局部加权回归落入初级窗口中的序列数进行GC修正。

4.3 对批次内所有样本，对每个初级窗口进行基线的修正，批次间调整。

4.4 以100个为单位将相邻的初级窗口进行合并，合并后得到多个次级窗口，所述次级窗口的长度为2M；

4.5 利用Z检验计算各个次级窗口的T1值，将T1值在-3-3之间的次级窗口过滤掉；

4.6 对过滤后的次级窗口进行游程检验计算出T2值，根据T2值将相邻两个T2值在-3-3之间的次级窗口合并为终极窗口；

4.7 重复步骤4.5-4.6，直至无法合并；

4.8 根据Z检验计算最终合并得到的终极窗口，计算得到微缺失微重复结果，共检出19个样本有微缺失微重复的结果。

表1 19个样本检出的结果

表1.表中说明了19个样本检出的结果，其中第一列是样本的id，第二列是发生微缺失微重复的染色体，第三列是染色体的微缺失微重复长度，第四列是检出的T值。

4.9 根据微缺失微重复的结果计算微缺失微重复片段的浓度，具体的步骤如下：

计算每个样本中含有微缺失微重复的初级窗口的平均深度d1；

计算不含微缺失微重复的初级窗口的平均深度d2；

计算微缺失微重复的片段的浓度fm；

计算胎儿核酸浓度。对以上19个结果的表格如下：

表2. 19个样本的胎儿核酸浓度信息

4.10 根据chrY的比例计算胎儿浓度，得到其中8个样本的男性胎儿浓度，具体的步骤如下：

去除染色体chrY中经GC修改调整后的唯一比对序列数目大于平均序列数目5倍以上的初级窗口；

计算chrY中初级窗口的平均深度dy；

计算男性胎儿核酸浓度fy，结果如下表：

表3. 19个样本由chrY估算的胎儿核酸浓度的结果

4.11 根据片段长度计算胎儿的浓度，得到11个样本的女性胎儿浓度，具体的步骤如下：

统计出整个批次中共有41个男性样本，找出频率与胎儿浓度相关性较强的区域，这里选出的区域为179bp-206bp，相关系数R＝-0.9056996。

确定剩余11个样本中长度范围在179bp-206bp里的核酸唯一比对测序序列出现的频率与游离的胎儿核酸浓度的函数关系，利用选出的区域179bp-206bp做线性拟合，得到关系式d＝a×p+b，公式中d代表浓度，p代表出现的频率，计算得到a，b分别为-0.3215和1.62562。

根据拟合计算女性胎儿样本的结果，得出的结果如下：

表4. 19个样本根据片段长度计算得到的胎儿核酸浓度

4.12 对微缺失微重复结果进行筛选。

对男性的胎儿：

计算微缺失微重复的片段的浓度fm与男性胎儿核酸浓度fy的比值rmY＝fm/fy；

根据拷贝数进行过滤，过滤缺失的拷贝数rmY值在2以上的片段，过滤重复的拷贝数rmY值在6以上的片段。

对rmY取小数部分得到dmY。

对剩余的片段，过滤dmY大于0.13并且小于0.85的片段。

计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY＝fm+fy；

过滤amY>0.95并且amY<1.05的片段，得到男性胎儿含有微缺失微重复的样本。

对女性的胎儿：

计算微缺失微重复的片段的浓度fm与女性胎儿核酸浓度fs的比值rms＝fm/fs；

根据拷贝数进行过滤，过滤缺失的拷贝数rms值在2以上的片段，过滤重复的拷贝数rms值在6以上的片段。

对rms取小数部分得到dms。

对剩余的片段，过滤dms大于0.15并且小于0.791的片段。

计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的和为ams＝fm+fs；

过滤ams>0.93并且ams<1.06的片段，得到女性胎儿含有微缺失微重复的样本。

得到阳性的结果如下表5：

表5.过滤后的微缺失微重复结果

样本	8
染色体
起始位置	19394465
终止位置	27194537
微缺失微重复的长度	7.80M
T值	5.030
微缺失微重复计算的浓度	0.119863
根据chrY计算得到的胎儿浓度
根据片段长度计算得到的胎儿浓度	0.126509

对微缺失微重复的结果经过以上的处理，能够过滤大量的假阳性，得到准确的结果，参见图15。图中横坐标表示样本的编号，纵坐标表示浓度，其中fm表示微缺失微重复估算出来的浓度，fy表示男胎样本根据chrY估算出来的浓度，fs表示女胎根据片段估算出来的浓度，可以看出，经过以上标准的判断，编号为28的样本为最终含有微重复结果的胎儿样本。

实施3

本实施例确定胎儿染色体中微缺失微重复的方法与实施例2相同，其不同之处在于，步骤4.2中按照40kb的窗口进行划分。

实施4

本实施例确定胎儿染色体中微缺失微重复的方法与实施例2相同，其不同之处在于，步骤4.4中以200个为单位进行合并，合并后得到的次级窗口的长度为4M。

实施5

本实施例确定胎儿染色体中微缺失微重复的方法与实施例2相同，其不同之处在于，步骤4.11中采用40个男性样本，选出的区域为185-204bp，相关系数R＝-0.87。

利用选出的区域185-204bp做线性拟合，得到关系式d＝a×p+b，公式中d代表浓度，p代表出现的频率，计算得到a，b分别为0.0334和1.6657。

以上实施方式仅用以说明本发明的技术方案而非限制，尽管参照以上较佳实施方式对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换都不应脱离本发明技术方案的精神和范围。

Claims

一种确定胎儿染色体中微缺失微重复的方法，其特征在于，包括以下步骤：

S1、获得含有微缺失微重复片段的浓度fm；

S2、获得男性胎儿核酸浓度fy或女性胎儿核酸浓度fs；

S3、计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的比值rmY＝fm/fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的比值rms＝fm/fs；

S4、根据缺失的拷贝数或重复的拷贝数计算rmY或rms，过滤掉假阳性；

S5、取rmY的小数部分dmY，或rms的小数部分dms，判断dmY或dms是否为阳性，否则过滤掉结果；

S6、计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY＝fm+fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的和为ams＝fm+fs；

S7、根据判定原则对微缺失微重复的片段进行过滤，过滤后得到胎儿染色体微缺失微重复片段。
根据权利要求1所述的方法，其特征在于，所述步骤S1中含有微缺失微重复片段的浓度fm通过如下步骤获得：

S11、根据含有微缺失微重复的初级窗口，获得不含微缺失微重复的初级窗口，计算含有微缺失微重复的初级窗口的总序列数和含有微缺失微重复的初级窗口的总数目，以及不含有微缺失微重复的初级窗口的总序列数和不含有微缺失微重复的初级窗口的总数目；

S12、获得含有微缺失微重复的初级窗口的平均深度d1，d1＝含有微缺失微重复的初级窗口的总序列数/含有微缺失微重复的初级窗口的数目；

S13、获得不含微缺失微重复的初级窗口的平均深度d2，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的总数目；

S14、计算含有微缺失微重复片段的浓度fm，fm＝2×︱d2-d1︱/d2。
根据权利要求2所述的方法，其特征在于，所述含有微缺失微重复的终极窗口通过以下步骤获得：

S111、对含有游离核酸的生物样本进行核酸测序，以便获得由多个测序数据构成的测序结果；

S112、将所述测序结果与参考基因组进行比对，以便构建唯一比对测序序列集，所述唯一比对测序序列集中的每一个测序序列仅能够与所述参考基因组的一个位置匹配；

S113、确定所述唯一比对测序序列集中各唯一比对测序序列的长度；

S114、按照预定长度将参考基因组划分为多个初级窗口，所述预定长度为1bp-5M；

S115、统计所述各唯一比对测序序列落入各个初级窗口的数目；

S116、对落入初级窗口中的序列数进行GC修正，以及对修正后的结果进行批次间调整；

S117、将预定数目个相邻的初级窗口合并为多个次级窗口，确定各个次级窗口中的序列数目；

S118、对各个次级窗口进行统计检验，计算出T1值，根据所述T1值过滤所述次级窗口；

S119、对过滤后的次级窗口进行统计检验，计算出T2值，根据所述T2值将相邻两个无显著性差异的次级窗口合并为终极窗口；

S120、重复步骤S118-S120，直至无法合并；

S121、对最终合并得到的终极窗口进行假设检验，获得含有微缺失微重复的终极窗口。
根据权利要求3所述的方法，其特征在于，所述步骤S114中的预定长度为1bp-5M，所述步骤S117中的预定数目为5-100个。
根据权利要求3所述的方法，其特征在于，所述步骤S118中T1值包括根据Z检验或T检验计算得到，所述过滤为将T1值在-3～3之间的次级窗口过滤掉。
根据权利要求3所述的方法，其特征在于，所述步骤S119中T2值包括根据秩和检验、符号检验或游程检验计算得到，所述无显著性差异为相邻两个窗口的T2值在-3-3之间。
根据权利要求3所述的方法，其特征在于，所述步骤S121中假设检验包括根据Z检验或T检验计算得到，即当检验的统计量>3或者<-3，判定为含有微缺失微重复的终极窗口。
根据权利要求1所述的方法，其特征在于，所述步骤S2中所述男性胎儿核酸浓度fy通过如下步骤获得：

S211、对含有游离核酸的生物样本进行测序，获得由多个测序数据构成的测序结果；

S212、根据所述测序结果，确定所述样品中的Y染色体中唯一比对测序序列落入初级窗口的数目；

S213、统计Y染色体上各初级窗口中唯一比对测序序列的数目总和以及所述初级窗口的总数目；

S214、获得Y染色体中初级窗口的平均深度dy，dy＝Y染色体上唯一比对测序序列数目总和/Y染色体上初级窗口的数目；

S215、获得男性胎儿核酸浓度fy，fy＝2×dy/d2，所述d2为不含微缺失微重复的初级窗口的平均深度，d2＝不含微缺失微重复的初级窗口的总序列数/不含微缺失微重复的初级窗口的数目。
根据权利要求1所述的方法，其特征在于，所述步骤S2中女性胎儿核酸浓度fs通过如下步骤获得：

S221、对含有游离核酸的生物样本进行测序，获得由多个测序数据构成的测序结果；

S222、根据所述测序结果，确定所述样品中长度落入预定范围的唯一比对测序序列的数目；

S223、基于所述长度落入预定范围的唯一比对测序序列的数目，确定在所述预定范围内出现唯一比对测序序列的频率；

S224、根据所述预定范围内出现唯一比对测序序列的频率，根据预定函数，确定所述样本中女性胎儿核酸浓度fs。
根据权利要求1所述的方法，其特征在于，所述步骤S4还包括：若根据所述缺失的拷贝数计算得到rmY≧2或所述重复的拷贝数计算得到rmY≧6，则判定为不可信，过滤掉假阳性结果；

或者，若根据所述缺失的拷贝数计算得到rms≧2或所述重复的拷贝数计算得到rms≧6，则判定为不可信，过滤掉假阳性结果。
根据权利要求1所述的方法，其特征在于，所述步骤S5还包括：若dmY<0.13或dmY>0.85，则dmY为阳性；

或者，若dms<0.15或dms>0.791，则dms为阳性。
根据权利要求1述的方法，其特征在于，所述步骤S7中的判定原则为：若amY在0.95-1.05之间，则认为所述微缺失微重复的片段来自于母亲，过滤所述微缺失微重复的片段；

或者，若ams在0.93-1.06之间，则认为所述微缺失微重复的片段来自于母亲，过滤所述微缺失微重复的片段。
一种确定胎儿染色体中微缺失微重复的设备，其特征在于，包括：

微缺失微重复片段浓度计算装置，用于获得含有微缺失微重复片段的浓度fm；

胎儿核酸浓度获得装置，用于获得男性胎儿核酸浓度fy或女性胎儿核酸浓度fs；

比值计算装置，用于计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的比值rmY＝fm/fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的比值rms＝fm/fs；

第一过滤装置，用于根据缺失的拷贝数或重复的拷贝数计算rmY或rms，过滤掉假阳性；

第二过滤装置，用于取rmY的小数部分dmY，或rms的小数部分dms，判断dmY或dms是否为阳性，否则过滤掉结果；

和值计算装置，用于计算含有微缺失微重复片段的浓度fm与男性胎儿核酸浓度fy的和为amY＝fm+fy，或计算含有微缺失微重复片段的浓度fm与女性胎儿核酸浓度fs的和为ams＝fm+fs；

第三过滤装置，用于根据判定原则对微缺失微重复片段进行过滤，过滤后得到胎儿染色体微缺失微重复片段。