[go: up one dir, main page]

CN116721698A - 染色体核型的预测系统、构建方法、装置、设备及存储介质 - Google Patents

染色体核型的预测系统、构建方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116721698A
CN116721698A CN202310778877.2A CN202310778877A CN116721698A CN 116721698 A CN116721698 A CN 116721698A CN 202310778877 A CN202310778877 A CN 202310778877A CN 116721698 A CN116721698 A CN 116721698A
Authority
CN
China
Prior art keywords
karyotype
prediction system
blastula
chromosome
aneuploidy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310778877.2A
Other languages
English (en)
Inventor
林戈
王声鹏
冷丽智
商周春
顾亦凡
刘龙奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Reproductive and Genetic Hospital of CITIC Xiangya Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Reproductive and Genetic Hospital of CITIC Xiangya Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd, Reproductive and Genetic Hospital of CITIC Xiangya Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN202310778877.2A priority Critical patent/CN116721698A/zh
Publication of CN116721698A publication Critical patent/CN116721698A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种染色体核型的预测系统、构建方法、装置、设备及存储介质。所述染色体核型的预测系统的构建方法,包括如下步骤:获取覆盖目标生物全部类型的非整倍体核型囊胚单细胞的转录组数据;将各类非整倍体核型囊胚单细胞的转录组数据分别与二倍体囊胚单细胞的转录组数据进行基因表达差异分析,获取各类非整倍体核型的差异表达基因集;对每个囊胚单细胞分别根据各类非整倍体核型对应的所述差异表达基因集的表达水平进行打分,生成得分矩阵;及基于所述得分矩阵利用分类器构建所述染色体拷贝数变异的预测系统。基于上述构建方法构建的预测系统,用于预测单细胞的染色体核型时具有高精确度、高灵敏度等优点。

Description

染色体核型的预测系统、构建方法、装置、设备及存储介质
技术领域
本发明涉及生物技术领域,特别是涉及一种染色体核型的预测系统、构建方法、装置、设备及存储介质。
背景技术
染色体拷贝数变异是指染色体数目发生变异,即在正常染色体数目的(46条)基础上,某些染色体的数目增加或减少了一条或多条。这种变异可能涉及到单个染色体或多个染色体,也可能涉及到整个染色体组。染色体拷贝数变异是最常见的人类染色体异常,也是导致人类疾病的重要原因之一。染色体非整倍体胚胎在临床中发生率极高,由此造成了极高的流产率和新生儿出生缺陷,是辅助生殖领域面临的一大问题。
非整倍体的检测是产前基因检测中的一个重要内容,可以帮助孕妇了解胎儿是否存在染色体异常,从而进行相应的干预和治疗。目前,非整倍体的检测主要依靠基因芯片、测序等技术。胚胎着床前染色体筛检(Preimplantation Genetic Testing forAneuploidy,PGT-A)是一种用于检测胚胎染色体异常的技术,可以检测胚胎是否存在非整倍体、染色体缺失或重复等异常。该技术主要通过取出胚胎的一部分细胞进行基因检测,然后选择染色体正常的胚胎进行移植,从而提高移植胚胎的着床率和妊娠率。PGT-A技术虽然具有很高的准确性和可靠性,但仍然存在一些局限性:在进行PGT-A检测前,需要对检测的风险和局限性进行充分的了解和评估,以便做出正确的决策。
基于二代测序技术平台开发的单细胞转录组测序技术问世以来,高通量单细胞测序技术得到迅速发展,使得能够在单个细胞中分析基因组、转录组及表观基因组等多组学特征。目前,单细胞测序技术已经被广泛应用于生殖医学、肿瘤学、神经科学等领域的研究中,成为生命科学领域的研究热点之一。单细胞转录组CNV(copy number variation,拷贝数变异)分析是一种用于检测单个细胞转录组和染色体拷贝数变异的技术。该技术主要应用于早期胚胎的基因检测和肿瘤细胞的分析,可以帮助研究人员了解单个细胞的基因表达和基因组结构,从而深入研究疾病的发生和发展机制。目前基于单细胞转录组进行CNV分析的方法大多是基于统计模型结合基因的表达水平、位置及SNP(single nucleotidepolymorphism,单核苷酸多态性)信息等特征来推断细胞的染色体拷贝数变异,如inferCNV,Numbat,CopyKAT等。然而单细胞转录具有较强的异质性,存在较强的背景噪音,无法精确的区分出每个细胞的染色体核型,尤其在早期胚胎发育过程,受细胞数量影响,单细胞转录的检测灵敏度显著降低。
因此,丞需对染色体核型的预测方法进行改进。
发明内容
基于此,本发明提供了一种准确度高、灵敏度高、应用范围广的染色体核型的预测系统、构建方法、装置、设备及存储介质。
具体技术方案如下:
根据本发明的一个方面,提供了一种染色体核型的预测系统的构建方法,包括如下步骤:
获取覆盖目标生物全部类型的非整倍体核型囊胚单细胞的转录组数据;
将各类非整倍体核型囊胚单细胞的转录组数据分别与二倍体囊胚单细胞的转录组数据进行基因表达差异分析,获取各类非整倍体核型的差异表达基因集;
对每个囊胚单细胞分别根据各类非整倍体核型对应的所述差异表达基因集的表达水平进行打分,生成每种非整倍体核型的得分矩阵;及
基于所述得分矩阵利用分类器构建所述染色体核型的预测系统。
在其中一个实施例中,所述非整倍体核型囊胚单细胞的筛选方法包括以下步骤:
获取PGT-A鉴定核型为非整倍体的胚胎的囊胚单细胞;
采用inferCNV分析每个囊胚单细胞的核型;
筛选出inferCNV分析与PGT-A鉴定核型一致的囊胚单细胞。
在其中一个实施例中,采用差异分析函数分别对各类非整倍体核型囊胚单细胞的转录组数据和二倍体囊胚单细胞的转录组数据进行处理,计算每个基因在非整倍体核型囊胚单细胞中相对于二倍体囊胚单细胞的组间表达差异显著性,将满足预设标准的基因判定为差异表达基因;
所述差异分析函数为glmer.nb、edgeR或FindMarkers。
在其中一个实施例中,还包括以下步骤:
通过p.adjust函数采用Benjamini-Hochberg方法对所述组间表达差异显著性的P值进行校正;所述预设标准为:adjustP<0.05且|logFC|>0.25;
其中,在单体核型中logFC<-0.25,在三体核型中logFC>0.25。
在其中一个实施例中,通过Seurat的AddModuleScore函数对每个囊胚单细胞分别根据各类非整倍体核型对应的所述差异表达基因集的表达水平进行打分,生成所述得分矩阵。
在其中一个实施例中,所述分类器为随机森林分类器;
所述随机森林分类器中,所述得分矩阵作为输入特征矩阵,囊胚单细胞的染色体核型作为输出标签向量,ntree参数为200,importance参数和proximity参数均为TRUE。
一种染色体核型的预测系统,采用上述的构建方法构建得到。
一种用于构建染色体核型的预测系统的装置,包括:
数据获取模块,用于获取覆盖目标生物全部类型的非整倍体核型囊胚单细胞的转录组数据;
比较分析模块,用于将各类非整倍体核型囊胚单细胞的转录组数据分别与二倍体囊胚单细胞的转录组数据进行比较分析,获取各类非整倍体核型的差异表达基因集;
打分模块,用于对每个囊胚单细胞分别根据各类非整倍体核型对应的差异表达基因集的表达水平进行打分,生成得分矩阵;
输出预测模块,用于根据得分矩阵输出预测每个囊胚单细胞的染色体核型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的构建方法的步骤。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的构建方法的步骤。
与传统技术相比,本发明具有如下有益效果:
一方面,采用本发明的构建方法构建的染色体核型的预测系统,可以有效地降低因转录异质性造成的背景噪音对染色体核型的鉴定的干扰,并能够极大地提高检测的准确性,测试准确率达到97.1%。另一方面,本发明的构建方法基于单个细胞的每条染色体的全部染色体核型,筛选出非整倍体核型上受剂量影响的差异表达基因集,该基因集更能反映细胞发生染色体拷贝数变异后对特定染色体上基因表达的影响。
此外,本发明的预测系统可以用于预测单个细胞的染色体核型,具有较高的灵敏性。上述预测系统在早期人胚胎发育过程中的染色体核型鉴定等方面具有广泛的应用前景。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为实施例1中单细胞转录组数据获取的步骤示意图;
图2为非整倍体核型中发生拷贝数变化的染色体上剂量效应基因的分布示意图;
图3为基于差异表达数据集(剂量效应基因集)生成的得分矩阵示意图;
图4为实施例1的预测系统对测试集数据的预测结果示意图;
图5为实施例1中对囊胚胚胎的预测结果示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。除非另有特别说明,本发明中用到的各种原材料、试剂、仪器和设备等均可通过市场购买得到或者可通过现有方法制备得到。
本发明的一些实施方式提供了一种染色体核型的预测系统的构建方法。
在其中一些实施方式中,上述染色体核型的预测系统的构建方法,包括步骤S10~S40。
S10:获取覆盖目标生物全部类型的非整倍体核型囊胚单细胞的转录组数据;
S20:将各类非整倍体核型囊胚单细胞的转录组数据分别与二倍体囊胚单细胞的转录组数据进行基因表达差异分析,获取各类非整倍体核型的差异表达基因集;
S30:对每个囊胚单细胞分别根据各类非整倍体核型对应的差异表达基因集的表达水平进行打分,生成每种非整倍体核型的得分矩阵;及
S40:基于得分矩阵利用分类器构建染色体核型的预测系统。
采用上述构建方法构建的染色体核型的预测系统,基于确定核型的单细胞转录组数据筛选出差异表达基因集(cis-DEGs),可以有效地降低因转录异质性造成的背景噪音对染色体核型的鉴定的干扰,提高检测的准确性。此外,上述的构建方法是基于单个细胞的1~22号染色体的全部染色体核型,筛选出非整倍体核型上受剂量影响的差异表达基因集,该基因集更能反映细胞发生染色体拷贝数变异后对特定染色体上基因表达的影响。
差异表达基因集(cis Dosage effected genes,cis-DEGs)指在拷贝数变异染色体上的基因,相对二倍体细胞差异表达且变化倍数跟染色体拷贝数成正比。
为了去除数据可能产生的噪音干扰,通过对数据充分分析,筛选出各核型中最具代表性的差异表达基因集(cis-DEGs),并采用打分策略对每个细胞中各核型对应的cis-DEGs的表达特征进行打分,生成得分矩阵;得分矩阵相对基因表达矩阵具有更显著的特征,能够提高模型的预测效果。
可理解地,步骤S10中获取的囊胚单细胞的转录组数据覆盖了目标生物的全部染色体的全部非整倍体核型,该转录组数据覆盖面广、精确度高,基于此进行染色体核型的精准预测,提高了非整倍体检测的准确性和灵敏度。
在其中一些实施方式中,步骤S10中,非整倍体核型囊胚单细胞的筛选方法包括以下步骤:
获取PGT-A鉴定核型为非整倍体的胚胎的囊胚单细胞;
采用inferCNV分析每个囊胚单细胞的核型;
筛选出inferCNV分析与PGT-A鉴定核型一致的囊胚单细胞。
通过PGT-A和inferCNV分析,对用于构建预测系统的囊胚单细胞的染色体核型进行双重验证,进一步分析揭示各染色体拷贝数变异所引起的细胞基因表达变化的典型特征,提取这些特征用于训练并构建预测系统。通过精确的细胞染色体核型以及大量的单细胞转录组数据筛选出典型的差异表达基因集,结合机器学习的策略从而能够高效、精准地预测出细胞的染色体核型。
可理解地,上述的囊胚单细胞是从未经过体内发育的受精14天以内的人类或动物胚胎分离或者获取的。或者,上述的囊胚单细胞还可以是从未经过体内发育的受精14天以内的已经死亡的人类或动物胚胎分离或者获取的。
在其中一些实施方式中,步骤S20中,采用差异分析函数分别对各类非整倍体核型囊胚单细胞的转录组数据和二倍体囊胚单细胞的转录组数据进行处理,计算每个基因在非整倍体核型囊胚单细胞中相对于二倍体囊胚单细胞的组间表达差异显著性,将满足预设标准的基因判定为差异表达基因。
在其中一些具体示例中,差异分析函数为glmer.nb、edgeR或FindMarkers。
在其中一些实施方式中,步骤S20中,还包括以下步骤:
通过p.adjust函数采用Benjamini-Hochberg方法对表达组间差异显著性的P值进行校正;预设标准为:adjustP<0.05且|logFC|>0.25。
在其中一些具体示例中,步骤S20中,预设标准为:adjustP<0.05,且在单体核型中logFC<-0.25,在三体核型中logFC>0.25。
在其中一些实施方式中,可以通过提高预设标准的数值,筛选出更加特异的基因构成差异表达基因集。
在其中一些实施方式中,步骤S30中,通过Seurat的AddModuleScore函数对每个囊胚单细胞分别根据各类非整倍体核型对应的差异表达基因集的表达水平进行打分,生成得分矩阵。
采用Seurat包中的AddModuleScore函数考虑了差异表达基因的综合表达权重,使得最终构建的预测系统更加合理可靠。
在其中一些实施方式中,步骤S40中,分类器为随机森林分类器。
在其中一些实施方式中,步骤S40中,在随机森林分类器中,将得分矩阵作为输入特征矩阵,囊胚单细胞的染色体核型作为输出标签向量,ntree参数为200,importance参数和proximity参数均为TRUE。
在其中一些实施方式中,步骤S40中,在随机森林分类器中,将差异表达基因集的表达矩阵作为输入特征矩阵。
可理解地,还可以选择其他分类模型进行训练,同样可达到较好的预测效果。
上述的染色体核型的预测系统的构建方法至少具有如下优点:
(1)精确度和灵敏度高:结合PGT-A和inferCNV分析方法,能够从多个维度充分评估胚胎细胞的染色体核型,并锁定在发生拷贝数变异的染色体上受染色体剂量效应影响的差异表达基因集;基于该差异表达基因集构建的预测系统具有更高的精度和灵敏度;
(2)检测能力更全面:该构建方法的转录组数据覆盖了1~22号染色体及性染色体的三体和单体,能够全面检测胚胎细胞的染色体核型,检测能力更加全面。
本发明的另一些实施方式提供了一种采用上述任一实施方式的构建方法构建得到的染色体核型的预测系统。
上述的染色体核型的预测系统具有较高的准确性和可靠性,在产前基因检测、生殖医学、肿瘤学等领域都有广泛的应用前景。在产前基因检测领域,该预测系统可以用于检测胚胎染色体异常,帮助孕妇了解胎儿是否存在染色体异常,从而进行相应的干预和治疗。在生殖医学领域,该预测系统可以用于筛选出染色体正常的胚胎进行移植,提高移植胚胎的着床率和妊娠率。在肿瘤学领域,该预测系统可以用于分析肿瘤细胞的染色体拷贝数变异,从而为肿瘤的治疗提供有力的依据。
基于与上述方法相同的构思,本发明的另一些实施方式还提供了一种用于构建染色体核型的预测系统的装置,包括:
数据获取模块,用于获取覆盖目标生物全部类型的非整倍体核型囊胚单细胞的转录组数据;
比较分析模块,用于将各类非整倍体核型囊胚单细胞的转录组数据分别与二倍体囊胚单细胞的转录组数据进行比较分析,获取各类非整倍体核型的差异表达基因集;
打分模块,用于对每个囊胚单细胞分别根据各类非整倍体核型对应的差异表达基因集的表达水平进行打分,生成得分矩阵;
输出预测模块,用于根据得分矩阵输出预测每个囊胚单细胞的染色体核型。
在其中一些实施方式中,数据获取模块包括第一核型鉴定单元、第二核型鉴定单元和筛选单元。
在其中一些具体示例中,第一核型鉴定单元用于获取PGT-A鉴定核型为非整倍体的胚胎的囊胚单细胞。
在其中一些具体示例中,第二核型鉴定单元用于通过inferCNV分析每个囊胚单细胞的核型。
在其中一些具体示例中,筛选单元用于筛选出inferCNV分析与PGT-A鉴定核型一致的囊胚单细胞。
本发明的另一些实施方式还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任一实施方式的构建方法的步骤。
本领域普通技术人员可以理解实现上述方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
本发明的另一些实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述任一实施方式的构建方法的步骤。
下面将结合具体实施例和对比例对本发明作进一步说明,但不应将其理解为对本发明保护范围的限制。
实施例1:
(1)构建覆盖人体全部染色体(包括1~22号染色体以及性染色体)的单体和三体的囊胚单细胞转录图谱,参阅图1:
1.1对供试胚胎(8930个单体细胞、5521个三体细胞以及1508个二倍体细胞)细胞进行PGT-A检测,确定每个胚胎细胞的染色体核型。
1.2利用smart-seq2单细胞全长转录组测序技术对每个胚胎细胞进行建库并测序获取转录组数据。
1.3对获取的所有细胞数据进行质控,标准化(TPM),并利用seurat软件进行降维聚类;进一步采用inferCNV软件进行分析,推测出每个细胞的染色体核型,并筛选出与PGT-A检测结果一致的细胞,最终筛选出覆盖1~22号染色体及性染色体的单体和三体在内的11225个胚胎细胞。
本实施例的单细胞图谱数据具有高覆盖度、高精确度等特征,能够为预测系统的构建提供精确的数据支撑。
(2)对每条染色体的单体、三体以及二倍体细胞采用lmerTest包中的glmer.nb函数拟合负二项分布的广义线性混合效应模型(GLMM),统计每个基因在非整倍体细胞中相对二倍体细胞的组间表达差异显著性,并使用p.adjust函数采用Benjamini-Hochberg方法对P值进行校正。最终定义在两组间的|logFC|>0.25且adjust P<0.05的基因为差异表达基因,筛选得到在非整倍体染色体上受剂量影响的基因。进一步,筛选出在各条染色体的单体中logFC<-0.25的特征基因,在各条染色体的三体中logFC>0.25的基因为差异表达基因,将筛选到的各染色体剂量效应影响的差异表达基因构成差异表达基因集(cis-DEGs)。
图2为各个染色体的非整倍体核型中发生拷贝数变化染色体上差异表达基因的logFC结果分布图。
(3)根据筛选到的差异表达基因集(cis-DEGs),采用Seurat的AddModuleScore函数对每个细胞的基因表达水平进行打分,计算每个染色体的单体和三体的CNV得分矩阵;1~22号染色体的三体和单体的得分情况如图3所示。
上述结果表明:各非整倍体细胞在1~22号染色体的三体和单体类型得分能够较好的反映细胞的染色体拷贝数变异特征,二倍体细胞在所有非整倍体类型得分都较均一,而特定染色体的三体则在对应染色体的三体和单体得分都相对较高,特定染色体的单体则在对应染色体的三体和单体得分都相对较低。
(4)基于步骤(3)的得分矩阵,采用R软件中的randomForest包构建随机森林分类器模型。首先,将供试细胞按照8:2的比例随机分成两组,80%的细胞作为训练集数据,20%的细胞作为测试集数据。利用randomForest函数对训练集数据进行构建预测系统,其中,将各非整倍体的得分矩阵作为输入特征矩阵,而细胞的染色体核型作为输出标签向量,随机森林中树的数量ntree参数为200,importance参数和proximity参数为TRUE。
(5)完成模型训练后使用测试数据对模型进行评估。采用predict函数对测试数据的染色体核型进行评估,将步骤(4)中训练好的模型作为输入随机森林模型,测试集数据细胞在非整倍体的得分矩阵作为输入特征矩阵。基于测试细胞的实际染色体核型和本模型预测的细胞染色体核型,统计预测系统的准确率。采用pROC包中的multiclass.roc函数来统计ROC曲线并计算模型的AUC值来指征模型的分类效果。
利用步骤(3)构建的预测系统对测试集数据细胞的染色体核型进行预测,结果如图4所示,模型预测准确性达到97.1%,AUC值达到0.97,充分说明该预测系统的预测结果具有较高的可信度。
进一步地,使用步骤(3)构建的预测系统对一个体外培养到第8天的囊胚胚胎(PGT-A检测为4M,共63个细胞)进行预测,结果如图5所示,其中有60个细胞被预测为4M,仅有三个细胞被错误预测为1T,3T和7T,整体的预测准确性高达95.23%。上述结果表明本发明的预测系统对于预测其他时间段的早期胚胎的细胞核型同样具有较好的效果。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种染色体核型的预测系统的构建方法,其特征在于,包括如下步骤:
获取覆盖目标生物全部类型的非整倍体核型囊胚单细胞的转录组数据;
将各类非整倍体核型囊胚单细胞的转录组数据分别与二倍体囊胚单细胞的转录组数据进行基因表达差异分析,获取各类非整倍体核型的差异表达基因集;
对每个囊胚单细胞分别根据各类非整倍体核型对应的所述差异表达基因集的表达水平进行打分,生成每种非整倍体核型的得分矩阵;及
基于所述得分矩阵利用分类器构建所述染色体核型的预测系统。
2.根据权利要求1所述的染色体核型的预测系统的构建方法,其特征在于,所述非整倍体核型囊胚单细胞的筛选方法包括以下步骤:
获取PGT-A鉴定核型为非整倍体的胚胎的囊胚单细胞;
采用inferCNV分析每个囊胚单细胞的核型;
筛选出inferCNV分析与PGT-A鉴定核型一致的囊胚单细胞。
3.根据权利要求1所述的染色体核型的预测系统的构建方法,其特征在于,采用差异分析函数分别对各类非整倍体核型囊胚单细胞的转录组数据和二倍体囊胚单细胞的转录组数据进行处理,计算每个基因在非整倍体核型囊胚单细胞中相对于二倍体囊胚单细胞的组间表达差异显著性,将满足预设标准的基因判定为差异表达基因;
所述差异分析函数为glmer.nb、edgeR或FindMarkers。
4.根据权利要求3所述的染色体核型的预测系统的构建方法,其特征在于,还包括以下步骤:
通过p.adjust函数采用Benjamini-Hochberg方法对所述组间表达差异显著性的P值进行校正;所述预设标准为:adjust P<0.05且|logFC|>0.25;
其中,在单体核型中logFC<-0.25,在三体核型中logFC>0.25。
5.根据权利要求1~4任一项所述的染色体核型的预测系统的构建方法,其特征在于,通过Seurat的AddModuleScore函数对每个囊胚单细胞分别根据各类非整倍体核型对应的所述差异表达基因集的表达水平进行打分,生成所述得分矩阵。
6.根据权利要求1~4任一项所述的染色体核型的预测系统的构建方法,其特征在于,所述分类器为随机森林分离器;
所述随机森林分类器中,所述得分矩阵作为输入特征矩阵,囊胚单细胞的染色体核型作为输出标签向量,ntree参数为200,importance参数和proximity参数均为TRUE。
7.一种染色体核型的预测系统,其特征在于,采用权利要求1~6任一项所述的构建方法构建得到。
8.一种用于构建染色体核型的预测系统的装置,其特征在于,包括:
数据获取模块,用于获取覆盖目标生物全部类型的非整倍体核型囊胚单细胞的转录组数据;
比较分析模块,用于将各类非整倍体核型囊胚单细胞的转录组数据分别与二倍体囊胚单细胞的转录组数据进行比较分析,获取各类非整倍体核型的差异表达基因集;
打分模块,用于对每个囊胚单细胞分别根据各类非整倍体核型对应的所述差异表达基因集的表达水平进行打分,生成得分矩阵;
输出预测模块,用于根据所述得分矩阵输出预测每个囊胚单细胞的染色体核型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~6任一项所述的构建方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~6任一项所述的构建方法的步骤。
CN202310778877.2A 2023-06-29 2023-06-29 染色体核型的预测系统、构建方法、装置、设备及存储介质 Pending CN116721698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310778877.2A CN116721698A (zh) 2023-06-29 2023-06-29 染色体核型的预测系统、构建方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310778877.2A CN116721698A (zh) 2023-06-29 2023-06-29 染色体核型的预测系统、构建方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116721698A true CN116721698A (zh) 2023-09-08

Family

ID=87865963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310778877.2A Pending CN116721698A (zh) 2023-06-29 2023-06-29 染色体核型的预测系统、构建方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116721698A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117237324A (zh) * 2023-10-09 2023-12-15 苏州博致医疗科技有限公司 一种非侵入式整倍体预测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100160717A1 (en) * 2008-10-03 2010-06-24 Scott Jr Richard T In vitro fertilization
US20140242581A1 (en) * 2013-01-23 2014-08-28 Reproductive Genetics And Technology Solutions, Llc Compositions and methods for genetic analysis of embryos
CN109979538A (zh) * 2019-03-28 2019-07-05 广州基迪奥生物科技有限公司 一种基于10x单细胞转录组测序数据的分析方法
US20200109438A1 (en) * 2018-10-05 2020-04-09 University Of South Carolina Implantation Success as Determined by Blastocoel Fluid Components
CN112582022A (zh) * 2020-07-21 2021-03-30 序康医疗科技(苏州)有限公司 用于无创胚胎移植优先级评级的系统和方法
CN113403370A (zh) * 2021-07-12 2021-09-17 福建省妇幼保健院 染色体平衡易位患者的囊胚发育潜能评估方法
WO2022188785A1 (zh) * 2021-03-08 2022-09-15 中国科学院上海营养与健康研究所 融合深度学习模型的单细胞转录组计算分析方法和系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100160717A1 (en) * 2008-10-03 2010-06-24 Scott Jr Richard T In vitro fertilization
US20140242581A1 (en) * 2013-01-23 2014-08-28 Reproductive Genetics And Technology Solutions, Llc Compositions and methods for genetic analysis of embryos
US20200109438A1 (en) * 2018-10-05 2020-04-09 University Of South Carolina Implantation Success as Determined by Blastocoel Fluid Components
CN109979538A (zh) * 2019-03-28 2019-07-05 广州基迪奥生物科技有限公司 一种基于10x单细胞转录组测序数据的分析方法
CN112582022A (zh) * 2020-07-21 2021-03-30 序康医疗科技(苏州)有限公司 用于无创胚胎移植优先级评级的系统和方法
WO2022017414A1 (zh) * 2020-07-21 2022-01-27 序康医疗科技(苏州)有限公司 用于无创胚胎移植优先级评级的系统和方法
WO2022188785A1 (zh) * 2021-03-08 2022-09-15 中国科学院上海营养与健康研究所 融合深度学习模型的单细胞转录组计算分析方法和系统
CN113403370A (zh) * 2021-07-12 2021-09-17 福建省妇幼保健院 染色体平衡易位患者的囊胚发育潜能评估方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117237324A (zh) * 2023-10-09 2023-12-15 苏州博致医疗科技有限公司 一种非侵入式整倍体预测方法及系统
CN117237324B (zh) * 2023-10-09 2024-03-29 苏州博致医疗科技有限公司 一种非侵入式整倍体预测方法及系统

Similar Documents

Publication Publication Date Title
ENCODE Project Consortium Abascal Federico 95 Acosta Reyes 5 Addleman Nicholas J. 3 Adrian Jessika 3 Afzal Veena 17 Ai Rizi 118 Aken Bronwen 100 Akiyama Jennifer A. 17 Jammal Omar Al 116 Amrhein Henry 14 Anderson Stacie M. 58 Andrews Gregory R. 1 Antoshechkin Igor 14 Ardlie Kristin G. 2 Armstrong Joel 101 Astley Matthew 95 Banerjee Budhaditya 88 Barkal Amira A. 87 Barnes If HA 100 Barozzi Iros 17 Barrell Daniel 100 Barson Gemma 95 Bates Daniel 5 Baymuradov Ulugbek K. 3 Bazile Cassandra 31 Beer Michael A. 98 99 Beik Samantha 2 Bender MA 78 Bennett Ruth 100 Bouvrette Louis Philip Benoit 19 20 21 Bernstein Bradley E. 42 Berry Andrew 100 Bhaskar Anand 3 Bignell Alexandra 100 Blue Steven M. 7 Bodine David M. 58 Boix Carles 35 Boley Nathan 3 Borrman Tyler 1 Borsari Beatrice 38 Boyle Alan P. 64 65 Brandsmeier Laurel A. 13 Breschi Alessandra 38 Bresnick Emery H. 94 Brooks Jason A. 1 Buckley Michael 5 Burge Christopher B. 31 Byron Rachel 78 Cahill Eileen 116 Cai Lingling 43 Cao Lulu 3 Carty Mark 96 Castanon Rosa G. 12 Castillo Andres 5 Chaib Hassan 3 Chan Esther T. 3 Chee Daniel R. 5 Chee Sora 10 Chen Hao 1 44 Chen Huaming 12 Chen Jia-Yu 56 Chen Songjie 3 Cherry J. Michael 3 Chhetri Surya B. 13 25 Choudhary Jyoti S. 108 Chrast Jacqueline 102 Chung Dongjun 93 Clarke Declan 24 Cody Neal AL 19 20 21 Coppola Candice J. 13 25 Coursen Julie 116 D’Ippolito Anthony M. 60 Dalton Stephen 110 Danyko Cassidy 4 Davidson Claire 100 Davila-Velderrain Jose 35 Davis Carrie A. 4 Dekker Job 32 Deran Alden 101 DeSalvo Gilberto 14 Despacio-Reyes Gloria 95 Dewey Colin N. 90 Dickel Diane E. 17 Diegel Morgan 5 Diekhans Mark 101 Dileep Vishnu 22 Ding Bo 61 Djebali Sarah 38 51 Dobin Alexander 4 Dominguez Daniel 31 Donaldson Sarah 100 Drenkow Jorg 53 Dreszer Timothy R. 3 Drier Yotam 45 Duff Michael O. 18 Dunn Douglass 5 Eastman Catharine 66 Ecker Joseph R. 12 34 Edwards Matthew D. 35 El-Ali Nicole 15 Elhajjajy Shaimae I. 1 Elkins Keri 7 Emili Andrew 67 Epstein Charles B. 2 Evans Rachel C. 13 Ezkurdia Iakes 103 Fan Kaili 1 Farnham Peggy J. 39 Farrell Nina P. 2 Feingold Elise A. 116 Ferreira Anne-Maud 102 Fisher-Aylor Katherine 14 Fitzgerald Stephen 95 Flicek Paul 100 Foo Chuan Sheng 80 Fortier Kevin 1 Frankish Adam 100 Freese Peter 8 Fu Shaliu 43 Fu Xiang-Dong 56 Fu Yu 1 79 Fukuda-Yuzawa Yoko 17 Fulciniti Mariateresa 46 Funnell Alister PW 5 Gabdank Idan 3 Galeev Timur 24 Gao Mingshi 1 Giron Carlos Garcia 100 Garvin Tyler H. 17 Gelboin-Burkhart Chelsea Anne 7 Georgolopoulos Grigorios 5 Gerstein Mark B. 24 Giardine Belinda M. 16 Gifford David K. 35 Gilbert David M. 22 Gilchrist Daniel A. 116 Gillespie Shawn 45 Gingeras Thomas R. 4 Gong Peng 26 Gonzalez Alvaro 96 Gonzalez Jose M. 100 Good Peter 117 Goren Alon 2 Gorkin David U. 9 10 Graveley Brenton R. 18 Gray Michael 95 Greenblatt Jack F. 67 74 Griffiths Ed 95 Groudine Mark T. 78 Grubert Fabian 3 Gu Mengting 24 Guigó Roderic 38 Guo Hongbo 67 Guo Yu 39 Guo Yuchun 35 Gursoy Gamze 24 Gutierrez-Arcelus Maria 88 Halow Jessica 5 Hardison Ross C. 16 Hardy Matthew 100 Hariharan Manoj 12 Harmanci Arif 24 Harrington Anne 17 Harrow Jennifer L. 107 Hashimoto Tatsunori B. 35 Hasz Richard D. 111 Hatan Meital 2 Haugen Eric 5 Hayes James E. 36 He Peng 14 He Yupeng 12 Heidari Nastaran 3 68 Hendrickson David 2 Heuston Elisabeth F. 58 Hilton Jason A. 3 Hitz Benjamin C. 3 Hochman Abigail 31 Holgren Cory 27 Hou Lei 35 Hou Shuyu 43 Hsiao Yun-Hua E. 97 Hsu Shanna 2 Huang Hui 10 Hubbard Tim J. 106 Huey Jack 1 Hughes Timothy R. 67 76 Hunt Toby 100 Ibarrientos Sean 5 Issner Robbyn 2 Iwata Mineo 5 Izuogu Osagie 100 Jaakkola Tommi 35 Jameel Nader 27 Jansen Camden 15 Jiang Lixia 3 Jiang Peng 82 83 Johnson Audra 5 Johnson Rory 38 54 Jungreis Irwin 2 35 Kadaba Madhura 27 Kasowski Maya 3 Kasparian Mary 27 Kato Momoe 17 Kaul Rajinder 5 6 Kawli Trupti 3 Kay Michael 100 Keen Judith C. 112 Keles Sunduz 89 90 Keller Cheryl A. 16 Kelley David 49 Kellis Manolis 2 35 Kheradpour Pouya 35 Kim Daniel Sunwook 3 Kirilusha Anthony 14 Klein Robert J. 36 Knoechel Birgit 46 48 Kuan Samantha 10 Kulik Michael J. 109 Kumar Sushant 24 Kundaje Anshul 3 Kutyavin Tanya 5 Lagarde Julien 38 Lajoie Bryan R. 32 Lambert Nicole J. 31 Lazar John 5 Lee Ah Young 10 Lee Donghoon 24 Lee Elizabeth 17 Lee Jin Wook 3 Lee Kristen 5 Leslie Christina S. 96 Levy Shawn 13 Li Bin 10 Li Hairi 56 Li Nan 61 Li Shantao 119 Li Xiangrui 43 Li Yang I. 3 Li Ying 43 Li Yining 3 Li Yue 35 Lian Jin 26 Libbrecht Maxwell W. 81 Lin Shin 3 Lin Yiing 69 Liu Dianbo 35 Liu Jason 24 Liu Peng 90 Liu Tingting 63 Liu X. Shirley 82 83 Liu Yan 43 Liu Yaping 35 Long Maria 16 Lou Shaoke 24 Loveland Jane 100 Lu Aiping 43 Lu Yuheng 96 Lécuyer Eric 19 20 21 Ma Lijia 27 Mackiewicz Mark 13 Mannion Brandon J. 17 Mannstadt Michael 45 Manthravadi Deepa 95 Marinov Georgi K. 14 Martin Fergal J. 100 Mattei Eugenio 1 McCue Kenneth 14 McEown Megan 13 McVicker Graham 12 Meadows Sarah K. 13 Meissner Alex 50 Mendenhall Eric M. 13 25 Messer Christopher L. 13 Meuleman Wouter 5 Meyer Clifford 82 83 Miller Steve 95 Milton Matthew G. 27 Mishra Tejaswini 3 Moore Dianna E. 13 Moore Helen M. 113 Moore Jill E. 1 Moore Samuel H. 116 Moran Jennifer 27 Mortazavi Ali 15 Mudge Jonathan M. 100 Munshi Nikhil 46 Murad Rabi 15 Myers Richard M. 13 Nandakumar Vivek 5 Nandi Preetha 116 Narasimha Anil M. 3 Narayanan Aditi K. 3 Naughton Hannah 116 Navarro Fabio CP 24 Navas Patrick 5 Nazarovs Jurijs 89 Nelson Jemma 5 Neph Shane 5 Neri Fidencio Jun 5 Nery Joseph R. 12 Nesmith Amy R. 13 Newberry J. Scott 13 Newberry Kimberly M. 13 Ngo Vu 61 Nguyen Rosy 13 Nguyen Thai B. 7 Nguyen Tung 61 Nishida Andrew 5 Noble William S. 37 Novak Catherine S. 17 Novoa Eva Maria 35 Nuñez Briana 116 O’Donnell Charles W. 35 Olson Sara 18 Onate Kathrina C. 3 Otterman Ericka 5 Ozadam Hakan 32 Pagan Michael 116 Palden Tsultrim 31 Pan Xinghua 26 70 71 Park Yongjin 35 Partridge E. Christopher 13 Paten Benedict 101 Pauli-Behn Florencia 13 Pazin Michael J. 116 Pei Baikang 24 Pennacchio Len A. 17 29 40 Perez Alexander R. 96 Perry Emily H. 100 Pervouchine Dmitri D. 38 52 Phalke Nishigandha N. 1 Pham Quan 17 Phanstiel Doug H. 72 73 Plajzer-Frick Ingrid 17 Pratt Gabriel A. 7 Pratt Henry E. 1 Preissl Sebastian 10 Pritchard Jonathan K. 3 Pritykin Yuri 96 Purcaro Michael J. 1 Qin Qian 47 85 Quinones-Valdez Giovanni 97 Rabano Ines 7 Radovani Ernest 67 Raj Anil 3 Rajagopal Nisha 88 Ram Oren 2 Ramirez Lucia 3 Ramirez Ricardo N. 15 Rausch Dylan 45 Raychaudhuri Soumya 88 Raymond Joseph 2 Razavi Rozita 74 Reddy Timothy E. 59 60 Reimonn Thomas M. 1 Ren Bing 9 10 Reymond Alexandre 102 Reynolds Alex 5 Rhie Suhn K. 39 Rinn John 33 Rivera Miguel 45 Rivera-Mulia Juan Carlos 22 23 Roberts Brian S. 13 Rodriguez Jose Manuel 103 Rozowsky Joel 24 Ryan Russell 45 Rynes Eric 5 Salins Denis N. 3 Sandstrom Richard 5 Sasaki Takayo 22 Sathe Shashank 7 Savic Daniel 57 Scavelli Alexandra 4 Scheiman Jonathan 47 Schlaffner Christoph 95 Schloss Jeffery A. 116 Schmitges Frank W. 74 See Lei Hoon 4 Sethi Anurag 24 Setty Manu 96 Shafer Anthony 5 Shan Shuo 1 Sharon Eilon 3 Shen Quan 26 75 Shen Yin 10 11 Sherwood Richard I. 88 Shi Minyi 3 Shin Sunyoung 91 Shoresh Noam 2 Siebenthall Kyle 5 Sisu Cristina 24 105 Slifer Teri 3 Sloan Cricket A. 3 Smith Anna 114 Snetkova Valentina 17 Snyder Michael P. 3 41 Spacek Damek V. 3 Srinivasan Sharanya 88 Srivas Rohith 3 Stamatoyannopoulos George 6 77 Stamatoyannopoulos John A. 5 6 37 Stanton Rebecca 7 Steffan Dave 27 Stehling-Sun Sandra 5 Strattan J. Seth 3 Su Amanda 31 Sundararaman Balaji 7 Suner Marie-Marthe 100 Syed Tahin 35 Szynkarek Matt 27 Tanaka Forrest Y. 3 Tenen Danielle 2 Teng Mingxiang 86 Thomas Jeffrey A. 115 Toffey Dave 27 Tress Michael L. 104 Trout Diane E. 14 Trynka Gosia 95 Tsuji Junko 1 Upchurch Sean A. 14 Ursu Oana 3 Uszczynska-Ratajczak Barbara 38 55 Uziel Mia C. 2 Valencia Alfonso 104 Biber Benjamin Van 5 van der Velde Arjan G. 1 44 Van Nostrand Eric L. 7 Vaydylevich Yekaterina 116 Vazquez Jesus 103 Victorsen Alec 27 Vielmetter Jost 14 Vierstra Jeff 5 Visel Axel 17 29 30 Vlasova Anna 38 Vockley Christopher M. 2 60 Volpi Simona 116 Vong Shinny 5 Wang Hao 5 Wang Mengchi 61 Wang Qin 43 Wang Ruth 7 Wang Tao 61 Wang Wei 61 Wang Xiaofeng 19 20 21 Wang Yanli 63 Watson Nathaniel K. 3 Wei Xintao 18 Wei Zhijie 43 Weisser Hendrik 95 Weissman Sherman M. 26 Welch Rene 90 Welikson Robert E. 5 Weng Zhiping 1 43 44 Westra Harm-Jan 88 Whitaker John W. 61 White Collin 13 White Kevin P. 28 Wildberg Andre 61 Williams Brian A. 14 Wine David 2 Witt Heather N. 39 Wold Barbara 14 Wolf Maxim 35 Wright James 95 Xiao Rui 56 Xiao Xinshu 97 Xu Jie 63 Xu Jinrui 24 Yan Koon-Kiu 24 Yan Yongqi 5 Yang Hongbo 63 Yang Xinqiong 3 Yang Yi-Wen 97 Yardımcı Galip Gürkan 37 Yee Brian A. 7 Yeo Gene W. 7 Young Taylor 1 Yu Tianxiong 43 Yue Feng 62 63 Zaleski Chris 4 Zang Chongzhi 82 83 84 Zeng Haoyang 35 Zeng Weihua 15 Zerbino Daniel R. 100 Zhai Jie 3 Zhan Lijun 18 Zhan Ye 32 Zhang Bo 63 Zhang Jialing 26 Zhang Jing 24 Zhang Kai 61 Zhang Lijun 63 Zhang Peng 43 Zhang Qi 92 Zhang Xiao-Ou 1 Zhang Yanxiao 10 Zhang Zhizhuo 35 Zhao Yuan 10 Zheng Ye 89 Zhong Guoqing 67 Zhou Xiao-Qiao 116 Zhu Yun 61 Zimmerman Jared 22 et al. Expanded encyclopaedias of DNA elements in the human and mouse genomes
CN112885408B (zh) 一种基于低深度测序检测snp标记位点的方法及装置
Liang et al. Raman profiling of embryo culture medium to identify aneuploid and euploid embryos
JP7772389B2 (ja) 妊娠中の無細胞断片を使用する分子分析
Gusmao et al. Analysis of computational footprinting methods for DNase sequencing experiments
US20110092763A1 (en) Methods for Embryo Characterization and Comparison
CN110468207B (zh) 基于Taqman低密度芯片的胶质瘤EM/PM分子分型方法及其应用
US20160210402A1 (en) Haplotyping and copy number typing using polymorphic variant allelic frequencies
CN108350498B (zh) 分型方法和装置
KR102812123B1 (ko) 유전체 서열 내의 변이 후보를 분류하는 방법 및 장치
US20230115039A1 (en) Machine-learning techniques for predicting surface-presenting peptides
US20240120026A1 (en) Method and device for extracting somatic mutations from single-cell transcriptome sequencing data
CN114531916A (zh) 确定精子提供者、卵母细胞提供者和对应受孕体之间的遗传关系的系统和方法
KR20250078852A (ko) 기계학습에 기반한 유전적 변이 식별 방법 및 장치
CN117789822A (zh) 一种基于多模态遗传信息的生物个体地理来源定位方法
KR20220064951A (ko) 인간 배아에서의 복제 수 변이의 확인을 위한 단일 뉴클레오티드 변이의 밀도를 사용하는 시스템 및 방법(systems and methods for using density of single nucleotide variations for the verification of copy number variations in human embryos)
CN116721698A (zh) 染色体核型的预测系统、构建方法、装置、设备及存储介质
WO2024022529A1 (en) Epigenetics analysis of cell-free dna
CN111128300B (zh) 基于突变信息的蛋白相互作用影响判断方法
Chuffart et al. Exploiting single-cell quantitative data to map genetic variants having probabilistic effects
CN113658636A (zh) 一种评估多能干细胞质量的方法
CN118471329A (zh) 基因变异筛查报告方法、系统、电子设备和存储介质
WO2016112539A1 (zh) 确定胎儿核酸含量的方法和装置
CN113981070B (zh) 胚胎染色体微缺失的检测方法、装置、设备和存储介质
CN115537468A (zh) 一种用于检测胰腺癌胚系变异的探针组合物、试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination