CN110310699A - 基于全基因组序列挖掘目标基因序列的分析工具及应用 - Google Patents
基于全基因组序列挖掘目标基因序列的分析工具及应用 Download PDFInfo
- Publication number
- CN110310699A CN110310699A CN201910586422.4A CN201910586422A CN110310699A CN 110310699 A CN110310699 A CN 110310699A CN 201910586422 A CN201910586422 A CN 201910586422A CN 110310699 A CN110310699 A CN 110310699A
- Authority
- CN
- China
- Prior art keywords
- sequence
- target gene
- file
- sample
- gene sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 115
- 238000004458 analytical method Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000012300 Sequence Analysis Methods 0.000 claims abstract description 3
- 230000035772 mutation Effects 0.000 claims description 31
- 230000037430 deletion Effects 0.000 claims description 17
- 238000012217 deletion Methods 0.000 claims description 17
- 230000037431 insertion Effects 0.000 claims description 14
- 238000003780 insertion Methods 0.000 claims description 13
- 210000000349 chromosome Anatomy 0.000 claims description 9
- 235000007164 Oryza sativa Nutrition 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 8
- 235000009566 rice Nutrition 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 6
- 239000002773 nucleotide Substances 0.000 claims description 3
- 125000003729 nucleotide group Chemical group 0.000 claims description 3
- 239000012141 concentrate Substances 0.000 claims 2
- 240000007594 Oryza sativa Species 0.000 claims 1
- 239000000463 material Substances 0.000 abstract description 11
- 238000009395 breeding Methods 0.000 abstract description 3
- 230000001488 breeding effect Effects 0.000 abstract description 3
- 101150095418 crop gene Proteins 0.000 abstract description 2
- 238000002864 sequence alignment Methods 0.000 abstract description 2
- 201000010099 disease Diseases 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 241000209094 Oryza Species 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 102000054766 genetic haplotypes Human genes 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 3
- 101150009243 HAP1 gene Proteins 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 101150030367 cls gene Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种利用Perl语言编写的可供Linux环境下运行的基于全基因组序列挖掘目标基因序列的分析工具进行检测分析的方法及其应用,实现从全基因组水平上,利用多个亲本材料的全基因序列开展目标基因的变异位点、变异类型分析,并获得目标基因在亲本材料中的同源序列。该分析工具及分析方法能够自动完成目标区间搜索、序列比对以及功能变异类型分析工作,不需要其他任何物种基因组注释结果作为参考,具有较高的通用性,并且可以支持2,000个亲本基因组的分析,可广泛应用于作物基因组中的目标基因序列分析,为分子育种提供简便快捷的序列多态性分析工具和策略。
Description
技术领域
本发明涉及一种利用基于全基因组序列挖掘目标基因序列的分析工具创建及运用其进行全基因组序列中目标基因序列的挖掘、分析方法。该方法及其创建的基于全基因组序列挖掘目标基因序列的分析工具EXGE1.0主要应用于作物基因组中的目标基因序列分析。
背景技术
近年来,随着测序技术的不断进步,测序通量越来越高,同时测序成本越来越低,通过基因组测序获得某个材料的基因组序列,并在基因组序列中寻找目标基因的变异类型已成为动植物分子育种改良的基本策略。但是,伴随着样本量的剧增,大量基因组测序的积累,如何在海量数据中快速寻找目标基因的功能基因型以及变异位信息已成限制基因组学育种改良进程的关键因素,传统分析工具在操作大量基因组序列上存在操作步骤繁琐、工作强度高、工作量大的缺点。因此,提供基于全基因组序列的目标基因自动化分析工具是一个有效的方法。
发明内容
本发明所解决的技术问题在于提供一种基于全基因组序列挖掘目标基因序列的分析工具,从全基因组水平上,自动分析目标基因序列的变异类型,不需要其他任何物种基因组注释结果作为参考,具有良好的通用性。
实现本发明目的的技术解决方案为:
一种基于全基因组序列挖掘目标基因序列的分析工具,包括:
参数:-i:目标基因序列文件名称,-g:目标基因组合集的路径文本文件名称,-e:过滤阈值,-d:待检测基因组区间,-o:输出的文件名;命令行1:-g文件格式是每行一个基因组路径;命令行2:-d指定染色体编号和物理位置;命令行3:-i为fasta格式文件,要求存放在待检测基因组的相同文件夹中;使用perl命令,执行EXEG.pl脚本程序,并携带参数-i、-g、-e、-d、-o。
一种利用上述基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,包括以下步骤:
步骤1:在计算机Linux操作系统下安装bioperl软件包和序列比对软件Blast+软件包;
步骤2:提取样本基因组DNA,并测序、建库,获得样本基因组序列,并将其转换为fasta格式文件,得到样本基因组序列文件;
步骤3:将样本基因组序列的名称按顺序依次写入目标基因组合集的路径文本文件g中,目标基因组合集的路径文本的格式为:每行记录一个样本基因组的路径;设定待检测基因组区间d,待检测基因组区间表示为:染色体编号:物理距离;设置过滤阈值e;
步骤4:将样本基因组序列文件和需要检测的目标基因序列文件i放入同一目标文件夹中,其中,需要检测的目标基因序列文件i为fasta格式文件,同时将权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的脚本软件包、目标基因组合集的路径文本文件g也放入到同一目标文件夹中;
步骤5:运行基于全基因组序列挖掘目标基因序列的分析工具,输出目标基因序列在样本基因组中的插入或缺失突变位点信息、SNP突变信息、以及目标基因序列与样本基因组合集中BLAST比对结果;其中,插入或缺失突变位点信息包括目标基因序列中插入或缺失突变的物理位置、所属样本基因组序列的名称、样本基因组序列中插入或缺失突变的物理位置、目标基因序列中的变异类型、样本基因组序列中的变异类型;SNP突变信息包括目标基因序列中SNP突变的物理位置、所属样本基因组序列的名称、样本基因组序列中SNP突变的物理位置、目标基因序列中的SNP碱基类型、样本基因组序列中的碱基变异类型、同义或非同义突变类型;目标基因序列与基因组合集中BLAST比对结果包括目标基因序列在样本基因组中的同源序列。
利用上述检测分析方法在水稻及其它作物的基因组测序后的序列检测分析中的应用。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明从全基因组水平上,自动分析目标基因序列的变异类型,不需要其他任何物种基因组注释结果作为参考,具有良好的通用性,适合普通个人PC电脑使用。
2、本发明可自动完成目标区间搜索、序列比对、功能变异类型的分析工作,全程无需任何人工干预,最终生成的变异类型、比对序列的汇总表,便于用户用于后续分析工作。
3、本发明可以支持2,000个以下完整基因组(每个基因组430Mb)序列的分析,同时提供标准化的输出数据格式,便于用户调用第三方工具对分析数据再处理。
附图说明
图1是样本基因组序列的Fasta格式文件;
图2是目标基因序列的Fasta格式文件;
图3是插入或缺失突变输出结果;
图4是插入或缺失突变输出结果说明;
图5是SNP突变输出结果;
图6是SNP突变输出结果说明;
图7是目标基因序列与基因组合集中BLAST比对结果;
图8是稻瘟病Piz-t抗病基因的CDS序列;
图9是利用基于全基因组序列挖掘目标基因序列的分析工具分析Piz-t抗病基因在测序亲本材料中的变异类型以及抗病表型,A表示Piz-t抗病基因单倍体型以及变异位点,B表示单倍体型与抗病、感病表型的关系。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
一种基于全基因组序列挖掘目标基因序列的分析工具,包括:
参数:-i:目标基因序列文件名称,-g:目标基因组合集的路径文本文件名称,-e:过滤阈值,-d:待检测基因组区间,-o:输出的文件名;
命令行1:-g文件格式是每行一个基因组路径;
命令行2:-d指定染色体编号和物理位置;
命令行3:-i为fasta格式文件,要求存放在待检测基因组的相同文件夹中;
使用perl命令,执行EXEG.pl脚本程序,并携带参数-i、-g、-e、-d、-o。
一种利用上述基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,包括以下步骤:
步骤1:在计算机Linux操作系统下安装bioperl软件包和序列比对软件Blast+软件包;
步骤2:提取样本基因组DNA,并测序、建库,获得样本基因组序列,利用分析工具BWA将测得的每个样本的reads与参考基因组进行比对,生成BAM格式文件,再利用samtools软件将BAM格式文件转换为fasta格式文件得到样本基因组序列文件;
步骤3:将样本基因组序列的名称按顺序依次写入目标基因组合集的路径文本文件g中,目标基因组合集的路径文本的格式为:每行记录一个样本基因组的路径;例如:~/msuv7.fa,2000个基因组就是2000行;
设定待检测基因组区间d,待检测基因组区间表示为:染色体编号:物理距离;例如染色体编号为Chr01,加上物理距离,表示为Chr01:1-1000,要注意命令行中的染色体编号要与待检测样本基因组序列中的编号要一致;
设置过滤阈值e,e默认为10-10,可根据实际需要调整过滤阀值;
步骤4:将样本基因组序列文件和需要检测的目标基因序列文件i放入同一目标文件夹中,其中,需要检测的目标基因序列文件i为fasta格式文件,
同时将权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的脚本软件包、目标基因组合集的路径文本文件g也放入到同一目标文件夹中;
步骤5:运行基于全基因组序列挖掘目标基因序列的分析工具,输出目标基因序列在样本基因组中的插入或缺失突变位点信息、SNP突变信息、以及目标基因序列与样本基因组合集中BLAST比对结果;
其中,插入或缺失突变位点信息包括目标基因序列中插入或缺失突变的物理位置、所属样本基因组序列的名称、样本基因组序列中插入或缺失突变的物理位置、目标基因序列中的变异类型、样本基因组序列中的变异类型;
SNP突变信息包括目标基因序列中SNP突变的物理位置、所属样本基因组序列的名称、样本基因组序列中SNP突变的物理位置、目标基因序列中的SNP碱基类型、样本基因组序列中的碱基变异类型、同义或非同义突变类型;
目标基因序列与基因组合集中BLAST比对结果包括目标基因序列在样本基因组中的同源序列。
上述检测分析方法可运用在水稻及其它作物的基因组测序后的序列检测分析中。实施例1
(一)运行环境要求
硬件配置要求:CPU 4核以上,内存在16G以上,硬盘1000G以上。软件环境要求:linux操作系统(配有5.10以上版本的perl)。
(二)亲本材料中抗病基因的挖掘
1、供试材料
199份高代稳定水稻样本。
2、DNA提取参考Temnykh等(2000年)的DNA提取方法,对各单株分别提取基因组DNA。提取后,基因组测序建库和测序,测序深度为20倍,原始数据中Read超过50%的碱基quality值小于5的或者有接头污染,则予以过滤淘汰。在基因组DNA测序数据的基础上,利用免费分析工具BWA将每个样本获得的reads与参考基因组(IRGSP-1.0)进行比对,获得生成BAM格式文件,使用samtools软件将BAM文件转换为fasta格式的文件。为了提高序列提取的可靠性,质量控制参数设置为:每个位点的mapping质量值大于20、变异质量值大于50,而且每个碱基至少有来自3个以上reads数据支撑。
3、以上获得亲本基因组序列(序列内容如图1)以及需要检测的目标基因序列(如图2)存放在同一个文件夹中。本脚本程序涉及的数据文件格式均为fasta格式的文件,序列描述信息以”>”开头只占一行,其后第一个字段在文件内不能重复。序列说明之后为序列内容,可以分连续多行存储。
本实施例中使用稻瘟病抗性基因Piz-t的基因序列作为目标基因序列,序列内容如图8。
4、在以上文件夹中新建direct.txt文本文件,并在文件输入以上样本基因组的名称,例如~/199_1.fa,一直到~/199_199.fa。
5、目标基因序列文件为Piz-t.fasta,序列内容如图8所示。
6、使用脚本程序EXGE.pl,命令行为perl EXGE.pl -i Piz-t.fa -g direct.txt-e -10 -d Chr06_consensus:10,000,00-12,000,000 -o Piz-t_result,脚本程序包见源代码。
7、完成脚本运行后,输出结果有三个文件,包括目标基因序列在对应基因组中的SNP变异(如图5)、Indel插入缺失变异位点信息(如图3)、以及BLAST比对结果(如图7),SNP变异的结果说明如图6所示,插入缺失变异位点的结果说明如图4所示。图7中的BLAST比对结果中,>199_17_Chr11_consensus_27982787-27983057表示的是样本‘199_17’的第11号染色体的27982787至27983057区间的序列与目标基因存在高度同源;POS:表示目标基因序列的第94至第364区间与样本基因组的序列同源程度达100%。
8、根据以上抗病基因Piz-t在亲本材料中的插入、缺失以及非同义替换类型将变异类型分为13种单倍体型(命名为Hap1~Hap13),其中Hap1类型与抗病型的Piz-t序列100%一致,如图9A所示,NO.表示具有该单倍体型的亲本材料数目,‘-’表示该位点缺失1个bp的碱基,‘--’表示该位点缺失2个bp的碱基。利用稻瘟病病菌‘83-14’鉴定以上13种Hap类型的亲本材料稻瘟病抗性,如图9B所示,R:抗病表型;S:感病表型,其中,Hap1类型的水稻叶瘟表现抗病,而其他类型Hap2~Hap13则表现出感病。因此,利用EXGE1.0脚本程序从亲本材料中鉴定出抗病基因型,其结果和接菌的表型一致。
基于全基因组序列挖掘目标基因序列的分析工具的源代码如下:
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些改进应视为本发明的保护范围。
Claims (5)
1.一种基于全基因组序列挖掘目标基因序列的分析工具,其特征在于,包括:
参数:-i:目标基因序列文件名称,-g:目标基因组合集的路径文本文件名称,-e:过滤阈值,-d:待检测基因组区间,-o:输出的文件名;
命令行1:-g文件格式是每行一个基因组路径;
命令行2:-d指定染色体编号和物理位置;
命令行3:-i为fasta格式文件,要求存放在待检测基因组的相同文件夹中;
使用perl命令,执行EXEG.pl脚本程序,并携带参数-i、-g、-e、-d、-o。
2.一种利用权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,其特征在于,包括以下步骤:
步骤1:在计算机Linux操作系统下安装bioperl软件包和序列比对软件Blast+软件包;
步骤2:提取样本基因组DNA,并测序、建库,获得样本基因组序列,并将其转换为fasta格式文件,得到样本基因组序列文件;
步骤3:将样本基因组序列的名称按顺序依次写入目标基因组合集的路径文本文件g中,目标基因组合集的路径文本的格式为:每行记录一个样本基因组的路径;
设定待检测基因组区间d,待检测基因组区间表示为:染色体编号:物理距离;
设置过滤阈值e;
步骤4:将样本基因组序列文件和需要检测的目标基因序列文件i放入同一目标文件夹中,其中,需要检测的目标基因序列文件i为fasta格式文件,
同时将权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的脚本软件包、目标基因组合集的路径文本文件g也放入到同一目标文件夹中;
步骤5:运行基于全基因组序列挖掘目标基因序列的分析工具,输出目标基因序列在样本基因组中的插入或缺失突变位点信息、SNP突变信息、以及目标基因序列与样本基因组合集中BLAST比对结果;
其中,插入或缺失突变位点信息包括目标基因序列中插入或缺失突变的物理位置、所属样本基因组序列的名称、样本基因组序列中插入或缺失突变的物理位置、目标基因序列中的变异类型、样本基因组序列中的变异类型;
SNP突变信息包括目标基因序列中SNP突变的物理位置、所属样本基因组序列的名称、样本基因组序列中SNP突变的物理位置、目标基因序列中的SNP碱基类型、样本基因组序列中的碱基变异类型、同义或非同义突变类型;
目标基因序列与基因组合集中BLAST比对结果包括目标基因序列在样本基因组中的同源序列。
3.根据权利要求2所述的基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,其特征在于,步骤2中将样本基因组序列转换生成fasta格式文件具体为:利用分析工具BWA将测得的每个样本的reads与参考基因组进行比对,生成BAM格式文件,再利用samtools软件将BAM格式文件转换为fasta格式文件。
4.根据权利要求2所述的基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,其特征在于,过滤阈值e为10-10。
5.利用基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法在水稻及其它作物的基因组测序后的序列检测分析中的应用。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910586422.4A CN110310699A (zh) | 2019-07-01 | 2019-07-01 | 基于全基因组序列挖掘目标基因序列的分析工具及应用 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910586422.4A CN110310699A (zh) | 2019-07-01 | 2019-07-01 | 基于全基因组序列挖掘目标基因序列的分析工具及应用 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN110310699A true CN110310699A (zh) | 2019-10-08 |
Family
ID=68078708
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910586422.4A Pending CN110310699A (zh) | 2019-07-01 | 2019-07-01 | 基于全基因组序列挖掘目标基因序列的分析工具及应用 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN110310699A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112037847A (zh) * | 2020-09-15 | 2020-12-04 | 中国科学院微生物研究所 | 微生物菌株基因组分析方法、装置及电子设备 |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1733915A (zh) * | 2005-07-19 | 2006-02-15 | 浙江大学 | 水稻全基因组假基因数据库构建方法 |
| CN104462211A (zh) * | 2014-11-04 | 2015-03-25 | 北京诺禾致源生物信息科技有限公司 | 重测序数据的处理方法和处理装置 |
| CN105426700A (zh) * | 2015-12-18 | 2016-03-23 | 江苏省农业科学院 | 一种批量计算基因组直系同源基因进化速率的方法 |
| CN106282320A (zh) * | 2015-05-20 | 2017-01-04 | 广州华大基因医学检验所有限公司 | 检测体细胞突变的方法和装置 |
| CN106529171A (zh) * | 2016-11-09 | 2017-03-22 | 上海派森诺医学检验所有限公司 | 乳腺癌易感基因遗传变异位点的检测分析方法 |
| CN106544407A (zh) * | 2015-09-18 | 2017-03-29 | 广州华大基因医学检验所有限公司 | 确定受体cfDNA样本中供体来源cfDNA比例的方法 |
| CN107391965A (zh) * | 2017-08-15 | 2017-11-24 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的肺癌体细胞突变检测分析方法 |
| CN109402241A (zh) * | 2017-08-07 | 2019-03-01 | 深圳华大基因研究院 | 鉴定和分析古dna样本的方法 |
-
2019
- 2019-07-01 CN CN201910586422.4A patent/CN110310699A/zh active Pending
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1733915A (zh) * | 2005-07-19 | 2006-02-15 | 浙江大学 | 水稻全基因组假基因数据库构建方法 |
| CN104462211A (zh) * | 2014-11-04 | 2015-03-25 | 北京诺禾致源生物信息科技有限公司 | 重测序数据的处理方法和处理装置 |
| CN106282320A (zh) * | 2015-05-20 | 2017-01-04 | 广州华大基因医学检验所有限公司 | 检测体细胞突变的方法和装置 |
| CN106544407A (zh) * | 2015-09-18 | 2017-03-29 | 广州华大基因医学检验所有限公司 | 确定受体cfDNA样本中供体来源cfDNA比例的方法 |
| CN105426700A (zh) * | 2015-12-18 | 2016-03-23 | 江苏省农业科学院 | 一种批量计算基因组直系同源基因进化速率的方法 |
| CN106529171A (zh) * | 2016-11-09 | 2017-03-22 | 上海派森诺医学检验所有限公司 | 乳腺癌易感基因遗传变异位点的检测分析方法 |
| CN109402241A (zh) * | 2017-08-07 | 2019-03-01 | 深圳华大基因研究院 | 鉴定和分析古dna样本的方法 |
| CN107391965A (zh) * | 2017-08-15 | 2017-11-24 | 上海派森诺生物科技股份有限公司 | 一种基于高通量测序技术的肺癌体细胞突变检测分析方法 |
Non-Patent Citations (1)
| Title |
|---|
| 陶欢: ""水稻品种CO39及其NILs基因组重测序序列的组装与SNPs"", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112037847A (zh) * | 2020-09-15 | 2020-12-04 | 中国科学院微生物研究所 | 微生物菌株基因组分析方法、装置及电子设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Huang et al. | Genome sequence of Gossypium herbaceum and genome updates of Gossypium arboreum and Gossypium hirsutum provide insights into cotton A-genome evolution | |
| JP6314091B2 (ja) | Dna配列のデータ分析 | |
| Giudice et al. | RNA editing in plants: A comprehensive survey of bioinformatics tools and databases | |
| CN108197434A (zh) | 去除宏基因组测序数据中人源基因序列的方法 | |
| KR20140006846A (ko) | Dna 서열의 데이터 분석 | |
| CN105426700B (zh) | 一种批量计算基因组直系同源基因进化速率的方法 | |
| Henke et al. | Perspectives for identification of mutations in the zebrafish: making use of next-generation sequencing technologies for forward genetic approaches | |
| Hesse | K-Mer-based genome size estimation in theory and practice | |
| Liu | Bioinformatics in aquaculture: principles and methods | |
| Duran et al. | Future tools for association mapping in crop plants | |
| Aflitos et al. | Introgression browser: high‐throughput whole‐genome SNP visualization | |
| CN106169034A (zh) | 基因组信息辅助育种方法ⅰ‑基于snp聚类信息和pav变异信息的育种亲本选择 | |
| CN113571131A (zh) | 一种泛基因组的构建方法及其相应的结构变异挖掘方法 | |
| Gutierrez-Gonzalez et al. | De novo transcriptome assembly in polyploid species | |
| CN110310699A (zh) | 基于全基因组序列挖掘目标基因序列的分析工具及应用 | |
| AU2021423830B2 (en) | Genotype identification of multi-parent crop on basis of high-throughput whole genome sequencing | |
| JP4468773B2 (ja) | 遺伝子情報の表示方法及び表示装置 | |
| Henke et al. | Identification of Mutations in Zebrafish Using Next‐Generation Sequencing | |
| KR101911307B1 (ko) | 유전자 단위에서 단상형을 구분하는 태그-snp 선발 및 활용 기술 | |
| Donaire et al. | Computational pipeline for the detection of plant RNA viruses using high-throughput sequencing | |
| KR20220063480A (ko) | 통계적 규제화 방법과 선택확률을 활용한 표현형질 연관 snp 마커 발굴 방법 | |
| Romain et al. | Investigating the topological motifs of inversions in pangenome graphs | |
| Tullume-Vergara et al. | Comparative analysis of the mobilome yields new insights into its diversity, dynamics and evolution in parasites of the Trypanosomatidae family | |
| JP2005190427A (ja) | 配列を同定するための変異要素のセット抽出方法 | |
| Sahu et al. | Role of bioinformatics in genome analysis |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191008 |
|
| RJ01 | Rejection of invention patent application after publication |