[go: up one dir, main page]

CN110310699A - 基于全基因组序列挖掘目标基因序列的分析工具及应用 - Google Patents

基于全基因组序列挖掘目标基因序列的分析工具及应用 Download PDF

Info

Publication number
CN110310699A
CN110310699A CN201910586422.4A CN201910586422A CN110310699A CN 110310699 A CN110310699 A CN 110310699A CN 201910586422 A CN201910586422 A CN 201910586422A CN 110310699 A CN110310699 A CN 110310699A
Authority
CN
China
Prior art keywords
sequence
target gene
file
sample
gene sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910586422.4A
Other languages
English (en)
Inventor
肖宁
李爱宏
戴正元
周长海
刘广青
潘存红
李育红
吴云雨
余玲
王志平
蔡跃
黄年生
季红娟
张小祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Lixiahe Prefecture Institute Of Agricultural Science
Original Assignee
Jiangsu Lixiahe Prefecture Institute Of Agricultural Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Lixiahe Prefecture Institute Of Agricultural Science filed Critical Jiangsu Lixiahe Prefecture Institute Of Agricultural Science
Priority to CN201910586422.4A priority Critical patent/CN110310699A/zh
Publication of CN110310699A publication Critical patent/CN110310699A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种利用Perl语言编写的可供Linux环境下运行的基于全基因组序列挖掘目标基因序列的分析工具进行检测分析的方法及其应用,实现从全基因组水平上,利用多个亲本材料的全基因序列开展目标基因的变异位点、变异类型分析,并获得目标基因在亲本材料中的同源序列。该分析工具及分析方法能够自动完成目标区间搜索、序列比对以及功能变异类型分析工作,不需要其他任何物种基因组注释结果作为参考,具有较高的通用性,并且可以支持2,000个亲本基因组的分析,可广泛应用于作物基因组中的目标基因序列分析,为分子育种提供简便快捷的序列多态性分析工具和策略。

Description

基于全基因组序列挖掘目标基因序列的分析工具及应用
技术领域
本发明涉及一种利用基于全基因组序列挖掘目标基因序列的分析工具创建及运用其进行全基因组序列中目标基因序列的挖掘、分析方法。该方法及其创建的基于全基因组序列挖掘目标基因序列的分析工具EXGE1.0主要应用于作物基因组中的目标基因序列分析。
背景技术
近年来,随着测序技术的不断进步,测序通量越来越高,同时测序成本越来越低,通过基因组测序获得某个材料的基因组序列,并在基因组序列中寻找目标基因的变异类型已成为动植物分子育种改良的基本策略。但是,伴随着样本量的剧增,大量基因组测序的积累,如何在海量数据中快速寻找目标基因的功能基因型以及变异位信息已成限制基因组学育种改良进程的关键因素,传统分析工具在操作大量基因组序列上存在操作步骤繁琐、工作强度高、工作量大的缺点。因此,提供基于全基因组序列的目标基因自动化分析工具是一个有效的方法。
发明内容
本发明所解决的技术问题在于提供一种基于全基因组序列挖掘目标基因序列的分析工具,从全基因组水平上,自动分析目标基因序列的变异类型,不需要其他任何物种基因组注释结果作为参考,具有良好的通用性。
实现本发明目的的技术解决方案为:
一种基于全基因组序列挖掘目标基因序列的分析工具,包括:
参数:-i:目标基因序列文件名称,-g:目标基因组合集的路径文本文件名称,-e:过滤阈值,-d:待检测基因组区间,-o:输出的文件名;命令行1:-g文件格式是每行一个基因组路径;命令行2:-d指定染色体编号和物理位置;命令行3:-i为fasta格式文件,要求存放在待检测基因组的相同文件夹中;使用perl命令,执行EXEG.pl脚本程序,并携带参数-i、-g、-e、-d、-o。
一种利用上述基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,包括以下步骤:
步骤1:在计算机Linux操作系统下安装bioperl软件包和序列比对软件Blast+软件包;
步骤2:提取样本基因组DNA,并测序、建库,获得样本基因组序列,并将其转换为fasta格式文件,得到样本基因组序列文件;
步骤3:将样本基因组序列的名称按顺序依次写入目标基因组合集的路径文本文件g中,目标基因组合集的路径文本的格式为:每行记录一个样本基因组的路径;设定待检测基因组区间d,待检测基因组区间表示为:染色体编号:物理距离;设置过滤阈值e;
步骤4:将样本基因组序列文件和需要检测的目标基因序列文件i放入同一目标文件夹中,其中,需要检测的目标基因序列文件i为fasta格式文件,同时将权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的脚本软件包、目标基因组合集的路径文本文件g也放入到同一目标文件夹中;
步骤5:运行基于全基因组序列挖掘目标基因序列的分析工具,输出目标基因序列在样本基因组中的插入或缺失突变位点信息、SNP突变信息、以及目标基因序列与样本基因组合集中BLAST比对结果;其中,插入或缺失突变位点信息包括目标基因序列中插入或缺失突变的物理位置、所属样本基因组序列的名称、样本基因组序列中插入或缺失突变的物理位置、目标基因序列中的变异类型、样本基因组序列中的变异类型;SNP突变信息包括目标基因序列中SNP突变的物理位置、所属样本基因组序列的名称、样本基因组序列中SNP突变的物理位置、目标基因序列中的SNP碱基类型、样本基因组序列中的碱基变异类型、同义或非同义突变类型;目标基因序列与基因组合集中BLAST比对结果包括目标基因序列在样本基因组中的同源序列。
利用上述检测分析方法在水稻及其它作物的基因组测序后的序列检测分析中的应用。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明从全基因组水平上,自动分析目标基因序列的变异类型,不需要其他任何物种基因组注释结果作为参考,具有良好的通用性,适合普通个人PC电脑使用。
2、本发明可自动完成目标区间搜索、序列比对、功能变异类型的分析工作,全程无需任何人工干预,最终生成的变异类型、比对序列的汇总表,便于用户用于后续分析工作。
3、本发明可以支持2,000个以下完整基因组(每个基因组430Mb)序列的分析,同时提供标准化的输出数据格式,便于用户调用第三方工具对分析数据再处理。
附图说明
图1是样本基因组序列的Fasta格式文件;
图2是目标基因序列的Fasta格式文件;
图3是插入或缺失突变输出结果;
图4是插入或缺失突变输出结果说明;
图5是SNP突变输出结果;
图6是SNP突变输出结果说明;
图7是目标基因序列与基因组合集中BLAST比对结果;
图8是稻瘟病Piz-t抗病基因的CDS序列;
图9是利用基于全基因组序列挖掘目标基因序列的分析工具分析Piz-t抗病基因在测序亲本材料中的变异类型以及抗病表型,A表示Piz-t抗病基因单倍体型以及变异位点,B表示单倍体型与抗病、感病表型的关系。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
一种基于全基因组序列挖掘目标基因序列的分析工具,包括:
参数:-i:目标基因序列文件名称,-g:目标基因组合集的路径文本文件名称,-e:过滤阈值,-d:待检测基因组区间,-o:输出的文件名;
命令行1:-g文件格式是每行一个基因组路径;
命令行2:-d指定染色体编号和物理位置;
命令行3:-i为fasta格式文件,要求存放在待检测基因组的相同文件夹中;
使用perl命令,执行EXEG.pl脚本程序,并携带参数-i、-g、-e、-d、-o。
一种利用上述基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,包括以下步骤:
步骤1:在计算机Linux操作系统下安装bioperl软件包和序列比对软件Blast+软件包;
步骤2:提取样本基因组DNA,并测序、建库,获得样本基因组序列,利用分析工具BWA将测得的每个样本的reads与参考基因组进行比对,生成BAM格式文件,再利用samtools软件将BAM格式文件转换为fasta格式文件得到样本基因组序列文件;
步骤3:将样本基因组序列的名称按顺序依次写入目标基因组合集的路径文本文件g中,目标基因组合集的路径文本的格式为:每行记录一个样本基因组的路径;例如:~/msuv7.fa,2000个基因组就是2000行;
设定待检测基因组区间d,待检测基因组区间表示为:染色体编号:物理距离;例如染色体编号为Chr01,加上物理距离,表示为Chr01:1-1000,要注意命令行中的染色体编号要与待检测样本基因组序列中的编号要一致;
设置过滤阈值e,e默认为10-10,可根据实际需要调整过滤阀值;
步骤4:将样本基因组序列文件和需要检测的目标基因序列文件i放入同一目标文件夹中,其中,需要检测的目标基因序列文件i为fasta格式文件,
同时将权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的脚本软件包、目标基因组合集的路径文本文件g也放入到同一目标文件夹中;
步骤5:运行基于全基因组序列挖掘目标基因序列的分析工具,输出目标基因序列在样本基因组中的插入或缺失突变位点信息、SNP突变信息、以及目标基因序列与样本基因组合集中BLAST比对结果;
其中,插入或缺失突变位点信息包括目标基因序列中插入或缺失突变的物理位置、所属样本基因组序列的名称、样本基因组序列中插入或缺失突变的物理位置、目标基因序列中的变异类型、样本基因组序列中的变异类型;
SNP突变信息包括目标基因序列中SNP突变的物理位置、所属样本基因组序列的名称、样本基因组序列中SNP突变的物理位置、目标基因序列中的SNP碱基类型、样本基因组序列中的碱基变异类型、同义或非同义突变类型;
目标基因序列与基因组合集中BLAST比对结果包括目标基因序列在样本基因组中的同源序列。
上述检测分析方法可运用在水稻及其它作物的基因组测序后的序列检测分析中。实施例1
(一)运行环境要求
硬件配置要求:CPU 4核以上,内存在16G以上,硬盘1000G以上。软件环境要求:linux操作系统(配有5.10以上版本的perl)。
(二)亲本材料中抗病基因的挖掘
1、供试材料
199份高代稳定水稻样本。
2、DNA提取参考Temnykh等(2000年)的DNA提取方法,对各单株分别提取基因组DNA。提取后,基因组测序建库和测序,测序深度为20倍,原始数据中Read超过50%的碱基quality值小于5的或者有接头污染,则予以过滤淘汰。在基因组DNA测序数据的基础上,利用免费分析工具BWA将每个样本获得的reads与参考基因组(IRGSP-1.0)进行比对,获得生成BAM格式文件,使用samtools软件将BAM文件转换为fasta格式的文件。为了提高序列提取的可靠性,质量控制参数设置为:每个位点的mapping质量值大于20、变异质量值大于50,而且每个碱基至少有来自3个以上reads数据支撑。
3、以上获得亲本基因组序列(序列内容如图1)以及需要检测的目标基因序列(如图2)存放在同一个文件夹中。本脚本程序涉及的数据文件格式均为fasta格式的文件,序列描述信息以”>”开头只占一行,其后第一个字段在文件内不能重复。序列说明之后为序列内容,可以分连续多行存储。
本实施例中使用稻瘟病抗性基因Piz-t的基因序列作为目标基因序列,序列内容如图8。
4、在以上文件夹中新建direct.txt文本文件,并在文件输入以上样本基因组的名称,例如~/199_1.fa,一直到~/199_199.fa。
5、目标基因序列文件为Piz-t.fasta,序列内容如图8所示。
6、使用脚本程序EXGE.pl,命令行为perl EXGE.pl -i Piz-t.fa -g direct.txt-e -10 -d Chr06_consensus:10,000,00-12,000,000 -o Piz-t_result,脚本程序包见源代码。
7、完成脚本运行后,输出结果有三个文件,包括目标基因序列在对应基因组中的SNP变异(如图5)、Indel插入缺失变异位点信息(如图3)、以及BLAST比对结果(如图7),SNP变异的结果说明如图6所示,插入缺失变异位点的结果说明如图4所示。图7中的BLAST比对结果中,>199_17_Chr11_consensus_27982787-27983057表示的是样本‘199_17’的第11号染色体的27982787至27983057区间的序列与目标基因存在高度同源;POS:表示目标基因序列的第94至第364区间与样本基因组的序列同源程度达100%。
8、根据以上抗病基因Piz-t在亲本材料中的插入、缺失以及非同义替换类型将变异类型分为13种单倍体型(命名为Hap1~Hap13),其中Hap1类型与抗病型的Piz-t序列100%一致,如图9A所示,NO.表示具有该单倍体型的亲本材料数目,‘-’表示该位点缺失1个bp的碱基,‘--’表示该位点缺失2个bp的碱基。利用稻瘟病病菌‘83-14’鉴定以上13种Hap类型的亲本材料稻瘟病抗性,如图9B所示,R:抗病表型;S:感病表型,其中,Hap1类型的水稻叶瘟表现抗病,而其他类型Hap2~Hap13则表现出感病。因此,利用EXGE1.0脚本程序从亲本材料中鉴定出抗病基因型,其结果和接菌的表型一致。
基于全基因组序列挖掘目标基因序列的分析工具的源代码如下:
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些改进应视为本发明的保护范围。

Claims (5)

1.一种基于全基因组序列挖掘目标基因序列的分析工具,其特征在于,包括:
参数:-i:目标基因序列文件名称,-g:目标基因组合集的路径文本文件名称,-e:过滤阈值,-d:待检测基因组区间,-o:输出的文件名;
命令行1:-g文件格式是每行一个基因组路径;
命令行2:-d指定染色体编号和物理位置;
命令行3:-i为fasta格式文件,要求存放在待检测基因组的相同文件夹中;
使用perl命令,执行EXEG.pl脚本程序,并携带参数-i、-g、-e、-d、-o。
2.一种利用权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,其特征在于,包括以下步骤:
步骤1:在计算机Linux操作系统下安装bioperl软件包和序列比对软件Blast+软件包;
步骤2:提取样本基因组DNA,并测序、建库,获得样本基因组序列,并将其转换为fasta格式文件,得到样本基因组序列文件;
步骤3:将样本基因组序列的名称按顺序依次写入目标基因组合集的路径文本文件g中,目标基因组合集的路径文本的格式为:每行记录一个样本基因组的路径;
设定待检测基因组区间d,待检测基因组区间表示为:染色体编号:物理距离;
设置过滤阈值e;
步骤4:将样本基因组序列文件和需要检测的目标基因序列文件i放入同一目标文件夹中,其中,需要检测的目标基因序列文件i为fasta格式文件,
同时将权利要求1所述的基于全基因组序列挖掘目标基因序列的分析工具的脚本软件包、目标基因组合集的路径文本文件g也放入到同一目标文件夹中;
步骤5:运行基于全基因组序列挖掘目标基因序列的分析工具,输出目标基因序列在样本基因组中的插入或缺失突变位点信息、SNP突变信息、以及目标基因序列与样本基因组合集中BLAST比对结果;
其中,插入或缺失突变位点信息包括目标基因序列中插入或缺失突变的物理位置、所属样本基因组序列的名称、样本基因组序列中插入或缺失突变的物理位置、目标基因序列中的变异类型、样本基因组序列中的变异类型;
SNP突变信息包括目标基因序列中SNP突变的物理位置、所属样本基因组序列的名称、样本基因组序列中SNP突变的物理位置、目标基因序列中的SNP碱基类型、样本基因组序列中的碱基变异类型、同义或非同义突变类型;
目标基因序列与基因组合集中BLAST比对结果包括目标基因序列在样本基因组中的同源序列。
3.根据权利要求2所述的基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,其特征在于,步骤2中将样本基因组序列转换生成fasta格式文件具体为:利用分析工具BWA将测得的每个样本的reads与参考基因组进行比对,生成BAM格式文件,再利用samtools软件将BAM格式文件转换为fasta格式文件。
4.根据权利要求2所述的基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法,其特征在于,过滤阈值e为10-10
5.利用基于全基因组序列挖掘目标基因序列的分析工具的检测分析方法在水稻及其它作物的基因组测序后的序列检测分析中的应用。
CN201910586422.4A 2019-07-01 2019-07-01 基于全基因组序列挖掘目标基因序列的分析工具及应用 Pending CN110310699A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910586422.4A CN110310699A (zh) 2019-07-01 2019-07-01 基于全基因组序列挖掘目标基因序列的分析工具及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910586422.4A CN110310699A (zh) 2019-07-01 2019-07-01 基于全基因组序列挖掘目标基因序列的分析工具及应用

Publications (1)

Publication Number Publication Date
CN110310699A true CN110310699A (zh) 2019-10-08

Family

ID=68078708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910586422.4A Pending CN110310699A (zh) 2019-07-01 2019-07-01 基于全基因组序列挖掘目标基因序列的分析工具及应用

Country Status (1)

Country Link
CN (1) CN110310699A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037847A (zh) * 2020-09-15 2020-12-04 中国科学院微生物研究所 微生物菌株基因组分析方法、装置及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1733915A (zh) * 2005-07-19 2006-02-15 浙江大学 水稻全基因组假基因数据库构建方法
CN104462211A (zh) * 2014-11-04 2015-03-25 北京诺禾致源生物信息科技有限公司 重测序数据的处理方法和处理装置
CN105426700A (zh) * 2015-12-18 2016-03-23 江苏省农业科学院 一种批量计算基因组直系同源基因进化速率的方法
CN106282320A (zh) * 2015-05-20 2017-01-04 广州华大基因医学检验所有限公司 检测体细胞突变的方法和装置
CN106529171A (zh) * 2016-11-09 2017-03-22 上海派森诺医学检验所有限公司 乳腺癌易感基因遗传变异位点的检测分析方法
CN106544407A (zh) * 2015-09-18 2017-03-29 广州华大基因医学检验所有限公司 确定受体cfDNA样本中供体来源cfDNA比例的方法
CN107391965A (zh) * 2017-08-15 2017-11-24 上海派森诺生物科技股份有限公司 一种基于高通量测序技术的肺癌体细胞突变检测分析方法
CN109402241A (zh) * 2017-08-07 2019-03-01 深圳华大基因研究院 鉴定和分析古dna样本的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1733915A (zh) * 2005-07-19 2006-02-15 浙江大学 水稻全基因组假基因数据库构建方法
CN104462211A (zh) * 2014-11-04 2015-03-25 北京诺禾致源生物信息科技有限公司 重测序数据的处理方法和处理装置
CN106282320A (zh) * 2015-05-20 2017-01-04 广州华大基因医学检验所有限公司 检测体细胞突变的方法和装置
CN106544407A (zh) * 2015-09-18 2017-03-29 广州华大基因医学检验所有限公司 确定受体cfDNA样本中供体来源cfDNA比例的方法
CN105426700A (zh) * 2015-12-18 2016-03-23 江苏省农业科学院 一种批量计算基因组直系同源基因进化速率的方法
CN106529171A (zh) * 2016-11-09 2017-03-22 上海派森诺医学检验所有限公司 乳腺癌易感基因遗传变异位点的检测分析方法
CN109402241A (zh) * 2017-08-07 2019-03-01 深圳华大基因研究院 鉴定和分析古dna样本的方法
CN107391965A (zh) * 2017-08-15 2017-11-24 上海派森诺生物科技股份有限公司 一种基于高通量测序技术的肺癌体细胞突变检测分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陶欢: ""水稻品种CO39及其NILs基因组重测序序列的组装与SNPs"", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037847A (zh) * 2020-09-15 2020-12-04 中国科学院微生物研究所 微生物菌株基因组分析方法、装置及电子设备

Similar Documents

Publication Publication Date Title
Huang et al. Genome sequence of Gossypium herbaceum and genome updates of Gossypium arboreum and Gossypium hirsutum provide insights into cotton A-genome evolution
JP6314091B2 (ja) Dna配列のデータ分析
Giudice et al. RNA editing in plants: A comprehensive survey of bioinformatics tools and databases
CN108197434A (zh) 去除宏基因组测序数据中人源基因序列的方法
KR20140006846A (ko) Dna 서열의 데이터 분석
CN105426700B (zh) 一种批量计算基因组直系同源基因进化速率的方法
Henke et al. Perspectives for identification of mutations in the zebrafish: making use of next-generation sequencing technologies for forward genetic approaches
Hesse K-Mer-based genome size estimation in theory and practice
Liu Bioinformatics in aquaculture: principles and methods
Duran et al. Future tools for association mapping in crop plants
Aflitos et al. Introgression browser: high‐throughput whole‐genome SNP visualization
CN106169034A (zh) 基因组信息辅助育种方法ⅰ‑基于snp聚类信息和pav变异信息的育种亲本选择
CN113571131A (zh) 一种泛基因组的构建方法及其相应的结构变异挖掘方法
Gutierrez-Gonzalez et al. De novo transcriptome assembly in polyploid species
CN110310699A (zh) 基于全基因组序列挖掘目标基因序列的分析工具及应用
AU2021423830B2 (en) Genotype identification of multi-parent crop on basis of high-throughput whole genome sequencing
JP4468773B2 (ja) 遺伝子情報の表示方法及び表示装置
Henke et al. Identification of Mutations in Zebrafish Using Next‐Generation Sequencing
KR101911307B1 (ko) 유전자 단위에서 단상형을 구분하는 태그-snp 선발 및 활용 기술
Donaire et al. Computational pipeline for the detection of plant RNA viruses using high-throughput sequencing
KR20220063480A (ko) 통계적 규제화 방법과 선택확률을 활용한 표현형질 연관 snp 마커 발굴 방법
Romain et al. Investigating the topological motifs of inversions in pangenome graphs
Tullume-Vergara et al. Comparative analysis of the mobilome yields new insights into its diversity, dynamics and evolution in parasites of the Trypanosomatidae family
JP2005190427A (ja) 配列を同定するための変異要素のセット抽出方法
Sahu et al. Role of bioinformatics in genome analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191008

RJ01 Rejection of invention patent application after publication