CN111681711A - 一种兼并引物的设计筛选方法 - Google Patents
一种兼并引物的设计筛选方法 Download PDFInfo
- Publication number
- CN111681711A CN111681711A CN202010600299.XA CN202010600299A CN111681711A CN 111681711 A CN111681711 A CN 111681711A CN 202010600299 A CN202010600299 A CN 202010600299A CN 111681711 A CN111681711 A CN 111681711A
- Authority
- CN
- China
- Prior art keywords
- primer
- mer
- degenerate
- design
- screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012216 screening Methods 0.000 title claims abstract description 54
- 238000013461 design Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 41
- 241000894007 species Species 0.000 claims description 35
- 230000000295 complement effect Effects 0.000 claims description 14
- 230000003321 amplification Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 13
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 13
- 244000000010 microbial pathogen Species 0.000 claims description 4
- 238000007672 fourth generation sequencing Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims description 2
- 238000007403 mPCR Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 abstract description 9
- 238000002360 preparation method Methods 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 11
- 244000052769 pathogen Species 0.000 description 11
- 241000701161 unidentified adenovirus Species 0.000 description 10
- 230000001717 pathogenic effect Effects 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 108091092584 GDNA Proteins 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 238000002887 multiple sequence alignment Methods 0.000 description 4
- 244000045947 parasite Species 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000000137 annealing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000701149 Human adenovirus 1 Species 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- 241000328826 Human adenovirus 52 Species 0.000 description 1
- 241000121453 Human adenovirus 55 Species 0.000 description 1
- 241000701096 Human adenovirus 7 Species 0.000 description 1
- 241000193096 Human adenovirus B3 Species 0.000 description 1
- 241001135572 Human adenovirus E4 Species 0.000 description 1
- 241000620147 Human mastadenovirus C Species 0.000 description 1
- 241000886679 Human mastadenovirus D Species 0.000 description 1
- 241000886703 Human mastadenovirus E Species 0.000 description 1
- 241000886705 Human mastadenovirus F Species 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/70—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
- C12Q1/701—Specific hybridization probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Virology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种兼并引物的设计筛选方法。本发明所述方法通过多重比对、k‑mer划分、制备兼并k‑mer、获得候选引物集以及组合引物对等步骤,实现对多种物种基因设计兼并引物,并筛选出最佳兼并引物对。
Description
技术领域
本发明涉及生物信息学分析领域,特别是涉及一种兼并引物的设计筛选方法。
背景技术
在临床病原诊断领域,常用检测方法为PCR扩增、16S rRNA测序和宏基因组测序,其中PCR扩增主要面向靶向扩增检测,16S测序物种区分度不足以作病原鉴定,宏基因组测序在解决大量的宿主DNA占比问题上仍有很大的挑战。鉴于常规检测方法中的各种局限和挑战,提供一套临床常见病原菌的靶向检测解决方案尤为重要。
病原靶向检测需要富集目标物种特定序列后测序作物种鉴定,达到临床关注病原检测的目的。这就要求富集引物能够覆盖到多种病原物种,且富集序列需具备一定地物种区分度用于后续作物种鉴定分析。靶向富集技术需要在物种序列的保守区设计兼并引物,同时要求富集区间包含一定比例地可变区用于物种区分。靶向富集序列可应用于下一代测序(Next Generation Sequencing,NGS)和纳米孔测序(Oxford Nanopore Technologies,ONT)。
关于靶向富集引物的设计筛选,现有技术主要根据蛋白保守性domain结构作兼并引物设计,该方法需要预知基因对应地蛋白序列,且引物对组合时具有一定地随意性,比较适用于同属相似物种间的引物设计,而对于非相似物种的引物设计并不适用。目前linux端引物设计经常调用primer3软件,但该软件只适用于提供特定序列设计非兼并引物,并不支持兼并引物设计。为推进靶向富集在临床病原检测中的应用,亟需开发一种靶向富集兼并引物的设计筛选方法。
有鉴于此,提出本发明。
发明内容
本发明要解决的技术问题是提供一种兼并引物的设计筛选方法。
考虑到病原靶向检测需要富集目标物种特定序列,然后测序进行物种鉴定,以达到临床病原检测目的,这就要求富集引物能够覆盖到多种病原物种,且富集序列需具备一定地物种区分度用于后续物种鉴定分析。为推进靶向富集在临床病原检测中的应用,本发明通过深入挖掘大量多物种序列数据,从物种基因或全基因组多重序列比对结果入手,惊奇发现在多物种基因多重序列比对下,可通过k-mer方法将所有序列划分为k长度的短序列,便于后续对引物设计区域进行筛选。同时为了设计兼并引物,本发明还开发了一种碱基转码规则及其反向互补规则,在物种个数等于序列数时,保障了引物设计区域的特异性,对该区域的k-mer进行碱基转码形成兼并k-mer,同时记录其位置信息和反向互补序列,进一步对兼并k-mer以不同引物长度L进行划分,便于筛选最优引物对。基于对此的研究发现,本发明构建了一套兼并引物的设计筛选方法,并通过大量多物种兼并引物设计对该方法进行验证,又利用生信、湿实验方法对兼并引物进行特异性验证,结果表明该方法所设计出的兼并引物可以对多物种进行特异性扩增。
因此,本发明的第一目的是提供一种兼并引物的设计筛选方法。
本发明的第二目的是提供一种兼并引物的设计筛选产品。
为实现上述目的,本发明采用如下技术方案:
一种兼并引物的设计筛选方法,所述方法包括:
1)多重比对:物种序列进行多重比对;
2)k-mer划分:多重比对序列进行k-mer划分;
3)形成兼并k-mer:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;
4)形成候选引物集合:以不同引物长度L划分步骤3)后的序列,分别形成候选k-mer F引物集合和候选k-mer R引物集合;
5)组合引物对:对候选k-mer F引物集合和候选k-mer R引物集合中的引物进行两两引物对组合,筛选最优引物对。
在一些实施方式中,所述步骤5)中筛选的条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。
在一些实施方式中,所述步骤3)还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;
在一些优选的实施方式中,所述P(max)取值范围为20%-30%;更优选地为25%。
在一些实施方式中,所述步骤3)中基础引物设计条件为:序列不存在gap,GC含量为40%-60%,引物Tm为50-70℃。
在一些实施方式中,所述步骤3)中碱基转码规则为A→A,T→T,C→C,G→G,A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;转码后的反向互补规则为A→T,T→A,C→G,G→C,R→Y,Y→R,M→K,K→M,S→S,W→W,H→D,D→H,B→V,V→B,N→N;
在一些实施方式中,所述步骤5)中兼并引物Tm值计算公式为Tm=4×(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)+2×(A+T+W+(R+Y+M+K+N)/2+(H+D)×2/3+(B+V)/3),兼并引物GC含量计算公式为GC=(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)/L。
在一些实施方式中,所述步骤2)中所述k-mer,k取值范围为20-38;优选为25。
在一些实施方式中,所述步骤4)中所述L取值范围为L(min)≤L≤k;L(min)取值范围为18-21,优选为20。
在一些实施方式中,所述步骤5)中所述引物对组合取决于目标扩增区间长度T,T的取值范围为80-5k;优选为1-5k。
本发明还提供一种兼并引物的设计筛选系统/装置/产品,其特征在于,所述系统/装置/产品包含如下模块:
1)多重比对模块:物种序列进行多重比对;
2)k-mer划分模块:多重比对序列进行k-mer划分;
3)形成兼并k-mer模块:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;
4)形成候选引物集合模块:以不同引物长度L划分步骤3)后的序列,分别形成候选k-mer F引物集合和候选k-mer R引物集合;
5)组合引物对模块:对候选k-mer F引物集合和候选k-mer R引物集合中的引物进行两两引物对组合,筛选最优引物对。
在一些实施方式中,所述5)组合引物对模块中筛选条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。
在一些实施方式中,所述3)形成兼并k-mer模块还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;优选地,所述P(max)取值范围为20%-30%,更优选地为25%;
在一些实施方式中,所述3)形成兼并k-mer模块中,基础引物设计条件为序列不存在gap,GC含量为40%-60%,引物Tm为50-70℃。
在一些实施方式中,所述2)k-mer划分模块中k取值范围为20-38,优选为25;
在一些实施方式中,所述4)形成候选引物集合模块中L取值范围为L(min)≤L≤k,L(min)取值范围为18-21,优选为20;
在一些实施方式中,所述5)组合引物对模块中引物对组合取决于目标扩增区间长度T,T的取值范围为80-5k;优选为1-5k。
本发明还提供一种计算机可读介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一项所述兼并引物的设计筛选方法。
本发明还提供一种电子设备,其特征在于,包括处理器以及存储器,所述存储器上存储一条或多条可读指令,所述一条或多条可读指令被所述处理器执行时,实现上述任一项所述兼并引物的设计筛选方法。
本发明还提供上述任一所述的兼并引物的设计筛选系统/装置/产品,计算机可读介质或电子设备的应用,其特征在于,所述应用为以下任一应用:
1)在多重PCR扩增中的应用;
2)在宏基因组病原微生物靶向富集中的应用;
3)在宏基因组病原微生物检测中的应用;
4)在纳米孔测序检测中的应用。
本发明还提供一种通过上述方法设计筛选的针对腺病毒ONT靶向富集的引物对,具体序列参见seq id no.5-6。
本发明有益的技术效果:
1.本发明通过深入挖掘大量多物种序列数据,从物种基因或全基因组多重序列比对结果入手,惊奇发现在多物种基因多重序列比对下,可通过k-mer方法设计筛选兼并引物。
2.本发明采用k-mer方法从物种多重序列比对结果中设计兼并引物,克服了第三方软件无法设计兼并引物的缺陷,首次提供一种能够有效应用于多物种靶向富集兼并引物设计的方法;
3.本发明通过优化引入兼并引物Tm、GC值计算方法,可筛选出Tm值差异最小、GC含量适中的引物对作为候选引物,确保了引物对的可用性;
4.本发明通过大数据分析优化制定一套适合设计兼并引物的碱基转码、反向互补和引物对筛选规则。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1:靶向富集兼并引物设计筛选流程;
图2:湿实验PCR产物电泳结果。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限制本发明的范围,并且所述实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
部分术语定义
除非在下文中另有定义,本发明具体实施方式中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本发明。
如本发明中所使用,术语“包括”、“包含”、“具有”、“含有”或“涉及”为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。术语“由...组成”被认为是术语“包含”的优选实施方案。如果在下文中某一组被定义为包含至少一定数目的实施方案,这也应被理解为揭示了一个优选地仅由这些实施方案组成的组。
本发明中的术语“大约”、“大体”表示本领域技术人员能够理解的仍可保证论及特征的技术效果的准确度区间。该术语通常表示偏离指示数值的±10%,优选±5%。
在提及单数形式名词时使用的不定冠词或定冠词例如“一个”或“一种”,“所述”,包括该名词的复数形式。
此外,说明书和权利要求书中的术语第一、第二、第三、(a)、(b)、(c)以及诸如此类,是用于区分相似的元素,不是描述顺序或时间次序必须的。应理解,如此应用的术语在适当的环境下可互换,并且本发明描述的实施方案能以不同于本发明描述或举例说明的其它顺序实施。
以下术语或定义仅仅是为了帮助理解本发明而提供。这些定义不应被理解为具有小于本领域技术人员所理解的范围。
本发明中的部分技术术语解释如下:
本发明所述的“k-mer”是指将一条序列连续切割,逐个碱基划动得到k个碱基的子字符串,例如reads长度为L,k-mer长度设为k,则产生的k-mers数目为:L-k+1,再例如序列AACTGACT,设置k为3,则可以将其分割为AAC、ACT、CTG、TGA、GAC、ACT共6个k-mers。
本发明所述的“碱基转码”是指根据密码子的兼并性将两个或者更多不同的碱基用一个符号代替,例如A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;
本发明所述的“位置信息”是指所选k-mer在多重比对结果中的位置。
可以理解的是,任何包含上述设计方法的程序、软件、系统等应用都在本发明的保护范围之内。
本发明通过附图和如下实施例进一步描述,所述的附图和实施例只是为了例证本发明的特定实施方案,不应理解为以任何方式限制本发明范围之意。除非另外说明,本发明中所公开的实验方法均采用本技术领域常规技术,实施例中所用的试剂和原材料均可由市场购得。
实施例1靶向富集兼并引物设计方法的优化开发开发
本发明经大量生信分析优化开发如下靶向富集兼并引物的设计筛选方法:
1)多重比对:使用MAFFT软件对物种序列(全基因组或基因,一个物种对应一个id)作多重序列比对,保存为FASTA格式;
2)k-mer筛选:使用k-mer方法从物种多重序列比对结果中以满足引物设计条件进行过滤筛选。所述k-mer指的是将一条序列连续切割,逐个碱基划动得到的一序列长度为k的核苷酸序列。常规引物所述k取值范围通常为20-38,取值25为最优;所述引物设计条件为不允许存在gap,GC含量满足40%-60%之间,退火温度Tm值满足50-70℃之间,其中GC含量计算公式为(C+G)/K,Tm值计算公式为4×(C+G)+2×(A+T);
3)获得兼并k-mer:筛选与物种个数一致的k-mer多重比对结果进行同位置碱基转码获得兼并k-mer序列(F),同时记录k-mer起始、终止位置信息和反向互补k-mer序列(R)。所述碱基转码规则为A→A,T→T,C→C,G→G,A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;所述序列互补规则为A→T,T→A,C→G,G→C,R→Y,Y→R,M→K,K→M,S→S,W→W,H→D,D→H,B→V,V→B,N→N。
4)兼并k-mer序列过滤:统计碱基转码后k-mer中的兼并碱基占比P,根据占比P是否小于P(max)来判定转码k-mer的保守性,获得保守性k-mer序列。所述P(max)取值范围为20%-30%,以25%最佳。
5)获得获选引物集合:根据最小引物长度L(min),分别从对保守性k-mer序列(包含F/和R的k-mer序列),以不同引物长度L,中逐个碱基划分出划动得到所有不同引物长度L的集合,分别获得候选的k-merF引物集合和k-merR引物集合。所述L取值范围为L(min)≤L≤K;L(min)取值范围为18-21,以20最佳。
6)组合引物对,获取最优引物对:
1.选保守性k-mer F引物集合和另一保守性k-mer R引物集合进行两两引物对组合,所述组合条件为扩增区间大小T,所述T取值范围为80-5k,优选的为1-5k;
2.从引物对组合中筛选出最优引物对,所述组合限定筛选条件为兼并碱基最大个数N1,F与R间连续碱基互补最大个数N2,及兼并引物Tm值差异和GC含量,以Tm值差异最小的引物对为候选引物。N1取值范围为0-6,以4最佳;N2取值为4-5,以4最佳;Tm值取值范围为55-70,且引物对间Tm差异不超过2度,其中兼并引物Tm值计算公式为Tm=4×(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)+2×(A+T+W+(R+Y+M+K+N)/2+(H+D)×2/3+(B+V)/3);GC含量取值范围40%-60%,其中兼并引物GC含量计算公式为(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)/L。所述引物不能出现连续4个重复碱基;引物不能出现2个以上连续3个重复碱基;引物对首末端不能出现兼并序列;引物3’末端不能以A碱基结尾。
7)双重验证:1)生信验证:根据兼并引物位置提取所选物种对应地碱基序列与NT库比库验证引物的特异性;其中病毒物种的特异性为没有人/细菌/真菌/寄生虫的比对结果,细菌物种的特异性为没有人/病毒/真菌/寄生虫的比对结果,真菌物种的特异性为没有人/细菌/病毒/寄生虫的比对结果。2)湿实验验证:经生信物种特异性验证后,兼并引物进行湿试验靶向富集验证。
实施例2腺病毒ONT靶向富集引物的具体设计实验
1)数据准备
从RefSeq/GenBank库筛选靶向12种腺病毒的参考基因组,如下表所示。使用MAFFT软件对腺病毒全基因组作多重序列比对,并将结果保存为FASTA格式。
表1靶向12种腺病毒的参考基因组
| Organism_strain | Assembly_accession | Assembly_level |
| Human adenovirus B3 | GCA_000880515.1 | Complete Genome |
| Human adenovirus 55 | GCA_006401535.1 | Complete Genome |
| Human adenovirus 7 | GCF_000859485.1 | Complete Genome |
| Human mastadenovirus C | GCF_000845085.1 | Complete Genome |
| Human adenovirus 1 | GCF_000858645.1 | Complete Genome |
| Human adenovirus 2 | GCF_000859465.1 | Complete Genome |
| Human adenovirus 5 | GCF_000857865.1 | Complete Genome |
| Human mastadenovirus D | GCF_000845985.1 | Complete Genome |
| Human mastadenovirus E | GCF_000859665.1 | Complete Genome |
| Human adenovirus E4 | GCF_006415355.1 | Complete Genome |
| Human mastadenovirus F | GCF_000846685.1 | Complete Genome |
| Human adenovirus 52 | GCF_006448415.1 | Complete Genome |
2)兼并引物设计
2.1)对腺病毒全基因组多重序列比对结果切25-mer,以过滤掉gap,同时满足GC含量在40-60%、Tm值在50-70之间为条件进行过滤,同时保留25-mer起始/终止位置信息。所述Tm值计算公式为Tm=4×(C+G)+2×(A+T)。
2.2)以同位置25-mer个数和物种数一致为条件进行保守性25-mer筛选,并转化为兼并序列,同时记录k-mer起始、终止位置信息和反向互补k-mer序列(R)。所述转码规则A→A T→T,C→C,G→G,A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;所述序列互补规则为A→T,T→A,C→G,G→C,R→YY→R,M→K,K→M,S→S,W→W,H→D,D→H,B→V,V→B,N→N。
2.3)以兼并序列个数占比P小于P(max)进行保守性25-mer筛选,P(max)为25%。
2.4)对保守性k-mer序列(包含F/和R的k-mer序列),以不同引物长度L,逐个碱基划动得到所有不同引物长度L的集合,分别获得候选的k-mer F引物集合和k-mer R引物集合。所述L取值范围为L(min)≤L≤K;L(min)取值范围为18-21,以20最佳。
按照Target扩增区间1k-5k为条件进行25-mer和反向互补序列进行引物对组合,从25-mer和反向互补序列中分别切出各种引物长度L集合,从引物集合间挑选出Tm值差异最小的一对作为候选引物,并记录引物GC含量、长度、多重序列比对结果中的位置信息。
2.5)按照Target扩增区间1k-5k为条件,将k-mer F引物和k-mer R引物进行引物对组合,再从引物对组合中筛选出最优引物对,所述组合限定筛选条件为兼并碱基引物最大个数N1,F与R和连续间连续碱基互补最大个数N2,及兼并引物Tm值差异和GC含量,以N1取值范围为0-6(以4最佳)、N2取值为4-5(以4最佳)、Tm值取值范围为55-70℃,且引物对间Tm值差异不超过2℃、GC含量取值范围40%-60%的引物对为候选引物。
引物对组合时进行仍需满足以下条件:引物对间不能出现连续5个碱基的互补;引物不能出现连续4个重复碱基;引物不能出现2个以上连续3个重复碱基;引物对首末端不能出现兼并序列;引物3’末端不能以A碱基结尾。
其中兼并引物Tm值的计算公式为Tm=4×(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)+2×(A+T+W+(R+Y+M+K+N)/2+(H+D)×2/3+(B+V)/3);兼并引物GC含量计算公式为GC=(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)/L。
2.6)生信验证及过滤:根据兼并引物位置提取所选物种对应地碱基序列与NT库作blastn-short比对,过滤掉能比对上人、细菌、真菌或寄生虫的兼并引物,以确保候选引物的物种特异性。
2.7)按上述方法设计腺病毒兼并引物结果如下表:
进一步对引物最适合长度作优化筛选,以计算得到的Tm值是否接近60℃来判断最小引物长度为最优。
3)结果
由上表可知,其中最优的长度为20,因此最终获得引物对序列如下
实施例3腺病毒ONT靶向富集兼并引物的湿实验验证
1)试剂耗材
无酶无菌水:ThermoFisher,Nuclease-Free Water(not DEPC-Treated)(货号:AM9937);Qubit荧光定量仪DNA检测试剂盒:Qubit 1X dsDNA HS Assay Kit(货号:Q33231);PCR扩增酶:GXL DNA Polymerase(R050A)。
2)引物验证
以腺病毒标准品提取的核酸为模板,同时在PCR反应体系中增加gDNA模拟真实的临床样本,分别进行不同的TM值(52℃/55℃/58℃)的筛选,配置体系和反应条件如下表:
其中primer1、primer2分别指实施例2中腺病毒兼并引物primer F、primer R。
3)PCR产物浓度结果
4)PCR产物4200电泳结果
以PCR 55℃ PCR产物为例
A1(L):gDNA Marker
B1:腺病毒PCR产物模板目的条带2300bp,条带单一且与预期大小一致
C1:阴性对照gDNA
D1:阴性对照zymo
4200电泳结果如图2所示。
5)结果
腺病毒引物,测试了不同的退火温度,该引物在gDNA,Zymo(8种细菌2种真菌)以及水里不存在非特异性扩增,阳性标准品达到了有效的扩增效果。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,但本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
序列表
<110> 江苏先声医学诊断有限公司
北京先声医学检验实验室有限公司
江苏先声医疗器械有限公司
<120> 一种兼并引物的设计筛选方法
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
tvagbgcvga kgcrtacat 19
<210> 2
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ccaccacvyt vaactacct 19
<210> 3
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tvagbgcvga kgcrtacat 19
<210> 4
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ccaccacvyt vaactacct 19
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtvagbgcvg akgcrtacat 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gccaccacvy tvaactacct 20
<210> 7
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gtvagbgcvg akgcrtacat g 21
<210> 8
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gccaccacvy tvaactacct bt 22
Claims (15)
1.一种兼并引物的设计筛选方法,其特征在于,所述方法包括:
1)多重比对:物种序列进行多重比对;
2)k-mer划分:多重比对序列进行k-mer划分;
3)形成兼并k-mer:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;
4)形成候选引物集合:以不同引物长度L划分步骤3)后的序列,分别形成候选k-mer F引物集合和候选k-mer R引物集合;
5)组合引物对:对候选k-mer F引物集合和候选k-mer R引物集合中的引物进行两两引物对组合,筛选最优引物对。
2.根据权利要求1所述的设计筛选方法,其特征在于,所述步骤5)中筛选的条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。
3.根据权利要求1-2任一所述的设计筛选方法,其特征在于,所述步骤3)还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;优选地,所述P(max)取值范围为20%-30%,更优选地为25%。
4.根据权利要求1-3任一所述的设计筛选方法,其特征在于,所述步骤3)中基础引物设计条件为:序列不存在gap,GC含量为40%-60%,引物Tm为50-70℃。
5.根据权利要求1-4任一所述的设计筛选方法,其特征在于,所述步骤3)中碱基转码规则为A→A,T→T,C→C,G→G,A/G→R,C/T→Y,A/C→M,G/T→K,C/G→S,A/T→W,A/C/T→H,C/G/T→B,A/C/G→V,A/G/T→D,A/C/G/T→N;转码后的反向互补规则为A→T,T→A,C→G,G→C,R→Y,Y→R,M→K,K→M,S→S,W→w,H→D,D→H,B→V,V→B,N→N;所述步骤5)中兼并引物Tm值计算公式为Tm=4×(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)+2×(A+T+W+(R+Y+M+K+N)/2+(H+D)×2/3+(B+V)/3),兼并引物GC含量计算公式为GC=(C+G+S+(R+Y+M+K+N)/2+(H+D)/3+(B+V)×2/3)/L。
6.根据权利要求1-5任一所述的设计筛选方法,其特征在于,所述步骤2)中所述k-mer,k取值范围为20-38,优选为25。
7.根据权利要求1-6任一所述的设计筛选方法,其特征在于,所述步骤4)中所述L取值范围为L(min)≤L≤k;L(min)取值范围为18-21,优选为20。
8.根据权利要求1-7任一所述的设计筛选方法,其特征在于,所述步骤5)中所述引物对组合取决于目标扩增区间长度T,T的取值范围为80-5k;优选为1-5k。
9.一种兼并引物的设计筛选系统/装置/产品,其特征在于,所述系统/装置/产品包含如下模块:
1)多重比对模块:物种序列进行多重比对;
2)k-mer划分模块:多重比对序列进行k-mer划分;
3)形成兼并k-mer模块:划分后的多重比对k-mer以满足基础引物设计条件进行筛选,筛选后的k-mer进行同位置的碱基转码,形成兼并k-mer序列F和其反向互补k-mer序列R;
4)形成候选引物集合模块:以不同引物长度L划分步骤3)后的序列,分别形成候选k-mer F引物集合和候选k-mer R引物集合;
5)组合引物对模块:对候选k-mer F引物集合和候选k-mer R引物集合中的引物进行两两引物对组合,筛选最优引物对。
10.根据权利要求9所述的设计筛选系统/装置/产品,其特征在于,所述5)组合引物对模块中筛选条件为:兼并碱基最大个数为0-6,优选为4;F与R引物间连续碱基互补最大个数为4-5,优选为4;兼并引物Tm值取值范围为55-70℃,GC含量取值范围40%-60%。
11.根据权利要求10所述的设计筛选系统/装置/产品,其特征在于,所述3)形成兼并k-mer模块还包括统计碱基转码后k-mer中的兼并碱基占比P,筛选P<P(max)的k-mer序列;优选地,所述P(max)取值范围为20%-30%,更优选地为25%;基础引物设计条件为序列不存在gap,GC含量为40%-60%,引物Tm为50-70℃。
12.根据权利要求9-11任一所述的设计筛选系统/装置/产品,其特征在于,所述2)k-mer划分模块中k取值范围为20-38,优选为25;所述4)形成候选引物集合模块中L取值范围为L(min)≤L≤k,L(min)取值范围为18-21,优选为20;所述5)组合引物对模块中引物对组合取决于目标扩增区间长度T,T的取值范围为80-5k;优选为1-5k。
13.一种计算机可读介质,其存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至8中任一项所述兼并引物的设计筛选方法。
14.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器上存储一条或多条可读指令,所述一条或多条可读指令被所述处理器执行时,实现权利要求1至8中任一项所述兼并引物的设计筛选方法。
15.权利要求9-14任一所述的兼并引物的设计筛选系统/装置/产品,计算机可读介质或电子设备的应用,其特征在于,所述应用为以下任一应用:
1)在多重PCR扩增中的应用;
2)在宏基因组病原微生物靶向富集中的应用;
3)在宏基因组病原微生物检测中的应用;
4)在纳米孔测序检测中的应用。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010600299.XA CN111681711B (zh) | 2020-06-28 | 2020-06-28 | 一种兼并引物的设计筛选方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010600299.XA CN111681711B (zh) | 2020-06-28 | 2020-06-28 | 一种兼并引物的设计筛选方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN111681711A true CN111681711A (zh) | 2020-09-18 |
| CN111681711B CN111681711B (zh) | 2021-03-16 |
Family
ID=72437199
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202010600299.XA Active CN111681711B (zh) | 2020-06-28 | 2020-06-28 | 一种兼并引物的设计筛选方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111681711B (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112634983A (zh) * | 2021-01-08 | 2021-04-09 | 江苏先声医疗器械有限公司 | 病原物种特异pcr引物优化设计方法 |
| CN114351261A (zh) * | 2022-02-28 | 2022-04-15 | 江苏先声医学诊断有限公司 | 基于纳米孔测序平台的呼吸道样本难检病原微生物的检测方法 |
| CN115101126A (zh) * | 2022-02-22 | 2022-09-23 | 中国医学科学院北京协和医院 | 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统 |
| CN116959580A (zh) * | 2023-08-30 | 2023-10-27 | 予果生物科技(北京)有限公司 | 一种基于靶向高通量测序序列的比对方法及其应用 |
Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101613756A (zh) * | 2009-07-24 | 2009-12-30 | 深圳博睿祥晖生物技术有限公司 | 可用于多重连接扩增技术的长探针的制备方法 |
| CN101864493A (zh) * | 2009-04-17 | 2010-10-20 | 上海生物信息技术研究中心 | 检测人乳头瘤病毒的检测试剂盒及其制备和使用 |
| US20150347088A1 (en) * | 2014-05-30 | 2015-12-03 | Spiral Genetics, Inc. | Prefix burrows-wheeler transformations for creating and searching a merged lexeme set |
| CN105590038A (zh) * | 2014-10-22 | 2016-05-18 | 中国人民解放军军事医学科学院放射与辐射医学研究所 | 一种推断寡核苷酸在基因组上结合位点的方法和系统 |
| CN107937497A (zh) * | 2017-11-29 | 2018-04-20 | 拓普基因科技(广州)有限责任公司 | 一种基于Primer3的多重PCR引物设计方法 |
| CN108137642A (zh) * | 2015-09-25 | 2018-06-08 | 语境基因组学有限公司 | 分子质量保证方法在测序中的应用 |
| CN108334750A (zh) * | 2018-04-19 | 2018-07-27 | 江苏先声医学诊断有限公司 | 一种宏基因组数据分析方法及系统 |
| CN109658982A (zh) * | 2018-12-25 | 2019-04-19 | 人和未来生物科技(长沙)有限公司 | 一种用于基因测序的引物设计方法及系统 |
| CN110692101A (zh) * | 2018-01-05 | 2020-01-14 | 伊鲁米那股份有限公司 | 用于比对靶向的核酸测序数据的方法 |
| CN111180013A (zh) * | 2019-12-23 | 2020-05-19 | 北京橡鑫生物科技有限公司 | 检测血液病融合基因的装置 |
| CN111326210A (zh) * | 2020-03-11 | 2020-06-23 | 中国科学院生态环境研究中心 | 一种基于k-mer算法的引物设计方法及系统 |
-
2020
- 2020-06-28 CN CN202010600299.XA patent/CN111681711B/zh active Active
Patent Citations (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101864493A (zh) * | 2009-04-17 | 2010-10-20 | 上海生物信息技术研究中心 | 检测人乳头瘤病毒的检测试剂盒及其制备和使用 |
| CN101613756A (zh) * | 2009-07-24 | 2009-12-30 | 深圳博睿祥晖生物技术有限公司 | 可用于多重连接扩增技术的长探针的制备方法 |
| US20150347088A1 (en) * | 2014-05-30 | 2015-12-03 | Spiral Genetics, Inc. | Prefix burrows-wheeler transformations for creating and searching a merged lexeme set |
| CN105590038A (zh) * | 2014-10-22 | 2016-05-18 | 中国人民解放军军事医学科学院放射与辐射医学研究所 | 一种推断寡核苷酸在基因组上结合位点的方法和系统 |
| CN108137642A (zh) * | 2015-09-25 | 2018-06-08 | 语境基因组学有限公司 | 分子质量保证方法在测序中的应用 |
| CN107937497A (zh) * | 2017-11-29 | 2018-04-20 | 拓普基因科技(广州)有限责任公司 | 一种基于Primer3的多重PCR引物设计方法 |
| CN110692101A (zh) * | 2018-01-05 | 2020-01-14 | 伊鲁米那股份有限公司 | 用于比对靶向的核酸测序数据的方法 |
| CN108334750A (zh) * | 2018-04-19 | 2018-07-27 | 江苏先声医学诊断有限公司 | 一种宏基因组数据分析方法及系统 |
| CN109686408A (zh) * | 2018-04-19 | 2019-04-26 | 江苏先声医学诊断有限公司 | 一种鉴定耐药基因和/或耐药基因突变位点的宏基因组数据分析方法及系统 |
| CN109658982A (zh) * | 2018-12-25 | 2019-04-19 | 人和未来生物科技(长沙)有限公司 | 一种用于基因测序的引物设计方法及系统 |
| CN111180013A (zh) * | 2019-12-23 | 2020-05-19 | 北京橡鑫生物科技有限公司 | 检测血液病融合基因的装置 |
| CN111326210A (zh) * | 2020-03-11 | 2020-06-23 | 中国科学院生态环境研究中心 | 一种基于k-mer算法的引物设计方法及系统 |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112634983A (zh) * | 2021-01-08 | 2021-04-09 | 江苏先声医疗器械有限公司 | 病原物种特异pcr引物优化设计方法 |
| CN112634983B (zh) * | 2021-01-08 | 2021-07-09 | 江苏先声医疗器械有限公司 | 病原物种特异pcr引物优化设计方法 |
| CN115101126A (zh) * | 2022-02-22 | 2022-09-23 | 中国医学科学院北京协和医院 | 基于ce平台的呼吸道病毒和/或细菌亚型引物设计方法及系统 |
| CN114351261A (zh) * | 2022-02-28 | 2022-04-15 | 江苏先声医学诊断有限公司 | 基于纳米孔测序平台的呼吸道样本难检病原微生物的检测方法 |
| CN114351261B (zh) * | 2022-02-28 | 2023-12-15 | 江苏先声医学诊断有限公司 | 基于纳米孔测序平台的呼吸道样本难检病原微生物的检测方法 |
| CN116959580A (zh) * | 2023-08-30 | 2023-10-27 | 予果生物科技(北京)有限公司 | 一种基于靶向高通量测序序列的比对方法及其应用 |
| CN116959580B (zh) * | 2023-08-30 | 2025-09-19 | 予果生物科技(北京)有限公司 | 一种基于靶向高通量测序序列的比对方法及其应用 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN111681711B (zh) | 2021-03-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111681711B (zh) | 一种兼并引物的设计筛选方法 | |
| Tirosh et al. | Expanded skin virome in DOCK8-deficient patients | |
| Lanzén et al. | Exploring the composition and diversity of microbial communities at the Jan Mayen hydrothermal vent field using RNA and DNA | |
| Boughner et al. | Microbial ecology: where are we now? | |
| KR102864537B1 (ko) | 시퀀싱 공정 | |
| Mustafa et al. | Species identification and molecular typing of human Brucella isolates from Kuwait | |
| CN114774557B (zh) | 用于推断中国汉族人群个体年龄的组合标志物及其应用 | |
| Corich et al. | Sau-PCR, a novel amplification technique for genetic fingerprinting of microorganisms | |
| Furlani et al. | Sequencing of Nucleic Acids: from the First Human Genome to Next Generation Sequencing in COVID-19 Pandemic. | |
| Mani | Current status and challenges of DNA sequencing | |
| JP2025105745A (ja) | 遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム | |
| CN112634983B (zh) | 病原物种特异pcr引物优化设计方法 | |
| CN107267600A (zh) | 一种富集brca1和brca2基因目标区域的引物、方法、试剂盒及其应用 | |
| Pasookhush et al. | Single-strand conformation polymorphism fingerprint method for dictyostelids | |
| US11634774B2 (en) | Genome-wide capture of inter-transposable element segments for genomic sequence analysis of human DNA samples with microbial contamination | |
| US8481267B2 (en) | Genetic fingerprinting and identification method | |
| CN106191037B (zh) | 一种多重测序文库的构建方法 | |
| CN119162318B (zh) | 一种分析肿瘤细胞cin表观遗传特征的方法 | |
| US20240141447A1 (en) | Dynamic Clinical Assay Pipeline for Detecting a Virus | |
| Green et al. | Modern Diagnostic Methods in the 21st Century | |
| Wang et al. | Precise and highly sensitive detection of single nucleotide variations with a PfAgo and individualized probe combined fluorescent assay | |
| Sistrom et al. | Taking advantage of genomic data to develop reliable microsatellite loci in Trypanosoma brucei | |
| Dyrhovden | The use of 16S rRNA targeted next generation sequencing in diagnostics of polymicrobial invasive infections | |
| Hossain et al. | A micro-disc-based multiplex method for monitoring emerging SARS-CoV-2 variants using the molecular diagnostic tool Intelli-OVI | |
| Kowarsky et al. | Humans are colonized by many uncharacterized and highly divergent microbes |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |