RU2613489C2 - Method of detecting mutations in complex dna mixtures - Google Patents
Method of detecting mutations in complex dna mixtures Download PDFInfo
- Publication number
- RU2613489C2 RU2613489C2 RU2014137484A RU2014137484A RU2613489C2 RU 2613489 C2 RU2613489 C2 RU 2613489C2 RU 2014137484 A RU2014137484 A RU 2014137484A RU 2014137484 A RU2014137484 A RU 2014137484A RU 2613489 C2 RU2613489 C2 RU 2613489C2
- Authority
- RU
- Russia
- Prior art keywords
- seq
- pcr
- dna
- primers
- barcoding
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000035772 mutation Effects 0.000 title claims abstract description 71
- 239000000203 mixture Substances 0.000 title description 35
- 230000003321 amplification Effects 0.000 claims abstract description 60
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 59
- 238000012163 sequencing technique Methods 0.000 claims abstract description 56
- 108020004414 DNA Proteins 0.000 claims abstract description 27
- 239000013615 primer Substances 0.000 claims description 192
- 108090000623 proteins and genes Proteins 0.000 claims description 44
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 238000000746 purification Methods 0.000 claims description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 17
- 238000007403 mPCR Methods 0.000 claims description 16
- 102000053602 DNA Human genes 0.000 claims description 13
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 claims description 12
- 102100029075 Exonuclease 1 Human genes 0.000 claims description 12
- 230000000295 complement effect Effects 0.000 claims description 6
- 239000003155 DNA primer Substances 0.000 claims description 4
- 238000002523 gelfiltration Methods 0.000 claims description 3
- 238000011534 incubation Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 39
- 238000001514 detection method Methods 0.000 abstract description 8
- 239000000126 substance Substances 0.000 abstract description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 125
- 239000000523 sample Substances 0.000 description 56
- 239000000047 product Substances 0.000 description 55
- 206010028980 Neoplasm Diseases 0.000 description 45
- 239000002773 nucleotide Substances 0.000 description 35
- 125000003729 nucleotide group Chemical group 0.000 description 35
- 239000012634 fragment Substances 0.000 description 34
- 102000039446 nucleic acids Human genes 0.000 description 33
- 108020004707 nucleic acids Proteins 0.000 description 33
- 150000007523 nucleic acids Chemical class 0.000 description 33
- 239000011541 reaction mixture Substances 0.000 description 30
- 239000003153 chemical reaction reagent Substances 0.000 description 19
- 238000002703 mutagenesis Methods 0.000 description 19
- 231100000350 mutagenesis Toxicity 0.000 description 19
- 201000011510 cancer Diseases 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 15
- 238000000137 annealing Methods 0.000 description 14
- 210000004027 cell Anatomy 0.000 description 14
- 239000011159 matrix material Substances 0.000 description 14
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 13
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 13
- 108700024394 Exon Proteins 0.000 description 12
- 101150048834 braF gene Proteins 0.000 description 12
- 238000004925 denaturation Methods 0.000 description 12
- 230000036425 denaturation Effects 0.000 description 12
- 239000013060 biological fluid Substances 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000001914 filtration Methods 0.000 description 10
- 238000007481 next generation sequencing Methods 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 101710100969 Receptor tyrosine-protein kinase erbB-3 Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 239000003814 drug Substances 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 8
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 210000002381 plasma Anatomy 0.000 description 8
- 230000001605 fetal effect Effects 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 6
- 229960005542 ethidium bromide Drugs 0.000 description 6
- 238000013467 fragmentation Methods 0.000 description 6
- 238000006062 fragmentation reaction Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 101150039808 Egfr gene Proteins 0.000 description 5
- 206010027476 Metastases Diseases 0.000 description 5
- 238000000246 agarose gel electrophoresis Methods 0.000 description 5
- 239000012620 biological material Substances 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 108700021358 erbB-1 Genes Proteins 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 230000000869 mutational effect Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 4
- 238000009004 PCR Kit Methods 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 101150063858 Pik3ca gene Proteins 0.000 description 4
- 239000008049 TAE buffer Substances 0.000 description 4
- HGEVZDLYZYVYHD-UHFFFAOYSA-N acetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound CC(O)=O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O HGEVZDLYZYVYHD-UHFFFAOYSA-N 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 4
- 210000000601 blood cell Anatomy 0.000 description 4
- 239000007795 chemical reaction product Substances 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 239000012188 paraffin wax Substances 0.000 description 4
- 102000054765 polymorphisms of proteins Human genes 0.000 description 4
- 206010069754 Acquired gene mutation Diseases 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical class OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 101150041031 Gnaq gene Proteins 0.000 description 3
- 101150054472 HER2 gene Proteins 0.000 description 3
- 101150105104 Kras gene Proteins 0.000 description 3
- 101150040099 MAP2K2 gene Proteins 0.000 description 3
- 101150073096 NRAS gene Proteins 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 102000043276 Oncogene Human genes 0.000 description 3
- 108700025695 Suppressor Genes Proteins 0.000 description 3
- 101150080074 TP53 gene Proteins 0.000 description 3
- 101150045355 akt1 gene Proteins 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013399 early diagnosis Methods 0.000 description 3
- 108700020302 erbB-2 Genes Proteins 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 101150046722 idh1 gene Proteins 0.000 description 3
- 230000009401 metastasis Effects 0.000 description 3
- 108700025694 p53 Genes Proteins 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000037439 somatic mutation Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000007400 DNA extraction Methods 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 102100030708 GTPase KRas Human genes 0.000 description 2
- 206010071602 Genetic polymorphism Diseases 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- 101150117869 Hras gene Proteins 0.000 description 2
- 101150068332 KIT gene Proteins 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 101150100676 Map2k1 gene Proteins 0.000 description 2
- 101150024075 Mapk1 gene Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 208000003788 Neoplasm Micrometastasis Diseases 0.000 description 2
- 101150058540 RAC1 gene Proteins 0.000 description 2
- 101150101372 RAF1 gene Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 238000003149 assay kit Methods 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 210000004180 plasmocyte Anatomy 0.000 description 2
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 230000002335 preservative effect Effects 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 102200055464 rs113488022 Human genes 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 2
- ABDKAPXRBAPSQN-UHFFFAOYSA-N veratrole Chemical compound COC1=CC=CC=C1OC ABDKAPXRBAPSQN-UHFFFAOYSA-N 0.000 description 2
- KKVYYGGCHJGEFJ-UHFFFAOYSA-N 1-n-(4-chlorophenyl)-6-methyl-5-n-[3-(7h-purin-6-yl)pyridin-2-yl]isoquinoline-1,5-diamine Chemical compound N=1C=CC2=C(NC=3C(=CC=CN=3)C=3C=4N=CNC=4N=CN=3)C(C)=CC=C2C=1NC1=CC=C(Cl)C=C1 KKVYYGGCHJGEFJ-UHFFFAOYSA-N 0.000 description 1
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical compound COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- PQVHMOLNSYFXIJ-UHFFFAOYSA-N 4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1-[2-oxo-2-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethyl]pyrazole-3-carboxylic acid Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C=1C(=NN(C=1)CC(N1CC2=C(CC1)NN=N2)=O)C(=O)O PQVHMOLNSYFXIJ-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 101150019464 ARAF gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 101150037241 CTNNB1 gene Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 206010068051 Chimerism Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- 101150062673 GNA11 gene Proteins 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101000771237 Homo sapiens Serine/threonine-protein kinase A-Raf Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 101100381978 Mus musculus Braf gene Proteins 0.000 description 1
- 101100523539 Mus musculus Raf1 gene Proteins 0.000 description 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 101150102573 PCR1 gene Proteins 0.000 description 1
- 208000008900 Pancreatic Ductal Carcinoma Diseases 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 239000012162 RNA isolation reagent Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 239000012163 TRI reagent Substances 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 206010052779 Transplant rejections Diseases 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000007844 allele-specific PCR Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007845 assembly PCR Methods 0.000 description 1
- 208000026900 bile duct neoplasm Diseases 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- YDQXYRCYDMRJGD-UHFFFAOYSA-N chloroform;phenol;thiocyanic acid Chemical compound SC#N.ClC(Cl)Cl.OC1=CC=CC=C1 YDQXYRCYDMRJGD-UHFFFAOYSA-N 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 101150047356 dec-1 gene Proteins 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000000032 diagnostic agent Substances 0.000 description 1
- 238000004720 dielectrophoresis Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000001001 laser micro-dissection Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000007854 ligation-mediated PCR Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 208000012268 mitochondrial disease Diseases 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- -1 nucleoside triphosphate Chemical class 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000000771 oncological effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 201000008129 pancreatic ductal adenocarcinoma Diseases 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 201000000498 stomach carcinoma Diseases 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
Область изобретенияField of Invention
[01] Изобретение относится к области молекулярной биологии и медицины. В частности, изобретение направлено на методы детекции мутаций в образцах ДНК.[01] The invention relates to the field of molecular biology and medicine. In particular, the invention is directed to methods for detecting mutations in DNA samples.
Уровень техникиState of the art
[02] Ранняя диагностика и лечение онкологических заболеваний остаются одними из самых актуальных проблем современной медицины. Выявление таких заболеваний на ранних стадиях и выбор адекватной стратегии лечения позволяют существенно повысить шансы пациентов на выздоровление и снизить показатели смертности от рака.[02] Early diagnosis and treatment of cancer remain one of the most pressing problems of modern medicine. The identification of such diseases in the early stages and the selection of an adequate treatment strategy can significantly increase patients' chances of recovery and reduce cancer mortality rates.
[03] Основной причиной возникновения злокачественных новообразований в организме человека являются мутации, повреждающие работу важнейших регуляторных генов. Природа этих мутаций определяет вид опухоли, степень их злокачественности и чувствительность опухоли к лекарственным препаратам. Анализ молекул ДНК, несущих мутации опухолевого происхождения (онкомутации), позволяет прогнозировать агрессивность опухолей вероятность появления метастазов, а также рекомендовать выбор стратегии лечения. Вместе с тем онкомутации обладают почти абсолютной специфичностью, что делает их пригодными для оценки лекарственной чувствительности опухоли и детекции приобретенной резистентности. Таким образом, выявление онкомутаций имеет огромное прогностическое и диагностическое значение, что было доказано многолетней практикой (см., например, van der Heijden, M.S., et al. Clin Cancer Res. 2005 Oct 15; 11(20):7508-15; Thomas, R.K., et al. Nat Genet. 2007; 39(3):347-51; Diehl, F., et al. Nat Medicine. 2008; 14(9):985-90; Rizvi, Ν.Α., et al. Clin Cancer Res. 2011; 17(10):3500-6).[03] The main reason for the occurrence of malignant neoplasms in the human body are mutations that damage the functioning of the most important regulatory genes. The nature of these mutations determines the type of tumor, the degree of their malignancy and the sensitivity of the tumor to drugs. Analysis of DNA molecules carrying mutations of tumor origin (oncomutation) allows us to predict the aggressiveness of tumors and the likelihood of metastases, as well as recommend the choice of treatment strategy. At the same time, oncomutations have almost absolute specificity, which makes them suitable for evaluating the drug sensitivity of a tumor and detecting acquired resistance. Thus, the detection of cancer mutations is of great prognostic and diagnostic value, which has been proved by many years of practice (see, for example, van der Heijden, MS, et al. Clin Cancer Res. 2005 Oct 15; 11 (20): 7508-15; Thomas , RK, et al. Nat Genet. 2007; 39 (3): 347-51; Diehl, F., et al. Nat Medicine. 2008; 14 (9): 985-90; Rizvi, Ν.Α., et al. Clin Cancer Res. 2011; 17 (10): 3500-6).
[04] Анализ мутаций в «горячих точках» ключевых онкогенов и генов-супрессоров, включая мутации в экзоне 15 гена BRAF, экзоне 7 гена ARAF, экзоне 7 гена RAF1, экзоне 11 гена KIT, экзонах 2, 3, 4 гена KRAS, экзонах 2, 3, 4 гена NRAS, экзонах 2, 3, 4 гена HRAS, экзонах 2, 3, 6 гена MAP2K1, экзонах 4 и 6 гена MAP2K2, экзоне 7 гена MAPK1, экзонах 9 и 20 гена PIK3CA, экзоне 2 гена AKT1, экзоне 5 гена GNAQ, экзоне 5 гена GNA11, экзоне 2 гена RAC1, экзонах 12, 18, 19, 20, 21 гена EGFR, экзонах 8, 18, 19, 20, 21 гена HER2, экзонах 2, 3, 6, 7, 8, 9, 21, 23 гена HER3, экзонах 8, 12, 14, 21 гена HER4, экзонах 5, 6, 7, 8, 9 гена ТР53 и экзоне 3 гена CTNNB1 имеет существенное диагностическое, прогностическое и предиктивное значение при многих видах онкозаболеваний, включая рак легкого, рак молочной железы, рак толстой и прямой кишки, злокачественную меланому кожи, рак щитовидной железы, рак желудка, рак поджелудочной железы и желчных протоков, рак мочевого пузыря, глиальные опухоли голового мозга, саркомы костей и мягких тканей, многие типы лейкозов и лимфом (Vogelstein, В., et al. Science. 2013 Mar 29; 339(6127):1546-58; Watson, I.R., et al. Nat Rev Genet. 2013 Oct; 14(10):703-18; Weinstein, J.N., et al. Nat Genet. 2013 Oct; 45(10):1113-20; Kandoth, C., et al. Nature. 2013 Oct 17; 502(7471):333-9; http : cancer . sanger . ac . uk; http : cancergenome . nih . gov; http : p 53. free . fr; и мн. др.) Многие из указанных мутаций могут быть использованы как неинвазивные маркеры опухолевого присутствия, в том числе на ранних стадиях заболевания (Fleischhacker, M., Schmidt, В. Biochim Biophys Acta. 2007; 1775(1):181-232; Chen, Z., et al. PLoS One. 2009; 4(9):e7220; Newman, A.M., et al. Nat Med. 2014 May; 20(5):548-54).[04] Analysis of mutations in “hot spots” of key oncogenes and suppressor genes, including mutations in
[05] К настоящему моменту разработано значительное количество методов для выявления мутаций в ДНК. Большинство этих методов включают избирательную амплификацию аллелей, несущих мутации или полиморфизмы, в ходе ПЦР. Можно выделить следующие основные группы методов: аллель-специфическую ПЦР (Newton, С.R., et al. Nucleic Acids Res. 1989 Apr 11; 17(7):2503-16; Ruano, G., Kidd, K.K. Nucleic Acids Res. 1989; 17(20):8392; Sommer, S.S., et al. Mayo Clin Proc. 1989; 64(11):1361-72), ПЦР, опосредованную лигированием (Wu, D.Y. and Wallace, R.B. Genomics. 1989; 4(4):560-9; Shi, C., et al. Nat Methods. 2004; 1(2):141-7); корректирующую ПЦР (Zhang, J., et al. Trends Biotechnol. 2005 Feb; 23(2):92-6; Liu, Q., Sommer, S.S. Biotechniques. 2000 Nov; 29(5):1072-6); «холодную» ПЦР (Li, J., et al. Nat Med. 2008; 14(5):579-84; Milbury, C.Α., et al. Nucleic Acids Res. 2011; 39(1):e2); ПЦР, блокирующую дикий тип (Seyama, T., et al. Nucleic Acids Res. 1992; 20(10):2493-6; Orou, Α., et al. Hum Mutat. 1995; 6(2):163-9; Beau-Faller, M., et al. Br J Cancer. 2009; 100(6):985-92).[05] To date, a significant number of methods have been developed for detecting mutations in DNA. Most of these methods include the selective amplification of alleles carrying mutations or polymorphisms during PCR. The following main groups of methods can be distinguished: allele-specific PCR (Newton, C. R., et al. Nucleic Acids Res. 1989 Apr 11; 17 (7): 2503-16; Ruano, G., Kidd, KK Nucleic Acids Res . 1989; 17 (20): 8392; Sommer, SS, et al. Mayo Clin Proc. 1989; 64 (11): 1361-72), ligation-mediated PCR (Wu, DY and Wallace, RB Genomics. 1989; 4; 4). (4): 560-9; Shi, C., et al. Nat Methods. 2004; 1 (2): 141-7); corrective PCR (Zhang, J., et al. Trends Biotechnol. 2005 Feb; 23 (2): 92-6; Liu, Q., Sommer, S.S. Biotechniques. 2000 Nov; 29 (5): 1072-6); Cold PCR (Li, J., et al. Nat Med. 2008; 14 (5): 579-84; Milbury, C.Α., et al. Nucleic Acids Res. 2011; 39 (1): e2) ; Wild-type PCR (Seyama, T., et al. Nucleic Acids Res. 1992; 20 (10): 2493-6; Orou, Α., Et al. Hum Mutat. 1995; 6 (2): 163-9 ; Beau-Faller, M., et al. Br J Cancer. 2009; 100 (6): 985-92).
[06] Существенным недостатком первых двух методов является фактическое внесение в матрицу искомого аллельного варианта в ходе ПЦР. Продукт, полученный с применением этих методов, не может быть проверен никаким дополнительным способом, поскольку истинно положительный и ложноположительный результаты дают абсолютно одинаковую картину.[06] A significant drawback of the first two methods is the actual introduction of the desired allelic variant into the matrix during PCR. The product obtained using these methods cannot be tested in any additional way, since the truly positive and false positive results give exactly the same picture.
[07] Метод корректирующей ПЦР основан на реакциях, которые в любых условиях протекают с очень низкой эффективностью; вследствие этого он является не вполне применимым к большинству задач поиска редких мутаций и полиморфизмов, в которых исследуются частично деградированные образцы ДНК, а количество искомых молекул «на старте» может исчисляться единицами.[07] The method of correcting PCR is based on reactions that under any conditions proceed with very low efficiency; as a result, it is not entirely applicable to most tasks of searching for rare mutations and polymorphisms, in which partially degraded DNA samples are studied, and the number of desired molecules “at the start” can be calculated in units.
[08] Методы «холодной» ПЦР и ПЦР, блокирующей дикий тип, основаны на крайне небольших различиях в температуре плавления совершенных и несовершенных дуплексов; вследствие этого для получения воспроизводимых результатов при использовании этих методов необходимо прибегать или к использованию модифицированных олигонуклеотидных зондов (LNA, PNA, Р-HyP-PNA, ZNA и др.), которые дороги и сложны в синтезе, или к особым модификациям приборов для проведения ПЦР, позволяющим трансформировать небольшую разницу в температуре плавления в существенную разницу в эффективности ПЦР (а такие приборы существенно дороже стандартных, и подбор условий ПЦР для них достаточно сложен), или к крайне неудобным режимам проведения ПЦР (60 циклов продолжительностью более 10 минут каждый) (Galbiati, S., et al. Clin Chem. 2011; 57(1):136-8).[08] The methods of “cold” PCR and wild-type PCR blocking are based on extremely small differences in the melting temperature of perfect and imperfect duplexes; therefore, to obtain reproducible results when using these methods, it is necessary to resort either to the use of modified oligonucleotide probes (LNA, PNA, P-HyP-PNA, ZNA, etc.), which are expensive and difficult to synthesize, or to special modifications of PCR devices , allowing to transform a small difference in the melting temperature into a significant difference in the effectiveness of PCR (and such devices are much more expensive than standard ones, and the selection of PCR conditions for them is quite complicated), or to extremely inconvenient modes PCR (60 cycles of more than 10 minutes each) (Galbiati, S., et al. Clin Chem. 2011; 57 (1): 136-8).
[09] Тем не менее, при оптимизации условий перечисленные методы способны обеспечить избирательность порядка 1:100-1:200 (Pao, W., Ladanyi, M. Clin Cancer Res. 2007; 13(17):4954-5; Milbury, C.Α., et al. Clin Chem. 2009; 55(4):632-40) и широко используются для анализа мутаций. Однако для получения образцов ДНК, пригодных для анализа этими методами, необходимо взятие биопсии непосредственно из опухоли, что невозможно на ранних стадиях развития рака. Кроме того, все указанные методы позволяют анализировать только определенные мутации в заранее известных точках, что значительно снижает информативность анализа.[09] However, when optimizing conditions, the above methods can provide selectivity of the order of 1: 100-1: 200 (Pao, W., Ladanyi, M. Clin Cancer Res. 2007; 13 (17): 4954-5; Milbury, C.Α., et al. Clin Chem. 2009; 55 (4): 632-40) and are widely used for mutation analysis. However, to obtain DNA samples suitable for analysis by these methods, it is necessary to take a biopsy directly from the tumor, which is impossible in the early stages of cancer. In addition, all these methods allow you to analyze only certain mutations at previously known points, which significantly reduces the information content of the analysis.
[010] В последние годы было установлено, что фрагменты ДНК, несущие мутации опухолевого происхождения, присутствуют в биологических жидкостях человека даже при минимальном размере опухолевого очага (Diehl, F., et al. Proc Natl Acad Sci USA. 2005; 102(45):16368-73; Fleischhacker, M., Schmidt, В. Biochim Biophys Acta. 2007; 1775(1):181-232; Chen, Z., et al. PLoS One. 2009; 4(9):e7220). Детектирование мутаций в образцах опухолевой ДНК из крови пациентов открывает перспективы для ранней диагностики опухоли и ее рецидивов, мониторинга остаточной болезни и оценки радикальности проведенного лечения.[010] In recent years, it has been found that DNA fragments carrying mutations of tumor origin are present in human biological fluids even with a minimal tumor focus (Diehl, F., et al. Proc Natl Acad Sci USA. 2005; 102 (45) : 16368-73; Fleischhacker, M., Schmidt, B. Biochim Biophys Acta. 2007; 1775 (1): 181-232; Chen, Z., et al. PLoS One. 2009; 4 (9): e7220). Detection of mutations in tumor DNA samples from the blood of patients opens up prospects for early diagnosis of the tumor and its relapses, monitoring of residual disease and assessing the radical nature of the treatment.
[011] Однако на пути выявление таких мутаций встают нерешенные до настоящего времени технологические проблемы. Главные из них это: (а) необходимость одновременного анализа панели онкомутаций на фоне крайне малого количество циркулирующей ДНК в биологических жидкостях и (б) наличие в биологических жидкостях немутантой ДНК в соотношении 1000-100000 копий на одну молекулу опухолевого происхождения. Указанные проблемы делают невозможным использование классических методов мутационного анализа, перечисленных выше, так как их разрешающая способность на порядки ниже требуемого уровня (Liu, Q., Sommer, S.S. Hum Mutat. 2004 May; 23(5):426-36; Gilje, В., et al. J Mol Diagn. 2008 Jul; 10(4):325-31; Busby, K., Morris, A.J. Clin Pathol. 2005, 58(4):372-5). Таким образом, существует потребность в методах детекции мутаций, способных выявлять мутантную нуклеиновую кислоту на фоне тысячекратного (и выше) избытка референсной нуклеиновой кислоты.[011] However, the identification of such mutations is confronted with unresolved technological problems to date. The main ones are: (a) the need for a simultaneous analysis of the oncomutation panel against the background of an extremely small amount of circulating DNA in biological fluids, and (b) the presence of non-mutant DNA in biological fluids in a ratio of 1000-100000 copies per tumor molecule. These problems make it impossible to use the classical methods of mutational analysis listed above, since their resolution is orders of magnitude lower than the required level (Liu, Q., Sommer, SS Hum Mutat. 2004 May; 23 (5): 426-36; Gilje, B ., et al. J Mol Diagn. 2008 Jul; 10 (4): 325-31; Busby, K., Morris, AJ Clin Pathol. 2005, 58 (4): 372-5). Thus, there is a need for mutation detection methods capable of detecting mutant nucleic acid against a background of a thousand-fold (or higher) excess of reference nucleic acid.
[012] Предлагаемый в настоящей заявке способ направлен на выявление мутаций в образцах ДНК, где мутантные молекулы находятся в смеси с избытком нормальной (немутированной) ДНК. Метод находит применение, например, для выявления мутаций, анализ которых востребован для диагностики и мониторинга заболеваний, в ДНК опухолевого происхождения, выделенной из биопсийного материала или из биологических жидкостей.[012] The method proposed in this application is aimed at detecting mutations in DNA samples, where the mutant molecules are in a mixture with an excess of normal (non-mutated) DNA. The method finds application, for example, to detect mutations, the analysis of which is required for the diagnosis and monitoring of diseases, in DNA of tumor origin isolated from biopsy material or from biological fluids.
[013] Предлагаемый метод основан на молекулярном баркодировании, последующей амплификации целевых молекул ДНК и их секвенировании высокопроизводительными методами секвенирования, такими как методы секвенирования нового поколения.[013] The proposed method is based on molecular barcoding, subsequent amplification of target DNA molecules and their sequencing by high-performance sequencing methods, such as new generation sequencing methods.
[014] Как здесь используется, термины «высокопроизводительное секвенирование», «секвенирование нового поколения» или «NGS» (от next generation sequencing) относятся к группе технологий одновременного секвенирования огромного числа единичных молекул ДНК, в том числе технология 454, технология Illumina (Solexa SBS Technology), технология SoLID и технология IonTorrent (Metzker M.L. Nat Rev Genetics. 2010; 11(1):31-46; Mardis, Ε.R. Annual review of genomics and human genetics. 2008; 9:387-402; Bentley D.R., et al. Nature. 2008; 456(7218):53-59; Rothberg J.M., et al. Nature. 2011; 475(7356):348-352; Drmanac R., et al. Science. 2010; 327(5961):78-81; Eid J., et al. Science. 2009; 323(5910): 133-138; Lam H.Y., et al. Nature biotechnology. 2012; 30(1):78-82; Clark, M.J., et al. Nat Biotech. 2011; 29(10):908-914; Quail M.A., et al. BMC genomics. 2012; 13:341). Для всех этих технологий необходимы этапом пробоподготовки является введение так называемых «сиквенсовых адаптеров» в последовательность ДНК таким образом, что молекула ДНК оказывается фланкирована с одной стороны последовательностью адаптера А, а с другой - последовательностью адаптера Б. Последовательности секвенсовых адаптеров известны специалистам в данной области и предоставляются производителями коммерческих наборов для секвенирования нового поколения.[014] As used here, the terms “high throughput sequencing”, “next generation sequencing” or “NGS” (from next generation sequencing) refer to a group of technologies for simultaneously sequencing a huge number of single DNA molecules, including 454 technology, Illumina technology (Solexa SBS Technology), SoLID technology, and IonTorrent technology (Metzker ML Nat Rev Genetics. 2010; 11 (1): 31-46; Mardis, J. R. Annual review of genomics and human genetics. 2008; 9: 387-402; Bentley DR, et al. Nature. 2008; 456 (7218): 53-59; Rothberg JM, et al. Nature. 2011; 475 (7356): 348-352; Drmanac R., et al. Science. 2010; 327 ( 5961): 78-81; Eid J., et al. Science. 2009; 323 (5910): 133-138; Lam HY, et al. Nature biotechnology. 2012; 30 (1): 78-82 ; Clark, M.J., et al. Nat Biotech. 2011; 29 (10): 908-914; Quail M.A., et al. BMC genomics. 2012; 13: 341). For all these technologies, the stage of sample preparation is the introduction of the so-called “sequence adapters” into the DNA sequence so that the DNA molecule is flanked on one side by adapter A and on the other by adapter B. Sequence adapter sequences are known to those skilled in the art and provided by manufacturers of next-generation commercial sequencing kits.
[015] Близким аналогом предлагаемого метода является метод, предложенный Шмиттом и коллегами (Schmitt, M.W., et al. Proc Natl Acad Sci USA. 2012 Sep 4; 109(36):14508-13). Метод включает этапы синтеза двухцепочечных молекул баркодирующих ДНК-адаптеров, лигирования этих ДНК-адаптеров к молекулам ДНК образца, ПЦР-амплификации с универсальными праймерами, секвенирования нового поколения (NGS) и анализа данных с фильтрацией ошибок ПЦР и NGS. Синтез несущих баркод адаптеров осуществляется с помощью ПЦР на синтетической ДНК-матрице - олигонуклеотиде, содержащем случайную последовательность из 6-24 нуклеотидов.[015] A close analogue of the proposed method is the method proposed by Schmitt and colleagues (Schmitt, M.W., et al. Proc Natl Acad Sci USA. 2012 Sep 4; 109 (36): 14508-13). The method includes the steps of synthesizing double-stranded molecules of barcoding DNA adapters, ligating these DNA adapters to DNA molecules of a sample, PCR amplification with universal primers, next generation sequencing (NGS), and analyzing data with PCR and NGS error filtering. The synthesis of barcode-bearing adapters is carried out using PCR on a synthetic DNA matrix - an oligonucleotide containing a random sequence of 6-24 nucleotides.
[016] Заявленный метод отличается от указанного технологией баркодирования: (1) не используется полимеразный синтез двухцепочечных баркодирующих ДНК-адаптеров, что существенно снижает риск появления ошибок внутри самих баркодов; (2) введение баркодов осуществляется с помощью линейной ПЦР, что позволяет существенно увеличить разнообразие библиотеки, кардинально повысить специфичность анализа путем отсечения нецелевых молекул на этапе амплификации, а также сократить время пробоподготовки в случае анализа конечного количества регионов генома.[016] The claimed method differs from that indicated by the technology of barcoding: (1) polymerase synthesis of double-stranded barcoding DNA adapters is not used, which significantly reduces the risk of errors within the barcodes themselves; (2) the introduction of barcodes is carried out using linear PCR, which can significantly increase the diversity of the library, dramatically increase the specificity of the analysis by cutting off non-target molecules at the amplification stage, and also reduce the time of sample preparation in the case of analysis of a finite number of regions of the genome.
[017] Другой метод описан в работе Кинде и соавторов (Kinde, I., et al. Proc Nat Acad Sci USA. 2011; 23:9530-35). Метод включает введение синтетических баркодирующих праймеров с помощью ПЦР, дальнейшую ПЦР-амплификацию баркодированных молекул с использованием универсальных праймеров, секвенированиенового поколения (NGS) и анализ данных с фильтрацией ошибок ПЦР и NGS. Для введения баркодов используются 2 цикла ПЦР в присутствии баркодирующего и встречного ему праймеров.[017] Another method is described by Kinde et al. (Kinde, I., et al. Proc Nat Acad Sci USA. 2011; 23: 9530-35). The method includes the introduction of synthetic barcoding primers using PCR, further PCR amplification of the barcoded molecules using universal primers, sequencing of the new generation (NGS), and analysis of data with PCR and NGS error filtering. For the introduction of barcodes, 2 PCR cycles are used in the presence of the barcoding and counter primers.
[018] Баркодирование с помощью стандартной ПЦР имеет ряд недостатков. В связи с тем, что баркодированию должны подвергаться только молекулы ДНК исходного образца (но не продукты их амплификации), возможно использование не более двух циклов стандартной ПЦР (а в идеале - один цикл). Таким образом, каждой исходной молекуле соответствует единственная баркодированная копия. Это делает невозможным в дальнейшем различение ошибок полимеразного синтеза от истинных мутаций за счет «фильтрации по количеству». Принцип «фильтрации по количеству» основан на том, что истинные мутации, изначально присутствующие в образце, должны встречаться в «сырых данных» секвенирования значимо чаще, чем случайные замены, возникшие в ходе пробоподготовки и секвенирования. Кроме того, в этом случае не происходит увеличения исходного пула молекул для дальнейшего анализа, что осложняет работу с малыми количествами биологического материала.[018] Barcoding using standard PCR has several disadvantages. Due to the fact that only DNA molecules of the initial sample (but not the products of their amplification) should be barcoding, it is possible to use no more than two cycles of standard PCR (and ideally, one cycle). Thus, each source molecule corresponds to a single barcoded copy. This makes it impossible to further distinguish polymerase synthesis errors from true mutations due to "filtering by quantity." The principle of “filtering by quantity” is based on the fact that true mutations that were originally present in the sample should be found in the “raw data” of sequencing significantly more often than random substitutions that occurred during sample preparation and sequencing. In addition, in this case, there is no increase in the initial pool of molecules for further analysis, which complicates the work with small amounts of biological material.
[019] Заявленный метод предполагает более эффективную процедуру баркодирования с помощью линейной ПЦР. Использование линейной ПЦР для введения молекулярных баркодов имеет целый ряд принципиальных преимуществ по сравнению со стандартной ПЦР, в частности: 1) снимается ограничение на количество циклов реакции баркодирования, что дает возможность эффективно работать с низкими количествами исходной ДНК, а также выявлять ошибки ДНК-полимеразы, возникающие в процессе реакции баркодирования, путем «фильтрации по количеству»; 2) сохраняется стрэнд-специфичность реакции, что позволяет путем постановки двух реакций (первая - с прямым праймером, вторая - с обратным праймером на тот же регион генома) отличить истинные мутации от результатов повреждения исходной ДНК. Оптимизированные условия экзонуклеазной реакции, используемые в ряде применений заявленного метода, позволяют эффективно гидролизовать неиспользованные праймеры без существенной деградации продуктов линейной ПЦР. Кроме того, заявленный метод, в отличие от описанного Кинде и коллегами, адаптирован под мультиплексный анализ целевых регионов генома.[019] The claimed method involves a more efficient barcoding procedure using linear PCR. The use of linear PCR for introducing molecular barcodes has a number of fundamental advantages compared to standard PCR, in particular: 1) the restriction on the number of barcoding reaction cycles is removed, which makes it possible to efficiently work with low amounts of initial DNA, as well as detect DNA polymerase errors, arising in the process of barcoding, by "filtering by quantity"; 2) the strand specificity of the reaction is preserved, which allows one to distinguish true mutations from the results of damage to the original DNA by staging two reactions (the first with a direct primer and the second with a reverse primer in the same region of the genome). Optimized conditions of the exonuclease reaction used in a number of applications of the claimed method allow efficient hydrolysis of unused primers without significant degradation of linear PCR products. In addition, the claimed method, in contrast to that described by Kinde and colleagues, is adapted for multiplex analysis of target regions of the genome.
Сущность изобретенияSUMMARY OF THE INVENTION
[020] Настоящее изобретение обеспечивает способ выявления мутаций в целевых последовательностях ДНК (мутантных ДНК), отличающих целевые последовательности анализируемого образца ДНК от референсных последовательностей ДНК.[020] The present invention provides a method for detecting mutations in target DNA sequences (mutant DNAs) that distinguish target sequences of an analyzed DNA sample from reference DNA sequences.
[021] В некоторых применениях мутантная ДНК содержит одну или несколько точечных мутаций. В некоторых применениях мутантная ДНК содержит одну или несколько делеций одного или нескольких нуклеотидов. В некоторых применениях мутантная ДНК содержит одну или несколько инсерций одного или нескольких нуклеотидов.[021] In some applications, the mutated DNA contains one or more point mutations. In some applications, the mutant DNA contains one or more deletions of one or more nucleotides. In some applications, the mutant DNA contains one or more insertions of one or more nucleotides.
[022] Метод настоящего изобретения включает:[022] The method of the present invention includes:
(а) молекулярное баркодирование пула целевых молекул ДНК в образце ДНК;(a) molecular barcoding of a pool of target DNA molecules in a DNA sample;
(б) очистку продукта реакции баркодирования от остатков баркодирующего праймера;(b) purification of the product of the barcoding reaction from residues of the barcoding primer;
(в) амплификацию пула целевых молекул;(c) amplification of a pool of target molecules;
(г) введение сиквенсовых адаптеров в продукт ПЦР и секвенирование указанного продукта ПЦР;(d) introducing sequence adapters into the PCR product and sequencing said PCR product;
(д) идентификацию мутаций в целевых ДНК по данным секвенирования.(e) the identification of mutations in the target DNA according to sequencing data.
[023] Заявленный метод позволяет выявлять мутации в целевой последовательности ДНК в образцах, где содержится как мутантная, так и немутантная ДНК, причем отношение концентрации мутантной ДНК к немутантной может быть менее чем 1:100, например находится в пределах 1:100-1:100000, например, быть менее чем 1:140, быть менее чем 1:300, быть менее чем 1:1000, быть менее чем 1:5000 или быть менее чем 1:10000.[023] The claimed method allows you to detect mutations in the target DNA sequence in samples that contain both mutant and non-mutant DNA, and the ratio of the concentration of mutant to non-mutant DNA can be less than 1: 100, for example, in the range 1: 100-1: 100,000, for example, be less than 1: 140, be less than 1: 300, be less than 1: 1000, be less than 1: 5000, or be less than 1: 10000.
[024] В частности, заявленный метод позволяет выявлять мутации в фрагментах генов, выбранных из SEQ ID No: 1 - SEQ ID No: 62. Число целевых последовательностей, отобранных для анализа, может варьировать в зависимости от целей анализа и включает по крайней мере пять целевых последовательностей, чаще 6, 7 или более последовательностей, например, десять или более последовательностей, чаще семнадцать или более последовательностей, тридцать или более последовательностей, сорок или более последовательностей, пятьдесят или более последовательностей, шестьдесят и более последовательностей, семьдесят или более последовательностей, например, 10, 17, 18, 27, 28, 34, 35, 44, 45 или 62 последовательности.[024] In particular, the claimed method allows the detection of mutations in fragments of genes selected from SEQ ID No: 1 - SEQ ID No: 62. The number of target sequences selected for analysis may vary depending on the purpose of the analysis and includes at least five target sequences, usually 6, 7 or more sequences, for example, ten or more sequences, more often seventeen or more sequences, thirty or more sequences, forty or more sequences, fifty or more sequences, sixty and more than 70 sequences, seventy or more sequences, for example, 10, 17, 18, 27, 28, 34, 35, 44, 45 or 62 sequences.
[025] В преимущественных воплощениях молекулярное баркодирование осуществляется методом мультиплексной линейной ПЦР в присутствии баркодирующих праймеров. Число баркодирующих праймеров, используемых для линейной ПЦР, равно числу последовательностей, отобранных для анализа.[025] In preferred embodiments, molecular barcoding is performed by multiplex linear PCR in the presence of barcoding primers. The number of barcoding primers used for linear PCR is equal to the number of sequences selected for analysis.
[026] В некоторых воплощениях линейная ПЦР осуществляется в одной пробирке, в некоторых воплощениях линейная ПЦР осуществляется в двух, трех, четырех или более пробирках, каждая из которых содержит свой набор баркодирующих праймеров.[026] In some embodiments, linear PCR is performed in one tube, in some embodiments, linear PCR is performed in two, three, four or more tubes, each of which contains its own set of barcoding primers.
[027] В преимущественных воплощениях очистка от баркодирующего праймера включает обработку реакционной смеси экзонуклеазой I.[027] In preferred embodiments, purification from the barcoding primer comprises treating the reaction mixture with exonuclease I.
[028] Баркодированные молекулы ДНК амплифицируют в мультиплексной ПЦР и продукт амплификации используют для секвенирования. ПЦР осуществляется в том же числе пробирок, что и баркодирование целевых молекул. В преимущественных воплощениях секвенирование продукта амплификации осуществляется методами высокопроизводительного секвенирования.[028] Barcoded DNA molecules are amplified in multiplex PCR and the amplification product used for sequencing. PCR is carried out in the same number of tubes as the barcoding of target molecules. In preferred embodiments, the amplification product is sequenced by high throughput sequencing methods.
[029] В некоторых воплощениях введение сиквенсовых адаптеров осуществляется с помощью ПЦР с выходом наружу в присутствии заглубленных внутренних геноспецифических праймеров.[029] In some embodiments, the introduction of sequencing adapters is carried out using PCR with the release of in the presence of recessed internal gene-specific primers.
[030] В преимущественных воплощениях для выявления мутаций в данных секвенирования используется анализ потомков каждой целевой молекулы из исходного образца ДНК, где потомки одной молекулы выявляются по последовательности индивидуального баркода.[030] In preferred embodiments, the analysis of the descendants of each target molecule from the original DNA sample is used to detect mutations in the sequencing data, where the descendants of one molecule are identified by the sequence of an individual barcode.
[031] Также обеспечиваются наборы праймеров для осуществления метода настоящего изобретения для выявления мутаций во фрагментах ДНК, выбранных из группы SEQ ID No: 1 - SEQ ID No: 62.[031] Also provided are primer sets for implementing the method of the present invention for detecting mutations in DNA fragments selected from the group of SEQ ID No: 1 - SEQ ID No: 62.
[032] Также обеспечиваются наборы реагентов для осуществления метода настоящего изобретения для выявления мутаций во фрагментах ДНК, выбранных из группы SEQ ID No: 1 - SEQ ID No: 62. В преимущественных воплощениях наборы включают праймеры для баркодирования и праймеры для амплификации целевых молекул. В некоторых воплощениях наборы также включают праймеры для введения последовательностей сиквенсовых адаптеров в целевые молекулы с помощью заглубленной ПЦР и ПЦР с выходом наружу. В некоторых воплощениях наборы также включают реагентгенты для осуществления ПЦР. В некоторых воплощениях наборы также включают реагентгенты для очистки продуктов реакции баркодирования.[032] Reagent kits are also provided for implementing the method of the present invention for detecting mutations in DNA fragments selected from the group of SEQ ID No: 1 to SEQ ID No: 62. In preferred embodiments, the kits include barcode primers and primers for amplification of the target molecules. In some embodiments, the kits also include primers for introducing sequences of sequence adapters into the target molecules using in-depth PCR and outward PCR. In some embodiments, the kits also include reagents for the implementation of PCR. In some embodiments, the kits also include reagents for purifying the products of the barcoding reaction.
Краткое описание рисунковBrief Description of Drawings
[033] Рисунок 1 показывает структуру баркодирующего праймера.[033] Figure 1 shows the structure of a barcoding primer.
[034] Рисунок 2 иллюстрирует последовательность процедур пробоподготовки преимущественного воплощения метода настоящего изобретения.[034] Figure 2 illustrates the sequence of sample preparation procedures of a preferred embodiment of the method of the present invention.
[035] Рисунок 3 иллюстрирует различные способы введения сиквенсовых адаптеров.[035] Figure 3 illustrates various methods for introducing sequence adapters.
[036] Рисунок 4 показывает электрофореграммы продуктов двух последовательных раундов ПЦР после реакции баркодирования в присутствии двух праймеров (дорожка 1) и после реакции баркодирования в присутствии одного праймера (дорожка 2). M - маркер длин ДНК 100+ bp DNA Ladder (Евроген, Россия).[036] Figure 4 shows the electrophoregrams of the products of two consecutive PCR rounds after the barcoding reaction in the presence of two primers (lane 1) and after the barcoding reaction in the presence of one primer (lane 2). M -
[037] Рисунок 5 показывает электрофореграмму продуктов амплифкации образцов BRAF-wt (дорожка 1); BRAF-mut100 (дорожка 2); BRAF-mut1000 (дорожка 3). M - маркер длин ДНК 100+ bp DNA Ladder (Евроген, Россия).[037] Figure 5 shows an electrophoregram of the amplification products of BRAF-wt samples (lane 1); BRAF-mut100 (lane 2); BRAF-mut1000 (lane 3). M -
Подробное описание изобретенияDETAILED DESCRIPTION OF THE INVENTION
[038] Как указано выше, настоящее изобретение направлено на метод и набор для выявления мутаций в образце ДНК.[038] As indicated above, the present invention is directed to a method and kit for detecting mutations in a DNA sample.
[039] Метод настоящего изобретения включает[039] The method of the present invention includes
[040] (а) молекулярное баркодирование пула целевых молекул ДНК в образце ДНК;[040] (a) molecular barcoding of a pool of target DNA molecules in a DNA sample;
[041] (б) очистку продукта реакции баркодирования от остатков баркодирующего праймера;[041] (b) purification of the product of the barcoding reaction from residues of the barcoding primer;
[042] (в) амплификацию пула целевых молекул в мультиплексной ПЦР;[042] (c) amplification of a pool of target molecules in multiplex PCR;
[043] (г) введение сиквенсовых адаптеров в продукт мультиплексной ПЦР и секвенирование указанного продукта мультиплексной ПЦР;[043] (d) introducing sequence adapters into a multiplex PCR product and sequencing said multiplex PCR product;
[044] (д) идентификацию мутаций в целевых ДНК по данным секвенирования.[044] (e) the identification of mutations in the target DNA according to sequencing data.
[045] Заявленный метод позволяет выявлять мутации в целевой последовательности ДНК в образцах, где содержится как мутантная, так и немутантная ДНК, причем отношение концентрации мутантной ДНК к немутантной может составлять 1:300-1:100000, например, 1:2000, 1:5000 или 1:10000.[045] The claimed method allows to detect mutations in the target DNA sequence in samples that contain both mutant and non-mutant DNA, and the ratio of the concentration of mutant to non-mutant DNA can be 1: 300-1: 100000, for example, 1: 2000, 1: 5000 or 1: 10000.
[046] Указанный метод находит применение во многих приложениях, в частности, для детекции соматических мутаций для широкого круга задач в биологии и медицине, при анализе уровня спонтанного мутагенеза и при анализе генетического полиморфизма на пулированных образцах (в частности, в популяционной, эволюционной и экологической генетике). В частности, метод настоящего изобретения находит применение для выявления опухолевого присутствия по анализу внеклеточной ДНК из биологических жидкостей (кровь, моча).[046] This method is used in many applications, in particular, for the detection of somatic mutations for a wide range of problems in biology and medicine, in the analysis of the level of spontaneous mutagenesis and in the analysis of genetic polymorphism in pulled samples (in particular, in population, evolutionary and environmental genetics). In particular, the method of the present invention finds application for detecting the tumor presence by analyzing extracellular DNA from biological fluids (blood, urine).
[047] Также обеспечиваются наборы для осуществления метода настоящего изобретения.[047] Kits for implementing the method of the present invention are also provided.
[048] В преимущественных воплощениях наборы настоящего изобретения позволяют анализировать мутации во фрагментах генов, выбранных из группы SEQ ID No: 1 - SEQ ID No: 62. Метод настоящего изобретения может быть использован также для анализа любых других мутаций, однако для этого требуется подбор подходящих геноспецифических последовательностей праймеров и условий мультиплексной ПЦР.[048] In preferred embodiments, the kits of the present invention allow the analysis of mutations in fragments of genes selected from the group of SEQ ID No: 1 - SEQ ID No: 62. The method of the present invention can also be used to analyze any other mutations, however, this requires the selection of suitable gene-specific sequences of primers and multiplex PCR conditions.
[049] Различные термины, относящиеся к биологическим молекулам и методам настоящего изобретения, используются выше и также в описании и в формуле изобретения.[049] Various terms related to the biological molecules and methods of the present invention are used above and also in the description and in the claims.
[050] Следует заметить, что, как применяют здесь и в прилагаемой формуле изобретения, формы единственного числа включают объекты-ссылки множественного числа, если контекст явно не требует другого. Так, например, ссылка на «нуклеиновую кислоту» включает множество молекул таких нуклеиновых кислот.[050] It should be noted that, as used here and in the appended claims, singular forms include plural reference objects unless the context clearly requires otherwise. For example, reference to “nucleic acid” includes many molecules of such nucleic acids.
[051] Как здесь используется, молекула нуклеиновой кислоты - это молекула ДНК, такая как геномная ДНК или кДНК молекула. Как здесь используется, термин «кДНК» относится к нуклеиновым кислотам, которые обладают размещением элементов последовательности, найденным в нативных зрелых видах мРНК, где элементы последовательности - это экзоны и 5'- и 3'-некодирующие области.[051] As used here, a nucleic acid molecule is a DNA molecule, such as a genomic DNA or cDNA molecule. As used here, the term "cDNA" refers to nucleic acids that possess a sequence of sequence elements found in native mature types of mRNAs, where sequence elements are exons and 5'- and 3'-non-coding regions.
[052] Как здесь используется, термин «пробоподготовка» относится ко всем манипуляциям, которым подвергаются нуклеиновые кислоты после очистки и до секвенирования.[052] As used here, the term "sample preparation" refers to all the manipulations to which nucleic acids are subjected after purification and prior to sequencing.
[053] Как здесь используется, термин «мутант» или «мутантный» относится к молекуле ДНК, последовательность нуклеотидов которой отличается от последовательности референсной ДНК. Кроме того, термин «мутант» здесь относится к любому варианту, который короче или длиннее референсной ДНК. В некоторых применениях отличием является точечная замена. В некоторых применениях отличием является делеция или инсерция одного или нескольких нуклеотидов. Для нужд настоящего изобретения размер делеции или инсерции не превышает 150 нуклеотидов, преимущественно не превышает 100 нуклеотидов. За исключением указанных отличий, последовательности мутантной и референсной ДНК идентичны. В преимущественных применениях последовательность референсной ДНК идентична последовательности ДНК дикого типа человека.[053] As used here, the term "mutant" or "mutant" refers to a DNA molecule whose nucleotide sequence is different from the reference DNA sequence. In addition, the term "mutant" refers to any variant that is shorter or longer than the reference DNA. In some applications, the difference is spot replacement. In some applications, the difference is a deletion or insertion of one or more nucleotides. For the needs of the present invention, the size of the deletion or insertion does not exceed 150 nucleotides, preferably does not exceed 100 nucleotides. With the exception of these differences, the sequences of the mutant and reference DNA are identical. In preferred applications, the reference DNA sequence is identical to the wild-type human DNA sequence.
[054] Как здесь используется, термин «горячая точка» относится к позиции в молекуле ДНК, если в этой позиции при определенных условиях часто возникает мутация. Так, по отношению к ключевым онкогенам и генам-супрессорам термин «горячая точка» обозначает позицию мутации, часто возникающей в онкогенезе. По отношению к ошибкам ПЦР термин «горячая точка» обозначает позицию в ДНК-матрице, если в этой позиции преимущественно локализуются ошибки полимеразного синтеза ДНК.[054] As used here, the term "hot spot" refers to a position in a DNA molecule if a mutation often occurs in this position under certain conditions. So, in relation to key oncogenes and suppressor genes, the term "hot spot" refers to the position of a mutation that often occurs in oncogenesis. In relation to PCR errors, the term “hot spot” denotes a position in the DNA matrix if polymerase DNA synthesis errors are predominantly localized in this position.
[055] Процент идентичности последовательностей с референсной определяется путем их сравнительного анализа. Алгоритмы для анализа последовательности известны в данной области, такие как BLAST, описанный в: Altschul et al. J. Mol. Biol., 1990, 215, pp. 403-10. Для целей настоящего изобретения сравнение нуклеотидных и аминокислотных последовательностей, производимое с помощью пакета программ Blast, предоставляемого National Center for Biotechnology Information (http:www.ncbi.nlm.nih.gov/blast), с использованием содержащего разрывы выравнивания со стандартными параметрами, может быть использовано для определения уровня идентичности и сходства между нуклеотидными последовательностями.[055] The percentage of sequence identity with the reference is determined by comparative analysis. Algorithms for sequence analysis are known in the art, such as BLAST described in: Altschul et al. J. Mol. Biol., 1990, 215, pp. 403-10. For the purposes of the present invention, nucleotide and amino acid sequence comparisons performed using the Blast software package provided by the National Center for Biotechnology Information ( http: www.ncbi.nlm.nih.gov/blast ) using alignment breaks with standard parameters can be used to determine the level of identity and similarity between nucleotide sequences.
[056] Как здесь используется, нуклеотидные последовательности «по существу сходны» или «по существу такие же, как референсная последовательность», если нуклеотидные последовательности имеют по крайней мере 85% идентичности друг с другом или с указанной последовательностью внутри выбранного для сравнения региона. Таким образом, по существу сходные последовательности включают те, которые имеют, например, по крайней мере, 85% идентичности, по крайней мере, 90% идентичности, по крайней мере, 95% идентичности или по крайней мере, 96%, 97%, 98% или 99% идентичности. Две последовательности, которые идентичны одна другой, так же по существу сходны.[056] As used here, the nucleotide sequences are "substantially similar" or "substantially the same as the reference sequence" if the nucleotide sequences have at least 85% identity with each other or with the specified sequence within the region selected for comparison. Thus, substantially similar sequences include those that have, for example, at least 85% identity, at least 90% identity, at least 95% identity, or at least 96%, 97%, 98 % or 99% identity. Two sequences that are identical to one another are also essentially similar.
[057] Как здесь используется, термин «ПЦР» относится к широко известному методу полимеразной цепной реакции (описанному, например, в Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, New York, 1989; Erlich, PCR Technology, Stockton Press, New York, 1989; Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press, Harcourt Brace Javanovich, New York, 1990; Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989; Barnes, W.M. Proc Natl Acad Sd USA, 1994, 91, 2216-2220). Стандартная реакционная смесь для ПЦР включает ДНК-полимеразу, буфер, обеспечивающий оптимальную работу ДНК-полимеразы, хлорид магния, дезоксинуклеотидтрифосфаты, ДНК-матрицу и олигонуклеотидные праймеры.[057] As used here, the term "PCR" refers to the well-known method of polymerase chain reaction (described, for example, in Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, New York, 1989; Erlich, PCR Technology , Stockton Press, New York, 1989; Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press, Harcourt Brace Javanovich, New York, 1990; Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989; Barnes, WM Proc Natl Acad Sd USA, 1994, 91, 2216-2220). A standard PCR reaction mixture includes DNA polymerase, a buffer that ensures the optimal functioning of DNA polymerase, magnesium chloride, deoxynucleotide triphosphates, DNA matrix, and oligonucleotide primers.
[058] Реакционная смесь для ПЦР содержит Mg2+-ионы в концентрации 0,1-10 мМ, дезоксирибонуклеозидтрифосфаты (dNTPs), включая АТФ (dATP), ГТФ (dGTP), ЦТФ (dCTP) и ТТФ (dTTP), в конечной концентрации 20-800 мкМ каждого, как правило, 160-600 мкМ, преимущественно 200-300 мкМ. Реакционная смесь для ПЦР может содержать другие компоненты, например, вещества, облегчающие амплификацию GC-богатых участков, антитела, обеспечивающие горячий старт, и т.д. Подобные компоненты хорошо известны специалистам в данной области.[058] The reaction mixture for PCR contains Mg2 + ions in a concentration of 0.1-10 mM, deoxyribonucleoside triphosphates (dNTPs), including ATP (dATP), GTP (dGTP), CTF (dCTP) and TTF (dTTP), in a final concentration of 20 -800 μM each, typically 160-600 μM, preferably 200-300 μM. The PCR reaction mixture may contain other components, for example, substances that facilitate the amplification of GC-rich regions, antibodies that provide a hot start, etc. Such components are well known to those skilled in the art.
[059] Объем реакционной смеси для ПЦР составляет, как правило, 10-100 мкл, чаще 15-50 мкл, например, 20 мкл или 25 мкл. Количество ДНК матрицы, добавляемой в реакционную смесь для ПЦР, находится в пределах от 10 пг до 1 мкг, как правило, от 100 пкг до 200 нг, например, 2 нг на реакцию, или 5 нг на реакцию, или 10 нг на реакцию, или 50 нг на реакцию, или 100 нг на реакцию.[059] The volume of the reaction mixture for PCR is usually 10-100 μl, usually 15-50 μl, for example, 20 μl or 25 μl. The amount of DNA template added to the PCR reaction mixture is in the range of 10 pg to 1 μg, typically from 100 pg to 200 ng, for example, 2 ng per reaction, or 5 ng per reaction, or 10 ng per reaction, or 50 ng per reaction, or 100 ng per reaction.
[060] Как здесь используется, термин «праймер» относится к олигонуклеотидам, рутинно используемым в ПЦР в качестве затравки для ДНК-полимеразы. Как здесь используется, термин «геноспецифический» относится к последовательностям праймеров, способным отжигаться (имеющим «сайт отжига») на целевую нуклеиновую кислоту за счет входящих в его состав последовательностей, комплементарных указанной нуклеиновой кислоте. В качестве праймеров выступают синтетические олигонуклеотиды. Синтетические олигонуклеотиды могут быть приготовлены с помощью фосфорамидитного метода и очищены с помощью методов, хорошо известных в данной области, таких как высокоэффективная жидкостная хроматография (ВЭЖХ), или других методов, как описано, например, в Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., (1989) Cold Spring Harbor Press, Cold Spring Harbor, NY, или по инструкции, описанной в, например, United States Dept. of HHS, National Institute of Health (NIH) Guidelines for Recombinant DNA Research.[060] As used here, the term "primer" refers to oligonucleotides routinely used in PCR as a seed for DNA polymerase. As used here, the term "gene-specific" refers to sequences of primers capable of annealing (having an "annealing site") to the target nucleic acid due to its constituent sequences complementary to the specified nucleic acid. Synthetic oligonucleotides act as primers. Synthetic oligonucleotides can be prepared using the phosphoramidite method and purified using methods well known in the art, such as high performance liquid chromatography (HPLC), or other methods, as described, for example, in Sambrook et al., Molecular Cloning: A Laboratory Manual, 2 nd Ed., (1989) Cold Spring Harbor Press, Cold Spring Harbor, NY, or according to the instructions described in, for example, United States Dept. of HHS, National Institute of Health (NIH) Guidelines for Recombinant DNA Research.
[061] Олигонуклеотидные праймеры, используемые для ПЦР, имеют «сайт отжига» на целевые последовательности, например, на последовательности, введенные в молекулы ДНК в ходе предшествующей пробоподготовки (так называемые универсальные или адаптерные последовательности) или на геноспецифические последовательности целевых молекул. Термин «сайт отжига» в этом контексте означает последовательность нуклеотидов, комплементарную целевой последовательности и служащую затравкой для ДНК-полимеразы.[061] The oligonucleotide primers used for PCR have an annealing site for target sequences, for example, sequences introduced into DNA molecules during previous sample preparation (the so-called universal or adapter sequences) or gene-specific sequences of target molecules. The term "annealing site" in this context means a nucleotide sequence that is complementary to the target sequence and serves as a seed for DNA polymerase.
[062] Способы выбора геноспецифической последовательности для праймера хорошо известны. Как правило, длина геноспецифической последовательности не менее 10, но не более 100 нуклеотидов, чаще 15-30 нуклеотидов. Адаптерная последовательность выбирается таким образом, чтобы минимизировать неспецифическую амплификацию в ходе последующих ПЦР. Длина адаптерной последовательности может варьировать от 10 до 100 нуклеотидов и как правило составляет 15-30 нуклеотидов.[062] Methods for selecting a gene-specific sequence for a primer are well known. As a rule, the length of a gene-specific sequence is not less than 10, but not more than 100 nucleotides, usually 15-30 nucleotides. The adapter sequence is chosen so as to minimize non-specific amplification during subsequent PCR. The length of the adapter sequence can vary from 10 to 100 nucleotides and typically is 15-30 nucleotides.
[063] Как здесь используется, термин «целевая нуклеиновая кислота» относится к нуклеиновой кислоте, мутации в которой представляют интерес.[063] As used here, the term "target nucleic acid" refers to a nucleic acid in which mutations are of interest.
[064] Как здесь используется, термин «выделенный» означает молекулу или клетку, которая находится в среде, отличной от среды, в которой молекула или клетка находится в естественных условиях.[064] As used here, the term "isolated" means a molecule or cell that is in an environment other than the environment in which the molecule or cell is in vivo.
[065] Как здесь используется, термины «опухолевая ДНК», «ДНК опухолевого происхождения» или подобные означают ДНК или кДНК, происходящую из злокачественных опухолевых клеток.[065] As used here, the terms "tumor DNA", "DNA of tumor origin" or the like mean DNA or cDNA originating from malignant tumor cells.
[066] Как здесь используется, термин «онкомутация» означает изменение в последовательности гена (точечную замену, делецию или инсерцию), возникшее в опухолевой ДНК.[066] As used here, the term "oncutation" means a change in the gene sequence (point change, deletion or insertion) that has occurred in the tumor DNA.
[067] Как здесь используется, термин «внеклеточная ДНК» означает ДНК, находящуюся в биологических жидкостях, циркулирующих во внеклеточном пространстве (например, в моче или в плазме крови).[067] As used here, the term "extracellular DNA" means DNA located in biological fluids circulating in the extracellular space (for example, in urine or in blood plasma).
[068] Получение образца ДНК, содержащего целевые молекулы ДНК[068] Obtaining a DNA sample containing the target DNA molecule
[069] Мутантная ДНК может присутствовать в исследуемом образце ДНК, выделенном из биологического материала, или быть добавлена экзогенно.[069] Mutant DNA may be present in a test sample of DNA isolated from biological material, or may be added exogenously.
[070] Различия в нуклеотидной последовательности между высоко сходными нуклеотидными последовательностями мутантной и референсной ДНК (замены, делеции и инсерции) могут представлять однонуклеотидные полиморфизмы, а также мутации в последовательности, которые возникают в процессе нормальной репликации или дупликации, в том числе соматические мутации или мутации de novo.[070] Differences in the nucleotide sequence between highly similar nucleotide sequences of mutant and reference DNA (substitutions, deletions and insertions) can represent single nucleotide polymorphisms, as well as mutations in the sequence that occur during normal replication or duplication, including somatic mutations or mutations de novo.
[071] Другие мутации (замены, делеции и инсерции) могут быть специально рассчитаны и вставлены в последовательность для определенных целей, таких как создание искусственной мутантной ДНК. Такие специальные замены могут быть произведены in vitro с помощью различных технологий мутагенеза или получены в организмах-хозяевах, находящихся в специфических селекционных условиях, которые индуцируют или отбирают эти изменения. Такие специально полученные варианты последовательности могут быть названы «мутантами» или «производными» исходной последовательности.[071] Other mutations (substitutions, deletions and insertions) can be specifically calculated and inserted into the sequence for specific purposes, such as the creation of artificial mutant DNA. Such special substitutions can be made in vitro using various mutagenesis technologies or obtained in host organisms under specific breeding conditions that induce or select these changes. Such specially prepared sequence variants may be called “mutants” or “derivatives” of the original sequence.
[072] Мутантные ДНК могут быть получены на матричной нуклеиновой кислоте путем модификации, делеции или добавления одного или более нуклеотидов в матричной последовательности или их комбинации, для получения варианта матричной нуклеиновой кислоты. Модификации, добавления или делеции могут быть выполнены любым способом, известным в данной области (см. например Gustin et al. Biotechniques. 1993. 14:22; Barany Gene. 1985. 37:111-123; Colicelli et al. Mol. Gen. Genet. (1985. 199:537-539; Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108), включая подверженный ошибкам ПЦР (error-prone PCR), shuffling, олигонуклеотид-направленный мутагенез, ПЦР со сборкой, парный ПЦР-мутагенез, мутагенез in vivo, кассетный мутагенез, рекурсивный множественный мутагенез, экспоненциальный множественный мутагенез, сайт-специфический мутагенез, случайный мутагенез, генное реассемблирование (gene reassembly), генный сайт-насыщающий мутагенез (GSSM), искусственную перестройку с лигированием (SLR) или их комбинации. Модификации, добавления или делеции могут быть также выполнены методом, включающим рекомбинацию, рекурсивную рекомбинацию последовательностей, фосфотиоат-модифицированный мутагенез ДНК, мутагенез на урацил-содержащей матрице, мутагенез с двойным пропуском, точечный восстановительный по рассогласованию мутагенез, мутагенез штамма, дефицитного по восстановлениям, химический мутагенез, радиоактивный мутагенез, делеционный мутагенез, рестрикционно-избирательный мутагенез, рестрикционный мутагенез с очисткой, синтез искусственных генов, множественный мутагенез, создание химерных множественных нуклеиновых кислот и их комбинации.[072] Mutant DNAs can be obtained on a template nucleic acid by modifying, deleting, or adding one or more nucleotides in a template sequence, or a combination thereof, to obtain a template template nucleic acid. Modifications, additions or deletions can be performed by any method known in the art (see, for example, Gustin et al. Biotechniques. 1993. 14:22; Barany Gene. 1985. 37: 111-123; Colicelli et al. Mol. Gen. Genet. (1985.1993: 537-539; Sambrook et al., Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108), including error prone PCR, shuffling, oligonucleotide directed mutagenesis, assembly PCR, paired PCR mutagenesis, in vivo mutagenesis, cassette mutagenesis, recursive multiple mutagenesis, exponential multiple mutagenesis, site-specific mutagenesis, random mutagenesis, gene reass gene reassembly, gene site-saturating mutagenesis (GSSM), ligation-assisted rearrangement (SLR), or combinations thereof. Modifications, additions or deletions can also be performed by a method including recombination, recursive recombination of sequences, phosphotioate-modified DNA mutagenesis, mutagenesis on a uracil-containing matrix, double-pass mutagenesis, mismatch-specific reductive mutagenesis, reduction-deficient mutagenesis, chemical mutagenesis, radioactive mutagenesis, deletion mutagenesis, restriction-selective mutagenesis, purification restriction mutagenesis, synthesis of artificial genes, multiple mutagenesis, the creation of chimeric multiple nucleic acids and their combinations.
[073] Образец ДНК может быть выделен из биологического материала, например, из культур клеток, тканей, мазков и соскобов, биопсийного материала, биологических жидкостей (кровь, моча, слюна) животных, включая человека. Для выделения геномной ДНК могут быть использованы любые методы, известные в данной области. Например, могут быть использованы методы, описанные Sambrook et al. (Molecular Cloning: A Laboratory Manual, 2nd edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989), или коммерчески доступные наборы для выделения ДНК, такие как наборы серий DiaTom или MagNA (ООО «Лаборатория Изоген», Россия) или серии DNEasy (фирма QiaGen, Германия) или их аналоги.[073] A DNA sample can be isolated from biological material, for example, from cultures of cells, tissues, smears and scrapings, biopsy material, body fluids (blood, urine, saliva) of animals, including humans. Any method known in the art can be used to isolate genomic DNA. For example, the methods described by Sambrook et al. Can be used. (Molecular Cloning: A Laboratory Manual, 2nd edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 1989), or commercially available DNA isolation kits, such as DiaTom or MagNA kits, Isogen Laboratory LLC, Russia ) or the DNEasy series (QiaGen company, Germany) or their analogues.
[074] Из биологических объектов может быть так же выделена суммарная РНК или поли(А) фракция РНК. Выделение РНК может быть выполнено любым способом, известным в данной области (например, могут быть использованы коммерчески доступные реагенты для выделения РНК, такие как Trizol (GIBCO/Life Technologies), TRI Reagent (Ambion), или RNeasy kits (QIAGEN) или метод гуанидин тиоцианат-фенол-хлороформной экстракции, описанный Chomczynski & Sacchi, 1987 (Anal. Biochem. 162, 156-159). Образцы РНК могут быть использованы для приготовления образцов кДНК с помощью технологий синтеза, известных в данной области, например, метод Гилбера-Хоффмана (Gubler, U., Hoffman, B.J. Gene. 1983. V. 25. P. 263-269), методы с использованием ДНК-лигазы фага Т4 (Akowitz & Manuelidis Gene. 1989. V. 81. P. 295-306; Lukyanov et al. Biophys. Biochem. Res. Comm. 1997. V. 230, P. 285-288), метод синтеза кДНК со сменой матрицы (Chenchik et al., (1998) Gene Cloning and Analysis by RT-PCR, ed. by Ρ Siebert and J Larrick, BioTechniques Books, Natick, MA, 305-319; Zhu et al. Biotechniques. 2001. 30, 892-897) и другие.[074] Total biological RNA or a poly (A) RNA fraction can also be isolated from biological objects. RNA isolation can be performed by any method known in the art (for example, commercially available RNA isolation reagents such as Trizol (GIBCO / Life Technologies), TRI Reagent (Ambion), or RNeasy kits (QIAGEN) or the guanidine method can be used thiocyanate-phenol-chloroform extraction described by Chomczynski & Sacchi, 1987 (Anal. Biochem. 162, 156-159). RNA samples can be used to prepare cDNA samples using synthesis techniques known in the art, for example, the Hilbert-Hoffman method (Gubler, U., Hoffman, BJ Gene. 1983. V. 25. P. 263-269), methods using DNA-l gases of phage T4 (Akowitz & Manuelidis Gene. 1989. V. 81. P. 295-306; Lukyanov et al. Biophys. Biochem. Res. Comm. 1997. V. 230, P. 285-288), cDNA synthesis method matrix change (Chenchik et al., (1998) Gene Cloning and Analysis by RT-PCR, ed. by Ρ Siebert and J Larrick, BioTechniques Books, Natick, MA, 305-319; Zhu et al. Biotechniques. 2001.30, 892-897) and others.
[075] В некоторых применениях образец ДНК является образцом опухолевой или фетальной ДНК или кДНК, присутствующей в биологической жидкости человека или животного в составе циркулирующих опухолевых или фетальных клеток, плазматических микровезикул, комплексов с белками, углеводами и липидами или в свободном виде. Известно, что ДНК опухолевого происхождения содержится в биологических жидкостях в очень малых количествах даже при метастатических опухолях (Diehl, F, et al. Gastroenterology. 2008 Aug; 135(2):489-98). Для обогащения образца такой ДНК биологический материал может быть подвергнут предварительной обработке. Например, может быть использован метод отделения плазмы крови от клеток крови для последующего анализа низкопредставленных мутаций опухолевого или фетального происхождения (как описано, например, в: Lo, Y.M.D., et al. Clin Chem. 1999 Oct; 45(10):1747-51). В другом приложении выделение ДНК или РНК может быть осуществлено из сыворотки крови (как описано, например, Anker, P., et al. Cancer Metastasis Rev. 1999; 18(1):65-73). В некоторых применениях может быть также осуществлено фракционирование клеточного осадка биологической жидкости с целью отделения фракции опухолевых или фетальных клеток путем сепарации с помощью антител на проточных цитометрах (как описано, например, в: Min, A. et al. Clin Exp Metastasis. 2009; 26(7):759-67) или с использованием магнитных частиц (как описано, например, в: Bilkenroth U., et al. Int J Cancer. 2001 May 15; 92(4):577-82), фильтрации через мембрану (как описано, например, в: Takano T., et al. Head Neck. 2008 Aug; 30(8):983-90), центрифугирования в градиенте плотности (как описано, например, в: Rosenberg, R. et al. Cytometry. 2002 Dec 1; 49(4):150-8) или диэлектрофореза (как описано, например, в: Gascoyne, P. et al. Electrophoresis. 2009 Apr; 30(8):1388-98). Может быть осуществлено отделение фракции микровезикул (экзосомы, «виртосомы» и другие), потенциально содержащих нуклеиновые кислоты, из биологических жидкостей с помощью ультрацентрифугирования, ультрафильтрации или сепарации с помощью антител (как описано, например, в: Taylor, D.D., et al. Methods Mol Biol. 2011; 728:235-46; Rood, I.M., et al. Kidney Int. 2010 Oct; 78(8):810-6; Clayton, Α., et al. J Immunol Methods. 2001 Jan 1; 247(1-2):163-74; Gahan, P.В., Stroun, M. Cell Biochem Funct. 2010 Oct; 28(7):529-38). В некоторых применениях с помощью инкубации клеток в буфере, содержащем трипсин и соли ЭДТА, могут быть выделены нуклеиновые кислоты, связанные с поверхностью клеток крови или других биологических жидкостей (как описано, например, Laktionov, P.P., et al. Ann Ν Υ Acad Sci. 2004 Jun; 1022:221-7; Mal'shakova, V.S., et al. Ann Ν Y Acad Sci. 2008 Aug; 1137:47-50). В некоторых применениях может быть осуществлено обогащение препаратов ткани целевыми клетками с помощью лазерной микродиссекции (как описано, например, в: Cha, S., et al. Mol Cell Proteomics. 2010 Nov; 9(11):2529-44; Weier, J.F., et al. Cytogenet Genome Res. 2006; 114(3-4):302-11).[075] In some applications, the DNA sample is a sample of tumor or fetal DNA or cDNA present in a biological fluid of a human or animal as part of circulating tumor or fetal cells, plasma microvesicles, complexes with proteins, carbohydrates and lipids, or in free form. It is known that DNA of tumor origin is contained in biological fluids in very small amounts even with metastatic tumors (Diehl, F, et al. Gastroenterology. 2008 Aug; 135 (2): 489-98). To enrich a sample of such DNA, the biological material may be pretreated. For example, a method for separating blood plasma from blood cells can be used for subsequent analysis of low-represented mutations of tumor or fetal origin (as described, for example, in: Lo, YMD, et al. Clin Chem. 1999 Oct; 45 (10): 1747-51 ) In another application, DNA or RNA can be isolated from blood serum (as described, for example, Anker, P., et al. Cancer Metastasis Rev. 1999; 18 (1): 65-73). In some applications, fractionation of the cell sediment of the biological fluid can also be carried out in order to separate the fraction of tumor or fetal cells by separation using antibodies on flow cytometers (as described, for example, in: Min, A. et al. Clin Exp Metastasis. 2009; 26 (7): 759-67) or using magnetic particles (as described, for example, in: Bilkenroth U., et al. Int J Cancer. 2001 May 15; 92 (4): 577-82), filtering through a membrane ( as described, for example, in: Takano T., et al. Head Neck. 2008 Aug; 30 (8): 983-90), density gradient centrifugation (as described, for example, in: Rosenberg, R. et a l. Cytometry. 2002
[076] В некоторых применениях обогащение образца опухолевой или фетальной ДНК может быть осуществлено после выделения ДНК из биологических жидкостей. Например, для повышения концентрации фетальной ДНК в образцах ДНК, выделенных из плазмы крови беременных женщин, образец может быть обработан формальдегидом, как предложено Dhallan и соавторами (Dhallan, P., et al. JAMA. 2004. Vol. 291. №9. P. 1114-1119). Также для повышения концентрации фетальной или опухолевой ДНК в образце может быть использовано то, что такая ДНК представлена практически исключительно низкомолекулярными фракциями (Li, Y., et al. Methods Mol Biol. 2008; 444:239-51; Hung, Ε.С, et al. Clin Chem. 2009 Apr; 55(4):715-22; Hahn, T., et al. Clin Chem. 2009 Dec; 55(12):2144-52) и эта фракция может быть отделена от остальных фракций на агарозном электрофорезе или на хроматографической колонке.[076] In some applications, the enrichment of a sample of tumor or fetal DNA can be carried out after the extraction of DNA from biological fluids. For example, to increase the concentration of fetal DNA in DNA samples isolated from the blood plasma of pregnant women, the sample can be treated with formaldehyde, as proposed by Dhallan et al. (Dhallan, P., et al. JAMA. 2004. Vol. 291. No. 9. P . 1114-1119). Also, to increase the concentration of fetal or tumor DNA in the sample, it can be used that such DNA is represented almost exclusively by low molecular weight fractions (Li, Y., et al. Methods Mol Biol. 2008; 444: 239-51; Hung, Ε.С, et al. Clin Chem. 2009 Apr; 55 (4): 715-22; Hahn, T., et al. Clin Chem. 2009 Dec; 55 (12): 2144-52) and this fraction can be separated from other fractions on agarose electrophoresis or on a chromatographic column.
[077] В преимущественных применениях образец ДНК для анализа содержит целевую нуклеиновую кислоту (то есть мутантную ДНК, референсную ДНК или их смесь). В некоторых применениях образец нуклеиновых кислот содержит также нецелевые нуклеиновые кислоты, не сходные с целевыми нуклеиновыми кислотами. Как здесь используется, термин «нецелевые» относится к нуклеиновой кислоте, которая не содержит исследуемого нуклеотида и не комплементарна целевой нуклеиновой кислоте.[077] In preferred applications, the DNA sample for analysis contains the target nucleic acid (ie, mutant DNA, reference DNA, or a mixture thereof). In some applications, the nucleic acid sample also contains non-target nucleic acids that are not similar to the target nucleic acids. As used here, the term "non-target" refers to a nucleic acid that does not contain the test nucleotide and is not complementary to the target nucleic acid.
[078] В преимущественных применениях концентрация нуклеиновых кислот в образце составляет не менее 10 пкг, обычно не менее 500 пкг. Доля целевой нуклеиновой кислоты в образце может колебаться от 0,0000001% до 100% и чаще всего не превышает 50%, преимущественно не превышает 10%, как правило, не превышает 1-2%.[078] In preferred applications, the concentration of nucleic acids in the sample is at least 10 pkg, usually at least 500 pkg. The proportion of the target nucleic acid in the sample can range from 0.0000001% to 100% and most often does not exceed 50%, mainly does not exceed 10%, as a rule, does not exceed 1-2%.
[079] В некоторых применениях образец ДНК содержит избыток референсной целевой последовательности по сравнению с мутантной. Референсная (немутантная) ДНК находится в более чем в 100-кратном избытке, например, более чем в 300-кратном избытке, обычно более чем в 500-кратном избытке, преимущественно более чем в 1000-кратном избытке, например в 10000-кратном избытке. В некоторых применениях референсная ДНК находится более чем в 1 000-кратном избытке, но не более чем в 100000-кратном избытке.[079] In some applications, the DNA sample contains an excess of the reference target sequence compared to the mutant. Reference (non-mutant) DNA is in more than 100-fold excess, for example, more than 300-fold excess, usually more than 500-fold excess, mainly more than 1000-fold excess, for example, a 10,000-fold excess. In some applications, the reference DNA is in more than 1,000-fold excess, but not more than in 100,000-fold excess.
[080] В некоторых воплощениях образец ДНК подвергают фрагментации с целью получения фрагментов ДНК со средней длиной от 50 до 1000 пар нуклеотидов, чаще от 100 до 500 пар нуклеотидов, например 150-300 пар нуклеотидов.[080] In some embodiments, the DNA sample is fragmented to obtain DNA fragments with an average length of from 50 to 1000 nucleotides, more often from 100 to 500 nucleotides, for example 150-300 nucleotides.
[081] В некоторых воплощениях к образцу ДНК, выделенному из биологического материала, добавляют экзогенную двухцепочечную ДНК из другого организма или искусственно созданную. Амплификация фрагментов этой ДНК в дальнейшем может быть использована как контроль качества амплификации и секвенирования. Например, к образцу ДНК, выделенной из человека, может быть добавлена ДНК беспозвоночных или искусственно полученная последовательность. Примеры таких последовательностей показаны в SEQ ID NOs: 64, 65.[081] In some embodiments, exogenous double-stranded DNA from another organism or artificially created is added to a DNA sample isolated from biological material. Amplification of fragments of this DNA can be further used as quality control of amplification and sequencing. For example, invertebrate DNA or an artificially generated sequence can be added to a DNA sample isolated from a human. Examples of such sequences are shown in SEQ ID NOs: 64, 65.
[082] Молекулярное баркодирование пула целевых молекул ДНК[082] Molecular barcoding of a pool of target DNA molecules
[083] Образец ДНК используется в качестве матрицы для баркодирования пула целевых молекул. Как здесь используется, термин «баркодирование» означает введение в последовательность молекул ДНК последовательности баркода. Как здесь используется, термин «баркод» означает последовательность нуклеотидов, которая позволяет отличить продукт амплификации одной молекулы от продукта амплификации других идентичных или по существу сходных молекул. Как здесь используется, термин «баркод» не относится к индексным последовательностям, которые служат для различения молекул из двух различных образцов ДНК.[083] A DNA sample is used as a matrix for barcoding a pool of target molecules. As used here, the term "barcoding" means the introduction of a barcode sequence into a DNA sequence. As used here, the term "barcode" means a nucleotide sequence that allows you to distinguish between the amplification product of one molecule and the amplification product of other identical or essentially similar molecules. As used here, the term "barcode" does not refer to index sequences that serve to distinguish molecules from two different DNA samples.
[084] Для нужд настоящего изобретения процесс баркодирования заключается во введении случайной последовательности нуклеотидов (random primer) в целевую молекулу ДНК. Длина случайной последовательности может варьировать и обычно составляет 9-20 нуклеотидов, чаще 10-15 нуклеотидов, например 12, 13 или 14 нуклеотидов. Как здесь используется, термин «баркодирующий праймер» означает смесь олигонуклеотидов, содержащих случайную последовательность - баркод. Структура баркодирующего праймера схематически показана на рис.1. На 3'-конце праймер несет геноспецифическую последовательность, комплементарную целевой последовательности ДНК, за которой следует случайная последовательность (баркод). В преимущественных воплощениях за баркодом (на 5'-конце) находится адаптерная последовательность.[084] For the needs of the present invention, the process of barcoding consists in introducing a random sequence of nucleotides (random primer) in the target DNA molecule. The length of the random sequence can vary and is usually 9-20 nucleotides, usually 10-15 nucleotides, for example 12, 13 or 14 nucleotides. As used here, the term "barcoding primer" means a mixture of oligonucleotides containing a random sequence - barcode. The structure of the barcoding primer is shown schematically in Fig. 1. At the 3'-end, the primer carries a gene-specific sequence complementary to the target DNA sequence, followed by a random sequence (barcode). In preferred embodiments, behind the barcode (at the 5'-end) is an adapter sequence.
[085] Примеры баркодирующих праймеров для целевых последовательностей SEQ ID NOS: 1-62 показаны в SEQ ID Nos: 66-127. Указанные праймеры содержат геноспецифические последовательности, прилегающие к рефернсным последовательностям, показанным в SEQ ID NOS: 1-62. Соответствие праймеров целевым последовательностям показано в Таблице 1.[085] Examples of barcoding primers for the target sequences of SEQ ID NOS: 1-62 are shown in SEQ ID Nos: 66-127. These primers contain gene-specific sequences adjacent to the reference sequences shown in SEQ ID NOS: 1-62. The correspondence of the primers to the target sequences is shown in Table 1.
[086] Для любого специалиста в данной области очевидно, что длина баркода может быть уменьшена или увеличена на 1-4 нуклеотида без существенного влияния на эффективность баркодирования. Также очевидно, что может быть заменена адаптерная последовательность. Варианты адаптерных последовательностей хорошо известны и показаны, например, в базе данных UniVec, предоставляемой National Center for Biotechnology Information, в инструкциях к приборам для секвенирования нового поколения и наборам реагентов для секвенирования нового поколения.[086] It is obvious to any person skilled in the art that the length of the barcode can be reduced or increased by 1-4 nucleotides without a significant impact on the efficiency of barcoding. It is also apparent that the adapter sequence may be replaced. Variants of adapter sequences are well known and shown, for example, in the UniVec database provided by the National Center for Biotechnology Information, in instructions for next-generation sequencing instruments and new-generation sequencing kits.
[087] Введение баркода в пул целевых молекул осуществляется в ходе полимеразной цепной реакции (ПЦР) в присутствии баркодирующего праймера в конечной концентрации 0,03-0,3 мкМ, чаще 0,05-0,2 мкМ. Предпочтительным является использование ДНК-полимеразы или смеси ДНК полимераз, отличающейся повышенной точностью синтеза и специфичности затравления синтеза - например, полимеразы, которая содержит дополнительные аминокислотные замены, усиливающие точность синтеза (например, описанные в: Lovmar, L., Syvaenen, А.С. Methods Mol Med. 2005; 114:79-92), такой как, например, Tersus (ЗАО «Евроген», Россия), Phusion (New England Biolabs, США), Kapa Hi-Fi (Kapa Biosystems, ЮАР), TruSeq DNA Polymerase (Illumina, США), KOD DNA Polymerase (TaKaRa Bio, Япония), или подобной.[087] The introduction of barcode into the pool of target molecules is carried out during the polymerase chain reaction (PCR) in the presence of a barcoding primer at a final concentration of 0.03-0.3 μM, usually 0.05-0.2 μM. Preferred is the use of DNA polymerase or a mixture of DNA polymerases, characterized by increased accuracy of synthesis and specificity of the seed of synthesis - for example, polymerase, which contains additional amino acid substitutions that enhance the accuracy of synthesis (for example, described in: Lovmar, L., Syvaenen, A.C. Methods Mol Med. 2005; 114: 79-92), such as, for example, Tersus (ZAO Evrogen, Russia), Phusion (New England Biolabs, USA), Kapa Hi-Fi (Kapa Biosystems, South Africa), TruSeq DNA Polymerase (Illumina, USA), KOD DNA Polymerase (TaKaRa Bio, Japan), or the like.
[088] Баркодирование может осуществляться в ходе стандартной ПЦР, как описано Kinde и соавторами (Proc Nat Acad Sci USΑ. 2011; 23:9530-35). В этом случае реакционная смесь для ПЦР также содержит встречный геноспецифический праймер для каждого баркодирующего праймера. Термины «прямой праймер» и «встречный праймер» используются здесь для обозначения взаиморасположения двух праймеров на молекуле ДНК, но без учета их положения относительно кодирующей цепи ДНК. Примеры встречных геноспецифических праймеров для амплификации референсных последовательностей SEQ ID NOS: 1-62 показаны в SEQ ID NOs: 131-192. Геноспецифические последовательности указанных праймеров отдалены от референсных последовательностей SEQ ID NOs: 1-62 на 10-25 нуклеотидов. Соответствие референсных последовательностей и геноспецифических праймеров приведено в таблице 1.[088] Barcoding can be performed during standard PCR as described by Kinde et al. (Proc Nat Acad Sci USi. 2011; 23: 9530-35). In this case, the PCR reaction mixture also contains a counter gene-specific primer for each barcoding primer. The terms “forward primer” and “counter primer” are used here to indicate the relative position of two primers on a DNA molecule, but without regard to their position relative to the DNA coding chain. Examples of counter gene-specific primers for amplification of reference sequences of SEQ ID NOS: 1-62 are shown in SEQ ID NOs: 131-192. The gene-specific sequences of these primers are distant from the reference sequences of SEQ ID NOs: 1-62 per 10-25 nucleotides. The correspondence of reference sequences and gene-specific primers is shown in table 1.
[089] В качестве альтернативы Заявители разработали оригинальную процедуру баркодирования методом линейной ПЦР в присутствии только баркодирующих праймеров (рис. 2). В ходе такой ПЦР матрицей служит только исходная ДНК, что позволяет увеличить число циклов амплификации до 15, чаще до 5-7. Таким образом, в ходе баркодирования каждой молекуле исходного образца соответствует по крайней мере 5 копий, каждая из которых несет свой баркод.[089] As an alternative, Applicants have developed an original linear PCR barcoding procedure in the presence of only barcoding primers (Fig. 2). During such PCR, the matrix is only the original DNA, which allows you to increase the number of amplification cycles to 15, more often to 5-7. Thus, during barcoding, each molecule of the initial sample corresponds to at least 5 copies, each of which carries its own barcode.
[090] Это делает возможным дальнейшее выявление ошибок ДНК-полимеразы, происходящих на данном этапе: при достаточном количестве циклов линейной амплификации мутация, присутствующая хотя бы в одной молекуле исходного образца, должна будет присутствовать в нескольких продуктах данной реакции, содержащих разные баркоды (ожидаемое число этих продуктов рассчитывается с учетом эффективности конкретных реакций и числа циклов амплификации). Если число этих продуктов более 3, то вероятность появления столь же частой артефактной мутации крайне невелика, и ошибки ДНК-полимеразы на начальном этапе можно выявлять с помощью «фильтрации по количеству».[090] This makes it possible to further identify DNA polymerase errors occurring at this stage: with a sufficient number of linear amplification cycles, a mutation present in at least one molecule of the initial sample should be present in several products of this reaction containing different barcodes (expected number of these products is calculated taking into account the effectiveness of specific reactions and the number of amplification cycles). If the number of these products is more than 3, then the likelihood of the appearance of an equally frequent artifact mutation is extremely small, and DNA polymerase errors at the initial stage can be detected using "filtering by quantity."
[091] Каждый цикл амплификации включает денатурацию при температуре 94-96°C, отжиг праймеров при температуре 50-65°C, элонгацию температуре 72°C. Выбор программы амплификации хорошо известен специалистам в данной области. Температуру отжига выбирают в соответствии с расчетами в программах M-Fold (Zuker, M. Nucleic Acids Res. 2003 Jul 1; 31(13):3406-15), MeltCalc (Schuetz, E., von Ahsen, N. Biotechniques. 1999 Dec; 27(6):1218-22, 1224) или аналогичных и проверяют экспериментально на контрольных образцах ДНК.[091] Each amplification cycle includes denaturation at a temperature of 94-96 ° C, annealing of primers at a temperature of 50-65 ° C, and elongation at a temperature of 72 ° C. The choice of amplification program is well known to those skilled in the art. The annealing temperature is chosen in accordance with calculations in the M-Fold (Zuker, M. Nucleic Acids Res. 2003
[092] В зависимости от числа целевых последовательностей, которые необходимо проанализировать в образце, баркодирование может быть осуществлено в одной пробирке в ходе мультиплекной линейной ПЦР или в нескольких пробирках в ходе мультиплексной линейной ПЦР, где каждая пробирка содержит свой набор баркодирующих праймеров.[092] Depending on the number of target sequences to be analyzed in the sample, barcoding can be performed in one tube during multiplex linear PCR or in several tubes during multiplex linear PCR, where each tube contains its own set of barcoding primers.
[093] В некоторых воплощениях мультиплексной линейной ПЦР различные праймеры для баркодирования присутствуют в реакционной смеси в эквимолярных количествах. В некоторых воплощениях, концентрации некоторых праймеров увеличены или уменьшены (например, в 1,5-3 раза) относительно других таким образом, чтобы обеспечивать сохранение близкое к исходному соотношение концентраций молекул-мишеней по окончании пробоподготовки. Для каждого набора праймеров необходим экспериментальный подбор оптимального отношения концентраций.[093] In some embodiments of linear multiplex PCR, various barcoding primers are present in equimolar amounts in the reaction mixture. In some embodiments, the concentrations of some primers are increased or decreased (for example, 1.5-3 times) relative to others in such a way as to maintain a close to the original ratio of the concentrations of target molecules at the end of sample preparation. For each set of primers, experimental selection of the optimal concentration ratio is necessary.
[094] В некоторых воплощениях каждая смесь баркодирующих праймеров так же содержит праймеры для баркодирования «внутреннего контроля» - последовательности гена, немутантной для данного образца. Например, в случае использования опухолевой ДНК человека в качестве матрицы внутренним контролем может служить фрагмент гена IDH1, последовательность которого показана в SEQ ID No: 63. Последовательность баркодирующего праймера для этого фрагмента показана в SEQ ID No: 128.[094] In some embodiments, each mixture of barcoding primers also contains primers for barcoding the "internal control" - a gene sequence that is not mutant for a given sample. For example, in the case of using human tumor DNA, the IDH1 gene fragment, the sequence of which is shown in SEQ ID No: 63, can be used as the internal control matrix. The sequence of the barcoding primer for this fragment is shown in SEQ ID No: 128.
[095] В некоторых воплощениях каждая смесь баркодирующих праймеров также содержит праймеры для баркодирования экзогенно добавленной ДНК. Примеры праймеров для баркодирования фрагментов SEQ ID Nos: 64, 65 показаны в SEQ ID Nos: 129, 130.[095] In some embodiments, each mixture of barcoding primers also contains primers for barcoding the exogenously added DNA. Examples of primers for barcoding fragments of SEQ ID Nos: 64, 65 are shown in SEQ ID Nos: 129, 130.
[096] Очистка продукта реакции баркодирования от остатков баркодирующего праймера[096] Purification of the product of the barcoding reaction from the residues of the barcoding primer
[097] Очистка продукта баркодирования от остатка праймера призвана исключить участие праймера, содержащего баркод, в дальнейшей амплификации. Для очистки может быть использован любой известный метод очистки ДНК от коротких олигонуклеотидов, включая гель-фильтрационные и энзиматические методы или их комбинацию. В частности, могут быть использованы коммерчески доступные наборы реагентов для очистки ДНК из реакционных смесей, такие как набор Cleanup Standard (Евроген, Россия), DNA Clean & Concentrator-5 (Zymo Research, США) и подобные.[097] Purification of the barcoding product from the remainder of the primer is designed to exclude the participation of the primer containing barcode in further amplification. For purification, any known method for purifying DNA from short oligonucleotides, including gel filtration and enzymatic methods, or a combination thereof, can be used. In particular, commercially available reagent kits for purifying DNA from reaction mixtures, such as the Cleanup Standard kit (Eurogen, Russia), DNA Clean & Concentrator-5 (Zymo Research, USA) and the like, can be used.
[098] В некоторых применениях для уничтожения остатков баркодирующего праймера может быть произведена обработка реакционной смеси экзонуклеазой I (Exo-I), которая разрушает одноцепочечные ДНК в 3'-5' направлении, высвобождая дезоксирибонуклеозид-5-монофосфаты. Exo-I активна в реакционном буфере для ПЦР и может быть добавлена в реакционную смесь непосредственно после окончания процедуры баркодирования. Как правило, используется Ехо-1 в конечной концентрации от 1 до 3 ед. в мкл, например, 2,4 единицы в мкл.[098] In some applications, exonuclease I (Exo-I), which destroys single-stranded DNA in the 3'-5 'direction, releasing deoxyribonucleoside-5-monophosphates can be treated to destroy residues of the barcoding primer. Exo-I is active in the PCR reaction buffer and can be added to the reaction mixture immediately after completion of the barcoding procedure. Typically, Exo-1 is used in a final concentration of 1 to 3 units. in μl, for example, 2.4 units in μl.
[099] Обработка Exo-I осуществляется при 37°C. Время обработки может варьировать от 5 мин до 2 часов, чаще в пределах от 7 мин до 1 часа, например 10-15 мин, что достаточно для гидролиза остатков баркодирующего праймера, но не затрагивает целевые последовательности баркодированных молекул ДНК (рис. 2).[099] Exo-I treatment is carried out at 37 ° C. Processing time can vary from 5 minutes to 2 hours, more often ranging from 7 minutes to 1 hour, for example 10-15 minutes, which is sufficient for hydrolysis of the residues of the barcoding primer, but does not affect the target sequences of the barcoded DNA molecules (Fig. 2).
[0100] Инактивация Exo-I осуществляется с помощью прогревания при 68-70°C в течение 10-30 мин.[0100] Inactivation of Exo-I is carried out by heating at 68-70 ° C for 10-30 minutes.
[0101] В некоторых воплощениях продукт реакции после обработки Exo-I может быть переосажден. В некоторых воплощениях продукт реакции после обработки Exo-I может быть очищен с помощью коммерчески доступных наборов реагентов для очистки ДНК из реакционных смесей или любым другим известным методом для очистки ДНК.[0101] In some embodiments, the reaction product after Exo-I treatment may be reprecipitated. In some embodiments, the reaction product after Exo-I treatment can be purified using commercially available DNA purification reagent kits from reaction mixtures or any other known method for DNA purification.
[0102] Амплификация пула целевых молекул в мультиплексной ПЦР[0102] Amplification of the pool of target molecules in multiplex PCR
[0103] Амплификация пула баркодированных целевых молекул осуществляется в стандартной ПЦР с использованием универсального праймера, содержащего на 3' конце последовательность, по существу сходную с адаптерной последовательностью баркодирующего праймера, и геноспецифического праймера, встречного по отношению к геноспецифической последовательности баркодирующего праймера (рис. 2). Например для амплификации молекул баркодированных с помощью праймеров, выбранных из SEQ ID NOs: 66-130 может быть использован универсальный праймер TS-Uni-short, последовательность которого показана в SEQ ID No: 196 и встречные геноспецифические праймеры, выбранные из SEQ ID NOs: 131-195.[0103] Amplification of the pool of barcoded target molecules is carried out in standard PCR using a universal primer containing at the 3 'end a sequence essentially similar to the adapter sequence of the barcoding primer and a gene-specific primer that is counter to the gene-specific sequence of the barcoding primer (Fig. 2) . For example, the TS-Uni-short universal primer, the sequence of which is shown in SEQ ID No: 196 and counter genespecific primers selected from SEQ ID NOs: 131, can be used to amplify barcoded molecules using primers selected from SEQ ID NOs: 66-130 -195.
[0104] Число пробирок ПЦР равно числу пробирок использованному для баркодирования. Каждая содержит свой набор геноспецифических праймеров (далее REV-праймеров), встречных использованным на предыдущей стадии баркодирующим праймерам (таблица 1).[0104] The number of PCR tubes is equal to the number of tubes used for barcoding. Each contains its own set of gene-specific primers (hereinafter referred to as REV primers), which are counter to barcoding primers used in the previous stage (table 1).
[0105] Объем реакционной смеси для ПЦР составляет, как правило, 10-100 мкл, чаще 15-50 мкл, например, 20 мкл или 25 мкл. В качестве матрицы в ПЦР используется очищенный продукт баркодирования.[0105] The volume of the reaction mixture for PCR is typically 10-100 μl, usually 15-50 μl, for example, 20 μl or 25 μl. As a matrix in PCR, a purified barcoding product is used.
[0106] Конечная концентрация универсального праймера в реакционной смеси обычно составляет 0,2-0,5 мкМ, например 0,3 мкМ. Конечная концентрация каждого геноспецифического праймера составляет 0,01-0,3 мкМ, чаще 0,03-0,2 мкМ.[0106] The final concentration of universal primer in the reaction mixture is usually 0.2-0.5 μM, for example 0.3 μM. The final concentration of each gene-specific primer is 0.01-0.3 μM, usually 0.03-0.2 μM.
[0107] В некоторых воплощениях различные геноспецифические праймеры для мультиплексной ПЦР присутствуют в реакционной смеси в эквимолярных количествах. В некоторых воплощениях, концентрации некоторых праймеров увеличены или уменьшены (например, в 0,5-3 раза) относительно других таким образом, чтобы обеспечивать сохранение близкое к исходному соотношение концентраций молекул-мишеней в амплифицированной образце. Для каждого набора геноспецифических праймеров необходим экспериментальный подбор оптимального отношения концентраций.[0107] In some embodiments, various gene-specific multiplex PCR primers are present in equimolar amounts in the reaction mixture. In some embodiments, the concentration of some primers is increased or decreased (for example, 0.5-3 times) relative to others in such a way as to maintain close to the original ratio of the concentrations of target molecules in the amplified sample. For each set of gene-specific primers, experimental selection of the optimal concentration ratio is necessary.
[0108] В некоторых воплощениях каждая смесь для ПЦР так же содержит геноспецифические праймеры для амплификации «внутреннего контроля» и/или экзогенно добавленной ДНК. Например для референсных последовательностей показанных в SEQ ID Nos: 63-65 могут быть использованы геноспецифические REV-праймеры, показанные в SEQ ID Nos: 193-195.[0108] In some embodiments, each PCR mixture also contains gene-specific primers for amplification of the "internal control" and / or exogenously added DNA. For example, for the reference sequences shown in SEQ ID Nos: 63-65, gene specific REV primers shown in SEQ ID Nos: 193-195 can be used.
[0109] Амплификацию выполняют по следующей программе: 25-90 циклов ПЦР в режиме 1-30 сек - денатурация при температуре 94-96°C, 40 сек - 1 минута - отжиг праймеров при температуре 50-65°C, элонгация в течение 1 минуты при температуре 72°C. Температуру отжига выбирают в соответствии с расчетами в программе M-Fold (Zuker, M. Nucleic Acids Res. 2003 Jul 1; 31(13):3406-15), MeltCalc (Schuetz, E., von Ahsen, N. Biotechniques. 1999 Dec; 27(6):1218-22, 1224) или аналогичных и проверяют экспериментально на контрольных образцах ДНК.[0109] Amplification is carried out according to the following program: 25-90 PCR cycles in 1-30 sec mode — denaturation at a temperature of 94-96 ° C, 40 sec — 1 minute — annealing of primers at a temperature of 50-65 ° C, elongation for 1 minutes at 72 ° C. The annealing temperature is selected in accordance with the calculations in the M-Fold program (Zuker, M. Nucleic Acids Res. 2003
[0110] Введение сиквенсовых адаптеров в продукт мультиплексной ПЦР и секвенирование указанного продукта[0110] the Introduction of sequence adapters in the product of multiplex PCR and sequencing of the specified product
[0111] Секвенирование продукта амплификации может быть произведено любым известным методом секвенирования, включая секвенирование по Сэнгеру и высокопроизводительное секвенирование нового поколения.[0111] Sequencing of the amplification product can be performed by any known sequencing method, including Sanger sequencing and new generation high-performance sequencing.
[0112] Для метода настоящего изобретения сиквенсовые адаптеры для NGS могут быть введены в продукт амплификации разными способами известными специалистам в данной области, включая лигирование или различные варианты ПЦР с праймерами, содержащими последовательности сиквенсовых адаптеров на 3'-конце. Различные способы введения сиквенсовых адаптеров в ходе одной или нескольких ПЦР проиллюстрированы на рис. 3.[0112] For the method of the present invention, sequence adapters for NGS can be introduced into the amplification product in various ways known to those skilled in the art, including ligation or various PCR variants with primers containing sequences of sequence adapters at the 3'-end. Various methods of introducing sequence adapters during one or more PCR are illustrated in Fig. 3.
[0113] В некоторых воплощениях введение сиквенсовых адаптеров осуществляется с помощью ПЦР с праймерами, содержащими последовательности сиквенсовых адаптеров на «свисающих» 5'-концах. 3'-концевые последовательности праймеров содержат сайты отжига на целевые молекулы, например на геноспецифические последовательности внутри амплифицированных регионов целевых молекул (заглубленный ПЦР) и на адаптерную последовательность баркодирующего праймера.[0113] In some embodiments, the introduction of sequencing adapters is carried out using PCR with primers containing sequences of sequenced adapters at the "hanging" 5'-ends. The 3'-terminal sequences of the primers contain annealing sites for the target molecules, for example, for gene-specific sequences within the amplified regions of the target molecules (in-depth PCR) and for the adapter sequence of the barcoding primer.
[0114] Как здесь используется, термин «свисающий конец» или «свисающий хвост» по отношению к праймеру обозначает 5'-концевую последовательность нуклеотидов в праймере, некомплементарную целевым молекулам.[0114] As used here, the term "hanging end" or "hanging tail" in relation to the primer refers to the 5'-terminal nucleotide sequence in the primer, non-complementary to the target molecules.
[0115] В некоторых воплощениях введение сиквенсовых адаптеров осуществляется с помощью двух последовательных ПЦР, где в ходе первого ПЦР используются праймеры, содержащие 3'-концевые сайты отжига на целевые молекулы и свисающие концы, содержащие часть последовательности сиквенсового адаптера или любую иную последовательность. Во второй ПЦР используются праймеры, содержащие 3'-концевой сайт отжига на свисающие концы праймеров предыдущей ПЦР и последовательности сиквенсовых адаптеров на 5'-конце.[0115] In some embodiments, sequencing adapters are introduced using two consecutive PCRs, where primers containing 3'-terminal annealing sites to target molecules and hanging ends containing part of the sequence of the sequencing adapter or any other sequence are used during the first PCR. The second PCR uses primers containing the 3'-terminal annealing site at the hanging ends of the previous PCR primers and sequences of sequence adapters at the 5'-end.
[0116] В некоторых воплощениях последовательности сиквенсовых адаптеров введены в виде свисающих концов в последовательности праймеров, использованных на стадии мультиплексной ПЦР. В этом случае введение сиквенсовых последовательностей осуществляется сразу на стадии мультиплексной ПЦР.[0116] In some embodiments, sequences of sequence adapters are introduced as hanging ends in the sequence of primers used in the multiplex PCR step. In this case, the introduction of sequence sequences is carried out immediately at the stage of multiplex PCR.
[0117] В некоторых воплощениях для введения сиквенсовых адаптеров используется «ПЦР с выходом наружу» (Step-Out PCR) (Matz et al. Nucleic Acids Res. 1999; 27(6):1558-1560). Для амплификации используются две смеси праймеров, каждая из которых состоит из (1) «внутреннего» праймера, несущего на 3' конце сайт отжига на целевые последовательности (3'-концевая специфическая последовательность) и свисающий хвост на 5'-конце и (2) «внешнего» праймера, содержащего на 3'-конце последовательность, идентичную последовательности свисающего хвоста «внутреннего» праймера. Концентрации праймеров в смесях подбирают таким образом, чтобы «внутренний» праймер расходовался на первых циклах ПЦР, в ходе которых создаются молекулы, имеющие сайты отжига «внешнего» праймера. На дальнейших циклах ПЦР амплификация пула целевых молекул продолжается с «внешнего» праймера. Например, конечная концентрация каждого внутреннего праймера обычно составляет 0,05-0,3 мкМ, например 0,1 или 0,2 мкМ, а концентрация внешнего праймера превышает ее в 10-15 раз.[0117] In some embodiments, Step-Out PCR (Matz et al. Nucleic Acids Res. 1999; 27 (6): 1558-1560) is used to introduce sequencing adapters. For amplification, two primer mixtures are used, each of which consists of (1) an “internal” primer carrying an annealing site at the 3 'end to the target sequences (3'-end specific sequence) and a drooping tail at the 5'-end and (2) An “external” primer containing at the 3 ′ end a sequence identical to the sequence of the hanging tail of the “internal” primer. Concentrations of primers in the mixtures are selected so that the “internal” primer is consumed in the first PCR cycles, during which molecules are created that have sites for annealing the “external” primer. In subsequent PCR cycles, amplification of the pool of target molecules continues from the “external” primer. For example, the final concentration of each internal primer is usually 0.05-0.3 μM, for example 0.1 or 0.2 μM, and the concentration of the external primer is 10-15 times higher.
[0118] В состав праймеров может быть так же введена индексная последовательность. При амплификации различных образцов используют праймеры, несущие различные индексные последовательности, что впоследствии позволяет отличать данные секвенирования молекул из разных образцов. Длина индексной последовательности обычно составляет 3-10 случайных нуклеотидов, например, 3, 4, 5, 6, 7, 8, 9 или 10 нуклеотидов. Примеры подобных индексных последовательностей (index sequences) доступны на сайтах производителей наборов реагентов для высокопроизводительного секвенирования.[0118] An index sequence may also be included in the primers. For amplification of various samples, primers are used that carry different index sequences, which subsequently makes it possible to distinguish molecular sequencing data from different samples. The length of the index sequence is usually 3-10 random nucleotides, for example, 3, 4, 5, 6, 7, 8, 9 or 10 nucleotides. Examples of such index sequences are available on the websites of reagent kit manufacturers for high throughput sequencing.
Идентификация мутаций в целевых ДНК по данным секвенированияIdentification of mutations in target DNA by sequencing data
[0119] Суммарный уровень ошибок, генерируемых в ходе многоэтапного пробоподготовки и секвенирования составляет не менее 1% (Wei, Ζ., et al. Nucleic Acids Res. 2011 Oct; 39(19):e132; Klein, J.D., et al. PLoS One. 2011; 6(8):e23455). Таким образом, для достоверного выявления редких мутаций (например, онкомутаций) по анализу данных секвенирования требуется отсев ложнопозитивных сигналов - замен нуклеотидов, внесенных в последовательность в результате некорректной работы ДНК-полимеразы на стадиях ПЦР и неправильных прочтений в ходе секвенирования.[0119] The total error rate generated during multi-stage sample preparation and sequencing is at least 1% (Wei, Ζ., Et al. Nucleic Acids Res. 2011 Oct; 39 (19): e132; Klein, JD, et al. PLoS One. 2011; 6 (8): e23455). Thus, for reliable identification of rare mutations (for example, onc mutations), analysis of sequencing data requires screening of false-positive signals - replacing nucleotides introduced into the sequence as a result of incorrect operation of DNA polymerase at the PCR stages and incorrect readings during sequencing.
[0120] В преимущественных воплощениях отсев ложнопозитивных сигналов включает анализ последовательностей баркодов. Наличие у молекул одинакового баркода означает, что они являются потомками единственной баркодированной молекулы ДНК-матрицы. Потомки одной молекулы должны иметь одинаковый профиль мутаций. Наличие различных вариантов нуклеотидной последовательности среди потомков одной молекулы указывает на то, что или все эти варианты, или все эти варианты, кроме одного, представляют собой недостоверный (чаще - ложнопозитивный) сигнал.[0120] In preferred embodiments, screening of false-positive signals includes barcode sequence analysis. The presence of the same barcode in molecules means that they are descendants of the only barcoded DNA matrix molecule. The descendants of one molecule must have the same mutation profile. The presence of various variants of the nucleotide sequence among the descendants of one molecule indicates that either all of these variants, or all of these variants, except for one, represent an unreliable (more often false positive) signal.
[0121] В некоторых воплощениях отсев ложнопозитивных сигналов также включает «фильтрацию по количеству», что позволяет исключить из рассмотрения потомков баркодированной молекулы, содержащих замену, появившуюся в результате некорректной работы ДНК-полимеразы на стадии баркодирования.[0121] In some embodiments, screening of false-positive signals also includes "filtering by quantity", which allows excluding from consideration descendants of a barcoded molecule containing a substitution resulting from malfunctioning DNA polymerase at the barcoding stage.
[0122] В некоторых воплощениях отсев ложнопозитивных сигналов также включает отсев ошибок ПЦР с помощью стратегии MIGEC, описанной в работе Shugay и соавт. (Shugay et al. Nat Methods. 2014; 11(6):653-5).[0122] In some embodiments, false positive screening also includes PCR error screening using the MIGEC strategy described by Shugay et al. (Shugay et al. Nat Methods. 2014; 11 (6): 653-5).
Праймеры для анализа целевых регионов в ключевых онкогенах и генах-суπрессорах человекаPrimers for the analysis of target regions in key human oncogenes and human suppressor genes
[0123] Также обеспечиваются наборы праймеров для реализации метода настоящего изобретения при анализе мутаций в последовательностях генов, показанных в SEQ ID No: 1 - SEQ ID No: 62. По литературным данным, анализ мутаций в указанных регионах является востребованным для выявления и мониторинга ряда онкологических заболеваний, а также имеет высокую прогностическую и предиктивную значимость при выборе стратегии и тактики ведения пациентов с подобными заболеваниями.[0123] Also provided are primer sets for implementing the method of the present invention when analyzing mutations in the gene sequences shown in SEQ ID No: 1 to SEQ ID No: 62. According to literature data, mutation analysis in these regions is in demand for identifying and monitoring a number of oncological diseases, and also has high prognostic and predictive value in the selection of strategies and tactics for managing patients with similar diseases.
[0124] Праймеры для баркодирования и амплификации разделены на группы (таблица 2), каждая из которых может быть использована для одновременного баркодирования и амплификации целевых фрагментов в одной пробирке. Для любого специалиста в данной области очевидно, что некоторые праймеры могут быть исключены из группы, если нет необходимости анализировать какие-то из перечисленных фрагментов. Подобное уменьшение числа праймеров в смеси не влияет на эффективность баркодирования и амплификации оставшихся фрагментов.[0124] The barcoding and amplification primers are divided into groups (Table 2), each of which can be used to simultaneously barcode and amplify target fragments in a single tube. For any specialist in this field it is obvious that some primers can be excluded from the group if there is no need to analyze any of the listed fragments. Such a decrease in the number of primers in the mixture does not affect the efficiency of barcoding and amplification of the remaining fragments.
[0125] В преимущественных воплощениях, праймеры для мультиплексной ПЦР1 используются вместе со встречным праймером, последовательность которого показана в SEQ ID No: 196.[0125] In preferred embodiments, primers for multiplex PCR1 are used in conjunction with a counter primer whose sequence is shown in SEQ ID No: 196.
[0126] Также обеспечиваются праймеры для приготовления смесей для введения сиквенсовых адаптеров с помощью ПЦР с выходом наружу. Смесь 1 включает внутренний праймер, имеющий сайт отжига на адаптерную последовательность баркодирующего праймера, общую для всех баркодирующих праймеров, и «свисающий хвост», и внешний праймер, содержащий последовательность сиквенсового адаптора и последовательность, идентичную «свисающему хвосту» внутреннего праймера. Примеры таких праймеров для секвенирования по технологии Illumina показаны в SEQ ID Nos: 197, 198.[0126] Primers are also provided for preparing mixtures for introducing sequence adapters using PCR to the outside.
[0127] Смесь 2 включает набор внутренних праймеров, содержащих 5'-концевой «свисающий хвост» и 3'-концевую геноспецифическую последовательность, заглубленную относительно геноспецифических праймеров для мультиплексной ПЦР и прилегающую к референсной последовательности SEQ ID NOs: 1-62 (BRIDGE-праймеры). Смесь 2 также включает внешний праймер, содержащий последовательность «свисающего хвоста» внутреннего праймера на 3'-конце и последовательность сиквенсового адаптора на 5'-конце. После последовательности сиквенсового адаптера (от 5' к 3') указанный внешний праймер может так же содержать индексную последовательность. Примеры внутренних праймеров приведены в SEQ ID NOs: 199-260, примеры внешнего праймера в SEQ ID NO: 264, 265.[0127]
[0128] Для любого специалиста в данной области очевидно, что индексная последовательность может быть заменена в таком праймере на любую другую нуклеотидную последовательность такой же или близкой длины. Также индексная последовательность может быть перенесена во внешний праймер смеси 1. Также во внешних праймерах могут быть заменены последовательности сиквенсовых адаптеров в соответствии с требованиями производителей секвенаторов для высокопроизводительного секвенирования. В приведенных примерах показаны сиквенсовые адаптеры для секвенирования на секвенаторах Illumina.[0128] It is obvious to any person skilled in the art that the index sequence can be replaced in such a primer with any other nucleotide sequence of the same or close length. Also, the index sequence can be transferred to the external primer of
[0129] Внешние и внутренние праймеры также могут быть использованы для введение сиквенсовых адаптеров в ходе двух раундов ПЦР как показано на рис. 3. В этом случае внутренние праймеры используются для первого раунда ПЦР (в концентрации 0,05-0,3 мкМ), а внешние - для второго раунда ПЦР.[0129] External and internal primers can also be used to introduce sequencing adapters during two rounds of PCR as shown in Fig. 3. In this case, the internal primers are used for the first round of PCR (at a concentration of 0.05-0.3 μM), and the external ones for the second round of PCR.
[0130] В некоторых воплощениях праймеры в каждой группе смешаны в эквимолярных количествах. Конечная концентрация каждого праймера составляет 0,7-0,15 мкМ, например 0,1 мкМ. В некоторых воплощениях концентрация некоторых праймеров увеличена в 1,5-5 раз по сравнению с остальными. В некоторых воплощениях концентрация некоторых праймеров уменьшена в 1,5-5 раз по сравнению с остальными. Концентрации внешних праймеров в смесях для ПЦР с выходом наружу превышают концентрации внутренних праймеров по крайней мере в 5 раз, чаще в 10 раз, иногда в 15 раз.[0130] In some embodiments, the primers in each group are mixed in equimolar amounts. The final concentration of each primer is 0.7-0.15 μM, for example 0.1 μM. In some embodiments, the concentration of some primers is increased by 1.5-5 times compared with the rest. In some embodiments, the concentration of some primers is reduced by 1.5-5 times compared with the rest. The concentrations of the external primers in the PCR mixtures with the exit to the outside exceed the concentrations of the internal primers by at least 5 times, more often 10 times, sometimes 15 times.
[0131] Например, обеспечиваются смеси праймеров для баркодирования А, Б, В и Г (Таблица 2), где по крайней мере вдвое увеличена концентрация баркодирующих праймеров для следующих референсных фрагментов: экзон 4 гена HER4, экзон 12 фрагмент 2 гена HER4, экзон 14 гена HER4, экзон 8 гена HER3, экзон 21 гена HER3, экзон 23 гена HER3, экзон 10 гена PIK3CA, экзон 4 гена KRAS, экзон 2 гена AKT1, экзон 4 гена MAP2K2, экзон 5 гена GNAQ, экзон 2 гена RAC1. Также обеспечиваются смеси REV-праймеров для мультиплексной амплификации баркодированных молекул, где по крайней мере вдвое увеличена концентрация геноспецифических праймеров для амплификации следующих референсных фрагментов: экзон 4 гена HER4, экзон 12 фрагмент 2 гена HER4, экзон 14 гена HER4, экзон 8 гена HER3, экзон 21 гена HER3, экзон 20 фрагмент 1 гена EGFR, экзон 8 фрагмент 2 гена HER4, экзон 5 фрагмент 2 гена ТР53, экзон 23 гена HER3, экзон 10 гена PIK3CA, экзон 4 гена KRAS и по крайней мере в 1,5 раза уменьшена концентрация для амплификации следующих референсных фрагментов: экзон 7 гена ТР53, экзон 18 гена EGFR, экзон 21 гена EGFR, экзон 20 фрагмент 1 гена HER2, экзон 21 фрагмент 1 гена HER2, экзон 9 гена HER3, экзон 3 гена HER3, экзон 11 гена KIT, экзон 15 гена BRAF, экзон 2 гена NRAS, экзон 20 гена PIK3CA, экзон 3 KRAS, экзон 2 и экзон 3 гена HRAS, экзон 3 гена NRAS, экзон 12 гена EGFR, экзон 7 гена RAF1, экзон 2 гена MAP2K1, экзон 6 гена MAP2K2, экзон 5 гена GNAQ, экзон 7 гена MAPK1.[0131] For example, mixtures of barcoding primers A, B, C, and D are provided (Table 2), where the concentration of barcoding primers is at least doubled for the following reference fragments:
[0132] В преимущественных воплощениях смеси праймеров также содержат праймеры для баркодирования и амплификации «внутреннего контроля», например, экзона 4 гена IDH1 (SEQ ID NOs: 63). Анализ амплификации и данных секвенирования этого гена может служить контролем качества анализа. Примеры таких праймеров показаны в SEQ ID NOs: 128, 193, 261.[0132] In preferred embodiments, the primer mixtures also contain primers for barcoding and amplifying an “internal control”, for example,
[0133] В преимущественных воплощениях смеси праймеров также содержат праймеры для баркодирования и амплификации экзогенно добавляемых последовательностей. Примеры таких праймеров показаны в SEQ ID NOs: 129, 130, 194, 195, 262, 263.[0133] In preferred embodiments, the primer mixtures also comprise primers for barcoding and amplifying exogenously added sequences. Examples of such primers are shown in SEQ ID NOs: 129, 130, 194, 195, 262, 263.
[0134] В некоторых воплощениях смеси праймеров содержат дополнительные праймеры для амплификации иных дополнительных последовательностей, подобранные таким образом, что они не препятствуют амплификации вышеуказанных референсных последовательностей.[0134] In some embodiments, the primer mixture contains additional primers for amplification of other additional sequences, selected in such a way that they do not interfere with the amplification of the above reference sequences.
[0135] Смеси праймеров могут быть использованы для реализации метода настоящего изобретения, как описано в разделе «Примеры» ниже.[0135] A mixture of primers can be used to implement the method of the present invention, as described in the "Examples" section below.
[0136] Смеси баркодирующих праймеров праймеров могут быть использованы для стандартной мультиплексной ПЦР фрагментов ДНК, содержащих референсные регионы SEQ ID NOs: 1-62 вместе с соответствующими им REV-праймерами. Продукты такой ПЦР могут быть использованы в качестве матрицы при для заглубленной мультиплексной ПЦР с BRIDGE-праймерами и TS-Uni-short праймером или баркодирующими праймерами.[0136] Mixtures of barcoding primer primers can be used for standard multiplex PCR DNA fragments containing reference regions of SEQ ID NOs: 1-62 together with their corresponding REV primers. The products of such PCR can be used as a matrix for in-depth multiplex PCR with BRIDGE primers and TS-Uni-short primers or barcoding primers.
Наборы реагентовReagent kits
[0137] Также обеспечиваются наборы реагентов для реализации метода настоящего изобретения. В преимущественных воплощениях указанные наборы включают смеси праймеров для баркодирования и мультиплексной амплификации. В некоторых воплощениях наборы также включают праймеры для введения сиквенсовых адаптеров методом ПЦР с выходом наружу. В некоторых воплощениях наборы также включают реагенты для ПЦР. В некоторых воплощениях наборы также включают реагенты для очистки ДНК из реакционных смесей и экзонуклеазу I.[0137] Reagent kits for implementing the method of the present invention are also provided. In preferred embodiments, said kits include mixtures of barcode primers and multiplex amplification. In some embodiments, the kits also include primers for introducing sequencing adapters by PCR to the outside. In some embodiments, the kits also include PCR reagents. In some embodiments, the kits also include reagents for purifying DNA from the reaction mixtures and exonuclease I.
[0138] В преимущественных воплощениях наборы также включают инструкцию по использованию на бумажном или электронном носителе, содержащую протокол пробоподготовки и анализа данных секвенирования.[0138] In preferred embodiments, the kits also include instructions for use on paper or electronic media containing a protocol for sample preparation and analysis of sequencing data.
Способы примененияApplication methods
[0139] Возможные применения изобретения включают все области биологии и медицины, в которых может быть актуально выявление молекул ДНК или РНК с мутациями и полиморфизмами, особенно присутствующих в образцах, содержащих избыток немутированных молекул ДНК или РНК.[0139] Possible applications of the invention include all areas of biology and medicine in which the identification of DNA or RNA molecules with mutations and polymorphisms may be relevant, especially those present in samples containing an excess of non-mutated DNA or RNA molecules.
[0140] Подобные применения включают в себя, в частности, следующие области, но не исчерпываются ими:[0140] Such applications include, but are not limited to, the following areas:
[0141] Детекцию соматических мутаций, прежде всего - неинвазивный скрининг и мониторинг в онкологии, включая раннюю диагностику злокачественных опухолей и их рецидивов, оценку радикальности проведенного лечения, диагностику микрометастазов и «спящих метастазов» и оценку лекарственной чувствительности опухоли без использования биопсии;[0141] Detection of somatic mutations, first of all, non-invasive screening and monitoring in oncology, including early diagnosis of malignant tumors and their relapses, assessment of the radical nature of the treatment, diagnosis of micrometastases and "sleeping metastases" and evaluation of the drug sensitivity of the tumor without biopsy;
[0142] Неинвазивную пренатальную диагностику;[0142] Non-invasive prenatal diagnosis;
[0143] ДНК-диагностику мутаций de novo и болезней, вызванных химеризмом;[0143] DNA diagnosis of de novo mutations and diseases caused by chimerism;
[0144] Мониторинг реципиентов пересаженных органов для своевременного выявления отторжения трансплантата;[0144] Monitoring recipients of transplanted organs for timely detection of transplant rejection;
[0145] Выявление приобретенной лекарственной устойчивости инфекционных агентов и злокачественных опухолей, в том числе непосредственно в процессе терапии;[0145] Identification of acquired drug resistance of infectious agents and malignant tumors, including directly during therapy;
[0146] ДНК-диагностику митохондриальных болезней (в большинстве случаев подобные болезни вызываются изменениями в митохондриальном геноме, которые присутствуют далеко не во всех митохондриях - т.н. гетероплазмия);[0146] DNA diagnosis of mitochondrial diseases (in most cases, such diseases are caused by changes in the mitochondrial genome that are not present in all mitochondria - the so-called heteroplasmy);
[0147] Анализ уровня спонтанного мутагенеза для самого широкого круга задач в биологии и медицине;[0147] Analysis of the level of spontaneous mutagenesis for a wide range of tasks in biology and medicine;
[0148] Анализ генетического полиморфизма на пулированных образцах (в частности, в популяционной, эволюционной и экологической генетике).[0148] Analysis of genetic polymorphism on the pulled samples (in particular, in population, evolutionary and environmental genetics).
[0149] Следующие примеры предлагаются в качестве иллюстративных, но не ограничивающих.[0149] The following examples are provided as illustrative, but not limiting.
ПРИМЕРЫEXAMPLES
[0150] Пример 1[0150] Example 1
[0151] Сравнение эффективности разных способов баркодирования целевых молекул[0151] Comparison of the effectiveness of different methods of barcoding target molecules
[0152] Было произведено баркодирование молекул с помощью стандартной ПЦР и линейной ПЦР. Для подготовки реакционных смесей использовали наборы реагентов Tersus PCR kit (Евроген, Россия), согласно инструкции производителя. Было приготовлено две реакционные смеси (объем каждой - 25 мкл): смесь для баркодирования в ПЦР с двумя праймерами содержала 2 мкМ праймера SEQ ID No: 100 и 2 мкМ праймера SEQ ID No: 165, смесь для баркодирования в ПЦР с одним праймером содержала 2 мкМ праймера SEQ ID No: 100. В каждую реакционную смесь было добавлено 10 нг геномной ДНК человека (Clontech, США). Смеси подвергли амплификации в следующем режиме: предварительная денатурация при 95°C в течение 5 мин; 2 цикла: 95°C - 15 сек; 58°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. По окончании реакции обе смеси инкубировали с 3 мкл экзонуклеазы I (New England Biolabs) 1 час при 37°C, прогревали 15 мин при 70°C для инактивации фермента и амплифицировали в присутствии праймеров TS-Uni-short и SEQ ID No: 165 (2 мкМ на реакцию) в ПЦР в следующем режиме: предварительная денатурация при 95°C в течение 5 мин; 28 циклов: 95°C - 15 сек; 62°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. Продукты ПЦР разводили в 40 раз и амплифицировали (1 мкл разведенного продукта на 50 мкл реакционной смеси для ПЦР) в присутствии праймеров TS-Uni-short и SEQ ID NO: 233 с использованием набора реагентов Tersus PCR kit (Евроген, Россия) согласно прилагаемой инструкции. Использовали следующий режим амплификации: предварительная денатурация при 95°C в течение 5 мин; 12 циклов: 95°C - 15 сек; 62°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. Продукты ПЦР разрешали на гель-электрофорезе в агарозе в ТАЕ-буфере с окрашиванием бромистым этидием (Рис. 4). Видно, что в случае баркодирования с помощью линейной ПЦР, целевая амплификация идет более эффективно.[0152] Barcoding of the molecules was performed using standard PCR and linear PCR. To prepare the reaction mixtures, Tersus PCR kit reagents were used (Eurogen, Russia), according to the manufacturer's instructions. Two reaction mixtures were prepared (each volume was 25 μl): the mixture for barcoding in PCR with two primers contained 2 μM primer SEQ ID No: 100 and 2 μM primer SEQ ID No: 165, the mixture for barcoding in PCR with one primer contained 2 μM primer SEQ ID No: 100. 10 ng of human genomic DNA was added to each reaction mixture (Clontech, USA). The mixture was amplified in the following mode: preliminary denaturation at 95 ° C for 5 min; 2 cycles: 95 ° C - 15 sec; 58 ° C - 20 sec; 72 ° C - 30 sec; completion of the ends of the molecules at 72 ° C for 2 minutes At the end of the reaction, both mixtures were incubated with 3 μl of exonuclease I (New England Biolabs) for 1 hour at 37 ° C, heated for 15 min at 70 ° C to inactivate the enzyme, and amplified in the presence of TS-Uni-short primers and SEQ ID No: 165 ( 2 μM per reaction) in PCR in the following mode: preliminary denaturation at 95 ° C for 5 min; 28 cycles: 95 ° C - 15 sec; 62 ° C - 20 sec; 72 ° C - 30 sec; completion of the ends of the molecules at 72 ° C for 2 minutes PCR products were diluted 40 times and amplified (1 μl of the diluted product per 50 μl of the PCR reaction mixture) in the presence of TS-Uni-short and SEQ ID NO: 233 primers using the Tersus PCR kit (Eurogen, Russia) according to the attached instructions . The following amplification mode was used: preliminary denaturation at 95 ° C for 5 min; 12 cycles: 95 ° C - 15 sec; 62 ° C - 20 sec; 72 ° C - 30 sec; completion of the ends of the molecules at 72 ° C for 2 minutes PCR products were allowed for agarose gel electrophoresis in TAE buffer stained with ethidium bromide (Fig. 4). It can be seen that in the case of barcoding using linear PCR, target amplification is more efficient.
[0153] Пример 2[0153] Example 2
[0154] Анализ мутаций в гене BRAF[0154] Analysis of mutations in the BRAF gene
[0155] Для создания экспериментальных образцов был использован коммерческий образец геномной ДНК человека из здоровых доноров мужского пола (Human Male Control Genomic DNA, Promega, кат №G1471) - далее «образец BRAF-wt». Для получения мутантной по BRAF ДНК - геномная ДНК клеточной линии SK-Mel-1, содержащей гетерозиготную мутацию с. 1799 Т→А (p. Val600Glu) в гене BRAF.[0155] To create the experimental samples, a commercial human genomic DNA sample was used from healthy male donors (Human Male Control Genomic DNA, Promega, Cat No. G1471) - hereinafter referred to as “BRAF-wt sample”. To obtain BRAF mutant DNA, the genomic DNA of the SK-Mel-1 cell line containing a heterozygous mutation c. 1799 T → A (p. Val600Glu) in the BRAF gene.
[0156] Для выделения ДНК клеточный осадок линии SK-Mel-1 инкубировали с протеиназой K (Amresco, кат №О706) в стандартном буфере (100 мМ Трис-HCl; 50 мМ K3EDTA; 0,5% SDS; pH=8,0). Аликвоты по 1 миллиону клеток инкубировали в 1,2 мл буфера в течение 3 суток при 56°C. ДНК выделяли из лизата с использованием набора реагентов DNA Clean & Concentrator-5 (Zymo Research, кат № D4013) в соответствии с инструкцией производителя, на одно выделение использовали 300 мкл лизата.[0156] To isolate DNA, the SK-Mel-1 cell line was incubated with proteinase K (Amresco, Cat No. O706) in standard buffer (100 mM Tris-HCl; 50 mM K3EDTA; 0.5% SDS; pH = 8.0 ) Aliquots of 1 million cells were incubated in 1.2 ml of buffer for 3 days at 56 ° C. DNA was isolated from the lysate using the DNA Clean & Concentrator-5 reagent kit (Zymo Research, Cat. No. D4013) according to the manufacturer's instructions, 300 μl of the lysate was used for one isolation.
[0157] Образцы ДНК подвергали ультразвуковой фрагментации, результаты фрагментации контролировали с помощью гель-электрофореза в агарозе с окрашиванием бромистым этидием. Фрагментацию вели до появления доминирующих фрагментов длиной от 100 до 150 п.о. Концентрацию ДНК измеряли с использованием набора реагентов XY-Detect (Синтол, Россия, кат. № HG-402) и панели ДНК-калибраторов (в концентрации 50, 10 и 1 нг/мкл; Лаборатория Изоген, Россия, кат. № R0010) в соответствии с инструкциями производителей.[0157] DNA samples were subjected to ultrasonic fragmentation, the fragmentation results were monitored by agarose gel electrophoresis stained with ethidium bromide. Fragmentation was carried out until dominant fragments from 100 to 150 bp in length appeared. DNA concentration was measured using an XY-Detect reagent kit (Synthol, Russia, cat. No. HG-402) and a panel of DNA calibrators (at a concentration of 50, 10 and 1 ng / μl; Isogen Laboratory, Russia, cat. No. R0010) in according to manufacturers instructions.
[0158] Для получения амплифицированных экспериментальных образцов BRAF-wt ДНК смешивали с ДНК клеточной линии SK-Mel-1 в соотношении 100 к 1 (образец BRAF-mut100) и 1000 к 1 (образец BRAF-mut1000). В качестве контроля использовали образец ДНК BRAF-wt. Мутационный статус гена BRAF в образцах ДНК BRAF-mut100, BRAF-mut1000 и BRAF-wt был подтвержден стандартной и мутационно-специфической ПЦР в режиме реального времени с использованием набора реагентов Insider B-Raf (Евроген, Россия) с последующим секвенированием по Сэнгеру. Было показано что мутантная ДНК находится в 30 и 300-кратном избытке в образцах BRAF-mut100, BRAF-mut1000, соответственно.[0158] To obtain amplified experimental samples, BRAF-wt DNA was mixed with the DNA of the SK-Mel-1 cell line in a ratio of 100 to 1 (sample BRAF-mut100) and 1000 to 1 (sample BRAF-mut1000). As a control, a BRAF-wt DNA sample was used. The mutational status of the BRAF gene in BRAF-mut100, BRAF-mut1000, and BRAF-wt DNA samples was confirmed by standard and mutational-specific real-time PCR using the Insider B-Raf reagent kit (Eurogen, Russia) followed by Sanger sequencing. Mutant DNA was shown to be in 30 and 300 fold excess in samples BRAF-mut100, BRAF-mut1000, respectively.
[0159] Образцы BRAF-wt ДНК, BRAF-mut100 и BRAF-mut1000 использовали в качестве матрицы для баркодирования целевого фрагмента экзона 15 гена BRAF. Баркодирование с помощью линейной ПЦР, очистку и последующую амплификацию целевого фрагмента осуществляли как описано в Примере 1. Единственное отличие - использовали 3 цикла линейной ПЦР для баркодирования. Продукт ПЦР разводили в 40 раз и 1 мкл разведенного продукта добавляли в 50 мкл реакционной смеси для ПЦР, которую осуществляли в присутствии праймеров SEQ ID NOs: 197 и 233 в режиме предварительная денатурация при 95°C в течение 5 мин; 17 циклов: 95°C - 15 сек; 62°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. Продукты ПЦР разводили в 40 раз и 1 мкл разведенного продукта добавляли в 50 мкл реакционной смеси для ПЦР, которую осуществляли в присутствии праймеров SEQ ID NOs: 198 и одного из 264, 266, 267 (праймеры с различными индексными последовательностями, свой для каждого образца) в режиме предварительная денатурация при 95°C в течение 5 мин; 17 циклов: 95°C - 15 сек; 58°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°С в течение 2 мин. Для контроля эффективности амплификации использовали гель-электрофорез в агарозе в ТАЕ-буфере (40 мМ Трис-ацетат, pH 7,8-8,0; 1 мМ ЭДТА) с окраской бромистым этидием. Результаты гель-электрофореза суммированы на Рис. 4. Продукты ПЦР разных образцов очищали с помощью набора для очистки продуктов ПЦР (Qiagen, Германия), измеряли концентрацию продукта на флуориметре Qubit 2.0 (Life Technologies, США) с помощью набора реагентов Quant-IT dsDNA BR Assay Kit (Life Technologies, США, Cat. ID Q32853) в соответствии с инструкцией производителя и по 700 нг ДНК каждого продукта объединяли и секвенировали на приборе MiSeq v. 2 (Illumina) с использованием набора реагентов MiSeq 2 X 150 Cycle Sequencing Kit v. 2 (Illumina, кат. № MS-102-2002) в соответствии с инструкцией производителя. Были получены парные (двухсторонние) прочтения длиной 150 оснований.[0159] Samples of BRAF-wt DNA, BRAF-mut100 and BRAF-mut1000 were used as a matrix for barcoding the
[0160] Результаты массированного секвенирования были автоматически рассортированы по образцам, согласно меткам образцов, и использованы для анализа мутаций в экзоне 15 гена BRAF. На первом этапе анализа данных проводили оценку качества данных по стандартному протоколу с использованием программного обеспечения fastqc с дальнейшей фильтрацией при помощи программного обеспечения flexbar. Далее, результаты секвенирования (индивидуальные прочтения) картировали на референсную последовательность 15-го экзона гена BRAF (SEQ ID NO: 1). В первом случае прочтения картировали с помощью программы Bowtie2 с использованием стандартных параметров. Полученные на данном этапе данные соответствовали стандартно получаемому результату биоинформационного анализа. Во втором случае сначала отфильтровывали прочтения, которые не перекрывали референсную последовательность, или не содержали полноценного баркода. Полученный пул данных группировали в «семейства», внутри которых все молекулы имели одинаковый баркод. Семейства, содержащие один член, отбрасывали как непригодные для статистического анализа. В результате обработки данных с учетом всех требований оказалось отброшено ~20% прочтений. После формирования «семейств» с идентичными баркодами для каждого из них с помощью программы Bowtie2 собирали консенсус с доминирующим вариантом в каждой позиции (доля доминирующего варианта - не менее 95%). Если доминирующего варианта не обнаруживалось в консенсусную последовательность вносился символ «X». Наконец, полученные консенсусные последовательности картировали на референсную последовательность 15-го экзона гена BRAF с помощью программы Bowtie2 с использованием стандартных параметров.[0160] The results of massive sequencing were automatically sorted according to samples according to the labels of the samples and used to analyze mutations in
[0161] Результаты выравнивания до и после обработки трансформировали в таблицу, содержащую данные о том, сколько раз каждый вариант встретился в каждой позиции последовательности. Для расчета приблизительного числа молекул целевого фрагмента ДНК в ПЦР-продуктах и в исходных образцах использовали полученные данные о количестве прочтений и семейств с различными баркодами, соответственно, с поправкой на общий объем реакционной смеси: для образцов, использованных для секвенирования: общий объем реакционной смеси был в 60 раз больше объема, использованного для секвенирования (таблица 3).[0161] The alignment results before and after processing were transformed into a table containing data on how many times each variant occurred in each position of the sequence. To calculate the approximate number of molecules of the target DNA fragment in PCR products and in the original samples, we used the obtained data on the number of reads and families with different barcodes, respectively, adjusted for the total volume of the reaction mixture: for samples used for sequencing: the total volume of the reaction mixture was 60 times the volume used for sequencing (table 3).
[0162] Для оценки избирательности метода производили проверку наличия в данных по образцам с мутацией «сигнала» (прочтений и семейств, соответствующих мутации с. 1799 Т→А), а в случае наличия этого сигнала производили сравнение его уровня с уровнем «шума» от ошибок ПЦР и секвенирования. Под уровнем шума К понимали отношение числа чтений с неверными вариантами к сумме числа чтений с неверными вариантами и числа чтений с верным вариантом (чтения с символом «N» в обоих случаях не учитывали ни в числителе, ни в знаменателе; чтения с символом «X» в случае выравнивания с предварительной кластеризацией по баркодам учитывали как часть шума, т.е. и в числителе и в знаменателе). Полученные ряды значений параметра K (всего 12 рядов) анализировали с помощью базовых статистических методов. Для каждого ряда вычисляли выборочное среднее и стандартное отклонение выборки. Соответствие распределения значений в каждом ряду нормальному распределению проверяли с помощью критерия Колмогорова-Смирнова. Так как по этому критерию распределение соответствовало нормальному, проводили сравнение средних значений в парах рядов для одного образца с помощью t-критерия Стьюдента (двусторонний, двухвыборочный с неравным отклонением). Статистические операции выполняли с помощью программы Microsoft Excel и надстройки AtteStat (StatSoft, Россия). Результаты статистического анализа суммированы в Таблице 4. Выравнивание с предварительной кластеризацией по баркодам позволило снизить уровень шума приблизительно в 10 раз, причем это различие отличается высоким уровнем статистической значимости (p-value). Параллельно с уменьшением уровня шума увеличивается уровень сигнала, а соответственно, растет и избирательность анализа. Если при стандартном анализе уровень сигнала превышает средний уровень шума всего в 3,5 или 4,6 раз, то после кластеризации по баркодам сигнал превышает средний уровень шума в 31 раз и более. Таким образом, хотя сигнал, соответствующий наличию мутации с. 1799 Т→А, был обнаружен в данных всех образцов, при использовании стандартного выравнивания достоверно отличить сигнал от шума при стандартном выранивании возможно только в образце BRAF-mut100. Иными словами, при стандартном выравнивании достигается уровень избирательности 1:30, но не 1:300.[0162] To assess the selectivity of the method, the presence of a “signal” in the data for samples with mutations (readings and families corresponding to the mutation p. 1799 T → A) was checked, and if this signal was present, its level was compared with the “noise” level from PCR and sequencing errors. The noise level K was understood as the ratio of the number of readings with incorrect options to the sum of the number of readings with incorrect options and the number of readings with the correct option (readings with the symbol "N" in both cases were not taken into account either in the numerator or denominator; readings with the symbol "X" in the case of equalization with preliminary clustering by barcodes, they were taken into account as part of the noise, i.e., both in the numerator and denominator). The obtained series of values of the parameter K (a total of 12 series) were analyzed using basic statistical methods. For each series, the sample mean and standard deviation of the sample were calculated. The correspondence of the distribution of values in each row to the normal distribution was checked using the Kolmogorov-Smirnov criterion. Since, according to this criterion, the distribution corresponded to the normal one, we compared the average values in pairs of rows for one sample using the Student t-test (two-sided, two-sample with unequal deviation). Statistical operations were performed using the Microsoft Excel program and the AtteStat add-in (StatSoft, Russia). The results of the statistical analysis are summarized in Table 4. Alignment with pre-clustering by barcodes reduced the noise level by about 10 times, and this difference is characterized by a high level of statistical significance (p-value). In parallel with a decrease in the noise level, the signal level increases, and, accordingly, the selectivity of the analysis increases. If in a standard analysis the signal level exceeds the average noise level by only 3.5 or 4.6 times, then after clustering by barcodes the signal exceeds the average noise level by 31 times or more. Thus, although the signal corresponding to the presence of a mutation c. 1799 T → A, was found in the data of all samples, using standard equalization, it is possible to reliably distinguish the signal from noise with standard alignment only in the BRAF-mut100 sample. In other words, with standard alignment, a selectivity level of 1:30, but not 1: 300, is achieved.
[0163] Пример 3[0163] Example 3
[0164] Проверка специфичности праймеров[0164] Verification of the specificity of the primers
[0165] Олигонуклеотидные праймеры (таблица 1) были синтезированы на синтезаторе Applied Biosystems ABI 3900. Олигонуклеотиды обессоливали и очищали на ПААГ согласно стандартному протоколу. Для приготовления смесей олигонуклеотидов лиофилизированные праймеры, полученные после синтеза, растворяли стерильной деионизованной водой для молекулярно-биологических работ до конечной концентрации 10 мкМ. Олигонуклеотиды для каждой группы (Таблица 2) смешивали в эквимолярных количествах и использовали для тестовых ПЦР. В каждом случае реакционную смесь объемом 25 мкл, содержащую смесь баркодирующих праймеров (группы А, Б, В или Г) в конечной концентрации 0,2 мкМ каждого, 1Х буфер для полимеразы Tersus (Евроген, Россия), 10 нг геномной ДНК человека (Human Male Control Genomic DNA, Promega, кат № G1471), 200 мкМ каждого нуклеозидтрифосфата и полимеразу Tersus подвергали линейной ПЦР в режиме: предварительная денатурация при 95°C в течение 5 мин; 5 циклов: 95°C - 15 сек; 58°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. Далее в реакционную смесь добавляли 1,5 мкл эндонуклеазы I (New England BioLabs) и инкубировали 45 мин при 37°C. Эндонуклеазу инактивировали 10 мин прогреванием при 68°C и переносили пробирку в лед. Через 2 мин продукты реакции очищали с помощью наборов для выделения ДНК из агарозного геля и реакционных смесей Cleanup Mini (Евроген, Россия), элюировали 11,5 мкл стерильной деионизованной водой для молекулярно-биологических работ. 10 мкл полученного продукта использовали для амплификации в присутствии смеси REV-праймеров для мультиплексной амплификации (группы А, Б, В или Г, соответственно) и праймера TS-Uni-short (конечная концентрация праймеров 0,2 мкМ). Для ПЦР использовали набор реагентов Tersus PCR kit (Евроген, Россия) согласно прилагаемой инструкции. Амплификацию осуществляли в режиме: предварительная денатурация при 95°C в течение 1 мин; 29 циклов: 95°C - 15 сек; 62°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. Продукт ПЦР (конечное разведение в новой реакционной смеси 1:1000) подвергали nested ПЦР в присутствии смеси геноспецифических внутренних праймеров для ПЦР с выходом наружу (смесь 2) и праймера TruSeq Universal long (SEQ ID No: 197) в конечной концентрации 0,2 мкМ в режиме: предварительная денатурация при 95°C в течение 1 мин; 17 циклов ПЦР: 95°C - 15 сек; 58°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин.[0165] Oligonucleotide primers (Table 1) were synthesized on an Applied Biosystems ABI 3900 synthesizer. Oligonucleotides were desalted and purified on a SDS page according to a standard protocol. To prepare mixtures of oligonucleotides, lyophilized primers obtained after synthesis were dissolved with sterile deionized water for molecular biological work to a final concentration of 10 μM. Oligonucleotides for each group (Table 2) were mixed in equimolar amounts and used for test PCR. In each case, a 25 μl reaction mixture containing a mixture of barcoding primers (groups A, B, C or D) in a final concentration of 0.2 μM each, 1X Tersus polymerase buffer (Eurogen, Russia), 10 ng of human genomic DNA (Human Male Control Genomic DNA, Promega, Cat No. G1471), 200 μM of each nucleoside triphosphate and Tersus polymerase were subjected to linear PCR in the mode: preliminary denaturation at 95 ° C for 5 min; 5 cycles: 95 ° C - 15 sec; 58 ° C - 20 sec; 72 ° C - 30 sec; completion of the ends of the molecules at 72 ° C for 2 minutes Next, 1.5 μl of endonuclease I (New England BioLabs) was added to the reaction mixture and incubated for 45 min at 37 ° C. The endonuclease was inactivated for 10 min by heating at 68 ° C and the tube was transferred to ice. After 2 min, reaction products were purified using agarose gel DNA extraction kits and Cleanup Mini reaction mixtures (Eurogen, Russia), 11.5 μl of sterile deionized water was eluted for molecular biological work. 10 μl of the obtained product was used for amplification in the presence of a mixture of REV primers for multiplex amplification (groups A, B, C or D, respectively) and TS-Uni-short primer (final concentration of primers 0.2 μM). For PCR, a Tersus PCR kit reagent kit (Eurogen, Russia) was used according to the attached instructions. Amplification was carried out in the following mode: preliminary denaturation at 95 ° C for 1 min; 29 cycles: 95 ° C - 15 sec; 62 ° C - 20 sec; 72 ° C - 30 sec; completion of the ends of the molecules at 72 ° C for 2 minutes The PCR product (final dilution in the new reaction mixture 1: 1000) was subjected to nested PCR in the presence of a mixture of genespecific internal PCR primers with outward passage (mixture 2) and TruSeq Universal long primer (SEQ ID No: 197) at a final concentration of 0.2 μM in the mode: preliminary denaturation at 95 ° C for 1 min; 17 cycles of PCR: 95 ° C - 15 sec; 58 ° C - 20 sec; 72 ° C - 30 sec; completion of the ends of the molecules at 72 ° C for 2 minutes
[0166] Полученный продукт ПЦР разводили (конечная концентрация в новой реакционной смеси 1:1000) и анализировали специфичность амплификации с использованием индивидуальных пар праймеров (баркодирующий праймер + геноспецифический BRIDGE-праймер) для каждого референсного фрагмента (таблица 1). Для ПЦР использовали набор Encyclo PCR kit (Евроген, Россия) согласно прилагаемой инструкции производителя. Продукты амплификации анализировали при помощи гель-электрофореза в агарозе с ТАЕ-буфером и окрашиванием бромистым этидием. Продукты тестовых ПЦР клонировали в pAL-TA вектор и в каждом случае секвенировали вставки трех отобранных клонов для подтверждения соответствия структуры клонированного фрагмента ожидаемой нуклеотидной последовательности. Секвенирование осуществляли на автоматическом секвенаторе ABI3730xl. Во всех случаях секвенирование подтвердило соответствие структуры продукта амплификации ожидаемой нуклеотидной последовательности.[0166] The obtained PCR product was diluted (final concentration in the new reaction mixture 1: 1000) and the specificity of amplification was analyzed using individual primer pairs (barcoding primer + gene-specific BRIDGE primer) for each reference fragment (table 1). For PCR, the Encyclo PCR kit (Eurogen, Russia) was used according to the attached manufacturer's instructions. Amplification products were analyzed by agarose gel electrophoresis with TAE buffer and ethidium bromide staining. The PCR test products were cloned into a pAL-TA vector, and in each case, the inserts of three selected clones were sequenced to confirm that the structure of the cloned fragment matches the expected nucleotide sequence. Sequencing was performed on an ABI3730xl automated sequencer. In all cases, sequencing confirmed that the structure of the amplification product corresponded to the expected nucleotide sequence.
[0167] Пример 4[0167] Example 4
[0168] Выявление мутации опухолевого происхождения в ДНК плазмы крови[0168] Identification of mutations of tumor origin in the DNA of blood plasma
[0169] Был проведен сравнительный анализ мутаций в трех образцах ДНК от одного и того же пациента со злокачественной меланомой кожи III стадии. В качестве источников ДНК были использованы: а) операционный материал - первичная опухоль - в виде парафинового блока с фиксированной формалином тканью; б) операционный материал - лимфатический узел без признаков метастазирования, но с подозрением на микрометастазы по косвенным признакам («сторожевое» положение узла, увеличенный размер, аномальная структура стромы) - также в виде парафинового блока с фиксированной формалином тканью; в) кровь, забранная у пациента перед операцией.[0169] A comparative analysis of mutations was carried out in three DNA samples from the same patient with stage III malignant skin melanoma. The following sources were used as DNA sources: a) surgical material - the primary tumor - in the form of a paraffin block with formalin-fixed tissue; b) surgical material - a lymph node without signs of metastasis, but with suspected micrometastases by indirect signs (“watchdog” position of the node, increased size, abnormal structure of the stroma) - also in the form of a paraffin block with fixed formalin tissue; c) blood taken from the patient before surgery.
[0170] Образцы, представленные в виде парафиновых блоков, сперва подвергались морфологическому контролю. По результатам морфологического контроля оба образца были признаны удовлетворяющими критериям для использования в настоящем эксперименте и были использованы для выделения ДНК без дополнительных диссекционных процедур. С каждого из блоков было изготовлено по 4 стеклопрепарата. Использовались предметные стекла, покрытые поли-L-лизином (ApexLab, Москва). На каждое предметное стекло наносилось по 2 среза толщиной 6 мкм и площадью от 0,9 до 1,3 см2. Срезы изготавливались на ротационном микротоме RM5230 (Leica, Германия) с использованием одноразовых лезвий; перед началом работы с каждым новым блоком рабочие поверхности микротома дважды протирались 96%-ным этанолом; первые два среза с каждого блока не использовались (выбрасывались) для исключения кросс-контаминации образцов. Для прикрепления срезов к поли-L-лизиновому покрытию предметные стекла после нанесения срезов прогревались в сухожаровом шкафу при температуре 56°C в течение 3 часов. Покраска и заключение срезов под покровные стекла не производились. Выделение ДНК из прикрепленных срезов производилось с помощью набора реагентов QuickExtract FFPE DNA Extraction Kit (Epicentre, США) в соответствии с инструкцией производителя с небольшими изменениями: по окончании инкубации при +90 С пробирки с раствором ДНК помещали на +4 С на 2 минуты, после чего центрифугировали на микроцентрифуге (СМ-50, BioSan, Латвия) на максимальных оборотах в течение 10 минут. Образовавшееся над раствором кольцо из концентрированного парафина осторожно прокалывали посередине 300-микролитровым одноразовым пластиковым наконечником для автоматического дозатора, после чего через прокол отбирали раствор с помощью одноканального автоматического механического дозатора и аналогичного 200-микролитрового наконечника; отбор раствора производили максимально осторожно, стараясь не захватить осадок на дне пробирки. Полученный раствор ДНК хранили при -20 C до дальнейшего использования.[0170] Samples presented as paraffin blocks were first subjected to morphological control. According to the results of morphological control, both samples were found to satisfy the criteria for use in this experiment and were used to isolate DNA without additional dissection procedures. Four glass products were made from each of the blocks. Used slides coated with poly-L-lysine (ApexLab, Moscow). For each glass slide, 2 sections were applied with a thickness of 6 μm and an area of 0.9 to 1.3 cm2. Slices were made on a rotational microtome RM5230 (Leica, Germany) using disposable blades; Before starting work with each new block, the working surfaces of the microtome were twice wiped with 96% ethanol; the first two slices from each block were not used (discarded) to exclude cross-contamination of the samples. To attach the slices to the poly-L-lysine coating, the slides, after applying the slices, were heated in a dry heat oven at a temperature of 56 ° C for 3 hours. Painting and conclusion of sections under coverslips were not made. DNA was isolated from attached sections using the QuickExtract FFPE DNA Extraction Kit (Epicentre, USA) in accordance with the manufacturer's instructions with slight modifications: after incubation at +90 C, the tubes with the DNA solution were placed at +4 C for 2 minutes, after which was centrifuged in a microcentrifuge (SM-50, BioSan, Latvia) at maximum speed for 10 minutes. A ring of concentrated paraffin formed above the solution was carefully punctured in the middle with a 300-liter disposable plastic tip for an automatic dispenser, after which the solution was taken through a puncture using a single-channel automatic mechanical dispenser and a similar 200-microliter tip; the solution was selected as carefully as possible, being careful not to trap the sediment at the bottom of the tube. The resulting DNA solution was stored at -20 C until further use.
[0171] Образец крови забирали путем пункции локтевой вены в пробирку типа Vacutainer (Beckton Dickinson, США) объемом 10 мл, содержащую 1,1 мл консерванта на основе K3EDTA. Кровь тщательно перемешивали с консервантом и помещали на +4 C. Не позднее чем через полчаса производили отделение плазмы крови от клеток крови с использованием стандартного протокола (описан, в частности, в Приложении 2 к инструкциям к наборам Insider, ЗАО «Евроген», Москва). Плазму и клетки крови хранили при -80 С до момента выделения ДНК. ДНК из плазмы крови выделяли с использованием набора реагентов QiaAMP Circulating Nucleic Acids Kit (Qiagen, США, cat. ID 55114) в соответствии с инструкцией производителя. Финальную элюцию производили двукратно, каждый раз использовали 11 мкл элюирующего буфера, входящего в состав набора реагентов. Раствор ДНК хранили при -20 С до дальнейшего использования.[0171] A blood sample was taken by puncture of the ulnar vein into a 10 ml Vacutainer tube (Beckton Dickinson, USA) containing 1.1 ml of K3EDTA preservative. Blood was thoroughly mixed with a preservative and placed at +4 C. Not later than half an hour later, blood plasma was separated from blood cells using the standard protocol (described, in particular, in
[0172] Образцы ДНК подвергали ферментативной фрагментации с помощью набора реагентов dsDNA Fragmentase (New England Biolabs, США) в соответствии с инструкцией производителя, результаты фрагментации контролировали с помощью гель-электрофореза в агарозе с окрашиванием бромистым этидием. Фрагментацию вели до появления доминирующих фрагментов длиной от 100 до 150 п.о. Концентрацию ДНК измеряли с использованием набора реагентов XY-Detect (Синтол, Россия, кат. № HG-402) и панели ДНК-калибраторов (в концентрации 50, 10 и 1 нг/мкл; Лаборатория Изоген, Россия, кат. № R0010) в соответствии с инструкциями производителей.[0172] DNA samples were subjected to enzymatic fragmentation using the dsDNA Fragmentase reagent kit (New England Biolabs, USA) according to the manufacturer's instructions, the fragmentation results were monitored by ethidium bromide stained gel electrophoresis. Fragmentation was carried out until dominant fragments from 100 to 150 bp in length appeared. DNA concentration was measured using an XY-Detect reagent kit (Synthol, Russia, cat. No. HG-402) and a panel of DNA calibrators (at a concentration of 50, 10 and 1 ng / μl; Isogen Laboratory, Russia, cat. No. R0010) in according to manufacturers instructions.
[0173] Мутационный статус гена BRAF в образцах Τ (ДНК из опухолевой ткани), LN (ДНК из лимфатического узла) и Ρ (ДНК из плазмы крови) был проанализирован стандартной и мутационно-специфической ПЦР в режиме реального времени с использованием набора реагентов Insider B-Raf (Евроген, Россия) с последующим секвенированием по Сэнгеру. Было показано что в образце Τ присутствует мутация с. 1799 Т→А (p. Val600Glu) в 15-м экзоне гена BRAF примерно в 45% копий гена, в образце LN - примерно в 10% копий, а в образце Ρ она не обнаруживалась (предел избирательности анализа для данного образца составил 1:80).[0173] The mutational status of the BRAF gene in samples of Τ (DNA from tumor tissue), LN (DNA from lymph node) and Ρ (DNA from blood plasma) was analyzed by standard and mutational-specific real-time PCR using the Insider B reagent kit -Raf (Eurogen, Russia) followed by Sanger sequencing. It was shown that mutation c is present in sample Τ. 1799 T → A (p. Val600Glu) in the 15th exon of the BRAF gene in about 45% of copies of the gene, in sample LN - in about 10% of copies, and it was not found in sample ((the selectivity of analysis for this sample was 1: 80).
[0174] Образцы Т, LN и Ρ использовали в качестве матрицы для баркодирования целевых фрагментов генов KRAS, NRAS, HRAS, ARAF, BRAF, CRAF, PIK3CA и Akt1. Параллельно через все этапы реакций баркодирования проводились также два контроля - положительный контроль ПЦР (30 нг фрагментированной ДНК из клеточной линии Raji) и отрицательный контроль ПЦР (NTC - no template control - контроль без ДНК). Баркодирование с помощью линейной ПЦР, очистку и последующую амплификацию целевых фрагментов осуществляли как описано в Примере 3. Использовали наборы праймеров, включенные в группу В в Табл. 2, полученные как описано в примере 3 (смешанные в неэквимолярных количествах), и праймеры для амплификации внутреннего контроля - фрагмента гена IDH1. Линейную ПЦР проводили в течение 5 циклов в двух повторностях, после обработки экзонуклеазой и очистки продукта реакции продукты двух повторностей линейной ПЦР объединяли и вносили в реакционную смесь для ПЦР-амплификации, которую проводили в режиме: предварительная денатурация при 95°C в течение 5 мин; 28 циклов: 95°C - 15 сек; 62°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. Продукт ПЦР-амплификации 1 разводили в 40 раз и 1 мкл разведенного продукта добавляли в 50 мкл реакционной смеси для ПЦР с выходом наружу (использовали праймеры с 5-ю различными индексными последовательностями - для трех исследуемых образцов, положительного контроля и отрицательного контроля ПЦР), которую осуществляли в режиме: предварительная денатурация при 95°C в течение 5 мин; 17 циклов: 95°C - 15 сек; 58°C - 20 сек; 72°C - 30 сек; достройка концов молекул при 72°C в течение 2 мин. Для контроля эффективности амплификации использовали гель-электрофорез в агарозе в ТАЕ-буфере (40 мМ Трис-ацетат, pH 7,8-8,0; 1 мМ ЭДТА) с окраской бромистым этидием. Продукты ПЦР разных образцов очищали с помощью набора для очистки продуктов ПЦР (Qiagen, Германия), измеряли концентрацию продукта на флуориметре Qubit 2.0 (Life Technologies, США) с помощью набора реагентов Quant-IT dsDNA BR Assay Kit (Life Technologies, США, Cat. ID Q32853) в соответствии с инструкцией производителя. По 50 нг продуктов амплификации образцов Τ и Raji (положительный контроль ПЦР) и весь объем продуктов амплификации образцов LN, Ρ и NTC (отрицательный контроль ПЦР) объединяли (суммарный вес полученной смеси продуктов ПЦР составил 860 нг) и секвенировали на приборе HiSeq2000 (Illumina) с использованием наборов HiSeq РЕ Cluster Kit v3 cBot (Illumina, кат. № РЕ-301-3001) и HiSeq SBS Kit v.3 (Illumina, кат. № FC-301-2003) в соответствии с инструкцией производителя. Были получены парные (двухсторонние) прочтения длиной 105 оснований.[0174] Samples T, LN, and Ρ were used as a matrix for barcoding target fragments of the KRAS, NRAS, HRAS, ARAF, BRAF, CRAF, PIK3CA, and Akt1 genes. At the same time, two controls were also carried out through all stages of the barcoding reactions - positive control of PCR (30 ng of fragmented DNA from the Raji cell line) and negative control of PCR (NTC - no template control - control without DNA). Barcoding using linear PCR, purification and subsequent amplification of the target fragments was carried out as described in Example 3. Used sets of primers included in group B in Table. 2, obtained as described in example 3 (mixed in non-equimolar amounts), and primers for amplification of the internal control - IDH1 gene fragment. Linear PCR was performed for 5 cycles in duplicate, after treatment with an exonuclease and purification of the reaction product, the products of two replicates of linear PCR were combined and introduced into the reaction mixture for PCR amplification, which was carried out in the following mode: preliminary denaturation at 95 ° C for 5 min; 28 cycles: 95 ° C - 15 sec; 62 ° C - 20 sec; 72 ° C - 30 sec; completion of the ends of the molecules at 72 ° C for 2 minutes The
[0175] Результаты массированного секвенирования были автоматически рассортированы по образцам, согласно индексным последовательностям, с помощью программы CASAVA v.2.3.1 (Illumina) и использованы для анализа мутаций в баркодированных и амплифицированных регионах генома человека. На первом этапе анализа данных проводили оценку качества данных по стандартному протоколу с использованием программного обеспечения fastqc с дальнейшей фильтрацией при помощи программного обеспечения flexbar. Дальнейший анализ проводили с применением стратегии MIGEC (Shugay et al. Nat Meth. 2014; 11(6):653-5). Была проведена оценка достоверности каждого отдельного прочтения, выделение молекулярных баркодов, группировка потомков одной исходной молекулы, сборка консенсусной последовательности внутри каждого «семейства» молекул, выравнивание полученных консенсусных последовательностей на референсные последовательности, вторичная корректировка редких ошибок, случайно оказавшихся доминирующими внутри отдельных «семейств» молекул, и вывод результатов в табличном виде.[0175] The results of massive sequencing were automatically sorted into samples according to index sequences using the CASAVA v.2.3.1 program (Illumina) and used to analyze mutations in the barcoded and amplified regions of the human genome. At the first stage of data analysis, data quality was evaluated according to a standard protocol using fastqc software with further filtering using flexbar software. Further analysis was performed using the MIGEC strategy (Shugay et al. Nat Meth. 2014; 11 (6): 653-5). The reliability of each individual reading was assessed, molecular barcodes were distinguished, the descendants of one source molecule were grouped, the consensus sequence was assembled within each “family” of molecules, the obtained consensus sequences were aligned to reference sequences, and secondary corrections of rare errors that accidentally dominated inside the individual “families” of molecules , and output the results in a table form.
[0176] Полученные результаты по экзону 15 гена BRAF представлены в Табл. 5. По другим исследованным регионам не было выявлено ни одного «семейства» с какой-либо мутацией ни в одном из 5 образцов.[0176] The results obtained for
[0177] Таким образом, удалось выявить небольшой процент мутантных молекул ДНК опухолевого происхождения в ДНК плазмы крови пациента с опухолью, имеющей соответствующую мутацию, с избирательностью более чем 1:140. Важно также отметить, что низкопредставленные молекулы с мутацией были бы неотличимы от ошибок ПЦР и секвенирования в случае стандартного анализа, а отличить одно от другого оказалось возможно именно благодаря использованию аналитического подхода, опирающегося на предварительную группировку прочтений в «семейства» на основе индивидуальных молекулярных баркодов.[0177] Thus, it was possible to identify a small percentage of mutant DNA molecules of tumor origin in the blood plasma DNA of a patient with a tumor having an appropriate mutation with a selectivity of more than 1: 140. It is also important to note that low-represented molecules with a mutation would be indistinguishable from PCR and sequencing errors in the case of standard analysis, and it was possible to distinguish one from the other precisely thanks to the use of an analytical approach based on a preliminary grouping of reads into “families” based on individual molecular barcodes.
>SEQ ID NO:1> SEQ ID NO: 1
aaatgagatctactgttttcctttacttactacacctcagATATATTTCTTCATGAAGACCTCACAGTAAAAATAGGTGATTTTGGTCTAGCTACAGTGAAATCTCGATaaatgagatctactgttttcctttacttactacacctcagATATATTTCTTCATGAAGACCTCACAGTAAAAATAGGTGATTTTTGGTCTAGCTACAGTGAAATCTCGAT
>SEQ ID NO:2> SEQ ID NO: 2
TCCCCTTCCCTGCCCCAGCCAATGCCCCCCTACAGCGCATCCGCTCCACGTCCACTCCCAACGTCCATATGGTCAGCACCACGGCCCCCATGGACTCCAACCTCATCCAGgttggtgctgtgggggacaatgccggggacTCCCCTTCCCTGCCCCAGCCAATGCCCCCCTACAGCGCATCCGCTCCACGTCCACTCCCAACGTCCATATGGTCAGCACCACGGCCCCATGGACTCCAACCTCATCCAGgttggtgctgtgggggacaatgccggggacac
>SEQ ID NO:3> SEQ ID NO: 3
CCTCACGCCTTCACCTTTAACACCTCCAGTCCCTCATCTGAAGGTTCCCTCTCCCAGAGGCAGAGGTCGACATCCACACCTAATGTCCACATGGTCAGCACCACCCTGCCTGTGGACCCTCACGCCTTCACCTTTAACACCTCCAGTCCCTCATCTGAAGGTTCCCTCTCCCAGAGGCAGAGGTCGACATCCACACCTAATGTCCACATGGTCAGCACCACCCTGCCTGTGGAC
>SEQ ID NO:4> SEQ ID NO: 4
acagAAACCCATGTATGAAGTACAGTGGAAGGTTGTTGAGGAGATAAATGGAAACAATTATGTTTACATAGACCCAACACAACTTCCTTATGATCACAAATGGGAGTTTCCCAGAAACAGGCTGAGTTTTGgtcagtacagAAACCCATGTATGAAGTACAGTGGAAGGTTGTTGAGGAGATAAATGGAAACAATTATGTTTACATAGACCCAACACAACTTCCTTATGATCACAAATGGGAGTTTCCCAGAAACAGGCTGAGTTTTGgtcagt
>SEQ ID NO:5> SEQ ID NO: 5
AGCTGGTGGCGTAGGCAAGAGTGCCTTGACGATACAGCTAATTCAGAATCATTTTGTGGACGAATATGATCCAACAATAGAGGtaaatcttgttttaatatgcatattactggtAGCTGGTGGCGTAGGCAAGAGTGCCTTGACGATACAGCTAATTCAGAATCATTTTTGTGGACGAATATGATCCAACAATAGAGGtaaatcttgttttaatatgcatattactggt
>SEQ ID NO:6> SEQ ID NO: 6
gtgtttctcccttctcagGATTCCTACAGGAAGCAAGTAGTAATTGATGGAGAAACCTGTCTCTTGGATATTCTCGACACAGCAGGTCAAGAGGAGTACAGTGCgtgtttctcccttctcagGATTCCTACAGGAAGCAAGTAGTAATTGATGGAGAAACCTGTCTCTTGGATATTCTCGACACAGCAGGTCAAGAGGAGTACAGTGC
>SEQ ID NO:7> SEQ ID NO: 7
taacttttttttctttcccagAGAACAAATTAAAAGAGTTAAGGACTCTGAAGATGTACCTATGGTCCTAGTAGGAAATAAATGTGATTTGCCTTCTAGAACAGTAGACACAAAACAGGCTCAGGACTTAGCAAGAAGTTATGGAATTCCTTTTATTGAAACATCAGCAAAGACAAGACAGgtaagtaacactgaaataaatacagatctgtttan
>SEQ ID NO:8> SEQ ID NO: 8
TGCTGGTGTGAAATGACTGAGTACAAACTGGTGGTGGTTGGAGCAGGTGGTGTTGGGAAAAGCGCACTGACAATCCAGCTAATCCAGAACCACTTTGTAGATGAATATGATCCCACCATAGAGgtgaggccTGCTGGTGTGAAATGACTGAGTACAAACTGGTGGTGGTTGGAGCAGGTGGTGTTGGGAAAAGCGCACTGACAATCCAGCTAATCCAGAACCACTTTGTAGATGAATATATGATCCCACCATAGAGgtgaggcccc
>SEQ ID NO:9> SEQ ID NO: 9
CTGTTTGTTGGACATACTGGATACAGCTGGACAAGAAGAGTACAGTGCCATGAGAGACCAATACATGAGGACAGGCGAAGGCTTCCTCTGTGTATTTGCCATCAATAATAGCTGTTTGTTGGACATACTGGATACAGCTGGACAAGAAGAGTACAGTGCCATGAGAGACCAATACATGAGGACAGGCGAAGGCTTCCTCTGTGTATTTGCCATCAATAATAG
>SEQ ID NO:10> SEQ ID NO: 10
GTGGGAAACAAGTGTGATTTGCCAACAAGGACAGTTGATACAAAACAAGCCCACGAACTGGCCAAGAGTTACGGGATTCCATTCATTGAAACCTCAGCCAAGACCAGACAGgtaGTGGGAAACAAGTGTGATTTGCCAACAAGGACAGTTGATACAAAACAAGCCCACGAACTGGCCAAGAGTTACGGGATTCCATTCATTGAAACCTCAGCCAAGACCAGACAGgta
>SEQ ID NO:11> SEQ ID NO: 11
CCCGGGCCGCAGGCCCCTGAGGAGCGATGACGGAATATAAGCTGGTGGTGGTGGGCGCCGGCGGTGTGGGCAAGAGTGCGCTGACCATCCAGCTGATCCAGAACCATTTTGTGGACGAATACGACCCCCCGGGCCGCAGGCCCCTGAGGAGCGATGACGGAATATAAGCTGGTGGTGGTGGGCGCCGGCGGTGTGGGCAAGAGTGCGCTGACCATCCAGCTGATCCAGAACCATTTTGTGGACGAATACGACCC
>SEQ ID NO:12> SEQ ID NO: 12
CCGGAAGCAGGTGGTCATTGATGGGGAGACGTGCCTGTTGGACATCCTGGATACCGCCGGCCAGGAGGAGTACAGCGCCATGCGGGACCAGTACATGCGCACCGGGGAGGGCCCGGAAGCAGGTGGTCATTGATGGGGAGAGGTGCCTGTTGGACATCCTGGATACCGCCGGCCAGGAGGAGTACAGCGCCATGCGGGACCAGTACATGCGCACCGGGGAGAGGGC
>SEQ ID NO:13> SEQ ID NO: 13
GATGACGTGCCCATGGTGCTGGTGGGGAACAAGTGTGACCTGGCTGCACGCACTGTGGAATCTCGGCAGGCTCAGGACCTCGCCCGAAGCTACGGCATCCCCTACATCGAGACCTCGGCCAAGACCCGGCAGgGATGACGTGCCCATGGTGCTGGTGGGGAACAAGTGTGACCTGGCTGCACGCACTGTGGAATCTCGGCAGGCTCAGGACCTCGCCCGAAGCTACGGCATCCCCTACATCGAGACCTCGGCCAAGACCCGGCAGg
>SEQ ID NO:14> SEQ ID NO: 14
AACTTGGAGGCCTTGCAGAAGAAGCTGGAGGAGCTAGAGCTTGATGAGCAGCAGCGAAAGCGCCTTGAGGCCTTTCTTACCCAGAAGCAGAAGGTGGGAGAACTGAAGGATGACGACTTTGAGAAGATCAGTGAGCTGGGGGCTGGAACTTGGAGGCCTTGCAGAAGAAGCTGGAGGAGCTAGAGCTTGATGAGCAGCAGCGAAAGCGCCTTGAGGCCTTTCTTACCCAGAAGCAGAAGGTGGGAGAACTGAAGGATGACGACTTTGAGAAGATCAGTGAGCGGGGGT
>SEQ ID NO:15> SEQ ID NO: 15
CATGTGCTCCATGCAGATACTGATCTCGCCATCGCTGTAGAACGCACCATAGAAGCCCACGATGTACGGAGAGTTGCACTCATGCAGAACCTGCAGCTCCCTTATGATCTGGTTCCGGATTGCGGGTTTGATCTCCAGATGAATTAGctCATGTGCTCCATGCAGATACTGATCTCGCCATCGCTGTAGAACGCACCATAGAAGCCCACGATGTACGGAGAGTTGCACTCATGCAGAACCTGCAGCTCCCTTATGATCTGGTTCCGGATTGCGGGTTGATC
>SEQ ID NO:16> SEQ ID NO: 16
GTGGGGAGATCAAGCTCTGTGACTTTGGGGTCAGCGGGCAGCTCATCGACTCCATGGCCAACTCCTTCGTGGGCACAAGGTCCTACATGTCGgtatgaacagaagtttccattgcttgagcttGTGGGGAGATCAAGCTCTGTGACTTTGGGGTCAGCGGGCAGCTCATCGACTCCATGGCCAACTCCTTCGTGGGCACAAGGTCCTACATGTCGgtatgaacagaagtttccattgcttgagctt
>SEQ ID NO:17> SEQ ID NO: 17
ggccacctgcgcagagcctgcactcactccttgtgtgccctctagGACGGCGGCTCCCTGGACCAGGTGCTGAAAGAGGCCAAGAGGATTCCCGAGGAGATCCTGGGGAAAGTCAGCATCGCGgtgagtccaccgggccacctgcgcagagcctgcactcactccttgtgtctccccctagGACGGCGGCTCCCTGGACCAGGTGCTGAAAGAGGCCAAGAGGATTCCCGAGGAGATCCTGGGGAAAGTCAGCATCGCGgtgagtccaccgg
>SEQ ID NO:18> SEQ ID NO: 18
CCTCCAACATCCTCGTGAACTCTAGAGGGGAGATCAAGCTGTGTGACTTCGGGGTGAGCGGCCAGCTCATCGACTCCATGGCCAACTCCTTCGTCCTCCAACATCCTCGTGAACTCTAGAGGGGGAGATCAAGCTGTGTGACTTCGGGGTGAGCGGCCAGCTCATCGACTCCATGGCCAACTCCTTCGT
>SEQ ID NO:19> SEQ ID NO: 19
acctttctctttatagCTCTGGACTTATTGGACAAAATGTTGACATTCAACCCACACAAGAGGATTGAAGTAGAACAGGCTCTGGCCCACCCATATCTGGAGCAGTATTACGACCCGAGTGACGAGgtaagagctcaacctttctctttatagCTCTGGACTTATTGGACAAAATGTTGACATTCAACCCACACAAGAGGATTGAAGTAGAACAGGCTCTGGCCCACCCATATCTGGAGCAGTATTACGACCCGAGTGACGAGgtaagagctca
>SEQ ID NO:20> SEQ ID NO: 20
TAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTCTCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGGTAAGTGCTAAAATAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTCTCTCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGGTAAGTGCTAAAAA
>SEQ ID NO:21> SEQ ID NO: 21
ATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATGAAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCACACAATTAAACAGCATATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATGAAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAAGGATTGGATCTTCCACACAATTAAACAGCAT
>SEQ ID NO:22> SEQ ID NO: 22
TCATTCTTGAGGAGGAAGTAGCGTGGCCGCCAGGTCTTGATGTACTCCCctacagacgtgcTCATTCTTGAGGAGGAAGTAGCGTGGCCGCCAGGTCTTGATGTACTCCCctacagacgtgc
>SEQ ID NO:23> SEQ ID NO: 23
aatattttccctaagtttgtaagtagtgctatatttatgttgactttttagttttactttatatgttattaatatgagtattgttaaccttgcagAATGGTCGATGTAGGGGGCCAAAGGTCAGAGAGAAGAAAATGGATACACTGCTTTGAAAATGTCACCTCTATCATGTTTCTAGTAGCGCTTAaatattttccctaagtttgtaagtagtgctatatttatgttgactttttagttttactttatatgttattaatatgagtattgttaaccttgcagAATGGTCGATGTAGGGGGCCAAAGGTCAGAGAGAAGAAAATGGATACACTGCTTTAGATGTATTAGTATTAGATCATTAGTATTAGATATTAGATATTAGATATTAGATATTAGATAGTATTAGATATTAGATAGTATTAGATAGTATTAGATAGTATTAGATAGTAGTTAGATAGTAGTTAGATAGTAGTTAGATAGTTAGATAGTAGTAGTAGTAGTAGTAGTAGTAGGTAGTAGTAGTAGTAGTAGTAGGTAGTAGTAGTAGTAGGTAGTAGGTAGTAGGTAGTAGTAGTAGGTAGTAGTAGTAGGTAGTAGGTA
>SEQ ID NO:24> SEQ ID NO: 24
ggccttggggcgccaggtggctgagtcctggcgctgtgtcctttcagGATGGTGGATGTGGGGGGCCAGCGGTCGGAGCGGAGGAAGTGGATCCACTGCTTTGAGAACGTGACATCCATCATGTTTCTCGTCGCggccttggggcgccaggtggctgagtcctggcgctgtgctcctttcagGATGGTGGATGTGGGGGGCCAGCGGTCGGAGCGGAGGAAGTGGATCCACTGCTTTGAGAACGTGACATCCATCATGTTTCTCGTCGCG
>SEQ ID NO:25> SEQ ID NO: 25
accttttttctctttctctttagAGCTGTAGGTAAAACTTGCCTACTGATCAGTTACACAACCAATGCATTTCCTGGAGAATATATCCCTACTGTgtaagtatcttaaattgggaattaaccttttttctctttctctttagAGCTGTAGGTAAAACTTGCCTACTGATCAGTTACACAACCAATGCATTTCCTGGAGAATATATCCCTACTGTgtaagtatcttaaattgggaatta
>SEQ ID NO:26> SEQ ID NO: 26
TGATAATTTCAGGAAACAAAAATTTGTGCTATGCAAATACAATAAACTGGAAAAAACTGTTTGGGACCTCCGGTCAGAAAACCAAAATTATAAGCAACAGAGGTGAAAACAGCTGCATGATAATTTCAGGAAACAAAAATTTGTGCTATGCAAATACAATAAACTGGAAAAAACTGTTTGGGACCTCCGGTCAGAAAACCAAAATTATAAGCAACAGAGGTGAAAACAGCTGCA
>SEQ ID NO:27> SEQ ID NO: 27
tacCTTATACACCGTGCCGAACGCACCGGAGCCCAGCACTTTGATCTTTTTGAATTCAGTTTCCTTCAAGATCCTCAAGAGAGCTTGGTTGGGAGCTTCTCCACTGGGTGTAAGAGGCTCCACAAGctggggtacCTTATACACCGTGCCGAACGCACCGGAGCCCAGCACTTTGATCTTTTTGAATTCAGTTTCCTTCAAGATCCTCAAGAGAGCTTGGTTGGGAGCTTCTCCACTGGGTGTAAGAGGCTCCACAAGctgggg
>SEQ ID NO:28> SEQ ID NO: 28
gtcttccttctctctctgtcatagGGACTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAAGGAATTAAGAGAAGCAACATCTCCGAAAGCCAACAAGGAAATCCTCGATgtgagtttgtcttccttctctctctgtcatagGGACTCTGGATCCCAGAAGGTGAGAAAGTTAAAATTCCCGTCGCTATCAAGGAATTAAGAGAAGCAACATCTCCGAAAGCCAACAAGGAAATCCTCGATgtgagttt
>SEQ ID NO:29> SEQ ID NO: 29
gtgcctctccctccctccagGAAGCCTACGTGATGGCCAGCGTGGACAACCCCCACGTGTGCCGCCTGCTGGGCATCTGCCTCACCTCCACCGTGCAGCTCATCACGCAGCTCATGCCCTTCGGCTGCCTCCgtgcctctccctccctccagGAAGCCTACGTGATGGCCAGCGTGGACAACCCCCACGTGTGCCGCCTGCTGGGCATCTGCCTCACCTCCACCGTGCAGCTCATCACGCAGCTCATGCCCTTCGGCTGCCTCC
>SEQ ID NO:30> SEQ ID NO: 30
ccttccctgattacCTTTGCGATCTGCACACACCAGTTGAGCAGGTACTGGGAGCCAATATTGTCTTTGTGTTCCCGGACATAGTCCAGGAGGCAGCCGAAGGGCATGAGCTGCGTGATGAGCTGCccttccctgattacCTTTGCGATCTGCACACACCAGTTGAGCAGGTACTGGGAGAGAATATTGTCTTTGTGTTCCCGGACATAGTCCAGGAGGCAGCCGAAGGGCATGAGCTGCGTGATGAGCTGC
>SEQ ID NO:31> SEQ ID NO: 31
ccttacTTTGCCTCCTTCTGCATGGTATTCTTTCTCTTCCGCACCCAGCAGTTTGGCCAGCCCAAAATCTGTGATCTTGACATGCTGCGGTGTTTTCACCAGTACGTTCCTGGCTGCCAGGTCGCGGTGCACCAAGCGACGGTCCTCCAAGTAGTTCATGCCctgaaacagagaagaccctgctgtgagggacagatcatcatgggaagaccttacTTTGCCTCCTTCTGCATGGTATTCTTTCTCTTCCGCACCCAGCAGTTTGGCCAGCCCAAAATCTGTGATCTTGACATGCTGCGGTGTTTTCACCAGTACGTTCCTGGCGAGGGGAGGTAGCGTAGCGAGTAGCTAGTAGCTAGTAGCTAG
>SEQ ID NO:32> SEQ ID NO: 32
tccttagACAACTACCTTTCTACGGACGTGGGATCCTGCACCCTCGTCTGCCCCCTGCACAACCAAGAGGTGACAGCAGAGGATGGAACACAGCGGTGTGAGAAGTGCAGCAAGCCCTGTGCCCGAGgtacccactcactgcccccgagtccttagACAACTACCTTTCTACGGACGTGGGATCCTGCACCCTCGTCTGCCCCCTGCACAACCAAGAGGTGACAGCAGAGGATGGAACACAGCGGTGTGAGAAGTGCAGCAAGCCCTGTGCCCGAGgtacccgactccccggcc
>SEQ ID NO:33> SEQ ID NO: 33
ccccagCTGGTGGAGCCGCTGACACCTAGCGGAGCGATGCCCAACCAGGCGCAGATGCGGATCCTGAAAGAGACGGAGCTGAGGAAGGTGAAGGTGCTTGGATCTGGCGCTTTccccagCTGGTGGAGCCGCTGACACCTAGCGGAGCGATGCCCAACCAGGCGCAGATGCGGATCCTGAAAGAGACGGAGCTGAGGAAGGTGAAGGTGCTTGGATCTGGCGCTTT
>SEQ ID NO:34> SEQ ID NO: 34
TGCTTGGATCTGGCGCTTTTGGCACAGTCTACAAGgtcagggccaggtcctggggtgggcggccccagaggatgggggcggtgcctggTGCTTGGATCTGGCGCTTTTTGGCACAGTCTACAAGgtcagggccaggtcctggggtgggcggccccagagatggggcggtgcctgg
>SEQ ID NO:35> SEQ ID NO: 35
ctgcccagGGCATCTGGATCCCTGATGGGGAGAATGTGAAAATTCCAGTGGCCATCAAAGTGTTGAGGGAAAACACATCCCCCAAAGCCAACAAAGAAATCTTAGACgtaagcccctccaccctctcctgcctgcccagGGCATCTGGATCCCTGATGGGGAGAATGTGAAAATTCCAGTGGCCATCAAAGTGTTGAGGGAAAACACATCCCCCAAAGCCAACAAAGAAATCTTAGACgtaagcccctccaccctctcctgc
>SEQ ID NO:36> SEQ ID NO: 36
tacccttgtccccagGAAGCATACGTGATGGCTGGTGTGGGCTCCCCATATGTCTCCCGCCTTCTGGGCATCTGCCTGACATCCACGGTGCAGCTGGTGACACAGCTTATGtacccttgtccccagGAAGCATACGTGATGGCTGGTGTGGGCTCCCCATATGTCTCCCGCCTTCTGGGCATCTGCCTGACATCCACGGTGCAGCTGGTGACACAGCTTATG
>SEQ ID NO:37> SEQ ID NO: 37
ATGCCCTATGGCTGCCTCTTAGACCATGTCCGGGAAAACCGCGGACGCCTGGGCTCCCAGGACCTGCTGAACTGGTGTATGCAGATTGCCAAGgtatgcacctgATGCCCTATGGCTGCCTCTTAGACCATGTCCGGGAAAACCGCGGACGCCTGGGCTCCCAGGACCTGCTGAACTGGTGTATGCAGATTGCCAAGgtatgcacctg
>SEQ ID NO:38> SEQ ID NO: 38
atgggtgcttcccattccagGGGATGAGCTACCTGGAGGATGTGCGGCTCGTACACAGGGACTTGGCCGCTCGGAACGTGCTGGTCAAGAGTCCCAACCATGTCAAAATTACAGACTTCatgggtgcttcccattccagGGGATGAGCTACCTGGAGGATGTGCGGCTCGTACACAGGGACTTGGCCGCTCGGAACGTGCTGGTCAAGAGTCCCAACCATGTCAAAATTACAGACTTC
>SEQ ID NO:39> SEQ ID NO: 39
AAATTACAGACTTCGGGCTGGCTCGGCTGCTGGACATTGACGAGACAGAGTACCATGCAGATGGGGGCAAGgttaggtgaaggaccaaggagcagaggaggctggAAATTACAGACTTCGGGCTGGCTCGGCTGCTGGACATTGACGAGACAGAGTACCATGCAGATGGGGGCAAGgttaggtgaaggaccaaggagcagaggaggctgg
>SEQ ID NO:40> SEQ ID NO: 40
CGGCGATGCTGAGAACCAATACCAGACACTGTACAAGCTCTACGAGAGGTGTGAGGTGGTGATGGGGAACCTTGAGATTGTGCTCACGGGACCGGCGATGCTGAGAACCAATACCAGACACTGTACAAGCTCTACGAGAGGTGTGAGGTGGTGATGGGGAACCTTGAGATTGTGCTCACGGGAC
>SEQ ID NO:41> SEQ ID NO: 41
CTATGTCCTCGTGGCCATGAATGAATTCTCTACTCTACCATTGCCCAACCTCCGCGTGGTGCGAGGGACCCAGGTCTACGATGGGAAGTTTGCCATCTTCGTCATGTTGAACTATAACACCAACTCCCTATGTCCTCGTGGCCATGAATGAATTCTCTACTCTACCATTGCCCAACCTCCGCGTGGTGCGAGGGACCCAGGTCTACGATGGGAAGTTTGCCATCTTCGTCATGTTGAACTATAACACCAACTCCCC
>SEQ ID NO:42> SEQ ID NO: 42
ttctctccttccatagTGACCAAGACCATCTGTGCTCCTCAGTGTAATGGTCACTGCTTTGGGCCCAACCCCAACCAGTGCTGCCATGATGAGTGTGCCGGGGGCTGCTCAGGCCCTCAGGACACAGACTGCTTTgtatgttctctccttccatagTGACCAAGACCATCTGTGCTCCTCAGTGTAATGGTCACTGCTTTGGGCCCCACACCCCAACCAGTGCTGCCATGATGAGTGTGCCGGGGGCTGCTCAGGCCCTCAGGACACAGACTGCTTgtg
>SEQ ID NO:43> SEQ ID NO: 43
CCACAGCCTCTTGTCTACAACAAGCTAACTTTCCAGCTGGAACCCAATCCCCACACCAAGTATCAGTATGGAGGAGTTTGTGTAGCCAGCTGTCCCCgtaagtgtctgaggggaaggaCCACAGCCTCTTGTCTACAACAAGCTAACTTTCCAGCTGGAACCCAATCCCCACACCAAGTATCAGTATGGAGGAGTTTGTGTAGCCAGCTGTCCCCgtaagtgtctgaggggaagga
>SEQ ID NO:44> SEQ ID NO: 44
tcatctctaatggtgtcctcctcctcttccctagATAACTTTGTGGTGGATCAAACATCCTGTGTCAGGGCCTGTCCTCCTGACAAGATGGAAGTAGATAAAAATGGGCTCAAGATGTGTGAGCCTTGTGGGGGACTATGTCCCAAAGgtgggtagtcatctctaatggtgtcctcctcctcttccctagATAACTTTGTGGTGGATCAAACATCCTGTGTCAGGGCCTGTCCTCCTGACAAGATGGAAGTAGATAAAAATGGGCTCAAGATGTGTGAGCCCCTTGTGGGGAGATGTGGGAGATGT
>SEQ ID NO:45> SEQ ID NO: 45
GGGAACAGGCTCTGGGAGCCGCTTCCAGACTGTGGACTCGAGCAACATTGATGGATTTGTGAACTGCACCAAGATCCTGGGCAACCTGGACTTTCTGATCACGGGAACAGGCTCTGGGAGCCGCTTCCAGACTGTGGACTCGAGCAACATTGATGGATTTGTGAACTGCACCAAGATCCTGGGCAACCTGGACTTTCTGATCAC
>SEQ ID NO:46> SEQ ID NO: 46
tacagGGAATGTACTACCTTGAGGAACATGGTATGGTGCATAGAAACCTGGCTGCCCGAAACGTGCTACTCAAGTCACCCAGTCAGGTTCAGGTGGCAGATTTTGGTGTGGCTGACCTGCTGCCTCCTGATGATAAGCAGCtacagGGAATGTACTACCTTGAGGAACATGGTATGGTGCATAGAAACCTGGCTGCCCGAAACGTGCTACTCAAGTCACCCAGTCAGGTTCAGGTGGCAGATTTTGGTGTGGCTGACCTGCTGCCTAGCATGATGATGAT
>SEQ ID NO:47> SEQ ID NO: 47
ttcctgcaacagGTGTGACAGTTTGGGAGTTGATGACCTTCGGGGCAGAGCCCTATGCAGGGCTACGATTGGCTGAAGTACCAGACCTGCTAGAGAAGGGGGAGCGGTTGGCACAGCCCCAGATCTGCACAATTGATGTCTACAttcctgcaacagGTGTGACAGTTTGGGAGTTGATGACCTTCGGGGCAGAGCCCTATGCAGGGCTACGATTGGCTGAAGTACCAGACCTGCTAGAGAAGGGGGAGCGGTTGGCACAGCCCCAGATCTGCA
>SEQ ID NO:48> SEQ ID NO: 48
ctgaatgttaacattaatgcttattttaccttttttttttttttaatcagATAACTTTGTGGTAGATTCCAGTTCTTGTGTGCGTGCCTGCCCTAGTTCCAAGATGGAAGTAGAAGAAAActgaatgttaacattaatgcttattttaccttttttttttttttaatcagATAACTTTGTGGTAGATTCCAGTTCTTGTGTGCGTGCCTGCCCTAGTTCCAAGATGGAAGTAGAAGAAAA
>SEQ ID NO:49> SEQ ID NO: 49
AGATGGAAGTAGAAGAAAATGGGATTAAAATGTGTAAACCTTGCACTGACATTTGCCCAAAAGgtgagtggtagctcagattatttagttagaactgggcctatatAGATGGAAGTAGAAGAAAATGGGATTAAAATGTGTAAACCTTGCACTGACATTTGCCCAAAAGgtgagtggtagctcagattatttagttagaactgggcctatat
>SEQ ID NO:50> SEQ ID NO: 50
tttctcacttccccctccttagTGGCCTGTCCTTGCTTATCCTCAAGCAACAGGGCATCACCTCTCTACAGTTCCAGTCCCTGAAGGAAATCAGCGCAGGAAACATCTATATTACTGACAACAGCAACCtttctcacttccccctccttagTGGCCTGTCCTTGCTTATCCTCAAGCAACAGGGCATCACCTCTCTACAGTTCCAGTCCCTGAAGGAAATCAGCGCAGGAAACATCTATATTACTGACAACAGCAACCC
>SEQ ID NO:51> SEQ ID NO: 51
TATTACTGACAACAGCAACCTGTGTTATTATCATACCATTAACTGGACAACACTCTTCAGCACAATCAACCAGAGAATAGTAATCCGGGACAACAGAAAAGCTGAAAATTGTAgtaagtacattactcagacatttaaaacatagaaacttaaatttTATTACTGACAACAGCAACCTGTGTTATTATCATACCATTAACTGGACAACACTCTCTTCAGCACAATCAACCAGAGAATAGTAATCCGGGACAACAGAAAAGCTGAAAATTGTAgtaagtacattactcagacatttaaaacatagaaacttaaattt
>SEQ ID NO:52> SEQ ID NO: 52
tcctcatgtggctgatgttttcacagTGAATTTCGGGAGTTTGAGAATGGCTCCATCTGTGTGGAGTGTGACCCCCAGTGTGAGAAGATGGAAGATGGCCTCCTCACATGCCATGGACCGgtaagtcctcatgtggctgatgttttcacagTGAATTTCGGGAGTTTGGAATGGCTCCATCTGTGTGGAGTGTGACCCCCAGTGTGAGAAGATGGAAGATGGCCTCCTCACATGCCATGGACCGgtaag
>SEQ ID NO:53> SEQ ID NO: 53
atatttttcagGGAATGATGTACCTGGAAGAAAGACGACTCGTTCATCGGGATTTGGCAGCCCGTAATGTCTTAGTGAAATCTCCAAACCATGTGAAAATCACAGATTTTGGatatttttcagGGAATGATGTACCTGGAAGAAAGACGACTCGTTCATCGGGATTTGGCAGCCCGTAATGTCTTAGTGAAATCTCCAAACCATGTGAAAATCACAGATTTTGG
>SEQ ID NO:54> SEQ ID NO: 54
TGAAATCTCCAAACCATGTGAAAATCACAGATTTTGGGCTAGCCAGACTCTTGGAAGGAGATGAAAAAGAGTACAATGCTGATGGAGGAAAGgtgggtatctttttTGAAATCTCCAAACCATGTGAAAATCACAGATTTTGGGCTAGCCAGACTCTTGGAAGGAGATGAAAAAGAGTACAATGCTGATGGAGGAAAGgtgggtatcttttt
>SEQ ID NO:55> SEQ ID NO: 55
tcaactctgtctccttcctcttcctacagTACTCCCCTGCCCTCAACAAGATGTTTTGCCAACTGGCCAAGACCTGCCCTGTGCAGCTGTGGGTTGATTCCACACCCCCGCCCGGCACCCGCGTCCGCGCCATGGCtcaactctgtctccttcctcttcctacagTACTCCCCTGCCCTCAACAAGATGTTTTGCCAACTGGCCAAGACCTGCCCTGTGCAGCTGTGGGTTGATTCCACACCCCCCCGCCCGGCACCCGCGTCCGCGCCATGGC
>SEQ ID NO:56> SEQ ID NO: 56
TTCCACACCCCCGCCCGGCACCCGCGTCCGCGCCATGGCCATCTACAAGCAGTCACAGCACATGACGGAGGTTGTGAGGCGCTGCCCCCACCATGAGCGCTGCTCAGATAGCGATGgtgagcagctggggcTTCCACACCCCCGCCCGGCACCCGCGTCCGCGCCATGGCCATCTACAAGCAGTCACAGCACATGACGGAGGTTGTGAGGCGCTGCCCCCACCATGAGCGCTGCTCAGATAGCGATGgtgagcagctggggc
>SEQ ID NO:57> SEQ ID NO: 57
ctcactgattgctcttagGTCTGGCCCCTCCTCAGCATCTTATCCGAGTGGAAGGAAATTTGCGTGTGGAGTATTTGGATGACAGAAACACTTTTCGACATAGTGTGGTGGTGCCCTATGAGCCGCCTGAGgtctggtttgcaactgggctcactgattgctcttagGTCTGGCCCCTCCTCAGCATCTTATCCGAGTGGAAGGAAATTTGCGTGTGGAGTATTTGGATGACAGAAACACTTTTCGACATAGTGTGGTGGTGCCCTATGAGCCGCCTGAGgctggttgg
>SEQ ID NO:58> SEQ ID NO: 58
ttatctcctagGTTGGCTCTGACTGTACCACCATCCACTACAACTACATGTGTAACAGTTCCTGCATGGGCGGCATGAACCGGAGGCCCATCCTCACCATCATCACACTGGAAGACTCCAGgtcaggagccattatctcctagGTTGGCTCTGACTGTACCACCATCCACTACAACTACATGTGTAACAGTTCCTGCATGGGCGGCATGAACCGGAGGCCCATCCTCACCATCATCACACTGGAAGACTCCAGgtcaggagcca
>SEQ ID NO:59> SEQ ID NO: 59
agtagTGGTAATCTACTGGGACGGAACAGCTTTGAGGTGCGTGTTTGTGCCTGTCCTGGGAGAGACCGGCGCACAGAGGAAGAGAATCTCCGCAAGAAAGGGGAGCCTCACCACGAGCTGCCCCCAGGGAGCACTAAGCGAGgtaagagtagTGGTAATCTACTGGGACGGAACAGCTTTGAGGTGCGTGTTTGTGCCTGTCCTGGGAGAGACCGGCGCACAGAGGAAGAGAATCTCCGCAAGAAAGGGGAGCCTCACCACGAGCTGCCCCCAGGGAGGAGTA
>SEQ ID NO:60> SEQ ID NO: 60
ttgcctctttcctagCACTGCCCAACAACACCAGCTCCTCTCCCCAGCCAAAGAAGAAACCACTGGATGGAGAATATTTCACCCTTCAGgtactaagtcttttgcctctttcctagCACTGCCCAACAACACCAGCTCCTCTCCCCAGCCAAAGAAGAAACCACTGGATGGAGAATATTTCACCCTTCAGgtactaagtctt
>SEQ ID NO:61> SEQ ID NO: 61
atttatagCTGATTTGATGGAGTTGGACATGGCCATGGAACCAGACAGAAAAGCGGCTGTTAGTCACTGGCAGCAACAGTCTTACCTGGACTCTGGAATCCATTCTGGTGCCACTACCACAGCTCCTTCatttatagCTGATTTGATGGAGTTGGACATGGCCATGGAACCAGACAGAAAAGCGGCTGTTAGTCACTGGCAGCAACAGTCTTACCTGGACTCTGGAATCCATTCTGGTGCCACTACCACAGCTCCTTC
>SEQ ID NO:62> SEQ ID NO: 62
CACAGCTCCTTCTCTGAGTGGTAAAGGCAATCCTGAGGAAGAGGATGTGGATACCTCCCAAGTCCTGTATGAGTGGGAACAGGGATTTTCTCAGTCCTTCACTCAAGAACAAGTAGCTGGTAAGAGTATTATTTTTCATCACAGCTCCTTCTCTGAGTGGTAAAGGCAATCCTGAGGAAGAGGATGTGGATACCTCCCAAGTCCTGTATGAGTGGGAACAGGGATTTTCTCAGTCCTTCACTCAAGAACAAGTAGCTGGTAAGAGTATTATTTTTCAT
>SEQ ID NO:63> SEQ ID NO: 63
TTGATCCCCATAAGCATGACGACCTATGATGATAGGTTTTACCCATCCACTCACAAGCCGGGGGATATTTTTGCAGATAATGGCTTCTCTGAAGACCGTGCCATTGATCCCCATAAGCATGACGACCTATGATGATAGGTTTTACCCATCCACTCACAAGCCGGGGGATATTTTTGCAGATAATGGCTTCTCTGAAGACCGTGCCA
>SEQ ID NO:64> SEQ ID NO: 64
GCAGCCGTCCTGGAGGCTGGTGTCCTGGGTAGCGGTCAGCACGCCCCCGTCTTCGTATGTGGTGACTCTCTCCCATGTGAAGCCCTCGGGGAGCAGCCGTCCTGGAGGCTGGTGTCCTGGGTAGCGGTCAGCACGCCCCCGTCTTCGTATGTGGTGACTCTCTCCCATGTGAAGCCCTCGGGGA
>SEQ ID NO:65> SEQ ID NO: 65
AAACACTCGGCTGGGAGGCCTCCACCGAGACCCTGTACCCCGCTGACGGCGGCCTGGAAGGCAGAGCCGACATGGCCCTGAAGCTCGTGGGCGGGGGCCACCTGATCTGCAACTTGAAAACACTCGGCTGGGAGGCCTCCACCGAGACCCTGTACCCCGCTGACGGCGGCCTGGAAGGCAGAGCCGACATGGCCCTGAAGCTCGTGGGCGGGGGCCACCTGATCTGCAACTTGA
>SEQ ID NO:66> SEQ ID NO: 66
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCATCTCACAATTGCCAGTTAACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCATCTCACAATTGCCAGTTAAC
>SEQ ID NO:67> SEQ ID NO: 67
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTATCTCCCCTCCCCGTATCTCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTATCTCCCCTCCCCGTATCTC
>SEQ ID NO:68> SEQ ID NO: 68
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTGACCCACCACCCCCTCAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCTGACCCACACACACCCCCTCA
>SEQ ID NO:69> SEQ ID NO: 69
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGGTCCTTCCTGTCCTCCTAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGGTCCTTCCTGTCCTCCTA
>SEQ ID NO:70> SEQ ID NO: 70
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCGGAGAGACCTGCAAAGAGCCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCGGAGAGACCTGCAAAGAGCC
>SEQ ID NO:71> SEQ ID NO: 71
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNATGGGCTAGACACCACTCCACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNATGGGCTAGACACCACTCCAC
>SEQ ID NO:72> SEQ ID NO: 72
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGAAGGAGAGGTCGGCATTGTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGAGAGAGAGGTCGGCATTGT
>SEQ ID NO:73> SEQ ID NO: 73
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGAGCCCTAACAGCCATGCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGAGCCCTAACAGCCATGCT
>SEQ ID NO:74> SEQ ID NO: 74
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTAGCTGGTGATGTTCCTCCCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTAGCTGGTGATGTTCCTCCC
>SEQ ID NO:75> SEQ ID NO: 75
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNAATACTTTCTTCCCCTATACCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNANAACTACTTTCTTCCCCTATACC
>SEQ ID NO:76> SEQ ID NO: 76
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTATCTTGTTTTGAGCTTGTTTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTATCTTGTTTTGAGCTTGTTTG
>SEQ ID NO:77> SEQ ID NO: 77
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGTCCAAAGAAGAATGGGAAAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGTCCAAAGAAGAATGGGAAA
>SEQ ID NO:78> SEQ ID NO: 78
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTTGACGCTTGTTTGCTTACACCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTTGACGCTTGTTTGCTTACACC
>SEQ ID NO:79> SEQ ID NO: 79
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTTTTCAAGCAAGATTGCTCTCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTTTTCAAGCAAGATTGCTCTC
>SEQ ID NO:80> SEQ ID NO: 80
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTGCTGTGACTGCTTGTAGATGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTGCTGTGACTGCTTGTAGATG
>SEQ ID NO:81> SEQ ID NO: 81
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNAGGGTCCCCAGGCCTCTGATTCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNAGGGTCCCCAGGCCTCTGATTC
>SEQ ID NO:82> SEQ ID NO: 82
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTGCTTCTCTTTTCCTATCCTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTGCTTCTCTTTTCCTATCCTG
>SEQ ID NO:83> SEQ ID NO: 83
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGAGGCCTGTGCCAGGGACCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGAGGCCTGTGCCAGGGACCT
>SEQ ID NO:84> SEQ ID NO: 84
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNACCATGCGAAGCCACACTGACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNACCATGCGAAGCCACACTGAC
>SEQ ID NO:85> SEQ ID NO: 85
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNN CTGGCTGACCTAAAGCCACCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNN CTGGCTGACCTAAAGCCACCT
>SEQ ID NO:86> SEQ ID NO: 86
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGACAGGAACTGCAGCTGGCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGACAGGAACTGCAGCTGGC
>SEQ ID NO:87> SEQ ID NO: 87
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGAACTGCCGACCACACCCCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGAACTGCCGACCACACCCCCCT
>SEQ ID NO:88> SEQ ID NO: 88
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGTCTCCCATACCCTCTCAGCGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGTCTCCCATACCCTCTCAGCG
>SEQ ID NO:89> SEQ ID NO: 89
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGCCCTCCCAGAAGGTCTACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGCCCTCCCAGAAGGTCTAC
>SEQ ID NO:90> SEQ ID NO: 90
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTGGATTCGAGAAGTGACAGGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTGGATTCGAGAAGTGACAGG
>SEQ ID NO:91> SEQ ID NO: 91
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGATCTACTATTGTTGATCATTGTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGATCTACTATTGTTGATCATTGT
>SEQ ID NO:92> SEQ ID NO: 92
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTCTTACATTTGCAGCCTGTGAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTCTTACATTTGCAGCCTGTGA
>SEQ ID NO:93> SEQ ID NO: 93
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGCCAGTGACTAGTCCATGTCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGCCAGTGACTAGTCCATGTC
>SEQ ID NO:94> SEQ ID NO: 94
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTTAAAAGTGAATTAAAAACCTTGTTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTTAAAAGTGAATTAAAAACCTTGGT
>SEQ ID NO:95> SEQ ID NO: 95
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGAATGCGTTTCATGGTTCCGTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGAATGCGTTTCATGGTTCCGT
>SEQ ID NO:96> SEQ ID NO: 96
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTGAATATCATTAAGGAACTTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCTGAATATCATTAAGGAACTTG
>SEQ ID NO:97> SEQ ID NO: 97
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCCAGCCCTGTCGTCTCTCCAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCCAGCCCTGTCGTCTCTCCA
>SEQ ID NO:98> SEQ ID NO: 98
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGCCTCATCTTGGGCCTGTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGCCTCATCTTGGGCCTGTG
>SEQ ID NO:99> SEQ ID NO: 99
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNATTCACTTTTATCACCTTTCCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNATTCACTTTTATCACCTTTCC
>SEQ ID NO:100> SEQ ID NO: 100
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCATAATGCTTGCTCTGATAGGAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCATAATGCTTGCTCTGATAGGA
>SEQ ID NO:101> SEQ ID NO: 101
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNACTGTGACCCGGAGCACTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNACTGTGACCCGGAGCACT
>SEQ ID NO:102> SEQ ID NO: 102
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTTCTCAGCACAGATATTCTACAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTTCTCAGCACAGATATTCTACA
>SEQ ID NO:103> SEQ ID NO: 103
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTATTTTTCCCTTTCTCCCCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCTATTTTTCCCTTTCTCCCC
>SEQ ID NO:104> SEQ ID NO: 104
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTATAAACTTGTGGTAGTTGGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTATAAACTTGTGGTAGTTGG
>SEQ ID NO:105> SEQ ID NO: 105
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTGCACTGTAATAATCCAGACTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTGCACTGTAATAATCCAGACT
>SEQ ID NO:106> SEQ ID NO: 106
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCAGTGTTACTTACCTGTCTTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCAGTGTTACTTACCTGTCTTG
>SEQ ID NO:107> SEQ ID NO: 107
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTTACTGGTTTCCAACAGGTTCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTTACTGGTTTCCAACAGGTTCT
>SEQ ID NO:108> SEQ ID NO: 108
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNAAGTGGTTATAGATGGTGAAACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNAAGTGGTTATAGATGGTGAAAC
>SEQ ID NO:109> SEQ ID NO: 109
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNACAAATGCTGAAAGCTGTACCAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNACACAAATGCTGAAAGCTGTACCA
>SEQ ID NO:110> SEQ ID NO: 110
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGCCAGGCTCACCTCTATAGTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGCCAGGCTCACCTCTATAGTG
>SEQ ID NO:111> SEQ ID NO: 111
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGATGGCAAACACACACAGGAAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGATGGCAAACACACACAGAGAA
>SEQ ID NO:112> SEQ ID NO: 112
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGGTGGAGAGCTGCCTCAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGGTGGAGAGCTGCCTCA
>SEQ ID NO:113> SEQ ID NO: 113
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGGAAAATGACAAAGAACAGCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGGAAAATGACAAAGAACAGC
>SEQ ID NO:114> SEQ ID NO: 114
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTCTTTTGATGACATTGCATACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTCTTTTGATGACATTGCATAC
>SEQ ID NO:115> SEQ ID NO: 115
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGCCAACCCCCCAAATCTGAAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGCCAACCCCCCACAAATCTGAA
>SEQ ID NO:116> SEQ ID NO: 116
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNAGGAGATAAGTGATGGAGATGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNAGGAGATAAGTGATGGAGATG
>SEQ ID NO:117> SEQ ID NO: 117
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCATTCTGACTTTCAGTAAGGCAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCATTCTGACTTTCAGTAAGGCA
>SEQ ID NO:118> SEQ ID NO: 118
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTCCCCACTTTGGAACAGGACCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTCCCCACTTTGGAACAGGACC
>SEQ ID NO:119> SEQ ID NO: 119
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGCTGAGAGGGTGTCACATACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGCTGAGAGGGTGTCACATAC
>SEQ ID NO:120> SEQ ID NO: 120
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCCTCTCCCTGACCGTACAAGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCCTCTCCCTGACCGTACAAG
>SEQ ID NO:121> SEQ ID NO: 121
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGGGCGCGATGTGGGTCTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGGGCGCGATGTGGGTCTG
>SEQ ID NO:122> SEQ ID NO: 122
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTGCCGCCTCCAGATGTGAAGCACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTGCCGCCTCCAGATGTGAAGC
>SEQ ID NO:123> SEQ ID NO: 123
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTTCTGCTCTCACTACTGCAAAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCTTCTGCTCTCACTACTGCAAA
>SEQ ID NO:124> SEQ ID NO: 124
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNGGATGATCATCGTCATTCAAGAGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNGGATGATCATCGTCATTCAAGAG
>SEQ ID NO:125> SEQ ID NO: 125
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCCGTCCTGGGATTGCAGATTGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCCGTCCTGGGATTGCAGATTG
>SEQ ID NO:126> SEQ ID NO: 126
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTACATTCATGTTGACTAAGCAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTACATTCATGTTGACTAAGCA
>SEQ ID NO:127> SEQ ID NO: 127
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTACTAATGCTAATACTGTTTCGTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCTACTAATGCTAATACTGTTTCGT
>SEQ ID NO:128> SEQ ID NO: 128
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCATTATTGCCAACATGACTTACACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCATTATTGCCAACATGACTTAC
>SEQ ID NO:129> SEQ ID NO: 129
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTGATCTTGACGTTGTAGATGAGACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNTGATCTTGACGTTGTAGATGAG
>SEQ ID NO:130> SEQ ID NO: 130
ACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNCGGCCCTGTGATGCAGAAGAACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNCGGCCCTGTGATGCAGAAGA
>SEQ ID NO:131> SEQ ID NO: 131
GAGGTTCAGAGCCATGGACCGAGGTTCAGAGCCATGGACC
>SEQ ID NO:132> SEQ ID NO: 132
ACGTGTGCCGCCTGCTGGGACGTGTGCCGCCTGCTGGG
>SEQ ID NO:133> SEQ ID NO: 133
CCTGGCCCTGACCTTGTAGACCCTGGCCCTGACCTTGTAGAC
>SEQ ID NO:134> SEQ ID NO: 134
CCCACGCTCTTCTCACTCATACCCACGCTCTTCTCACTCATA
>SEQ ID NO:135> SEQ ID NO: 135
CATCTGCCTGACATCCACGGTCATCTGCCTGACATCCACGGT
>SEQ ID NO:136> SEQ ID NO: 136
GGAACGTGCTGGTCAAGAGTCGGAACGTGCTGGTCAAGAGTC
>SEQ ID NO:137> SEQ ID NO: 137
TCCTGGGACTCTGAATGGCTCCTGGGACTCTGAATGGC
>SEQ ID NO:138> SEQ ID NO: 138
AATTTCAGAACCCAGGCAATGAATTTCAGAACCCAGGCAATG
>SEQ ID NO:139> SEQ ID NO: 139
GAAAGGCTGTCTCTTTACAACTGAAAGGCTGTCTCTTTACAACT
>SEQ ID NO:140> SEQ ID NO: 140
CTTTGTGTCTCCTCACCTTGCTTTGTGTCTCCTCACCTTG
>SEQ ID NO:141> SEQ ID NO: 141
TTTGGGCAAATGTCAGTGCAAGTTTGGGCAAATGTCAGTGCAAG
>SEQ ID NO:142> SEQ ID NO: 142
CAGTTCCAGTCCCTGAAGGACAGTTCCAGTCCCTGAAGGA
>SEQ ID NO:143> SEQ ID NO: 143
TAAATAAGCCAACACACCACAGTAAATAAGCCAACACACCACAG
>SEQ ID NO:144> SEQ ID NO: 144
GACTCGTTCATCGGGATTTGGACTCGTTCATCGGGATTTG
>SEQ ID NO:145> SEQ ID NO: 145
GTTGCTTTATCTGTTCACTTGGTTGCTTTATCTGTTCACTTG
>SEQ ID NO:146> SEQ ID NO: 146
CACCCGGAGGGCCACTGACAACCACCCGGAGGGCCACTGACAAC
>SEQ ID NO:147> SEQ ID NO: 147
CTCCACCGCTTCTTGTCCTCTCCACCGCTTCTTGTCCT
>SEQ ID NO:148> SEQ ID NO: 148
AGGGCTGAGGTGACCCTTGTAGGGCTGAGGTGACCCTTGT
>SEQ ID NO:149> SEQ ID NO: 149
AGCCAATATTGTCTTTGTGTTCCAGCCAATATTGTCTTTGTGTTCC
>SEQ ID NO:150> SEQ ID NO: 150
ATGATCTGTCCCTCACAGCAATGATCTGTCCCTCACAGCA
>SEQ ID NO:151> SEQ ID NO: 151
CCAGGGTATGTGGCTACATGCCAGGGTATGTGGCTACATG
>SEQ ID NO:152> SEQ ID NO: 152
CCTGAAAGAGACGGAGCTGAGCCTGAAAGAGACGGAGCTGAG
>SEQ ID NO:153> SEQ ID NO: 153
TCCCGGACATGGTCTAAGAGTCCCGGACATGGTCTAAGAG
>SEQ ID NO:154> SEQ ID NO: 154
CTCGTCAATGTCCAGCAGCCCTCGTCAATGTCCAGCAGCC
>SEQ ID NO:155> SEQ ID NO: 155
GGTGAGCTGAGTCAAGCGGGGTGAGCTGAGTCAAGCGG
>SEQ ID NO:156> SEQ ID NO: 156
CGGCACTTCAATGACAGTGGACGGCACTTCAATGACAGTGGA
>SEQ ID NO:157> SEQ ID NO: 157
GGGAAGGCAGGATCTCTAACGGGAAGGCAGGATCTCTAAC
>SEQ ID NO:158> SEQ ID NO: 158
CAGCAGGTAACTCACACTTGACAGCAGGTAACTCACACTTGA
>SEQ ID NO:159> SEQ ID NO: 159
GATTCCAGTTCTTGTGTGCGTGATTCCAGTTCTTGTGTGCGT
>SEQ ID NO:160> SEQ ID NO: 160
GCTGAAGAGTGTTGTCCAGTGCTGAAGAGTGTTGTCCAGT
>SEQ ID NO:161> SEQ ID NO: 161
CTTTCCTCCATCAGCATTGTACTTTCCTCCATCAGCATTGTA
>SEQ ID NO:162> SEQ ID NO: 162
CTCAACAAGATGTTTTGCCAACCTCAACAAGATGTTTTGCCAAC
>SEQ ID NO:163> SEQ ID NO: 163
GGCAAGCAGAGGCTGGGGCACGGCAAGCAGAGGCTGGGGCAC
>SEQ ID NO:164> SEQ ID NO: 164
ACGGCATTTTGAGTGTTAGACACGGCATTTTGAGTGTTAGAC
>SEQ ID NO:165> SEQ ID NO: 165
CAACTGTTCAAACTGATGGGACAACTGTTCAAACTGATGGGA
>SEQ ID NO:166> SEQ ID NO: 166
GCCAACAGGGATGGCTCTAGCCAACAGGGATGGCTCTA
>SEQ ID NO:167> SEQ ID NO: 167
CAAGGTGCCCTATTACCTCACAAGGTGCCCTATTACCTCA
>SEQ ID NO:168> SEQ ID NO: 168
TACCCAAAAAGGTGACATGGTACCCAAAAAGGTGACATGG
>SEQ ID NO:169> SEQ ID NO: 169
TGAAAATGGTCAGAGAAACCTTGAAAATGGTCAGAGAAACCT
>SEQ ID NO:170> SEQ ID NO: 170
CTCCCCAGTCCTCATGTACTCTCCCCAGTCCTCATGTACT
>SEQ ID NO:171> SEQ ID NO: 171
AAAGAGTTAAGGACTCTGAAGAAAAGAGTTAAGGACTCTGAAGA
>SEQ ID NO:172> SEQ ID NO: 172
CAAGTGAGAGACAGGATCAGGCAAGTGAGAGACAGGATCAGG
>SEQ ID NO:173> SEQ ID NO: 173
ACCTGTAGAGGTTAATATCCGACCTGTAGAGGTTAATATCCG
>SEQ ID NO:174> SEQ ID NO: 174
AGGGAGCAGATTAAGCGAGTAGGGAGCAGATTAAGCGAGT
>SEQ ID NO:175> SEQ ID NO: 175
GGCAGGTGGGGCAGGAGACGGCAGGTGGGGCAGGAGAC
>SEQ ID NO:176> SEQ ID NO: 176
TCCCTGAGCCTTGTCCTCCTTCCCTGAGCCTTGTCCTCCT
>SEQ ID NO:177> SEQ ID NO: 177
TCTCGCTTTCCACCTCTCAGTCTCGCTTTCCACCTCTCAG
>SEQ ID NO:178> SEQ ID NO: 178
AACATGCTGAGATCAGCCAGATAACATGCTGAGATCAGCCAGAT
>SEQ ID NO:179> SEQ ID NO: 179
AGTGTGGAATCCAGAGTGAGCAGTGTGGAATCCAGAGTGAGC
>SEQ ID NO:180> SEQ ID NO: 180
TCTGACGGGTAGAGTGTGCTCTGACGGGTAGAGTGTGC
>SEQ ID NO:181> SEQ ID NO: 181
CAAATAAAGGACCCATTAGAACCCAAATAAAGGACCCATTAGAACC
>SEQ ID NO:182> SEQ ID NO: 182
CTTACCTGGACTCTGGAATCCTTACCTGGACTCTGGAATC
>SEQ ID NO:183> SEQ ID NO: 183
AGGCCAGAAGGCTTGTGGGAGGCCAGAAGGCTTGTGGG
>SEQ ID NO:184> SEQ ID NO: 184
CCCTCTTTCTTTCATAAAACCTCCCCTCTTTCTTTCATAAAACCTC
>SEQ ID NO:185> SEQ ID NO: 185
TTCTCTTCCCTGCAGATGTCATTCTCTTCCCTGCAGATGTCA
>SEQ ID NO:186> SEQ ID NO: 186
GGGAGTGGGGGGACGCATCGGGAGTGGGGGGACGCATC
>SEQ ID NO:187> SEQ ID NO: 187
CAGCGGGGACTCACAGCCATCAGCGGGGACTCACAGCCAT
>SEQ ID NO:188> SEQ ID NO: 188
ATCTATGTCCCTGAAGCAGCATCTATGTCCCTGAAGCAGC
>SEQ ID NO:189> SEQ ID NO: 189
CTTACCTCATTGTCTGACTCCCTTACCTCATTGTCTGACTCC
>SEQ ID NO:190> SEQ ID NO: 190
CTCGTTGTCCGACTCCACCACTCGTTGTCCGACTCCACCA
>SEQ ID NO:191> SEQ ID NO: 191
CATATGAGGATTAAAGATGGCTTCATATGAGGATTAAAGATGGCTT
>SEQ ID NO:192> SEQ ID NO: 192
CATCCTCTTCCTCAGGATTGCCATCCTCTTCCTCAGGATTGC
>SEQ ID NO:193> SEQ ID NO: 193
ATCACCAAATGGCACCATACATCACCAAATGGCACCATAC
>SEQ ID NO:194> SEQ ID NO: 194
ACCTTCATCAACCACACCCAACCTTCATCAACCACACCCA
>SEQ ID NO:195> SEQ ID NO: 195
GCATCTTGAGGTTCTTAGCGGCATCTTGAGGTTCTTAGCG
>SEQ ID NO:199> SEQ ID NO: 199
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCATGGACCCCCACACAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCATGGACCCCCACACACAG
>SEQ ID NO:200> SEQ ID NO: 200
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATCTGCCTCACCTCCACCGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATCTGCCTCACCTCCACCGT
>SEQ ID NO:201> SEQ ID NO: 201
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGACCTTGTAGACTGTGCCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGACCTTGTAGACTGTGCCA
>SEQ ID NO:202> SEQ ID NO: 202
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCACTCATATCCTCCTCTTTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCACTCATATCCTCCTCTTT
>SEQ ID NO:203> SEQ ID NO: 203
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCAGCTGGTGACACAGCTTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCAGCTGGTGACACAGCTT
>SEQ ID NO:204> SEQ ID NO: 204
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAGAGTCCCAACCATGTCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAGAGTCCCAACCATGTCA
>SEQ ID NO:205> SEQ ID NO: 205
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTGAATGGCCTGAGTGTGACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTGAATGGCCTGAGTGTGAC
>SEQ ID NO:206> SEQ ID NO: 206
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCAGGCAATGGAAAGGGTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCAGGCAATGGAAAGGGTA
>SEQ ID NO:207> SEQ ID NO: 207
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTTACAACTTCTTACCATCTCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTTACAACTTCTTACCATCTC
>SEQ ID NO:208> SEQ ID NO: 208
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTGGCCTCACTGTATAGCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTGGCCTCACTGTATAGCA
>SEQ ID NO:209> SEQ ID NO: 209
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGTTTACACATTTTAATCCCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGTTTACACATTTTAATCCCA
>SEQ ID NO:210> SEQ ID NO: 210
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAATCAGCGCAGGAAACATCTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAATCAGCGCAGGAAACATCTA
>SEQ ID NO:211> SEQ ID NO: 211
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACACCACAGATGTCTTCAGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACACCACAGATGTCTTCAGG
>SEQ ID NO:212> SEQ ID NO: 212
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGCAGCCCGTAATGTCTTAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGCAGCCCGTAATGTCTTAG
>SEQ ID NO:213> SEQ ID NO: 213
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTTCACTTGTGCCCTGACTTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTTCACTTGTGCCCTGACTT
>SEQ ID NO:214> SEQ ID NO: 214
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTAACCCCTCCTCCCAGAGACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTAACCCCTCCTCCCAGAGAC
>SEQ ID NO:215> SEQ ID NO: 215
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACCGCTTCTTGTCCTGCTTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACCGCTTCTTGTCCTGCTTG
>SEQ ID NO:216> SEQ ID NO: 216
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTCTCTGTGTTCTTGTCCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTCTCTGTGTTCTTGTCCC
>SEQ ID NO:217> SEQ ID NO: 217
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCCGAAGGGCATGAGCTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAGCCGAAGGGCCATGAGCT
>SEQ ID NO:218> SEQ ID NO: 218
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCTCACAGCAGGGTCTTCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCTCACAGCAGGGTCTTC
>SEQ ID NO:219> SEQ ID NO: 219
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTGGCTACATGTTCCTGATCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTGGCTACATGTTCCTGATC
>SEQ ID NO:220> SEQ ID NO: 220
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAGCTGAGGAAGGTGAAGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAGCTGAGGAAGGTGAAGG
>SEQ ID NO:221> SEQ ID NO: 221
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAGAGGCAGCCATAGGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAGAGGCAGCCATAGGG
>SEQ ID NO:222> SEQ ID NO: 222
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGCAGCCGAGCCAGCCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGCAGCCGAGCCAGCCC
>SEQ ID NO:223> SEQ ID NO: 223
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTGGCGCAGAGCGTGGCTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTGGCGCAGAGCGTGGCT
>SEQ ID NO:224> SEQ ID NO: 224
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGCCTGTGTACCTCGCTGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGCCTGTGTACCTCGCTGT
>SEQ ID NO:225> SEQ ID NO: 225
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATCTCTAACCATTGAGGCCGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATCTCTAACCATTGAGGCCG
>SEQ ID NO:226> SEQ ID NO: 226
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCACACTTGACCATCACCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCACACTTGACCATCACCA
>SEQ ID NO:227> SEQ ID NO: 227
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCGTGCCTGCCCTAGTTCCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCGTGCCTGCCCTAGTTCCA
>SEQ ID NO:228> SEQ ID NO: 228
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGTTAATGGTATGATAATAACACAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGTTAATGGTATGATAATAACACA
>SEQ ID NO:229> SEQ ID NO: 229
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTCCAAGAGTCTGGCTAGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTTCCAAGAGTCTGGCTAGC
>SEQ ID NO:230> SEQ ID NO: 230
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTGCAGCTGTGGGTTGAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTGCAGCTGTGGGTTGA
>SEQ ID NO:231> SEQ ID NO: 231
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCAGTGTGCAGGGTGGCAAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCAGTGTGCAGGGTGGCAAG
>SEQ ID NO:232> SEQ ID NO: 232
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCACTTGATAAGAGGTCCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCACTTGATAAGAGGTCCC
>SEQ ID NO:233> SEQ ID NO: 233
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAACTGATGGGACCCACTCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAACTGATGGGACCCACTCC
>SEQ ID NO:234> SEQ ID NO: 234
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCTACCCTCTGCCCTGTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCTACCCTCTGCCCTGTG
>SEQ ID NO:235> SEQ ID NO: 235
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATTACCTCAATCATCCTGCTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATTACCTCAATCATCCTGCT
>SEQ ID NO:236> SEQ ID NO: 236
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATGGAAAGCCCCTGTTTCATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATGGAAAGCCCCTGTTTCAT
>SEQ ID NO:237> SEQ ID NO: 237
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTATCAAAGAATGGTCCTGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTATCAAAGAATGGTCCTGC
>SEQ ID NO:238> SEQ ID NO: 238
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCATGTACTGGTCCCTCATTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCATGTACTGGTCCCTCATT
>SEQ ID NO:239> SEQ ID NO: 239
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGACTCTGAAGATGTACCTATGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGACTCTGAAGATGTACCTATG
>SEQ ID NO:240> SEQ ID NO: 240
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGGTCAGCGGGCTACCACTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGGTCAGCGGGCTACCACTG
>SEQ ID NO:241> SEQ ID NO: 241
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTTAATATCCGCAAATGACTTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTTAATATCCGCAAATGACTTG
>SEQ ID NO:242> SEQ ID NO: 242
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGATGATGTACCTATGGTGCTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGATGATGTACCTATGGTGCTA
>SEQ ID NO:243> SEQ ID NO: 243
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGGAGACCCTGTAGGAGGACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGGAGACCCTGTAGGAGGAC
>SEQ ID NO:244> SEQ ID NO: 244
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTCCTCCTGCAGGATTCCTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTCCTCCTGCAGGATTCCTA
>SEQ ID NO:245> SEQ ID NO: 245
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAACGGGTGAAGGACTCGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAAACGGGGTGAAGGACTCG
>SEQ ID NO:246> SEQ ID NO: 246
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAAAAGAAACAGAGAATCTCCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAAAAGAAACAGAGAATCTCCA
>SEQ ID NO:247> SEQ ID NO: 247
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTTATCTTTTCAGTTCAATGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTTATCTTTTCAGTTCAATGC
>SEQ ID NO:248> SEQ ID NO: 248
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGAGTGTGCGTGGCTCTCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGAGTGTGCGTGGCTCTCA
>SEQ ID NO:249> SEQ ID NO: 249
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAACAGAAAGCGGTGACTTACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAACAGAAAGCGGTGACTTAC
>SEQ ID NO:250> SEQ ID NO: 250
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATCCATTCTGGTGCCACTACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATCCATTCTGGTGCCACTAC
>SEQ ID NO:251> SEQ ID NO: 251
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGAACACCACACCGCCATTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGAACACCACACCGCCATTG
>SEQ ID NO:252> SEQ ID NO: 252
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCTTTCTTCCACCTTTCTCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCTTTCTTCCACCTTTCTCC
>SEQ ID NO:253> SEQ ID NO: 253
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAACATCCTAGTCAACTCCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCAACATCCTAGTCAACTCCC
>SEQ ID NO:254> SEQ ID NO: 254
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGACGCATCCGTGGCTTCCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGACGCATCCGTGGCTTCCC
>SEQ ID NO:255> SEQ ID NO: 255
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATGTAGGAGCGCGTGCCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCATGTAGGAGCGCGTGCCC
>SEQ ID NO:256> SEQ ID NO: 256
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAGCAGCAGCCAGGAACAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGAAGCAGCAGCCAGGAACA
>SEQ ID NO:257> SEQ ID NO: 257
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATATTCACTAAGCGCTACTAGAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTATATTCACTAAGCGCTACTAGA
>SEQ ID NO:258> SEQ ID NO: 258
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACTTGGTCGTATTCGCTGAGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTACTTGGTCGTATTCGCTGAGG
>SEQ ID NO:259> SEQ ID NO: 259
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAACACAAACAGGTTAATTCCCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAACACAAACAGGTTAATTCCCA
>SEQ ID NO:260> SEQ ID NO: 260
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGATTGCCTTTACCACTCAGAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGATTGCCTTTACCACTCAGA
>SEQ ID NO:261> SEQ ID NO: 261
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCACCATACGAAATATTCTGGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCACCATACGAAATATTCTGGG
>SEQ ID NO:262> SEQ ID NO: 262
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCGACTTCTTTAAGCAGTCCTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCCCGACTTCTTTAAGCAGTCCT
>SEQ ID NO:263> SEQ ID NO: 263
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTCTTGGATCTGTATGTGGTCTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTCTTGGATCTGTATGTGGTCT
>SEQ ID NO:264> SEQ ID NO: 264
CAAGCAGAAGACGGCATACG AGATTGGTCAGTGACTGGAGTTCAGACGTGTCAAGCAGAAGACGGCATACG AGATTGGTCAGTGACTGGAGTTCAGACGTGT
>SEQ ID NO:265> SEQ ID NO: 265
CAAGCAGAAGACGGCATACGAGAGTGACTGGAGTTCAGACGTGTCAAGCAGAAGACGGCATACGAGAGTGACTGGAGTTCAGACGTGT
>SEQ ID NO:266> SEQ ID NO: 266
CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTCAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGT
>SEQ ID NO:267> SEQ ID NO: 267
CAAGCAGAAGACGGCATACGAGATACATCGGTGACTGGAGTTCAGACGTGTCAAGCAGAAGACGGCATACGAGATACATCGGTGACTGGAGTTCAGACGTGT
Claims (13)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2014137484A RU2613489C2 (en) | 2014-09-17 | 2014-09-17 | Method of detecting mutations in complex dna mixtures |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2014137484A RU2613489C2 (en) | 2014-09-17 | 2014-09-17 | Method of detecting mutations in complex dna mixtures |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2014137484A RU2014137484A (en) | 2016-04-10 |
| RU2613489C2 true RU2613489C2 (en) | 2017-03-16 |
Family
ID=55647488
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2014137484A RU2613489C2 (en) | 2014-09-17 | 2014-09-17 | Method of detecting mutations in complex dna mixtures |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2613489C2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2794177C1 (en) * | 2019-05-15 | 2023-04-12 | Еги Тек (Шэнь Чжэнь) Ко., Лимитед | Method for single-channel sequencing based on self-luminescence |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2011156529A2 (en) * | 2010-06-08 | 2011-12-15 | Nugen Technologies, Inc. | Methods and composition for multiplex sequencing |
| WO2013096802A1 (en) * | 2011-12-22 | 2013-06-27 | Ibis Biosciences, Inc. | Amplification primers and methods |
| RU2505956C2 (en) * | 2012-05-11 | 2014-02-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Пермский государственный национальный исследовательский университет" | Method of molecular-genetic identification of woody plant species populations |
-
2014
- 2014-09-17 RU RU2014137484A patent/RU2613489C2/en active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2011156529A2 (en) * | 2010-06-08 | 2011-12-15 | Nugen Technologies, Inc. | Methods and composition for multiplex sequencing |
| WO2013096802A1 (en) * | 2011-12-22 | 2013-06-27 | Ibis Biosciences, Inc. | Amplification primers and methods |
| RU2505956C2 (en) * | 2012-05-11 | 2014-02-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Пермский государственный национальный исследовательский университет" | Method of molecular-genetic identification of woody plant species populations |
Non-Patent Citations (3)
| Title |
|---|
| KINDE I. et al, "Detection and quantification of rare mutations with massively parallel sequencing", Proc Natl Acad Sci, 2011, v. 108, no. 23, p. 9530-9535. * |
| KINDE I. et al, "Detection and quantification of rare mutations with massively parallel sequencing", Proc Natl Acad Sci, 2011, v. 108, no. 23, p. 9530-9535. SCHMITT M., "Detection of ultra-rare mutations by next-generation sequencing", PNAS, 2012, v. 109, no. 36, p. 14508"14513. * |
| SCHMITT M., "Detection of ultra-rare mutations by next-generation sequencing", PNAS, 2012, v. 109, no. 36, p. 14508"14513. * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2794177C1 (en) * | 2019-05-15 | 2023-04-12 | Еги Тек (Шэнь Чжэнь) Ко., Лимитед | Method for single-channel sequencing based on self-luminescence |
| RU2840942C1 (en) * | 2019-12-09 | 2025-05-30 | Лексоген Гмбх | Index sequences for multiplexed parallel sequencing |
Also Published As
| Publication number | Publication date |
|---|---|
| RU2014137484A (en) | 2016-04-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Tébar-Martínez et al. | Strategies for improving detection of circulating tumor DNA using next generation sequencing | |
| US10894980B2 (en) | Methods of amplifying nucleic acid sequences mediated by transposase/transposon DNA complexes | |
| WO2017027835A1 (en) | Method of preparing cell free nucleic acid molecules by in situ amplification | |
| JP2021176302A (en) | Deep sequencing profiling of tumors | |
| EP3607065B1 (en) | Method and kit for constructing nucleic acid library | |
| WO2016134136A2 (en) | Genomic alterations in the tumor and circulation of pancreatic cancer patients | |
| CN110741096B (en) | Compositions and methods for detecting circulating tumor DNA | |
| EP3625364A1 (en) | Method for detecting genomic rearrangements | |
| Stiller et al. | Single-strand DNA library preparation improves sequencing of formalin-fixed and paraffin-embedded (FFPE) cancer DNA | |
| KR102275752B1 (en) | Method and kit for determining the genome integrity and/or the quality of a library of dna sequences obtained by deterministic restriction site whole genome amplification | |
| Shibata et al. | Detection of DNA fusion junctions for BCR-ABL translocations by Anchored ChromPET | |
| Morgensztern et al. | Mutational events in lung cancer: Present and developing technologies | |
| CN112921091B (en) | Use of FLT3 gene mutation in predicting sensitivity of non-small cell lung cancer patient to immune checkpoint inhibitor therapy | |
| US10954542B2 (en) | Size selection of RNA using poly(A) polymerase | |
| US20180291369A1 (en) | Error-proof nucleic acid library construction method and kit | |
| WO2025090956A1 (en) | Methods for detecting nucleic acid variants using capture probes | |
| RU2613489C2 (en) | Method of detecting mutations in complex dna mixtures | |
| WO2017084027A1 (en) | Kit for prognostic stratification of acute myelocytic leukemia and testing method therefor | |
| US10253370B2 (en) | High-sensitivity sequencing to detect BTK inhibitor resistance | |
| US20210115435A1 (en) | Error-proof nucleic acid library construction method | |
| EP4596712A1 (en) | Methods of identifying and using biomarkers | |
| CN111607646A (en) | A nucleotide sequence set for detecting BRAF gene mutation and its application | |
| Hoffmeister | Impact of Fusion Genes and other genetic aberrations on Pediatric Acute Myeloid Leukemia | |
| WO2025207926A1 (en) | Methods for selective deamination using methyl-sensitive deaminases | |
| JP2024530807A (en) | Methods for detecting and quantifying genomic and gene expression changes using RNA |