KR20160047506A - 서열 정렬 방법 및 시스템 - Google Patents
서열 정렬 방법 및 시스템 Download PDFInfo
- Publication number
- KR20160047506A KR20160047506A KR1020167007423A KR20167007423A KR20160047506A KR 20160047506 A KR20160047506 A KR 20160047506A KR 1020167007423 A KR1020167007423 A KR 1020167007423A KR 20167007423 A KR20167007423 A KR 20167007423A KR 20160047506 A KR20160047506 A KR 20160047506A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- construct
- leads
- reference sequence
- lead
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 155
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 68
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 53
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 53
- 150000001413 amino acids Chemical class 0.000 claims abstract description 29
- 201000010099 disease Diseases 0.000 claims abstract description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 15
- 238000012163 sequencing technique Methods 0.000 claims description 53
- 108090000623 proteins and genes Proteins 0.000 claims description 31
- 238000012217 deletion Methods 0.000 claims description 22
- 230000037430 deletion Effects 0.000 claims description 22
- 238000003780 insertion Methods 0.000 claims description 20
- 230000037431 insertion Effects 0.000 claims description 20
- 238000012300 Sequence Analysis Methods 0.000 claims description 17
- 125000002015 acyclic group Chemical group 0.000 claims description 14
- 238000004949 mass spectrometry Methods 0.000 claims description 13
- 102000004169 proteins and genes Human genes 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 11
- 230000037361 pathway Effects 0.000 claims description 11
- 210000000349 chromosome Anatomy 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 210000001519 tissue Anatomy 0.000 claims description 6
- 206010064571 Gene mutation Diseases 0.000 claims description 5
- 239000008280 blood Substances 0.000 claims description 5
- 210000004369 blood Anatomy 0.000 claims description 5
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 4
- 230000001052 transient effect Effects 0.000 claims description 4
- 210000003780 hair follicle Anatomy 0.000 claims description 3
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 3
- 239000004065 semiconductor Substances 0.000 claims description 3
- 206010028980 Neoplasm Diseases 0.000 claims description 2
- 210000003608 fece Anatomy 0.000 claims description 2
- 210000002445 nipple Anatomy 0.000 claims description 2
- 229920001184 polypeptide Polymers 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 4
- 238000007841 sequencing by ligation Methods 0.000 claims 2
- 206010036790 Productive cough Diseases 0.000 claims 1
- 201000011510 cancer Diseases 0.000 claims 1
- 210000003802 sputum Anatomy 0.000 claims 1
- 208000024794 sputum Diseases 0.000 claims 1
- 210000004243 sweat Anatomy 0.000 claims 1
- 239000000470 constituent Substances 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 56
- 239000000523 sample Substances 0.000 description 33
- 239000012634 fragment Substances 0.000 description 27
- 230000035772 mutation Effects 0.000 description 24
- 239000002773 nucleotide Substances 0.000 description 23
- 238000012545 processing Methods 0.000 description 23
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 22
- 125000003729 nucleotide group Chemical group 0.000 description 22
- 210000004027 cell Anatomy 0.000 description 19
- 238000004891 communication Methods 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 14
- 239000011324 bead Substances 0.000 description 14
- 239000011159 matrix material Substances 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 13
- 238000013459 approach Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 11
- 102000053602 DNA Human genes 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 238000003491 array Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 7
- -1 DNA) is cleaved Chemical class 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004811 liquid chromatography Methods 0.000 description 6
- 238000002493 microarray Methods 0.000 description 6
- 238000002864 sequence alignment Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 239000011521 glass Substances 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 239000004677 Nylon Substances 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 238000000132 electrospray ionisation Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 229920001778 nylon Polymers 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000012176 true single molecule sequencing Methods 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 238000002123 RNA extraction Methods 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 2
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 2
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 2
- 238000010802 RNA extraction kit Methods 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000003795 desorption Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001917 fluorescence detection Methods 0.000 description 2
- 238000011223 gene expression profiling Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007901 in situ hybridization Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000002865 local sequence alignment Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 238000012175 pyrosequencing Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 208000003721 Triple Negative Breast Neoplasms Diseases 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000003040 circulating cell Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000000105 evaporative light scattering detection Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 230000037308 hair color Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 235000019689 luncheon sausage Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000007902 molecular cytogenetic technique Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 108700022487 rRNA Genes Proteins 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 208000022679 triple-negative breast carcinoma Diseases 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G06F19/22—
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
도 2는 비순환 방향 그래프로 표시되는 3종의 변이 지명 포맷 (VCF) 등재물을 도시한다;
도 3의 A는 삽입 사례 및 참조 서열을 고려한 구성체에 대하여 핵산 서열 리드를 정렬하는 것에 대한 그림 표시를 나타낸다;
도 3의 B는 핵산 서열 리드 "ATCGAA"의 적정한 위치를 식별하는 데에 사용되는 행렬 및 백트랙을 나타낸다;
도 4는 병렬 프로세싱을 위한 연상 컴퓨팅 모델을 도시한다;
도 5는 병렬 컴퓨팅의 아키텍처를 도시한다.
Claims (104)
- 프로세서 및 비-일시적인 메모리를 포함하는, 다수의 서열 리드들을 정렬하기 위한 시스템이며,
상기 메모리는 실행될 때 프로세서로 하여금
기호 스트링으로서 다수의 서열 리드들을 수득하는 것;
서열 리드에 대응하는 각 기호 스트링을 참조 서열 구성체 내 다수의 위치와 비교하는 것-상기 구성체는 구성체 내 다수의 위치에 2개 이상의 서로 다른 기호 스트링을 포함함-;
서열 리드에 대응하는 각 기호 스트링과 참조 서열 구성체 내 다수의 위치 각각 사이의 중복을 점수화하는 것-더 높은 점수는 더 큰 중복량에 대응함-;
각 서열 리드에 대하여 최고 점수에 대응하는 중복을 식별하는 것;
각 서열 리드를 최고 점수에 대응하는 구성체 상의 위치에 할당하는 것; 및
각 정렬된 서열 리드의 위치에 대응하는 메모리에 파일을 기록하는 것
을 수행하도록 하는 명령어를 포함하는, 다수의 서열 리드들을 정렬하기 위한 시스템. - 제1항에 있어서, 서열 리드가 핵산 서열 리드인 시스템.
- 제1항에 있어서, 서열 리드가 아미노산 서열 리드인 시스템.
- 제1항에 있어서,
메모리가, 실행될 때 프로세서로 하여금
각 서열 리드의 할당된 위치에 기초하여, 다수의 정렬된 서열 리드들을 조립된 서열로 조립하는 것; 및
조립된 서열에 대응하는 메모리에 파일을 기록하는 것
을 수행하도록 하는 명령어를 추가적으로 포함하는 것인 시스템. - 제4항에 있어서, 조립된 서열이 유기체의 유전자 서열에 대응하는 것인 시스템.
- 제5항에 있어서, 유전자 서열이 실질적으로 염색체 또는 게놈을 포괄하는 것인 시스템.
- 제1항에 있어서, 하나 이상의 정렬된 서열 리드의 위치에 기초하여 유기체에 유전형을 할당하는 것을 추가적으로 포함하는 시스템.
- 제7항에 있어서, 할당된 유전형을 질환의 위험성과 상관시키는 것을 추가적으로 포함하는 시스템.
- 제8항에 있어서, 질환이 암인 시스템.
- 제1항에 있어서, 참조 서열 구성체가 비-일시적인 컴퓨터-판독가능 매체에 저장된 위치 및 기호의 데이터베이스를 포함하는 것인 방법.
- 제1항에 있어서, 다수의 프로세서들을 포함하며, 각 프로세서는 참조 서열 구성체에 대하여 다수의 서열 리드들 중 일부를 비교하고 점수화하도록 구성되는 것인 시스템.
- 제1항에 있어서, 메모리가, 제1 프로세서로 하여금 제2 프로세서가 수득, 비교, 점수화, 식별 및 할당한 다음 할당된 위치를 제1 프로세서로 전송하도록 명령하도록 하는 명령어를 추가적으로 포함하는 것인 시스템.
- 제1항에 있어서, 참조 서열 구성체 상의 각 위치가 참조 서열 내의 핵산에 대응하는 것인 시스템.
- 제1항에 있어서, 구성체 상의 각 위치가 참조 서열 내의 아미노산에 대응하는 것인 시스템.
- 제1항에 있어서, 구성체 상의 각 위치가 참조 서열 내의 유전자에 대응하는 것인 시스템.
- 제1항에 있어서, 참조 서열 구성체가 방향을 가지는 것인 시스템.
- 제16항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 유기체의 게놈을 표시하는 것인 시스템.
- 제16항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 유기체의 염색체를 표시하는 것인 시스템.
- 제16항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 단백질을 표시하는 것인 시스템.
- 제16항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 비순환인 시스템.
- 제1항에 있어서, 구성체 내의 2개 이상의 서로 다른 기호 스트링이 그 위치에서의 알려져 있는 서열 변이를 표시하는 것인 시스템.
- 제1항에 있어서, 2개 이상의 서로 다른 기호 스트링이 염기 삽입 또는 염기 결실에 의해 서로 다른 핵산 서열에 대응하는 것인 시스템.
- 제1항에 있어서, 2개 이상의 서로 다른 기호 스트링이 아미노산 삽입 또는 아미노산 결실에 의해 서로 다른 폴리펩티드에 대응하는 것인 시스템.
- 제1항에 있어서, 참조 서열 구성체가 1,000개를 초과하는 기호를 포함하는 것인 시스템.
- 제24항에 있어서, 참조 서열 구성체가 1,000,000개를 초과하는 기호를 포함하는 것인 시스템.
- 제1항에 있어서, 다수의 서열 리드들이 1000개를 초과하는 서열 리드를 포함하는 것인 시스템.
- 제1항에 있어서, 다수의 서열 리드들 중 대부분이 100개를 초과하는 기호의 길이인 시스템.
- 제1항에 있어서, 다수의 서열 리드들이 차-세대 서열분석 방법의 출력 파일인 시스템.
- 다수의 서열 리드들을 수득하는 것;
참조 서열 구성체에 대하여 각 서열 리드의 서열 중복을 점수화하는 것-상기 구성체는 구성체 내 다수의 위치에 위치 당 2개 이상의 대안적인 서열을 포함하며, 더 큰 중복이 더 높은 점수로 이어짐-; 및
각 서열 리드의 점수가 최대화되도록 구성체 내 위치에 각 서열 리드를 정렬하는 것
을 포함하는, 다수 서열 리드들의 정렬 방법. - 제29항에 있어서, 구성체와 관련한 서열의 정렬에 기초하여 서열 리드들을 서로 조립하는 것을 추가적으로 포함하는 방법.
- 제29항에 있어서, 서열 리드가 핵산 서열 리드인 방법.
- 제29항에 있어서, 서열 리드가 아미노산 서열 리드인 방법.
- 제29항에 있어서, 구성체에서의 각 위치가 참조 서열 내의 염기 또는 아미노산에 대응하는 것인 방법.
- 제29항에 있어서, 구성체에서의 각 위치가 참조 서열 내의 유전자에 대응하는 것인 방법.
- 제29항에 있어서, 참조 서열 구성체가 방향을 가지는 것인 방법.
- 제35항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 유기체의 게놈을 표시하는 것인 방법.
- 제35항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 유기체의 염색체를 표시하는 것인 방법.
- 제35항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 단백질을 표시하는 것인 방법.
- 제35항에 있어서, 참조 서열을 통한 경로가 비순환인 방법.
- 제29항에 있어서, 구성체 내의 2개 이상의 대안적인 서열이 그 위치에서의 알려져 있는 유전자 변이를 표시하는 것인 방법.
- 제40항에 있어서, 핵산 리드들의 할당된 위치에 기초하여 유기체에 유전형을 할당하는 것을 추가적으로 포함하는 방법.
- 제29항에 있어서, 구성체 내의 2개 이상의 대안적인 서열이 그 위치에서의 알려져 있는 구조적 변이를 표시하는 것인 방법.
- 제29항에 있어서, 2개 이상의 대안적인 서열이 염기 삽입 또는 염기 결실에 의해 서로 다른 것인 방법.
- 제29항에 있어서, 2개 이상의 대안적인 서열이 아미노산 삽입 또는 아미노산 결실에 의해 서로 다른 것인 방법.
- 제29항에 있어서, 각 리드가 측정된 핵산 염기 서열을 표시하는 기호 스트링을 포함하는 것인 방법.
- 제45항에 있어서, 측정된 핵산 염기 서열이 생거 서열분석, 피로시퀀싱, 이온 반도체 서열분석, 합성에 의한 서열분석, 라이게이션에 의한 서열분석, 및 단일-분자 실시간 서열분석에서 선택되는 서열분석 방법을 사용하여 측정되는 것인 방법.
- 제29항에 있어서, 각 리드가, 측정된 아미노산 서열을 표시하는 기호 스트링을 포함하는 것인 방법.
- 제47항에 있어서, 측정된 아미노산 서열이 질량 분광측정법을 사용하여 측정되는 것인 방법.
- 제29항에 있어서, 참조 서열 구성체가 1,000개를 초과하는 염기를 포함하는 것인 방법.
- 제49항에 있어서, 참조 서열 구성체가 1,000,000개를 초과하는 염기를 포함하는 것인 방법.
- 제29항에 있어서, 다수의 리드들이 1000개를 초과하는 리드를 포함하는 것인 방법.
- 제29항에 있어서, 다수의 리드들 중 대부분이 100개를 초과하는 염기쌍의 길이인 방법.
- 제29항에 있어서, 다수의 리드들 중 대부분이 10개를 초과하는 아미노산의 길이인 방법.
- 제29항에 있어서, 참조 서열 구성체가 컴퓨터-판독가능 매체에 저장된 위치 및 서열의 데이터베이스를 포함하는 것인 방법.
- 제54항에 있어서, 리드가 컴퓨터-판독가능 매체에 저장된 기호 스트링을 포함하는 것인 방법.
- 제29항에 있어서, 샘플로부터의 다수의 핵산을 서열분석하는 것을 추가적으로 포함하는 방법.
- 제56항에 있어서, 환자로부터 샘플을 수득하는 것을 추가적으로 포함하는 방법.
- 제56항에 있어서, 샘플이 혈액, 소변, 타액, 가래, 대변, 유두 흡인물, 땀, 모낭, 협측 면봉 또는 조직에서 선택된 것인 방법.
- 제58항에 있어서, 샘플로부터 다수의 핵산을 단리하는 것을 추가적으로 포함하는 방법.
- 제59항에 있어서, 단리된 다수의 핵산 중 일부 이상을 증폭시키는 것을 추가적으로 포함하는 방법.
- 다수의 핵산 리드들을 수득하는 것;
리드 내 염기와 구성체 사이의 중복을 점수화하는 알고리즘을 사용하여 참조 서열 구성체에 대해 핵산 리드를 정렬하는 것-상기 구성체는 구성체 내 다수의 위치에 위치 당 2개 이상의 대안적인 서열을 포함함-
을 포함하는, 다수 핵산 리드들의 정렬 방법. - 제61항에 있어서, 알고리즘이 2개 이상의 서열들 사이의 선택에 따라 최대 중복 점수를 계산하는 것인 방법.
- 제61항에 있어서, 참조 서열 구성체가 비순환 방향 그래프인 방법.
- 제61항에 있어서, 구성체가 1,000개 이상의 염기를 포함하는 것인 방법.
- 제64항에 있어서, 구성체가 1,000,000개 이상의 염기를 포함하는 것인 방법.
- 다수의 아미노산 리드들을 수득하는 것;
리드 내 아미노산과 구성체 사이의 중복을 점수화하는 알고리즘을 사용하여 참조 서열 구성체에 대해 아미노산 리드를 정렬하는 것-상기 구성체는 구성체 내 다수의 위치에 위치 당 2개 이상의 대안적인 서열을 포함함-
을 포함하는, 다수 아미노산 리드들의 정렬 방법. - 제66항에 있어서, 알고리즘이 2개 이상의 서열들 사이의 선택에 따라 최대 중복 점수를 계산하는 것인 방법.
- 제66항에 있어서, 참조 서열 구성체가 비순환 방향 그래프인 방법.
- 제66항에 있어서, 구성체가 100개 이상의 아미노산을 포함하는 것인 방법.
- 제69항에 있어서, 구성체가 10,000개 이상의 아미노산을 포함하는 것인 방법.
- 기호 스트링으로서 다수의 리드들을 수득하는 것;
컴퓨터 프로세서를 사용하여 리드에 대응하는 각 기호 스트링을 참조 서열 구성체 내 다수의 위치와 비교하는 것-상기 구성체는 구성체 내 다수의 위치에 2개 이상의 서로 다른 기호 스트링을 포함함-;
프로세서를 사용하여 기호 스트링과 참조 서열 구성체 내 다수의 위치 각각 사이의 중복을 점수화하는 것-더 높은 점수는 더 큰 중복량에 대응함-;
각 리드에 대하여 최고 점수에 대응하는 중복을 식별하는 것; 및
리드를 최고 점수에 대응하는 구성체 상의 위치에 정렬하는 것
을 포함하는, 다수 리드들의 컴퓨터-실행 정렬 방법. - 제71항에 있어서, 구성체 상의 정렬된 위치에 기초하여 리드들을 서로 조립하는 것을 추가적으로 포함하는 방법.
- 제71항에 있어서, 리드가 핵산 리드인 방법.
- 제71항에 있어서, 리드가 아미노산 리드인 방법.
- 제71항에 있어서, 구성체 상의 각 위치가 참조 서열 내의 염기에 대응하는 것인 방법.
- 제71항에 있어서, 구성체 상의 각 위치가 참조 서열 내의 아미노산에 대응하는 것인 방법.
- 제71항에 있어서, 구성체 상의 각 위치가 참조 서열 내의 유전자에 대응하는 것인 방법.
- 제71항에 있어서, 참조 서열 구성체가 방향을 가지는 것인 방법.
- 제78항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 유기체의 게놈을 표시하는 것인 방법.
- 제78항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 유기체의 염색체를 표시하는 것인 방법.
- 제78항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 단백질을 표시하는 것인 방법.
- 제78항에 있어서, 상기 방향으로의 참조 서열 구성체를 통한 경로가 비순환인 방법.
- 제71항에 있어서, 구성체 내의 2개 이상의 대안적인 서열이 그 위치에서의 알려져 있는 유전자 변이를 표시하는 것인 방법.
- 제83항에 있어서, 핵산 리드들의 할당된 위치에 기초하여 유기체에 유전형을 할당하는 것을 추가적으로 포함하는 방법.
- 제71항에 있어서, 2개 이상의 대안적인 서열이 염기 삽입 또는 염기 결실에 의해 서로 다른 것인 방법.
- 제71항에 있어서, 각 핵산 리드가, 측정된 핵산 염기 서열을 표시하는 기호 스트링을 포함하는 것인 방법.
- 제86항에 있어서, 측정된 핵산 염기 서열이 생거 서열분석, 피로시퀀싱, 이온 반도체 서열분석, 합성에 의한 서열분석, 라이게이션에 의한 서열분석, 및 단일-분자 실시간 서열분석에서 선택되는 서열분석 방법을 사용하여 측정되는 것인 방법.
- 제71항에 있어서, 참조 서열 구성체가 1,000개를 초과하는 염기를 포함하는 것인 방법.
- 제88항에 있어서, 참조 서열 구성체가 1,000,000개를 초과하는 염기를 포함하는 것인 방법.
- 제71항에 있어서, 다수의 핵산 리드들이 1000개를 초과하는 리드를 포함하는 것인 방법.
- 제71항에 있어서, 다수의 핵산 리드들 중 대부분이 100개를 초과하는 염기쌍의 길이인 방법.
- 기호 스트링으로서 다수의 리드들을 수득하는 것;
리드와 구성체 사이의 중복을 점수화하는 알고리즘을 실행하는 프로세서를 사용하여 참조 서열 구성체에 대해 리드를 정렬하는 것-상기 구성체는 구성체 내 다수의 위치에 위치 당 2개 이상의 대안적인 서열을 포함함-
을 포함하는, 다수 리드들의 컴퓨터 실행 정렬 방법. - 제92항에 있어서, 알고리즘이 2개 이상의 대안적인 서열들 사이의 선택에 따라 최대 중복 점수를 계산하는 것인 방법.
- 제92항에 있어서, 참조 서열 구성체가 비순환 방향 그래프인 방법.
- 제92항에 있어서, 다수의 핵산 리드들이 컴퓨터-판독가능 매체에 저장되는 것인 방법.
- 제92항에 있어서, 참조 서열 구성체가 컴퓨터-판독가능 매체에 저장된 데이터베이스를 포함하는 것인 방법.
- 프로세서 및 메모리를 포함하는, 다수의 리드들을 정렬하기 위한 시스템이며,
상기 메모리는 실행될 때 프로세서로 하여금
기호 스트링으로서 다수의 리드들을 수득하는 것;
리드와 구성체 사이의 중복을 점수화하는 알고리즘을 사용하여 참조 서열 구성체에 대해 리드를 정렬하는 것-상기 구성체는 구성체 내 다수의 위치에 위치 당 2개 이상의 대안적인 서열을 포함함-; 및
정렬된 서열에 대응하는 메모리에 파일을 기록하는 것
을 수행하도록 하는 명령어를 포함하는, 다수의 리드들을 정렬하기 위한 시스템. - 제97항에 있어서, 메모리가, 실행될 때 프로세서로 하여금 2개 이상의 대안적인 서열들 사이의 선택에 따라 최대 중복 점수를 계산하도록 하는 명령어를 추가적으로 포함하는 것인 시스템.
- 제97항에 있어서, 참조 서열 구성체가 비순환 방향 그래프인 시스템.
- 제97항에 있어서, 다수의 리드들이 컴퓨터-판독가능 매체에 저장되는 것인 시스템.
- 제97항에 있어서, 참조 서열 구성체가 컴퓨터-판독가능 매체에 저장된 데이터베이스를 포함하는 것인 시스템.
- 다수의 서열 리드들을 수득하는 것;
참조 서열 구성체에 대하여 각 서열 리드의 서열 중복을 점수화하는 것-상기 구성체는 구성체 내 다수의 위치에 위치 당 2개 이상의 대안적인 서열을 포함하며, 더 큰 중복이 더 낮은 점수로 이어짐-; 및
각 서열 리드의 점수가 최소화되도록 구성체 내 위치에 각 서열 리드를 정렬하는 것
을 포함하는, 다수 서열 리드들의 정렬 방법. - 기호 스트링으로서 다수의 리드들을 수득하는 것;
컴퓨터 프로세서를 사용하여 리드에 대응하는 각 기호 스트링을 참조 서열 구성체 내 다수의 위치와 비교하는 것-상기 구성체는 구성체 내 다수의 위치에 2개 이상의 서로 다른 기호 스트링을 포함함-;
프로세서를 사용하여 기호 스트링과 참조 서열 구성체 내 다수의 위치 각각 사이의 중복을 점수화하는 것-더 낮은 점수는 더 큰 중복량에 대응함-;
각 리드에 대하여 최저 점수에 대응하는 중복을 식별하는 것; 및
리드를 최저 점수에 대응하는 구성체 상의 위치에 정렬하는 것
을 포함하는, 다수 리드들의 컴퓨터-실행 정렬 방법. - 프로세서 및 메모리를 포함하는, 다수의 리드들을 정렬하기 위한 시스템이며,
상기 메모리는 실행될 때 프로세서로 하여금
기호 스트링으로서 다수의 리드들을 수득하는 것;
리드에 대응하는 각 기호 스트링을 참조 서열 구성체 내 다수의 위치와 비교하는 것-상기 구성체는 구성체 내 다수의 위치에 2개 이상의 서로 다른 기호 스트링 포함함-;
기호 스트링과 참조 서열 구성체 내 다수의 위치 각각 사이의 중복을 점수화하는 것-더 낮은 점수는 더 큰 중복량에 대응함-;
각 핵산 리드에 대하여 최저 점수에 대응하는 중복을 식별하는 것;
핵산 리드를 최저 점수에 대응하는 구성체 상의 위치에 할당하는 것; 및
정렬된 서열에 대응하는 메모리에 파일을 기록하는 것
을 수행하도록 하는 명령어를 포함하는, 다수의 리드들을 정렬하기 위한 시스템.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361868249P | 2013-08-21 | 2013-08-21 | |
| US61/868,249 | 2013-08-21 | ||
| US14/016,833 US9898575B2 (en) | 2013-08-21 | 2013-09-03 | Methods and systems for aligning sequences |
| US14/016,833 | 2013-09-03 | ||
| PCT/US2014/052065 WO2015027050A1 (en) | 2013-08-21 | 2014-08-21 | Methods and systems for aligning sequences |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20160047506A true KR20160047506A (ko) | 2016-05-02 |
| KR102371953B1 KR102371953B1 (ko) | 2022-03-08 |
Family
ID=52481122
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020167007423A Active KR102371953B1 (ko) | 2013-08-21 | 2014-08-21 | 서열 정렬 방법 및 시스템 |
Country Status (9)
| Country | Link |
|---|---|
| US (2) | US9898575B2 (ko) |
| EP (2) | EP3702472B1 (ko) |
| JP (2) | JP6586088B2 (ko) |
| KR (1) | KR102371953B1 (ko) |
| CN (1) | CN105637098B (ko) |
| AU (1) | AU2014308794B2 (ko) |
| CA (1) | CA2921645C (ko) |
| SG (1) | SG11201601124YA (ko) |
| WO (1) | WO2015027050A1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20190082854A (ko) * | 2016-11-16 | 2019-07-10 | 일루미나, 인코포레이티드 | 데이터 판독 재정렬을 시퀀싱하는 방법 |
Families Citing this family (49)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9116866B2 (en) | 2013-08-21 | 2015-08-25 | Seven Bridges Genomics Inc. | Methods and systems for detecting sequence variants |
| US9898575B2 (en) | 2013-08-21 | 2018-02-20 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences |
| AU2014337089B2 (en) | 2013-10-18 | 2019-08-08 | Seven Bridges Genomics Inc. | Methods and systems for genotyping genetic samples |
| US11049587B2 (en) | 2013-10-18 | 2021-06-29 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences in the presence of repeating elements |
| SG11201603039PA (en) | 2013-10-18 | 2016-05-30 | Seven Bridges Genomics Inc | Methods and systems for identifying disease-induced mutations |
| US10832797B2 (en) | 2013-10-18 | 2020-11-10 | Seven Bridges Genomics Inc. | Method and system for quantifying sequence alignment |
| US9092402B2 (en) | 2013-10-21 | 2015-07-28 | Seven Bridges Genomics Inc. | Systems and methods for using paired-end data in directed acyclic structure |
| JP2017510871A (ja) | 2014-01-10 | 2017-04-13 | セブン ブリッジズ ジェノミクス インコーポレイテッド | リードマッピングにおける公知の対立遺伝子の使用のためのシステム及び方法 |
| US9817944B2 (en) | 2014-02-11 | 2017-11-14 | Seven Bridges Genomics Inc. | Systems and methods for analyzing sequence data |
| WO2016141294A1 (en) | 2015-03-05 | 2016-09-09 | Seven Bridges Genomics Inc. | Systems and methods for genomic pattern analysis |
| US10275567B2 (en) | 2015-05-22 | 2019-04-30 | Seven Bridges Genomics Inc. | Systems and methods for haplotyping |
| US10229519B2 (en) | 2015-05-22 | 2019-03-12 | The University Of British Columbia | Methods for the graphical representation of genomic sequence data |
| US20160364523A1 (en) * | 2015-06-11 | 2016-12-15 | Seven Bridges Genomics Inc. | Systems and methods for identifying microorganisms |
| US10793895B2 (en) | 2015-08-24 | 2020-10-06 | Seven Bridges Genomics Inc. | Systems and methods for epigenetic analysis |
| US10724110B2 (en) | 2015-09-01 | 2020-07-28 | Seven Bridges Genomics Inc. | Systems and methods for analyzing viral nucleic acids |
| US10584380B2 (en) | 2015-09-01 | 2020-03-10 | Seven Bridges Genomics Inc. | Systems and methods for mitochondrial analysis |
| US11347704B2 (en) | 2015-10-16 | 2022-05-31 | Seven Bridges Genomics Inc. | Biological graph or sequence serialization |
| US20170199960A1 (en) | 2016-01-07 | 2017-07-13 | Seven Bridges Genomics Inc. | Systems and methods for adaptive local alignment for graph genomes |
| US10364468B2 (en) | 2016-01-13 | 2019-07-30 | Seven Bridges Genomics Inc. | Systems and methods for analyzing circulating tumor DNA |
| US10460829B2 (en) | 2016-01-26 | 2019-10-29 | Seven Bridges Genomics Inc. | Systems and methods for encoding genetic variation for a population |
| US10262102B2 (en) | 2016-02-24 | 2019-04-16 | Seven Bridges Genomics Inc. | Systems and methods for genotyping with graph reference |
| US10790044B2 (en) | 2016-05-19 | 2020-09-29 | Seven Bridges Genomics Inc. | Systems and methods for sequence encoding, storage, and compression |
| US9940212B2 (en) * | 2016-06-09 | 2018-04-10 | Google Llc | Automatic qubit calibration |
| US10600499B2 (en) | 2016-07-13 | 2020-03-24 | Seven Bridges Genomics Inc. | Systems and methods for reconciling variants in sequence data relative to reference sequence data |
| US11289177B2 (en) | 2016-08-08 | 2022-03-29 | Seven Bridges Genomics, Inc. | Computer method and system of identifying genomic mutations using graph-based local assembly |
| US11250931B2 (en) | 2016-09-01 | 2022-02-15 | Seven Bridges Genomics Inc. | Systems and methods for detecting recombination |
| US20180157792A1 (en) * | 2016-11-11 | 2018-06-07 | Seven Bridges Genomics Inc. | Systems and methods for aligning sequences to personalized references |
| US10319465B2 (en) | 2016-11-16 | 2019-06-11 | Seven Bridges Genomics Inc. | Systems and methods for aligning sequences to graph references |
| US10726110B2 (en) * | 2017-03-01 | 2020-07-28 | Seven Bridges Genomics, Inc. | Watermarking for data security in bioinformatic sequence analysis |
| US11347844B2 (en) | 2017-03-01 | 2022-05-31 | Seven Bridges Genomics, Inc. | Data security in bioinformatic sequence analysis |
| US20180260520A1 (en) * | 2017-03-08 | 2018-09-13 | Björn Pollex | Systems and methods for aligning sequences to graph reference constructs |
| EP3467690A1 (en) * | 2017-10-06 | 2019-04-10 | Emweb bvba | Improved alignment method for nucleic acid sequences |
| JP7054133B2 (ja) | 2017-11-09 | 2022-04-13 | 国立研究開発法人国立がん研究センター | 配列解析方法、配列解析装置、参照配列の生成方法、参照配列生成装置、プログラム、および記録媒体 |
| US20200294622A1 (en) * | 2017-12-04 | 2020-09-17 | Nantomics, Llc | Subtyping of TNBC And Methods |
| US12046325B2 (en) | 2018-02-14 | 2024-07-23 | Seven Bridges Genomics Inc. | System and method for sequence identification in reassembly variant calling |
| CN110310705B (zh) * | 2018-03-16 | 2021-05-14 | 北京哲源科技有限责任公司 | 支持simd的序列比对方法及装置 |
| MX2020012672A (es) * | 2018-05-31 | 2021-02-09 | Koninklijke Philips Nv | Sistema y metodo para interpretacion de alelos usando un genoma de referencia basado en graficos. |
| WO2020025114A1 (en) * | 2018-07-31 | 2020-02-06 | Vestel Elektronik Sanayi Ve Ticaret A.S. | Method, apparatus, system and computer program for data distribution |
| US11726757B2 (en) * | 2019-08-14 | 2023-08-15 | Nvidia Corporation | Processor for performing dynamic programming according to an instruction, and a method for configuring a processor for dynamic programming via an instruction |
| CN114503206A (zh) * | 2019-10-01 | 2022-05-13 | 皇家飞利浦有限公司 | 用于在基因组图中有效识别和提取序列路径的系统和方法 |
| WO2022197887A1 (en) | 2021-03-17 | 2022-09-22 | Seven Bridges Genomics Inc. | Systems and methods for generating graph references |
| CN113268270B (zh) * | 2021-06-07 | 2022-10-21 | 中科计算技术西部研究院 | 一种针对成对隐马尔可夫模型的加速方法、系统及装置 |
| TWI814481B (zh) * | 2021-07-20 | 2023-09-01 | 奧義智慧科技股份有限公司 | 用於輔助入侵偵測的資安事件診斷系統與相關的電腦程式產品 |
| US11822541B2 (en) | 2021-09-30 | 2023-11-21 | Nvidia Corporation | Techniques for storing sub-alignment data when accelerating Smith-Waterman sequence alignments |
| US11550584B1 (en) * | 2021-09-30 | 2023-01-10 | Nvidia Corporation | Implementing specialized instructions for accelerating Smith-Waterman sequence alignments |
| US12141582B2 (en) | 2021-09-30 | 2024-11-12 | Nvidia Corporation | Implementing specialized instructions for accelerating dynamic programming algorithms |
| CN115862740B (zh) * | 2022-12-06 | 2023-09-12 | 中国人民解放军军事科学院军事医学研究院 | 一种面向大规模病毒基因组数据的快速分布式多序列比对方法 |
| CN118824369B (zh) * | 2024-09-20 | 2024-12-27 | 烟台大学 | 基于图压缩的序列到图比对方法、系统、装置、存储介质 |
| CN120260679B (zh) * | 2025-06-06 | 2025-09-12 | 之江实验室 | 基于人工智能算法的蛋白质优化设计与筛选方法和装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20110295514A1 (en) * | 2010-05-13 | 2011-12-01 | Life Technologies Corporation | Computational Methods For Translating A Sequence Of Multi-Base Color Calls To A Sequence Of Bases |
| US8209130B1 (en) * | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
Family Cites Families (146)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5242794A (en) | 1984-12-13 | 1993-09-07 | Applied Biosystems, Inc. | Detection of specific sequences in nucleic acids |
| US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
| US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
| US5583024A (en) | 1985-12-02 | 1996-12-10 | The Regents Of The University Of California | Recombinant expression of Coleoptera luciferase |
| US4988617A (en) | 1988-03-25 | 1991-01-29 | California Institute Of Technology | Method of detecting a nucleotide change in nucleic acids |
| US5234809A (en) | 1989-03-23 | 1993-08-10 | Akzo N.V. | Process for isolating nucleic acid |
| US5494810A (en) | 1990-05-03 | 1996-02-27 | Cornell Research Foundation, Inc. | Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease |
| US5511158A (en) | 1994-08-04 | 1996-04-23 | Thinking Machines Corporation | System and method for creating and evolving directed graphs |
| US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
| US5701256A (en) | 1995-05-31 | 1997-12-23 | Cold Spring Harbor Laboratory | Method and apparatus for biological sequence comparison |
| GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
| US6054278A (en) | 1997-05-05 | 2000-04-25 | The Perkin-Elmer Corporation | Ribosomal RNA gene polymorphism based microorganism identification |
| EP1027145A4 (en) | 1997-09-17 | 2004-08-25 | Gentra Systems Inc | APPARATUS AND METHODS FOR ISOLATING NUCLEIC ACID |
| US6054276A (en) | 1998-02-23 | 2000-04-25 | Macevicz; Stephen C. | DNA restriction site mapping |
| US6223128B1 (en) | 1998-06-29 | 2001-04-24 | Dnstar, Inc. | DNA sequence assembly system |
| US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
| GB9901475D0 (en) | 1999-01-22 | 1999-03-17 | Pyrosequencing Ab | A method of DNA sequencing |
| US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
| EP1218543A2 (en) | 1999-09-29 | 2002-07-03 | Solexa Ltd. | Polynucleotide sequencing |
| US6582938B1 (en) | 2001-05-11 | 2003-06-24 | Affymetrix, Inc. | Amplification of nucleic acids |
| US6448717B1 (en) | 2000-07-17 | 2002-09-10 | Micron Technology, Inc. | Method and apparatuses for providing uniform electron beams from field emission displays |
| BR0112667A (pt) | 2000-07-18 | 2006-05-09 | Correlogic Systems Inc | processo de distinção entre estados biológicos baseados em padrões ocultos de dados biológicos |
| NO20004869D0 (no) | 2000-09-28 | 2000-09-28 | Torbjoern Rognes | Metode for hurtig optimal lokal sekvensjustering ved bruk av parallell prosessering |
| JP2004523243A (ja) | 2001-03-12 | 2004-08-05 | カリフォルニア インスティチュート オブ テクノロジー | 非同期性塩基伸長によってポリヌクレオチド配列を分析するための方法および装置 |
| US6890763B2 (en) | 2001-04-30 | 2005-05-10 | Syn X Pharma, Inc. | Biopolymer marker indicative of disease state having a molecular weight of 1350 daltons |
| US7809509B2 (en) | 2001-05-08 | 2010-10-05 | Ip Genesis, Inc. | Comparative mapping and assembly of nucleic acid sequences |
| US7577554B2 (en) | 2001-07-03 | 2009-08-18 | I2 Technologies Us, Inc. | Workflow modeling using an acyclic directed graph data structure |
| US20040023209A1 (en) | 2001-11-28 | 2004-02-05 | Jon Jonasson | Method for identifying microorganisms based on sequencing gene fragments |
| WO2003095978A2 (en) | 2002-05-09 | 2003-11-20 | Surromed, Inc. | Methods for time-alignment of liquid chromatography-mass spectrometry data |
| US7321623B2 (en) | 2002-10-01 | 2008-01-22 | Avocent Corporation | Video compression system |
| US7225324B2 (en) | 2002-10-31 | 2007-05-29 | Src Computers, Inc. | Multi-adaptive processing systems and techniques for enhancing parallelism and performance of computational functions |
| AU2003303502A1 (en) | 2002-12-27 | 2004-07-29 | Rosetta Inpharmatics Llc | Computer systems and methods for associating genes with traits using cross species data |
| US7885840B2 (en) | 2003-01-07 | 2011-02-08 | Sap Aktiengesellschaft | System and method of flexible workflow management |
| US7575865B2 (en) | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
| US7953891B2 (en) | 2003-03-18 | 2011-05-31 | Microsoft Corporation | Systems and methods for scheduling data flow execution based on an arbitrary graph describing the desired data flow |
| JP2005092719A (ja) | 2003-09-19 | 2005-04-07 | Nec Corp | ハプロタイプ推定方法、推定装置、プログラム |
| WO2005042781A2 (en) | 2003-10-31 | 2005-05-12 | Agencourt Personal Genomics Corporation | Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof |
| US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
| US20060195266A1 (en) | 2005-02-25 | 2006-08-31 | Yeatman Timothy J | Methods for predicting cancer outcome and gene signatures for use therein |
| US8185367B2 (en) | 2004-04-30 | 2012-05-22 | Merck Sharp & Dohme Corp. | Systems and methods for reconstructing gene networks in segregating populations |
| JP2005346340A (ja) * | 2004-06-02 | 2005-12-15 | Hitachi Ltd | フラグメントによる配列クラスタリング・アラインメント方法 |
| US7642511B2 (en) | 2004-09-30 | 2010-01-05 | Ut-Battelle, Llc | Ultra high mass range mass spectrometer systems |
| WO2006052242A1 (en) | 2004-11-08 | 2006-05-18 | Seirad, Inc. | Methods and systems for compressing and comparing genomic data |
| US7483585B2 (en) | 2004-12-01 | 2009-01-27 | Ati Technologies Ulc | Image compression using variable bit size run length encoding |
| EP2857523A1 (en) | 2005-02-01 | 2015-04-08 | Applied Biosystems, LLC | Method for identifying a sequence in a polynucleotide |
| CA2615323A1 (en) | 2005-06-06 | 2007-12-21 | 454 Life Sciences Corporation | Paired end sequencing |
| US7329860B2 (en) | 2005-11-23 | 2008-02-12 | Illumina, Inc. | Confocal imaging methods and apparatus |
| KR100722504B1 (ko) | 2006-01-18 | 2007-05-29 | 학교법인 포항공과대학교 | 비선형 공정 계획 생성 방법 및 이를 이용한 인터넷 기반step-nc 시스템 |
| US7580918B2 (en) | 2006-03-03 | 2009-08-25 | Adobe Systems Incorporated | System and method of efficiently representing and searching directed acyclic graph structures in databases |
| GB2436564A (en) | 2006-03-31 | 2007-10-03 | Plant Bioscience Ltd | Prediction of heterosis and other traits by transcriptome analysis |
| US7282337B1 (en) | 2006-04-14 | 2007-10-16 | Helicos Biosciences Corporation | Methods for increasing accuracy of nucleic acid sequencing |
| US7702468B2 (en) | 2006-05-03 | 2010-04-20 | Population Diagnostics, Inc. | Evaluating genetic disorders |
| US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
| EP2463389A1 (en) | 2006-10-20 | 2012-06-13 | Innogenetics N.V. | Methodology for analysis of sequence variations within the HCV NS5B genomic region |
| AU2007334393A1 (en) | 2006-12-14 | 2008-06-26 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
| US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
| US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
| EP2374902B1 (en) | 2007-01-26 | 2017-11-01 | Illumina, Inc. | Nucleic acid sequencing system and method |
| WO2008098014A2 (en) | 2007-02-05 | 2008-08-14 | Applied Biosystems, Llc | System and methods for indel identification using short read sequencing |
| US8146099B2 (en) | 2007-09-27 | 2012-03-27 | Microsoft Corporation | Service-oriented pipeline based architecture |
| US20090119313A1 (en) | 2007-11-02 | 2009-05-07 | Ioactive Inc. | Determining structure of binary data using alignment algorithms |
| US8478544B2 (en) | 2007-11-21 | 2013-07-02 | Cosmosid Inc. | Direct identification and measurement of relative populations of microorganisms with direct DNA sequencing and probabilistic methods |
| US20090164135A1 (en) | 2007-12-21 | 2009-06-25 | Brodzik Andrzej K | Quaternionic algebra approach to dna and rna tandem repeat detection |
| US20090233809A1 (en) | 2008-03-04 | 2009-09-17 | Affymetrix, Inc. | Resequencing methods for identification of sequence variants |
| US8628940B2 (en) * | 2008-09-24 | 2014-01-14 | Pacific Biosciences Of California, Inc. | Intermittent detection during analytical reactions |
| US8271206B2 (en) | 2008-04-21 | 2012-09-18 | Softgenetics Llc | DNA sequence assembly methods of short reads |
| US20100010992A1 (en) | 2008-07-10 | 2010-01-14 | Morris Robert P | Methods And Systems For Resolving A Location Information To A Network Identifier |
| KR100992169B1 (ko) | 2008-07-25 | 2010-11-04 | 한국생명공학연구원 | 정보 분석프로세스 추천 설계시스템 및 방법 |
| US20100041048A1 (en) | 2008-07-31 | 2010-02-18 | The Johns Hopkins University | Circulating Mutant DNA to Assess Tumor Dynamics |
| US20100035252A1 (en) | 2008-08-08 | 2010-02-11 | Ion Torrent Systems Incorporated | Methods for sequencing individual nucleic acids under tension |
| US9347089B2 (en) | 2008-09-19 | 2016-05-24 | Children's Medical Center Corporation | Therapeutic and diagnostic strategies |
| US8546128B2 (en) | 2008-10-22 | 2013-10-01 | Life Technologies Corporation | Fluidics system for sequential delivery of reagents |
| US20100301398A1 (en) | 2009-05-29 | 2010-12-02 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
| US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
| US8691510B2 (en) | 2008-11-07 | 2014-04-08 | Sequenta, Inc. | Sequence analysis of complex amplicons |
| US8370079B2 (en) | 2008-11-20 | 2013-02-05 | Pacific Biosciences Of California, Inc. | Algorithms for sequence determination |
| DE102008061772A1 (de) | 2008-12-11 | 2010-06-17 | Febit Holding Gmbh | Verfahren zur Untersuchung von Nukleinsäure-Populationen |
| US10839940B2 (en) | 2008-12-24 | 2020-11-17 | New York University | Method, computer-accessible medium and systems for score-driven whole-genome shotgun sequence assemble |
| EP2394152B1 (en) | 2009-02-03 | 2019-05-01 | ANDE Corporation | Nucleic acid purification |
| US8352195B2 (en) | 2009-03-20 | 2013-01-08 | Siemens Corporation | Methods and systems for identifying PCR primers specific to one or more target genomes |
| EP2511843B1 (en) | 2009-04-29 | 2016-12-21 | Complete Genomics, Inc. | Method and system for calling variations in a sample polynucleotide sequence with respect to a reference polynucleotide sequence |
| US8673627B2 (en) | 2009-05-29 | 2014-03-18 | Life Technologies Corporation | Apparatus and methods for performing electrochemical reactions |
| US8574835B2 (en) | 2009-05-29 | 2013-11-05 | Life Technologies Corporation | Scaffolded nucleic acid polymer particles and methods of making and using |
| US9524369B2 (en) | 2009-06-15 | 2016-12-20 | Complete Genomics, Inc. | Processing and analysis of complex nucleic acid sequence data |
| WO2011050341A1 (en) | 2009-10-22 | 2011-04-28 | National Center For Genome Resources | Methods and systems for medical sequencing analysis |
| JP2011091775A (ja) | 2009-10-26 | 2011-05-06 | Toshiba Corp | 固体撮像装置 |
| PH12012501439A1 (en) | 2010-01-14 | 2018-09-28 | Fluor Tech Corp | 3d plant modeling systems and methods |
| WO2011103236A2 (en) | 2010-02-18 | 2011-08-25 | The Johns Hopkins University | Personalized tumor biomarkers |
| US9165109B2 (en) | 2010-02-24 | 2015-10-20 | Pacific Biosciences Of California, Inc. | Sequence assembly and consensus sequence determination |
| US20110257889A1 (en) | 2010-02-24 | 2011-10-20 | Pacific Biosciences Of California, Inc. | Sequence assembly and consensus sequence determination |
| WO2011139797A2 (en) | 2010-04-27 | 2011-11-10 | Spiral Genetics Inc. | Method and system for analysis and error correction of biological sequences and inference of relationship for multiple samples |
| US20120030566A1 (en) * | 2010-07-28 | 2012-02-02 | Victor B Michael | System with touch-based selection of data items |
| WO2012034030A1 (en) | 2010-09-09 | 2012-03-15 | Omicia, Inc. | Variant annotation, analysis and selection tool |
| WO2012040387A1 (en) | 2010-09-24 | 2012-03-29 | The Board Of Trustees Of The Leland Stanford Junior University | Direct capture, amplification and sequencing of target dna using immobilized primers |
| EP2652135A1 (en) | 2010-12-17 | 2013-10-23 | Université Pierre et Marie Curie (Paris 6) | The abcg1 gene as a marker and a target gene for treating obesity |
| CA2823815A1 (en) | 2011-01-14 | 2012-07-19 | Keygene N.V. | Paired end random sequence based genotyping |
| CN111192634A (zh) | 2011-01-19 | 2020-05-22 | 皇家飞利浦电子股份有限公司 | 用于处理基因组数据的方法 |
| US20120239706A1 (en) | 2011-03-18 | 2012-09-20 | Los Alamos National Security, Llc | Computer-facilitated parallel information alignment and analysis |
| CN103843001B (zh) | 2011-04-14 | 2017-06-09 | 考利达基因组股份有限公司 | 复杂核酸序列数据的处理和分析 |
| US20130059738A1 (en) | 2011-04-28 | 2013-03-07 | Life Technologies Corporation | Methods and compositions for multiplex pcr |
| TW201243117A (en) | 2011-04-28 | 2012-11-01 | Hsueh-Ting Chu | Method and system of assembling DNA reads with paired-end sequencing |
| US9506167B2 (en) | 2011-07-29 | 2016-11-29 | Ginkgo Bioworks, Inc. | Methods and systems for cell state quantification |
| WO2013035904A1 (ko) | 2011-09-08 | 2013-03-14 | 한국과학기술정보연구원 | 생명 정보 분석 파이프라인 처리 시스템 및 방법 |
| KR101282798B1 (ko) | 2011-09-08 | 2013-07-04 | 한국과학기술정보연구원 | 생명 정보 분석 파이프라인 처리 시스템 및 방법 |
| US20130073214A1 (en) | 2011-09-20 | 2013-03-21 | Life Technologies Corporation | Systems and methods for identifying sequence variation |
| US8954475B2 (en) | 2011-11-10 | 2015-02-10 | Microsoft Technology Licensing, Llc | Deep cloning of objects using binary format |
| EP2608096B1 (en) | 2011-12-24 | 2020-08-05 | Tata Consultancy Services Ltd. | Compression of genomic data file |
| CN104204221B (zh) | 2011-12-31 | 2016-04-13 | 深圳华大基因科技服务有限公司 | 一种检验融合基因的方法及系统 |
| WO2013106737A1 (en) | 2012-01-13 | 2013-07-18 | Data2Bio | Genotyping by next-generation sequencing |
| US9047133B2 (en) | 2012-03-02 | 2015-06-02 | Vmware, Inc. | Single, logical, multi-tier application blueprint used for deployment and management of multiple physical applications in a cloud environment |
| US9552458B2 (en) | 2012-03-16 | 2017-01-24 | The Research Institute At Nationwide Children's Hospital | Comprehensive analysis pipeline for discovery of human genetic variation |
| US20130345066A1 (en) | 2012-05-09 | 2013-12-26 | Life Technologies Corporation | Systems and methods for identifying sequence variation |
| US20130324417A1 (en) | 2012-06-04 | 2013-12-05 | Good Start Genetics, Inc. | Determining the clinical significance of variant sequences |
| US9104656B2 (en) | 2012-07-03 | 2015-08-11 | International Business Machines Corporation | Using lexical analysis and parsing in genome research |
| US10777301B2 (en) | 2012-07-13 | 2020-09-15 | Pacific Biosciences For California, Inc. | Hierarchical genome assembly method using single long insert library |
| US20140066317A1 (en) | 2012-09-04 | 2014-03-06 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
| EP2918047A4 (en) | 2012-11-06 | 2016-04-20 | Hewlett Packard Development Co | IMPROVED GRAPHIDE RUNNING |
| US20140129201A1 (en) | 2012-11-07 | 2014-05-08 | Good Start Genetics, Inc. | Validation of genetic tests |
| CN105190656B (zh) | 2013-01-17 | 2018-01-16 | 佩索纳里斯公司 | 用于遗传分析的方法和系统 |
| WO2014116921A1 (en) | 2013-01-24 | 2014-07-31 | New York University | Utilization of pattern matching in stringomes |
| US10032195B2 (en) | 2013-03-13 | 2018-07-24 | Airline Tariff Publishing Company | System, method and computer program product for providing a fare analytic engine |
| US9087007B2 (en) | 2013-03-14 | 2015-07-21 | International Business Machines Corporation | Generating fault tolerant connectivity API |
| EP2973044A2 (en) | 2013-03-15 | 2016-01-20 | James Webber | Graph database devices and methods for partitioning graphs |
| US9189224B2 (en) | 2013-07-11 | 2015-11-17 | Oracle International Corporation | Forming an upgrade recommendation in a cloud computing environment |
| US9116866B2 (en) | 2013-08-21 | 2015-08-25 | Seven Bridges Genomics Inc. | Methods and systems for detecting sequence variants |
| US9898575B2 (en) | 2013-08-21 | 2018-02-20 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences |
| US20150066383A1 (en) | 2013-09-03 | 2015-03-05 | Seven Bridges Genomics Inc. | Collapsible modular genomic pipeline |
| EP3053073B1 (en) | 2013-09-30 | 2019-07-03 | Seven Bridges Genomics Inc. | Methods and system for detecting sequence variants |
| WO2015050919A1 (en) | 2013-10-01 | 2015-04-09 | Life Technologies Corporation | Systems and methods for detecting structural variants |
| CN106103736B (zh) | 2013-10-15 | 2020-03-03 | 瑞泽恩制药公司 | 高分辨率等位基因鉴定 |
| US10832797B2 (en) | 2013-10-18 | 2020-11-10 | Seven Bridges Genomics Inc. | Method and system for quantifying sequence alignment |
| AU2014337089B2 (en) | 2013-10-18 | 2019-08-08 | Seven Bridges Genomics Inc. | Methods and systems for genotyping genetic samples |
| US11049587B2 (en) | 2013-10-18 | 2021-06-29 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences in the presence of repeating elements |
| SG11201603039PA (en) | 2013-10-18 | 2016-05-30 | Seven Bridges Genomics Inc | Methods and systems for identifying disease-induced mutations |
| US9092402B2 (en) | 2013-10-21 | 2015-07-28 | Seven Bridges Genomics Inc. | Systems and methods for using paired-end data in directed acyclic structure |
| JP2017510871A (ja) | 2014-01-10 | 2017-04-13 | セブン ブリッジズ ジェノミクス インコーポレイテッド | リードマッピングにおける公知の対立遺伝子の使用のためのシステム及び方法 |
| US9817944B2 (en) | 2014-02-11 | 2017-11-14 | Seven Bridges Genomics Inc. | Systems and methods for analyzing sequence data |
| WO2016141294A1 (en) | 2015-03-05 | 2016-09-09 | Seven Bridges Genomics Inc. | Systems and methods for genomic pattern analysis |
| US20160364523A1 (en) | 2015-06-11 | 2016-12-15 | Seven Bridges Genomics Inc. | Systems and methods for identifying microorganisms |
| US10793895B2 (en) | 2015-08-24 | 2020-10-06 | Seven Bridges Genomics Inc. | Systems and methods for epigenetic analysis |
| US10584380B2 (en) | 2015-09-01 | 2020-03-10 | Seven Bridges Genomics Inc. | Systems and methods for mitochondrial analysis |
| US10724110B2 (en) | 2015-09-01 | 2020-07-28 | Seven Bridges Genomics Inc. | Systems and methods for analyzing viral nucleic acids |
| US20170199960A1 (en) | 2016-01-07 | 2017-07-13 | Seven Bridges Genomics Inc. | Systems and methods for adaptive local alignment for graph genomes |
| US10364468B2 (en) | 2016-01-13 | 2019-07-30 | Seven Bridges Genomics Inc. | Systems and methods for analyzing circulating tumor DNA |
| US20170199959A1 (en) | 2016-01-13 | 2017-07-13 | Seven Bridges Genomics Inc. | Genetic analysis systems and methods |
| US10262102B2 (en) | 2016-02-24 | 2019-04-16 | Seven Bridges Genomics Inc. | Systems and methods for genotyping with graph reference |
-
2013
- 2013-09-03 US US14/016,833 patent/US9898575B2/en active Active
-
2014
- 2014-08-21 CA CA2921645A patent/CA2921645C/en active Active
- 2014-08-21 KR KR1020167007423A patent/KR102371953B1/ko active Active
- 2014-08-21 JP JP2016536446A patent/JP6586088B2/ja active Active
- 2014-08-21 CN CN201480055430.1A patent/CN105637098B/zh active Active
- 2014-08-21 SG SG11201601124YA patent/SG11201601124YA/en unknown
- 2014-08-21 WO PCT/US2014/052065 patent/WO2015027050A1/en not_active Ceased
- 2014-08-21 EP EP20162191.9A patent/EP3702472B1/en active Active
- 2014-08-21 EP EP14837955.5A patent/EP3036344B1/en active Active
- 2014-08-21 AU AU2014308794A patent/AU2014308794B2/en active Active
-
2018
- 2018-02-20 US US15/899,713 patent/US11211146B2/en active Active
-
2019
- 2019-09-06 JP JP2019162661A patent/JP6902073B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20110295514A1 (en) * | 2010-05-13 | 2011-12-01 | Life Technologies Corporation | Computational Methods For Translating A Sequence Of Multi-Base Color Calls To A Sequence Of Bases |
| US8209130B1 (en) * | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
Non-Patent Citations (2)
| Title |
|---|
| C. Lee 외, "Multiple sequence alignment using partial order graphs", Bioinformatics, 18(3):452-64 (2002.03.)* * |
| N. Homer 외, "Improved variant discovery through local re-alignment of short-read next-generation sequencing data using SRMA", Genome Biology, 11:R99 (2010)* * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20190082854A (ko) * | 2016-11-16 | 2019-07-10 | 일루미나, 인코포레이티드 | 데이터 판독 재정렬을 시퀀싱하는 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN105637098B (zh) | 2021-04-30 |
| JP6586088B2 (ja) | 2019-10-02 |
| EP3702472A1 (en) | 2020-09-02 |
| EP3036344A4 (en) | 2017-04-26 |
| US20150057946A1 (en) | 2015-02-26 |
| AU2014308794A1 (en) | 2016-03-10 |
| US9898575B2 (en) | 2018-02-20 |
| JP2016536698A (ja) | 2016-11-24 |
| SG11201601124YA (en) | 2016-03-30 |
| EP3702472B1 (en) | 2021-08-11 |
| AU2014308794B2 (en) | 2020-05-07 |
| JP6902073B2 (ja) | 2021-07-14 |
| EP3036344A1 (en) | 2016-06-29 |
| JP2020042813A (ja) | 2020-03-19 |
| KR102371953B1 (ko) | 2022-03-08 |
| EP3036344B1 (en) | 2020-03-11 |
| CA2921645A1 (en) | 2015-02-26 |
| US11211146B2 (en) | 2021-12-28 |
| CA2921645C (en) | 2023-03-28 |
| CN105637098A (zh) | 2016-06-01 |
| WO2015027050A1 (en) | 2015-02-26 |
| US20180357367A1 (en) | 2018-12-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12106826B2 (en) | Methods and systems for detecting sequence variants | |
| US11211146B2 (en) | Methods and systems for aligning sequences | |
| US20210280272A1 (en) | Methods and systems for quantifying sequence alignment | |
| US20210398616A1 (en) | Methods and systems for aligning sequences in the presence of repeating elements | |
| KR102446941B1 (ko) | 서열 변이체 검출 방법 및 시스템 | |
| US10078724B2 (en) | Methods and systems for genotyping genetic samples | |
| KR20160068953A (ko) | 질환-유도된 돌연변이를 확인하기 위한 방법 및 시스템 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20160321 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PG1501 | Laying open of application | ||
| A201 | Request for examination | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20190821 Comment text: Request for Examination of Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210609 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20211216 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220303 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20220304 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20250305 Start annual number: 4 End annual number: 4 |