ES2882329T3 - Diagnóstico no invasivo por secuenciación de ADN fuera de las células 5-hidroximetilado - Google Patents
Diagnóstico no invasivo por secuenciación de ADN fuera de las células 5-hidroximetilado Download PDFInfo
- Publication number
- ES2882329T3 ES2882329T3 ES17779593T ES17779593T ES2882329T3 ES 2882329 T3 ES2882329 T3 ES 2882329T3 ES 17779593 T ES17779593 T ES 17779593T ES 17779593 T ES17779593 T ES 17779593T ES 2882329 T3 ES2882329 T3 ES 2882329T3
- Authority
- ES
- Spain
- Prior art keywords
- cancer
- dna
- cfdna
- sample
- 5hmc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims description 19
- 238000001712 DNA sequencing Methods 0.000 title description 3
- 238000000034 method Methods 0.000 claims abstract description 116
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 48
- 201000010099 disease Diseases 0.000 claims abstract description 46
- 239000008280 blood Substances 0.000 claims abstract description 43
- 238000012163 sequencing technique Methods 0.000 claims abstract description 43
- 210000004369 blood Anatomy 0.000 claims abstract description 41
- 238000007031 hydroxymethylation reaction Methods 0.000 claims abstract description 22
- 108020004414 DNA Proteins 0.000 claims description 180
- 206010028980 Neoplasm Diseases 0.000 claims description 91
- 108090000623 proteins and genes Proteins 0.000 claims description 79
- 150000007523 nucleic acids Chemical group 0.000 claims description 71
- 201000011510 cancer Diseases 0.000 claims description 66
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 48
- 238000011282 treatment Methods 0.000 claims description 27
- 229960002685 biotin Drugs 0.000 claims description 26
- 239000011616 biotin Substances 0.000 claims description 26
- 235000020958 biotin Nutrition 0.000 claims description 24
- 102000053602 DNA Human genes 0.000 claims description 23
- -1 AGPG2 Proteins 0.000 claims description 21
- 238000002372 labelling Methods 0.000 claims description 15
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 10
- 239000008103 glucose Substances 0.000 claims description 10
- 238000004393 prognosis Methods 0.000 claims description 8
- 102100039588 Claudin-15 Human genes 0.000 claims description 6
- 102100034128 Dual specificity phosphatase 28 Human genes 0.000 claims description 6
- 101000888605 Homo sapiens Claudin-15 Proteins 0.000 claims description 6
- 101001017423 Homo sapiens Dual specificity phosphatase 28 Proteins 0.000 claims description 6
- 101000820477 Homo sapiens Syntaxin-binding protein 3 Proteins 0.000 claims description 6
- 102100021679 Syntaxin-binding protein 3 Human genes 0.000 claims description 6
- 102100020762 Homeobox protein Hox-C5 Human genes 0.000 claims description 5
- 101001002966 Homo sapiens Homeobox protein Hox-C5 Proteins 0.000 claims description 5
- 101000619914 Homo sapiens LIM/homeobox protein Lhx5 Proteins 0.000 claims description 5
- 101000825475 Homo sapiens Protein shisa-2 homolog Proteins 0.000 claims description 5
- 102100022139 LIM/homeobox protein Lhx5 Human genes 0.000 claims description 5
- 102100022938 Protein shisa-2 homolog Human genes 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 5
- 102100022618 COMM domain-containing protein 6 Human genes 0.000 claims description 4
- 102100038521 Calcitonin gene-related peptide 2 Human genes 0.000 claims description 4
- 102100021507 Costars family protein ABRACL Human genes 0.000 claims description 4
- 102100036931 G-protein coupled receptor 26 Human genes 0.000 claims description 4
- 102100036702 Glucosamine-6-phosphate isomerase 2 Human genes 0.000 claims description 4
- 101000899991 Homo sapiens COMM domain-containing protein 6 Proteins 0.000 claims description 4
- 101000741431 Homo sapiens Calcitonin gene-related peptide 2 Proteins 0.000 claims description 4
- 101000677808 Homo sapiens Costars family protein ABRACL Proteins 0.000 claims description 4
- 101001071346 Homo sapiens G-protein coupled receptor 26 Proteins 0.000 claims description 4
- 101001072480 Homo sapiens Glucosamine-6-phosphate isomerase 2 Proteins 0.000 claims description 4
- 101001032342 Homo sapiens Interferon regulatory factor 7 Proteins 0.000 claims description 4
- 101001125322 Homo sapiens Na(+)/H(+) exchange regulatory cofactor NHE-RF2 Proteins 0.000 claims description 4
- 101000614335 Homo sapiens P2X purinoceptor 2 Proteins 0.000 claims description 4
- 101000806155 Homo sapiens Short-chain dehydrogenase/reductase 3 Proteins 0.000 claims description 4
- 101000874762 Homo sapiens Synaptotagmin-2 Proteins 0.000 claims description 4
- 101000645447 Homo sapiens Transmembrane protein 168 Proteins 0.000 claims description 4
- 101000851406 Homo sapiens Transmembrane protein 65 Proteins 0.000 claims description 4
- 101000915738 Homo sapiens Zinc finger Ran-binding domain-containing protein 2 Proteins 0.000 claims description 4
- 101000782464 Homo sapiens Zinc finger protein 444 Proteins 0.000 claims description 4
- 101000976455 Homo sapiens Zinc finger protein 800 Proteins 0.000 claims description 4
- 102100038070 Interferon regulatory factor 7 Human genes 0.000 claims description 4
- 102100032118 Mitochondrial outer membrane protein SLC25A46 Human genes 0.000 claims description 4
- 102100029448 Na(+)/H(+) exchange regulatory cofactor NHE-RF2 Human genes 0.000 claims description 4
- 102100040479 P2X purinoceptor 2 Human genes 0.000 claims description 4
- 108091006481 SLC25A46 Proteins 0.000 claims description 4
- 108091006484 SLC25A47 Proteins 0.000 claims description 4
- 102100037857 Short-chain dehydrogenase/reductase 3 Human genes 0.000 claims description 4
- 102100032112 Solute carrier family 25 member 47 Human genes 0.000 claims description 4
- 102100036151 Synaptotagmin-2 Human genes 0.000 claims description 4
- 102100025712 Transmembrane protein 168 Human genes 0.000 claims description 4
- 102100036854 Transmembrane protein 65 Human genes 0.000 claims description 4
- 102100028956 Zinc finger Ran-binding domain-containing protein 2 Human genes 0.000 claims description 4
- 102100035868 Zinc finger protein 444 Human genes 0.000 claims description 4
- 102100023643 Zinc finger protein 800 Human genes 0.000 claims description 4
- 102100027400 A disintegrin and metalloproteinase with thrombospondin motifs 4 Human genes 0.000 claims description 3
- 108091005664 ADAMTS4 Proteins 0.000 claims description 3
- 102100030672 ADP-ribosylation factor-like protein 6-interacting protein 6 Human genes 0.000 claims description 3
- 102100039075 Aldehyde dehydrogenase family 1 member A3 Human genes 0.000 claims description 3
- 102100027937 Aurora kinase A and ninein-interacting protein Human genes 0.000 claims description 3
- 102100035526 B melanoma antigen 1 Human genes 0.000 claims description 3
- 102100039511 Chymotrypsin-C Human genes 0.000 claims description 3
- 102100024946 Ciliogenesis-associated TTC17-interacting protein Human genes 0.000 claims description 3
- 102100024069 Coiled-coil and C2 domain-containing protein 1B Human genes 0.000 claims description 3
- 102100021967 Coiled-coil domain-containing protein 33 Human genes 0.000 claims description 3
- 102100027823 Complexin-2 Human genes 0.000 claims description 3
- 102100021899 Cyclin-L2 Human genes 0.000 claims description 3
- 102100033672 Deleted in azoospermia-like Human genes 0.000 claims description 3
- 102100033267 Early placenta insulin-like peptide Human genes 0.000 claims description 3
- 102100036445 Epsin-3 Human genes 0.000 claims description 3
- 102000015626 Glucagon-Like Peptide-2 Receptor Human genes 0.000 claims description 3
- 108010024044 Glucagon-Like Peptide-2 Receptor Proteins 0.000 claims description 3
- 102100028008 Heme oxygenase 2 Human genes 0.000 claims description 3
- 101000793563 Homo sapiens ADP-ribosylation factor-like protein 6-interacting protein 6 Proteins 0.000 claims description 3
- 101000959046 Homo sapiens Aldehyde dehydrogenase family 1 member A3 Proteins 0.000 claims description 3
- 101000697944 Homo sapiens Aurora kinase A and ninein-interacting protein Proteins 0.000 claims description 3
- 101000874316 Homo sapiens B melanoma antigen 1 Proteins 0.000 claims description 3
- 101000889306 Homo sapiens Chymotrypsin-C Proteins 0.000 claims description 3
- 101000761406 Homo sapiens Ciliogenesis-associated TTC17-interacting protein Proteins 0.000 claims description 3
- 101000910424 Homo sapiens Coiled-coil and C2 domain-containing protein 1B Proteins 0.000 claims description 3
- 101000897106 Homo sapiens Coiled-coil domain-containing protein 33 Proteins 0.000 claims description 3
- 101000859628 Homo sapiens Complexin-2 Proteins 0.000 claims description 3
- 101000897452 Homo sapiens Cyclin-L2 Proteins 0.000 claims description 3
- 101000871280 Homo sapiens Deleted in azoospermia-like Proteins 0.000 claims description 3
- 101001017415 Homo sapiens Dual specificity protein phosphatase 26 Proteins 0.000 claims description 3
- 101000998777 Homo sapiens Early placenta insulin-like peptide Proteins 0.000 claims description 3
- 101000851955 Homo sapiens Epsin-3 Proteins 0.000 claims description 3
- 101001079615 Homo sapiens Heme oxygenase 2 Proteins 0.000 claims description 3
- 101000600748 Homo sapiens Pancreatic progenitor cell differentiation and proliferation factor-like protein Proteins 0.000 claims description 3
- 101001130147 Homo sapiens Probable D-lactate dehydrogenase, mitochondrial Proteins 0.000 claims description 3
- 101000993813 Homo sapiens Protein inscuteable homolog Proteins 0.000 claims description 3
- 101000922030 Homo sapiens Putative uncharacterized protein encoded by LINC00158 Proteins 0.000 claims description 3
- 101000795815 Homo sapiens Tetratricopeptide repeat protein 24 Proteins 0.000 claims description 3
- 101000851425 Homo sapiens Thioredoxin-related transmembrane protein 2 Proteins 0.000 claims description 3
- 101000835726 Homo sapiens Transcription elongation factor A protein 3 Proteins 0.000 claims description 3
- 101000652326 Homo sapiens Transcription factor SOX-18 Proteins 0.000 claims description 3
- 101000629913 Homo sapiens Translocon-associated protein subunit beta Proteins 0.000 claims description 3
- 101000830781 Homo sapiens Tropomyosin alpha-4 chain Proteins 0.000 claims description 3
- 101001135572 Homo sapiens Tyrosine-protein phosphatase non-receptor type 2 Proteins 0.000 claims description 3
- 101000607645 Homo sapiens Ubiquilin-4 Proteins 0.000 claims description 3
- 101000854879 Homo sapiens V-type proton ATPase 116 kDa subunit a 2 Proteins 0.000 claims description 3
- 101000785715 Homo sapiens Zinc finger protein 284 Proteins 0.000 claims description 3
- 101000976599 Homo sapiens Zinc finger protein 423 Proteins 0.000 claims description 3
- 101000785577 Homo sapiens Zinc finger protein 850 Proteins 0.000 claims description 3
- 102100037264 Pancreatic progenitor cell differentiation and proliferation factor-like protein Human genes 0.000 claims description 3
- 102100031708 Probable D-lactate dehydrogenase, mitochondrial Human genes 0.000 claims description 3
- 102100031729 Protein inscuteable homolog Human genes 0.000 claims description 3
- 102100031094 Putative uncharacterized protein encoded by LINC00158 Human genes 0.000 claims description 3
- 102100031768 Tetratricopeptide repeat protein 24 Human genes 0.000 claims description 3
- 102100036927 Thioredoxin-related transmembrane protein 2 Human genes 0.000 claims description 3
- 102100026427 Transcription elongation factor A protein 3 Human genes 0.000 claims description 3
- 102100030249 Transcription factor SOX-18 Human genes 0.000 claims description 3
- 102100026229 Translocon-associated protein subunit beta Human genes 0.000 claims description 3
- 102100024944 Tropomyosin alpha-4 chain Human genes 0.000 claims description 3
- 102100033141 Tyrosine-protein phosphatase non-receptor type 2 Human genes 0.000 claims description 3
- 102100039932 Ubiquilin-4 Human genes 0.000 claims description 3
- 102100020745 V-type proton ATPase 116 kDa subunit a 2 Human genes 0.000 claims description 3
- 102100026415 Zinc finger protein 284 Human genes 0.000 claims description 3
- 102100023563 Zinc finger protein 423 Human genes 0.000 claims description 3
- 102100026589 Zinc finger protein 850 Human genes 0.000 claims description 3
- 102100031051 Cysteine and glycine-rich protein 1 Human genes 0.000 claims description 2
- 101000624524 Homo sapiens Leucine-tRNA ligase, cytoplasmic Proteins 0.000 claims description 2
- 101000855237 Homo sapiens Putative uncharacterized protein encoded by LINC00304 Proteins 0.000 claims description 2
- 102100023339 Leucine-tRNA ligase, cytoplasmic Human genes 0.000 claims description 2
- 102100026567 Putative uncharacterized protein encoded by LINC00304 Human genes 0.000 claims description 2
- 102100026974 Sorbitol dehydrogenase Human genes 0.000 claims description 2
- 101710184713 Sorbitol dehydrogenase Proteins 0.000 claims description 2
- 102100027188 Thyroid peroxidase Human genes 0.000 claims description 2
- 101710113649 Thyroid peroxidase Proteins 0.000 claims description 2
- 108091006374 cAMP receptor proteins Proteins 0.000 claims description 2
- 244000078127 Eleusine coracana Species 0.000 claims 1
- 235000013499 Eleusine coracana subsp coracana Nutrition 0.000 claims 1
- VBUBYMVULIMEHR-UHFFFAOYSA-N propa-1,2-diene;prop-1-yne Chemical compound CC#C.C=C=C VBUBYMVULIMEHR-UHFFFAOYSA-N 0.000 claims 1
- 235000002079 ragi Nutrition 0.000 claims 1
- 238000012284 sample analysis method Methods 0.000 claims 1
- 239000000523 sample Substances 0.000 description 105
- 210000004027 cell Anatomy 0.000 description 88
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 86
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 86
- 102000039446 nucleic acids Human genes 0.000 description 62
- 108020004707 nucleic acids Proteins 0.000 description 62
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 36
- 201000005202 lung cancer Diseases 0.000 description 36
- 208000020816 lung neoplasm Diseases 0.000 description 36
- 239000012634 fragment Substances 0.000 description 33
- 239000002773 nucleotide Substances 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 206010050017 Lung cancer metastatic Diseases 0.000 description 27
- 238000004458 analytical method Methods 0.000 description 27
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 23
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 23
- 201000002528 pancreatic cancer Diseases 0.000 description 23
- 208000008443 pancreatic carcinoma Diseases 0.000 description 23
- 239000000203 mixture Substances 0.000 description 22
- 210000001519 tissue Anatomy 0.000 description 18
- 239000011324 bead Substances 0.000 description 16
- 125000005647 linker group Chemical group 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 230000000295 complement effect Effects 0.000 description 15
- 206010006187 Breast cancer Diseases 0.000 description 14
- 208000026310 Breast neoplasm Diseases 0.000 description 14
- 101000576894 Homo sapiens Macrophage mannose receptor 1 Proteins 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 14
- 230000003321 amplification Effects 0.000 description 14
- 238000003199 nucleic acid amplification method Methods 0.000 description 14
- 238000009826 distribution Methods 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 13
- 230000000683 nonmetastatic effect Effects 0.000 description 13
- 102000040430 polynucleotide Human genes 0.000 description 13
- 108091033319 polynucleotide Proteins 0.000 description 13
- 239000002157 polynucleotide Substances 0.000 description 13
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 12
- 206010009944 Colon cancer Diseases 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 206010017758 gastric cancer Diseases 0.000 description 12
- MJEQLGCFPLHMNV-UHFFFAOYSA-N 4-amino-1-(hydroxymethyl)pyrimidin-2-one Chemical compound NC=1C=CN(CO)C(=O)N=1 MJEQLGCFPLHMNV-UHFFFAOYSA-N 0.000 description 11
- 208000005718 Stomach Neoplasms Diseases 0.000 description 11
- 238000006352 cycloaddition reaction Methods 0.000 description 11
- 208000005017 glioblastoma Diseases 0.000 description 11
- 201000011549 stomach cancer Diseases 0.000 description 11
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 9
- 108010090804 Streptavidin Proteins 0.000 description 9
- 238000007637 random forest analysis Methods 0.000 description 9
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 8
- 206010025323 Lymphomas Diseases 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- FTNHTYFMIOWXSI-UHFFFAOYSA-N 6-(hydroxymethylamino)-1h-pyrimidin-2-one Chemical group OCNC1=CC=NC(=O)N1 FTNHTYFMIOWXSI-UHFFFAOYSA-N 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 201000001441 melanoma Diseases 0.000 description 7
- 230000002980 postoperative effect Effects 0.000 description 7
- 230000000306 recurrent effect Effects 0.000 description 7
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 6
- 208000003200 Adenoma Diseases 0.000 description 6
- 206010035226 Plasma cell myeloma Diseases 0.000 description 6
- 208000006265 Renal cell carcinoma Diseases 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 208000003174 Brain Neoplasms Diseases 0.000 description 5
- 201000009030 Carcinoma Diseases 0.000 description 5
- 208000034578 Multiple myelomas Diseases 0.000 description 5
- PJKKQFAEFWCNAQ-UHFFFAOYSA-N N(4)-methylcytosine Chemical class CNC=1C=CNC(=O)N=1 PJKKQFAEFWCNAQ-UHFFFAOYSA-N 0.000 description 5
- 206010038389 Renal cancer Diseases 0.000 description 5
- 206010039491 Sarcoma Diseases 0.000 description 5
- 102000012005 alpha-2-HS-Glycoprotein Human genes 0.000 description 5
- 108010075843 alpha-2-HS-Glycoprotein Proteins 0.000 description 5
- 210000003169 central nervous system Anatomy 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 208000029340 primitive neuroectodermal tumor Diseases 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 206010001233 Adenoma benign Diseases 0.000 description 4
- 208000011691 Burkitt lymphomas Diseases 0.000 description 4
- 101001028025 Homo sapiens Mdm2-binding protein Proteins 0.000 description 4
- 101000633784 Homo sapiens SLAM family member 7 Proteins 0.000 description 4
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 4
- 102100037572 Mdm2-binding protein Human genes 0.000 description 4
- 208000000172 Medulloblastoma Diseases 0.000 description 4
- 102100029198 SLAM family member 7 Human genes 0.000 description 4
- 238000001790 Welch's t-test Methods 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 239000000090 biomarker Substances 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 206010012818 diffuse large B-cell lymphoma Diseases 0.000 description 4
- 230000001605 fetal effect Effects 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 201000007270 liver cancer Diseases 0.000 description 4
- 208000014018 liver neoplasm Diseases 0.000 description 4
- 201000005962 mycosis fungoides Diseases 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 208000000649 small cell carcinoma Diseases 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 208000024827 Alzheimer disease Diseases 0.000 description 3
- 102100040357 Angiomotin-like protein 1 Human genes 0.000 description 3
- 201000003076 Angiosarcoma Diseases 0.000 description 3
- 206010003571 Astrocytoma Diseases 0.000 description 3
- 201000008271 Atypical teratoid rhabdoid tumor Diseases 0.000 description 3
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 3
- 208000024172 Cardiovascular disease Diseases 0.000 description 3
- 102100023759 Cytosolic iron-sulfur assembly component 2A Human genes 0.000 description 3
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 206010014733 Endometrial cancer Diseases 0.000 description 3
- 206010014759 Endometrial neoplasm Diseases 0.000 description 3
- 208000006168 Ewing Sarcoma Diseases 0.000 description 3
- 102100036935 Ewing's tumor-associated antigen 1 Human genes 0.000 description 3
- 240000008168 Ficus benjamina Species 0.000 description 3
- 102100023301 Germ cell-less protein-like 2 Human genes 0.000 description 3
- 102100038147 Histone chaperone ASF1B Human genes 0.000 description 3
- 101000891169 Homo sapiens Angiomotin-like protein 1 Proteins 0.000 description 3
- 101000906806 Homo sapiens Cytosolic iron-sulfur assembly component 2A Proteins 0.000 description 3
- 101000851494 Homo sapiens Ewing's tumor-associated antigen 1 Proteins 0.000 description 3
- 101000830079 Homo sapiens Germ cell-less protein-like 2 Proteins 0.000 description 3
- 101000884473 Homo sapiens Histone chaperone ASF1B Proteins 0.000 description 3
- 101001091229 Homo sapiens Kinesin-like protein KIF16B Proteins 0.000 description 3
- 101000613575 Homo sapiens Paired box protein Pax-1 Proteins 0.000 description 3
- 101000890956 Homo sapiens Putative Dol-P-Glc:Glc(2)Man(9)GlcNAc(2)-PP-Dol alpha-1,2-glucosyltransferase Proteins 0.000 description 3
- 101000734290 Homo sapiens RING finger protein 223 Proteins 0.000 description 3
- 101000640782 Homo sapiens Spermatogenesis-associated protein 31E1 Proteins 0.000 description 3
- 101000649115 Homo sapiens Translocating chain-associated membrane protein 1 Proteins 0.000 description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 description 3
- 102100034894 Kinesin-like protein KIF16B Human genes 0.000 description 3
- 206010027476 Metastases Diseases 0.000 description 3
- 108030004080 Methylcytosine dioxygenases Proteins 0.000 description 3
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 3
- 102100022883 Nuclear receptor coactivator 3 Human genes 0.000 description 3
- 206010033128 Ovarian cancer Diseases 0.000 description 3
- 206010061535 Ovarian neoplasm Diseases 0.000 description 3
- 102100040851 Paired box protein Pax-1 Human genes 0.000 description 3
- 208000007641 Pinealoma Diseases 0.000 description 3
- 208000024777 Prion disease Diseases 0.000 description 3
- 206010060862 Prostate cancer Diseases 0.000 description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 3
- 102100040383 Putative Dol-P-Glc:Glc(2)Man(9)GlcNAc(2)-PP-Dol alpha-1,2-glucosyltransferase Human genes 0.000 description 3
- 102000001183 RAG-1 Human genes 0.000 description 3
- 108060006897 RAG1 Proteins 0.000 description 3
- 102100034811 RING finger protein 223 Human genes 0.000 description 3
- 238000003559 RNA-seq method Methods 0.000 description 3
- 201000000582 Retinoblastoma Diseases 0.000 description 3
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 3
- 206010041067 Small cell lung cancer Diseases 0.000 description 3
- 102100033784 Spermatogenesis-associated protein 31E1 Human genes 0.000 description 3
- 238000000692 Student's t-test Methods 0.000 description 3
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 3
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 3
- 208000009956 adenocarcinoma Diseases 0.000 description 3
- 150000001345 alkine derivatives Chemical class 0.000 description 3
- 125000000304 alkynyl group Chemical group 0.000 description 3
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 210000000601 blood cell Anatomy 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 208000029742 colonic neoplasm Diseases 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 206010012601 diabetes mellitus Diseases 0.000 description 3
- 208000016097 disease of metabolism Diseases 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 3
- 230000002496 gastric effect Effects 0.000 description 3
- 125000000623 heterocyclic group Chemical group 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 201000010982 kidney cancer Diseases 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 210000005228 liver tissue Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 208000030159 metabolic disease Diseases 0.000 description 3
- 230000009401 metastasis Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 201000006417 multiple sclerosis Diseases 0.000 description 3
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 201000008968 osteosarcoma Diseases 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 208000000587 small cell lung carcinoma Diseases 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 208000008732 thymoma Diseases 0.000 description 3
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- 102100024371 Arf-GAP domain and FG repeat-containing protein 2 Human genes 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 206010004146 Basal cell carcinoma Diseases 0.000 description 2
- 206010005949 Bone cancer Diseases 0.000 description 2
- 208000018084 Bone neoplasm Diseases 0.000 description 2
- 206010006143 Brain stem glioma Diseases 0.000 description 2
- 208000006547 Central Nervous System Lupus Vasculitis Diseases 0.000 description 2
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 2
- 208000005243 Chondrosarcoma Diseases 0.000 description 2
- 208000006332 Choriocarcinoma Diseases 0.000 description 2
- 206010009900 Colitis ulcerative Diseases 0.000 description 2
- 208000009798 Craniopharyngioma Diseases 0.000 description 2
- 208000011231 Crohn disease Diseases 0.000 description 2
- 101700026669 DACH1 Proteins 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 102100028735 Dachshund homolog 1 Human genes 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 206010058314 Dysplasia Diseases 0.000 description 2
- 102100039502 E3 ubiquitin-protein ligase RNF34 Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 201000008228 Ependymoblastoma Diseases 0.000 description 2
- 206010014967 Ependymoma Diseases 0.000 description 2
- 206010014968 Ependymoma malignant Diseases 0.000 description 2
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 2
- 201000008808 Fibrosarcoma Diseases 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 208000021309 Germ cell tumor Diseases 0.000 description 2
- 208000032612 Glial tumor Diseases 0.000 description 2
- 206010018338 Glioma Diseases 0.000 description 2
- 102000007446 Glucagon-Like Peptide-1 Receptor Human genes 0.000 description 2
- 108010086246 Glucagon-Like Peptide-1 Receptor Proteins 0.000 description 2
- 102100030943 Glutathione S-transferase P Human genes 0.000 description 2
- 208000001258 Hemangiosarcoma Diseases 0.000 description 2
- 208000002250 Hematologic Neoplasms Diseases 0.000 description 2
- 208000017604 Hodgkin disease Diseases 0.000 description 2
- 102100027817 Homeobox protein GBX-1 Human genes 0.000 description 2
- 101000833311 Homo sapiens Arf-GAP domain and FG repeat-containing protein 2 Proteins 0.000 description 2
- 101001103581 Homo sapiens E3 ubiquitin-protein ligase RNF34 Proteins 0.000 description 2
- 101000920711 Homo sapiens Eppin Proteins 0.000 description 2
- 101001010139 Homo sapiens Glutathione S-transferase P Proteins 0.000 description 2
- 101000859749 Homo sapiens Homeobox protein GBX-1 Proteins 0.000 description 2
- 101001027631 Homo sapiens Kinesin-like protein KIF20B Proteins 0.000 description 2
- 101000818546 Homo sapiens N-formyl peptide receptor 2 Proteins 0.000 description 2
- 101001094737 Homo sapiens POU domain, class 4, transcription factor 3 Proteins 0.000 description 2
- 101001116123 Homo sapiens Podocalyxin-like protein 2 Proteins 0.000 description 2
- 101001133624 Homo sapiens Polyadenylate-binding protein-interacting protein 1 Proteins 0.000 description 2
- 101001071363 Homo sapiens Probable G-protein coupled receptor 21 Proteins 0.000 description 2
- 101001080401 Homo sapiens Proteasome assembly chaperone 1 Proteins 0.000 description 2
- 101001098769 Homo sapiens Protein disulfide-isomerase A6 Proteins 0.000 description 2
- 101000796015 Homo sapiens Protein turtle homolog B Proteins 0.000 description 2
- 101000711577 Homo sapiens RING finger protein 122 Proteins 0.000 description 2
- 101001092196 Homo sapiens Ret finger protein-like 3 Proteins 0.000 description 2
- 101001111655 Homo sapiens Retinol dehydrogenase 11 Proteins 0.000 description 2
- 101000836954 Homo sapiens Sialic acid-binding Ig-like lectin 10 Proteins 0.000 description 2
- 101000716933 Homo sapiens Sterile alpha motif domain-containing protein 11 Proteins 0.000 description 2
- 101000626379 Homo sapiens Synaptotagmin-11 Proteins 0.000 description 2
- 101000855027 Homo sapiens WAP four-disulfide core domain protein 6 Proteins 0.000 description 2
- 101000818522 Homo sapiens fMet-Leu-Phe receptor Proteins 0.000 description 2
- 101000802094 Homo sapiens mRNA decay activator protein ZFP36L1 Proteins 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 2
- 208000007766 Kaposi sarcoma Diseases 0.000 description 2
- 102100037691 Kinesin-like protein KIF20B Human genes 0.000 description 2
- 108010080643 L-xylulose reductase Proteins 0.000 description 2
- 102100029137 L-xylulose reductase Human genes 0.000 description 2
- 208000006404 Large Granular Lymphocytic Leukemia Diseases 0.000 description 2
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 208000002030 Merkel cell carcinoma Diseases 0.000 description 2
- 208000003445 Mouth Neoplasms Diseases 0.000 description 2
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 2
- 201000007224 Myeloproliferative neoplasm Diseases 0.000 description 2
- 102100021126 N-formyl peptide receptor 2 Human genes 0.000 description 2
- 208000034179 Neoplasms, Glandular and Epithelial Diseases 0.000 description 2
- 206010029266 Neuroendocrine carcinoma of the skin Diseases 0.000 description 2
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102100035398 POU domain, class 4, transcription factor 3 Human genes 0.000 description 2
- 208000018737 Parkinson disease Diseases 0.000 description 2
- 208000007452 Plasmacytoma Diseases 0.000 description 2
- 102100024588 Podocalyxin-like protein 2 Human genes 0.000 description 2
- 102100034080 Polyadenylate-binding protein-interacting protein 1 Human genes 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 102100036934 Probable G-protein coupled receptor 21 Human genes 0.000 description 2
- 102100027583 Proteasome assembly chaperone 1 Human genes 0.000 description 2
- 102100037061 Protein disulfide-isomerase A6 Human genes 0.000 description 2
- 102100031337 Protein turtle homolog B Human genes 0.000 description 2
- 201000004681 Psoriasis Diseases 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 102100034117 RING finger protein 122 Human genes 0.000 description 2
- 102100035528 Ret finger protein-like 3 Human genes 0.000 description 2
- 102100023916 Retinol dehydrogenase 11 Human genes 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108091006779 SLC19A3 Proteins 0.000 description 2
- 206010061934 Salivary gland cancer Diseases 0.000 description 2
- 201000010208 Seminoma Diseases 0.000 description 2
- 208000000097 Sertoli-Leydig cell tumor Diseases 0.000 description 2
- 208000009359 Sezary Syndrome Diseases 0.000 description 2
- 102100027164 Sialic acid-binding Ig-like lectin 10 Human genes 0.000 description 2
- 208000000453 Skin Neoplasms Diseases 0.000 description 2
- 102100020927 Sterile alpha motif domain-containing protein 11 Human genes 0.000 description 2
- 102100024609 Synaptotagmin-11 Human genes 0.000 description 2
- 206010042971 T-cell lymphoma Diseases 0.000 description 2
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 206010043276 Teratoma Diseases 0.000 description 2
- 102100030103 Thiamine transporter 2 Human genes 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 201000006704 Ulcerative Colitis Diseases 0.000 description 2
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 102100020719 WAP four-disulfide core domain protein 6 Human genes 0.000 description 2
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 2
- 208000008383 Wilms tumor Diseases 0.000 description 2
- 150000001540 azides Chemical class 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 150000001615 biotins Chemical class 0.000 description 2
- 201000000053 blastoma Diseases 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000012650 click reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 208000017763 cutaneous neuroendocrine carcinoma Diseases 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000007847 digital PCR Methods 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 201000008184 embryoma Diseases 0.000 description 2
- 230000002124 endocrine Effects 0.000 description 2
- 201000004101 esophageal cancer Diseases 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 102100021145 fMet-Leu-Phe receptor Human genes 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 201000010175 gallbladder cancer Diseases 0.000 description 2
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 201000010536 head and neck cancer Diseases 0.000 description 2
- 208000014829 head and neck neoplasm Diseases 0.000 description 2
- 201000005787 hematologic cancer Diseases 0.000 description 2
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 206010024627 liposarcoma Diseases 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 102100034702 mRNA decay activator protein ZFP36L1 Human genes 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 201000009020 malignant peripheral nerve sheath tumor Diseases 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 201000008203 medulloepithelioma Diseases 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000009826 neoplastic cell growth Effects 0.000 description 2
- 208000004296 neuralgia Diseases 0.000 description 2
- 208000021722 neuropathic pain Diseases 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 210000004180 plasmocyte Anatomy 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 201000000849 skin cancer Diseases 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 206010041823 squamous cell carcinoma Diseases 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 201000002510 thyroid cancer Diseases 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 206010044412 transitional cell carcinoma Diseases 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- YABZBTUZPWUEKP-BTVCFUMJSA-N (2r,3s,4r,5r)-2,3,4,5,6-pentahydroxyhexanal;azide Chemical class [N-]=[N+]=[N-].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O YABZBTUZPWUEKP-BTVCFUMJSA-N 0.000 description 1
- XJOTXKZIRSHZQV-RXHOOSIZSA-N (3S)-3-amino-4-[[(2S,3R)-1-[[(2S)-1-[[(2S)-1-[(2S)-2-[[(2S,3S)-1-[[(1R,6R,12R,17R,20S,23S,26R,31R,34R,39R,42S,45S,48S,51S,59S)-51-(4-aminobutyl)-31-[[(2S)-6-amino-1-[[(1S,2R)-1-carboxy-2-hydroxypropyl]amino]-1-oxohexan-2-yl]carbamoyl]-20-benzyl-23-[(2S)-butan-2-yl]-45-(3-carbamimidamidopropyl)-48-(hydroxymethyl)-42-(1H-imidazol-4-ylmethyl)-59-(2-methylsulfanylethyl)-7,10,19,22,25,33,40,43,46,49,52,54,57,60,63,64-hexadecaoxo-3,4,14,15,28,29,36,37-octathia-8,11,18,21,24,32,41,44,47,50,53,55,58,61,62,65-hexadecazatetracyclo[32.19.8.26,17.212,39]pentahexacontan-26-yl]amino]-3-methyl-1-oxopentan-2-yl]carbamoyl]pyrrolidin-1-yl]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-imidazol-4-yl)-1-oxopropan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-4-oxobutanoic acid Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@H](Cc1ccccc1)NC(=O)[C@H](Cc1cnc[nH]1)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)[C@@H](C)O)C(=O)N[C@H]1CSSC[C@H](NC(=O)[C@@H]2CSSC[C@@H]3NC(=O)[C@@H]4CSSC[C@H](NC(=O)[C@H](Cc5ccccc5)NC(=O)[C@@H](NC1=O)[C@@H](C)CC)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](Cc1cnc[nH]1)NC3=O)C(=O)NCC(=O)N[C@@H](CCSC)C(=O)N2)C(=O)NCC(=O)N4)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XJOTXKZIRSHZQV-RXHOOSIZSA-N 0.000 description 1
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 1
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 101150029062 15 gene Proteins 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- WWVANQJRLPIHNS-BKPPORCPSA-N 2-iminobiotin Chemical compound N1C(=N)N[C@H]2[C@H](CCCCC(=O)O)SC[C@H]21 WWVANQJRLPIHNS-BKPPORCPSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- JKNCSZDPWAVQAI-ZKWXMUAHSA-N 5-[(2s,3s,4r)-3,4-diaminothiolan-2-yl]pentanoic acid Chemical compound N[C@H]1CS[C@@H](CCCCC(O)=O)[C@H]1N JKNCSZDPWAVQAI-ZKWXMUAHSA-N 0.000 description 1
- HOSGXJWQVBHGLT-UHFFFAOYSA-N 6-hydroxy-3,4-dihydro-1h-quinolin-2-one Chemical group N1C(=O)CCC2=CC(O)=CC=C21 HOSGXJWQVBHGLT-UHFFFAOYSA-N 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 208000002008 AIDS-Related Lymphoma Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 208000016683 Adult T-cell leukemia/lymphoma Diseases 0.000 description 1
- 208000037540 Alveolar soft tissue sarcoma Diseases 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 206010073478 Anaplastic large-cell lymphoma Diseases 0.000 description 1
- 206010002412 Angiocentric lymphomas Diseases 0.000 description 1
- 206010002556 Ankylosing Spondylitis Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 206010073360 Appendix cancer Diseases 0.000 description 1
- 208000017925 Askin tumor Diseases 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 208000004300 Atrophic Gastritis Diseases 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 206010003827 Autoimmune hepatitis Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 208000003950 B-cell lymphoma Diseases 0.000 description 1
- 208000032568 B-cell prolymphocytic leukaemia Diseases 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 208000023514 Barrett esophagus Diseases 0.000 description 1
- 208000023665 Barrett oesophagus Diseases 0.000 description 1
- 208000005440 Basal Cell Neoplasms Diseases 0.000 description 1
- 206010004453 Benign salivary gland neoplasm Diseases 0.000 description 1
- 206010004593 Bile duct cancer Diseases 0.000 description 1
- 208000020925 Bipolar disease Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 208000006274 Brain Stem Neoplasms Diseases 0.000 description 1
- 206010006417 Bronchial carcinoma Diseases 0.000 description 1
- 208000023611 Burkitt leukaemia Diseases 0.000 description 1
- 208000016778 CD4+/CD56+ hematodermic neoplasm Diseases 0.000 description 1
- 201000002829 CREST Syndrome Diseases 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010007275 Carcinoid tumour Diseases 0.000 description 1
- 206010007277 Carcinoid tumour of the appendix Diseases 0.000 description 1
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 208000037138 Central nervous system embryonal tumor Diseases 0.000 description 1
- 206010008263 Cervical dysplasia Diseases 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 206010008609 Cholangitis sclerosing Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 206010008874 Chronic Fatigue Syndrome Diseases 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 208000030808 Clear cell renal carcinoma Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 208000020406 Creutzfeldt Jacob disease Diseases 0.000 description 1
- 208000003407 Creutzfeldt-Jakob Syndrome Diseases 0.000 description 1
- 208000010859 Creutzfeldt-Jakob disease Diseases 0.000 description 1
- 201000005171 Cystadenoma Diseases 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108010033065 DNA beta-glucosyltransferase Proteins 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 1
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 1
- 208000008334 Dermatofibrosarcoma Diseases 0.000 description 1
- 206010057070 Dermatofibrosarcoma protuberans Diseases 0.000 description 1
- 206010059352 Desmoid tumour Diseases 0.000 description 1
- 208000008743 Desmoplastic Small Round Cell Tumor Diseases 0.000 description 1
- 206010064581 Desmoplastic small round cell tumour Diseases 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 208000007033 Dysgerminoma Diseases 0.000 description 1
- 208000000471 Dysplastic Nevus Syndrome Diseases 0.000 description 1
- 206010062805 Dysplastic naevus Diseases 0.000 description 1
- 201000009051 Embryonal Carcinoma Diseases 0.000 description 1
- 201000005231 Epithelioid sarcoma Diseases 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 208000003021 Erythroplasia Diseases 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 208000017259 Extragonadal germ cell tumor Diseases 0.000 description 1
- 208000016937 Extranodal nasal NK/T cell lymphoma Diseases 0.000 description 1
- 201000003364 Extraskeletal myxoid chondrosarcoma Diseases 0.000 description 1
- 206010015848 Extraskeletal osteosarcomas Diseases 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 208000001640 Fibromyalgia Diseases 0.000 description 1
- 201000011240 Frontotemporal dementia Diseases 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 208000036495 Gastritis atrophic Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 208000000527 Germinoma Diseases 0.000 description 1
- 208000003736 Gerstmann-Straussler-Scheinker Disease Diseases 0.000 description 1
- 206010072075 Gerstmann-Straussler-Scheinker syndrome Diseases 0.000 description 1
- 201000005618 Glomus Tumor Diseases 0.000 description 1
- 206010018381 Glomus tumour Diseases 0.000 description 1
- 206010018404 Glucagonoma Diseases 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 208000005234 Granulosa Cell Tumor Diseases 0.000 description 1
- 208000003807 Graves Disease Diseases 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000006050 Hemangiopericytoma Diseases 0.000 description 1
- 206010019799 Hepatitis viral Diseases 0.000 description 1
- 208000017605 Hodgkin disease nodular sclerosis Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000603399 Homo sapiens Neuronal PAS domain-containing protein 4 Proteins 0.000 description 1
- 101000962469 Homo sapiens Transcription factor MafF Proteins 0.000 description 1
- 101000851376 Homo sapiens Tumor necrosis factor receptor superfamily member 8 Proteins 0.000 description 1
- 101000775702 Homo sapiens V-type proton ATPase subunit C 2 Proteins 0.000 description 1
- 101000919269 Homo sapiens cAMP-responsive element modulator Proteins 0.000 description 1
- 238000006736 Huisgen cycloaddition reaction Methods 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010021042 Hypopharyngeal cancer Diseases 0.000 description 1
- 206010056305 Hypopharyngeal neoplasm Diseases 0.000 description 1
- 210000005131 Hürthle cell Anatomy 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 206010022971 Iron Deficiencies Diseases 0.000 description 1
- 208000009164 Islet Cell Adenoma Diseases 0.000 description 1
- 201000005099 Langerhans cell histiocytosis Diseases 0.000 description 1
- 206010023791 Large granular lymphocytosis Diseases 0.000 description 1
- 208000032004 Large-Cell Anaplastic Lymphoma Diseases 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 208000018142 Leiomyosarcoma Diseases 0.000 description 1
- 206010024218 Lentigo maligna Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 206010061523 Lip and/or oral cavity cancer Diseases 0.000 description 1
- 206010062038 Lip neoplasm Diseases 0.000 description 1
- 206010025312 Lymphoma AIDS related Diseases 0.000 description 1
- 208000030289 Lymphoproliferative disease Diseases 0.000 description 1
- 201000003791 MALT lymphoma Diseases 0.000 description 1
- 208000035771 Malignant Sertoli-Leydig cell tumor of the ovary Diseases 0.000 description 1
- 208000030070 Malignant epithelial tumor of ovary Diseases 0.000 description 1
- 206010073059 Malignant neoplasm of unknown primary site Diseases 0.000 description 1
- 208000032271 Malignant tumor of penis Diseases 0.000 description 1
- 208000025205 Mantle-Cell Lymphoma Diseases 0.000 description 1
- 208000037196 Medullary thyroid carcinoma Diseases 0.000 description 1
- 206010027145 Melanocytic naevus Diseases 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- 206010027260 Meningitis viral Diseases 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- RJQXTJLFIWVMTO-TYNCELHUSA-N Methicillin Chemical compound COC1=CC=CC(OC)=C1C(=O)N[C@@H]1C(=O)N2[C@@H](C(O)=O)C(C)(C)S[C@@H]21 RJQXTJLFIWVMTO-TYNCELHUSA-N 0.000 description 1
- 206010028193 Multiple endocrine neoplasia syndromes Diseases 0.000 description 1
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 1
- 208000005927 Myosarcoma Diseases 0.000 description 1
- BAQMYDQNMFBZNA-UHFFFAOYSA-N N-biotinyl-L-lysine Natural products N1C(=O)NC2C(CCCCC(=O)NCCCCC(N)C(O)=O)SCC21 BAQMYDQNMFBZNA-UHFFFAOYSA-N 0.000 description 1
- 206010028729 Nasal cavity cancer Diseases 0.000 description 1
- 206010028767 Nasal sinus cancer Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 102100038877 Neuronal PAS domain-containing protein 4 Human genes 0.000 description 1
- 208000006964 Nevi and Melanomas Diseases 0.000 description 1
- 206010029461 Nodal marginal zone B-cell lymphomas Diseases 0.000 description 1
- 208000019569 Nodular lymphocyte predominant Hodgkin lymphoma Diseases 0.000 description 1
- 206010029488 Nodular melanoma Diseases 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 208000000160 Olfactory Esthesioneuroblastoma Diseases 0.000 description 1
- 206010048757 Oncocytoma Diseases 0.000 description 1
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 1
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 1
- 208000007571 Ovarian Epithelial Carcinoma Diseases 0.000 description 1
- 206010061328 Ovarian epithelial cancer Diseases 0.000 description 1
- 206010073261 Ovarian theca cell tumour Diseases 0.000 description 1
- 208000002063 Oxyphilic Adenoma Diseases 0.000 description 1
- 206010033701 Papillary thyroid cancer Diseases 0.000 description 1
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 1
- 208000003937 Paranasal Sinus Neoplasms Diseases 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 208000031481 Pathologic Constriction Diseases 0.000 description 1
- 208000029082 Pelvic Inflammatory Disease Diseases 0.000 description 1
- 206010061336 Pelvic neoplasm Diseases 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 208000027190 Peripheral T-cell lymphomas Diseases 0.000 description 1
- 206010073144 Peripheral primitive neuroectodermal tumour of soft tissue Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 208000002163 Phyllodes Tumor Diseases 0.000 description 1
- 206010071776 Phyllodes tumour Diseases 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 208000009077 Pigmented Nevus Diseases 0.000 description 1
- 206010050487 Pinealoblastoma Diseases 0.000 description 1
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 1
- 201000008199 Pleuropulmonary blastoma Diseases 0.000 description 1
- 208000037062 Polyps Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 208000023146 Pre-existing disease Diseases 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 208000007541 Preleukemia Diseases 0.000 description 1
- 208000006399 Premature Obstetric Labor Diseases 0.000 description 1
- 206010065857 Primary Effusion Lymphoma Diseases 0.000 description 1
- 206010036711 Primary mediastinal large B-cell lymphomas Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 208000037276 Primitive Peripheral Neuroectodermal Tumors Diseases 0.000 description 1
- 206010036832 Prolactinoma Diseases 0.000 description 1
- 208000035416 Prolymphocytic B-Cell Leukemia Diseases 0.000 description 1
- 208000033759 Prolymphocytic T-Cell Leukemia Diseases 0.000 description 1
- 108091030084 RNA-OUT Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 206010071141 Rasmussen encephalitis Diseases 0.000 description 1
- 208000004160 Rasmussen subacute encephalitis Diseases 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010063837 Reperfusion injury Diseases 0.000 description 1
- 208000025747 Rheumatic disease Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- 206010039796 Seborrhoeic keratosis Diseases 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 208000002669 Sex Cord-Gonadal Stromal Tumors Diseases 0.000 description 1
- 208000021388 Sezary disease Diseases 0.000 description 1
- 108091027568 Single-stranded nucleotide Proteins 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 208000031672 T-Cell Peripheral Lymphoma Diseases 0.000 description 1
- 201000008717 T-cell large granular lymphocyte leukemia Diseases 0.000 description 1
- 208000026651 T-cell prolymphocytic leukemia Diseases 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 201000000331 Testicular germ cell cancer Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 206010043515 Throat cancer Diseases 0.000 description 1
- 208000007536 Thrombosis Diseases 0.000 description 1
- 201000009365 Thymic carcinoma Diseases 0.000 description 1
- 102100039187 Transcription factor MafF Human genes 0.000 description 1
- 206010044407 Transitional cell cancer of the renal pelvis and ureter Diseases 0.000 description 1
- 208000030886 Traumatic Brain injury Diseases 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102100036857 Tumor necrosis factor receptor superfamily member 8 Human genes 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 208000023915 Ureteral Neoplasms Diseases 0.000 description 1
- 206010046392 Ureteric cancer Diseases 0.000 description 1
- 206010046431 Urethral cancer Diseases 0.000 description 1
- 206010046458 Urethral neoplasms Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000002813 Uterine Cervical Dysplasia Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 102100032185 V-type proton ATPase subunit C 2 Human genes 0.000 description 1
- 208000009311 VIPoma Diseases 0.000 description 1
- 206010047115 Vasculitis Diseases 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 206010047741 Vulval cancer Diseases 0.000 description 1
- 208000004354 Vulvar Neoplasms Diseases 0.000 description 1
- 208000021146 Warthin tumor Diseases 0.000 description 1
- 208000027207 Whipple disease Diseases 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 201000006083 Xeroderma Pigmentosum Diseases 0.000 description 1
- 210000002593 Y chromosome Anatomy 0.000 description 1
- 210000003815 abdominal wall Anatomy 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 206010000583 acral lentiginous melanoma Diseases 0.000 description 1
- 208000009621 actinic keratosis Diseases 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 208000002517 adenoid cystic carcinoma Diseases 0.000 description 1
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 1
- 201000006966 adult T-cell leukemia Diseases 0.000 description 1
- 208000015230 aggressive NK-cell leukemia Diseases 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 238000005904 alkaline hydrolysis reaction Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 208000036878 aneuploidy Diseases 0.000 description 1
- 231100001075 aneuploidy Toxicity 0.000 description 1
- 206010002449 angioimmunoblastic T-cell lymphoma Diseases 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 208000021780 appendiceal neoplasm Diseases 0.000 description 1
- 208000028442 appendix neuroendocrine tumor G1 Diseases 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- BAQMYDQNMFBZNA-MNXVOIDGSA-N biocytin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCC[C@H](N)C(O)=O)SC[C@@H]21 BAQMYDQNMFBZNA-MNXVOIDGSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- KCSKCIQYNAOBNQ-YBSFLMRUSA-N biotin sulfoxide Chemical compound N1C(=O)N[C@H]2CS(=O)[C@@H](CCCCC(=O)O)[C@H]21 KCSKCIQYNAOBNQ-YBSFLMRUSA-N 0.000 description 1
- 208000012172 borderline epithelial tumor of ovary Diseases 0.000 description 1
- 208000003362 bronchogenic carcinoma Diseases 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 102100029387 cAMP-responsive element modulator Human genes 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 208000025046 carcinoma of lip Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 208000011654 childhood malignant neoplasm Diseases 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 208000016644 chronic atrophic gastritis Diseases 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000007882 cirrhosis Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 208000013056 classic Hodgkin lymphoma Diseases 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- ZPWOOKQUDFIEIX-UHFFFAOYSA-N cyclooctyne Chemical group C1CCCC#CCC1 ZPWOOKQUDFIEIX-UHFFFAOYSA-N 0.000 description 1
- 208000012106 cystic neoplasm Diseases 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- LNHSQAOQVNHUGL-QRBHCBQLSA-N dbco-peg4-biotin Chemical compound C1C2=CC=CC=C2C#CC2=CC=CC=C2N1C(=O)CCNC(=O)CCOCCOCCOCCOCCNC(=O)CCCC[C@H]1[C@H]2NC(=O)N[C@H]2CS1 LNHSQAOQVNHUGL-QRBHCBQLSA-N 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 201000006827 desmoid tumor Diseases 0.000 description 1
- 229910052805 deuterium Inorganic materials 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 208000014616 embryonal neoplasm Diseases 0.000 description 1
- 206010014599 encephalitis Diseases 0.000 description 1
- 201000003914 endometrial carcinoma Diseases 0.000 description 1
- 208000037902 enteropathy Diseases 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 208000032099 esthesioneuroblastoma Diseases 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- IFQUWYZCAGRUJN-UHFFFAOYSA-N ethylenediaminediacetic acid Chemical compound OC(=O)CNCCNCC(O)=O IFQUWYZCAGRUJN-UHFFFAOYSA-N 0.000 description 1
- 201000008819 extrahepatic bile duct carcinoma Diseases 0.000 description 1
- 201000008815 extraosseous osteosarcoma Diseases 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 201000003444 follicular lymphoma Diseases 0.000 description 1
- 201000007487 gallbladder carcinoma Diseases 0.000 description 1
- 208000010749 gastric carcinoma Diseases 0.000 description 1
- 208000015419 gastrin-producing neuroendocrine tumor Diseases 0.000 description 1
- 201000000052 gastrinoma Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 201000003115 germ cell cancer Diseases 0.000 description 1
- 210000001280 germinal center Anatomy 0.000 description 1
- 201000007116 gestational trophoblastic neoplasm Diseases 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 150000002303 glucose derivatives Chemical class 0.000 description 1
- 208000003064 gonadoblastoma Diseases 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 201000000459 head and neck squamous cell carcinoma Diseases 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 208000025750 heavy chain disease Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 206010066957 hepatosplenic T-cell lymphoma Diseases 0.000 description 1
- 102000018511 hepcidin Human genes 0.000 description 1
- 108060003558 hepcidin Proteins 0.000 description 1
- 229940066919 hepcidin Drugs 0.000 description 1
- 208000010544 human prion disease Diseases 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 208000017819 hyperplastic polyp Diseases 0.000 description 1
- 208000013010 hypopharyngeal carcinoma Diseases 0.000 description 1
- 201000006866 hypopharynx cancer Diseases 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 206010022498 insulinoma Diseases 0.000 description 1
- 208000028774 intestinal disease Diseases 0.000 description 1
- 208000026876 intravascular large B-cell lymphoma Diseases 0.000 description 1
- 230000010438 iron metabolism Effects 0.000 description 1
- 208000028867 ischemia Diseases 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 208000022013 kidney Wilms tumor Diseases 0.000 description 1
- 201000005264 laryngeal carcinoma Diseases 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 208000029805 leather-bottle stomach Diseases 0.000 description 1
- 208000011080 lentigo maligna melanoma Diseases 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 208000002741 leukoplakia Diseases 0.000 description 1
- 206010024520 linitis plastica Diseases 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 201000006721 lip cancer Diseases 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 208000012804 lymphangiosarcoma Diseases 0.000 description 1
- 208000006116 lymphomatoid granulomatosis Diseases 0.000 description 1
- 208000007282 lymphomatoid papulosis Diseases 0.000 description 1
- 201000007919 lymphoplasmacytic lymphoma Diseases 0.000 description 1
- 208000025036 lymphosarcoma Diseases 0.000 description 1
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 208000020968 mature T-cell and NK-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 1
- 206010027191 meningioma Diseases 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 208000037970 metastatic squamous neck cancer Diseases 0.000 description 1
- 229960003085 meticillin Drugs 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 208000022669 mucinous neoplasm Diseases 0.000 description 1
- 206010051747 multiple endocrine neoplasia Diseases 0.000 description 1
- 201000002077 muscle cancer Diseases 0.000 description 1
- 208000029766 myalgic encephalomeyelitis/chronic fatigue syndrome Diseases 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 208000029974 neurofibrosarcoma Diseases 0.000 description 1
- 208000004649 neutrophil actin dysfunction Diseases 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 201000000032 nodular malignant melanoma Diseases 0.000 description 1
- 208000026878 nongerminomatous germ cell tumor Diseases 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 210000002747 omentum Anatomy 0.000 description 1
- 201000005443 oral cavity cancer Diseases 0.000 description 1
- 230000008816 organ damage Effects 0.000 description 1
- 201000006958 oropharynx cancer Diseases 0.000 description 1
- 208000012221 ovarian Sertoli-Leydig cell tumor Diseases 0.000 description 1
- 208000021284 ovarian germ cell tumor Diseases 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 208000021255 pancreatic insulinoma Diseases 0.000 description 1
- 208000022102 pancreatic neuroendocrine neoplasm Diseases 0.000 description 1
- 208000021010 pancreatic neuroendocrine tumor Diseases 0.000 description 1
- 201000010198 papillary carcinoma Diseases 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 208000029211 papillomatosis Diseases 0.000 description 1
- 208000007312 paraganglioma Diseases 0.000 description 1
- 201000007052 paranasal sinus cancer Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000009984 peri-natal effect Effects 0.000 description 1
- 208000015754 perinatal disease Diseases 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 210000004303 peritoneum Anatomy 0.000 description 1
- 208000028591 pheochromocytoma Diseases 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 201000003113 pineoblastoma Diseases 0.000 description 1
- 208000010916 pituitary tumor Diseases 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 208000024246 polyembryoma Diseases 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 208000022131 polyp of large intestine Diseases 0.000 description 1
- 201000011461 pre-eclampsia Diseases 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 208000000814 primary cutaneous anaplastic large cell lymphoma Diseases 0.000 description 1
- 201000000742 primary sclerosing cholangitis Diseases 0.000 description 1
- 208000030153 prolactin-producing pituitary gland adenoma Diseases 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 201000010174 renal carcinoma Diseases 0.000 description 1
- 208000015347 renal cell adenocarcinoma Diseases 0.000 description 1
- 208000030859 renal pelvis/ureter urothelial carcinoma Diseases 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 201000007416 salivary gland adenoid cystic carcinoma Diseases 0.000 description 1
- 201000003804 salivary gland carcinoma Diseases 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 208000010157 sclerosing cholangitis Diseases 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 201000003385 seborrheic keratosis Diseases 0.000 description 1
- 208000016596 serous neoplasm Diseases 0.000 description 1
- 208000028467 sex cord-stromal tumor Diseases 0.000 description 1
- 201000008261 skin carcinoma Diseases 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 206010062261 spinal cord neoplasm Diseases 0.000 description 1
- 206010062113 splenic marginal zone lymphoma Diseases 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 208000017572 squamous cell neoplasm Diseases 0.000 description 1
- 208000037969 squamous neck cancer Diseases 0.000 description 1
- 230000036262 stenosis Effects 0.000 description 1
- 208000037804 stenosis Diseases 0.000 description 1
- 201000000498 stomach carcinoma Diseases 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 201000008205 supratentorial primitive neuroectodermal tumor Diseases 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000006379 syphilis Diseases 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 208000001644 thecoma Diseases 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 208000013818 thyroid gland medullary carcinoma Diseases 0.000 description 1
- 208000030045 thyroid gland papillary carcinoma Diseases 0.000 description 1
- 230000000451 tissue damage Effects 0.000 description 1
- 231100000827 tissue damage Toxicity 0.000 description 1
- 208000025358 tongue carcinoma Diseases 0.000 description 1
- 210000000515 tooth Anatomy 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 208000029387 trophoblastic neoplasm Diseases 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000037965 uterine sarcoma Diseases 0.000 description 1
- 206010046885 vaginal cancer Diseases 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- 201000001862 viral hepatitis Diseases 0.000 description 1
- 201000010044 viral meningitis Diseases 0.000 description 1
- 201000005102 vulva cancer Diseases 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2545/00—Reactions characterised by their quantitative nature
- C12Q2545/10—Reactions characterised by their quantitative nature the purpose being quantitative analysis
- C12Q2545/101—Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/185—Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/04—Methods of creating libraries, e.g. combinatorial synthesis using dynamic combinatorial chemistry techniques
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B70/00—Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pathology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Biomedical Technology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Un método de secuenciación de ADN fuera de las células hidroximetilado (ADNfc) para generar un patrón de hidroximetilación para identificar la presencia o ausencia de un fenotipo de enfermedad en un sujeto, en el que dicho ADNfc se origina a partir de una muestra de sangre del paciente, comprendiendo el método: añadir una etiqueta de afinidad sólo a moléculas de ADN hidroximetilado en una muestra de ADNfc obtenida de la muestra de sangre del paciente; enriquecer las moléculas de ADN que están etiquetadas con la etiqueta de afinidad al unirse a un soporte; amplificar el ADN enriquecido sin liberar el ADN del soporte; secuenciar las moléculas de ADN amplificadas para producir una pluralidad de lecturas de secuencia específicas para el paciente; y asignar una pluralidad de lecturas de secuencia específicas para el paciente a cada una de una pluralidad de loci diana para identificar un patrón de hidroximetilación en el ADNfc que indica la presencia o ausencia del fenotipo de la enfermedad en el paciente.
Description
DESCRIPCIÓN
Diagnóstico no invasivo por secuenciación de ADN fuera de las células 5-hidroximetilado
Antecedentes
Las modificaciones del ADN en forma de 5-metilcitosina (5mC) y la recientemente identificada 5-hidroximetilcitosina (5hmC) representan las dos principales marcas epigenéticas que se encuentran en el genoma de los mamíferos e impactan una amplia gama de procesos biológicos desde la regulación génica hasta el desarrollo normal. La detección de cambios aberrantes de 5mC y 5hmC en el ADN fuera de las células (ADNfc) puede representar un enfoque atractivo no invasivo para el diagnóstico del cáncer. ADNfc es el ADN circulante que se encuentra en nuestra sangre y se origina en diferentes tejidos y se ha utilizado para pruebas prenatales no invasivas, diagnóstico de trasplantes de órganos y detección de cáncer. En comparación con la investigación intensiva sobre el ADN de 5mC fuera de las células como biomarcador para el diagnóstico del cáncer, el ADN de 5hmC fuera de las células ha permanecido sin explotar, principalmente debido al bajo nivel de 5hmC en comparación con 5mC en el genoma humano (10 a 100 veces menos que 5mC) y la falta de un método de secuenciación de ADN de 5hmC sensible y de bajo consumo para trabajar con cantidades minúsculas de ADNfc (típicamente solo unos pocos nanogramos por ml de plasma) el documento WO2015/021282 A1 divulga un método para secuenciar el ADN de 5-hidroximetilcitosina (5hmC) extraído de una muestra celular. Hongchuan et al., "Circulating methylated DNA as biomarkers for cancer detection", Capítulo 6", INTECH (enero de 2013) divulga la presencia de 5-hidroximetilcitosina en el ADN fuera de las células, pero no proporciona un método para la secuenciación.
Resumen
En el presente documento, entre otras cosas, se proporciona un método de secuenciación de ADN hidroximetilado en una muestra de ADN circulante fuera de las células. En algunas realizaciones, el método comprende añadir una etiqueta de afinidad sólo a moléculas de ADN hidroximetiladas en una muestra de ADNfc, enriqueciendo las moléculas de ADN que están etiquetadas con la etiqueta de afinidad; y secuenciando las moléculas de ADN enriquecidas. En algunas realizaciones, el método comprende: añadir secuencias adaptadoras a los extremos del ADNfc; incubar el ADNfc ligado al adaptador con una beta-glucosiltransferasa de ADN y glucosa UDP modificada con un grupo quimioselectivo, marcando así covalentemente las moléculas de ADN hidroximetilado en el ADNfc con el grupo quimioselectivo; unir una fracción de biotina al ADNfc quimioselectivamente modificado mediante una reacción de cicloadición; enriquecer con moléculas de ADN biotiniladas al unirse a un soporte que se une a la biotina; amplificar el ADN enriquecido utilizando cebadores que se unen a los adaptadores; y secuenciar el ADN amplificado para producir una pluralidad de lecturas de secuencia.
Un método que comprende: (a) obtener una muestra que comprende ADN circulante fuera de las células, (b) enriquecer el ADN hidroximetilado en la muestra, y (c) cuantificar independientemente la cantidad de ácidos nucleicos en el ADN hidroximetilado enriquecido que mapea a cada uno de uno o más loci diana.
Entre otras cosas, las secuencias obtenidas del método pueden usarse como diagnóstico, teranosis o pronóstico para una variedad de enfermedades o afecciones, por ejemplo.
También se proporciona una variedad de composiciones, incluida una composición que comprende ADN circulante fuera de las células, en el que los residuos de hidroximetilcitosinas en el ADN se modifican para contener una etiqueta de captura.
Estas y otras características de las presentes enseñanzas se exponen en este documento.
Breve descripción de las Figuras
El experto en la materia comprenderá que los dibujos, que se describen a continuación, tienen únicamente fines ilustrativos. Los dibujos no pretenden limitar el alcance de las presentes enseñanzas de ninguna manera.
Figuras 1A-1C: secuenciación de 5hmC en ADNfc. Figura 1A: Procedimiento general de secuenciación de 5hmC fuera de las células. El ADNfc se liga con el adaptador Illumina y se marca con biotina en 5 hmC para su extracción con perlas de estreptavidina. La biblioteca final se completa mediante PCR directamente a partir de perlas de estreptavidina. Figura 1B: Porcentaje de lecturas mapeadas para enriquecer el ADN en las bibliotecas de secuenciación. Las barras de error indican la desviación estándar Figura 1C: Perfiles de metagenómica del log2 de las veces que cambia la relación de 5hmC fuera de las células con respecto a la entrada de ADNfc en genes clasificados de acuerdo con su expresión en la técnica de secuenciación de ARN fuera de las células.
Figuras 2A-2D: el cáncer de pulmón conduce a una pérdida progresiva del enriquecimiento de 5hmC en ADNfc. Figura 2A: Vista del navegador del genoma de la distribución de 5hmC fuera de las células en una región de 10 mb en el cromosoma 6. Se muestran las pistas superpuestas de cáncer de pulmón sano, no metastásico, cáncer de pulmón
metastásico y muestras de entrada de ADNfc en un gráfico de líneas. Figura 2B: Mapa de calor de 1159 genes diferenciales de cáncer de pulmón metastásico en muestras sanas, de cáncer de pulmón y la entrada de ADNfc no enriquecido. La agrupación jerárquica se realizó entre genes y muestras. Figura 2C: Diagrama de caja del número de hMR (normalizado a 1 millón de lecturas) identificadas en cada grupo. Figura 2D: Diagramas de caja de CCNY y PDIA6 5hmC FPKM en cáncer de pulmón y otras muestras de ADNfc. * P <0,05, ** P <0,01, *** P <0,001, **** P <1e-5, prueba t de Welch.
Figuras 3A-3E: 5 hmC fuera de las células para controlar la progresión y el tratamiento de1HCC. Figura 3A: Gráfico de tSNE de FPKM 5hmC de muestras sanas, HBV y HCC. Figura 3B: Mapa de calor de 1.006 genes diferenciales de HCC en muestras sanas, de VHB y HCC. La agrupación jerárquica se realizó entre genes y muestras. Figuras 3C-3D: Diagramas de caja de FPKM de 5hmC de AHSG (Figura 3C) y MTBP (Figura 3D) en VHB, HCC (preoperatorio), HCC postoperatorio, HCC recurrente y otras muestras de ADNfc. * P <0,05, ** P <1e-4, *** P <1e-5, prueba t de Welch. Figura 3E: Gráfico de tSNE de FPKM de 5hmC de muestras sanas, de HCC preoperatorio, HCC postoperatorio y de HCC recurrente.
Figuras 4A-4C: tipo de cáncer y predicción del estadio con 5hmC fuera de las células. Figura 4A: Gráfico de tSNE de FPKM de 5hmC en ADNfc de muestras de cáncer sanas y diversas. Figura 4B: Clasificación real y prevista por la validación cruzada de dejar uno fuera utilizando el algoritmo Mclust (MC) y Bosque Aleatorio (RF), con base en dos conjuntos de características (cuerpo del gen y DhMR). Figura 4C: Coeficiente kappa de Cohen para medir la concordancia entre clasificadores (GB para el cuerpo del gen). La barra de error indica el error estándar de la estimación kappa de Cohen.
Figuras 5A-5F: secuenciación de 5hmC fuera de las células mediante hMe-Seal modificado. Figura 5A: reacciones de hMe-Seal. 5hmC en el ADN se marca con una glucosa modificada con azida por pGT, que luego se une a un grupo biotina a través de la química clic. Figura 5B: Ensayos de enriquecimiento de un único conjunto de amplicones que contienen C, 5mC o 5hmC enriquecidos con ADNfc. El análisis en gel muestra que después de hMe-Seal, solo el amplicón que contiene 5hmC puede ser sometido a PCR a partir de las perlas de estreptavidina. Figura 5C: Diagrama de caja de la profundidad de secuenciación en todas las muestras fuera de las células. Figura 5D: Diagrama de caja de la tasa de mapa no duplicada única en todas las muestras fuera de las células. Figura 5E: Gráfico de MA de recuentos de lectura de 5hmC fuera de las células normalizados (lecturas/millón) en contenedores de 10 kb de todo el genoma entre duplicados técnicos. La línea azul horizontal M = 0 indica el mismo valor en dos muestras. Se grafica un ajuste más bajo (en rojo) subyacente a una posible tendencia en el sesgo relacionado con el valor medio. Figura 5F: Diagrama de Venn del solapamiento de las hMR entre las replicaciones técnicas de la secuenciación de 5hmC fuera de las células y una muestra combinada de ambas repeticiones.
Figuras 6A-6D: distribución en todo el genoma de 5hmC en ADNfc. Figura 6A: vista del navegador del genoma de la distribución de 5hmC en una región de 10 mb en el cromosoma 20. Muestra las pistas de ADNfc enriquecido y muestras de ADNg de sangre completa junto con la entrada de ADNfc no enriquecido. Figura 6B: presentación de gráfico circular de la distribución genómica general de hMR en ADNfc. Figura 6C: El enriquecimiento relativo de hMR a través de distintas regiones genómicas en ADNfc y ADNg de sangre completa. Figura 6D: Gráfico de tSNE de FPKM de 5hmC en ADNfc y ADNg de sangre completa de muestras sanas.
Figuras 7A-7E: Señales diferenciales de 5hmC entre ADNfc y ADNg de sangre completa. Figura 7A: Mapa de calor de 2.082 genes diferenciales entre ADNfc y ADNg en sangre. La agrupación jerárquica se realizó entre genes y muestras. Figura 7B: Diagrama de caja del nivel de expresión en sangre completa para genes enriquecidos en 5hmC de ADNfc y ADNg de sangre completa. El valor p se muestra en la parte superior. Figuras 7C y 7D: análisis GO de los genes enriquecidos con 5hmC específicos de sangre completa (Figura 7C) y específicos de ADNfc (Figura 7D), corte de valor p ajustado 0,001. Figura 7E: Vista del navegador del genoma de la distribución de 5hmC en los loci FPR1/FPR2 (superior) y GLP1R (inferior). Se muestran las pistas de superposición de ADNfc, ADNg de sangre total y entrada de ADNfc en el gráfico de líneas.
Figuras 8A-8D: Hidroximetiloma fuera de las células en cáncer de pulmón. Figura 8A: Gráfico de tSNE de FPKM de 5hmC de muestras sanas, de cáncer de pulmón no metastásico y cáncer de pulmón metastásico, junto con la entrada de ADNfc no enriquecido. Figura 8B: Perfiles metagenómicos de 5hmC fuera de las células en grupos sanos y de diversos tipos de cáncer, junto con la entrada de ADNfc no enriquecido. El área sombreada indica SEM. Figura 8C: Porcentaje de lecturas mapeadas para enriquecimiento de ADN en las bibliotecas de secuenciación de varios grupos. Las barras de error indican SD. Figura 8D: Vista del navegador del genoma de la distribución de 5hmC fuera de las células en los loci CREM/CCNY (izquierda) y ATP6V1C2/PDIA6 (derecha) en muestras sanas y de cáncer de pulmón. Se muestran las pistas superpuestas en el gráfico de líneas.
Figuras 9A-9E: hidroximetiloma fuera de las células en HCC. Figura 9A: Diagrama de caja del nivel de expresión en tejido hepático para genes enriquecidos y empobrecidos en 5hmC específicos de HCC. El valor p se muestra en la parte superior. Figura 9B: vista del navegador del genoma de la distribución de 5hmC fuera de las células en el locus AHSG en muestras sanas, de HBV y HCC. Se muestran las pistas superpuestas en el gráfico de líneas. Figura 9C: Expresión de AHSG en hígado y otros tejidos. Figura 9D: Vista del navegador del genoma de la distribución de 5hmC
fuera de las células en el locus MTBP en muestras sanas, de VHB y de HCC. Se muestran las pistas superpuestas en el gráfico de líneas.
Figura 9E: Cambios en la puntuación de HCC en 4 casos de seguimiento de HCC. El estado de la enfermedad se muestra en la parte inferior. La duración del tiempo en meses se muestra en la parte superior. Las líneas punteadas indican los valores medios de las puntuaciones de HCC en los grupos de HCC, VHB y sanos. Los triángulos indican tratamiento. La puntuación de HCC es una combinación lineal de 1006 genes diferenciales de HCC (Figura 3B) que separa mejor las muestras de HCC, de VHB y las sanas.
Figuras 10A-10E: hidroximetiloma fuera de las células en cáncer de páncreas. Figura 10A: Mapa de calor de 713 genes diferenciales de cáncer de páncreas en muestras sanas y de cáncer de páncreas. La agrupación jerárquica se realizó entre genes y muestras. Figuras 10B y 10C, diagramas de caja de FPKM de 5hmC de ZFP36L1, DCXR (Figura 10B) y GPR21, SLC19A3 (Figura 10C) en cáncer de páncreas y otras muestras de ADNfc. * P <0,001, ** P <1e-5, prueba t de Welch. Figura 10D y 10E: vista del navegador del genoma de la distribución de 5hmC fuera de las células en los loci de ZFP36L1, DCXR (Figura 10D) y GPR21, SLC19A3 (Figura 10E) en muestras sanas y de cáncer de páncreas. Se muestran las pistas superpuestas en el gráfico de líneas.
Figuras 11A-11D: hidroximetiloma fuera de las células en muestras de cáncer. Figura 11A: Gráfico de tSNE de FPKM de 5hmC de promotores (5 kb secuencia arriba de TSS) de muestras sanas y de diversos cánceres. Figura 11B: Gráfico de tSNE de FPKM de 5hmC de muestras de ADNfc sanas y de diversos cánceres junto con las muestras de ADNg de sangre completa. Figura 11C: Distribución por edades de individuos sanos y varios pacientes con cáncer. Figura 11D: Gráfico de tSNE de FPKM de 5hmC en ADNfc de muestras sanas y diversos cánceres (Figura 4A) coloreadas por lotes numerados de acuerdo con el tiempo del proceso.
Figuras 12A-12G: tipo de cáncer y predicción del estadio con 5hmC fuera de las células. Figuras 12A y 12B: Gráfico del criterio de información bayesiano (BIC) de Mclust entrenado con el conjunto de características del cuerpo de 90 genes (Figura 12A) y el conjunto de características de 17 DhMR (Figura 12B), lo que indica un valor BIC alto para separar cinco grupos cuando se usa el modelo EEI para Mclust. Figura 12C: Gráfico de reducción dimensional basado en Mclust de 4 dimensiones utilizando características de DhMR. La mitad inferior muestra el gráfico de dispersión y la mitad superior muestra el gráfico de densidad. Figuras 12D y 12E: Importancia variable (disminución media de Gini) para los 15 principales cuerpos de genes (Figura 12D) y DhMR (Figura 12E), en el modelo de entrenamiento forestal aleatorio. Figuras 12F y 12G muestran la importancia variable para los cuerpos de los genes y los DhMR, obtenidos mediante un método diferente.
Figura 13: Ejemplos de DhMR en el modelo de bosque aleatorio. Vista del navegador del genoma de la distribución de 5hmC fuera de las células en cuatro DhMR con alta importancia variable en el modelo de bosque aleatorio en varios grupos. Se muestran las pistas superpuestas en el gráfico de líneas. El área sombreada indica el DhMR.
Definiciones
A menos que se defina lo contrario en el presente documento, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que el que entiende comúnmente un experto en la técnica a la que pertenece esta invención.
Los intervalos numéricos incluyen los números que definen el intervalo. A menos que se indique lo contrario, los ácidos nucleicos se escriben de izquierda a derecha en orientación 5' a 3'; las secuencias de aminoácidos se escriben de izquierda a derecha en orientación amino a carboxilo, respectivamente.
Los títulos proporcionados en este documento no son limitaciones de los diversos aspectos o realizaciones de la invención. Por consiguiente, los términos definidos inmediatamente a continuación se definen más completamente por referencia a la especificación en su conjunto.
A menos que se defina de otro modo, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que el comúnmente entendido por un experto en la técnica a la que pertenece esta invención. Singleton, et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, segunda edición, John Wiley and Sons, Nueva York (1994), y Hale & Markham, THE HARPER COLLINS DICTIONARY OF BIOLOGY, Harper Perennial, NY (1991) le proporciona a un experto el significado general de muchos de los términos usados en este documento. Aún así, algunos términos se definen a continuación en aras de la claridad y la facilidad de referencia.
El término "muestra" como se usa en este documento se refiere a un material o mezcla de materiales, típicamente, aunque no necesariamente, en forma líquida, que contiene uno o más analitos de interés.
El término "muestra de ácido nucleico", como se usa en este documento, indica una muestra que contiene ácidos nucleicos. Las muestras de ácido nucleico utilizadas en este documento pueden ser complejas porque contienen múltiples moléculas diferentes que contienen secuencias. El ADN genómico de un mamífero (por ejemplo, un ratón o un ser humano) son tipos de muestras complejas. Las muestras complejas pueden tener más de 104, 105, 106 o 107
moléculas de ácido nucleico diferentes. Una diana de ADN puede originarse a partir de cualquier fuente, tal como ADN genómico o un constructo de ADN artificial. Cualquier muestra que contenga ácido nucleico, por ejemplo, ADN genómico elaborado a partir de células de cultivo de tejidos o una muestra de tejido, puede emplearse en este documento. Se puede preparar una muestra de ácido nucleico a partir de cualquier fuente adecuada, incluida una muestra de diente, hueso, cabello o hueso, etc.
El término "nucleótido" pretende incluir aquellas fracciones que contienen no sólo las bases de purina y pirimidina conocidas, sino también otras bases heterocíclicas que han sido modificadas. Tales modificaciones incluyen purinas o pirimidinas metiladas, purinas o pirimidinas aciladas, ribosas alquiladas u otros heterociclos. Además, el término "nucleótido" incluye aquellas fracciones que contienen etiquetas de hapteno o fluorescentes y pueden contener no sólo azúcares de ribosa y desoxirribosa convencionales, sino también otros azúcares. Los nucleósidos o nucleótidos modificados también incluyen modificaciones en la fracción de azúcar, por ejemplo, en el que uno o más de los grupos hidroxilo se reemplazan con átomos de halógeno o grupos alifáticos, o se funcionalizan como éteres, aminas o similares.
El término "ácido nucleico" y "polinucleótido" se usan indistintamente en el presente documento para describir un polímero de cualquier longitud, por ejemplo, más de aproximadamente 2 bases, más de aproximadamente 10 bases, más de aproximadamente 100 bases, más de aproximadamente 500 bases, más de 1000 bases, hasta aproximadamente 10.000 o más bases compuestas de nucleótidos, por ejemplo, desoxirribonucleótidos o ribonucleótidos, y pueden producirse enzimáticamente o sintéticamente (por ejemplo, PNA como se describe en la patente de los Estados Unidos 5.948.902 y las referencias citadas allí) que pueden hibridar con ácidos nucleicos de origen natural de una manera específica de la secuencia análoga a la de dos ácidos nucleicos de origen natural, por ejemplo, puede participar en interacciones de emparejamiento de bases de Watson-Crick. Los nucleótidos de origen natural incluyen guanina, citosina, adenina y timina (G, C, A y T, respectivamente). El ADN y el ARN tienen una cadena principal de azúcar desoxirribosa y ribosa, respectivamente, mientras que la cadena principal de PNA está compuesta por unidades repetidas de N-(2-aminoetil)-glicina unidas por enlaces peptídicos. En el PNA, varias bases de purina y pirimidina están unidas a la cadena principal mediante enlaces metiléncarbonilo. Un ácido nucleico bloqueado (LNA), a menudo denominado ARN inaccesible, es un nucleótido de ARN modificado. La fracción de ribosa de un nucleótido de LNA se modifica con un puente adicional que conecta el oxígeno 2' y el carbono 4'. El puente "bloquea" la ribosa en la conformación 3'-endo (norte), que a menudo se encuentra en los dúplex en forma de A. Los nucleótidos de LNA se pueden mezclar con residuos de ADN o ARN en el oligonucleótido cuando se desee. El término "ácido nucleico no estructurado" o "UNA" es un ácido nucleico que contiene nucleótidos no naturales que se unen entre sí con una estabilidad reducida. Por ejemplo, un ácido nucleico no estructurado puede contener un residuo G' y un residuo C', en el que estos residuos corresponden a formas no naturales, es decir, análogos de G y C que se emparejan entre sí con estabilidad reducida, pero retienen una capacidad para emparejar sus bases con residuos C y G de origen natural, respectivamente. El ácido nucleico no estructurado se describe en el documento US20050233340. También se incluyen en esta definición los ZNA, es decir, ácidos nucleicos zip.
El término "oligonucleótido" como se usa en este documento denota un multímero de nucleótido monocatenario de aproximadamente 2 a 200 nucleótidos, hasta 500 nucleótidos de longitud. Los oligonucleótidos pueden ser sintéticos o pueden prepararse enzimáticamente y, en algunas realizaciones, tienen una longitud de 30 a 150 nucleótidos. Los oligonucleótidos pueden contener monómeros de ribonucleótidos (es decir, pueden ser oligorribonucleótidos) y/o monómeros de desoxirribonucleótidos. Un oligonucleótido puede tener de 10 a 20, 21 a 30, 31 a 40, 41 a 50, 51 a 60, 61 a 70, 71 a 80, 80 a 100, 100 a 150 o 150 a 200 nucleótidos de longitud, por ejemplo.
El término "hibridación" se refiere al proceso mediante el cual una cadena de ácido nucleico se une a una cadena complementaria a través del emparejamiento de bases como se conoce en la técnica. Se considera que un ácido nucleico es "selectivamente hibridable" con una secuencia de ácido nucleico de referencia si las dos secuencias se hibridan específicamente entre sí en condiciones de hibridación y lavado de moderada a alta rigurosidad. Se conocen condiciones de hibridación moderadas y de alta rigurosidad (véase, por ejemplo, Ausubel, et al., Short Protocols in Molecular Biology, 3a ed., Wiley & Sons 1995 y Sambrook et al., Molecular Cloning: A Laboratory Manual, Tercera Edición, 2001 Cold Spring Harbor, Nueva York). Un ejemplo de condiciones de alta rigurosidad incluye la hibridación a aproximadamente 42 °C en formamida al 50%, SSC 5X, solución de Denhardt 5X, SDS al 0,5% y 100 pg/ml de ADN portador desnaturalizado seguido de lavado dos veces en SSC 2X y SDS al 0,5% temperatura ambiente y dos veces más en SSC 0,1X y SDS al 0,5% a 42 °C.
"Cebador" significa un oligonucleótido, ya sea natural o sintético, que es capaz, al formar un dúplex con una plantilla polinucleotídica, de actuar como un punto de inicio de la síntesis de ácidos nucleicos y extenderse desde su extremo 3' a lo largo de la plantilla de modo que se forme un dúplex extendido. La secuencia de nucleótidos añadidos durante el proceso de extensión está determinada por la secuencia del polinucleótido plantilla. Por lo general, los cebadores se extienden mediante una ADN polimerasa. Los cebadores son generalmente de una longitud compatible con su uso en la síntesis de productos de extensión de cebadores, y suelen tener una longitud de entre 8 y 100 nucleótidos, tal como 10 a 75, 15 a 60, 15 a 40, 18 a 30, 20 a 40, 21 a 50, 22 a 45, 25 a 40, etc. Los cebadores típicos pueden estar en el intervalo de entre 10 y 50 nucleótidos de longitud, tal como 15-45, 18-40, 20-30, 21-25, etc., y cualquier longitud entre los intervalos indicados. En algunas realizaciones, los cebadores normalmente no son más de aproximadamente 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 o 70 nucleótidos de longitud.
El término "dúplex" o "doble", como se usa en el presente documento, describe dos polinucleótidos complementarios de bases emparejadas, es decir, hibridadas juntas.
Los términos "determinar", "medir", "evaluar", "evaluación", "ensayar" y "analizar" se usan indistintamente en el presente documento para referirse a cualquier forma de medición, e incluyen determinar si un elemento está presente o no. Estos términos incluyen determinaciones tanto cuantitativas como cualitativas. La evaluación puede ser relativa o absoluta. "Evaluar la presencia de" incluye determinar la cantidad de algo presente, así como determinar si está presente o ausente.
El término "usar" tiene su significado convencional y, como tal, significa emplear, por ejemplo, poner en servicio, un método o composición para lograr un fin. Por ejemplo, si se utiliza un programa para crear un archivo, se ejecuta un programa para crear un archivo, el archivo suele ser la salida del programa. En otro ejemplo, si se usa un archivo de ordenador, generalmente se accede a él, se lee y la información almacenada en el archivo se emplea para lograr un fin. De manera similar, si se usa un identificador único, por ejemplo, un código de barras, el identificador único generalmente se lee para identificar, por ejemplo, un objeto o archivo asociado con el identificador único.
El término "ligadura", como se usa en este documento, se refiere a la unión catalizada enzimáticamente del nucleótido terminal en el extremo 5' de una primera molécula de ADN al nucleótido terminal en el extremo 3' de una segunda molécula de ADN.
Una "pluralidad" contiene al menos 2 miembros. En ciertos casos, una pluralidad puede tener al menos 10, al menos 100, al menos 1.000, al menos 10.000, al menos 100.000, al menos 106, al menos 107, al menos 108 o al menos 109 o más miembros.
Si dos ácidos nucleicos son "complementarios", cada base de uno de los ácidos nucleicos empareja sus bases con los nucleótidos correspondientes en el otro ácido nucleico. No es necesario que dos ácidos nucleicos sean perfectamente complementarios para hibridar entre sí.
El término "separar", como se usa en este documento, se refiere a la separación física de dos elementos (por ejemplo, por tamaño o afinidad, etc.) así como a la degradación de un elemento, dejando el otro intacto.
El término "secuenciación", como se usa en este documento, se refiere a un método mediante el cual se obtiene la identidad de al menos 10 nucleótidos consecutivos (por ejemplo, la identidad de al menos 20, al menos 50, al menos 100 o al menos 200 o más nucleótidos consecutivos) de un polinucleótido.
Los términos "secuenciación de próxima generación" o "secuenciación de alto rendimiento", como se usan en este documento, se refieren a las llamadas plataformas de secuenciación por síntesis o secuenciación por ligación en paralelo empleadas actualmente por Illumina, Life Technologies, y Roche, etc. Los métodos de secuenciación de próxima generación también pueden incluir métodos de secuenciación de nanoporos tales como los comercializados por Oxford Nanopore Technologies, métodos basados en detección electrónica tales como la tecnología Ion Torrent comercializada por Life Technologies, o métodos basados en fluorescencia de molécula única tales como el comercializado por Pacific Biosciences.
El término "secuenciación de próxima generación" se refiere a las llamadas plataformas de secuenciación por síntesis o secuenciación por ligación en paralelo empleadas actualmente por Illumina, Life Technologies y Roche, etc. Los métodos de secuenciación de próxima generación también pueden incluir métodos de secuenciación de nanoporos o métodos basados en la detección electrónica, tales como la tecnología Ion Torrent comercializada por Life Technologies.
El término "adaptador" se refiere a un ácido nucleico que es ligable a ambas cadenas de una molécula de ADN de cadena doble. En una realización, un adaptador puede ser un adaptador de horquilla (es decir, una molécula que puede emparejar sus propias bases para formar una estructura que tiene un vástago bicatenario y un bucle, en los que los extremos 3' y 5' de la molécula se ligan a los extremos 5' y 3' de la molécula de ADN bicatenario, respectivamente). En otra realización, un adaptador puede ser un adaptador en Y. En otra realización, un adaptador puede estar compuesto por sí mismo de dos moléculas de oligonucleótidos distintas que están emparejadas entre sí. Como resultará evidente, un extremo ligable de un adaptador puede diseñarse para que sea compatible con los salientes hechos por escisión por una enzima de restricción, o puede tener extremos romos o una saliente T en 5'. El término "adaptador" se refiere a moléculas bicatenarias y monocatenarias. Un adaptador puede ser ADN o ARN, o una mezcla de los dos. Un adaptador que contiene ARN puede escindirse mediante tratamiento con RNasa o mediante hidrólisis alcalina. Un adaptador puede tener de 15 a 100 bases, por ejemplo, de 50 a 70 bases, aunque se prevén adaptadores fuera de este intervalo.
El término "ligado a adaptador', como se usa en este documento, se refiere a un ácido nucleico que se ha ligado a un adaptador. El adaptador se puede ligar a un extremo 5' y/o un extremo 3' de una molécula de ácido nucleico.
El término "adaptador asimétrico", como se usa en el presente documento, se refiere a un adaptador que, cuando se liga a ambos extremos de un fragmento de ácido nucleico bicatenario, conducirá a una cadena superior que contiene una secuencia de etiqueta 5' que no es la misma o complementaria a la secuencia de la etiqueta en el extremo 3' . Se describen ejemplos de adaptadores asimétricos en: las patentes de los Estados Unidos Nos. 5.712.126 y 6.372.434 y el documento WO/2009/032167. Un fragmento etiquetado asimétricamente puede amplificarse mediante dos cebadores: uno que se hibrida con una primera secuencia de etiqueta agregada al extremo 3' de una cadena, y otro que se hibrida con el complemento de una segunda secuencia de etiqueta agregada al extremo 5' de una cadena. Los adaptadores en Y y los adaptadores de horquilla (que se pueden escindir, después de la ligadura, para producir un "adaptador en Y") son ejemplos de adaptadores asimétricos.
El término "adaptador en Y" se refiere a un adaptador que contiene: una región bicatenaria y una región monocatenaria en las que las secuencias opuestas no son complementarias. El extremo de la región bicatenaria se puede unir a moléculas diana tales como fragmentos bicatenarios de ADN genómico, por ejemplo, mediante ligación o una reacción catalizada por transposasa. Cada cadena de un ADN bicatenario etiquetado con adaptador que se ha ligado a un adaptador en Y está etiquetada asimétricamente porque tiene la secuencia de una cadena del adaptador en Y en un extremo y la otra cadena del adaptador en Y en el otro extremo. La amplificación de moléculas de ácido nucleico que se han unido a adaptadores en Y en ambos extremos da como resultado un ácido nucleico etiquetado asimétricamente, es decir, un ácido nucleico que tiene un extremo 5' que contiene una secuencia de etiqueta y un extremo 3' que tiene otra secuencia de etiqueta.
El término "adaptador de horquilla" se refiere a un adaptador que tiene forma de horquilla. En una realización, después de la ligadura, el bucle de horquilla se puede escindir para producir cadenas que tienen etiquetas no complementarias en los extremos. En algunos casos, el bucle de un adaptador de horquilla puede contener un residuo de uracilo y el bucle se puede escindir utilizando glicosilasa para el uracilo de ADN y endonucleasa VIII, aunque se conocen otros métodos.
El término "muestra ligada al adaptador", como se usa en este documento, se refiere a una muestra que se ha ligado a un adaptador. Como se entenderá dadas las definiciones anteriores, una muestra que se ha ligado a un adaptador asimétrico contiene cadenas que tienen secuencias no complementarias en los extremos 5' y 3'.
Un "sitio de unión de oligonucleótidos" se refiere a un sitio con el que un oligonucleótido se hibrida en un polinucleótido diana. Si un oligonucleótido "proporciona" un sitio de unión para un cebador, entonces el cebador puede hibridar con ese oligonucleótido o su complemento.
El término "cadena", como se usa en este documento, se refiere a un ácido nucleico formado por nucleótidos unidos covalentemente entre sí por enlaces covalentes, por ejemplo, enlaces fosfodiéster. En una célula, el ADN existe habitualmente en forma de doble cadena y, como tal, tiene dos cadenas complementarias de ácido nucleico denominadas en el presente documento cadenas "superior" e "inferior". En ciertos casos, las cadenas complementarias de una región cromosómica pueden denominarse cadenas "más" y "menos", las cadenas "primera" y "segunda", las cadenas "codificantes" y "no codificantes", las cadenas de "Watson" y "Crick" o las cadenas "sentido" y "antisentido". La asignación de una cadena como cadena superior o inferior es arbitraria y no implica ninguna orientación, función o estructura particular. Las secuencias de nucleótidos de la primera cadena de varios ejemplos de regiones cromosómicas de mamíferos (por ejemplo, BAC, ensamblajes, cromosomas, etc.) son conocidas y pueden encontrarse, por ejemplo, en la base de datos del GenBank del NCBI.
El término "etiquetado", como se usa en el presente documento, se refiere a la adición de una etiqueta de secuencia (que contiene una secuencia de identificación) en una molécula de ácido nucleico. Puede añadirse una etiqueta de secuencia al extremo 5', al extremo 3' o ambos extremos de la molécula de ácido nucleico. Puede añadirse una etiqueta de secuencia a un fragmento ligando un adaptador al fragmento mediante, por ejemplo, ADN ligasa T4 u otra ligasa.
El término "código de barras molecular' abarca tanto las secuencias de identificación de la muestra como las secuencias de identificación de la molécula, como se describe a continuación. En algunas realizaciones, un código de barras molecular puede tener una longitud en el intervalo de 1 a 36 nucleótidos, por ejemplo, de 6 a 30 nucleótidos, o de 8 a 20 nucleótidos. En ciertos casos, la secuencia del identificador molecular puede corregir errores, lo que significa que incluso si hay un error (por ejemplo, si la secuencia del código de barras molecular está mal sintetizada, mal interpretada o distorsionada en virtud de las diversas etapas de procesamiento que conducen a la determinación de la secuencia del código de barras molecular), entonces el código aún se puede interpretar correctamente. Se pueden encontrar descripciones de ejemplos de secuencias de corrección de errores a lo largo de la bibliografía (por ejemplo, documentos US20100323348 y US20090105959). En algunas realizaciones, una secuencia de identificación puede ser de complejidad relativamente baja (por ejemplo, puede estar compuesta por una mezcla de 4 a 1024 secuencias diferentes), aunque en algunos casos se pueden usar secuencias de identificación de mayor complejidad.
El término "secuencia de identificación de muestra" e "índice de muestra" es una secuencia de nucleótidos que se adjunta a un polinucleótido diana, cuando la secuencia identifica la fuente del polinucleótido diana (es decir, la muestra de la cual se deriva el polinucleótido diana). En uso, cada muestra se etiqueta con una secuencia de identificación de
muestra diferente (por ejemplo, se agrega una secuencia a cada muestra, en la que las diferentes muestras se agregan a diferentes secuencias), y las muestras etiquetadas se agrupan. Después de secuenciar la muestra combinada, la secuencia del identificador de muestra se puede utilizar para identificar la fuente de las secuencias. Puede añadirse una secuencia de identificación de muestra al extremo 5' de un polinucleótido o al extremo 3' de un polinucleótido. En ciertos casos, parte de la secuencia del identificador de la muestra puede estar en el extremo 5' de un polinucleótido y el resto de la secuencia de identificación de la muestra puede estar en el extremo 3' del polinucleótido. Cuando los elementos del identificador de la muestra tienen una secuencia en cada extremo, juntas, las secuencias del identificador de la muestra 3' y 5' identifican la muestra. En muchos ejemplos, la secuencia de identificación de la muestra es solo un subconjunto de las bases que se unen a un oligonucleótido diana.
El término "secuencia de identificación de la molécula" es una secuencia de nucleótidos que puede unirse a los fragmentos de ácido nucleico de una muestra de manera que la secuencia de nucleótidos unida, sola o en combinación con otras características de los fragmentos, por ejemplo, sus puntos de ruptura de fragmentación, se pueden usar para distinguir entre las diferentes moléculas de fragmentos en la muestra o una porción de la misma. La complejidad de una población de secuencias de identificación de moléculas usadas en cualquier implementación puede variar dependiendo de una variedad de parámetros, por ejemplo, el número de fragmentos en una muestra y/o la cantidad de muestra que se usa en una etapa posterior. Por ejemplo, en ciertos casos, la secuencia de identificación de la molécula puede ser de baja complejidad (por ejemplo, puede estar compuesta por una mezcla de 8 a 1024 secuencias). En otros casos, la secuencia de identificación de la molécula puede ser de alta complejidad (por ejemplo, puede estar compuesta de 1025 a 1 M o más secuencias). En determinadas realizaciones, una población de secuencias de identificación de moléculas puede comprender una región de base degenerada (DBR) que comprende uno o más (por ejemplo, al menos 2, al menos 3, al menos 4, al menos 5, o 5 a 30 o más) nucleótidos seleccionados de R, Y, S, W, K, M, B, D, H, V, N (como se define por el código IUPAC), o una variante del mismo. Como se describe en el documento US8.741.606, una secuencia de identificación de molécula puede estar formada por secuencias que no son adyacentes. En algunas realizaciones, una población de secuencias de identificación de moléculas puede prepararse mezclando oligonucleótidos de una secuencia definida. En estas realizaciones, la secuencia de identificación de la molécula en cada uno de los oligonucleótidos puede corregir errores. En los métodos descritos en el presente documento, la secuencia de identificación de la molécula puede usarse para distinguir entre los diferentes fragmentos en una porción de una muestra inicial, en la que la porción se ha eliminado de la muestra inicial. Las secuencias de identificación de moléculas pueden usarse junto con otras características de los fragmentos (por ejemplo, las secuencias finales de los fragmentos, que definen los puntos de rompimiento) para distinguir entre los fragmentos.
Como se usa en el presente documento, el término "corresponde a", con referencia a una secuencia leída que corresponde a una cadena particular (por ejemplo, la parte superior o inferior) de un fragmento, se refiere a una secuencia leída derivada de esa cadena o un producto de amplificación de la misma.
El término "enlace covalente" se refiere a la producción de un enlace covalente entre dos moléculas separadas.
Como se usa en este documento, el término "ADN circulante fuera de las células" se refiere al ADN que está circulando en la sangre periférica de un paciente. Las moléculas de ADN en el ADN fuera de las células pueden tener un tamaño medio inferior a 1 kb (por ejemplo, en el intervalo de 50 pb a 500 pb, 80 pb a 400 pb o 100 - 1000 pb), aunque pueden estar presentes fragmentos que tienen un tamaño medio fuera de este intervalo. El ADN fuera de las células puede contener ADN tumoral circulante (ADNtc), es decir, ADN tumoral que circula libremente en la sangre de un paciente con cáncer o ADN fetal circulante (si el sujeto es una mujer embarazada). El ADNfc puede estar muy fragmentado y, en algunos casos, puede tener un tamaño de fragmento medio de aproximadamente 165-250 pb (Newman et al., Nat Med. 201420: 548-54). ADNfc se puede obtener centrifugando sangre completa para eliminar todas las células y luego aislando el ADN del plasma o suero restante. Dichos métodos son bien conocidos (véase, por ejemplo, Lo et al., Am J Hum Genet 1998; 62: 768-75). El ADN circulante fuera de las células es bicatenario, pero se puede convertir en monocatenario por desnaturalización.
Como se usa en este documento, el término "agregar secuencias adaptadoras" se refiere al acto de agregar una secuencia adaptadora al final de los fragmentos en una muestra. Esto se puede hacer rellenando los extremos de los fragmentos usando una polimerasa, agregando una cola A y luego ligando un adaptador que comprende un saliente T sobre los fragmentos con cola A.
Como se usa en el presente documento, el término "glucosa UDP modificada con un grupo quimioselectivo" se refiere a una glucosa UDP que se ha funcionalizado, particularmente en la posición 6-hidroxilo, para incluir un grupo que es capaz de participar en una reacción de cicloadición 1,3 (o "clic"). Dichos grupos incluyen grupos azido y alquinilo (por ejemplo, ciclooctino), aunque se conocen otros (Kolb et al., 2001; Speers y Cravatt, 2004; Sletten y Bertozzi, 2009). UDP-6-N3-Glu es un ejemplo de glucosa UDP modificada con un grupo quimioselectivo, aunque se conocen otros.
Como se usa en este documento, el término "fracción de biotina" se refiere a una etiqueta de afinidad que incluye biotina o un análogo de biotina tal como destiobiotina, oxibiotina, 2-iminobiotina, diaminobiotina, sulfóxido de biotina, biocitina, etc. Las fracciones de biotina se unen a estreptavidina con una afinidad de al menos 10' 8 M.
Como se usa en el presente documento, los términos "reacción de cidoadición" y "reacción clic" se describen indistintamente para referirse a una cidoadición 1,3 entre una azida y un alquino para formar un heterociclo de cinco miembros. En algunas realizaciones, el alquino se puede forzar (por ejemplo, en un anillo tal como ciclooctina) y la reacción de cicloadición se puede realizar en condiciones libres de cobre. La dibenzociclooctina (DBCO) y la difluorooctina (DIFO) son ejemplos de alquinos que pueden participar en una reacción de cicloadición sin cobre, aunque se conocen otros grupos. Véase, por ejemplo, Kolb et al., (Drug Discov Today, 2003, 8: 1128-113), Baskin et al., (Proc. Natl. Acad. Sci. 2007 104: 16793-16797) y Sletten et al., (Accounts of Chemical Research, 2011, 44: 666 676), para una revisión de esta química.
Como se usa en este documento, el término "soporte que se une a biotina" se refiere a un soporte (por ejemplo, perlas, que pueden ser magnéticas) que está unido a estreptavidina o avidina, o un equivalente funcional de las mismas.
El término "amplificar", como se usa en este documento, se refiere a generar una o más copias de un ácido nucleico diana, usando el ácido nucleico diana como molde.
El término "copias de fragmentos" se refiere al producto de amplificación, en el que una copia de un fragmento puede ser un complemento inverso de una cadena de un fragmento, o tener la misma secuencia que una cadena de un fragmento.
Los términos "enriquecer" y "enriquecimiento" se refieren a una purificación parcial de analitos que tienen una determinada característica (por ejemplo, ácidos nucleicos que contienen hidroximetilcitosina) de analitos que no tienen la característica (por ejemplo, ácidos nucleicos que contienen hidroximetilcitosina). El enriquecimiento aumenta típicamente la concentración de los analitos que tienen la característica (por ejemplo, ácidos nucleicos que contienen hidroximetilcitosina) al menos 2 veces, al menos 5 veces o al menos 10 veces en relación con los analitos que no tienen la característica. Después del enriquecimiento, al menos el 10%, al menos el 20%, al menos el 50%, al menos el 80% o al menos el 90% de los analitos en una muestra pueden tener la característica utilizada para el enriquecimiento. Por ejemplo, al menos el 10%, al menos el 20%, al menos el 50%, al menos el 80% o al menos el 90% de las moléculas de ácido nucleico en una composición enriquecida pueden contener una cadena que tiene una o más hidroximetilcitosinas que se han modificado para contener una etiqueta de captura.
Pueden aparecer otras definiciones de términos a lo largo de la memoria descriptiva.
Descripción de ejemplos de realizaciones
En el presente documento se proporciona un método de secuenciación de ADN hidroximetilado fuera de las células. En algunas realizaciones, el método comprende añadir una etiqueta de afinidad sólo a moléculas de ADN hidroximetiladas en una muestra de ADNfc, enriqueciendo las moléculas de ADN que están etiquetadas con la etiqueta de afinidad; y secuenciando las moléculas de a Dn enriquecidas.
La Figura 1A muestra una implementación del método. En ciertas realizaciones y con referencia a la Figura 1A, el método puede comprender: (a) agregar secuencias adaptadoras en los extremos del ADN fuera de las células (ADNfc), (b) incubar el ADNfc ligado al adaptador con una ADN p-glucosiltransferasa y glucosa UDP modificada con un grupo quimioselectivo, marcando así covalentemente las moléculas de ADN hidroximetilado en el ADNfc con el grupo quimioselectivo; (c) unir una fracción de biotina al ADNfc quimioselectivamente modificado mediante una reacción de cicloadición; (d) enriquecer las moléculas de ADN biotinilado mediante la unión del producto de la etapa de marcado con biotina (etapa c) a un soporte que se une a la biotina; (e) amplificar el ADN enriquecido usando cebadores que se unen a los adaptadores; y (f) secuenciar el ADN amplificado para producir una pluralidad de lecturas de secuencia.
Como se muestra en la Figura 1A, en algunas realizaciones, el método no comprende liberar las moléculas de ADN biotinilado del soporte antes de la amplificación (es decir, después de la etapa (d), antes de la etapa (e)) y, como tal, en algunas realizaciones, la etapa de amplificación (d) puede comprender amplificar el ADN enriquecido mientras está unido al soporte de (c). Esto puede implementarse mediante: i. lavado del soporte de (d) después de que las moléculas de ADN biotinilado se hayan unido al soporte; y luego ii. establecer una reacción de amplificación que contiene el soporte, sin liberar las moléculas de ADN biotinilado del soporte.
También como se muestra en la Figura 1A, la etapa (a) puede implementarse ligando el ADN a un adaptador universal, es decir, un adaptador que se liga a ambos extremos de los fragmentos de ADNfc. En ciertos casos, el adaptador universal se puede hacer ligando un adaptador Y (o adaptador de horquilla) en los extremos del ADNfc, produciendo así una molécula de ADN de doble cadena que tiene una cadena superior que contiene una secuencia de etiqueta 5' que no es la igual o complementaria a la secuencia de la etiqueta añadida el extremo 3' de la cadena. Como debería ser evidente, los fragmentos de ADN utilizados en la etapa inicial del método deben ser ADN no amplificado que no haya sido desnaturalizado de antemano. Como se muestra en la Figura 1A, esta etapa puede requerir pulir (es decir, despuntar) los extremos del ADNfc con una polimerasa, colocar la cola A a los fragmentos usando, por ejemplo, Taq polimerasa, y ligando un adaptador en Y con cola T a los fragmentos con cola A. Esta etapa de ligación inicial se puede realizar en una cantidad limitante de ADNfc. Por ejemplo, ADNfc al que se ligan los adaptadores puede contener menos de 200 ng de ADN, por ejemplo, 10 pg a 200 ng, 100 pg a 200 ng, 1 ng a 200 ng o 5 ng a 50 ng, o menos de
10.000 (por ejemplo, menos de 5.000, menos de 1.000, menos de 500, menos de 100 o menos de 10) equivalentes del genoma haploide, dependiendo del genoma. En algunas realizaciones, el método se realiza utilizando menos de 50 ng de ADNfc (que corresponde aproximadamente a aproximadamente 5 ml de plasma) o menos de 10 ng de ADNfc, que corresponde aproximadamente a aproximadamente 1 ml de plasma. Por ejemplo, Newman et al., (Nat Med., 2014, 20: 548-54) elaboraron bibliotecas a partir de 7-32 ng de ADNfc aislado de 1-5 ml de plasma. Esto es equivalente a 2.121-9.697 genomas haploides (asumiendo 3,3 pg por genoma haploide). El adaptador ligado al ADNfc puede contener un código de barras molecular para facilitar la multiplexación y el análisis cuantitativo de las moléculas secuenciadas. Específicamente, el adaptador puede estar "indexado" porque contiene un código de barras molecular que identifica la muestra a la que se ligó (lo que permite agrupar las muestras antes de la secuenciación). Alternativamente o, además, el adaptador puede contener un código de barras aleatorio o similar. Dicho adaptador puede ligarse a los fragmentos y sustancialmente cada fragmento correspondiente a una región particular se marca con una secuencia diferente. Esto permite la identificación de duplicados de PCR y permite el recuento de moléculas.
En la siguiente etapa de esta implementación del método, las moléculas de ADN hidroximetilado en el ADNfc se marcan con un grupo quimioselectivo, es decir, un grupo que puede participar en una reacción clic. Esta etapa se puede realizar incubando el ADNfc ligado al adaptador con ADN p-glucosiltransferasa (por ejemplo, a Dn pglucosiltransferasa T4 (que está disponible comercialmente a través de diversos proveedores), aunque existen otras ADN p-glucosiltransferasas) y, por ejemplo, UDP-6-N3-Glu (es decir, glucosa UDP que contiene una azida). Esta etapa se puede realizar usando un protocolo adaptado de US20110301045 o Song et al., (Nat. Biotechnol. 2011 29: 68-72), por ejemplo.
La siguiente etapa de esta implementación del método implica la adición de una fracción de biotina al ADN modificado quimioselectivamente mediante una reacción de cicloadición (clic). Esta etapa se puede realizar añadiendo directamente un reactivo biotinilado, por ejemplo, una biotina modificada con dibenzociclooctina a la reacción de glucosiltransferasa después de que se haya completado esa reacción, es decir, después de una cantidad de tiempo apropiada (por ejemplo, después de 30 minutos o más). En algunas realizaciones, el reactivo biotinilado puede ser de fórmula general B-L-X, en la que B es una fracción de biotina, L es un enlazador y X es un grupo que reacciona con el grupo quimioselectivo añadido al ADNfc mediante una reacción de cicloadición. En ciertos casos, el enlazador puede hacer que el compuesto sea más soluble en un entorno acuoso y, como tal, puede contener un enlazador de polietilenglicol (PEG) o un equivalente del mismo. En algunas realizaciones, el compuesto añadido puede ser dibenzociclooctina-PEGn-biotina, en el que N es 2-10, por ejemplo, 4. La dibenzociclooctina-PEG4-biotina es relativamente hidrófila y es soluble en tampón acuoso hasta una concentración de 0,35 mM. El compuesto añadido en esta etapa no necesita contener un enlace escindible, por ejemplo, no contiene un enlace disulfuro o similar. En esta etapa, la reacción de cicloadición puede ser entre un grupo azido añadido al ADNfc hidroximetilado y un grupo alquinilo (por ejemplo, grupo dibenzociclooctina) que está unido a la refracción de biotina. Nuevamente, esta etapa se puede realizar usando un protocolo adaptado del documento US20110301045 o Song et al, (Nat. Biotechnol. 2011 29: 68 72), por ejemplo.
La etapa de enriquecimiento del método puede realizarse usando perlas magnéticas de estreptavidina, aunque podrían usarse otros soportes. Como se señaló anteriormente, las moléculas de ADNfc enriquecidas (que corresponden a las moléculas de ADNfc hidroximetiladas) se amplifican mediante PCR y luego se secuencian.
En estas realizaciones, la muestra de ADN enriquecida puede amplificarse usando uno o más cebadores que hibridan con los adaptadores añadidos (o sus complementos). En las realizaciones en las que se añaden adaptadores en Y, los ácidos nucleicos ligados al adaptador se pueden amplificar mediante PCR utilizando dos cebadores: un primer cebador que hibrida con la región monocatenaria de la cadena superior del adaptador y un segundo cebador que hibrida con el complemento de la región monocatenaria de la cadena inferior del adaptador en Y (o adaptador de horquilla, después de la escisión del bucle). Por ejemplo, en algunas realizaciones, el adaptador en Y utilizado puede tener brazos P5 y P7 (cuyas secuencias son compatibles con la plataforma de secuenciación de Illumina) y los productos de amplificación tendrán la secuencia P5 en uno y la secuencia P7 en el otro. Estos productos de amplificación se pueden hibridar con un sustrato de secuenciación de Illumina y secuenciarse. En otra realización, el par de cebadores usados para la amplificación puede tener extremos 3' que hibridan con el adaptador en Y y colas 5' que tienen la secuencia P5 o la secuencia P7. En esta realización, los productos de amplificación también tendrán la secuencia P5 en uno y la secuencia P7 en el otro. Estos productos de amplificación se pueden hibridar con un sustrato de secuenciación de Illumina y secuenciarse. Esta etapa de amplificación puede realizarse mediante PCR de ciclo limitado (por ejemplo, 5-20 ciclos).
La etapa de secuenciación puede realizarse usando cualquier método de secuenciación conveniente de próxima generación y puede resultar en al menos 10.000, al menos 50.000, al menos 100.000, al menos 500.000, al menos 1 M al menos 10 M al menos 100 M o al menos 1B lecturas de secuencia. En algunos casos, las lecturas son lecturas de extremo emparejado. Como sería evidente, los cebadores utilizados para la amplificación pueden ser compatibles con el uso en cualquier plataforma de secuenciación de próxima generación en la que se utilice la extensión de cebadores, por ejemplo, el método de terminación reversible de Illumina, el método de pirosecuenciación de Roche (454), la secuenciación por ligación de Life Technologies (la Plataforma SOLiD), la plataforma Ion Torrent de Life Technologies o el método de escisión de base fluorescente de Pacific Biosciences. Se describen ejemplos de tales métodos en las siguientes referencias: Margulies et al., (Nature 2005, 437: 376-80); Ronaghi et al., (Analytical
Biochemistry 1996, 242: 84-9); Shendure (Science, 2005, 309: 1728); Imelfort et al., (Brief Bioinform., 2009, 10: 609 18); Fox et al., (Methods Mol Biol. 2009; 553: 79-108); Appleby et al., (Methods Mol Biol. 2009; 513: 19-39) English (PLoS One. 2012, 7: e47768) y Morozova (Genomics. 2008, 92: 255-64).
En determinadas realizaciones, la muestra secuenciada puede comprender un conjunto de moléculas de ADN de una pluralidad de muestras, en las que los ácidos nucleicos de la muestra tienen un código de barras molecular para indicar su origen. En algunas realizaciones, los ácidos nucleicos que se analizan pueden derivarse de una sola fuente (por ejemplo, un solo organismo, virus, tejido, célula, sujeto, etc.), mientras que, en otras realizaciones, la muestra de ácido nucleico puede ser un conjunto de ácidos nucleicos extraídos de una pluralidad de fuentes (por ejemplo, un conjunto de ácidos nucleicos de una pluralidad de organismos, tejidos, células, sujetos, etc.), en las que por "pluralidad" se entiende dos o más. Como tal, en ciertas realizaciones, una muestra de ácido nucleico puede contener ácidos nucleicos de 2 o más fuentes, 3 o más fuentes, 5 o más fuentes, 10 o más fuentes, 50 o más fuentes, 100 o más fuentes, 500 o más fuentes, 1.000 o más fuentes, 5.000 o más fuentes, hasta e incluyendo aproximadamente 10.000 o más fuentes. Los códigos de barras moleculares pueden permitir distinguir las secuencias de diferentes fuentes después de su análisis.
Las lecturas de secuencia pueden ser analizadas por un ordenador y, como tal, las instrucciones para realizar las etapas que se exponen a continuación pueden exponerse como programación que puede grabarse en un medio de almacenamiento físico adecuado legible por ordenador.
En algunas realizaciones, las lecturas de secuencia se pueden analizar para proporcionar una determinación cuantitativa de qué secuencias están hidroximetiladas en el ADNfc. Esto se puede hacer, por ejemplo, contando las lecturas de secuencia o, alternativamente, contando el número de moléculas iniciales originales, antes de la amplificación, basándose en su punto de ruptura de fragmentación y/o si contienen la misma secuencia indexadora. Se conoce el uso de códigos de barras moleculares junto con otras características de los fragmentos (por ejemplo, las secuencias finales de los fragmentos, que definen los puntos de rompimiento) para distinguir entre los fragmentos. Los códigos de barras moleculares y los ejemplos de métodos para contar moléculas individuales se describen en Casbon (Nucl. Acids Res. 2011, 22 e81) y Fu et al (Proc Natl Acad Sci U S A. 2011, 108: 9026-31), entre otros. Los códigos de barras moleculares se describen en los documentos US 2015/0044687, US 2015/0024950, US 2014/0227705, US 8.835.358 y US 7.537.897, así como una variedad de otras publicaciones.
En determinadas realizaciones, se pueden comparar dos muestras de ADNfc diferentes usando los métodos anteriores. Las diferentes muestras pueden estar compuestas por una muestra "experimental", es decir, una muestra de ADNfc de interés, y una muestra de ADNfc de "control" con la que se puede comparar la muestra de ADNfc experimental. En muchas realizaciones, las diferentes muestras se obtienen de sujetos, siendo un sujeto un sujeto de interés, por ejemplo, un paciente con una enfermedad, y el otro un sujeto de control, un paciente que no tiene la enfermedad. Los ejemplos de pares de muestras incluyen, por ejemplo, ADNfc de un sujeto que tiene una enfermedad tal como cáncer de colon, mama, próstata, pulmón, piel o infectado con un patógeno, etc.) y ADNfc de sujetos normales que no tienen la enfermedad, y ADNfc desde dos puntos de tiempo diferentes del mismo sujeto, por ejemplo, antes y después de la administración de una terapia, etc.
También se proporciona un método para identificar un patrón de hidroximetilación que se correlaciona con el fenotipo, por ejemplo, una enfermedad, afección o resultado clínico, etc. En algunas realizaciones, este método puede comprender (a) realizar el método descrito anteriormente en una pluralidad de muestras de ADNfc, en el que las muestras de ADNfc se aíslan de pacientes que tienen un fenotipo conocido, por ejemplo, enfermedad, afección o resultado clínico, determinando de ese modo qué secuencias están hidroximetiladas en ADNfc de cada uno de los pacientes; y (b) identificar una firma de hidroximetilación que está correlacionada con el fenotipo.
En algunas realizaciones, la firma de hidroximetilación puede ser diagnóstica (por ejemplo, puede proporcionar un diagnóstico de una enfermedad o afección o el tipo o etapa de una enfermedad o afección, etc.), pronóstico (por ejemplo, indicando un resultado clínico, por ejemplo, supervivencia o muerte dentro de un período de tiempo) o teranóstico (por ejemplo, indicando qué tratamiento sería el más efectivo).
También se proporciona un método para analizar una muestra de un paciente. En esta realización, el método puede comprender: (a) identificar, usando el método descrito anteriormente, secuencias que están hidroximetiladas en el ADNfc de un paciente; (b) comparar las secuencias identificadas con un conjunto de secuencias distintivas que están correlacionadas con un fenotipo, por ejemplo, una enfermedad, afección o resultado clínico, etc.; y (c) proporcionar un informe que indique una correlación con el fenotipo. Esta realización puede comprender además hacer un diagnóstico, pronóstico o teranóstico con base en los resultados de la comparación.
En algunas realizaciones, el método puede implicar la creación de un informe como se describió anteriormente (un formulario electrónico el cual pudo haber sido enviado desde una ubicación remota) y reenviar el informe a un médico u otro profesional médico para determinar si un paciente tiene un fenotipo (por ejemplo, cáncer, etc.) o para identificar una terapia adecuada para el paciente. El informe puede usarse como diagnóstico para determinar si el sujeto tiene una enfermedad o afección, por ejemplo, un cáncer. En ciertas realizaciones, el método puede usarse para determinar
el estadio o el tipo de cáncer, para identificar células metastásicas o para controlar la respuesta de un paciente a un tratamiento, por ejemplo.
En cualquier realización, el informe puede enviarse a una "ubicación remota", en la que "ubicación remota" significa una ubicación diferente a la ubicación en la que se examina la imagen. Por ejemplo, una ubicación remota podría ser otra ubicación (por ejemplo, oficina, laboratorio, etc.) en la misma ciudad, otra ubicación en una ciudad diferente, otra ubicación en un estado diferente, otra ubicación en un país diferente, etc. Como tal, cuando se indica que un elemento está "alejado" de otro, lo que se quiere decir es que los dos elementos pueden estar en la misma habitación, pero separados, o al menos en habitaciones diferentes o edificios diferentes, y pueden estar al menos a una milla, diez millas, o al menos a cien millas de distancia. La información de "comunicación" hace referencia a la transmisión de los datos que representan esa información como señales eléctricas sobre un canal de comunicación adecuado (por ejemplo, una red pública o privada). "Reenviar" un elemento se refiere a cualquier medio de llevar ese elemento de un lugar a otro, ya sea transportando físicamente ese elemento o bien (cuando sea posible) e incluye, al menos en el caso de datos, transportar físicamente un medio que lleve los datos o comunicar los datos. Los ejemplos de medios de comunicación incluyen canales de transmisión de radio o infrarrojos, así como una conexión de red a otro ordenador o dispositivo en red, e internet o incluyendo transmisiones de correo electrónico e información registrada en sitios web y similares. En determinadas realizaciones, el informe puede ser analizado por un médico u otro profesional médico calificado, y un informe basado en los resultados del análisis de la imagen puede enviarse al paciente del que se obtuvo la muestra.
También se proporciona un método para analizar una muestra que comprende (a) determinar, usando el método descrito anteriormente, qué secuencias están hidroximetiladas en una primera muestra de ADNfc y qué secuencias están hidroximetiladas en la segunda muestra de ADNfc, en el que la primera y segundas muestras de ADNfc se obtienen del mismo paciente en dos momentos diferentes; y (b) comparar el patrón de hidroximetilación de la primera muestra con el patrón de hidroximetilación de la segunda muestra para determinar si ha habido un cambio en la hidroximetilación a lo largo del tiempo. Este método puede ser cuantitativo y, en algunas realizaciones, la etapa de comparación (b) puede comprender comparar el nivel de hidroximetilación de una o más secuencias seleccionadas. La etapa de comparación de este método puede mapear los cambios en la hidroximetilación en el curso de una enfermedad, afección o tratamiento de una enfermedad o afección.
El fenotipo de un paciente puede ser cualquier característica o rasgo observable de un sujeto, tal como una enfermedad o afección, una etapa de enfermedad o etapa de afección, susceptibilidad a una enfermedad o afección, pronóstico de una etapa de enfermedad o afección, un estado fisiológico o respuesta a compuestos terapéuticos, etc. Un fenotipo puede resultar de la expresión génica de un sujeto, así como de la influencia de factores ambientales y las interacciones entre los dos, así como de modificaciones epigenéticas en secuencias de ácidos nucleicos.
El fenotipo en un sujeto se puede caracterizar analizando ADNfc usando el método descrito anteriormente. Por ejemplo, caracterizar un fenotipo para un sujeto o individuo puede incluir detectar una enfermedad o afección (incluida la detección presintomática de la etapa temprana), determinar el pronóstico, diagnóstico o teranosis de una enfermedad o afección, o determinar la etapa o progresión de una enfermedad o afección. Caracterizar un fenotipo también puede incluir la identificación de tratamientos apropiados o la eficacia del tratamiento para enfermedades, afecciones, etapas de la enfermedad y etapas de la afección específicas, predicciones y análisis de probabilidad de la progresión de la enfermedad, en particular, la recurrencia de la enfermedad, la diseminación metastásica o la recaída de la enfermedad. Un fenotipo también puede ser un tipo o subtipo clínicamente distinto de una afección o enfermedad, tal como un cáncer o un tumor. La determinación del fenotipo también puede ser una determinación de una condición fisiológica, o una evaluación del daño orgánico o el rechazo de un órgano, tal como después de un trasplante. Los productos y procesos descritos en este documento permiten la evaluación de un sujeto de forma individual, lo que puede proporcionar beneficios de decisiones de tratamiento más eficientes y económicas.
En algunas realizaciones, el método puede usarse para identificar una firma que predice si es probable que un sujeto responda a un tratamiento para una enfermedad o trastorno.
La caracterización de un fenotipo puede incluir predecir el estado de respuesta/no respuesta del sujeto, en la que el sujeto responde a un tratamiento para una enfermedad y no responde al tratamiento. Si una firma de hidroximetilación en un sujeto se alinea más estrechamente con la de sujetos anteriores que se sabía que respondían al tratamiento, el sujeto puede caracterizarse, o predecirse, como que responde al tratamiento. De manera similar, si la firma de hidroximetilación en el sujeto se alinea más estrechamente con la de sujetos previos que no respondieron al tratamiento, el sujeto puede caracterizarse o predecirse como que no responde al tratamiento. El tratamiento puede ser para cualquier enfermedad, trastorno u otra condición apropiada. El método se puede utilizar en cualquier entorno de enfermedad en el que se conozca una firma de hidroximetilación que se correlaciona con el estado de respuesta/no respuesta.
En algunas realizaciones, el fenotipo comprende una enfermedad o afección como las que se enumeran a continuación. Por ejemplo, el fenotipo puede comprender la presencia o la probabilidad de desarrollar un tumor, neoplasia o cáncer. Un cáncer detectado o evaluado por productos o procesos descritos en este documento incluye, pero no se limita a, cáncer de mama, cáncer de ovario, cáncer de pulmón, cáncer de colon, pólipo hiperplásico,
adenoma, cáncer colorrectal, displasia de alto grado, displasia de bajo grado, hiperplasia prostética, cáncer de próstata, melanoma, cáncer de páncreas, cáncer de cerebro (tal como un glioblastoma), neoplasia maligna hematológica, carcinoma hepatocelular, cáncer de cuello uterino, cáncer de endometrio, cáncer de cabeza y cuello, cáncer de esófago, tumor del estroma gastrointestinal (GIST), carcinoma de células renales (RCC) o cáncer gástrico. El cáncer colorrectal puede ser CRC Dukes B o Dukes C-D. La neoplasia maligna hematológica puede ser leucemia linfocítica crónica de células B, linfoma de células B-DLBCL, linfoma de células B-DLBCL-como centro germinal, linfoma de células B-DLBCL-como células B activadas y linfoma de Burkitt.
En algunas realizaciones, el fenotipo puede ser una afección premaligna, tal como queratosis actínica, gastritis atrófica, leucoplaquia, eritroplasia, granulomatosis linfomatoide, preleucemia, fibrosis, displasia cervical, displasia cervical uterina, xeroderma pigmentoso, esófago de Barrett, pólipo colorrectal u otro crecimiento de tejido anormal o lesión que probablemente se convierta en un tumor maligno. Las infecciones virales transformadoras tales como el VIH y el VPH también presentan fenotipos que pueden evaluarse de acuerdo con el método.
El cáncer caracterizado por el presente método puede ser, sin limitación, un carcinoma, un sarcoma, un linfoma o leucemia, un tumor de células germinales, un blastoma u otros cánceres. Los carcinomas incluyen, sin limitación, neoplasias epiteliales, neoplasias de células escamosas, carcinoma de células escamosas, neoplasias de células basales, carcinoma de células basales, papilomas y carcinomas de células de transición, adenomas y adenocarcinomas (glándulas), adenoma, adenocarcinoma, insulinoma de linitis plástica, glucagonoma, gastrinoma, vipoma colangiocarcinoma, carcinoma hepatocelular, carcinoma quístico adenoide, tumor carcinoide de apéndice, prolactinoma, oncocitoma, adenoma de células de Hurthle, carcinoma de células renales, tumor de Grawitz, adenomas endocrinos múltiples, adenoma endometrioide, neoplasias de anexos y apéndices cutáneos, neoplasias mucoepidermoides, neoplasias cística, mucinosa y serosa, cistadenoma, pseudomixoma del peritoneo, neoplasias ductal, lobular y medular, neoplasias de células acinares, neoplasias epiteliales complejas, tumor de Warthin, timoma, neoplasias gonadales especializadas, tumor del estroma del cordón sexual, tecoma, tumor de células de la granulosa, arrenoblastoma, tumor de células de Sertoli Leydig, tumores glómicos, paraganglioma, feocromocitoma, tumor glómico, nevos y melanomas, nevo melanocítico, melanoma maligno, melanoma, melanoma nodular, nevo displásico, melanoma lentigo maligno, melanoma de extensión superficial y melanoma lentiginoso acral maligno. El sarcoma incluye, sin limitación, tumor de Askin, botryodies, condrosarcoma, sarcoma de Ewing, hemangioendotelioma maligno, schwannoma maligno, osteosarcoma, sarcomas de tejidos blandos que incluyen: sarcoma alveolar de partes blandas, angiosarcoma, filodes de cistosarcoma, dermatofibrosarcoma, tumor desmoide, tumor de células redondas pequeñas desmoplásicas, sarcoma epiteloide, condrosarcoma extraesquelético, osteosarcoma extraesquelético, fibrosarcoma, hemangiopericitoma, hemangiosarcoma, sarcoma de Kaposi, leiomiosarcoma, liposarcoma, linfangiosarcoma, linfosarcoma, histiocitoma fibroso maligno, neurofibrosarcoma, rabdomiosarcoma y sinoviosarcoma. El linfoma y la leucemia incluyen, sin limitación, leucemia linfocítica crónica/linfoma de linfocitos pequeños, leucemia prolinfocítica de células B, linfoma linfoplasmocítico (tal como macroglobulinemia de Waldenstrom), linfoma de zona marginal esplénica, mieloma de células plasmáticas, plasmocitoma, enfermedades por deposición de inmunoglobulinas monoclonales, enfermedades de cadena pesada, linfoma de células B de zona marginal extranodal, también llamado linfoma de Malta, linfoma de células B de zona marginal nodal (nmzl), linfoma folicular, linfoma de células del manto, linfoma difuso de células B grandes, linfoma mediastínico (tímico) de células B grandes, linfoma intravascular de células B grandes, linfoma de efusión primaria, linfoma/leucemia de Burkitt, leucemia prolinfocítica de células T, leucemia linfocítica granular grande de células T, leucemia agresiva de células NK, leucemia/linfoma de células T adultas, linfoma extraganglionar de células NK/T, linfoma de células T de tipo enteropatía, de tipo nasal, linfoma de células T hepatoesplénico, linfoma blástico de células NK, micosis fungoide/síndrome de Sézary, trastornos linfoproliferativos de células T, cutáneas primarias positivas para CD30, linfoma anaplásico cutáneo primario de células grandes, papulosis linfomatoide, linfoma angioinmunoblástico de células T, linfoma periférico de células T, linfoma anaplásico de células grandes no especificado, linfomas de Hodgkin clásicos (esclerosis nodular, celularidad mixta, rica en linfocitos agotada no agotada en linfocitos) y linfoma de Hodgkin con predominio de linfocitos nodulares. Los tumores de células germinales incluyen, sin limitación, germinoma, disgerminoma, seminoma, tumor de células germinales no germinomatosas, carcinoma embrionario, tumor endodérmico del seno, coriocarcinoma, teratoma, poliembrioma y gonadoblastoma. El blastoma incluye, sin limitación, nefroblastoma, meduloblastoma y retinoblastoma. Otros cánceres incluyen, sin limitación, carcinoma labial, carcinoma de laringe, carcinoma de hipofaringe, carcinoma de lengua, carcinoma de glándulas salivales, carcinoma gástrico, adenocarcinoma, cáncer de tiroides (carcinoma de tiroides medular y papilar), carcinoma renal, carcinoma de parénquima renal, carcinoma de cuello uterino, carcinoma del cuerpo uterino, carcinoma de endometrio, carcinoma de corion, carcinoma de testículo, carcinoma urinario, melanoma, tumores cerebrales tales como glioblastoma, astrocitoma, meningioma, meduloblastoma y tumores neuroectodérmicos periféricos, carcinoma de vesícula biliar, carcinoma bronquial, mieloma múltiple, basalioma, teratoma, retinoblastoma, melanoma de coroides, seminoma, rabdomiosarcoma, craneofaringeoma, osteosarcoma, condrosarcoma, miosarcoma, liposarcoma, fibrosarcoma, sarcoma de Ewing y plasmocitoma.
En una realización adicional, el cáncer bajo análisis puede ser un cáncer de pulmón que incluye cáncer de pulmón de células no pequeñas y cáncer de pulmón de células pequeñas (incluyendo carcinoma de células pequeñas (cáncer de células de avena), carcinoma mixto de células pequeñas/células grandes y carcinoma combinado de células pequeñas), cáncer de colon, cáncer de mama, cáncer de próstata, cáncer de hígado, cáncer de páncreas, cáncer de cerebro, cáncer de riñón, cáncer de ovario, cáncer de estómago, cáncer de piel, cáncer de huesos, cáncer gástrico,
cáncer de mama, cáncer de páncreas, glioma, glioblastoma, carcinoma hepatocelular, carcinoma renal papilar, carcinoma de células escamosas de cabeza y cuello, leucemia, linterna, mieloma o un tumor sólido.
En realizaciones adicionales, el cáncer puede ser una leucemia linfoblástica aguda; leucemia mieloide aguda; carcinoma de la corteza suprarrenal; cánceres relacionados con el SIDA; linfoma relacionado con el SIDA; cáncer anal; cáncer de apéndice; astrocitomas; tumor teratoide/rabdoide atípico; carcinoma de células basales; cáncer de vejiga; glioma de tronco encefálico; tumor cerebral (incluyendo glioma del tronco encefálico, tumor teratoide/rabdoide atípico del sistema nervioso central, tumores embrionarios del sistema nervioso central, astrocitomas, craneofaringioma, ependimoblastoma, ependimoma, meduloblastoma, meduloepitelioma, tumores parenquimatosos pineales de diferenciación intermedia, tumores neuroectodérmicos primitivos supra); cáncer de mama; tumores bronquiales; Linfoma de Burkitt; cáncer de sitio primario desconocido; tumor carcinoide; carcinoma de sitio primario desconocido; tumor teratoide/rabdoide atípico del sistema nervioso central; tumores embrionarios del sistema nervioso central; cáncer de cuello uterino; cánceres infantiles; cordoma, leucemia linfocítica crónica; leucemia mielógena crónica; trastornos mieloproliferativos crónicos; cáncer de colon; cáncer colorrectal; craneofaringioma; linfoma cutáneo de células T; tumores endocrinos de células de los islotes del páncreas; cáncer endometrial; ependimoblastoma; ependimoma; cáncer de esófago; estesioneuroblastoma; sarcoma de Ewing; tumor extracraneal de células germinales; tumor extragonadal de células germinales; cáncer extrahepático del conducto biliar; cáncer de vesícula biliar; cáncer gástrico (estómago); tumor carcinoide gastrointestinal; tumor de células del estroma gastrointestinal; tumor del estroma gastrointestinal (GIST); tumor trofoblástico gestacional; glioma; leucemia de células pilosas; cáncer de cabeza y cuello; cáncer de corazón; linfoma de Hodgkin; cáncer de hipofaringe; melanoma intraocular; tumores de células de los islotes; sarcoma de Kaposi; cáncer de riñón; histiocitosis de células de Langerhans; cáncer de laringe; cáncer de labios; cáncer de hígado; cáncer de hueso de histiocitoma fibroso maligno; meduloblastoma; meduloepitelioma; melanoma; carcinoma de células de Merkel; carcinoma de piel de células de Merkel; mesotelioma; cáncer de cuello escamoso metastásico con primario oculto; cáncer de boca; síndromes de neoplasias endocrinas múltiples; mieloma múltiple; mieloma múltiple/neoplasia de células plasmáticas; micosis fungoide; síndromes mielodisplásicos; neoplasias mieloproliferativas; cáncer de cavidad nasal; cáncer de nasofaringe; neuroblastoma; linfoma no Hodgkin; cáncer de piel no melanoma; cáncer de pulmón de células no pequeñas; cáncer oral; cáncer de cavidad oral; cáncer de orofaringe; osteosarcoma; otros tumores de encéfalo y médula espinal; cáncer de ovarios; cáncer epitelial de ovario; tumor de células germinales de ovario; tumor de ovario de bajo potencial maligno; cáncer de páncreas; papilomatosis; cáncer de seno paranasal; cáncer de paratiroides; cáncer de pelvis; cáncer de pene; cáncer de faringe; tumores del parénquima pineal de diferenciación intermedia; pineoblastoma; tumor pituitario; neoplasia de células plasmáticas/mieloma múltiple; blastoma pleuropulmonar; linfoma primario del sistema nervioso central (SNC); cáncer de hígado hepatocelular primario; cáncer de próstata; cáncer de recto; cáncer de riñón; cáncer de células renales (riñón); cáncer de células renales; cáncer del tracto respiratorio; retinoblastoma; rabdomiosarcoma; cáncer de glándulas salivales; síndrome de Sézary; cáncer de pulmón de células pequeñas; cáncer de intestino delgado; sarcoma de tejidos blandos; carcinoma de células escamosas; cáncer de cuello escamoso; cáncer de estómago (gástrico); tumores neuroectodérmicos primitivos supratentoriales; linfoma de células T; cáncer testicular; cáncer de garganta; carcinoma tímico; timoma; cáncer de tiroides; cáncer de células de transición; cáncer de células de transición de la pelvis renal y el uréter; tumor trofoblástico; cáncer de uréter; cáncer de uretra; cáncer uterino; sarcoma uterino; cáncer de vagina; cáncer de vulva; macroglobulinemia de Waldenstrom; o el tumor de Wilm. Los métodos de la invención pueden usarse para caracterizar estos y otros cánceres. Por lo tanto, caracterizar un fenotipo puede proporcionar un diagnóstico, pronóstico o teranosis de uno de los cánceres divulgados en el presente documento.
El fenotipo también puede ser una enfermedad inflamatoria, una enfermedad inmunitaria o una enfermedad autoinmunitaria. Por ejemplo, la enfermedad puede ser enfermedad inflamatoria intestinal (IBD), enfermedad de Crohn (CD), colitis ulcerosa (UC), inflamación pélvica, vasculitis, psoriasis, diabetes, hepatitis autoinmune, esclerosis múltiple, miastenia grave, diabetes tipo I, artritis reumatoide, psoriasis, lupus eritematoso sistémico (SLE), tiroiditis de Hashimoto, enfermedad de Grave, espondilitis anquilosante, enfermedad de Sjogren, síndrome CREST, esclerodermia, enfermedad reumática, rechazo de órganos, colangitis esclerosante primaria o sepsis.
El fenotipo también puede comprender una enfermedad cardiovascular, tal como aterosclerosis, insuficiencia cardíaca congestiva, placa vulnerable, accidente cerebrovascular o isquemia. La enfermedad o afección cardiovascular puede ser presión arterial alta, estenosis, oclusión de vasos o un evento trombótico.
El fenotipo también puede comprender una enfermedad neurológica, tal como esclerosis múltiple (MS), enfermedad de Parkinson (PD), enfermedad de Alzheimer (AD), esquizofrenia, trastorno bipolar, depresión, autismo, enfermedad priónica, enfermedad de Pick, demencia, enfermedad de Huntington (HD), síndrome de Down, enfermedad cerebrovascular, encefalitis de Rasmussen, meningitis viral, lupus eritematoso sistémico neuropsiquiátrico (NPSLE), esclerosis lateral amiotrófica, enfermedad de Creutzfeldt-Jacob, enfermedad de Gerstmann-Straussler-Scheinker, encefalopatía espongiforme transmisible, daño por reperfusión isquémica (por ejemplo, accidente cerebrovascular), traumatismo cerebral, infección microbiana o síndrome de fatiga crónica. El fenotipo también puede ser una afección tal como fibromialgia, dolor neuropático crónico o dolor neuropático periférico.
El fenotipo también puede comprender una enfermedad infecciosa, tal como una infección bacteriana, viral o por levaduras. Por ejemplo, la enfermedad o afección puede ser enfermedad de Whipple, enfermedad priónica, cirrosis,
Staphylococcus aureus resistente a la meticilina, VIH, hepatitis, sífilis, meningitis, malaria, tuberculosis o influenza. Las proteínas virales, tales como partículas similares al VIH o VHC, se pueden evaluar en una vesícula para caracterizar una afección viral.
El fenotipo también puede comprender una afección perinatal o relacionada con el embarazo (por ejemplo, preeclampsia o parto prematuro), enfermedad o afección metabólica, tal como una enfermedad o afección metabólica asociada con el metabolismo del hierro. Por ejemplo, la hepcidina se puede analizar en una vesícula para caracterizar una deficiencia de hierro. La enfermedad o afección metabólica también puede ser diabetes, inflamación o una afección perinatal.
Una "firma" correlativa puede ser un grupo de 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más secuencias que están independientemente subhidroximetiladas o sobrehidroximetiladas con respecto a un control (por ejemplo, ADNfc "normal"), en el que, colectivamente, la identidad de las secuencias y, opcionalmente, la cantidad de hidroximetilación asociada con esas secuencias, se correlaciona con un fenotipo.
El ADNfc usado en el método puede ser de un mamífero tal como animales bovinos, aviares, caninos, equinos, felinos, ovinos, porcinos o primates (incluidos humanos y primates no humanos). En algunas realizaciones, el sujeto puede tener una enfermedad o afección preexistente, tal como cáncer. Alternativamente, el sujeto puede no tener ninguna condición preexistente conocida. El sujeto también puede no responder a un tratamiento existente o pasado, tal como un tratamiento para el cáncer. En algunas realizaciones, el ADNfc puede ser de una mujer embarazada. En algunas realizaciones, el patrón de hidroximetilación en la fracción fetal del ADNfc puede correlacionarse con una anomalía cromosómica en el feto (por ejemplo, una aneuploidía). En otras realizaciones, se puede determinar el sexo del feto a partir del patrón de hidroximetilación en la fracción fetal del ADNfc y/o determinar la fracción fetal del ADNfc.
También se proporciona un método que comprende (a) obtener una muestra que comprende ADN circulante fuera de las células, (b) enriquecer el ADN hidroximetilado en la muestra y (c) cuantificar independientemente la cantidad de ácidos nucleicos en el ADN hidroximetilado enriquecido que se mapea a (es decir, tienen secuencias que corresponden a) cada uno de uno o más loci diana (por ejemplo, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5 o al menos 10 loci diana). Este método puede comprender, además: (d) determinar si una o más secuencias de ácido nucleico en el ADN hidroximetilado enriquecido están sobrerrepresentadas o subrepresentadas en el ADN hidroximetilado enriquecido, con respecto a un control. La identidad de los ácidos nucleicos que están sobrerrepresentados o subrepresentados en el ADN hidroximetilado enriquecido (y, en ciertos casos, el grado en que esos ácidos nucleicos están sobrerrepresentados o subrepresentados en el ADN hidroximetilado enriquecido) se puede utilizar para hacer un diagnóstico, una decisión de tratamiento o un pronóstico. Por ejemplo, en algunos casos, el análisis del ADN hidroximetilado enriquecido puede identificar una firma que se correlaciona con un fenotipo, como se discutió anteriormente. En algunas realizaciones, la cantidad de moléculas de ácido nucleico en el ADN hidroximetilado enriquecido que se asigna a cada uno de uno o más loci diana (por ejemplo, los genes/intervalos enumerados a continuación) pueden cuantificarse mediante qPCR, PCR digital, matrices, secuenciación o cualquier otro método cuantitativo.
En algunas realizaciones, el diagnóstico, la decisión de tratamiento o el pronóstico pueden ser un diagnóstico de cáncer. En estas realizaciones, los loci diana pueden incluir uno o más (por ejemplo, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 10, al menos 15 o al menos 20, de los siguientes cuerpos de los genes (es decir, regiones transcritas de un gen): ABRACL, ADAMTS4, AGFG2, ALDH1A3, ALG10B, AMOTL1, APCDD1L-AS1, ARL6IP6, ASF1B, ATP6V0A2, AUNIP, BAGE, C2orf62, C8orf22, CALCB, CC2D1B, CCDC33, CCNL2, CLDN15, COMMD6, CPLX2, CRP, CTRC, DACH1, DAZL, DDX11L1, DHRS3, DUSP26, DUSP28, EPN3, EPPIN-WFDC6, ETAA1, FAM96A, FENDRR, FLJ16779, FLJ31813, GBX1, GLP2R, GMCL1P1, GNPDA2, GPR26, GSTP1, HMOX2, HOXC5, IGSF9B, INSC, INSL4, IRF7, KIF16B, KIF20B, LARS, LDHD, LHX5, LINC00158, LINC00304, LOC100128946, LOC100131234, LOC100132287, LOC100506963, LOC100507250, LOC100507410, LOC255411, LOC729737, MAFF, NPAS4, NRADDP, P2RX2, PAIP1, PAX1, PODXL2, POU4F3, PSMG1, PTPN2, RAG1, RBM14-RBM4, RDH11, RFPL3, RNF122, RNF223, RNF34, SAMD11, SHISA2, SIGLEC10, SLAMF7, SLC25A46, SLC25A47, SLC9A3R2, SORD, SOX18, SPATA31E1, SSR2, STXBP3, SYT11, SYT2, TCEA3, THAP7-AS1, TMEM168, TMEM65, TMX2, TPM4, TPO, TRAM1, TTC24, UBQLN4, WASH7P, ZNF284, ZNF423, ZNF444, ZNF800, ZNF850, y ZRANB2.
Por ejemplo, en algunas realizaciones, la cantidad de ácidos nucleicos que se asignan a cada uno de uno o más (por ejemplo, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5 o al menos 10) de los siguientes cuerpos de los genes: ZNF800, TMEM65, GNPDA2, ALG10B, CLDN15, TMEM168, ETAA1, AMOTL1, STXBP3, ZNF444, LINC00158, IRF7, SLC9A3R2, TRAM1 y SLC25A46 pueden determinarse independientemente, como se muestra en la Figura 12D.
En otro ejemplo, en algunas realizaciones, la cantidad de ácidos nucleicos que se asignan a cada uno de uno o más (por ejemplo, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5 o al menos 10) de los siguientes cuerpos de los genes: CLDN15, SLC25A47, ZRANB2, LOC10050693, STXBP3, GPR26, P2RX2, LOC100507410, LHX5, HOXC5, FAM96A, CALCB, RNF223, SHISA2 y SLAMF7 pueden determinarse independientemente, como se muestra en la Figura 12F.
En estas realizaciones, los loci diana pueden incluir uno o más (por ejemplo, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 10 o al menos 15) de los siguientes intervalos (en los que la numeración es relativa al genoma de referencia hg19, publicado como GRCh37 en febrero de 2009): crom1: 114670001-114672000, crom1: 169422001-169424000, crom1: 198222001-198224000, crom1: 239846001-239848000, crom1: 24806001-24808000, crom1: 3234001-3236000, crom1: 37824001-37826000, crom1: 59248001-59250000, crom1: 63972001-63974000, crom1: 67584001-67586000, crom1: 77664001-77666000, crom2: 133888001-133890000, crom2: 137676001 137678000, crom2: 154460001-154462000, crom2: 200922001-200924000, crom2: 213134001-213136000, crom2: 219148001-219150000, crom2: 41780001-41782000, crom2: 49900001-49902000, crom3: 107894001-107896000, crom3: 108506001-108508000, crom3: 137070001-137072000, crom3: 17352001-17354000, crom3: 23318001 23320000, crom3: 87312001-87314000, crom3: 93728001-93730000, crom4: 39342001-39344000, crom4: 90790001 90792000, crom5: 103492001-103494000, crom5: 39530001-39532000, crom5: 83076001-83078000, crom6: 122406001-122408000, crom6: 129198001-129200000, crom6: 156800001-156802000, crom6: 157286001 157288000, crom6: 45304001-45306000, crom7: 11020001-11022000, crom7: 13364001-13366000, crom8: 42934001-42936000, crom8: 53686001-53688000, crom8: 69672001-69674000, crom9: 3496001-3498000 y crom9: 88044001-88046000.
Por ejemplo, en algunas realizaciones, la cantidad de ácidos nucleicos que se asignan a cada uno de uno o más (por ejemplo, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5 o todos) de los siguientes intervalos: crom4: 90790001-90792000, crom6: 45304001-45306000, crom5: 103492001-103494000, crom7: 11020001-11022000, crom2: 49900001-49902000, crom2: 137676001-137678000, crom3: 87312001-87314000, y crom9: 88044001 88046000 pueden determinarse de forma independiente, como se muestra en la Figura 12E.
En otro ejemplo, en algunas realizaciones, la cantidad de ácidos nucleicos que se asignan a cada uno de uno o más (por ejemplo, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5 o todos) de los siguientes intervalos: crom4: 90790001-90792000, crom6: 45304001-45306000, crom1: 169422001-169424000, crom1: 67584001-67586000, crom5: 103492001-103494000, crom3: 87312001-87314000, crom2: 219148001-219150000, crom1: 198222001 198224000, crom8: 53686001-53688000, crom1: 239846001-239848000, crom3: 23318001-23320000, crom6: 122406001-122408000, crom9: 3496001-3498000, crom1: 24806001-24808000, y crom8: 69672001-69674000, como se muestra en la Figura 12G.
Si el diagnóstico es un diagnóstico de cáncer, entonces el diagnóstico puede incluir una indicación del tipo de tejido del cáncer, es decir, si el cáncer es cáncer de pulmón, cáncer de hígado, cáncer de páncreas, etc.
Como resultará evidente, la etapa de cuantificación (c) se puede realizar usando una variedad de métodos diferentes. Por ejemplo, como se describió anteriormente y a continuación, la cuantificación se puede realizar adjuntando secuencias de identificación de moléculas a los fragmentos enriquecidos, secuenciarlos y luego contar el número de secuencias de identificación de moléculas que están asociadas con las lecturas de secuencias que se asignan a uno o más loci. (véase, por ejemplo, el documento US20110160078). Alternativamente, la cuantificación puede realizarse mediante PCR digital (véase, por ejemplo, Kalinina et al, Nucleic Acids Research. 1997, 25 (10): 1999-2004) o hibridación con una matriz, por ejemplo.
En algunas realizaciones, la muestra de ADNfc se puede analizar adicionalmente mediante el método de formación de imágenes descrito en Song et al., (Proc. Natl. Acad. Sci. 2016, 113: 4338-43). En estas realizaciones, el método puede comprender (a) marcar una muestra que comprende el ADNfc: (i) añadiendo una etiqueta de captura a los extremos de las moléculas de ADN en la muestra; y (ii) marcar moléculas que comprenden hidroximetilcitosina con un primer fluoróforo; (b) inmovilizar las moléculas de ADN marcadas preparadas en la etapa (a) sobre un soporte; y (c) formar imágenes de moléculas individuales de ADN hidroximetilado sobre el soporte. En algunas realizaciones, este método puede comprender (d) contar el número de moléculas individuales marcadas con el primer fluoróforo, determinando así el número de moléculas de ADN hidroximetilado en la muestra. En estas realizaciones, el primer fluoróforo de la etapa (a) (ii) se agrega incubando moléculas de ADN con una ADN p-glucosiltransferasa y glucosa UDP modificada con un grupo quimioselectivo, marcando así covalentemente las moléculas de ADN hidroximetilado con el grupo quimioselectivo, y uniendo el primer fluoróforo al ADN modificado quimioselectivamente mediante una reacción de cicloadición. En algunas realizaciones, la etapa (a) (i) puede comprender además añadir un segundo fluoróforo a los extremos de las moléculas de ADN en la muestra. En algunas realizaciones, la etapa (a) puede comprender, además: después de la etapa (ii), (iii) marcar moléculas que comprenden metilcitosina con un segundo fluoróforo; y la etapa (c) comprende además la formación de imágenes de moléculas individuales de ADN metilado sobre el soporte. En estas realizaciones, el método puede comprender (d) contar: (i) el número de moléculas individuales marcadas con el primer fluoróforo y (ii) el número de moléculas individuales marcadas con el segundo fluoróforo. En estas realizaciones, el método puede comprender además (e) calcular las cantidades relativas de ADN hidroximetilado y ADN metilado en la muestra. En algunas realizaciones, las moléculas que comprenden metilcitosina se marcan con el segundo fluoróforo: incubando el producto de la etapa (a) (ii) con una metilcitosina dioxigenasa, convirtiendo así la metilcitosina en hidroximetilcitosina; incubando el a Dn tratado con metilcitosina dioxigenasa con una ADN p-glucosiltransferasa y glucosa UDP modificada con un grupo quimioselectivo, marcando así covalentemente las moléculas de ADN hidroximetilado con el grupo quimioselectivo y uniendo el segundo fluoróforo al ADN modificado quimioselectivamente mediante una reacción de cicloadición.
En este método, la etapa (a) puede comprender, además: iii. marcar moléculas que comprenden metilcitosina con un segundo fluoróforo; y la etapa (c) puede comprender la obtención de imágenes de moléculas individuales de ADN genómico detectando una señal FRET (transferencia de energía por resonancia de fluorescencia) que emana del primer o segundo fluoróforos de (a) (ii) o (a) (iii), en los que una señal FRET indica que una molécula tiene una hidroximetilcitosina y una metilcitosina proximales entre sí. En estas realizaciones, el método puede comprender determinar si la molécula tiene una hidroximetilcitosina y una metilcitosina proximales en la misma cadena. Alternativamente o, además, el método puede comprender determinar si la molécula tiene una hidroximetilcitosina y metilcitosina proximales en diferentes cadenas.
El estado de hidroximetilcitosina/metilcitosina de los genes/intervalos enumerados en las Tablas 10A, 10B, 11A y 11B se puede investigar usando una serie de sondas. Por ejemplo, en algunas realizaciones, el método puede comprender unir marcadores a moléculas de ADN que comprenden uno o más nucleótidos de hidroximetilcitosina y metilcitosina en una muestra de ADNfc, en el que los nucleótidos de hidroximetilcitosina están marcados con una primer marcador ópticamente detectable (por ejemplo, un primer fluoróforo) y los nucleótidos de metilcitosina se marcan con un segundo marcador ópticamente detectable (por ejemplo, un segundo fluoróforo) que se distingue del primer marcador, para producir una muestra marcada e hibridar la muestra con una matriz de sondas, en la que la matriz de sondas comprende sondas para al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 10 o al menos 20 de los genes o intervalos enumerados en las Tablas 10A, 10B, 11A y 11B. En algunos casos, la matriz puede contener sondas de cadena superior y sondas de cadena inferior, lo que permite que las cadenas superior e inferior marcadas se detecten de forma independiente.
En algunas realizaciones, el método puede comprender unir marcadores a moléculas de ADN que comprenden uno o más nucleótidos de hidroximetilcitosina y metilcitosina en una muestra de ADNfc, en la que los nucleótidos de hidroximetilcitosina se marcan con una primera etiqueta de captura y los nucleótidos de metilcitosina se marcan con una segunda etiqueta de captura que es diferente a la primera captura, para producir una muestra marcada; enriquecimiento de las moléculas de ADN que están marcadas; y secuenciar las moléculas de ADN enriquecidas. Esta realización del método puede comprender enriquecer por separado las moléculas de ADN que comprenden una o más hidroximetilcitosinas y las moléculas de ADN que comprenden uno o más nucleótidos de metilcitosina. La marcación puede adaptarse de los métodos descritos anteriormente o de Song et al. (Proc. Natl. Acad. Sci. 2016 113: 4338-43), en la que se utilizan etiquetas de captura en lugar de marcadores fluorescentes. Por ejemplo, en algunas realizaciones, el método puede comprender incubar el ADNfc (por ejemplo, ADNfc ligado al adaptador) con un ADN pglucosiltransferasa y glucosa UDP modificada con un grupo quimioselectivo, marcando así covalentemente las moléculas de ADN hidroximetilado en el ADNfc con el grupo quimioselectivo; unir un primer agente de captura al ADNfc modificado quimioselectivamente mediante el grupo quimioselectivo, por ejemplo, mediante una reacción de cicloadición; incubar este producto de la etapa con una metilcitosina dioxigenasa, una ADN p-glucosiltransferasa y glucosa UDP modificada con un grupo quimioselectivo; y unir el segundo agente de captura al ADN modificado quimioselectivamente mediante el grupo quimioselectivo, por ejemplo, mediante una reacción de cicloadición.
En algunas realizaciones, la etapa de determinación se puede realizar en relación con un control. Específicamente, en algunas realizaciones, el método puede comprender determinar si una o más secuencias de ácidos nucleicos en el ADN hidroximetilado enriquecido están sobrerrepresentadas, en relación con un control y/o determinar si una o más secuencias de ácidos nucleicos en el ADN hidroximetilado enriquecido están subrepresentadas con respecto a un control. En algunas realizaciones, las secuencias de control pueden estar en el ADN hidroximetilado enriquecido. En estas realizaciones, las secuencias de control pueden estar en la misma muestra que los ácidos nucleicos que se asignan a los loci diana, pero no se asignan a los loci diana. En otras realizaciones, las secuencias de control pueden estar en la muestra de (a), en la muestra que comprende ADN circulante fuera de las células, antes del enriquecimiento del ADN hidroximetilado. En otras realizaciones, las secuencias de control pueden estar en la muestra de (a), en la muestra que comprende ADN circulante fuera de las células, después del enriquecimiento del ADN hidroximetilado (es decir, en la fracción de ADN circulante fuera de las células) que no contiene el ADN hidroximetilado. En otras realizaciones, las secuencias de control pueden ser de una muestra diferente. En otras realizaciones, la determinación puede basarse en un umbral derivado empíricamente obtenido del análisis de múltiples muestras.
Kits
También se proporcionan en esta divulgación kits que contienen reactivos para practicar los métodos objetivo, como se describió anteriormente. Los kits objetivo contienen uno o más de cualquiera de los componentes descritos anteriormente. Por ejemplo, en algunas realizaciones, el kit puede ser para analizar ADNfc. En estas realizaciones, el kit puede comprender una ADN p-glucosiltransferasa, glucosa UDP modificada con un grupo quimioselectivo; y un adaptador que comprende un código de barras molecular, como se describió anteriormente. En algunas realizaciones, el adaptador puede ser un adaptador en Y o en horquilla. En algunas realizaciones, el kit también puede comprender una fracción de biotina, en el que la fracción de biotina es reactiva con el grupo quimioselectivo.
Los diversos componentes del kit pueden estar presentes en contenedores separados o ciertos componentes compatibles pueden combinarse previamente en un solo contenedor, según se desee.
Además de los componentes mencionados anteriormente, los kits objetivo pueden incluir además instrucciones para usar los componentes del kit para practicar los métodos objetivo, es decir, instrucciones para el análisis de muestras. Las instrucciones para practicar los métodos objetivo se registran generalmente en un medio de grabación adecuado. Por ejemplo, las instrucciones pueden estar impresas en un sustrato, tal como un papel o plástico, etc. Como tal, las instrucciones pueden estar presentes en los kits como un prospecto, en la marcación del contenedor del kit o sus componentes (es decir, asociado con el empaquetado o subempacado), etc. En otras realizaciones, las instrucciones están presentes como un archivo de datos de almacenamiento electrónico presente en un medio de almacenamiento adecuado legible por ordenador, por ejemplo, CD-ROM, disquete, etc. En aún otras realizaciones las instrucciones reales no están presentes en el kit, pero se proporcionan los medios para obtener las instrucciones de una fuente remota, por ejemplo, a través de la Internet. Un ejemplo de esta realización es un kit que incluye una dirección web en la que se pueden ver las instrucciones y/o desde donde se pueden descargar las instrucciones. Al igual que con las instrucciones, este medio para obtener las instrucciones se registra en un sustrato adecuado.
Composiciones
También se proporciona en esta divulgación una variedad de composiciones que comprenden productos elaborados mediante el presente método. En algunas realizaciones, la composición puede comprender ADN circulante fuera de las células, en el que los residuos de hidroximetilcitosinas en el ADN se modifican para contener una etiqueta de captura. En estas realizaciones, ambas cadenas del ADN circulante fuera de las células pueden estar en la composición. En algunas realizaciones, el ADN puede estar en forma bicatenaria. En otras realizaciones, el ADN puede estar en forma monocatenaria (por ejemplo, si la composición se ha desnaturalizado mediante incubación a una temperatura elevada).
Como resultará evidente a partir de la descripción en la sección de métodos de esta divulgación, la etiqueta de captura puede ser una fracción de biotina (por ejemplo, biotina) o un grupo quimioselectivo (por ejemplo, un grupo azido y un grupo alquinilo tal como UDP-6-N3-Glu). En algunas realizaciones, la composición puede comprender, además: i. pglucosiltransferasa y ii. glucosa UDP modificada con un grupo quimioselectivo (por ejemplo, UDP-6-N3-Glu). Estas moléculas no están marcadas con fluorescencia ni marcadas con una marca detectable ópticamente.
En algunas realizaciones, el ADN hidroximetilado fuera de las células está ligado con un adaptador (es decir, se ha ligado con adaptadores). En algunas realizaciones, el ADN puede tener adaptadores, por ejemplo, adaptadores, en Y o en horquilla bicatenarios, ligados a ambas cadenas en ambos extremos.
En algunas realizaciones, la composición puede ser una composición enriquecida en la que al menos el 10% (por ejemplo, al menos el 20%, al menos el 50%, al menos el 80% o al menos el 90%) de las moléculas de ácido nucleico en la composición comprende una o más hidroximetilcitosinas que se modifican para contener la etiqueta de captura. En estas realizaciones, la composición puede comprender, además, en solución, copias del ADN hidroximetilado fuera de las células que se han preparado mediante p Cr . En estas realizaciones, la composición puede comprender una población de productos de PCR, en la que al menos el 10% (por ejemplo, al menos el 20%, al menos el 50%, al menos el 80% o al menos el 90%) de los productos de PCR se copian (directa o indirectamente) a partir de ADN hidroximetilado.
En algunas realizaciones, la composición puede comprender además un soporte (por ejemplo, una perla tal como una perla magnética u otro sólido), en la que el soporte y el ADN circulante fuera de las células están unidos entre sí mediante la etiqueta de captura. El enlace puede ser a través de un enlace covalente o un enlace no covalente. Como resultará evidente, el soporte puede estar ligado a estreptavidina y el agente de captura puede estar ligado a biotina.
Ejemplos
Los aspectos de las presentes enseñanzas pueden entenderse mejor a la luz de los siguientes ejemplos, que no deben interpretarse como limitantes del alcance de las presentes enseñanzas de ninguna manera.
En el presente documento se informa el primer análisis global de hidroximetiloma en ADNfc. En el cáncer de pulmón, se observó una pérdida global característica de 5hmC fuera de las células, mientras que en e1HCC y el cáncer de páncreas se identificaron cambios significativos a escala más fina de 5hmC fuera de las células. En e1HCC, se realizó un estudio exploratorio de las muestras longitudinales y se demostró que la 5hmC fuera de las células se puede utilizar para controlar el tratamiento y la recurrencia. Estos tres tipos de cáncer mostraron patrones distintos en su hidroximetiloma fuera de las células y se podrían emplear algoritmos de aprendizaje automático entrenados con funciones de 5hmC fuera de las células para predecir los tres tipos de cáncer con alta precisión. Se prevé que el perfil de 5hmC fuera de las células será una herramienta valiosa para el diagnóstico del cáncer, así como para otras áreas de enfermedades, que incluyen, entre otras, enfermedades neurodegenerativas, enfermedades cardiovasculares y diabetes. Además, el marco general de este método se puede adoptar fácilmente para secuenciar otras modificaciones en ácidos nucleicos fuera de las células aplicando la química de marcaje apropiada a las bases modificadas. Esto permitirá una visión general completa y global de los cambios genéticos y epigenéticos de varios estados de enfermedad y aumentará aún más el poder de los diagnósticos personalizados.
Estos datos se obtuvieron usando un método de secuenciación de 5hmC fuera de las células de genoma completo de baja entrada adaptado de una marcación química selectiva conocida como "hMe-Seal" (véase, por ejemplo, Song et al, Nat. Biotechnol. 2011 29, 68-72). hMe-Seal es un método robusto que utiliza p-glucosiltransferasa (pGT) para marcar selectivamente 5hmC con una biotina a través de una glucosa modificada con azida para la extracción de fragmentos de ADN que contienen 5hmC para la secuenciación (véase la Figura 5A). El procedimiento estándar de hMe-Seal requiere microgramos de ADN. En el enfoque modificado descrito en el presente documento, ADNfc se ligó primero con adaptadores de secuenciación y 5hmC se marcó selectivamente con un grupo biotina. Después de capturar ADNfc que contiene 5hmC utilizando perlas de estreptavidina, la biblioteca final se elabora mediante PCR directamente a partir de las perlas en lugar de eluir el ADN capturado. Esto minimiza la pérdida de muestra durante la purificación. El método se ilustra esquemáticamente en la Figura 1A).
Materiales y métodos
Recolección y procesamiento de muestras
Se obtuvieron muestras para sujetos sanos del centro de sangre de Stanford. Los pacientes con HCC y cáncer de mama se reclutaron en un protocolo aprobado por la Junta de Revisión Institucional de la Universidad de Stanford. Se reclutó a pacientes con cáncer de pulmón, cáncer de páncreas, GBM, cáncer gástrico y cáncer colorrectal en un protocolo aprobado por la Junta de Revisión Institucional del West China Hospital. Todos los sujetos reclutados dieron su consentimiento informado. La sangre se recogió en Vacutainers recubiertos con EDTA. Se recogió plasma de las muestras de sangre después de centrifugación a 1.600 x g durante 10 min a 4 °C y 16.000 x g durante 1o min a 4 °C. Se extrajo ADNfc usando el Kit de ácido nucleico circulante (Qiagen). El ADN genómico de sangre completa se extrajo usando el Mini Kit de ADN (Qiagen) y se fragmentó usando ADNbc fragmentasa (NEB) en un promedio de 300 pb. El ADN se cuantificó mediante el fluorómetro Qubit (Life Technologies). El ARN fuera de las células se extrajo utilizando el kit de purificación de ARN exosómico y circulante en plasma/suero (Norgen). El ARN fuera de las células extraído se digirió adicionalmente usando ADNasas Baseline-ZERO (Epicentre) y se redujo usando el kit de eliminación de ARNr, Ribo-Zero (Epicentre) de acuerdo con un protocolo de Clontech.
Preparación de amplicón enriquecido
Para generar el control enriquecido, se amplificó por PCR el ADN lambda mediante ADN polimerasa Taq (NEB) y se purificó mediante perlas AMPure XP (Beckman Coulter) en amplicones de —180 pb no superpuestos, con un cóctel de dATP/dGTP/dTTP y uno de los siguientes: dCTP, dmCTP o 10% de dhmCTP (Zymo)/90% de dCTP. Las secuencias de los cebadores son las siguientes: dCTP Directo-CGTTTCCGTTCTTCTTCGTC (SEQ ID NO: 1), Inverso-TACTCGCACCGAAAATGTCA (SEQ ID NO: 2), dmCTP Directo- GTGGCGGGTTATGATGAACT (SEQ ID NO: 3), 10% dhmCTP/90% dCTP Directo-TGAAAACGAAAGGGGATACG (SEQ ID NO: 5), Inverso-GTCCAGCTGGGAGTCGATAC (SEQ ID NO: 6).
Construcción, etiquetado, captura y secuenciación de alto rendimiento de bibliotecas de 5 hmC
ADNfc (1-10 ng) o ADN genómico de sangre completa fragmentada (1 |jg) enriquecido con amplicones (0,001 pg de cada amplicón por 10 ng de ADN) se reparó en los extremos, se adeniló en 3' y se ligó a códigos de barras de ADN (Bioo Scientific) utilizando el Kit KAPA Hyper Prep (Kapa Biosystems) de acuerdo con las instrucciones del fabricante. El ADN ligado se incubó en una solución de 25 j l que contenía tampón HEPES 50 mM (pH 8), MgCh 25 mM, UDP-6-N3-Glc 100 jM (Active Motif) y 12,5 U de pGT (Thermo) durante 2 horas a 37 °C. Después de esto, se añadieron directamente 2,5 j l de DBCO-PEG4-biotina (Click Chemistry Tools, solución madre 20 mM en DMSO) a la mezcla de reacción y se incubó durante 2 horas a 37 °C. A continuación, se añadieron 10 jg de ADN de esperma de salmón cortado (Life Technologies) a la mezcla de reacción y el ADN se purificó mediante una columna Micro Bio-Spin 30 (Bio-Rad). El ADN purificado se incubó con 0,5 j l de perlas de estreptavidina M270 (Life Technologies) bloqueadas previamente con a Dn de esperma de salmón en tampón 1 (Tris 5 mM pH 7,5, EDTA 0,5 mM, NaCl 1 M y Tween 20 al 0,2%) durante 30 min. Posteriormente, las perlas se sometieron a tres lavados de 5 min cada uno con tampón 1, tampón 2 (tampón 1 sin NaCl), tampón 3 (tampón 1 con pH 9) y tampón 4 (tampón 3 sin NaCl). Toda la unión y el lavado se realizaron a temperatura ambiente con rotación suave. A continuación, las perlas se resuspendieron en agua y se amplificaron con 14 (ADNfc) o 9 (ADN genómico de sangre completa) ciclos de amplificación por PCR usando ADN polimerasa Phusion (NEB). Los productos de la PCR se purificaron usando perlas AMPure XP. Se prepararon bibliotecas de entrada separadas mediante PCR directa a partir de ADN ligado sin marcación ni captura. Para las réplicas técnicas, el ADNfc del mismo sujeto se dividió en dos réplicas técnicas. Se realizó una secuenciación de 75 pb de los pares de los extremos en el instrumento NextSeq.
Procesamiento de datos y análisis del cuerpo del gen
Las secuencias de FASTQ se alinearon con UCSC/hg19 con Bowtie2 v2.2.5 y se filtraron adicionalmente con samtools-0.1.19 (view-f 2-F 1548-q 30 y rmdup) para retener coincidencias no duplicadas únicas con el genoma. Las lecturas de pares de los extremos se extendieron y convirtieron en un formato bedgraph normalizado al número total de lecturas alineadas usando bedtools, y luego se convirtieron al formato bigwig usando bedGraphToBigWig del UCSC Genome Browser para visualización en Integrated Genomics Viewer. Las secuencias de FASTq también se alinearon con las
tres secuencias de control de aumento para evaluar la eficiencia de reducción. El control de enriquecimiento solo se utiliza como validación del éxito de pull-down en cada muestra. Las hMR se identificaron con MACS utilizando ADN de entrada no enriquecido como fondo y configuración predeterminada (corte del valor p 1e-5). Las anotaciones genómicas de hMR se realizaron determinando el porcentaje de hMR que se superponen a cada región genómica > 1 pb. El perfil de metagen se generó usando ngs.plot. Se calcularon las FPKM de 5hmC usando los recuentos de fragmentos en cada cuerpo del gen RefSeq mediante bedtools. Para los análisis diferenciales, se excluyeron los genes de menos de 1 kb o asignados en los cromosomas X e Y. Se realizó un análisis génico diferencial de 5hmC utilizando el paquete limma en R. Los análisis GO se realizaron utilizando DAVID Bioinformatics Resources con GOTERM_BP_FAT. La expresión génica específica de tejido se obtuvo de BioGPS. Para el gráfico de tSNE, se usó la correlación de Pearson del FPKM de 5hmC del cuerpo del gen como matriz de distancia para tSNE. Se realizaron gráfico de MA, agrupamiento jerárquico, tSNE, LDA y mapas de calor en R.
Predicción del tipo y estadio del cáncer
Se seleccionaron genes marcadores específicos del tipo de cáncer realizando una prueba t de Student entre 1) un grupo de cáncer y un grupo sano, 2) un grupo de cáncer y otras muestras de cáncer, 3) dos grupos de cáncer diferentes. A continuación, se realizó la corrección de Benjamini y Hochberg para el valor p sin procesar y los genes se clasificaron por valor q. Los 5-20 genes superiores con el valor q más pequeño se seleccionaron como conjunto de características para entrenar al clasificador. Para lograr una resolución más alta, los DhMR se identificaron rompiendo primero el genoma de referencia (hg19) en ventanas de 2 kb in silico y calculando el valor de FPKM de 5hmC para cada una de las ventanas. Las regiones genómicas incluidas en la lista negra que tienden a mostrar señales de artefactos de acuerdo con ENCODE se filtraron antes del análisis posterior. Para los DhMR específicos del tipo de cáncer, se realizaron la prueba t de Student y la corrección de Benjamini y Hochberg de los valores p para comparar cada tipo de cáncer y los controles sanos. Se eligieron los 2-10 DhMR superiores con el valor q más pequeño para cada tipo de cáncer. El clasificador Mclust con base en el modelo gaussiano y el bosque aleatorio se realizaron en el conjunto de datos utilizando las características descritas anteriormente (cuerpos de los genes y DhMR). Se entrenaron clasificadores en cáncer de pulmón, cáncer de páncreas, HCC y muestras sanas. Los parámetros para el análisis de bosque aleatorio, que incluyen semilla aleatoria y mtry (número de variables muestreadas al azar como candidatas en cada división), se ajustaron para obtener la estimación de error más baja fuera de la bolsa utilizando tuneRF en el paquete randomForest en R. Las 15 características principales con mayor importancia variable se graficaron. El análisis del modelo de mezcla normal se realizó utilizando el paquete Mclust R. Para el entrenamiento de clasificadores con base en el modelo Mclust, se realizó un gráfico de criterio de información bayesiano (BIC) para visualizar la eficacia de clasificación de diferentes modelos de mezcla multivariante. Por defecto, el modelo EEI (diagonal, volumen y forma iguales) y el modelo tipo EDDA (componente único para cada clase con la misma estructura de covarianza entre clases) fueron elegidos para la clasificación Mclust. Para fortalecer el análisis, se realizó una validación cruzada de dejar uno fuera (LOO) para el bosque aleatorio y el clasificador Mclust con los mismos valores de parámetro. Para la validación cruzada de Mclust, se utilizó cvMclustDA en el paquete Mclust R.
Construcción de bibliotecas de ARN fuera de las células y secuenciación de alto rendimiento
Se preparó una biblioteca de ARN fuera de las células usando el kit de preparación de biblioteca ScriptSeq v2 RNA-Seq (Epicentre) siguiendo el protocolo de ARN de FFPE con 19 ciclos de amplificación por PCR. A continuación, los productos de la PCR se purificaron usando perlas AMPure XP. Se realizó una secuenciación de 75 pb de pares de los extremos en el instrumento NextSeq. Las lecturas de RNA-Seq se recortaron primero usando Trimmomatic-0.33 y luego se alinearon usando tophat-2.0.14. Los valores de expresión de RPKM se extrajeron utilizando cufflinks-2.2.1 utilizando modelos de genes RefSeq.
Resultados y discusión
5hmC fuera de las células forma fácilmente una muestra que contiene menos de 10 ng de ADNfc (por ejemplo, 1-10 ng de ADNfc) usando el método descrito anteriormente. Añadiendo un conjunto de amplicones de 180 pb que portan C, 5mC o 5hmC para ADNfc, se demostró que solo el ADN que contiene 5hmC puede detectarse mediante PCR a partir de las perlas después de pull-down (Figura 5B). Este resultado se confirmó en las bibliotecas de secuenciación final, que mostraron un enriquecimiento de más de 100 veces en lecturas que asignan ADN enriquecido en 5hmC (Figura 1B). Además, nuestro enfoque funcionó igualmente bien con ADNfc y ADN genómico a granel (1 |jg de ADN genómico de sangre completa (ADNg)) (Figura 1B). Las bibliotecas finales de 5hmC libres de células son muy complejas con una tasa media de asignaciones no duplicadas únicas de 0,75 cuando se secuencian ligeramente (mediana de 15 millones de lecturas, ~ 0,5 veces la cobertura del genoma humano) (Figuras 5C-5D y Tabla 1 a continuación), y, sin embargo, las réplicas técnicas son altamente reproducibles (Figura 1E). Las regiones enriquecidas con 5hmC (hMR) se identificaron en los datos de secuencia utilizando un método con base en Poisson. Las hMR son muy concordantes entre las réplicas técnicas y una muestra agrupada: más del 75% de las hMR en la muestra agrupada están en común con cada una de las réplicas (Figura 5F), alcanzando el estándar ENCODE para ChIP-Seq. Estos resultados demostraron que 5hmC fuera de las células se puede perfilar fácil y confiablemente mediante el método hMe-Seal modificado.
Tabla 1. Resumen de los resultados de la secuenciación de 5hmC.
Identificación de la Tipo Total de lecturas Lecturas únicas Tasa única muestra secuenciadas asignadas no asignada no duplicadas duplicada 10 ADNfc saludable 20081973 15192613 0,76 11 ADNfc saludable 19142986 14762956 0,77 27 ADNfc saludable 21862078 16645192 0,76 35-1 § ADNfc saludable 29132339 16742468 0,57 35-2 § ADNfc saludable 28694218 17346511 0,60 36-1 § ADNfc saludable 32202519 20996955 0,65 36-2 § ADNfc saludable 31089686 20993595 0,68 38o ADNfc saludable 20124203 15295376 0,76 38 ADNfc saludable 20419287 15679281 0,77 39o ADNfc saludable 22320662 17833176 0,80 entrada f ADNfc saludable 38574253 25910419 0,67 35-sangre ADNg de sangre total 44077590 31654982 0,72 36-sangre ADNg de sangre total 40843066 29266169 0,72 entrada de sangre f Entrada de ADNg de 39138506 26455609 0,68
sangre total
pulmón293 cáncer de pulmón 14172402 11470840 0,81 pulmón323 cáncer de pulmón 12269885 8916594 0,73 pulmón324 cáncer de pulmón 13313728 10058078 0,76 pulmón395 cáncer de pulmón 13589263 10092883 0,74 pulmón417 cáncer de pulmón 13212811 10109574 0,77 pulmón418 cáncer de pulmón 13103903 10420656 0,80 pulmón419 cáncer de pulmón 11949356 9704240 0,81 pulmón492 cáncer de pulmón 12563742 8885504 0,71 pulmón493 cáncer de pulmón 12930120 10479700 0,81 pulmón496 cáncer de pulmón 12267496 9657956 0,79 pulmón512 cáncer de pulmón 12934833 10483836 0,81 pulmón513 cáncer de pulmón 11310088 8304508 0,73 pulmón514 cáncer de pulmón 12895079 10264145 0,80 pulmón515 cáncer de pulmón 12132995 9406700 0,78 pulmón517 cáncer de pulmón 11766082 8857054 0,75 HCC150 HCC 15215190 11298385 0,74 HCC237 HCC 13439935 10109197 0,75 HCC241 HCC 16201676 12017320 0,74 HCC256 HCC 14579945 10728759 0,74 HCC260 HCC 13791503 10021911 0,73 HCC285 HCC 11522024 7662330 0,67 HCC290 HCC 13162465 9271065 0,70 HCC320 HCC 13462633 9696240 0,72 HCC341 HCC 11199473 6497400 0,58 HCC628 HCC 15365745 11759122 0,77 HCC324 HCC 12525818 9598812 0,77 HCC46 HCC 13121530 9237102 0,70
HCC73 HCC 13816686 10745247 0,78 HCC489 HCC 11446887 5575387 0,49 HCC195 HCC 11538777 7701351 0,67 HCC234 HCC 11960087 8468478 0,71 HCC626 HCC 13552712 11087605 0,82 HCC647 HCC 12491614 8590321 0,69 pancreático27 cáncer de páncreas 9717087 8019436 0,83 pancreático68 cáncer de páncreas 10457109 8374219 0,80 pancreático69 cáncer de páncreas 10838005 8940883 0,82 pancreático75 cáncer de páncreas 10197772 8452749 0,83 pancreático9 cáncer de páncreas 14601356 11245279 0,77 pancreático15 cáncer de páncreas 15240467 11923009 0,78 pancreático22 cáncer de páncreas 13439343 10356395 0,77 GBM57 GBM 8799132 6455359 0,73 GBM58 GBM 8874810 7253089 0,82 GBM66 GBM 9795211 8073651 0,82 GBM76 GBM 8103209 6165341 0,76
(continuación)
Identificación de la Tipo Total de lecturas Lecturas únicas Tasa única muestra secuenciadas asignadas no asignada no duplicadas duplicada estómago1 cáncer gástrico 14282633 10365849 0,73 estómago2 cáncer gástrico 17825012 12938872 0,73 estómago3 cáncer gástrico 16979690 12894400 0,76 estómago4 cáncer gástrico 21192604 15675499 0,74 estómago8 cáncer gástrico 14070772 8321549 0,59 colon13 cáncer colorrectal 17352371 12517451 0,72 colon16 cáncer colorrectal 15470656 11210513 0,72 colon17 cáncer colorrectal 15101557 10590748 0,70 colon19 cáncer colorrectal 18441208 12503926 0,68
BR5-2 § cáncer de mama 17746176 13004851 0,73
BR7-1 § cáncer de mama 16963664 13160842 0,78
BR7-2 § cáncer de mama 15495003 12100951 0,78
BR13 cáncer de mama 21382473 16015986 0,75
BR14 mama cáncer de mama 18668112 14613260 0,78 HBV268 HBV 8730571 5106519 0,58 HBV334 HBV 11838111 7848078 0,66 HBV374 HBV 14896634 11099981 0,75 HBV397 HBV 12127855 8416798 0,69 HBV455 HBV 12796382 9001735 0,70 HBV640 HBV 10040349 6062886 0,60 HBV646 HBV 9665264 5002160 0,52
§ duplicado técnico,
t ADN de entrada no enriquecido
Se secuenció 5hmC fuera de las células de ocho individuos sanos (Tablas 1 y 2). También se secuenció 5hmC de ADNg de sangre completa de dos de los individuos, porque las células sanguíneas lisadas pueden ser un contribuyente importante al ácido nucleico libre de células. Los perfiles a escala del genoma mostraron que las distribuciones de 5hmC fuera de las células son casi idénticas entre individuos sanos y se distinguen claramente tanto de la distribución de 5hmC de sangre completa como de la entrada de ADNfc (Figura 6A). Estudios previos de 5hmC en tejidos humanos y de ratón mostraron que la mayoría de 5hmC reside en los cuerpos de los genes y las regiones proximales del promotor del genoma (Mellen et al., Cell 2012 151: 1417-1430; Thomson Genome Biol. 2012, 13, R93). El análisis de todo el genoma de las hMR en nuestros datos de ADNfc mostró que la mayoría (80%) son intragénicas con la mayor parte del enriquecimiento en exones (observado con respecto al esperado, o/e = 7,29) y el agotamiento en regiones intergénicas (o/e = 0,46), consistente con eso en sangre completa (Figuras 6B-6C) y en otros tejidos. Se sabe que el enriquecimiento de 5hmC en cuerpos de los genes está correlacionado con la actividad transcripcional en tejidos tales como el cerebro y el hígado (véase, por ejemplo, Mellen et al., Cell 2012, 151: 1417-1430; Thomson Genome Biol.
2012, 13, R93). Para determinar si esta relación se mantiene en ADNfc, se realizó la secuenciación del ARN fuera de las células del mismo individuo. Al dividir los genes en tres grupos de acuerdo con su expresión fuera de las células y graficando el perfil promedio de 5hmC fuera de las células solo de cuerpos de los genes (análisis de metagen), se descubrió que 5hmC se enriquece en y alrededor de cuerpos de los genes de genes más altamente expresados (Figura 1C). Estos resultados respaldaron que 5hmC fuera de las células es una colección de varios tipos de tejidos y contiene información de otros tejidos además de la sangre.
Tabla 2. Información clínica para muestras sanas
Identificación de la sexo edad
__________________ ______________
39o femenino 49
Debido a que los 5hmC libres de células se enriquecieron principalmente en las regiones intragénicas, se usaron fragmentos de 5hmC génicos por kilobase de genes por millón de lecturas asignadas (FPKM) para comparar el hidroximetiloma fuera de las células con el hidroximetiloma de sangre completa. De hecho, el análisis imparcial de
5hmC génico usando la inclusión de vecinos estocásticos distribuidos en t (tSNE) 21 mostró una fuerte separación entre las muestras de sangre fuera de las células y de sangre completa (Figura 6D). Se utilizó el paquete limma (Ritchie, et al., Nucleic Acids Res.2015: 43, e47) para identificar 2.082 genes hidrometilados diferencialmente entre muestras de sangre completa y fuera de las células (valores q (valores p ajustados de Benjamini y Hochberg) <0,01, veces que cambia> 2, Figura 7A). En particular, los 735 genes enriquecidos con 5hmC específicos de la sangre mostraron un aumento de la expresión en sangre completa en comparación con los 1.347 genes enriquecidos con 5hmC específicos fuera de las células (valor p <2,2 * 10-16, prueba t de Welch) (Figura 7B). De acuerdo con la expresión diferencial, el análisis de Ontología Genética (GO) de genes enriquecidos con 5hmC específicos de la sangre identificó principalmente procesos relacionados con las células sanguíneas (Figura 7C), mientras que los genes enriquecidos con 5hmC específicos fuera de las células identificaron procesos biológicos mucho más diversos (Figura 7D). En la Figura 7E se muestran ejemplos de genes enriquecidos con 5hmC específicos de sangre completa (FPR1, FPR2) y específicos fuera de las células (GLP1R). Juntos, estos resultados refuerzan el concepto de que todos los tejidos contribuyen con 5hmC al ADNfc y que la medición de esto es una aproximación de la expresión génica.
Para explorar el potencial de diagnóstico de 5hmC fuera de las células, el método se aplicó para secuenciar el ADNfc de un panel de 49 pacientes con cáncer primario sin tratamiento previo, incluidos 15 pacientes con cáncer de pulmón, 10 con carcinoma hepatocelular (HCC), 7 con cáncer de páncreas, 4 con glioblastoma (GBM), 5 con cáncer gástrico, 4 con cáncer colorrectal, 4 con cáncer de mama (Tabla 3-9, a continuación). Estos pacientes varían desde cáncer en estadio temprano hasta cáncer metastásico en estadio tardío. En el cáncer de pulmón, se observó una pérdida global progresiva de enriquecimiento de 5hmC desde el cáncer de pulmón no metastásico en estadio temprano hasta el cáncer de pulmón metastásico en estadio tardío en comparación con el ADNfc sano, y gradualmente se asemejó a la entrada de ADNfc no enriquecido (Figura 2A). El análisis imparcial del cuerpo del gen usando tSNE también mostró una migración dependiente de la etapa del perfil de cáncer de pulmón desde el perfil sano a uno que se asemeja a la entrada de ADNfc no enriquecido (Figura 8A). Notablemente, incluso las muestras de cáncer de pulmón en estadio temprano están muy separadas de las muestras sanas (Figura 8A). Los eventos globales de hipohidroximetilomas se confirmaron aún más utilizando otras métricas. En primer lugar, la mayoría de los genes diferenciales en el cáncer de pulmón metastásico (valores q <1e-7, 1.159 genes) mostraron un agotamiento de 5hmC dependiente del estadio en comparación con las muestras sanas (Figura 2B). En segundo lugar, el perfil del metagen mostró un agotamiento dependiente de la etapa de la señal 5hmC del cuerpo del gen y una semejanza con la entrada de ADNfc no enriquecido (Figura 8B). En tercer lugar, hay una disminución drástica en el número de hMR identificadas en el cáncer de pulmón, especialmente en el cáncer de pulmón metastásico en comparación con las muestras de cáncer sanas y otras (Figura 2C). Estos datos confirmaron la pérdida global dependiente del estadio de los niveles de 5hmC en el ADNfc de cáncer de pulmón.
Tabla 3. Información clínica para muestras de cáncer de pulmón
Identificación de la muestra categoría TNM etapa sexo edad lung395 cáncer de pulmón no metastásico T4N2Mx III femenino 62 lung419 cáncer de pulmón no metastásico T1N2M0G2 IIIa femenino 53 lung492 cáncer de pulmón no metastásico T2N0M0 I masculino 55 lung493 cáncer de pulmón no metastásico T1N3M0 IV femenino 66 lung496 cáncer de pulmón no metastásico T3N1M0 IIIa masculino 68 lung512 cáncer de pulmón no metastásico - - femenino 67 lung513 cáncer de pulmón no metastásico T2N1M0 I-II masculino 47 lung514 cáncer de pulmón no metastásico T2N0M0 I-II femenino 57 lung515 cáncer de pulmón no metastásico cT3N1M0 IIIA masculino 52 lung293 cáncer de pulmón metastásico cT4N3M1a IV femenino 52 lung323 cáncer de pulmón metastásico TxN2M1 IV femenino 68 lung324 cáncer de pulmón metastásico TxNxM1 IV masculino 56 lung417 § cáncer de pulmón metastásico - - masculino 62 lung418 cáncer de pulmón metastásico TxN3Mx IIIb-IV masculino 59 lung517 cáncer de pulmón metastásico cT4N2M1b IV masculino 68
Todas son muestras de cáncer de pulmón de células no pequeñas a menos que se indique lo contrario. § cáncer de pulmón de células pequeñas.
Tabla 4. Información clínica para muestras de HCC
Identificación de la muestra categoría TNM Tamaño del tumor (cm) sexo edad HBV268 HBV - - masculino 36 HBV334 HBV - - femenino 55 HBV374 HBV - - femenino 45 HBV397 HBV - - femenino 51 HBV455 HBV - - femenino 66 HBV640 HBV - - femenino 49 HBV646 HBV - - masculino 60
(continuación)
Identificación de la muestra categoría TNM Tamaño del tumor (cm) sexo edad HCC150 HCC preoperatorio pT1 pNX pMX 3,1 § masculino 76 HCC256 HCC preoperatorio pT1 pNX pMX 15 x 9 masculino 80 HCC260 HCC preoperatorio pT1 pNX pMX 1,3 § masculino 68 HCC290 HCC preoperatorio - 10 x 13 x 18 masculino 68 HCC320 HCC preoperatorio - multifocal femenino 70 HCC628 HCC preoperatorio pT1 1,8 § masculino 43
HCC285 HCC preoperatorio pT3N0M0 8 § 73 HCC324 HCC postoperatorio - - masculino 73 HCC237 HCC preoperatorio pT2 pNX pMX 4,1 § 52 HCC241 HCC postoperatorio - - masculino 52 HCC341 HCC recurrente - 3 x 1,2 53 HCC195 HCC preoperatorio pT1 pNX pM0 - 44 HCC234 HCC preoperatorio - 1,6 44 HCC626 HCC recurrente - 1,7 x 1,7 x 1,0 masculino 50
HCC postoperatorio - - 53 HCC46 HCC preoperatorio pT2 pNX pMX 2,8 § 69
HCC postoperatorio HCC73 - 69 HCC398 Seguimiento del masculino - - 72 HCC
HCC489 HCC recurrente - 2,2 § 73 § en la mayor dimensión.
Tabla 5. Información clínica para muestras de cáncer de páncreas
Identificación de la muestra TNM etapa metástasis a sexo edad pancreático9 T3N0M1 IV hígado masculino 76 pancreático15 T1N0M0 IA - masculino 64 pancreático22 T4N1M0 III - femenino 71 pancreático27 T4N1M1 IV pared abdominal, omento masculino 55 pancreático68 T3N0M1 IV hígado masculino 63 pancreático69 T3N0M0 IIA - masculino 66 pancreático75 T3N0M0 IIA - masculino 54
Tabla 6. Información clínica para muestras de GBM
Identificación de la muestra etapa sexo edad
GBM57 IV femenino 52
GBM58 IV masculino 71
GBM66 IV masculino 81
GBM76 IV masculino 59
Tabla 7. Información clínica para muestras de cáncer gástrico
Identificación de la muestra TNM etapa sexo edad
Tabla 8. Información clínica para muestras de cáncer colorrectal
Identificación de la muestra TNM etapa sexo edad colonl3 T4N0M0 II masculino 54 colon16 T3N0M0 II femenino 57 colonl7 T4N0M1 IV masculino 52 colonl9 pT4N1M1 IV femenino 62
Tabla 9. Información clínica para muestras de cáncer de mama
Identificación de la muestra tamaño del tumor (cm) grado del tumor edad
BR5 2,5 2 54
BR7 1,2 1 71
BR13 1 2 58
BR14 1,9 1 61
Cabe señalar que la pérdida global de enriquecimiento de 5hmC observada en el ADNfc de cáncer de pulmón no se debe al fracaso de nuestro método de enriquecimiento, ya que el control de enriquecimiento en todas las muestras, incluidas las muestras de cáncer de pulmón, mostró un alto enriquecimiento de a Dn que contiene 5hmC (Figura 8C). También es un fenómeno exclusivo del cáncer de pulmón que no se observa en otros cánceres que se probaron, evidenciado por el número de hMR (Figura 2C) y los perfiles de metagenes (Figura 8B). En la Figura 2D y la Figura 8D se muestran ejemplos de genes empobrecidos en 5hmC en cáncer de pulmón. El tejido del cáncer de pulmón puede tener un nivel bajo de 5hmC en comparación con el tejido pulmonar normal y el pulmón puede tener una contribución relativamente grande al ADNfc. Es plausible que el cáncer de pulmón, especialmente el cáncer de pulmón metastásico provoque la liberación de grandes cantidades de ADNg hipohidroximetilado en ADNfc, lo que diluye eficazmente el ADNfc y conduce al agotamiento de 5hmC en el panorama de 5hmC fuera de las células. Alternativamente o en combinación, la hipohidroximetilación de ADNfc podría originarse a partir de la hipohidroximetilación de ADNg en sangre observada en pacientes con cáncer de pulmón metastásico como se informó recientemente. Tomados en conjunto, estos resultados demostraron que la secuenciación de 5hmC fuera de las células se puede usar para la detección temprana del cáncer de pulmón, así como para controlar la progresión y la metástasis del cáncer de pulmón.
Para el HCC, se secuenció 5hmC fuera de las células de siete pacientes con infección por hepatitis B (HBV), porque la mayoría de los casos de HCC son secundarios a infecciones por hepatitis viral (Tabla 4). El análisis imparcial del nivel génico por tSNE reveló que existe un cambio gradual de 5hmC fuera de las células de sano a HBV y luego a HCC, reflejando el desarrollo de la enfermedad (Figura 3A). Los genes diferenciales específicos para HCC (valores q <0,001, veces que cambia > 1,41, 1.006 genes) podrían separar HCC de las muestras sanas y de la mayoría de las muestras de VHB (Figura 3B). Tanto los genes enriquecidos como los empobrecidos específicos de HCC se pueden identificar en comparación con otras muestras de ADNfc (Figura 3B), y los genes enriquecidos (379 genes) mostraron una mayor expresión en el tejido hepático en comparación con los genes empobrecidos (637 genes) (valores p < 2,2 x 10-16, prueba t de Welch) (Figura 9A), de acuerdo con el efecto permisivo de 5hmC sobre la expresión génica. Un ejemplo de genes enriquecidos con 5hmC específicos de HCC es AHSG, una proteína secretada altamente expresada en el hígado (Figura 3C y Figuras 9B-9C), y un ejemplo de genes empobrecidos en 5hmC específicos de HCC es MTBP, que se informó que inhibe la migración y metástasis de HCC y se subreguló en los tejidos de HCC (Figura 3d y datos extendidos de la Figura 5d). Juntos, estos resultados apuntan a un modelo en el que la infección por virus y el desarrollo de HCC conducen a un daño gradual del tejido hepático y una mayor presentación de ADN hepático en la sangre.
Para explorar más el potencial de 5hmC fuera de las células para controlar el tratamiento y la progresión de la enfermedad, se siguió a cuatro de los pacientes con HCC. Estos pacientes fueron sometidos a resección quirúrgica, de los cuales tres tenían enfermedad recurrente (Tabla 4). El análisis de muestras de plasma seriadas de estos pacientes (preoperatorio/preop; postoperatorio/potsop; y recurrencia) con tSNE reveló que las muestras postop se agruparon con muestras sanas, mientras que las muestras de recurrencia se agruparon con HCC (Figura 3E). Este patrón también se reflejó por cambios en el FPKM de 5hmC de AHSG y MTBP (Figuras 3C-3D). Como ejemplo del uso de 5hmC fuera de las células para rastrear el tratamiento y la progresión de1HCC, se empleó el análisis discriminante lineal (LDA) para definir una combinación lineal de los genes diferenciales específicos de1HCC (Figura 3B) en un solo valor (la puntuación de HCC) que mejor separó las muestras de HCC preoperatorias de las muestras sanas y de HBV. Luego se calculó la puntuación de HCC para las muestras de HCC potsop y recurrentes, y se demostró que la puntuación de HCC puede rastrear con precisión el tratamiento y los estados de recurrencia (Figura 5E). Juntos, estos resultados demuestran que la secuenciación de 5hmC fuera de las células es una herramienta poderosa para detectar el HCC, así como para controlar el resultado del tratamiento y la recurrencia de la enfermedad.
También se encontró que el cáncer de páncreas produce cambios drásticos en su hidroximetiloma fuera de las células, incluso en algunos pacientes con cáncer de páncreas en estadio temprano (Tabla 5). Al igual que e1HCC, el cáncer de páncreas conduce a genes 5hmC sobrerregulados y subregulados en comparación con los individuos sanos (valor q <0,01, veces que cambia > 2.713 genes) (Figura 10A). En las Figuras 6B-6E se muestran ejemplos de genes empobrecidos y enriquecidos con 5hmC específicos de cáncer de páncreas comparados con otras muestras de ADNfc. Estos resultados sugieren que la secuenciación de 5hmC fuera de las células puede ser potencialmente valiosa para la detección temprana del cáncer de páncreas.
Aunque ha habido un mayor interés en usar ADNfc como "biopsia líquida" para detección del cáncer ha sido un desafio identificar el origen del ADNfc del tumor, y por tanto, su ubicación. Estos resultados indican que el análisis de 5hmC fuera de las células podría resolver este problema ya que el análisis de tSNE de los siete tipos de cáncer muestra que el cáncer de pulmón, el HCC y el cáncer de páncreas mostraron firmas distintas y podrían separarse fácilmente entre sí y de muestras sanas (Figura 4A). Los otros cuatro tipos de cáncer mostraron cambios relativamente menores en comparación con las muestras sanas. El uso de otras características tales como la región promotora (5 kb secuencia arriba del sitio de inicio de la transcripción (TSS)) mostró patrones similares (Figura 11A). Se observa que ningún tipo de cáncer en particular que se probó se parecía al perfil de sangre completa (Figura 11B), lo que sugiere que la contaminación de las células sanguíneas no es una fuente significativa de variación. Todos los pacientes del panel se encuentran en el mismo intervalo de edad que los individuos sanos (Figura 11C y Tablas 2-9), por lo que es poco probable que la edad sea un factor de confusión. No se observó ningún efecto de lote (Figura 11D).
Para demostrar aún más el poder de ADNfc 5hmC como biomarcadores para predecir tipos de cáncer, se emplearon dos métodos de aprendizaje automático ampliamente utilizados, el modelo de mezcla normal y de árbol aleatorio. La predicción se centró en el HCC, el cáncer de páncreas, el cáncer de pulmón no metastásico y metastásico. Con base en tres reglas (véase más abajo), se identificaron 90 genes (Tabla 10) cuyos niveles promedio de 5hmC en el cuerpo del gen podían distinguir grupos de cáncer de grupos sanos u entre grupos de cáncer.
Tabla 10A. Conjunto de 90 características del cuerpo génico utilizado para la predicción del cáncer ASF1B GLP2R C2orf62 SPATA31E1 SLAMF7 INSC LINC00304 LOC100507410 DUSP26 IRF7 RNF34 AUNIP
TTC24 ADAMTS4 TPM4 DUSP28 RNF122 SLC9A3R2
LOC255411 ATP6V0A2 SYT2 COMMD6 POU4F3 SYT11
RFPL3 KIF16B SHISA2 EPPIN-WFDC6 CPLX2 SIGLEC10
FLJ31813 RAG1 SLC25A46 FLJ16779 ZNF284 GBX1
PAIP1 PTPN2 APCDD1L-AS1 SOX18 ZNF850 C8orf22 ZNF800 TMEM168 GMCL1P1 CLDN15 RDH11 ZNF423 PODXL2 ABRACL LOCI 00507250 NRADDP BAGE EPN3
THAP7-AS1 GSTP1 CTRC TRAM1 ALDH1A3 PSMG1
MAFF AMOTL1 IGSF9B CC2D1B HOXC5 LHX5
FENDRR LOC100128946 PAX1 TPO CRP LOC100131234
KIF20B NPAS4 STXBP3 ARL6IP6 TMEM65 ETAA1
GNPDA2 ALG10B DAZL LINC00158 TMX2 RBM14-RBM4
SORD HMOX2 LDHD ZNF444 AGFG2 DHRS3
En un segundo análisis usando un método diferente, los cuerpos de los genes enumerados en la Tabla 10B se identificaron como predictivos de cáncer.
Tabla 10B: Conjunto de las principales características del cuerpo del gen utilizado para la predicción de cáncer CLDN15 SLC25A47 ZRANB2 LOC100506963 STXBP3 GPR26
P2RX2 LOC100507410 LHX5 HOXC5 FAM96A CALCB
RNF223 SHISA2 SLAMF7 PAX1 DACH1 LOC100128946 ASF1B KIF16B SSR2 LARS DHRS3 CCDC33 GMCL1P1 COMMD6 SPATA31E1 ABRACL SAMD11 UBQLN4 TCEA3 SYT2 INSL4 RAG1 CCNL2 CRP
DDX11L1 LOC729737 WASH7P LOC100132287
Los loci diana analizados en el método descrito anteriormente pueden incluir uno o más (por ejemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más, por ejemplo, 15 o más o 20 o más de los cuerpos de los genes enumerados en las Tablas 10A y/o 10B, como se muestra más arriba.
Además del cuerpo del gen, el 5hmC en las regiones no codificantes podría servir potencialmente como biomarcador para predecir los tipos de cáncer. Se diseñó otro conjunto de características investigando cada una de las ventanas de 2 kb de todo el genoma e identificando hMR diferenciales (DhMR) para cada tipo de cáncer. Se identificaron 17 DhMR marcadores para los cuatro grupos de cáncer distintivos (Tabla 11A).
Tabla 11A. Conjunto de 17 características de DhMR utilizadas para la predicción de cáncer crom9: 88044001-88046000 crom1: 63972001-63974000 crom1: 114670001-114672000 crom2: 133888001-133890000 crom1: 37824001-37826000 crom8: 53686001-53688000 crom2: 49900001-49902000 crom5: 103492001-103494000 crom2: 137676001-137678000 crom2: 200922001-200924000 crom2: 41780001-41782000 crom3: 137070001-137072000 crom7: 11020001-11022000 crom4: 90790001-90792000 crom3: 93728001-93730000 crom3: 87312001-87314000 crom6: 45304001-45306000
En un segundo análisis usando un método diferente, los cuerpos de los genes enumerados en la Tabla 10B se identificaron como predictivos de cáncer.
Tabla 11B: Conjunto de características principales de DhMR utilizado para la predicción de cáncer crom4: 90790001-90792000 crom6: 45304001-45306000 crom1: 169422001-169424000 crom1: 67584001-67586000 crom5: 103492001-103494000 crom3: 87312001-87314000 crom2: 219148001-219150000 crom1: 198222001-198224000 crom8: 53686001-53688000 crom1: 239846001-239848000 crom3: 23318001-23320000 crom6: 122406001-122408000 crom9: 3496001-3498000 crom1: 24806001-24808000 crom8: 69672001-69674000 crom2: 49900001-49902000 crom3: 107894001-107896000 crom8: 42934001-42936000 crom3: 17352001-17354000 crom6: 157286001-157288000 crom3: 108506001-108508000 crom4: 39342001-39344000 crom6: 129198001-129200000 crom3: 137070001-137072000 crom1: 59248001-59250000 crom5: 83076001-83078000 crom3: 93728001-93730000
Claims (14)
1. Un método de secuenciación de ADN fuera de las células hidroximetilado (ADNfc) para generar un patrón de hidroximetilación para identificar la presencia o ausencia de un fenotipo de enfermedad en un sujeto, en el que dicho ADNfc se origina a partir de una muestra de sangre del paciente, comprendiendo el método:
añadir una etiqueta de afinidad sólo a moléculas de ADN hidroximetilado en una muestra de ADNfc obtenida de la muestra de sangre del paciente;
enriquecer las moléculas de ADN que están etiquetadas con la etiqueta de afinidad al unirse a un soporte; amplificar el ADN enriquecido sin liberar el ADN del soporte;
secuenciar las moléculas de ADN amplificadas para producir una pluralidad de lecturas de secuencia específicas para el paciente; y
asignar una pluralidad de lecturas de secuencia específicas para el paciente a cada una de una pluralidad de loci diana para identificar un patrón de hidroximetilación en el ADNfc que indica la presencia o ausencia del fenotipo de la enfermedad en el paciente.
2. El método de la reivindicación 1, que comprende, además antes de añadir la etiqueta de afinidad, añadir secuencias adaptadoras en los extremos del ADNfc para proporcionar ADNfc ligado al adaptador.
3. El método de la reivindicación 2, en el que el ADN enriquecido se amplifica usando cebadores que se unen a los adaptadores.
4. El método de la reivindicación 3, en el que la etiqueta de afinidad comprende una fracción de biotina.
5. El método de la reivindicación 4, en el que el soporte se une a la fracción de biotina.
6. El método de la reivindicación 4 o la reivindicación 5, en el que la etiqueta de afinidad se añade mediante un método que comprende:
incubar el ADNfc ligado al adaptador con una ADN p-glucosiltransferasa y glucosa UDP modificada con un grupo quimioselectivo, marcando así covalentemente las moléculas de ADN hidroximetilado en el ADNfc con el grupo quimioselectivo; y
unir la fracción de biotina al ADNfc quimioselectivamente modificado.
7. El método de cualquiera de las reivindicaciones 2 a 6, en el que las secuencias adaptadoras comprenden un código de barras molecular.
8. El método de la reivindicación 1, que comprende además determinar si una o más secuencias de ácido nucleico en el ADN hidroximetilado enriquecido están sobrerrepresentadas o subrepresentadas.
9. El método de la reivindicación 8, que comprende además hacer un diagnóstico, una decisión de tratamiento o un pronóstico basado en las secuencias de ácido nucleico que están sobrerrepresentadas o subrepresentadas.
10. El método de la reivindicación 9, en el que el diagnóstico, la decisión de tratamiento o el pronóstico comprende un diagnóstico de cáncer.
11. El método de cualquiera de las reivindicaciones 8-10, en el que los loci diana incluyen uno o más de los siguientes cuerpos de los genes: ABRACL, ADAMTS4, AGPG2, ALDH1A3, ALG IOB, AMOTLI, APCDDIL-ASI, ARL6IP6, ASPIB, ATP6V0A2, AUNIP, BAGE, C2orf62, C8orf22, CALCB, CC2D1B, CCDC33, CCNL2, CLDN15, COMMD6, CPLX2, CRP, CTRC, DACHI, DAZL, DDXIILI, DHRS3, DUSP26, DUSP28, EPN3, EPPIN-WPDC6, ETAAI, PAM96A, FENDRR, PU16779, PU31813, GBXI, GLP2R, GMCLIPI, GNPDA2, GPR26, GSTPI, HMOX2, HOXC5, IGSP9B, INSC, INSL4, IRF7, KIP16B, KIP20B, LARS, LDHD, LHX5, LINC00158, LINC00304, LOC100128946, LOC100131234, LOC100132287, LOC100506963, LOC100507250, LOC100507410, LOC255411, LOC729737, MAPP, NPAS4, NRADDP, P2RX2, PAIPI, PAXI, PODXL2, POU4P3, PSMGI, PTPN2, RAGI, RBM14-RBM4, RDHII, RPPL3, RNP122, RNP223, RNP34, SAMDII, SHISA2, SIGLECIO, SLAMP7, SLC25A46, SLC25A47, SLC9A3R2, SORD, SOX18, SPATA31EI, SSR2, STXBP3, SYTI1, SYT2, TCEA3, THAP7-AS1, TMEM168, TMEM65, TMX2, TPM4, TPO, TRAMI, TTC24, UBQLN4, WASH7P, ZNF284, ZNF423, ZNF444, ZNF800, ZNF850, y ZRANB2.
12. El método de cualquiera de las reivindicaciones 8 a 10, en el que los loci diana incluyen uno o más de los siguientes intervalos en el genoma de referencia de hg19:
crom1: 114670001-114672000, crom1: 169422001-169424000, crom1: 198222001-198224000, crom1: 239846001 239848000, crom1: 24806001-24808000, crom1: 3234001-3236000, crom1: 37824001-37826000, crom1: 59248001 59250000, crom1: 63972001-63974000, crom1: 67584001-67586000, crom1: 77664001-77666000, crom2: 133888001-133890000, crom2: 137676001-137678000, crom2: 154460001-154462000, crom2: 200922001 200924000, crom2: 213134001-213136000, crom2: 219148001-219150000, crom2: 41780001-41782000, crom2:
49900001-49902000, crom3: 107894001-107896000, crom3: 108506001-108508000, crom3: 137070001-137072000, crom3: 17352001-17354000, crom3: 23318001-23320000, crom3: 87312001-87314000, crom3: 93728001-93730000, crom4: 39342001-39344000, crom4: 90790001-90792000, crom5: 103492001-103494000, crom5: 39530001 39532000, crom5: 83076001-83078000, crom6: 122406001-122408000, crom6: 129198001-129200000, crom6: 156800001-156802000, crom6: 157286001-157288000, crom6: 45304001-45306000, crom7: 11020001-11022000, crom7: 13364001-13366000, crom8: 42934001-42936000, crom8: 53686001-53688000, crom8: 69672001-69674000, crom9: 3496001-3498000 y crom9: 88044001-88046000.
13. Un método de análisis de muestras, que comprende:
(a) determinar, usando el método de cualquiera de las reivindicaciones 1-12, qué secuencias se hidroximetilan en una primera muestra de ADNfc y cuyas secuencias se hidroximetilan en una segunda muestra de ADNfc, en la que la primera y segunda muestras de ADNfc se obtienen del mismo sujeto en dos puntos de tiempo diferentes; y (b) comparar el patrón de hidroximetilación de la primera muestra con el patrón de hidroximetilación de la segunda muestra para determinar si ha habido un cambio en la hidroximetilación con el tiempo.
14. El método de la reivindicación 13, en el que la comparación da como resultado un mapa de los cambios en la hidroximetilación en el curso de una enfermedad, afección o tratamiento de una enfermedad o afección.
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201662319702P | 2016-04-07 | 2016-04-07 | |
| US201762444122P | 2017-01-09 | 2017-01-09 | |
| US201762461712P | 2017-02-21 | 2017-02-21 | |
| PCT/US2017/025735 WO2017176630A1 (en) | 2016-04-07 | 2017-04-03 | Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free dna |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2882329T3 true ES2882329T3 (es) | 2021-12-01 |
Family
ID=60000634
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES17779593T Active ES2882329T3 (es) | 2016-04-07 | 2017-04-03 | Diagnóstico no invasivo por secuenciación de ADN fuera de las células 5-hidroximetilado |
Country Status (13)
| Country | Link |
|---|---|
| US (7) | US10718010B2 (es) |
| EP (2) | EP3440205B1 (es) |
| JP (2) | JP7143221B2 (es) |
| CN (1) | CN109312399B (es) |
| AU (1) | AU2017246318B2 (es) |
| DK (1) | DK3440205T3 (es) |
| ES (1) | ES2882329T3 (es) |
| MX (1) | MX391039B (es) |
| PL (1) | PL3440205T3 (es) |
| PT (1) | PT3440205T (es) |
| RU (1) | RU2742355C2 (es) |
| SG (1) | SG11201808775PA (es) |
| WO (1) | WO2017176630A1 (es) |
Families Citing this family (44)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010037001A2 (en) | 2008-09-26 | 2010-04-01 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
| ES2872073T3 (es) | 2011-12-13 | 2021-11-02 | Univ Oslo Hf | Procedimientos y kits de detección de estado de metilación |
| ES2669512T3 (es) | 2012-11-30 | 2018-05-28 | Cambridge Epigenetix Limited | Agente oxidante para nucleótidos modificados |
| WO2014191981A1 (en) | 2013-05-28 | 2014-12-04 | Ramot At Tel-Aviv University Ltd. | Detection of hydroxymethylcytosine bases |
| US10184154B2 (en) | 2014-09-26 | 2019-01-22 | Mayo Foundation For Medical Education And Research | Detecting cholangiocarcinoma |
| WO2016160454A1 (en) | 2015-03-27 | 2016-10-06 | Exact Sciences Corporation | Detecting esophageal disorders |
| US11459573B2 (en) | 2015-09-30 | 2022-10-04 | Trustees Of Boston University | Deadman and passcode microbial kill switches |
| US20170298422A1 (en) | 2016-04-18 | 2017-10-19 | The Board Of Trustees Of The Leland Stanford Junior University | Simultaneous single-molecule epigenetic imaging of dna methylation and hydroxymethylation |
| JP2021500883A (ja) | 2017-10-27 | 2021-01-14 | ジュノ ダイアグノスティックス,インク. | 超微量リキッドバイオプシーのためのデバイス、システム、および方法 |
| EP3737748A4 (en) | 2018-01-08 | 2021-10-20 | Ludwig Institute for Cancer Research Ltd | BISULFITE-FREE, BASE-RESOLVING IDENTIFICATION OF CYTOSINE MODIFICATIONS |
| AU2019222723B2 (en) | 2018-02-14 | 2023-10-12 | Clearnote Health, Inc. | Methods for the epigenetic analysis of DNA, particularly cell-free DNA |
| JP2021514663A (ja) * | 2018-03-08 | 2021-06-17 | セント・ジョーンズ・ユニバーシティSt. Johns University | 循環性血清無細胞dnaバイオマーカー及び方法 |
| CA3095030A1 (en) | 2018-03-30 | 2019-10-03 | Juno Diagnostics, Inc. | Deep learning-based methods, devices, and systems for prenatal testing |
| DE202019005627U1 (de) | 2018-04-02 | 2021-05-31 | Grail, Inc. | Methylierungsmarker und gezielte Methylierungssondenpanels |
| EP3810806B1 (en) | 2018-06-22 | 2025-09-03 | ClearNote Health, Inc. | Hydroxymethylation analysis of cell-free nucleic acid samples for assigning tissue of origin, and related methods of use |
| MX2021003164A (es) | 2018-09-19 | 2021-06-23 | Bluestar Genomics Inc | Perfiles de hidroximetilación de adn circulante en la evaluación de lesiones pancreáticas. |
| AU2019351130B2 (en) | 2018-09-27 | 2025-10-23 | GRAIL, Inc | Methylation markers and targeted methylation probe panel |
| MX2021003847A (es) | 2018-10-04 | 2021-05-27 | Bluestar Genomics Inc | Analisis simultaneo de proteinas, nucleosomas y acidos nucleicos libres de celula, basado en secuenciacion, de una muestra biologica individual. |
| CN112867495B (zh) * | 2018-10-19 | 2024-08-20 | 韩国生命工学研究院 | 包含syt11抑制剂作为活性成分的胃癌治疗组合物 |
| CN109321647A (zh) * | 2018-10-26 | 2019-02-12 | 苏州森苗生物科技有限公司 | 标记组合物及羟甲基化核酸文库的构建方法 |
| ES3013495T3 (en) | 2019-01-31 | 2025-04-14 | Guardant Health Inc | Method for isolating and sequencing cell-free dna |
| WO2020194057A1 (en) * | 2019-03-22 | 2020-10-01 | Cambridge Epigenetix Limited | Biomarkers for disease detection |
| WO2020198312A1 (en) * | 2019-03-27 | 2020-10-01 | Juno Diagnostics, Inc. | Optimized ultra-low volume liquid biopsy methods, systems, and devices |
| WO2020263978A1 (en) * | 2019-06-25 | 2020-12-30 | Accuragen Holdings Limited | Methods and systems for disease detection |
| CN120138085A (zh) | 2019-07-08 | 2025-06-13 | 路德维格癌症研究所 | 用于切割经修饰的靶dna的试剂盒 |
| WO2021026382A1 (en) * | 2019-08-06 | 2021-02-11 | Nooma Bio, Inc. | Logic driven polynucleotide scanning for mapping features in a nanopore device |
| CA3154354A1 (en) | 2019-10-31 | 2021-05-06 | William R. Taylor | Detecting ovarian cancer |
| US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
| US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
| US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
| US20230151409A1 (en) * | 2020-03-30 | 2023-05-18 | Vilnius University | Methods and compositions for noninvasive prenatal diagnosis through targeted covalent labeling of genomic sites |
| CN115989551A (zh) * | 2020-06-10 | 2023-04-18 | 国家医疗保健研究所 | 用于评估器官组织学数据的方法和相关设备 |
| MX2023001142A (es) | 2020-07-30 | 2023-05-25 | Cambridge Epigenetix Ltd | Composiciones y metodos para analisis de acidos nucleicos. |
| AU2021329899A1 (en) | 2020-08-19 | 2023-03-09 | Exact Sciences Corporation | Detecting non-hodgkin lymphoma |
| CN114613423A (zh) * | 2020-12-09 | 2022-06-10 | 上海易毕恩基因科技有限公司 | 用于弥漫大b细胞淋巴瘤化疗疗效预测的生物标志物 |
| WO2022165247A1 (en) | 2021-01-29 | 2022-08-04 | Mayo Foundation For Medical Education And Research | Detecting the presence or absence of multiple types of cancer |
| KR20240036638A (ko) * | 2021-07-20 | 2024-03-20 | 프리놈 홀딩스, 인크. | 핵산 시퀀싱에서 개선된 5-히드록시메틸화 시토신 분해능을 위한 조성물 및 방법 |
| CN113528616A (zh) * | 2021-07-26 | 2021-10-22 | 深圳泰莱生物科技有限公司 | 一种捕获cfDNA5hmC片段的检测方法 |
| CN115851934A (zh) * | 2021-09-17 | 2023-03-28 | 北京大学 | 一种单基因检测方法及其应用 |
| JP2024538697A (ja) * | 2021-10-08 | 2024-10-23 | マイクロノーマ,インク. | メタエピゲノミクスベースの疾患診断法 |
| CN115992203B (zh) * | 2022-07-26 | 2024-07-26 | 生工生物工程(上海)股份有限公司 | 一种全基因组羟甲基化捕获测序的文库构建方法 |
| CN115491414A (zh) * | 2022-09-21 | 2022-12-20 | 安徽中医药大学第一附属医院(安徽省中医院) | 类风湿关节炎全转录组m6A甲基化修饰差异表达的综合分析方法 |
| WO2024159053A1 (en) | 2023-01-25 | 2024-08-02 | Guardant Health, Inc. | Nucleic acid methylation profiling method |
| AU2024239768A1 (en) | 2023-03-22 | 2025-10-09 | Clearnote Health, Inc. | Cell-free dna analysis in the detection and monitoring of pancreatic cancer using a combination of features |
Family Cites Families (36)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5712126A (en) | 1995-08-01 | 1998-01-27 | Yale University | Analysis of gene expression by display of 3-end restriction fragments of CDNA |
| US5948902A (en) | 1997-11-20 | 1999-09-07 | South Alabama Medical Science Foundation | Antisense oligonucleotides to human serine/threonine protein phosphatase genes |
| US6287825B1 (en) | 1998-09-18 | 2001-09-11 | Molecular Staging Inc. | Methods for reducing the complexity of DNA sequences |
| US20050233340A1 (en) | 2004-04-20 | 2005-10-20 | Barrett Michael T | Methods and compositions for assessing CpG methylation |
| US20100273151A1 (en) * | 2004-05-28 | 2010-10-28 | Fred Hutchinson Cancer Research Center | Genome-wide analysis of palindrome formation and dna methylation |
| EP2687608B1 (en) * | 2005-06-08 | 2017-02-08 | Millennium Pharmaceuticals, Inc. | Methods for the identification, assessment, and treatment of patients with cancer therapy |
| WO2007087312A2 (en) | 2006-01-23 | 2007-08-02 | Population Genetics Technologies Ltd. | Molecular counting |
| CN101720359A (zh) | 2007-06-01 | 2010-06-02 | 454生命科学公司 | 从多重混合物中识别个别样本的系统和方法 |
| WO2009032167A1 (en) | 2007-08-29 | 2009-03-12 | Illumina Cambridge | Method for sequencing a polynucleotide template |
| WO2010037001A2 (en) | 2008-09-26 | 2010-04-01 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
| WO2010048337A2 (en) * | 2008-10-22 | 2010-04-29 | Illumina, Inc. | Preservation of information related to genomic dna methylation |
| US20100323348A1 (en) | 2009-01-31 | 2010-12-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process |
| ES2469092T3 (es) * | 2009-04-01 | 2014-06-17 | Dxterity Diagnostics Incorporated | Amplificación de sondas dependiente de ligamiento químico (CLPA) |
| US9034597B2 (en) * | 2009-08-25 | 2015-05-19 | New England Biolabs, Inc. | Detection and quantification of hydroxymethylated nucleotides in a polynucleotide preparation |
| US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
| US8969061B2 (en) * | 2010-01-20 | 2015-03-03 | New England Biolabs, Inc. | Compositions, methods and related uses for cleaving modified DNA |
| WO2011127136A1 (en) | 2010-04-06 | 2011-10-13 | University Of Chicago | Composition and methods related to modification of 5-hydroxymethylcytosine (5-hmc) |
| US20120034603A1 (en) * | 2010-08-06 | 2012-02-09 | Tandem Diagnostics, Inc. | Ligation-based detection of genetic variants |
| EP3115468B1 (en) | 2010-09-21 | 2018-07-25 | Agilent Technologies, Inc. | Increasing confidence of allele calls with molecular counting |
| US20120122087A1 (en) | 2010-11-17 | 2012-05-17 | Weiwei Li | 5-Hydroxymethylcytosine as a biomarker for early detection, treatment and prognostic monitoring of cancer |
| US9611510B2 (en) | 2011-04-06 | 2017-04-04 | The University Of Chicago | Composition and methods related to modification of 5-methylcytosine (5-mC) |
| AU2012242847B2 (en) | 2011-04-15 | 2017-01-19 | The Johns Hopkins University | Safe sequencing system |
| ES2855130T3 (es) | 2012-02-17 | 2021-09-23 | Hutchinson Fred Cancer Res | Composiciones y métodos para identificar mutaciones de manera precisa |
| DK2828218T3 (da) | 2012-03-20 | 2020-11-02 | Univ Washington Through Its Center For Commercialization | Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing |
| US9732390B2 (en) * | 2012-09-20 | 2017-08-15 | The Chinese University Of Hong Kong | Non-invasive determination of methylome of fetus or tumor from plasma |
| CA3043574C (en) | 2012-11-26 | 2023-09-19 | The University Of Toledo | Methods for standardized sequencing of nucleic acids and uses thereof |
| EP2971100A1 (en) * | 2013-03-13 | 2016-01-20 | Sequenom, Inc. | Primers for dna methylation analysis |
| WO2015021282A1 (en) * | 2013-08-09 | 2015-02-12 | New England Biolabs, Inc. | Detecting, sequencing and/or mapping 5-hydroxymethylcytosine and 5-formylcytosine at single-base resolution |
| RU2688435C2 (ru) * | 2013-08-19 | 2019-05-21 | Эбботт Молекьюлар Инк. | Набор для получения реакционной смеси для синтеза 3′-o-пропаргил-модифицированной нуклеиновой кислоты |
| RU2688485C2 (ru) * | 2014-01-07 | 2019-05-21 | Фундасио Привада Институт Де Медисина Предиктива И Персоналицада Дель Кансер | Способы получения библиотек двухцепочечных днк и способы секвенирования для идентификации метилированных цитозинов |
| CA2938451C (en) * | 2014-01-30 | 2023-10-17 | The Regents Of The University Of California | Methylation haplotyping for non-invasive diagnosis (monod) |
| GB201405226D0 (en) * | 2014-03-24 | 2014-05-07 | Cambridge Entpr Ltd | Nucleic acid preparation method |
| PT3152331T (pt) * | 2014-06-06 | 2019-11-05 | Univ Cornell | Método para identificação e enumeração de alterações de sequência de ácidos nucleicos, expressão, cópia ou metilação de adn, utilizando reações de nuclease, ligase, polimerase e sequenciação combinadas |
| EP2975116B1 (en) * | 2014-07-16 | 2019-08-21 | Max-Delbrück-Centrum für Molekulare Medizin | Tgif2-induced reprogramming of hepatic cells to pancreatic progenitor cells and medical uses thereof |
| WO2016153434A1 (en) * | 2015-03-24 | 2016-09-29 | Agency For Science, Technology And Research (A*Star) | Normalization methods for measuring gene copy number and expression |
| US11162139B2 (en) | 2016-03-02 | 2021-11-02 | Shanghai Epican Genetech Co. Ltd. | Method for genomic profiling of DNA 5-methylcytosine and 5-hydroxymethylcytosine |
-
2017
- 2017-04-03 JP JP2018553116A patent/JP7143221B2/ja active Active
- 2017-04-03 SG SG11201808775PA patent/SG11201808775PA/en unknown
- 2017-04-03 EP EP17779593.7A patent/EP3440205B1/en active Active
- 2017-04-03 WO PCT/US2017/025735 patent/WO2017176630A1/en not_active Ceased
- 2017-04-03 PL PL17779593T patent/PL3440205T3/pl unknown
- 2017-04-03 ES ES17779593T patent/ES2882329T3/es active Active
- 2017-04-03 CN CN201780031390.0A patent/CN109312399B/zh active Active
- 2017-04-03 MX MX2018012156A patent/MX391039B/es unknown
- 2017-04-03 EP EP21167021.1A patent/EP3929290A1/en not_active Withdrawn
- 2017-04-03 AU AU2017246318A patent/AU2017246318B2/en active Active
- 2017-04-03 RU RU2018138848A patent/RU2742355C2/ru active
- 2017-04-03 PT PT177795937T patent/PT3440205T/pt unknown
- 2017-04-03 DK DK17779593.7T patent/DK3440205T3/da active
-
2018
- 2018-09-28 US US16/146,807 patent/US10718010B2/en active Active
-
2020
- 2020-04-14 US US16/848,515 patent/US20200248249A1/en not_active Abandoned
- 2020-04-14 US US16/848,498 patent/US20200248248A1/en not_active Abandoned
- 2020-04-14 US US16/848,482 patent/US20200283838A1/en active Pending
- 2020-04-15 US US16/849,071 patent/US20200299760A1/en not_active Abandoned
- 2020-04-15 US US16/849,067 patent/US20200277667A1/en not_active Abandoned
- 2020-04-15 US US16/848,989 patent/US20200277666A1/en active Pending
-
2022
- 2022-06-07 JP JP2022092184A patent/JP2022120007A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| RU2018138848A3 (es) | 2020-12-15 |
| US20200299760A1 (en) | 2020-09-24 |
| AU2017246318B2 (en) | 2023-07-27 |
| SG11201808775PA (en) | 2018-11-29 |
| JP7143221B2 (ja) | 2022-09-28 |
| JP2022120007A (ja) | 2022-08-17 |
| US20200248248A1 (en) | 2020-08-06 |
| DK3440205T3 (da) | 2021-08-16 |
| US20200283838A1 (en) | 2020-09-10 |
| AU2017246318A2 (en) | 2018-11-08 |
| MX2018012156A (es) | 2019-02-07 |
| WO2017176630A1 (en) | 2017-10-12 |
| AU2017246318A1 (en) | 2018-11-08 |
| EP3440205B1 (en) | 2021-05-26 |
| EP3440205A1 (en) | 2019-02-13 |
| JP2019520791A (ja) | 2019-07-25 |
| EP3929290A1 (en) | 2021-12-29 |
| EP3440205A4 (en) | 2019-04-03 |
| PL3440205T3 (pl) | 2021-11-22 |
| CA3019836A1 (en) | 2017-10-12 |
| PT3440205T (pt) | 2021-08-06 |
| RU2018138848A (ru) | 2020-05-12 |
| CN109312399B (zh) | 2023-02-03 |
| US10718010B2 (en) | 2020-07-21 |
| RU2742355C2 (ru) | 2021-02-05 |
| CN109312399A (zh) | 2019-02-05 |
| US20200248249A1 (en) | 2020-08-06 |
| MX391039B (es) | 2025-03-21 |
| US20200277667A1 (en) | 2020-09-03 |
| US20190017109A1 (en) | 2019-01-17 |
| US20200277666A1 (en) | 2020-09-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2882329T3 (es) | Diagnóstico no invasivo por secuenciación de ADN fuera de las células 5-hidroximetilado | |
| JP7504854B2 (ja) | 個別的エピゲノミクスのための天然クロマチンへの転移 | |
| ES2969767T3 (es) | Métodos de diagnóstico | |
| CN113227468A (zh) | 感染性疾病的检测和预测 | |
| TW201833329A (zh) | 腫瘤檢測之方法及系統 | |
| JP2020527340A (ja) | セルフリーdna中のdnaメチル化を評価するための方法およびシステム | |
| ES2936408T3 (es) | Método de detección múltiple de ADN metilado | |
| JP2015517321A (ja) | 定量的多重メチル化特異的PCR法−cMethDNA、試薬、及びその使用 | |
| CN112176057B (zh) | 利用CpG位点甲基化水平检测胰腺导管腺癌的标志物及其应用 | |
| WO2023226938A1 (zh) | 甲基化生物标记物、试剂盒及用途 | |
| CN114107498B (zh) | 结直肠癌血液检测标记物及其应用 | |
| KR20240046525A (ko) | 세포-유리 dna에 대한 tet-보조 피리딘 보란 시퀀싱과 관련된 조성물 및 방법 | |
| CN111032868A (zh) | 用于评估无细胞dna中的dna甲基化的方法和系统 | |
| CN116940693A (zh) | 癌症检查试剂组、癌症检查试剂组的制造方法及癌症检查方法 | |
| CA3019836C (en) | Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free dna | |
| JP2020014415A (ja) | がんの診断用バイオマーカー | |
| WO2022181496A1 (ja) | バイサルファイト試薬の評価方法及び遺伝子検査方法 | |
| HK40026251A (en) | Methods and systems for evaluating dna methylation in cell-free dna |