ES2706227T3 - Análisis de expresión génica en células individuales - Google Patents
Análisis de expresión génica en células individuales Download PDFInfo
- Publication number
- ES2706227T3 ES2706227T3 ES15190426T ES15190426T ES2706227T3 ES 2706227 T3 ES2706227 T3 ES 2706227T3 ES 15190426 T ES15190426 T ES 15190426T ES 15190426 T ES15190426 T ES 15190426T ES 2706227 T3 ES2706227 T3 ES 2706227T3
- Authority
- ES
- Spain
- Prior art keywords
- cdna
- cells
- mrna
- cell
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 title claims description 85
- 238000004458 analytical method Methods 0.000 title description 28
- 239000002299 complementary DNA Substances 0.000 claims abstract description 202
- 238000000034 method Methods 0.000 claims abstract description 145
- 108020004999 messenger RNA Proteins 0.000 claims abstract description 95
- 230000003321 amplification Effects 0.000 claims abstract description 36
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 36
- 230000000295 complement effect Effects 0.000 claims abstract description 26
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 24
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 20
- 239000003550 marker Substances 0.000 claims abstract description 14
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 5
- 108020004394 Complementary RNA Chemical group 0.000 claims abstract description 3
- 239000003184 complementary RNA Chemical group 0.000 claims abstract description 3
- 238000010804 cDNA synthesis Methods 0.000 claims description 176
- 125000003729 nucleotide group Chemical group 0.000 claims description 42
- 238000012163 sequencing technique Methods 0.000 claims description 41
- 239000002773 nucleotide Substances 0.000 claims description 38
- 230000008859 change Effects 0.000 claims description 33
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 claims description 28
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 150000007523 nucleic acids Chemical class 0.000 claims description 23
- 102000039446 nucleic acids Human genes 0.000 claims description 19
- 108020004707 nucleic acids Proteins 0.000 claims description 19
- 108091034117 Oligonucleotide Proteins 0.000 claims description 12
- 229940104302 cytosine Drugs 0.000 claims description 12
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 claims description 9
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 claims description 9
- 239000000839 emulsion Substances 0.000 claims description 9
- 229940029575 guanosine Drugs 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 239000000178 monomer Substances 0.000 claims description 2
- 239000002342 ribonucleoside Substances 0.000 claims description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims 2
- 229960002685 biotin Drugs 0.000 claims 1
- 235000020958 biotin Nutrition 0.000 claims 1
- 239000011616 biotin Substances 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 367
- 108020004635 Complementary DNA Proteins 0.000 description 159
- 108090000623 proteins and genes Proteins 0.000 description 70
- 238000003752 polymerase chain reaction Methods 0.000 description 60
- 239000000523 sample Substances 0.000 description 56
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 29
- 108091033319 polynucleotide Proteins 0.000 description 28
- 102000040430 polynucleotide Human genes 0.000 description 28
- 239000002157 polynucleotide Substances 0.000 description 28
- 210000001519 tissue Anatomy 0.000 description 21
- 239000011324 bead Substances 0.000 description 20
- 239000012634 fragment Substances 0.000 description 20
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 18
- 238000009396 hybridization Methods 0.000 description 18
- 239000000872 buffer Substances 0.000 description 17
- 239000000203 mixture Substances 0.000 description 17
- 238000010839 reverse transcription Methods 0.000 description 17
- 238000000746 purification Methods 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 12
- 102100034343 Integrase Human genes 0.000 description 12
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 12
- 101150087690 ACTB gene Proteins 0.000 description 11
- 238000009826 distribution Methods 0.000 description 11
- 239000011541 reaction mixture Substances 0.000 description 11
- 238000003753 real-time PCR Methods 0.000 description 11
- 239000000499 gel Substances 0.000 description 10
- 239000007787 solid Substances 0.000 description 10
- 108700024394 Exon Proteins 0.000 description 9
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- -1 Pou5f1 Proteins 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 8
- 238000002493 microarray Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 229930024421 Adenine Natural products 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 7
- 238000003559 RNA-seq method Methods 0.000 description 7
- 229960000643 adenine Drugs 0.000 description 7
- 230000009089 cytolysis Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 7
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 6
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 6
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 6
- 102000016911 Deoxyribonucleases Human genes 0.000 description 6
- 108010053770 Deoxyribonucleases Proteins 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 6
- 239000002771 cell marker Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 229940035893 uracil Drugs 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 5
- 108091093037 Peptide nucleic acid Proteins 0.000 description 5
- 238000010790 dilution Methods 0.000 description 5
- 239000012895 dilution Substances 0.000 description 5
- 238000010438 heat treatment Methods 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 5
- 235000000346 sugar Nutrition 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 101100224389 Mus musculus Dppa5a gene Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000006037 cell lysis Effects 0.000 description 4
- 238000011109 contamination Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 230000002438 mitochondrial effect Effects 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 101150092532 CALB1 gene Proteins 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 101150063564 DPPA3 gene Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 101000976622 Homo sapiens Zinc finger protein 42 homolog Proteins 0.000 description 3
- 108700021430 Kruppel-Like Factor 4 Proteins 0.000 description 3
- 101100445364 Mus musculus Eomes gene Proteins 0.000 description 3
- 101000976618 Mus musculus Zinc finger protein 42 Proteins 0.000 description 3
- 102000009572 RNA Polymerase II Human genes 0.000 description 3
- 108010009460 RNA Polymerase II Proteins 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- 101100445365 Xenopus laevis eomes gene Proteins 0.000 description 3
- 102100023550 Zinc finger protein 42 homolog Human genes 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000022131 cell cycle Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 3
- 210000001671 embryonic stem cell Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 229940088598 enzyme Drugs 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000010208 microarray analysis Methods 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108020004418 ribosomal RNA Proteins 0.000 description 3
- 210000000130 stem cell Anatomy 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 101100080292 Aspergillus oryzae (strain ATCC 42149 / RIB 40) pltp gene Proteins 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 2
- 101100239628 Danio rerio myca gene Proteins 0.000 description 2
- 101150099612 Esrrb gene Proteins 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 101150072501 Klf2 gene Proteins 0.000 description 2
- 108700043518 MT-RNR2 Proteins 0.000 description 2
- 101150039798 MYC gene Proteins 0.000 description 2
- 101100190814 Mus musculus Pltp gene Proteins 0.000 description 2
- 206010029260 Neuroblastoma Diseases 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 101150041192 Otx1 gene Proteins 0.000 description 2
- 108700005081 Overlapping Genes Proteins 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 102000004243 Tubulin Human genes 0.000 description 2
- 108090000704 Tubulin Proteins 0.000 description 2
- 101100459258 Xenopus laevis myc-a gene Proteins 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 238000004945 emulsification Methods 0.000 description 2
- 101150003286 gata4 gene Proteins 0.000 description 2
- 210000001654 germ layer Anatomy 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 210000004153 islets of langerhan Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000005298 paramagnetic effect Effects 0.000 description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical group [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 2
- 108010056274 polo-like kinase 1 Proteins 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 108090000850 ribosomal protein S14 Proteins 0.000 description 2
- 102000004314 ribosomal protein S14 Human genes 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical compound NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- HTOVHZGIBCAAJU-UHFFFAOYSA-N 2-amino-2-propyl-1h-purin-6-one Chemical compound CCCC1(N)NC(=O)C2=NC=NC2=N1 HTOVHZGIBCAAJU-UHFFFAOYSA-N 0.000 description 1
- USCCECGPGBGFOM-UHFFFAOYSA-N 2-propyl-7h-purin-6-amine Chemical compound CCCC1=NC(N)=C2NC=NC2=N1 USCCECGPGBGFOM-UHFFFAOYSA-N 0.000 description 1
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 description 1
- 102100023679 40S ribosomal protein S28 Human genes 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 1
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical compound O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 1
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 1
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- 102100035322 60S ribosomal protein L24 Human genes 0.000 description 1
- 102100026926 60S ribosomal protein L4 Human genes 0.000 description 1
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 1
- PFUVOLUPRFCPMN-UHFFFAOYSA-N 7h-purine-6,8-diamine Chemical compound C1=NC(N)=C2NC(N)=NC2=N1 PFUVOLUPRFCPMN-UHFFFAOYSA-N 0.000 description 1
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical compound NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 1
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 1
- 229960005508 8-azaguanine Drugs 0.000 description 1
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010083123 CDX2 Transcription Factor Proteins 0.000 description 1
- 102000006277 CDX2 Transcription Factor Human genes 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 101150057182 GFAP gene Proteins 0.000 description 1
- 101710113436 GTPase KRas Proteins 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 101000623076 Homo sapiens 40S ribosomal protein S28 Proteins 0.000 description 1
- 101000685323 Homo sapiens Succinate dehydrogenase [ubiquinone] flavoprotein subunit, mitochondrial Proteins 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 101100473053 Mus musculus Hnrnpab gene Proteins 0.000 description 1
- 102100032063 Neurogenic differentiation factor 1 Human genes 0.000 description 1
- 108050000588 Neurogenic differentiation factor 1 Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000003867 Phospholipid Transfer Proteins Human genes 0.000 description 1
- 108090000216 Phospholipid Transfer Proteins Proteins 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 102000017528 Ribosomal protein L35 Human genes 0.000 description 1
- 108050005789 Ribosomal protein L35 Proteins 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 102100023155 Succinate dehydrogenase [ubiquinone] flavoprotein subunit, mitochondrial Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102100027654 Transcription factor PU.1 Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000011166 aliquoting Methods 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 102000014823 calbindin Human genes 0.000 description 1
- 108060001061 calbindin Proteins 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000003436 cytoskeletal effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- CHNUOJQWGUIOLD-NFZZJPOKSA-N epalrestat Chemical compound C=1C=CC=CC=1\C=C(/C)\C=C1/SC(=S)N(CC(O)=O)C1=O CHNUOJQWGUIOLD-NFZZJPOKSA-N 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- YQOKLYTXVFAUCW-UHFFFAOYSA-N guanidine;isothiocyanic acid Chemical compound N=C=S.NC(N)=N YQOKLYTXVFAUCW-UHFFFAOYSA-N 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000000370 laser capture micro-dissection Methods 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 108091064355 mitochondrial RNA Proteins 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 210000003061 neural cell Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000005305 organ development Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 125000001181 organosilyl group Chemical group [SiH3]* 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000002685 polymerization catalyst Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 108010008929 proto-oncogene protein Spi-1 Proteins 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108010025463 ribosomal protein L24 Proteins 0.000 description 1
- 108090000893 ribosomal protein L4 Proteins 0.000 description 1
- 108090000842 ribosomal protein S18 Proteins 0.000 description 1
- 102000004296 ribosomal protein S18 Human genes 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 101150005399 sod2 gene Proteins 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000012085 transcriptional profiling Methods 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales, comprendiendo el método las etapas de: (i) liberar ARNm de cada célula individual para proporcionar una pluralidad de muestras de ARNm individuales, en las que el ARNm en cada muestra de ARNm individual es de una única célula; (ii) sintetizar una primera cadena de ADNc a partir del ARNm en cada muestra de ARNm individual con un cebador de síntesis de una primera cadena de ADNc (CDS) que comprende una secuencia de un cebador de amplificación (APS) en 5' y una secuencia complementaria de ARN (RCS) que es al menos parcialmente complementaria a uno o más ARNm en una muestra de ARNm individual, en donde el RCS comprende oligo (dT), hexámeros aleatorios o una secuencia semi-aleatoria no auto-complementaria, e incorporar un marcador al ADNc para proporcionar una pluralidad de muestras de ADNc marcadas, en donde el ADNc en cada muestra de ADNc marcada es complementario al ARNm de una única célula; y en donde el marcador incorporado es un marcador distinto o una combinación distinta de marcadores, de manera que cada muestra de ADNc tiene una etiqueta o combinación de etiquetas diferente; (iii) agrupar las muestras de ADNc marcadas; y (iv) amplificar las muestras de ADNc agrupadas para generar una biblioteca de ADNc que comprende ADNc bicatenario
Description
DESCRIPCIÓN
Análisis de expresión génica en células individuales
Campo de la invención
La presente invención se refiere al análisis de la expresión génica en células individuales. En particular, la invención se refiere a un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales, y a una biblioteca de ADNc producida por este método. Las bibliotecas de ADNc preparadas por el método de la invención son adecuadas para análisis de la expresión génica por secuenciación.
Antecedentes de la invención
La determinación del contenido de ARNm de una célula o tejido (es decir “perfil de expresión génica”) proporciona un método para el análisis funcional de tejidos y órganos normales y enfermos. Por ejemplo, puede usarse el perfil de expresión génica en el estudio de embriogénesis; para la caracterización de muestras tumorales primarias; para el análisis de biopsias de tejido enfermo y normal, por ejemplo, en psoriasis; para el análisis comparativo de tipos celulares de especies diferentes para delinear la evolución del desarrollo; como un sistema de ensayo para diagnóstico; como un sistema de control de calidad en terapia de reemplazo celular (es decir para asegurar que un cultivo de células sea suficientemente puro, y las células se diferencien correctamente); y como una herramienta in vitro para medir el efecto de un gen transfectado o ARNip en dianas cadena abajo a pesar de una eficacia de transfección menor del 100 %.
El perfil de expresión génica se realiza habitualmente aislando ARNm de muestras tisulares y sometiendo este ARNm a hibridación de micromatriz. Sin embargo, dichos métodos permiten solamente analizar genes previamente conocidos, y no pueden usarse para analizar corte y empalme alternativo, promotores y señales de poliadenilación. Por lo tanto, la secuenciación directa de todo, o partes, del contenido de ARNm de un tejido se está usando crecientemente (Cloonan et al., Nat Methods 5(7): 613-9 (2008)). Sin embargo, los métodos actuales de analizar el contenido de ARNm de células por secuenciación directa se basan en el análisis de ARNm en masa obtenido de muestras tisulares que típicamente contienen millones de células. Esto significa que mucha de la información funcional presente en células individuales se pierde o se distorsiona cuando la expresión génica se analiza en ARNm en masa. Además, no pueden observarse procesos dinámicos, tales como el ciclo celular, en promedios de población. De forma similar, solamente pueden estudiarse tipos celulares distintos en un tejido complejo (por ejemplo, el cerebro) si las células se analizan individualmente.
La expresión génica en células individuales se ha analizado previamente usando una diversidad de métodos (véase, por ejemplo, Brail et al., Mutat Res 406(2-4): 45-54 (1999); Levsky et al., Science 297(5582): 836-40 (2002); Bengtsson et al. Cenóme Res 15(10): 1388-92 (2005); Esumi et al., Nat Genet 37(2): 171-6 (2005)). En particular, la expresión génica de células individuales en células neurales se ha estudiado por análisis de micromatrices (véase Esumi et al. Neurosa Res 60(4): 439-51 (2008)). Sin embargo, estos métodos requieren que cada célula individual se analice individualmente y se trate por separado durante el procedimiento completo, que consume tiempo y es caro. Además, la preparación y amplificación de muestras de células individuales introduce potencialmente de forma independiente variación entre células. Además, ya que el ADNc de cada célula debe amplificarse hasta una cantidad que puede manipularse razonablemente para el análisis posterior, hay un desvío de amplificación potencial. Por ejemplo, una célula individual contiene aproximadamente 0,3 pg de ARNm, y se necesitan habitualmente al menos 300 ng para análisis posterior por secuenciación. Por lo tanto, se requiere una amplificación de al menos un millón de veces.
Adicionalmente, las micromatrices tienen dos defectos principales: están ligadas a genes conocidos, y tienen una sensibilidad y rango dinámico limitados. La secuenciación de ARN (ARN-Sec) supera estos problemas secuenciando el ARN directamente (Ozsolak et al., Nature 461: 814-818 (2009)) o después de transcripción inversa a ADNc (Cloonan et al., Nat. Methods 5: 613-619 (2008); Mortazavi et al., Nat. Methods 5: 621-628 (2008); Wang et al., Nature 456: 470-476 (2008)). Las lecturas de secuencia se mapean en el genoma para revelar sitios de transcripción y la cuantificación se basa simplemente en recuentos de aciertos, con gran sensibilidad y rango dinámico casi ilimitado.
Los tejidos son pocas veces homogéneos, sin embargo, y por lo tanto cualquier perfil de expresión basado en una muestra tisular, biopsia o cultivo celular confundirá los verdaderos perfiles de expresión de sus células constituyentes. Un modo de evitar este problema sería analizar células individuales en lugar de poblaciones celulares, y de hecho se han desarrollado métodos de células individuales para ambas micromatrices (Esumi et al., Neurosci. Res. 60: 439-451 (2008) y Kurimoto et al., Nucleic Acids Res. 34: 42 (2006)). Estos métodos son adecuados para el análisis de números pequeños de células individuales, y en particular pueden usarse para estudiar células que son difíciles de obtener en grandes números, tales como oocitos y las células del embrión temprano. Las células pueden aislarse por ejemplo por microdisección de captura de láser o por microcapilaridad, y
pueden usarse genes marcadores para localizar células de interés. Sin embargo, los transcriptomas de una única célula deben enfrentarse a dos grandes retos. En primer lugar, los marcadores adecuados para el aislamiento prospectivo de poblaciones celulares definidas no están disponibles para cada tipo celular, lo que refleja el hecho de que pocos tipos celulares están claramente definidos en términos moleculares. En segundo lugar, las abundancias de transcritos varían en gran medida de célula a célula. Por ejemplo, el contenido de ARNm de p-actina (Actb) varía más de tres órdenes de magnitud entre células de islotes pancreáticos (Bengtsson et al., Genome Res. 15: 1388 1392 (2005)). Se han presentado resultados similares, usando una diversidad de métodos de detección, para ARN polimerasa II (Raj et al, PLoS Biol 4: 309 (2006)), GAPDH (Lagunavicius et al., RNA 15: 765-771 (2009) y Warren et al, Proc. Nati. Acad. Sci. U.S.A. 103: 17807-17812 (2006)), PU.1 (Warren et al, mencionado anteriormente) y ARNm de TBP, B2M, SDHA y EE1FG (Taniguchi et al, Nat Methods 6: 503-506 (2009)) y en la actualidad parece ser una característica común del transcriptoma.
La mayoría de la variación puede ser intrínseca, provocada por activación estocástica de tipo estallido de transcripción, cuando breves episodios de síntesis de ARNm que duran varios minutos están separados por periodos de silencio transcripcional de duración similar (Chubb et al, Curr Biol 16: 1018-1025 (2006)). Cada estallido daría lugar a una población densa de ARNm en el núcleo, que se exporta después al citoplasma y rápidamente se degrada. Como consecuencia, una muestra aleatoria de células mostraría gran variación en su contenido de ARNm particulares, variando de las células que acaban de experimentar un estallido, a las que han degrado casi completamente su ARNm; esto se ha observado directamente para la transcripción de ARN polimerasa II in situ usando una sonda fluorescente que se dirigía a la repetición de 52 copias en ese gen (Raj et al, PLoS Biol 4: 309 (2006)).
En resumen, con frecuencia no hay marcadores de superficie celular adecuados para usar en el aislamiento de células individuales para su estudio, incluso cuando los hay, un número pequeño de células individuales no es suficiente para capturar el intervalo de variación natural en la expresión génica. La presente invención intenta superar, o reducir, estos problemas proporcionando un método para preparar bibliotecas de ADNc que pueden usarse para analizar la expresión génica en una pluralidad de células individuales.
Sumario de la invención
La descripción proporciona un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales. En un aspecto, el método incluye las etapas de liberar ARNm de cada célula individual para proporcionar una pluralidad de muestras de ARNm individuales, sintetizar una primera cadena de ADNc a partir del ARNm en cada muestra de ARNm individual e incorporar un marcador en el ADNc para proporcionar una pluralidad de muestras de ADNc marcadas, agrupar las muestras de ADNc marcadas y amplificar las muestras de ADNc agrupadas para generar una biblioteca de ADNc que tenga ADNc bicatenario. La invención también proporciona una biblioteca de ADNc producida por los métodos descritos en el presente documento. La descripción proporciona además métodos para analizar la expresión génica en una pluralidad de células preparando una biblioteca de ADNc como se describe en el presente documento y secuenciando la biblioteca.
Breve descripción de los dibujos
Se pretende que las figuras ilustren conceptos amplios de la invención por referencia a ejemplos representativos para facilidad de análisis.
La Figura 1, paneles A-F, muestra una visión de conjunto de un método para analizar la expresión génica en una pluralidad de células individuales. (A) El tejido de interés se disecciona; (B) se selecciona una pluralidad de células individuales; (C) se colocan células individuales en pocillos separados de una placa de 96 pocillos y se lisan, se realiza transcripción inversa marcada en cada muestra para producir ADNc; (D) se agrupan y amplifican muestras de ADNc; (E) se realiza secuenciación para obtener 100 millones de lecturas; y (F) identificación de genes expresados e identificación de células de las que se originaron.
La Figura 2 muestra la síntesis de ADNc por cambio de molde.
La Figura 3 muestra un ejemplo de oligonucleótido de cambio de molde que comprende una secuencia de cebador de amplificación 5' (APS), un marcador celular y una secuencia 3' para cambio de molde.
La Figura 4 muestra un ejemplo de un cebador de síntesis de ADNc (CDS) que comprende una secuencia de cebador de amplificación 5' (APS), un marcador celular y una secuencia complementaria de ARN 3' (RCS).
La Figura 5 muestra la visualización de muestras de ADNc L001 y L002 después de la amplificación de ADNc de longitud completa por PCR. Carril 1: escalera de marcadores de 100 pb; carriles 2-3: 25 ciclos; carriles 4-5: 30 ciclos; carriles 6-7: 35 ciclos. Los carriles pares contienen la muestra L001 y los carriles impares contienen la muestra L002. La Figura 6 muestra una serie de diluciones de una PCR de ensayo usando la muestra L001 (carriles 3-10). Los carriles 2 y 11 contienen una escalera de 100 pb como un marcador de tamaño.
La Figura 7, paneles A y B, muestra la separación por electroforesis en gel y el aislamiento de bibliotecas de ADNc. El panel A muestra una biblioteca de ADNc después de la amplificación final por PCR (16 ciclos) (carriles 5 y 6). El panel B muestra que la región de 125-200 pb se ha escindido. Los carriles 3 y 8 contienen una escalera de 100 pb como un marcador de tamaño.
La Figura 8 muestra un ejemplo de una molécula de ADNc secuenciada a partir de una biblioteca de ADNc
marcada. Las secuencias de cebadores para secuenciación por SOLiD (P1 y P2) están subrayadas. El marcador específico de célula está encuadrado. Las 2-5 G del mecanismo de cambio de molde están sombreadas en una caja gris. La secuencia del vector de clonación TOPO se muestra en cursiva. El inserto en este caso es tubulina beta 2c. La Figura 9 muestra una representación gráfica de resultados de una PCR en tiempo real cuantitativa que compara el ADNc en masa (eje horizontal) frente a ADNc marcado de 96 células (eje vertical). Cada círculo representa un par de cebadores de PCR dirigido contra los genes indicados. Las unidades son arbitrarias y derivan del valor de ciclos hasta umbral, Ct.
La Figura 10, paneles A-E, muestra una visión en conjunto del método de transcripción inversa marcado con células individuales (STRT) y resultados ejemplares. (A) Visión de conjunto del método, que ilustra como se siguieron las células individuales. Se incorporaron códigos de barras específicos de pocillo (y por tanto específicos de célula) durante la síntesis de ADNc, dando como resultado una biblioteca en la que cada molécula portaba un código de barras que identificaba la célula de origen. (B) Ejemplo de lecturas mapeadas en ambas cadenas del locus de Pou5f1 de 5 kb, mostrado como una representación de cobertura. Las lecturas fueron específicas de cadena y se mapearon principalmente en exones. El fondo no de ARNm fue mínimo como se valoró por aciertos en intrones en la cadena directa (carril superior) o la cadena inversa (carril inferior). (C) Comparación con ARN-Sec convencional (Cloonan et al. Nat. Methods 5: 613-619 (2008)) para el locus Nanog de 6 kb. Ya que la síntesis de ADNc se cebó desde la cola de poli(A), las lecturas se agruparon típicamente en el extremo 3' (carril superior). La UTR 3' extendida de Nanog (azul claro) se detectó claramente por ambos métodos. Las lecturas de SQRL se extendieron a exones 5', pero mostraron más fondo intrónico. (D) El genoma mitocondrial. Como se esperaba, la transcripción se detectó casi exclusivamente en la cadena H (parte superior), originándose solamente algunos transcritos truncados (flecha) en la cadena L. Los genes codificantes de proteínas se indican en la parte inferior. (E) Expresión génica en el cromosoma 19. La cobertura en las cadenas directa (carril superior) e inversa (medio) estaba altamente correlacionada con la densidad génica local (inferior). Los genes se muestran como barras apiladas horizontales. Para mayor claridad, las escalas verticales en (B-E) están truncadas a la mitad de los valores máximos.
La Figura 11, paneles A-F, muestra representación gráfica de etapas usadas opcionalmente en el método de STRT. El panel A muestra una etapa de trascripción inversa. Un cebador de oligo dT con cola dirige la síntesis de una cadena de ADNc. Cuando se alcanza el final del ARN molde, la transcriptasa inversa añade 3-4 C en 3' de la cadena de ADNc (debido a su actividad transferasa terminal). El panel B muestra una etapa de cambio de molde. El oligo auxiliar con código de barras hibrida de forma transitoria, y la síntesis de ADNc continúa usando el oligo como molde. Como consecuencia, el extremo 3' del ADNc portará un código de barras (XXXX), secuencias de reconocimiento de BtsCI (Bts) y secuencias de hibridación de cebadores (Pr). El panel C muestra una única etapa de PCR de cebadores. Los extremos del ADNc tienen secuencias idénticas y se amplifican usando un único cebador de PCR, que ayuda a suprimir amplicones cortos. El panel D muestra una etapa de fragmentación. La biblioteca amplificada se fragmenta a 200 - 300 pb usando digestión con DNasa controlada. El panel E muestra una inmovilización y etapa de reparación de extremos. Los fragmentos tanto 5' (con código de barras (Br) y sitio BtsCI (Bts)) como 3' se unen con perlas, mientras que los fragmentos internos se retiran por lavado. El panel F muestra liberación de fragmentos y ligamiento con el adaptador. Se liberan fragmentos 5' por digestión con BtsCI, dejando solamente el código de barras (Bc) y el inserto (área blanca). Los fragmentos 3' permanecen unidos a las perlas. Se ligan los adaptadores compatibles con extremos apareados de Genome Analyzer (P1 y P2). La biblioteca se secuencia desde el cebador P1 (y podría opcionalmente secuenciarse también desde P2). Las lecturas de P1 comienzan con un código de barras de 5 pb, seguido de 3-4 G, seguido del inserto de ADNc. Las lecturas de P2 producirían solamente secuencia de ADNc.
La Figura 12, paneles A-D, muestra una representación gráfica de una ausencia de motivos que rodean el sitio de cambio de molde. Todas las lecturas se examinaron en la muestra L006 con respecto a la presencia de cualquier motivo alrededor del sitio de cambio de molde (es decir, alrededor del extremo 5' de cada lectura). Se muestran los logos de secuencia para las 20 bases de secuencia genómica cadena arriba y cadena abajo del primer nucleótido (flecha) de cada lectura mapeada. Como se ejemplifican en A y B, en casos típicos (92 de 96), no se detectó ningún motivo fuerte, lo que indica una ausencia de acontecimientos de cebado erróneo significativos, que habrían generado un motivo cadena arriba complementario al cebador. En cuatro casos (C y D), hubo una preferencia general de secuencias ricas en T particularmente en las primeras 20 bases de la lectura. Esto se produjo en pocillos con números muy pequeños de lecturas, lo que indica una reacción fallida. Sin embargo, en un caso individual el motivo rico en T se observó a pesar de un gran número de lecturas.
La Figura 13, paneles A y B, muestra una representación gráfica de puntos calientes para cambio de molde. (A) El locus de Actb se expresa a partir de la cadena inferior (inversa), de derecha a izquierda en la figura. Las dos pistas superiores muestran aciertos de agregados en las cadenas directa e inversa, respectivamente, lo que demuestra especificidad de cadena y falta de fondo en intrones. La pista media (azul) muestra la estructura de exones/intrones del gen. La pista inferior muestra aciertos individuales de células individuales. Cada fila de píxeles representa los aciertos de una célula individual como puntos negros. Hay 96 filas de píxeles en total. (B) Se realizó el mismo análisis para Sox2, un gen de un único exón transcrito en la cadena directa (superior), que muestra el desvío 3' habitual. Tanto en (A) como en (B), los puntos calientes eran claramente visibles, y se compartían entre células, lo que sugiere que representan sitios estructurales en ARNm que favorecen la terminación de la síntesis de ADNc, hidrólisis de ARN y/o cambio de molde.
La Figura 14, paneles A y B, muestra una representación gráfica de la nueva tasa de descubrimiento. (A) Muestra la tasa de descubrimiento de lecturas de mapeo distintas en función del número total de lecturas. Ninguna de las muestras se secuenció hasta saturación, y la mayoría de las bibliotecas contendrían habitualmente al menos 3
millones de moléculas distintas, lo que indica que en promedio al menos 30.000 moléculas distintas por célula se convirtieron con éxito en ADNc amplificable. Las curvas son onduladas debido a heterogeneidades en los datos, supuestamente causadas por imperfecciones en el proceso de PCR de grupos que pueden generar duplicados locales y por lo tanto muestreo no aleatorio. En (B) la tasa de descubrimiento de características anotadas distintas se muestra en función del número de lecturas mapeadas (para la muestra L006). La saturación se alcanzó rápidamente, lo que muestra que la mayoría de las características presentes en la muestra podrían descubrirse a profundidad de toma de muestras modesta.
La Figura 15 muestra una representación gráfica para distinguir la expresión de genes solapantes. Debido a la especificidad de cadena del mecanismo de cambio de molde, el número de cadenas podría mantenerse durante todo el protocolo. Esto fue especialmente importante para genes con exones solapantes. Se representa en la figura un ejemplo de dicho par de genes, Catepsina A (Ctsa) y proteína de transferencia de Fosfolípidos (Pltp), cuyos últimos exones se solapan. Sin información de cadena, las lecturas en los últimos cuatro exones de Pltp no podrían distinguirse de las lecturas que se originan en el último exón de Ctsa. Hay aproximadamente 3.000 genes con exones 3' solapantes similares.
La Figura 16 muestra una representación gráfica de desvío de longitud para transcritos. Para detectar cualquier desvío contra transcritos cortos o largos, se calculó el nivel de expresión promedio en función de la longitud de ARNm (en grupos de 200 pb) para la muestra L019. Cada barra muestra el nivel de expresión de genes con transcritos más cortos que la longitud indicada (por lo tanto la primera barra contiene transcritos de 0 - 200 pb de longitud). Sobre una amplia serie de longitudes de ARNm, no hubo ninguna diferencia evidente en los niveles de expresión medidos. Los transcritos más cortos (<200 pb) se suprimían supuestamente por la etapa de purificación en gel en la que se seleccionaron insertos de > 100 pb. La sobreexpresión aparente de genes en el intervalo de 400 - 800 pb puede explicarse posiblemente por un cambio de molde más eficaz en este intervalo, en el que la síntesis de ADNc con frecuencia alcanzaría el extremo 5' de ARNm. Como alternativa, puede deberse simplemente a la presencia de algunos genes muy altamente expresados en este intervalo, incluyendo Dppa5 y Rps14.
La Figura 17, paneles A-E, muestra una representación gráfica de la precisión cuantitativa del método de STRT. (A) La distribución de los niveles de expresión génica en transcritos por millón (t.p.m.) mostraron predominantemente expresión baja, en el intervalo de 10 - 100 t.p.m. (B) La comparación de las secuencias de dos células hasta una profundidad de aproximadamente 500.000 lecturas/célula. En este caso, los genes por debajo de 100 t.p.m. podrían cuantificarse con precisión. (C) Comparación de dos células secuenciadas hasta aproximadamente 100.000 lecturas/célula. En este caso, la sensibilidad descendió hasta aproximadamente 1000 t.p.m. (D) Probabilidad de detección en función del nivel de expresión. Cada punto muestra un gen, con un nivel de expresión promedio dado (entre todas las células) y fracción de células que tienen expresión no cero de este gen. La distribución aborda el límite teórico de la toma de muestras aleatoria dada la profundidad real de secuenciación usada aquí (línea discontinua). (E) Comparación con PCR en tiempo real cuantitativa para las cuatro células ES mostradas en (B) y (C), usando marcadores seleccionados de pluripotencialidad y diferenciación. En general, la precisión cuantitativa fue buena, con un único falso positivo potencial (Eomes en Célula ES n° 4). Sin embargo este fue un acontecimiento poco común, y no se observó para este gen en ninguna de las otras 160 células ES examinadas. Se convirtieron los niveles de Q-PCR a t.p.m. por normalización del par de cebadores Actb/1081 con las células ES n° 1 y n° 2. Después se midió independientemente la actina usando un par de cebadores diferente (Actb/1832) para confirmar la precisión de la normalización.
La Figura 18 muestra una comparación gráfica entre STRT, Q-PCR y análisis de micromatrices. Los genes que se esperaba que se expresaran (Actb, Pou5f1; Zfp42, Sox2, Klf4, Nanog, Plk1, Zic3) o que no se expresaran (Gata4, Brachyury, Eomes, Otx1, Cdx2, Gata5, Calb1, Gfap, Dppa3 y NeuroD1) en células ES indiferenciadas se analizaron por sTrT, PCR en tiempo real cuantitativa (Q-PCR) y micromatriz Illumina. Hubo una buena correlación entre STRT y Q-PCR, y en menor grado con datos de micromatrices. En particular, Sox2 apareció poco en la micromatriz, mientras que Otx1 y Dppa3 fueron falsos positivos aparentes. Los datos de micromatrices son la medida de dos reacciones de hibridación, se realización Q-PCR por duplicado y se repitió una vez para confirmación, y los datos de STRT son la media de 160 células ES individuales.
La Figura 19, paneles A y B, muestra una representación gráfica de la distribución de expresión génica entre células. (A) muestra la distribución de los niveles de expresión de Actb entre todas las células usando STRT. (B) muestra la expresión de Actb en células de islotes pancreáticos de Bengtsson et al. Genome Res 15(10): 1388-92 (2005) para comparación.
La Figura 20 muestra un análisis de componentes principales. Para descubrir y agrupar tipos celulares basándose en datos de expresión, las cinco muestras de 96 células preparadas independientemente se sometieron a análisis de componentes principales. Los tres tipos de células (ES, Neuro-2A y MEF) claramente se agruparon por separado, aunque los m Ef no formaron un grupo muy definido. Además, las células ES preparadas de forma independiente se agruparon entre sí, lo que muestra que la PCA no captó simplemente diferencias en la preparación de muestras. Esto demuestra que los datos de expresión de células individuales pueden usarse para clasificar con precisión tipos celulares.
La Figura 21, paneles A-C, muestra una visualización basada en gráficos (“mapeo celular”) del patrón de expresión. (A) Las células, representadas por nodos gráficos (círculos) se extendieron aleatoriamente, y se dibujaron los bordes a partir de cada célula a las otras cinco células con las que estaba más altamente correlacionada. (B) Se usó la distribución dirigida por fuerza para trazar la gráfica en un plano. En esta distribución, las células se repelían entre sí uniformemente, pero se mantuvieron juntas por los bordes que actuaban como resortes elásticos. El mapa visual resultante fue coherente con las identidades celulares conocidas (células ES frente a células Neuro-2A), mostrando
algunas células menos profundamente secuenciadas escasa separación. (C) La adición de más células ES así como fibroblastos (MEF) expandió el mapa y demostró que las células ES preparadas de forma independiente se agrupaban juntas con precisión.
La Figura 22 muestra la visualización de la expresión génica en un mapa celular de la Figura 21. Cada mapa conserva su distribución de la Figura 21C, pero las células se sombrean de acuerdo con la expresión del gen indicado. Se usó una escala logarítmica (superior derecha). El ARN 2 de ribosoma mitocondrial (mt_Rnr2) fue el gen más expresado de todos. Se detectaron genes constitutivos tales como Actina (Actb) y la proteína ribosómica L4 (Rp14) en todos los tipos celulares, pero no en cada célula individual. La potencia del perfil de expresión de células individuales al azar se reveló para genes poco expresados como K-ras (Kras), que se detectó solamente en aproximadamente la mitad de las células, pero aún se expresaba claramente en todos los tipos celulares. La calbindina (Calb1) estaba ausente, como se esperaba y se confirmó por Q-PCR. Un conjunto de marcadores celulares de ES bien conocidos (Dppa5, Sox2, Sa114, Pou5f1, Nanog, Zfp42, Zic3 y Esrrb) estaban claramente expresados específicamente en el grupo de células ES, mientras que Klf4, Myc y Klf2 estaban más ampliamente distribuidos. Dppa3 no se detectó, como se confirmó por Q-PCR (Figura 18).
Descripción detallada de la invención
La presente descripción proporciona métodos y composiciones para el análisis de la expresión génica en células individuales o en una pluralidad de células individuales. En particular, la divulgación proporciona métodos para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales. Los métodos se basan en la determinación de los niveles de expresión génica a partir de una población de células individuales, que pueden usarse para identificar variaciones naturales en la expresión génica en un nivel célula a célula. Los métodos también pueden usarse para identificar y caracterizar la composición celular de una población de células en ausencia de marcadores de superficie celular adecuados. Los métodos descritos en el presente documento también proporcionan la ventaja de generar una biblioteca de ADNc representativa de contenido de ARN en una población celular usando células individuales, mientras que bibliotecas de ADNc preparadas por métodos clásicos típicamente requieren ARN total aislado de una población grande (véase Ejemplo 1). Por lo tanto, una población de ADNc producida usando los métodos de la invención proporciona al menos representación equivalente del contenido de ARN en una población de células utilizando una subpoblación menor de células individuales junto con ventajas adicionales como se describe en el presente documento.
Las realizaciones de la descripción también proporcionan toma de muestras de un gran número de células individuales. Usando similitud de patrones de expresión, puede construirse un mapa de células que muestre cómo las células se relacionan entre sí. Este mapa puede usarse para distinguir tipos celulares por ordenador, detectando grupos de células estrechamente relacionadas (véase Ejemplo II). Por la toma de muestras pueden usarse similitud de patentes de expresión de no solamente algunas, sino de grandes números de células individuales, para construir un mapa de células y cómo se relacionan entre sí. Este método permite acceso a datos de expresión puros de cada tipo de célula distinto presente en una población, sin la necesidad de purificación previa de esos tipos celulares. Además, cuando están disponibles marcadores conocidos, estos pueden usarse por ordenador para delinear células de interés. La validez de este enfoque se muestra en el Ejemplo II, que analiza una colección de células mostradas de tres tipos celulares distintos (células madre embrionarias de ratón, fibroblastos embrionarios y células de neuroblastoma) de distintos orígenes embrionarios (células madre pluripotenciales frente a capas germinales mesodérmicas y ectodérmicas) y patología (normal frente a transformada).
Las realizaciones de la idivulgación proporcionan un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales liberando ARNm de cada célula individual para proporcionar una pluralidad de muestras individuales, en el que ARNm en cada muestra de ARNm individual es de una célula individual, sintetizando una primera cadena de ADNc a partir del ARNm en cada muestra de ARNm individual e incorporando un marcador en el ADNc para proporcionar una pluralidad de muestras de ADNc marcadas, en el que el ADNc en cada muestra de ADNc marcada es complementario de ARNm de una célula individual agrupando las muestras de ADNc marcadas y amplificando las muestras de ADNc agrupadas para generar una biblioteca de ADNc que comprende ADNc bicatenario. Utilizando el método anterior, es factible preparar muestras para secuenciar a partir de varios cientos de células individuales en un tiempo corto y con una cantidad mínima de trabajo. Los métodos tradicionales para preparar una biblioteca de fragmentos de ARN para secuenciar incluyen etapas de escisión en gel que son trabajosas. En ausencia de equipamiento especial, no es conveniente preparar más de unas cuantas muestras en paralelo. En algunos aspectos de los métodos descritos en el presente documento, se prepara un conjunto de 96 células como una única muestra (después de síntesis de ADNc), lo que hace factible preparar varios cientos de células para secuenciación. Adicionalmente, la variación técnica se minimiza porque cada conjunto de 96 células se prepara junto (en único tubo).
En algunos aspectos de la invención, cada muestra de ADNc obtenida de una única célula se marca, lo que permite analizar la expresión génica al nivel de una única célula. Esto permite estudiar los procesos dinámicos, tales como el ciclo celular, y analizar distintos tipos celulares en un tejido complejo (por ejemplo el cerebro). En algunos aspectos de la invención, las muestras de ADNc pueden agruparse antes de su análisis. La agrupación de las muestras simplifica la manipulación de las muestras de cada célula individual y reduce el tiempo requerido para analizar la
expresión génica en las células individuales, lo que permite un análisis de alto rendimiento de la expresión génica. El agolpamiento de las muestras de ADNc antes de su amplificación también proporciona la ventaja de que prácticamente se elimina la variación técnica entre muestras. Además, como las muestras de ADNc se agrupan antes de la amplificación, se requiere menos amplificación para generar suficientes cantidades de ADNc para un análisis posterior en comparación con la amplificación y el tratamiento de muestras de ADNc de cada célula individual por separado. Esto reduce el desvío de amplificación, y también significa que cualquier desvío será similar entre todas las células usadas para proporcionar muestras de ADNc agrupadas. Tampoco se requiere purificación de ARN, almacenamiento y manipulación, lo que ayuda a eliminar problemas provocados por la naturaleza inestable del ARN.
Como las bibliotecas de ADNc producidas por el método de la invención son adecuadas para análisis de los perfiles de expresión génica de células individuales por secuenciación directa, es posible usar estas bibliotecas para estudiar la expresión de genes que no se conocían previamente, y también analizar el corte y empalme alternativo, promotores y señales de poliadenilación. La preparación de las bibliotecas de ADNc como se describe en el presente documento, proporciona un método sensible para detectar un transcrito de ARN individual o de bajo número de copias. La sensibilidad del método se muestra en la Figura 17D y se describe en el Ejemplo II. Por ejemplo, se detectan genes expresados a 100 transcritos por millón (t.p.m.) aproximadamente el 50 % de las veces. Sin embargo, como se muestra en la Figura 14A, las muestras no se saturaron, de modo que hay sensibilidad adicional que puede conseguirse con secuenciación más profunda de las muestras. En consecuencia, el método para preparar las bibliotecas de ADNc como se describe en el presente documento detecta un transcrito de ARN individual o de bajo número de copias al menos el 30 % de las veces, como alternativa al menos el 40 % de las veces, al menos el 50 % de las veces, como alternativa al menos el 60 % de las veces, como alternativa al menos el 70 % de las veces, como alternativa al menos el 80 % de las veces, como alternativa al menos el 90 % de las veces o como alternativa al menos el 95 % de las veces.
Las realizaciones de la descripción también proporcionan un método para identificar un tipo celular individual de una muestra y/o determinar el transcriptoma de una célula individual preparando una biblioteca de ADNc como se describe en el presente documento, determinar los niveles de expresión de células individuales en una población, y mapear las células individuales basándose en la similitud de los patrones de expresión. El mapeo de células individuales puede realizarse por ordenador por un experto en la materia y en particular utilizando los métodos descritos en el presente documento, tal como se muestra en el Ejemplo II. El número de células necesario para determinar la frecuencia de un tipo celular dado en la pluralidad de células seguirá una distribución binomial. Por ejemplo, pueden tomarse muestras de un número predeterminado de células individuales de modo que se espere detectar al menos diez del tipo deseado. En consecuencia, si la frecuencia del tipo celular en la muestra es del 10 %, será necesario preparar y analizar como se describe en el presente documento una biblioteca de ADNc de aproximadamente 100 células.
La expresión “biblioteca de ADNc” se refiere a una colección de fragmentos de ADN complementario (ADNc) clonado, que constituyen juntos alguna parte del transcriptoma de una célula individual o una pluralidad de células individuales. Se produce ADNc a partir de ARNm completamente transcrito hallado en una célula y por lo tanto contiene solamente los genes expresados de una única célula o cuando se agrupan entre sí los genes expresados de una pluralidad de células individuales.
Como se usa en el presente documento, una “pluralidad” se refiere a una población de células y puede incluir cualquier número de células que se desea analizar. En algunos aspectos de la descripción, una pluralidad de células incluye al menos 10 células, como alternativa al menos 25 células, como alternativa al menos 50 células, como alternativa al menos 100 células, como alternativa al menos 200 células, como alternativa al menos 500 células, como alternativa al menos 1000 células, como alternativa 5.000 células o como alternativa 10.000 células. En otro aspecto de la descripción, una pluralidad de células incluye de 10 a 100 células, como alternativa de 50 a 200 células, como alternativa de 100 a 500 células, como alternativa de 100 a 1000, o como alternativa de 1.000 a 5.000 células.
La expresión “amplificación” o “amplificar” se refiere a un proceso por el que se forman copias extra o múltiples de un polinucleótido particular. La amplificación incluye métodos tales como PCR, amplificación por ligamiento (o reacción en cadena de la ligasa, LCR) y métodos de amplificación. Estos métodos se conocen y se practican ampliamente en la técnica. Véase, por ejemplo, Patente de Estados Unidos n° 4.683.195 y 4.683.202 e Innis et al., "PCR protocols: a guide to method and applications" Academic Press, Incorporated (1990) (para PCR); y Wu et al. (1989) Genomics 4: 560-569 (para LCR). En general, el procedimiento de PCR describe un método de amplificación génica que está comprendido por (i) hibridación específica de secuencia de cebadores con genes específicos dentro de una muestra de ADN (o biblioteca), (ii) amplificación posterior que implica múltiples ciclos de hibridación, elongación y desnaturalización usando una ADN polimerasa, y (iii) exploración de los productos de PCR con respecto a una banda del tamaño correcto. Los cebadores usados son oligonucleótidos de longitud suficiente y secuencia apropiada para proporcionar inicio de polimerización, es decir cada cebador se diseña específicamente para que sea complementario de cada cadena del locus genómico para amplificar.
En el comercio se dispone de reactivos y hardware para realizar una reacción de amplificación. Los cebadores útiles para amplificar secuencias de una región génica particular son preferentemente complementarios de, e hibridan específicamente con, secuencias en la región diana o en sus regiones flanqueantes, y pueden prepararse usando las secuencias polinucleotídicas proporcionadas en el presente documento. Las secuencias de ácido nucleico generadas por amplificación pueden secuenciarse directamente.
Cuando se produce hibridación en una configuración antiparalela entre dos polinucleótidos monocatenarios, la reacción se denomina “hibridación” y los polinucleótidos se describen como “complementarios”. Un polinucleótido bicatenario puede ser complementario u homólogo de otro polinucleótido, si puede producirse hibridación entre una de las cadenas del primer polinucleótido y el segundo. La complementariedad u homología (el grado en que un polinucleótido es complementario de otro) es cuantificable en términos de la proporción de bases en cadenas opuestas que se espera que formen enlaces de hidrógeno entre sí, de acuerdo con las normas de formación de pares de bases aceptadas en general.
Como se usa en el presente documento, una “célula individual” se refiere a una célula. Pueden obtenerse células individuales útiles en los métodos descritos en el presente documento de un tejido de interés, o de una biopsia, muestra de sangre o cultivo celular. Adicionalmente, pueden obtenerse células de órganos específicos, tejidos, tumores, neoplasias o similares y usarse los métodos descritos en el presente documento. Además, en general, pueden usarse en los métodos células de cualquier población, tal como una población de organismos unicelulares procariotas o eucariotas incluyendo bacterias o levaduras. En algunos aspectos de la descripción, el método para preparar la biblioteca de ADNc puede incluir la etapa de obtener células individuales. Puede obtenerse una suspensión de células individuales usando métodos convencionales conocidos en la técnica incluyendo, por ejemplo, enzimáticamente usando tripsina o papaína para digerir proteínas que conectan células en muestras tisulares o liberar células adherentes en cultivo, o mecánicamente separando células en una muestra. Pueden colocarse células individuales en cualquier recipiente de reacción adecuado en el que puedan tratarse individualmente células individuales, por ejemplo una placa de 96 pocillos, de modo que cada célula individual se coloca en un único pocillo.
Se conocen en la técnica métodos para manipular células individuales e incluyen separación de células activadas por fluorescencia (FACS), micromanipulación y el uso de seleccionadores de células semiautomáticos (por ejemplo, el sistema de transferencia de células Quixell™ de Stoelting Co.). Las células individuales pueden seleccionarse, por ejemplo, individualmente basándose en características detectables por observación microscópica, tales como localización, morfología o expresión de gen indicador.
En algunos aspectos de la descripción, puede liberarse ARNm de las células lisando las células. El análisis puede conseguirse, por ejemplo, calentando las células, o mediante el uso de detergentes u otros métodos químicos, o por una combinación de estos. Sin embargo, puede usarse cualquier método de lisis adecuado conocido en la técnica. Puede usarse provechosamente un procedimiento de lisis suave para prevenir la liberación de cromatina nuclear, evitando de este modo la contaminación genómica de la biblioteca de ADNc y para minimizar la degradación de ARN. Por ejemplo, calentar las células a 72 °C durante 2 minutos en presencia de Tween-20 es suficiente para lisar las células sin dar como resultado contaminación genómica detectable de la cromatina nuclear. Como alternativa, las células pueden calentarse a 65 °C durante 10 minutos en agua (Esumi et al., Neurosci Res 60(4): 439-51 (2008)); o 70 °C durante 90 segundos en tampón de PCR II (Applied Biosystems) complementado con NP-400,5 % (Kurimoto et al., Nucleic Acids Res 34(5): e42 (2006)); o puede conseguirse lisis con una proteasa tal como Proteinasa K o mediante el uso de sales caotrópicas tales como guanidina isotiocianato (Publicación de Estados Unidos n° 2007/0281313).
Puede realizarse síntesis de ADNc a partir de ARNm en los métodos descritos en el presente documento directamente en lisados celulares, de modo que se añada una mezcla de reacción para transcripción inversa directamente a lisados celulares. Como alternativa, puede purificarse ARNm después de su liberación de las células. Esto puede ayudar a reducir la contaminación mitocondrial y ribosómica. Puede conseguirse purificación de ARNm por cualquier método conocido en la técnica, por ejemplo, uniendo el ARNm con una fase sólida. Los métodos de purificación usados habitualmente incluyen perlas paramagnéticas (por ejemplo, Dynabeads). Como alternativa, pueden retirarse selectivamente contaminantes específicos, tales como ARN ribosómico usando purificación de afinidad.
Se sintetiza típicamente ADNc a partir de ARNm por transcripción inversa. Se han descrito previamente métodos para sintetizar ADNc a partir de cantidades pequeñas de ARNm, incluyendo de células individuales (Kurimoto et al., Nucleic Acids Res 34(5): e42 (2006): Kurimoto et al., Nat Protoc 2(3): 739-52 (2007); y Esumi et al., Neurosci Res 60(4): 439-51 (2008)). Para generar un ADNc amplificable, estos métodos introducen una secuencia de hibridación de cebadores en ambos extremos de cada molécula de ADNc de tal modo que la biblioteca de ADNc puede amplificarse usando un único cebador. El método de Kurimoto usa una polimerasa para añadir una cola de poli A 3' a la cadena de ADNc, que puede después amplificarse usando un cebador de oligo T universal. Por el contrario, el método de Esumi usa un método de cambio de molde para introducir una secuencia arbitraria en el extremo 3' del ADNc, que se diseña para ser complementaria inversa de la cola 3' del cebador de síntesis de ADNc. De nuevo, la
biblioteca de ADNc puede amplificarse por un único cebador de PCR. La PCR de un único cebador aprovecha el efecto de supresión de PCR para reducir la amplificación de amplicones contaminantes cortos y dímeros de cebadores (Dai et al., J Biotechnol 128(3): 435-43 (2007)). Como los dos extremos de cada amplicón son complementarios, los amplicones cortos formarán horquillas estables, que son malos moldes para PCR. Esto reduce la cantidad de ADNc truncado y mejora el rendimiento de moléculas de ADNc más largas.
En algunos aspectos de la invención, la síntesis de la primera cadena del ADNc puede dirigirse por un cebador de síntesis de ADNc (CDS) que incluye una secuencia complementaria de ARN (RCS). En algunos aspectos de la invención, la RCS es al menos parcialmente complementaria de uno o más ARNm en una muestra de ARNm individual. Esto permite que el cebador, que es típicamente un oligonucleótido, hibride con al menos algo de ARNm en una muestra de ARNm individual para dirigir la síntesis de ADNc usando el ARNm como molde. La RCS puede comprender oligo (dT), o ser específica de familia génica, tal como una secuencia de ácidos nucleicos presente en todos o una mayoría de los genes relacionados, o puede estar compuesta de una secuencia aleatoria, tal como hexámeros aleatorios. Para evitar que el CDS sea cebador de sí mismo y por lo tanto genere productos secundarios indeseados, puede usarse una secuencia semialeatoria no autocomplementaria. Por ejemplo, puede excluirse una letra del código genético, o puede usarse un diseño más complejo restringiendo al mismo tiempo el CDS para que sea no autocomplementario.
Los términos “oligonucleótido” y “polinucleótido” se usan indistintamente y se refieren a una forma polimérica de nucleótidos de cualquier longitud, bien desoxirribonucleótidos o bien ribonucleótidos o análogos de los mismos. Los polinucleótidos pueden tener cualquier estructura tridimensional y pueden realizar cualquier función, conocida o desconocida. Los siguientes son ejemplos no limitantes de polinucleótidos: un gen o fragmento génico (por ejemplo, una sonda, un cebador, EST o marcador SAGE), exones, intrones, ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ribozimas, ADNc polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas y cebadores de ácido nucleico. Un polinucleótido puede comprender nucleótidos modificados, tales como nucleótidos metilados y análogos de nucleótidos. El término también se refiere a moléculas tanto bicatenarias como monocatenarias. A no ser que se especifique o requiera de otro modo, cualquier realización que comprenda un polinucleótido abarca tanto la forma bicatenaria como cada una de las dos formas monocatenarias complementarias que se sabe o se predice que componen la forma bicatenaria.
Un polinucleótido está compuesto de una secuencia específica de cuatro bases nucleotídicas: adenina (A); citosina (C); guanina (G); timina (T); y uracilo (U) en lugar de timina cuando el polinucleótido es de ARN. Por lo tanto, la expresión secuencia polinucleotídica es la representación alfabética de una molécula polinucleotídica. Esta representación alfabética puede introducirse en bases de datos en un ordenador que tenga una unidad de procesamiento central y usarse para aplicaciones bioinformáticas tales como genómica funcional y búsqueda de homología.
Un “cebador” es un polinucleótido corto, generalmente con un grupo OH 3' libre que se une con una diana o un molde potencialmente presente en una muestra de interés hibridando con la diana, y a continuación promoviendo la polimerización de un polinucleótido complementario de la diana. Los cebadores de la presente invención están comprendidos por nucleótidos que varían de 17 a 30 nucleótidos. En un aspecto, el cebador es de al menos 17 nucleótidos, como alternativa, al menos 18 nucleótidos, como alternativa, al menos 19 nucleótidos. como alternativa, al menos 20 nucleótidos, como alternativa, al menos 21 nucleótidos, como alternativa, al menos 22 nucleótidos, como alternativa, al menos 23 nucleótidos, como alternativa, al menos 24 nucleótidos, como alternativa, al menos 25 nucleótidos, como alternativa, al menos 26 nucleótidos, como alternativa, al menos 27 nucleótidos, como alternativa, al menos 28 nucleótidos, como alternativa, al menos 29 nucleótidos, como alternativa, al menos 30 nucleótidos, como alternativa al menos 50 nucleótidos, como alternativa al menos 75 nucleótidos o como alternativa al menos 100 nucleótidos.
La RCS también puede ser al menos parcialmente complementaria de una parte de la primera cadena de ADNc, de modo que sea capaz de dirigir la síntesis de una segunda cadena de ADNc usando la primera cadena del ADNc como molde. Por lo tanto, después de la síntesis de primera cadena, puede añadirse una enzima RNasa (por ejemplo una enzima que tenga actividad RNasaH) después de la síntesis de la primera cadena de ADNc para degradar la cadena de ARN y para permitir que el CDS hibride de nuevo en la primera cadena para dirigir la síntesis de una segunda cadena de ADNc. Por ejemplo, la RCS podría comprender hexámeros aleatorios, o una secuencia semialeatoria no autocomplementaria (que minimiza la autohibridación del CDS).
Puede añadirse un oligonucleótido de cambio de molde (TSO) que incluye una parte que es al menos parcialmente complementaria de una parte del extremo 3' de la primera cadena de ADNc a cada muestra de ARNm individual en los métodos descritos en el presente documento. Dicho método de cambio de molde se describe en (Esumi et al., Neurosci Res 60(4): 439-51 (2008)) y permite sintetizar ADNc de longitud completa que comprende el extremo 5' completo del ARNm. Como la actividad transferasa terminal de la transcriptasa inversa típicamente provoca que se incorporen 2-5 citosinas en el extremo 3' de la primera cadena de ADNc sintetizado a partir de ARNm, la primera cadena de ADNc puede incluir una pluralidad de citosinas, o análogos de citosina que forman pares de bases con
guanosina, en su extremo 3' (véase documento US 5.962.272). En un aspecto de la invención, la primera cadena de ADNc puede incluir una parte 3' que comprende al menos 2, al menos 3, al menos 4, al menos 5 o 2, 3, 4 o 5 citosinas o análogos de citosina que forman pares de bases con guanosina. Un ejemplo no limitante de un análogo de citosina que forma pares de bases con guanosina es 5-aminoalil-2'-desoxicitidina.
En un aspecto de la invención, el TSO puede incluir una parte 3' que comprende una pluralidad de guanosinas o análogos de guanosina que forman pares de bases con citosina. Los ejemplos no limitantes de guanosinas o análogos de guanosina útiles en los métodos descritos en el presente documento incluyen, pero sin limitación, desoxirriboguanosina, riboguanosina, guanosina de ácido nucleico bloqueado y guanosina de ácido nucleico peptídico. Las guanosinas pueden ser ribonucleósidos o monómeros de ácido nucleico bloqueado.
Un ácido nucleico bloqueado (LNA) es un nucleótido de ARN modificado. El resto de ribosa de un nucleótido LNA está modificado con un enlace extra que conecta el oxígeno 2' y el carbono 4'. El enlace “bloquea” la ribosa en la conformación 3'-endo (Norte). Algunas de las ventajas de usar LNA en los métodos de la invención incluyen aumentar la estabilidad térmica de dobles cadenas, aumento de la especificidad de diana y resistencia de exo y endonucleasas.
Un ácido nucleico peptídico (PNA) es un polímero sintetizado de forma artificial similar a ADN o ARN, en el que la cadena principal está compuesta de unidades de N-(2-aminoetil)-glicina repetidas unidas por enlaces peptídicos. La cadena principal de un PNA es sustancialmente no iónica en condiciones neutras, a diferencia de la cadena principal de fosfodiéster altamente cargada de ácidos nucleicos de origen natural. Esto proporciona dos ventajas no limitantes. En primer lugar, la cadena principal de PNA muestra cinética de hibridación mejorada. En segundo lugar, los PNA tienen mayores cambios en la temperatura de fusión (Tf) para pares de bases perfectamente coincidentes frente a desapareados. El ADN y ARN muestran típicamente un descenso de 2-4 °C en la Tf para un desapareamiento interno. Con la cadena principal de p Na no iónica, el descenso es más cercano a 7-9 °C. Esto puede proporcionar una mejor diferenciación de secuencia. De forma similar, debido a su naturaleza no iónica, la hibridación de las bases unidas a estas cadenas principales es relativamente insensible a la concentración salina.
Un ácido nucleico útil en la invención puede contener un resto de azúcar no natural en la cadena principal. Las modificaciones de azúcares ejemplares incluyen pero sin limitación modificaciones 2' tales como adición de halógeno, alquilo, alquilo sustituido, SH, SCH3 , OCN, Cl, Br, CN, CF3, OCF3, SO2CH3, OSO2, SO3, CH3 , ONO2 , NO2, N3 , NH2 , sililo sustituido y similares. También pueden realizarse modificaciones similares en otras posiciones en el azúcar, particularmente en la posición 3' del azúcar en el nucleótido 3' terminal o en oligonucleótidos con enlace 2'-5' y la posición 5' del nucleótido 5' terminal. Los ácidos nucleicos, análogos de nucleósidos o análogos de nucleótidos que tienen modificaciones de azúcares pueden modificarse adicionalmente para incluir un grupo de bloqueo reversible, marcador de enlace peptídico o ambos. En las realizaciones en las que están presentes las modificaciones 2' anteriormente descritas, la base puede tener un marcador con enlaces peptídicos.
Un ácido nucleico usado en la invención también puede incluir bases nativas o no nativas. A este respecto un ácido desoxirribonucleico nativo puede tener una o más bases seleccionadas del grupo que consiste en adenina, timina, citosina o guanina y un ácido ribonucleico puede tener una o más bases seleccionadas del grupo que consiste en uracilo, adenina, citosina o guanina. Las bases no nativas ejemplares que pueden incluirse en un ácido nucleico, que bien tienen una cadena principal nativa o una estructura análoga incluyen, sin limitación, inosina, xantanina, hipoxantanina, isocitosina, isoguanina, 5-metilcitosina, 5-hidroximetil citosina, 2-aminoadenina. 6-metil adenina, 6 metil guanina, 2-propil guanina, 2-propil adenina, 2-tiouracilo, 2-tiotimina, 2-tiocitosina, 15-halouracilo, 15-halocitosina, 5-propinil uracilo, 5-propinil citosina. 6-azo uracilo, 6-azo citosina. 6-azo timina, 5-uracilo, 4-tiouracilo, 8-halo adenina o guanina, 8-amino adenina o guanina, 8-tiol adenina o guanina, 8-tioalquiI adenina o guanina, 8-hidroxil adenina o guanina, uracilo o citosina 5-halo substituido, 7-metilguanina, 7-metiladenina, 8-azaguanina, 8-azaadenina, 7-desazaguanina, 7-desazaadenina, 3-desazaguanina, 3-desazaadenina o similares. Una realización particular puede utilizar isocitosina e isoguanina en un ácido nucleico para reducir la hibridación no específica, como se describe en general en la Patente de Estados Unidos n° 5.681.702.
Una base no nativa usada en un ácido nucleico puede tener actividad de formación de pares de bases universal, en la que es capaz de formar pares de bases con cualquier otra base de origen natural. Las bases ejemplares que tienen actividad de formación de pares de bases universal incluyen 3-nitropirrol y 5-nitroindol. Otras bases que pueden usarse incluyen las que tienen actividad de formación de pares de bases con un subconjunto de las bases de origen natural tales como inosina, que forma pares de bases con citosina, adenina o uracilo.
En un aspecto de la invención, el TSO puede incluir una parte 3' que incluye al menos 2, al menos 3, al menos 4, al menos 5 o 2, 3, 4, o 5, o 2-5 guanosinas, o análogos de guanosina que forman pares de bases con citosina. La presencia de una pluralidad de guanosinas o análogos de guanosina que forman pares de bases con citosina) permite que el TSO hibride de forma transitoria con las citosinas expuestas en el extremo 3' de la primera cadena de ADNc. Esto provoca que la transcriptasa inversa cambie de molde y continúe la síntesis de una cadena complementaria del TSO. En un aspecto de la invención, el extremo 3' del TSO puede bloquearse, por ejemplo por un grupo fosfato 3', para evitar que el TSO actúe como un cebador durante la síntesis de ADNc.
En un aspecto de la descripción, el ARNm se libera de las células por lisis celular. Si la lisis se consigue parcialmente por calentamiento, entonces el CDS y/o el TSO pueden añadirse a cada muestra de ARNm individual durante la lisis celular, ya que esto ayudará a la hibridación de los oligonucleótidos. En algunos aspectos, puede añadirse transcriptasa inversa después de la lisis celular para evitar la desnaturalización de la enzima.
En algunos aspectos de la invención, puede incorporarse un marcador en el ADNc durante su síntesis. Por ejemplo, el CDS y/o el TSO pueden incluir un marcador, tal como una secuencia de nucleótidos particular, que puede ser de al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 15 o al menos 20 nucleótidos de longitud. Por ejemplo, el marcador puede ser una secuencia de nucleótidos de 4-20 nucleótidos de longitud, por ejemplo, 4, 5, 6, 7, 8, 9, 10, 15 o 20 nucleótidos de longitud. Como el marcador está presente en el CDS y/o el TSO se incorporará en el ADNc durante su síntesis y puede actuar por lo tanto como un “código de barras” para identificar el ADNc. Tanto el CDS como el TSO pueden incluir un marcador. La CDS y el TSO pueden incluir cada uno un marcador diferente, de modo que la muestra de ADNc marcada comprende una combinación de marcadores. Cada muestra de ADNc generada por el método anterior puede tener un marcador distinto, o una combinación distinta de marcadores, de modo que una vez que se han agrupado las muestras de ADNc marcadas, el marcador puede usarse para identificar de qué célula individual se originó cada muestra de ADNc. Por lo tanto, cada muestra de ADNc puede ligarse a una única célula, incluso después de haberse agrupado las muestras de ADNc marcadas en los métodos descritos en el presente documento.
Antes de agruparse las muestras de ADNc marcadas, la síntesis de ADNc puede detenerse, por ejemplo retirando o inactivando la transcriptasa inversa. Esto evita que la síntesis de ADNc por transcripción inversa continúe en las muestras agrupadas. Las muestras de ADNc marcadas pueden purificarse opcionalmente antes de la amplificación, bien antes o bien después de agruparse.
Las muestras de ADNc agrupadas pueden amplificarse por reacción en cadena de la polimerasa (PCR) incluyendo PCR de emulsión y PCR de cebador individual en los métodos descritos en el presente documento. Por ejemplo, las muestras de ADNc pueden amplificarse por PCR de cebador individual. El c Ds puede comprender una secuencia de cebador de amplificación 5' (APS), que posteriormente permite que la primera cadena de ADNc se amplifique por PCR usando un cebador que es complementario de la APS 5'. El TSO también puede comprender una APS 5', que puede ser al menos 70 % idéntica, al menos 80 % idéntica, al menos 90 % idéntica, al menos 95 % idéntica, o 70 %, 80 %, 90 % o 100 % idéntica a la APS 5' en el CDS. Esto significa que las muestras de ADNc agrupadas pueden amplificarse por PCR usando un cebador individual (es decir por PCR de cebador individual), que aprovecha el efecto de supresión de PCR para reducir la amplificación de amplicones contaminantes cortos y dímeros de cebadores (Dai et al., J Biotechnol 128(3): 435-43 (2007)). Como los dos extremos de cada amplicón son complementarios, los amplicones cortos formarán horquillas estables, que son malos moldes para PCR. Esto reduce la cantidad de ADNc truncado y mejora el rendimiento de moléculas de ADNc más largas. La APS 5' puede diseñarse para facilitar el procesamiento corriente abajo de la biblioteca de ADNc. Por ejemplo, si la biblioteca de ADNc va a analizarse por un método de secuenciación particular, por ejemplo, la tecnología de secuenciación SOLiD de Applied Biosystems, o el Analizador de Genoma de Illumina, la APS 5' puede diseñarse para ser idéntica a los cebadores usados en estos métodos de secuenciación. Por ejemplo, la APS 5' puede ser idéntica al cebador PI de SOLiD y/o una secuencia P2 de SOLiD insertada en el CDS, de modo que las secuencias P1 y P2 requeridas para secuenciación por SOLiD sean integrales de la biblioteca amplificada.
Otro método ejemplar para amplificar ADNc agrupado incluye PCR. La PCR es una reacción en la que se realizan copias repetidas de un polinucleótido diana usando un par de cebadores o un conjunto de cebadores que consisten en un cebador cadena arriba y uno cadena abajo, y un catalizador de polimerización, tal como un ADN polimerasa, y típicamente una enzima polimerasa termoestable. Se conocen bien en la técnica métodos para PCR, y se enseñan, por ejemplo, en MacPherson et al. (1991) PCR 1 : A Practical Approach (IRL Press at Oxford University Press). Todos los procesos para producir copias repetidas de un polinucleótido, tales como PCR o clonación génica, se denominan colectivamente en el presente documento replicación. También puede usarse un cebador como una sonda en reacciones de hibridación, tales como análisis de transferencia de Southern o Northern.
Para PCR de emulsión, se crea una reacción de PCR de emulsión agitando vigorosamente o removiendo una mezcla de “agua en aceite” para generar millones de compartimentos acuosos de tamaños micrométricos. La biblioteca de ADN se mezcla en una dilución limitante bien con las perlas antes de la emulsificación o directamente en la mezcla de emulsión. La combinación del tamaño del compartimento y la dilución limitante de las perlas y moléculas diana se usa para generar compartimentos que contengan, en promedio, solamente una molécula de ADN y perla (a la dilución óptima muchos compartimentos tendrán perlas sin ninguna diana). Para facilitar la eficacia de amplificación, se incluyen cebadores de p Cr tanto cadena arriba (concentración baja, coincide con la secuencia de cebador en la perla) y cadena abajo (alta concentración) en la mezcla de reacción. Dependiendo del tamaño de los compartimentos acuosos generados durante la etapa de emulsión, pueden realizarse hasta 3x109 reacciones de PCR individuales por pl simultáneamente en el mismo tubo. Esencialmente cada compartimento pequeño en la emulsión forma un microrreactor de PCR. El tamaño promedio de un compartimento en una emulsión varía de un diámetro submicrométrico a más de 100 micrómetros, dependiendo de las condiciones de emulsión.
“ Identidad”, “homología” o “similitud” se usan indistintamente y se refieren a la similitud de secuencia entre dos moléculas de ácido nucleico. La identidad puede determinarse comparando una posición en cada secuencia que pueda alinearse para fines de comparación. Cuando una posición en la secuencia comparada está ocupada por la misma base o el mismo aminoácido, entonces las moléculas son homólogas en esa posición. Un grado de identidad entre secuencias es una función del número de posiciones coincidentes o idénticas compartidas por las secuencias. Una secuencia no relacionada o no homóloga comparte menos del 40 % de identidad, o como alternativa menos del 25 % de identidad, con una de las secuencias de la presente descripción.
Que un polinucleótido tenga un cierto porcentaje (por ejemplo, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 % o 99 %) de “identidad de secuencia” con otra secuencia significa que, cuando se alinean, el porcentaje de bases son iguales en la comparación de las dos secuencias. Este alineamiento y el porcentaje de identidad de secuencias u homología pueden determinarse usando programas informáticos conocidos en la técnica, por ejemplo los descritos en Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Nueva York, N. Y., (1993). Preferentemente, se usan parámetros por defecto para el alineamiento. Un programa de alineamiento es BLAST, usando parámetros por defecto. En particular, los programas son BLASTN y BLASTP, usando los siguientes parámetros por defecto: código genético = convencional; filtro = ninguno; cadena = ambas; punto de corte = 60; expectativa = 10; Matriz = BLOSUM62; Descripciones = 50 secuencias; clasificar por = ALTA PUNTUACIÓN; Bases de datos = no redundantes, GenBank EMBL DDBJ PDB GenBank CDS translations SwissProtein SPupdate PIR. Pueden encontrarse detalles de estos programas en el Centro Nacional para la Información Biotecnológica.
El método para preparar una biblioteca de ADNc descrito en el presente documento puede comprender además procesar la biblioteca de ADNc para obtener una biblioteca adecuada para secuenciación. Como se usa en el presente documento, una biblioteca es adecuada para secuenciación cuando la complejidad, el tamaño, la pureza o similares de una biblioteca de ADNc son adecuados para el método de exploración deseado. En particular, la biblioteca de ADNc puede procesarse para hacer a la muestra adecuada para cualquier método de exploración de alto rendimiento, tal como tecnología de secuenciación SOLiD Applied Biosystems o Analizador de Genoma de Illumina. Como tal, la biblioteca de ADNc puede procesarse fragmentando la biblioteca de ADNc (por ejemplo con DNasa) para obtener una biblioteca de extremo 5' de fragmentos cortos. Pueden añadirse adaptadores al ADNc, por ejemplo en uno o ambos extremos para facilitar la secuenciación de la biblioteca. La biblioteca de ADNc puede amplificarse adicionalmente, por ejemplo por PCR, para obtener una cantidad suficiente de ADNc para secuenciación.
Las realizaciones de la descripción proporcionan una biblioteca de ADNc producida por cualquiera de los métodos descritos en el presente documento. Esta biblioteca de ADNc puede secuenciarse para proporcionar un análisis de expresión génica en células individuales o en una pluralidad de células individuales.
Las realizaciones de la descripción también proporcionan un método para analizar la expresión génica en una pluralidad de células individuales, comprendiendo el método las etapas de preparar una biblioteca de ADNc usando el método descrito en el presente documento y secuenciando la biblioteca de ADNc. Un “gen” se refiere a un polinucleótido que contiene al menos una fase abierta de lectura (ORF) que es capaz de codificar un polipéptido o una proteína particular después de transcribirse y traducirse. Puede usarse cualquiera de las secuencias polinucleotídicas descritas en el presente documento para identificar fragmentos mayores o secuencias codificantes de longitud completa del gen con los que se asocian. Se conocen por los expertos en la materia métodos para aislar secuencias de fragmentos mayores.
Como se usa en el presente documento, “expresión” se refiere al proceso por el que se transcriben polinucleótidos a ARNm y/o el proceso por el que el ARNm transcrito se traduce posteriormente en péptidos, polipéptidos o proteínas. Si el polinucleótido deriva de ADN genómico, la expresión puede incluir corte y empalme del ARNm en una célula eucariota.
La biblioteca de ADNc puede secuenciarse por cualquier método de exploración adecuado. En particular, la biblioteca de ADNc puede secuenciarse usando un método de exploración de alto rendimiento, tal como la tecnología de secuenciación SOLiD de Applied Biosystems, o Analizador del Genoma de Illumina. En un aspecto de la invención, la biblioteca de ADNc puede secuenciarse al azar. El número de lecturas puede ser de al menos 10.000, al menos 1 millón, al menos 10 millones, al menos 100 millones, o al menos 1000 millones. En otro aspecto, el número de lecturas puede ser de 10.000 a 100.000, como alternativa de 100.000 a 1 millón, como alternativa de 1 millón a 10 millones, como alternativa de 10 millones a 100 millones, o como alternativa de 100 millones a 1000 millones. Una “lectura” es una longitud de secuencia de ácido nucleico continua obtenida por una reacción de secuenciación.
La “secuenciación al azar” se refiere a un método usado para secuenciar una cantidad muy grande de ADN (tal como el genoma completo). En este método, el ADN para secuenciar se rompe primero en fragmentos más pequeños que pueden secuenciarse individualmente. Las secuencias de estos fragmentos se vuelven a ensamblar
después en su orden original basándose en sus secuencias solapantes, produciendo de este modo una secuencia completa. La “rotura” del ADN puede realizarse usando varias técnicas diferentes incluyendo digestión con enzimas de restricción o corte mecánico. Las secuencias solapantes típicamente se alinean por un ordenador convenientemente programado. Se conocen bien en la técnica métodos y programas para secuenciación al azar de una biblioteca de ADNc.
Una realización del método de la invención se resume en la Figura 1. Las células se obtienen de un tejido de interés y se obtiene una suspensión de células individuales. Se coloca una célula individual en un pocillo de una placa de 96 pocillos en mezcla de captura celular. Las células se lisan y se añade mezcla de reacción de transcripción inversa directamente a los lisados sin purificación adicional. Esto da como resultado la síntesis de ADNc a partir de ARNm celular y la incorporación de un marcador en el ADNc. Las muestras de ADNc marcadas se agrupan y amplifican y después se secuencian para producir 100 millones de lecturas. Esto permite la identificación de genes que se expresan en cada célula individual.
Los siguientes ejemplos ilustran pero no limitan la presente invención.
Ejemplo 1
Transcripción inversa marcada en células individuales (STRT)
Una realización del método de la invención puede denominarse “transcripción inversa marcada en células individuales” (STRT) y se describe en detalle a continuación.
Recogida y lisis de células
Se preparó una placa de 96 pocillos que contenía Mezcla de Captura Celular separando en alícuotas 5 pl/pocillo de la Placa Maestra de Captura Celular (véase Tabla 1 posterior) en una placa Thermo-Fast AbGene.
Tabla 1 preparar una Placa Maestra de Captura Celular de STRT.
Se mezclaron 27,5 pl de STRT-T30-BIO (100 pM) con 1375 pl de tampón STRT 5x y 4,9 ml de agua sin Rnasa/Dnasa. Se separaron en alícuotas 57,5 pl de esta solución a casa pocillo de una placa de 96 pocillos y se añadieron 5 pl/pocillos de STRT-FW-n (de la placa de reserva 5 pM), es decir un oligo diferente en cada pocillo.
La secuencia de STRT-T30-BIO (que es un CDS) es:
5'-BlO-AAGCAGTGGTATCA.ACGCAGAGTaüVN-3',
y la secuencia de STRT-FW-n (que es un TSO) es:
5'-AAGCAGTGGTATCAACGCAGAGTGGATGCTXXXXXrGrGrG-3'(X=marcador celular)
BtsCl^2/0
n es 1-96 y cada oligonucleótido tiene un marcador celular distinto, de modo que se añade un oligonucleótido diferente a cada pocillo que contiene una única célula.
Se cultivaron celular madre embrionarias de ratón (R1) sin células de alimentación, se tripsinizaron, se clarificaron mediante un tamiz celular y se resuspendieron en PBS 1x. Las células se seleccionaron después por FACS en la Placa de Captura, colocándose una única célula en cada pocillo. La Placa de Captura de transfirió a un termociclador de PCR y se incubó a 72 °C durante 2 minutos, y después se enfrío a 4 °C durante 5 minutos para permitir que se produjera la hibridación. El detergente en tampón de STRT ayuda a reducir la adsorción de ARNm y ADNc a las paredes del tubo de reacción durante etapas posteriores, y también mejora la lisis de las células. La
etapa de calentamiento provoca que la célula se lise completamente y libere su ARN. Cuando la temperatura se reduce, el cebador de oligo (dT) híbrida.
Transcripción inversa
Se añadieron 5 pl/pocillo de mezcla de RT (véase Tabla 2 posterior) y la placa se incubó a 42 °C durante 45 minutos, sin tapa calentada.
Tabla 2 Composición de mezcla de RT
Cuando se añade la mezcla de RT, la enzima transcriptasa inversa (Superscript II RT) sintetiza una primera cadena y el oligo de cambio de molde marcado introduce una secuencia de cebador cadena arriba.
La Figura 2 muestra la síntesis de ADNc por cambio de molde. El extremo 5' del ADNc (que corresponde al extremo 3' del ARNm) puede controlarse añadiendo una cola (que es oligo dT en este caso) al cebador de síntesis de ADNc (CDS). El extremo 3' del ADNc puede controlarse usando el oligo de cambio de molde (TSO). Cuando la transcriptasa inversa alcanza el extremo 5' del molde de ARNm, preferentemente añade 2-5 citosinas. El oligo de cambio de molde, que tiene 2-5 guanosinas, hibrida de forma transitoria, y la transcriptasa inversa después cambia de molde y sintetiza la cadena complementaria. Por este mecanismo, ambos extremos del ADNc pueden controlarse de forma arbitraria.
La estructura de un TSO típico se muestra en la Figura 3. En este TSO particular, la secuencia de cambio de molde 3' incluye tres riboguaninas (rG). El marcador celular se muestra como “XXXXX” y puede tener en general cualquier longitud o composición de nucleótidos. Puede insertarse una secuencia arbitraria en el extremo 5' del TSO, después de la APS 5', o después del marcador celular, pero no en el extremo 3'.
La estructura de un CDS típico se muestra en la Figura 4. La RCS es oligo dT con un nucleótido de anclaje (V = A, C, G degradado). El marcador celular “XXXXX” puede tener cualquier longitud o composición de nucleótidos. Adicionalmente, pueden insertarse secuencias arbitrarias en el extremo 5', después de la APS 5' o después del marcador celular.
Purificación de ADNc
Se añadieron 50 pl de PBI (Kit de Purificación de PCR Qiaquick) a cada pocillo para inactivar la transcriptasa inversa. El PBI inactiva la transcriptasa inversa y después se agrupó ADNc de todos los pocillos. La adición de PBI antes del agrupamiento evita que se produzca síntesis de ADNc una vez que se han agrupado las muestras de ADNc. El ADNc agrupado se cargó en una única columna de Qiaquick y el ADNc purificado se eluyó en 30 pl de tampón EB a un tubo de Polialómero Beckman. La etapa de purificación retira los cebadores (<40 pb) así como proteínas y otros residuos.
Amplificación de ADNc de longitud completa
El ADNc se amplificó por PCR añadiendo los reactivos mostrados en la Tabla 3.
Tabla 3. Reactivos usados para amplificación de ADNc de longitud completa.
La secuencia de STRT-PCR es:
5'-BIO-AAGCAGTGGTATCAACGCAGAGT-3'
Se realizó PCR usando una tapa calentada de la siguiente menara: 1 min. a 95 °C, 25 ciclos de [5 s a 95 °C, 5 s a 65 °C 6 min. a 68 °C] 4 °C para siempre.
Se transfirieron 30 j l de la reacción a un nuevo tubo de PCR, marcado “Optimización”. Los 70 j l restantes se almacenaron a 4 °C hasta más tarde. Se retiraron 10 j l del tubo de Optimización y el resto de la muestra se procesó durante tres ciclos más. Esto se repitió para obtener alícuotas de 25, 28 y 31 ciclos. Se usó un gel de agarosa al 2 % de diagnóstico para determinar el número de ciclos óptimo (que es el ciclo justo antes de la saturación de la PCR), así como para visualizar el intervalo de tamaños del producto (véase Figura 5). Típicamente, el número óptimo de ciclos fue de aproximadamente 28. Los 70 j l restantes de reacción se procesaron para alcanzar el número óptimo de ciclos (además de los 25 ciclos ya procesados).
El producto de PCR se purificó usando una columna Qiaquick (kit de purificación de PCR) y se eluyó en 50 j l de EB en un tubo de polialómero de Beckman. La concentración esperada en ese estadio fue de aproximadamente 20-40 ng/jl (1-2 jg de rendimiento total).
Tratamiento con DNasa
La muestra se trató con DNasal en presencia de Mn2+ para generar roturas de doble cadena y reducir el tamaño. En primer lugar, se mezclaron los siguientes componentes en el orden mostrado en la Tabla 4.
(*) Es crucial añadir MnCh lo último a la reacción, ya que de otro modo la BSA presente en el tampón precipitará.
Tabla 4. Composición de mezcla de reacción para tratamiento con DNasa.
Se preparó DNasa I diluida (0,01 unidades/jl) justo antes de su uso de la siguiente manera: 40 j l de tampón de DNasa I 10x, 318 j l de agua, 40 j l de MnCh 100 mM y 2 j l de DNasal (2 U/jl).
Se añadieron 4 j l de esta DNasa I diluida a la mezcla de reacción descrita en la Tabla 4, y se incubó a TA durante exactamente 10 minutos. La reacción se detuvo después añadiendo 600 j l de PBI.
La muestra se purificó en una columna Qiaquick y se eluyó en 30 j l de EB.
Captura de perlas y reparación de extremos/traslación de muesca
Los fragmentos se unieron a continuación con perlas para capturar extremos 5' y 3', y después se trataron con TaqExpress para reparar extremos deshilacliados y muescas. Se lavaron 30 j l de Estreptavidina MyOne Cl Dynabeads dos veces en B y W 2x (Dynal), después se añadió a la muestra tratada con DNasa, se incubó durante 10 minutos, y después se lavó 3x en B y W 1x. Aproximadamente el 10 % de la muestra se unió a las perlas (es decir aproximadamente 30 - 60 ng), ya que los fragmentos internos no se biotinilaron.
Las perlas se lavaron una vez en tampón TaqExpress 1x y se resuspendieron en la mezcla de reacción mostrada en la Tabla 5:
Tabla 5. Composición de la mezcla de reacción usada para reparación de extremos/traslación de muescas. La reacción se incubó a 37 °C durante 30 minutos, y después se lavó tres veces en tampón de NEB41x.
Liberación de fragmentos y ligamiento del adaptador RDV/FDV
Los fragmentos se liberaron por digestión con BtsCI, y simultáneamente se ligaron con los adaptadores de FDV y RDV. Las perlas se resuspendieron después en la mezcla de reacción mostrada en la Tabla 6.
Tabla 6. Mezcla de reacción para resuspensión de las perlas.
La secuencia de STRT-FDV, realizada hibridando STRT-ADP1U y STRT-ADP1L, fue:
5'-----CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATCT-3'
3'-PHO-GGTGATGCGGAGGCGAAAGGAGAGATACCCGTCAGCCACTA-PHO-5'
La secuencia de STRT-RDV-A, realizada por hibridación de STRT-ADP2U-T y STRT-ADP2L fue:
5'-----AACTGCCCCGGGTTCCTCATTCTCTT-3'
3'-PHO-TTGACGGGGCCCAAGGAGTAAGAGA-PHO-5'
Las perlas se incubaron durante 30 minutos a 37 °C. La reacción se detuvo añadiendo 200 pl de PBI, mientras que las perlas se mantuvieron en el imán. El sobrenadante se cargó en una columna Qiaquick, se purificó y se eluyó en 30 pl de EB en un tubo de polialómero de Beckman. La concentración del ADNc fue de aproximadamente 1 - 2 ng/pl. Amplificación por PCR de bibliotecas
Se prepararon ocho reacciones usando alícuotas de 4, 2, 1, 1/2, 1/4, 1/8, 1/16 y 1/32 pl de la biblioteca adaptada, cada una en 4 pl. Cada biblioteca se amplificó usando la mezcla de reacción de PCR mostrada en la Tabla 7.
Tabla 7. Mezcla de reacción de PCR para amplificación de biblioteca de ADNc.
La secuencia de SOLID-PI fue:
5'-CCACTACGCCTCCGCTTTCCTCTCTATG-3'
La secuencia de SOLID-P2 fue:
5'-CTGCCCCGGGTTCCTCATTCTCT-3'
La PCR se procesó con tapa calentada: 5 min. a 94 °C, 18 ciclos de [15 s a 94 °C, 15 s a 68 °C], 5 min. a 70 °C. Las ocho reacciones se cargaron en un E-gel 2 %, 10 j l 10 j l de agua para determinar qué reacción estaba a punto de saturarse (véase Figura 6).
Después se realizó una nueva reacción de PCR usando el número óptimo de ciclos y material de partida. Por ejemplo, si 1/4 j l era óptimo a 18 ciclos, entonces se realizaron 14 ciclos.
El producto de PCR se cargó en un E-gel al 2 %, se escindió una región de 125 - 200 pb del gel y se purificó por Kit de Extracción en Gel Qiagen (véase Figura 7). El ADNc purificado se eluyó en 50 j l de EB.
La biblioteca de ADNc se preparó ahora para secuenciación por SOLiD, y podría ir directamente a PCR de emulsión. Para verificar la calidad de la biblioteca de ADNc, se clonó una alícuota usando el kit de clonación TOPO TA de Invitrogen, y se secuenció por secuenciación de Sanger. La Figura 8 muestra un resultado típico que demuestra la presencia de secuencias de cebadores para SOLiD (PI y P2; subrayado), el marcador específico de célula (encuadrado), y las 2-5 G (sombreadas en una caja gris) del mecanismo de cambio de molde. A partir de 22 secuencias Sanger, 7 no eran mapeables en nada en GenBank. Todas excepto una de estas fueron ligamientos erróneos de los adaptadores de SOLiD, que pueden rediseñarse para evitar que suceda esto. En experimentos separados, no se encontró ningún adaptador con ligamientos erróneos después de bloquear sus extremos romos con fosfato 3'. Como alternativa, los extremos 3' no ligantes podrían bloquearse usando didesoxinucleótidos o diseñando una cadena protruyente incompatible con los extremos ligantes de los adaptadores.
De las 15 secuencias restantes, una era un ARN ribosómico (45S), que no estaba poliadenilado. Se produjo probablemente debido a colocación de cebadores errónea interna durante la síntesis de primera cadena. Las 14 lecturas restantes fueron todas de ARNm poliadenilado, en la orientación correcta y con marcadores celulares correctos.
Para resumir este conjunto de datos, 15 de 22 lecturas fueron maleables y 14 de estas 15 fueron marcadores de transcrito correctos. Todos los transcritos vistos en el conjunto de datos de secuencia de Sanger se enumeran a continuación:
Gen Longitud (de ARNm)
Proteína ribosómica L35 452
B2_Mm2 -200
Tubulina beta 2c 1561
B2 Mm1 -195
Gen de RIKEN 1110008L16 3127
Sod2 661
Chchd2 910
mt-Cox2 947
Hnrnpab 2545
Proteína ribosómica L24 558
Proteína ribosómica S18 524
RIKEN 2700060E02 941
B2 Mm1 -195
Gen Longitud (de ARNm)
Proteína ribosómica S28 356
Como se esperaba, esta lista estaba dominada por genes altamente expresados como proteínas ribosómicas. Estaban presentes varios transcritos largos en esta muestra, lo que indica que no hubo ningún desvío fuerte (si hubo alguno) hacia ARNm cortos.
Resulta interesante que se observaron tres copias de repeticiones de B2 (de subfamilias Mm1 y Mm2). Estas son repeticiones de familia SINE expresadas a partir de un promotor pol III (no pol II como la mayoría de los ARNm), pero con fuertes señales de poliadenilación. Se ha mostrado que se expresan a niveles extremadamente altos en células ES, que comprendían juntas más del 10 % de todo el ARNm. Aún resulta más interesante que alcancen el máximo justo antes de la fase S en células en división, y por lo tanto es una indicación temprana de que usando este método será posible caracterizar el ciclo celular en células primarias desincronizadas.
Control de calidad por PCR en tiempo real cuantitativa
Para verificar que las bibliotecas eran representativas del contenido de ARNm de la población celular de ES original, se realizó PCR en tiempo real cuantitativa frente a un conjunto de marcadores con respecto a pluripotencialidad, así como marcadores para tejidos diferenciados. Se comparó una biblioteca de ADNc preparada de acuerdo con métodos clásicos a partir de 1 |jg de ARN total (-100.000 células) con la biblioteca preparada a partir de 96 células individuales usando el protocolo de STRT.
Se detectaron marcadores bien conocidos de pluripotencialidad, tales como Sox2, Oct4 y Nanog a niveles similares en ambas muestras, mientras que se detectaron marcadores de diferenciación de capas germinales tales como Brachyury, Gata4 y Eomes solamente a niveles muy bajos en ambas muestras (véase Figura 9). La correlación cuantitativa fue buena (coeficiente de correlación de Pearson 0,84), con la excepción de Plk1, que no se detectó en células individuales en este experimento.
Reactivos usados
Tabla 8. Lista de reactivos usados en el método descrito anteriormente.
Ejemplo II
Caracterización del paisaje transcripcional de células individuales por ARN-Sec altamente múltiple
El entendimiento del desarrollo y mantenimiento de tejidos se ha visto ayudado en gran medida por el análisis de expresión génica a gran escala. Sin embargo, los tejidos son invariablemente complejos, consistentes en múltiples tipos celulares en una diversidad de estados moleculares. Como resultado, el análisis de expresión de un tejido confunde los patrones de presión verdaderos de sus tipos celulares constituyentes. Se describe en el presente documento una nueva estrategia, denominada perfil de expresión de células individuales al azar, que se usó para acceder a dichas muestras complejas. Es un método sencillo y altamente múltiple usado para generar cientos de perfiles de expresión de ARN-Sec de células individuales. Las células se agrupan después basándose en sus perfiles de expresión, formando un mapa celular bidimensional en el que pueden proyectarse datos de expresión. El mapa celular resultante integra tres niveles de organización: la población completa de células, las subpoblaciones funcionalmente distintas que contiene, y las células individuales en sí mismas, todas sin la necesidad de marcadores conocidos para clasificar los tipos celulares. La viabilidad de la estrategia se demuestra analizando los transcriptomas completos de 436 células individuales de tres tipos distintos. Esta estrategia permite el descubrimiento y análisis imparcial de tipos celulares de origen natural durante el desarrollo, fisiología del adulto y enfermedad.
Métodos
Cultivo celular
Se cultivaron células ES RI como se ha descrito previamente (Moliner et al., Stem Cells Dev. 17: 233-243 (2008)). Se cultivaron células MEF y Neuro-2A en DMEM con FBS al 10 %, penicilina/estreptomicina 1x, Glutamax 1x y 2-mercaptoetanol 0,05 mM. Todos los reactivos de cultivo fueron de Gibco.
PCR en tiempo real cuantitativa (Q-PCR)
Se aisló ARN usando Trizol (Invitrogen) y se transcribió de forma inversa 1 |jg de ARN total con Superscript III (Invitrogen) y cebador de oIigo (dT). Se mezcló una Mezcla Maestra Verde de SYBR (Applied Biosystems) y una cantidad de ADNc correspondiente a 5 ng de ARN con 4 pmoles de cebadores (Eurofins MWG Operon, Alemania) en un volumen total de 10 jl, y se analizó en un termociclador en tiempo real 7900HT (Applied Biosystems). Se usó una serie de diluciones del molde para determinar la eficacia de cebadores.
Transcripción inversa marcada con células individuales (STRT)
Las células se disociaron enzimáticamente usando TrypLE Express (Invitrogen), se lavaron y se resuspendieron en solución salina tamponada con fosfato (PBS). Se recogió una única célula en cada pocillo de una placa de captura de 96 pocillos (AbGene Thermo-Fast 96 cat. n° 0600) por clasificación celular activada por fluorescencia (FACS), y la placa se congeló inmediatamente en hielo seco. La FACS se usó solamente para recoger células individuales y para rechazar células muertas y residuos basándose en la dispersión de la luz; no se usó ningún indicador de fluorescencia, y por lo tanto las células recogidas representarían una muestra aleatoria de la población.
La placa de captura celular contenía una única célula por pocillo en 5 j l de tampón STRT (Tris-HCl 20 mM pH 8,0, KCl 75 mM, MgCl2 6 mM, Tween-20 0,02%) con STRT-T30-BIO 400 nM (5'-biotina-AAGCAGTGGTATCAACGCAGAGT30VN-3'; este y todos los otros oligos fueron de Eurofins MWG Operon) y STRT-FW-n 400 nM (5'-AAGCAGTGGTATCAACGCAGAGTGGATGCTXXXXXrGrGrG-3', en la que “rG” indica un ribonucleótido guanina y “XXXXX” era un código de barras). Cada pocillo de la placa de captura contenía un oligo auxiliar de cambio de molde diferente (STRT-FW-n) con un código de barras distinto. Por ejemplo, el pocillo A01 recibió STRT-FW-1 con la secuencia 5'-AAGCAGTGGTATCAACGCAGAGTGGATGCTCAGAArGrGrG-3' que tenía una secuencia de código de barras CAGAA. Los 96 códigos de barras y las secuencias de oligo auxiliares se proporcionan en la Tabla 9.
Tabla 9. Códigos de barras y secuencias oligonucleotídicas auxiliares.
La placa de captura celular se descongeló y se calentó después para lisar las células (20 °C durante 5 minutos, 72 °C durante 4 minutos, 10 °C durante 5 minutos en un termociclador). Se añadieron 5 pl de mezcla de transcripción inversa (DTT 4 mM, dNTP 2 mM, Superscript II 5 U/pl en tampón de STRT) a cada pocillo y la placa se incubó (10 °C durante 10 minutos, 42 °C durante 45 minutos) para completar la transcripción inversa y el cambio de molde.
Para purificar el ADNc y retirar los cebadores que no habían reaccionado, se añadieron a cada pocillo 50 pl de PB (Kit de Purificación de PCR Qiaquick, Qiagen) las 96 reacciones se agruparon y se purificaron sobre una única columna de Qiaquick. El ADNc se eluyó en 30 pl de EB en un tubo de polialómero de 1,5 ml (Beckman).
La muestra de ADNc de 96 pocillos completa se amplificó en un único tubo en 100 pl de dNTP 200 pM, cebador de STRT-PCR 200 pM (5'-biotina-AAGCAGTGGTATCAACGCAGAGT-3'; Eurofins MWG Operon), Mezcla de ADN Polimerasa Advantage2 1x (Clontech) en tampón de PCR Advantage2 1x (Clontech) con 1 min. a 94 °C seguido de 25 ciclos de 15 s a 95 °C, 30 s a 65 °C, 3 min. a 68 °C, con tapa calentada. Se visualizó una alícuota en un E-gel de agarosa 1,2 % (Invitrogen) y la muestra se amplificó 1-5 ciclos adicionales si fue necesario. El producto se purificó (Kit de Purificación de PCR Qiaquick, Qiagen) y se cuantificó por fluorímetro (Qubit, Invitrogen). Las producciones típicas fueron de 0,5 -1 pg total. Las alícuotas se tomaron en este estadio para análisis de micromatrices y Q-PCR. Preparación de muestras para secuenciación de alto rendimiento
Se fragmentó ADNc amplificado por DNasa I en presencia de Mn2+, lo que provoca una preferencia por roturas de doble cadena. Se fragmentaron 50 pl de ADNc en tampón de DNasa I complementado con MnCl210 mM y DNasa I diluida a 0,0003 U/pl en un volumen total de 120 pl durante exactamente seis minutos a temperatura ambiente. La reacción se detuvo mediante la adición de 600 pl de PB (Kit de Purificación de PCR Qiaquick, Qiagen), se purificó y se eluyó en 30 pl de EB en un tubo de polialómero (Beckman).
Se inmovilizaron fragmentos 3' y 5' en 30 pl de perlas paramagnéticas recubiertas con estreptavidina (Dynabeads MyOne CI, Invitrogen), después volvieron a suspenderse en 30 pl de tampón TaqExpress (Genetix, Reino Unido). Los extremos se repararon y se generaron salientes A individuales incubando las perlas en 40 pl de dNTP 200 pM, 0,25 U/pl. TaqExpress (Genetix, Reino Unido) en tampón de TaqExpress a 37 °C durante 30 minutos, seguido de tres lavados en tampón NE 4 (New England Biolabs).
Se liberaron fragmentos 5' que contenían códigos de barras e insertos de ADNc de las perlas por digestión con BtsCI, y se ligaron simultáneamente adaptadores para generar una muestra adecuada para secuenciación en el Analizador del Genoma lllumina. Las perlas volvieron a suspenderse en 40 pl de ATP 1 mM, adaptador SOLEXA-ADP1 1 pM (5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3' y 3'-PHO-TTACTATGCCGCTGGTGGCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTA-PHO-5'), adaptador SOLEXA-ADP2 1 pM (5'-CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT-3' y 3'-PHO-GTTCGTCTTCTGCCGTATGCTCGAGAAGGCTAG-PHO-5'), ADN ligasa T4 0,25 U/pl (lnvitrogen), BtsCI 1 U/pl (New England Biolabs) en tampón NE 4 1x, y se incubó 30 minutos a 37 °C. Las perlas se retiraron y el sobrenadante se purificó usando AmPure (Agencourt) y se eluyeron en 40 pl de EB (Qiagen).
La muestra se cargó en un E-gel SizeSelect 2 % y se recogió el intervalo de 200 - 300 pb. Se amplificó una alícuota de 4 pl en 50 pl de volumen total que contenía dNTP 200 pM, 400 nM de cada cebador (5'-AATGATACGGCGACCACCGA-3' y 5'-CAAGCAGAAGACGGCATACGAG-3') y polimerasa Phusion 0,15 U/pl en tampón HF Phusion (New England Biolabs) con 30 s a 98 °C, 14-18 ciclos de [10 s a 98 °C, 30 s a 65 °C, 30 s a 72 °C] seguido de 5 min. a 70 °C. Se usaron las amplificaciones de ensayo para determinar el número mínimo de ciclos necesario. La muestra amplificada se purificó por Purificación por PCR Qiaquick seguido de un E-gel SizeSelect 2 % recogiendo de nuevo la región de 200 - 300 pb. La concentración se midió por Qubit (lnvitrogen) y fue típicamente de 5 ng/pl. Las alícuotas se clonaron (TOPO, lnvitrogen) y se secuenciaron por secuenciación de Sanger para verificar la calidad de la muestra y determinar la longitud de fragmento promedio. Basándose en esta información, la concentración molar pudo determinarse con precisión y fue en general por encima de 10 nM. Se realizó formación de grupos y secuenciación por síntesis en un Analizador de Genoma IIx de acuerdo con los protocolos del fabricante (Illumina, Inc., San Diego, Estados Unidos) en un proveedor de servicios comercial (Fastens SA, Ginebra. Suiza).
Mapeo, cuantificación y visualización
Se clasificaron lecturas sin procesar por código de barras (primeras cinco bases) y se recortaron para retirar hasta cinco G 5' introducidas por cambio de molde, y A 3' que aparecieron en ocasiones cuando una lectura se extendió hasta la cola de poli(A). Solamente se permitieron códigos de barras exactos, y los códigos de barras se diseñaron para que ningún error individual convirtiera un código de barras convirtiera un código de barras válido en otro. Las lecturas se mapearon después en el genoma de ratón usando Bowtie (Langmead et al., Genome Biol. 10: R25 (2009)) con los ajustes por defecto. Se descartaron las lecturas no mapeadas. Después, para cada característica anotada en el ensamblaje de NCBI 37.1, todas las lecturas de mapeo se contaron para generar un recuento sin procesar. Es decir, todas las lecturas que se mapearon en cualquiera de los exones de un gen se asignaron a ese gen, las isoformas no se distinguieron. Finalmente, las lecturas sin procesar para cada célula se normalizaron a transcritos por millón (t.p.m.). Los pocillos con menos de 1000 lecturas mapeadas se omitieron de análisis adicional; supuestamente estas incluían casos en los que el instrumento de FACS no había conseguido acertar con la gota de reactivo mientras se seleccionaban las células.
Para visualizar células en un paisaje bidimensional, se calcularon en primer lugar todas las similitudes por pares. Se usó la distancia de Bray-Curtis como una métrica de similitud porque tendía a manejar bien el ruido en genes poco expresados. La correlación convencional produjo resultados similares, pero con algunas células descolocadas más (datos no mostrados). Después se construyó un gráfico de similitud dejando que los nodos representen células, y conectando cada célula con sus cinco células más similares (para mayor claridad, las células con menos de 10.000 lecturas se omitieron, ya que eran susceptibles de generar bordes engañosos). Por lo tanto cada nodo (célula) tuvo cinco bordes salientes y diversos números de bordes entrantes. Después se usó una distribución dirigida por fuerza para proyectar la gráfica en dos dimensiones, revelando la estructura interna basada en similitudes célula-célula. La función GraphPlot del programa Mathematica (Wolfram Research Inc., Estados Unidos) se usó con la opción “Inclusión Eléctrica en Resorte”.
Resultados
Se presentan datos de 436 células individuales recogidas de tres tipos celulares de ratón diferentes: células madre embrionarias (ES Rl, Wood et al., Nature 365: 87-89 (1993)), una línea celular tumoral de neuroblastoma (Neuro-2A, Olmsted et al., Proc. Nati. Acad. Sci U.S.A. 65: 129-136 (1970)) y fibroblastos embrionarios (MEF). Brevemente, cada muestra se preparó seleccionando células individuales por separación de células activadas por fluorescencia (FACS) en los pocillos de una placa de PCR de 96 pocillos precargada con tampón de lisis; calentando la placa hasta completar la lisis, añadiendo después reactivos de transcripción inversa para generar un ADNc de primera cadena. Para incorporar un código de barras específico de pocillo (y por lo tanto específico de célula), se usó el mecanismo de cambio de molde de transcriptasa inversa (Schmidt et al., Nucleic Acids Res. 27: e31 (1999)) por el que un oligo auxiliar dirige la incorporación de una secuencia específica en el extremo 3' de la molécula de ADNc (Figura 10A). Se usó oligo auxiliar diferente en cada pocillo, con códigos de barras de cinco bases distintos y secuencia cebadora universal. Después de la síntesis de ADNc, las 96 reacciones se agruparon, se purificaron y se amplificaron por PCR de un único cebador en un único tubo. Por lo tanto se redujo la desviación de amplificación de célula a célula, y el número de ciclos de PCR se pudo mantener bajo ya que la amplificación comenzaba a partir de 96 veces más material. Las muestras amplificadas se adaptaron después para secuenciación usando métodos convencionales. El procedimiento se nombró “STRT” (transcripción inversa marcada en célula individual). Para más detalles, véase la sección de Métodos y la Figura 11.
Se obtuvieron típicamente 5-12 millones de lecturas sin procesar por carril de secuenciación en un Analizador de Genoma Illumina IIx, y cada muestra se analizó en hasta ocho carriles (pero típicamente uno o dos). Se retiraron las lecturas que carecían de un código de barras apropiado, principalmente provocado por errores en la preparación de muestras tales como adaptadores ligados erróneamente. De las 79+11 % (media+d.t) lecturas, aproximadamente tres cuartos (75+12 %) podrían colocarse en el genoma de ratón permitiendo hasta dos errores de secuenciación, dando como resultado aciertos hasta 14.718+3.006 características distintas (incluyendo ARNm, ARN mitocondrial y repeticiones expresadas). Estos resultados se resumen en la Tabla 10.
Los aciertos abarcaron algunos transcritos (Figura 10B), pero se localizaban más habitualmente en una región de aproximadamente 200 - 1500 pb desde el extremo 3' de cada gen, como se ilustra en la Figura 10C. Esto era esperable porque se usó un cebador de oligo(dT) para generar ADNc a partir del extremo 3' y el ARNm probablemente se degradaba parcialmente durante la lisis celular por hidrólisis de alta temperatura en presencia de Mg2+. El fondo de por ejemplo contaminación de ADN genómico, valorado por aciertos para la secuencia no anotada, fue mínimo (<10‘3 lecturas por millón por kilobase), como se ve claramente en la Figura 10B y Figura 10C. Obsérvese la escasez de aciertos para la cadena inversa y para intrones tanto para Pou5f1 como para Nanog; fueron similares otros loci.
Escrutando los datos mapeados, no se encontraron pruebas de colocación de cebadores errónea u otras reacciones secundarias indeseadas. Los experimentos de control mostraron que ARN, transcriptasa inversa y oligo de cambio de molde se requerían individualmente para producir productos (datos no mostrados). La amplia mayoría de lecturas mapeadas tuvieron un código de barras orientado apropiadamente, lo que indica que se iniciaron desde el cebador de oligo dT y se cambiaron de molde correctamente. No se encontraron pruebas de un motivo complementario de ninguno de los cebadores cerca de los sitios de mapeo de lectura o de hecho de ningún otro motivo, excepto por una desviación de T general débil en pocos casos (Figura 12). Por otro lado, hubo frecuentes puntos calientes de cambio de molde (Figura 13), que indican restricciones estructurales en el ARN que afectan a la síntesis de ADNc y/o cambio de molde en sitios particulares. Los puntos calientes fueron uniformes entre células, y por lo tanto no deberían afectar a comparaciones cuantitativas.
Para caracterizar la complejidad de las muestras, y para determinar la profundidad de secuenciación requerida para tomar muestras de la mayoría de complejidad disponible, se estudió la tasa de “nuevo descubrimiento” en función de la profundidad de lectura. En otras palabras, se determinó el número de moléculas nuevas, distintas, que se descubrieron a medida que se añadieron más secuencias. Debería observarse que, como máximo se generó un clon amplificable de cada molécula de ARN poliadenilada y este clon después se amplificó y secuenció a partir de su extremo 5'. Por lo tanto las lecturas que se mapeaban en distintas localizaciones deben haberse generado de distintas moléculas de ARNm. Por otro lado, las lecturas que se mapean en la misma localización pueden haberse generado por coincidencia a partir de dos moléculas de ARNm, o pueden representar copias del clon inicial de muestra. El número de lecturas de mapeo distinto fue por lo tanto un límite inferior en la verdadera complejidad de muestras. Como se muestra en la Figura 14A, ninguna de las muestras presentadas en el presente documento se secuenciaron hasta la saturación, incluso a 21 millones de lecturas mapeadas, pero la producción de nuevas moléculas tendió a ralentizarse después de 5-10 millones de lecturas. Proyectando las curvas hasta profundidad de lectura infinita, la mayoría de las muestras parecerían contener al menos tres millones de moléculas distintas, o aproximadamente 30.000 por célula. Suponiendo 105 - 106 moléculas de ARNm por célula, esto sugeriría que el método convirtió con éxito 3-30 % del ARNm en lecturas mapeables, como un límite inferior (muy) conservativo. La verdadera proporción fue probablemente significativamente mayor, ya que se generarían muchas lecturas coincidentes (descartadas en este análisis) a partir de puntos calientes de cambio de molde, como se ha mencionado anteriormente.
Por el contrario, la tasa de descubrimiento de características distintas se redujo rápidamente, y el 86 % de todas las características distintas se detectan en el Primer 14 % de lecturas (Figura 14B). Esto sugiere que el método recuperó con éxito la mayoría de características expresadas presentes en las muestras, incluso a profundidad de lectura relativamente baja.
Se requiere con frecuencia información de cadena para asignar apropiadamente lecturas a unidades transcripcionales, ya que los genes frecuentemente solapan en cadenas opuestas. Por ejemplo, más de 3000 genes humanos solapan de esta manera (Yelin et al., Nat. Biotechnol. 21: 379-386 (2003)). Debido a que el mecanismo de cambio de molde usado para introducir un código de barras sucede direccionalmente, el número de cadenas podría conservarse durante todo el protocolo. Para confirmar esto, se examinó el genoma mitocondrial, que se expresa como un único transcrito largo de una cadena (la cadena H) y se corta posteriormente para escindir transcritos de ARNt localizados entre genes codificantes de proteínas. Solamente se poliadenilan después genes codificantes de proteínas. Se genera un único transcrito codificante de proteína, ND6, de la cadena L, pero se expresa muy débilmente y está irregularmente poliadenilado (Slomovic et al., Mol. Cell. Biol. 25: 6427-6435 (2005)). Como se muestra en la Figura 10D, se observó una especificidad de cadena muy fuerte (> de 99 % de lecturas en la cadena H) y no se detectó expresión significativa de genes de ARNt, lo que confirma que el método era específico de poli(A). El número pequeño de aciertos en la cadena L se produjo principalmente cerca del promotor de cadena L, lo que puede explicarse por la poliadenilación de transcritos de cadena L abortados (Slomovic et al., mencionado anteriormente). De forma similar, la expresión aparente de ND6 en la cadena errónea se explica probablemente por la poliadenilación natural de ND5 cadena debajo de su fase abierta de lectura (Slomovic et al., mencionado anteriormente). La especificidad de cadena permitió asignar de forma inequívoca lecturas a transcritos expresados, incluso en casos en los que se coexpresaron dos genes solapantes (Figura 15).
En la escala mayor de los cromosomas nucleares, los aciertos se distribuyeron aproximadamente igual en las cadenas directa e inversa. La densidad de lectura se correlacionó fuertemente con la densidad génica como se muestra para el cromosoma 19 en la Figura 10E, lo que indica de nuevo que la mayoría de las lecturas se originaron
específicamente de transcritos expresados y se mapearon con precisión en el genoma.
Para generar una medida cuantitativa de la expresión génica, se contó el número de aciertos para cada característica anotada, normalizado a transcritos por millón (t.p.m.). Suponiendo 105 a 106 transcritos por célula, 1 a 10 t.p.m. corresponde a una única molécula de ARNm por célula. No se usó la longitud del transcrito (como en la medida de RPKM (Mortazavi et al., Nat. Methods 5: 621-628 (2008)) para normalizar porque se generó una única molécula de extremo 3' amplificable para cada molécula de ARNm introducida, independientemente de su longitud. Una ventaja de este enfoque fue la falta de desviación frente a transcritos cortos (de los que deben tomarse muestras con más profundidad para generar un valor de RPKM detectable) o transcritos largos (que podrían de otro modo suprimirse durante la PCR). De hecho, y en contraste con ARN-Sec convencional Oshlack et al., Biol. Direct 4: 14 (2009)), no se observó desviación dependiente de la longitud para transcritos mayores de 800 nucleótidos (Figura 16). Los transcritos menores de aproximadamente 200 nucleótidos se detectaron menos, probablemente debido a que solamente se seleccionaron en gel muestras por encima de 100 pb. Adicionalmente, los transcritos de aproximadamente 600 nucleótidos estaban ligeramente sobrerrepresentados, posiblemente debido a la mayor eficacia de cambio de molde en el extremo 5' de ARNm (Schmidt et al., Nucleic Acids Res. 27: e31 (1999)) o debido a la presencia de algunos genes muy altamente expresados en este intervalo (por ejemplo Dppa5 y Rps14).
Los niveles de expresión abarcaron cuatro órdenes de magnitud en células individuales (aproximadamente 1 -10.000 t.p.m.), expresados la mayoría de los genes a niveles bajos (<100 t.p.m.; Figura 17A). Dada la profundidad relativamente superficial de la secuenciación usada en el presente documento, los genes expresados por debajo de 10 t.p.m. fueron generalmente indetectables debido solamente al límite de toma de muestras. Ya que se agrupó ADNc de una única célula antes de la amplificación, las producciones de diferentes células no pudieron normalizarse posteriormente. Como consecuencia, se tomaron muestras desiguales de las células y varió el límite de detección. Por ejemplo, compárense dos células con muestras tomadas a 500.000 lecturas (Figura 17B) y 100.000 lecturas (Figura 17C). En el primer caso, el límite de detección aparente fue aproximadamente 10 t.p.m., mientras que en el segundo caso los genes por debajo de 100 t.p.m. generalmente no se detectaron. Sin embargo, en ambos casos, los genes por encima del límite de detección se cuantificaron de forma reproducible en células individuales (el coeficiente de variación fue de 46 % a 500.000 lecturas; y 72 % a 100.000 lecturas). La extensión de este análisis a todas las células y genes mostró que la sensibilidad abordaba el límite teórico impuesto por la profundidad de toma de muestras (Figura 17D); la diferencia puede explicarse por pérdidas en transcripción inversa, cambio de molde y manipulación de muestras. Los niveles de expresión medidos fueron generalmente precisos, como se determinó por comparación con Q-PCR (Figura 17E), e hibridación de micromatrices (Figura 18). De acuerdo con informes publicados basados en Q-PCR (Bengtsson et al., Genome Res. 15: 1388-1392 (2005)), la abundancia de ARNm de Actb mostró una distribución aproximadamente normal logarítmica entre células (Figura 19). Se expresión ARN polimerasa II (subunidad grande) a 25+123 t.p.m. en células ES, comparable a las 27 RPKM halladas por ARN-Sec (Cloonan et al., Nat. Methods 5: 613-619 (2008)) y a las 33+79 t.p.m. halladas en células CHO por detección directa in situ (suponiendo 300.000 transcritos por célula) (Raj et al., PLoS Biol 4: 309 (2006)).
Se visualizaron las relaciones célula-célula en un mapa bidimensional, de modo que las células más estrechamente relacionadas se localizarían cerca entre sí. De esta manera, los tipos celulares basados solamente en los datos de expresión pudieron detectarse y distinguirse, sin basarse en marcadores preexistentes. Un análisis de componentes principales convencional (PCA) reveló tres grupos distintos de células, como se esperaba (Figura 20). Sin embargo, se consiguió una separación más completa en grupos de tipos celulares distintos usando un método basado en gráfica (véase Métodos). Brevemente, se construyó un gráfico con nodos que representaban células, y bordes que representaban similitud de patrón de expresión célula-célula (Figura 21A). Se usó una distribución dirigida por fuerza para proyectar la gráfica en dos dimensiones. En este caso de ensayo usando solamente dos tipos celulares (células ES y Neuro2A), se consiguió una separación casi perfecta (Figura 21B). Un mapa mayor que incorporaba MEF y células ES adicionales mostró buena separación (Figura 21C); lo que demuestra que los perfiles de expresión de células individuales contenían suficiente información para distinguir tipos celulares de novo. El análisis tanto de PCA como basado en gráfico distinguió claramente los tipos celulares ensayados en el presente documento, pero el método basado en gráfico generó grupos más homogéneos, bien separados. Ambos métodos agruparon con precisión células ES preparadas independientemente juntas distintas de los otros tipos celulares, lo que muestra que los grupos no representaban artefactos de preparación de muestras.
Los datos de expresión génica se proyectaron en el mapa, lo que proporcionó un modo fácil de entender rápidamente los patrones de expresión génica en ambas células individuales y en los grupos que representan tipos celulares (Figura 22). Se expresaron claramente de forma específica un conjunto de marcadores de células ES bien conocidos (Dppa5, Sox2, Sal14, PouSf1, Nanog, Zfp42, Zic3, Esrrb) en células ES, aunque sus niveles de expresión variaron ampliamente entre células (obsérvese la escala de color logarítmica). Se expresaron más ampliamente algunos genes importantes para pluripotencialidad (Klf4, Myc y Klf2). La potencia del análisis de células individuales a gran escala resultó evidente en el hecho de que aunque no todas las células expresaron todos los marcadores, los patrones de actividad génica fueron altamente uniformes al nivel de grupo. Por ejemplo, incluso un gen citoesquelético altamente expresado como Actb no se detectó siempre, pero su expresión en cada uno de los tres grupos principales fue evidente. Consecuentemente, los factores de transcripción menos expresados característicos de células ES no se detectaron en algunas células ES individuales, pero el patrón global de expresión en el grupo de
células ES fue inequívoco y coherente con su identidad como células ES. En general, a medida que los niveles de expresión promedio se redujeron de 45 000 t.p.m. (mt_Rnr2) a 1700 (Actb), 850 (Rp14), 73 (KLras) y 0 t.p.m. (Calb1), el número de células de expresión también se redujo, lo que refleja la naturaleza estocástica de la expresión génica así como los límites de la sensibilidad del método.
La representación del mapa celular demostró que (1) las células individuales mostraban patrones de expresión altamente variables, pero su patrón global de expresión era suficiente para agrupar células de un tipo juntas como un grupo; (2) una vez que se formó un grupo de células, que representa un tipo celular definido, los patrones de expresión génica (al nivel de grupo) fueron inequívocos. Por lo tanto, el perfil de expresión de células individuales al azar es una estrategia eficaz para acceder a datos de expresión de una única célula en poblaciones heterogéneas de células.
Análisis
Se describe en el presente documento un método fiable y preciso para obtener perfiles de transcripción de ARN-Sec de cientos de células individuales, y se muestra que pueden usarse perfiles de expresión de células individuales para formar grupos específicos de tipos celulares. Esto permite el análisis de patrones específicos de tipos celulares de expresión génica tanto al nivel de células individuales como al nivel de población, sin la necesidad de marcadores conocidos o incluso un conocimiento previo de que existe un cierto tipo celular. Esa estrategia general puede extenderse para estudiar todos los tipos de muestras mixtas. Por ejemplo, podría aplicarse para controlar la aparición de tipos celulares específicos durante la organogénesis, sin la necesidad de purificar esos tipos celulares usando marcadores de superficie celular. De forma similar, podría usarse para estudiar poblaciones pequeñas de células madre incluidas en tejidos adultos, tales como las células madre que mantienen las criptas intestinales. El método también podría aplicarse a enfermedad, incluyendo la caracterización de muestras celulares de tumores heterogéneas o las células cancerosas en circulación poco habituales que pueden contribuir a la metástasis.
Lo que une todas estas líneas de investigación científica dispares es la necesidad de separar poblaciones heterogéneas de células. En la actualidad, la separación se consigue principalmente por aislamiento físico de las células basándose en marcadores de superficie celular conocidos, o por marcaje genético de las células deseadas de modo que puedan aislarse basándose, por ejemplo, en la expresión de GFP. Sin embargo, el uso de marcadores previamente conocidos evita el descubrimiento de nuevos tipos celulares, y siempre produce el riesgo de dar como resultado datos mixtos si los marcadores no eran verdaderamente específicos. Por el contrario, los métodos descritos en el presente documento han mostrado que pueden separarse células de distintos tipos simplemente por ordenador, siempre que se generen grandes números de perfiles de expresión de células individuales.
Resulta importante, por lo tanto, que se requiere un método escalable, de muy alto rendimiento, para realización de perfiles de expresión de células individuales. Por lo tanto, se desarrolló un método para preparar una muestra de ADNc de una célula individual con código de barras a partir 96 células en una única etapa de incubación. Como consecuencia, se pudieron agrupar 96 células y tratarse como una única muestra a lo largo del procedimiento, lo que aumentó en gran medida el rendimiento y redujo el coste. También se puede reducir el desvío de amplificación, ya que las 96 células se amplificaron en un único tubo cerrado. El procedimiento completo tardó dos días en realizarse, de 96 células vivas a muestras finalizadas cargadas en el analizador de genoma. El coste, incluyendo todos los reactivos y consumibles para generar 10-15 millones de lecturas de 36 pb usando servicios comerciales, fue de aproximadamente 3500 $ (es decir, aproximadamente 35 $/célula).
Los datos generados en el presente documento fueron en un gran número de células individuales, cada una analizada a una profundidad relativamente superficial de cobertura. Esto permitió la generación de datos en muchas más células individuales de lo que se ha presentado nunca en un único estudio (no se ha publicado ningún experimento de transcriptoma de células individuales con más de una docena de células), y producir un mapa celular con alta resolución. De hecho, siempre que se tome muestra de cada célula con suficiente profundidad para agrupar correctamente, tendría con frecuencia más sentido analizar un gran número de células que analizar cada célula con más profundidad. Cuantas más células se añadan, más precisos serán los datos agregados obtenidos de cada tipo celular distinto (grupo), y mejor será la resolución en el “espacio de tipo celular”. Por ejemplo, se tomaron muestras de muchas de las células ES del presente documento a menos de 100.000 lecturas/célula, pero en total se identificaron 160 células ES en el mapa celular, lo que comprende más de 1,5 millones de lecturas. La toma de muestras de un gran número de células será especialmente importante cuando el enfoque se aplique a tejidos complejos, en los que algunos tipos de células pueden estar presentes solamente en una pequeña minoría. Además, a medida que los costes de secuenciación continúan reduciéndose, el balance entre el número de células y el número de lecturas será menos apremiante.
Se prevé el uso de realización de perfiles transcripcionales de células individuales a muy gran escala para construir un mapa detallado de tipos celulares de origen natural, lo que proporcionaría acceso sin precedentes a la maquinaria genética activa en cada tipo de célula en cada estadio del desarrollo. Puede usarse la misma estrategia para diseccionar la heterogeneidad mutacional de neoplasias al nivel de células individuales.
Claims (15)
1. Un método para preparar una biblioteca de ADNc a partir de una pluralidad de células individuales, comprendiendo el método las etapas de:
(i) liberar ARNm de cada célula individual para proporcionar una pluralidad de muestras de ARNm individuales, en las que el ARNm en cada muestra de ARNm individual es de una única célula;
(ii) sintetizar una primera cadena de ADNc a partir del ARNm en cada muestra de ARNm individual con un cebador de síntesis de una primera cadena de ADNc (CDS) que comprende una secuencia de un cebador de amplificación (APS) en 5' y una secuencia complementaria de ARN (RCS) que es al menos parcialmente complementaria a uno o más ARNm en una muestra de ARNm individual, en donde el RCS comprende oligo (dT), hexámeros aleatorios o una secuencia semi-aleatoria no auto-complementaria, e incorporar un marcador al ADNc para proporcionar una pluralidad de muestras de ADNc marcadas, en donde el ADNc en cada muestra de ADNc marcada es complementario al ARNm de una única célula; y en donde el marcador incorporado es un marcador distinto o una combinación distinta de marcadores, de manera que cada muestra de ADNc tiene una etiqueta o combinación de etiquetas diferente;
(iii) agrupar las muestras de ADNc marcadas; y
(iv) amplificar las muestras de ADNc agrupadas para generar una biblioteca de ADNc que comprende ADNc bicatenario.
2. El método de acuerdo con la reivindicación 1, en el que en la etapa (ii) el marcador se incorpora en el ADNc durante su síntesis.
3. El método de acuerdo con cualquiera de las reivindicaciones 1-2, en el que la RCS es al menos parcialmente complementaria a una parte de la primera cadena de ADNc, de modo que es capaz de dirigir la síntesis de una segunda cadena de ADNc usando la primera cadena de ADNc como molde, o
en el que se añade un oligonucleótido de cambio de molde (TSO) a cada muestra de ARNm individual, en el que dicho TSO comprende una parte que es al menos parcialmente complementaria a una parte en el extremo 3' de la primera cadena de ADNc, en el que opcionalmente el CDS o el TSO incluye un marcador, en el que preferentemente el marcador es una secuencia de nucleótidos de 4-20 nucleótidos de longitud, o en el que opcionalmente tanto el CDS como el TSO incluyen un marcador, en el que preferentemente el CDS y el TSO incluyen cada uno un marcador diferente, de modo que la muestra de ADNc marcada comprende una combinación de marcadores.
4. El método de acuerdo con cualquiera de las reivindicaciones 1-3, en el que la primera cadena de ADNc incluye una parte 3' que comprende una pluralidad de citosinas o análogos de citosina que forman pares de bases con guanosina, en el que opcionalmente el TSO incluye una parte 3' que comprende una pluralidad de guanosinas o análogos de guanosina que forman pares de bases con citosina, en el que preferentemente las guanosinas son ribonucleósidos o monómeros de ácido nucleico bloqueados.
5. El método de acuerdo con cualquiera de las reivindicaciones 1-4, en el que el CDS comprende una RCS en 3'.
6. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el CDS se define por la secuencia 5'-BIO-AAGCAGTGGTATCAACGCAGAGT3üVN-3', donde BIO es una etiqueta de biotina, y en donde V es A, C o G; y en donde N puede ser cualquier nucleobase.
7. El método de acuerdo con cualquiera de las reivindicaciones 1-6, en el que el TSO incluye una APS en 5', en el que opcionalmente la APS en 5' del TSO es al menos un 80 % idéntica a la APS en 5' del CDS, o en la que la APS en 5' del TSO es 100 % idéntica a la APS en 5' del CDS.
8. El método de cualquiera de las reivindicaciones 3-7, en donde el TSO se define por la secuencia 5'-AAGCAGTGGTATCAACGCAGAGTGGATGCTXXXXXrGrGrG-3'; en donde X es una nucleobase aleatoria y en donde rG es riboguanina.
9. El método de acuerdo con cualquiera de las reivindicaciones 1-8, en el que las células se lisan para liberar ARNm y/o en el que el ARNm se purifica después de la etapa (i), y/o en el que la síntesis de ADNc a partir de ARNm se detiene antes de agrupar las muestras de ADNc marcadas, y/o en el que las muestras de ADNc marcadas se purifican antes de la amplificación del ADNc.
10. El método de acuerdo con la reivindicación 1, en el que en la etapa (iv) las muestras de ADNc agrupadas se amplifican por PCR, en el que opcionalmente las muestras de ADNc agrupadas se amplifican por PCR de emulsión, en el que preferentemente las muestras de ADNc agrupadas se amplifican por PCR de un único cebador.
11. El método de acuerdo con cualquiera de las reivindicaciones 1-10, en el que el método comprende además
procesar la biblioteca de ADNc para obtener una biblioteca adecuada para secuenciación.
12. El método de acuerdo con la reivindicación 11, en el que el procesamiento comprende fragmentar la biblioteca de ADNc y/o en el que el procesamiento incluye la etapa de añadir un adaptador al ADNc y/o en el que se amplifica la biblioteca de ADNc.
13. Una biblioteca de ADNc producida por el método de cualquiera de las reivindicaciones 1 a 12.
14. Un método para analizar la expresión génica en una pluralidad de células individuales, comprendiendo el método las etapas de:
(i) preparar una biblioteca de ADNc de acuerdo con el método de cualquiera de las reivindicaciones 1 a 12; y
(ii) secuenciar la biblioteca de ADNc.
15. El método de acuerdo con la reivindicación 14, en el que la secuenciación es por secuenciación al azar, en el que opcionalmente la biblioteca de ADNc se secuencia para obtener al menos 10.000, al menos 1 millón, al menos 10 millones, al menos 100 millones, o al menos 1 billón de lecturas, en el que una lectura es una longitud de ácido nucleico continuo obtenida por una reacción de secuenciación.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US16475909P | 2009-03-30 | 2009-03-30 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2706227T3 true ES2706227T3 (es) | 2019-03-27 |
Family
ID=42936790
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES15190426T Active ES2706227T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
| ES18201978T Active ES2903425T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
| ES10762102.1T Active ES2555389T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
Family Applications After (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES18201978T Active ES2903425T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
| ES10762102.1T Active ES2555389T3 (es) | 2009-03-30 | 2010-03-23 | Análisis de expresión génica en células individuales |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20120010091A1 (es) |
| EP (4) | EP3998346A1 (es) |
| DK (3) | DK3002337T3 (es) |
| ES (3) | ES2706227T3 (es) |
| WO (1) | WO2010117620A2 (es) |
Families Citing this family (221)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005118773A2 (en) | 2004-05-28 | 2005-12-15 | Wafergen, Inc. | Apparatus and methods for multiplex analyses |
| EP3699291B1 (en) | 2008-01-17 | 2024-08-07 | Sequenom, Inc. | Single molecule nucleic acid sequence analysis processes and compositions |
| EP3998346A1 (en) | 2009-03-30 | 2022-05-18 | Illumina, Inc. | Gene expression analysis in single cells |
| SG174617A1 (en) | 2009-04-02 | 2011-10-28 | Fluidigm Corp | Multi-primer amplification method for barcoding of target nucleic acids |
| EP3029141A1 (en) | 2009-08-20 | 2016-06-08 | Population Genetics Technologies Ltd. | Compositions and methods for intramolecular nucleic acid rearrangement |
| US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
| US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
| US10787701B2 (en) | 2010-04-05 | 2020-09-29 | Prognosys Biosciences, Inc. | Spatially encoded biological assays |
| US9650629B2 (en) * | 2010-07-07 | 2017-05-16 | Roche Molecular Systems, Inc. | Clonal pre-amplification in emulsion |
| WO2012048341A1 (en) | 2010-10-08 | 2012-04-12 | President And Fellows Of Harvard College | High-throughput single cell barcoding |
| EP2670863B1 (en) * | 2011-01-31 | 2018-06-27 | H. Hoffnabb-La Roche Ag | Methods of identifying multiple epitopes in cells |
| US9150852B2 (en) | 2011-02-18 | 2015-10-06 | Raindance Technologies, Inc. | Compositions and methods for molecular labeling |
| US9260753B2 (en) * | 2011-03-24 | 2016-02-16 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
| GB201106254D0 (en) * | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
| AU2012242847B2 (en) | 2011-04-15 | 2017-01-19 | The Johns Hopkins University | Safe sequencing system |
| SG194233A1 (en) * | 2011-04-28 | 2013-12-30 | Univ Leland Stanford Junior | Identification of polynucleotides associated with a sample |
| EP2710172B1 (en) * | 2011-05-20 | 2017-03-29 | Fluidigm Corporation | Nucleic acid encoding reactions |
| US9404864B2 (en) | 2013-03-13 | 2016-08-02 | Denovo Sciences, Inc. | System for imaging captured cells |
| EP2739587B1 (en) | 2011-08-01 | 2020-05-27 | Denovo Sciences | Cell capture system |
| US10466160B2 (en) | 2011-08-01 | 2019-11-05 | Celsee Diagnostics, Inc. | System and method for retrieving and analyzing particles |
| WO2013096839A1 (en) | 2011-12-22 | 2013-06-27 | Somagenics, Inc. | Methods of constructing small rna libraries and their use for expression profiling of target rnas |
| GB2513024B (en) * | 2012-02-27 | 2016-08-31 | Cellular Res Inc | A clonal amplification method |
| WO2013130512A2 (en) | 2012-02-27 | 2013-09-06 | The University Of North Carolina At Chapel Hill | Methods and uses for molecular tags |
| EP3495503A1 (en) | 2012-03-05 | 2019-06-12 | President and Fellows of Harvard College | Systems and methods for epigenetic sequencing |
| WO2014008447A1 (en) * | 2012-07-03 | 2014-01-09 | Integrated Dna Technologies, Inc. | Tm-enhanced blocking oligonucleotides and baits for improved target enrichment and reduced off-target selection |
| US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US10584381B2 (en) | 2012-08-14 | 2020-03-10 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
| US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
| US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| EP4397767A3 (en) | 2012-08-14 | 2024-07-31 | 10X Genomics, Inc. | Microcapsule compositions and methods |
| US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| WO2014047561A1 (en) | 2012-09-21 | 2014-03-27 | The Broad Institute Inc. | Compositions and methods for labeling of agents |
| EP4592400A3 (en) | 2012-10-17 | 2025-10-29 | 10x Genomics Sweden AB | Methods and product for optimising localised or spatial detection of gene expression in a tissue sample |
| WO2014066179A1 (en) | 2012-10-24 | 2014-05-01 | Clontech Laboratories, Inc. | Template switch-based methods for producing a product nucleic acid |
| EP2912468B1 (en) | 2012-10-29 | 2018-09-12 | The Johns Hopkins University | Papanicolaou test for ovarian and endometrial cancers |
| WO2014093676A1 (en) | 2012-12-14 | 2014-06-19 | 10X Technologies, Inc. | Methods and systems for processing polynucleotides |
| US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US9752181B2 (en) | 2013-01-26 | 2017-09-05 | Denovo Sciences, Inc. | System and method for capturing and analyzing cells |
| CN108753766A (zh) | 2013-02-08 | 2018-11-06 | 10X基因组学有限公司 | 多核苷酸条形码生成 |
| US9233305B2 (en) * | 2013-02-13 | 2016-01-12 | Unity Technologies Finland Oy | System and method for managing game-playing experiences |
| US9707562B2 (en) | 2013-03-13 | 2017-07-18 | Denovo Sciences, Inc. | System for capturing and analyzing cells |
| WO2014160036A1 (en) * | 2013-03-14 | 2014-10-02 | The Regents Of The University Of California | Nanopipette device and method for subcellular analysis |
| US9255265B2 (en) | 2013-03-15 | 2016-02-09 | Illumina, Inc. | Methods for producing stranded cDNA libraries |
| US10119134B2 (en) | 2013-03-15 | 2018-11-06 | Abvitro Llc | Single cell bar-coding for antibody discovery |
| US10391490B2 (en) | 2013-05-31 | 2019-08-27 | Celsee Diagnostics, Inc. | System and method for isolating and analyzing cells |
| US9856535B2 (en) | 2013-05-31 | 2018-01-02 | Denovo Sciences, Inc. | System for isolating cells |
| WO2014201273A1 (en) * | 2013-06-12 | 2014-12-18 | The Broad Institute, Inc. | High-throughput rna-seq |
| EP4219745B1 (en) | 2013-06-25 | 2025-09-03 | Prognosys Biosciences, Inc. | Spatially encoded biological assays using a microfluidic device |
| CN105579587A (zh) * | 2013-08-23 | 2016-05-11 | 惠氏公司 | 用于使用模板转换反应进行cDNA合成和单细胞转录组概况分析的方法和组合物 |
| GB2546833B (en) | 2013-08-28 | 2018-04-18 | Cellular Res Inc | Microwell for single cell analysis comprising single cell and single bead oligonucleotide capture labels |
| US10395758B2 (en) | 2013-08-30 | 2019-08-27 | 10X Genomics, Inc. | Sequencing methods |
| US9582877B2 (en) | 2013-10-07 | 2017-02-28 | Cellular Research, Inc. | Methods and systems for digitally counting features on arrays |
| US10941397B2 (en) * | 2013-10-17 | 2021-03-09 | Takara Bio Usa, Inc. | Methods for adding adapters to nucleic acids and compositions for practicing the same |
| WO2015058008A2 (en) | 2013-10-18 | 2015-04-23 | California Institute Of Technology | Enhanced nucleic acid identification and detection |
| US9824068B2 (en) | 2013-12-16 | 2017-11-21 | 10X Genomics, Inc. | Methods and apparatus for sorting data |
| WO2015094861A1 (en) | 2013-12-17 | 2015-06-25 | Clontech Laboratories, Inc. | Methods for adding adapters to nucleic acids and compositions for practicing the same |
| CA2943624A1 (en) | 2014-04-10 | 2015-10-15 | 10X Genomics, Inc. | Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same |
| US20150298091A1 (en) | 2014-04-21 | 2015-10-22 | President And Fellows Of Harvard College | Systems and methods for barcoding nucleic acids |
| US20170044525A1 (en) | 2014-04-29 | 2017-02-16 | Illumina, Inc. | Multiplexed single cell gene expression analysis using template switch and tagmentation |
| US10975371B2 (en) | 2014-04-29 | 2021-04-13 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
| US9757707B2 (en) | 2014-06-12 | 2017-09-12 | Takara Bio Usa, Inc. | Single cell capture with capture chips |
| JP2017518752A (ja) | 2014-06-12 | 2017-07-13 | ウエハージェン インコーポレイテッド | 捕捉用重合体膜を用いた単細胞捕捉 |
| US12312640B2 (en) | 2014-06-26 | 2025-05-27 | 10X Genomics, Inc. | Analysis of nucleic acid sequences |
| EP3161160B1 (en) | 2014-06-26 | 2021-10-13 | 10X Genomics, Inc. | Methods of analyzing nucleic acids from individual cells or cell populations |
| AU2015279617A1 (en) | 2014-06-26 | 2017-01-12 | 10X Genomics, Inc. | Analysis of nucleic acid sequences |
| MX378730B (es) * | 2014-09-15 | 2025-03-11 | Abvitro Llc | Secuenciacion de bibliotecas de nucleotidos de alto rendimiento |
| MX2017005267A (es) | 2014-10-29 | 2017-07-26 | 10X Genomics Inc | Metodos y composiciones para la secuenciacion de acidos nucleicos seleccionados como diana. |
| WO2016085632A2 (en) | 2014-11-05 | 2016-06-02 | California Institute Of Technology | Microfluidic measurements of the response of an organism to a drug |
| US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
| EP3227684B1 (en) | 2014-12-03 | 2019-10-02 | Isoplexis Corporation | Analysis and screening of cell secretion profiles |
| CN107427808B (zh) | 2015-01-12 | 2020-10-23 | 10X基因组学有限公司 | 用于制备核酸测序文库的方法和系统以及用其制备的文库 |
| ES2975332T3 (es) | 2015-02-19 | 2024-07-04 | Becton Dickinson Co | Análisis unicelular de alto rendimiento que combina información proteómica y genómica |
| CN107407685B (zh) | 2015-02-20 | 2021-08-03 | 宝生物工程(美国)有限公司 | 快速精确分配、可视化和分析单个细胞的方法 |
| US10697000B2 (en) | 2015-02-24 | 2020-06-30 | 10X Genomics, Inc. | Partition processing methods and systems |
| AU2016222719B2 (en) | 2015-02-24 | 2022-03-31 | 10X Genomics, Inc. | Methods for targeted nucleic acid sequence coverage |
| EP3262192B1 (en) | 2015-02-27 | 2020-09-16 | Becton, Dickinson and Company | Spatially addressable molecular barcoding |
| CA2976681A1 (en) | 2015-02-27 | 2016-09-01 | Fluidigm Corporation | Single-cell nucleic acids for high-throughput studies |
| WO2016160844A2 (en) | 2015-03-30 | 2016-10-06 | Cellular Research, Inc. | Methods and compositions for combinatorial barcoding |
| CN107614684A (zh) | 2015-04-17 | 2018-01-19 | 哈佛学院院长及董事 | 用于基因测序和其它应用的条形编码系统及方法 |
| EP3286326B1 (en) | 2015-04-23 | 2025-01-22 | Becton, Dickinson and Company | Method for whole transcriptome amplification |
| WO2016196229A1 (en) | 2015-06-01 | 2016-12-08 | Cellular Research, Inc. | Methods for rna quantification |
| WO2017027653A1 (en) | 2015-08-11 | 2017-02-16 | The Johns Hopkins University | Assaying ovarian cyst fluid |
| KR20180036712A (ko) * | 2015-08-24 | 2018-04-09 | 키아겐 게엠베하 | Rna-서열결정 라이브러리를 생성하는 방법 |
| SG10201912283RA (en) | 2015-08-28 | 2020-02-27 | Illumina Inc | Nucleic acid sequence analysis from single cells |
| EP3347465B1 (en) | 2015-09-11 | 2019-06-26 | Cellular Research, Inc. | Methods and compositions for nucleic acid library normalization |
| SG11201803646YA (en) | 2015-11-04 | 2018-05-30 | Atreca Inc | Combinatorial sets of nucleic acid barcodes for analysis of nucleic acids associated with single cells |
| US11371094B2 (en) | 2015-11-19 | 2022-06-28 | 10X Genomics, Inc. | Systems and methods for nucleic acid processing using degenerate nucleotides |
| KR20240161696A (ko) | 2015-12-04 | 2024-11-12 | 10엑스 제노믹스, 인크. | 핵산 분석을 위한 방법 및 조성물 |
| CA3006994A1 (en) | 2015-12-16 | 2017-06-22 | Fluidigm Corporation | High-level multiplex amplification |
| US11014957B2 (en) * | 2015-12-21 | 2021-05-25 | Realseq Biosciences, Inc. | Methods of library construction for polynucleotide sequencing |
| CN108779491B (zh) | 2016-02-11 | 2021-03-09 | 10X基因组学有限公司 | 用于全基因组序列数据的从头组装的系统、方法和介质 |
| US10633648B2 (en) | 2016-02-12 | 2020-04-28 | University Of Washington | Combinatorial photo-controlled spatial sequencing and labeling |
| ES2956757T3 (es) | 2016-05-02 | 2023-12-27 | Becton Dickinson Co | Codificación con códigos de barras moleculares precisa |
| WO2017197343A2 (en) | 2016-05-12 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic on-chip filters |
| WO2017197338A1 (en) | 2016-05-13 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic systems and methods of use |
| US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
| ES2979395T3 (es) | 2016-05-26 | 2024-09-25 | Becton Dickinson Co | Métodos de ajuste del recuento de etiquetas moleculares |
| US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
| US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
| WO2018017892A1 (en) | 2016-07-21 | 2018-01-25 | Takara Bio Usa, Inc. | Multi-z imaging and dispensing with multi-well devices |
| EP3510398A1 (en) | 2016-09-12 | 2019-07-17 | Isoplexis Corporation | System and methods for multiplexed analysis of cellular and other immunotherapeutics |
| WO2018058078A1 (en) | 2016-09-23 | 2018-03-29 | California Institute Of Technology | Digital quantification of dna replication and/or chromosome segregation based determination of antimicrobial susceptibility |
| CN109791157B (zh) | 2016-09-26 | 2022-06-07 | 贝克顿迪金森公司 | 使用具有条形码化的寡核苷酸序列的试剂测量蛋白质表达 |
| US11854666B2 (en) * | 2016-09-29 | 2023-12-26 | Myriad Women's Health, Inc. | Noninvasive prenatal screening using dynamic iterative depth optimization |
| EP3539035B1 (en) | 2016-11-08 | 2024-04-17 | Becton, Dickinson and Company | Methods for expression profile classification |
| CN109906274B (zh) | 2016-11-08 | 2023-08-25 | 贝克顿迪金森公司 | 用于细胞标记分类的方法 |
| US11493508B2 (en) | 2016-11-11 | 2022-11-08 | IsoPlexis Corporation | Compositions and methods for the simultaneous genomic, transcriptomic and proteomic analysis of single cells |
| US11525783B2 (en) | 2016-11-22 | 2022-12-13 | IsoPlexis Corporation | Systems, devices and methods for cell capture and methods of manufacture thereof |
| EP3551768B1 (en) * | 2016-12-12 | 2024-03-06 | Grail, LLC | Methods for tagging and amplifying rna template molecules for preparing sequencing libraries |
| US10550429B2 (en) | 2016-12-22 | 2020-02-04 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US10011872B1 (en) | 2016-12-22 | 2018-07-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| WO2018132610A1 (en) | 2017-01-13 | 2018-07-19 | Cellular Research, Inc. | Hydrophilic coating of fluidic channels |
| EP4029939B1 (en) | 2017-01-30 | 2023-06-28 | 10X Genomics, Inc. | Methods and systems for droplet-based single cell barcoding |
| US12264411B2 (en) | 2017-01-30 | 2025-04-01 | 10X Genomics, Inc. | Methods and systems for analysis |
| WO2018144240A1 (en) | 2017-02-01 | 2018-08-09 | Cellular Research, Inc. | Selective amplification using blocking oligonucleotides |
| US10995333B2 (en) | 2017-02-06 | 2021-05-04 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation |
| CN107083423B (zh) * | 2017-03-27 | 2022-01-28 | 北京极客基因科技有限公司 | 一种药物靶点预测和药物全方面评价方法 |
| WO2018204423A1 (en) | 2017-05-01 | 2018-11-08 | Illumina, Inc. | Optimal index sequences for multiplex massively parallel sequencing |
| CA3062174A1 (en) | 2017-05-08 | 2018-11-15 | Illumina, Inc. | Universal short adapters for indexing of polynucleotide samples |
| US10844372B2 (en) | 2017-05-26 | 2020-11-24 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
| EP3445876B1 (en) | 2017-05-26 | 2023-07-05 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
| WO2018218222A1 (en) | 2017-05-26 | 2018-11-29 | Goldfless Stephen Jacob | High-throughput polynucleotide library sequencing and transcriptome analysis |
| AU2018281745B2 (en) | 2017-06-05 | 2022-05-19 | Becton, Dickinson And Company | Sample indexing for single cells |
| US10636512B2 (en) | 2017-07-14 | 2020-04-28 | Cofactor Genomics, Inc. | Immuno-oncology applications using next generation sequencing |
| IL319255A (en) | 2017-08-07 | 2025-04-01 | Univ Johns Hopkins | Methods and materials for cancer assessment and treatment |
| AU2018323449B2 (en) | 2017-08-29 | 2020-09-03 | Bio-Rad Laboratories, Inc. | System and method for isolating and analyzing cells |
| US10837047B2 (en) | 2017-10-04 | 2020-11-17 | 10X Genomics, Inc. | Compositions, methods, and systems for bead formation using improved polymers |
| US12448655B2 (en) | 2017-10-11 | 2025-10-21 | California Institute Of Technology | Antibiotic susceptibility of microorganisms and related methods and systems |
| WO2019075264A1 (en) | 2017-10-11 | 2019-04-18 | California Institute Of Technology | ANTIBIOSENSITIVITY OF MICROORGANISMS AND COMPOSITIONS, METHODS AND ASSOCIATED SYSTEMS |
| WO2019084043A1 (en) | 2017-10-26 | 2019-05-02 | 10X Genomics, Inc. | METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS |
| WO2019084165A1 (en) | 2017-10-27 | 2019-05-02 | 10X Genomics, Inc. | METHODS AND SYSTEMS FOR SAMPLE PREPARATION AND ANALYSIS |
| SG11201913654QA (en) | 2017-11-15 | 2020-01-30 | 10X Genomics Inc | Functionalized gel beads |
| US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
| WO2019108851A1 (en) | 2017-11-30 | 2019-06-06 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation and analysis |
| CN108048915A (zh) * | 2017-12-01 | 2018-05-18 | 北京科迅生物技术有限公司 | 用于ctDNA文库构建的接头混合物、包括其的试剂盒及应用 |
| CA3084439A1 (en) | 2017-12-07 | 2019-06-13 | Massachusetts Institute Of Technology | Single cell analyses |
| WO2019118355A1 (en) | 2017-12-12 | 2019-06-20 | 10X Genomics, Inc. | Systems and methods for single cell processing |
| US11946095B2 (en) | 2017-12-19 | 2024-04-02 | Becton, Dickinson And Company | Particles associated with oligonucleotides |
| CN111712579B (zh) | 2017-12-22 | 2024-10-15 | 10X基因组学有限公司 | 用于处理来自一个或多个细胞的核酸分子的系统和方法 |
| JP2021509024A (ja) | 2018-01-02 | 2021-03-18 | ザ リージェンツ オブ ザ ユニバーシティ オブ ミシガン | 多数の液滴の捕捉 |
| EP3752832A1 (en) | 2018-02-12 | 2020-12-23 | 10X Genomics, Inc. | Methods characterizing multiple analytes from individual cells or cell populations |
| US11639928B2 (en) | 2018-02-22 | 2023-05-02 | 10X Genomics, Inc. | Methods and systems for characterizing analytes from individual cells or cell populations |
| WO2019169028A1 (en) | 2018-02-28 | 2019-09-06 | 10X Genomics, Inc. | Transcriptome sequencing through random ligation |
| SG11202009889VA (en) | 2018-04-06 | 2020-11-27 | 10X Genomics Inc | Systems and methods for quality control in single cell processing |
| ES2945191T3 (es) | 2018-05-03 | 2023-06-29 | Becton Dickinson Co | Análisis de muestras multiómicas de alto rendimiento |
| EP3788170B1 (en) | 2018-05-03 | 2025-01-01 | Becton, Dickinson and Company | Molecular barcoding on opposite transcript ends |
| WO2019217758A1 (en) | 2018-05-10 | 2019-11-14 | 10X Genomics, Inc. | Methods and systems for molecular library generation |
| US11932899B2 (en) | 2018-06-07 | 2024-03-19 | 10X Genomics, Inc. | Methods and systems for characterizing nucleic acid molecules |
| US11703427B2 (en) | 2018-06-25 | 2023-07-18 | 10X Genomics, Inc. | Methods and systems for cell and bead processing |
| US12188014B1 (en) | 2018-07-25 | 2025-01-07 | 10X Genomics, Inc. | Compositions and methods for nucleic acid processing using blocking agents |
| US20200032335A1 (en) | 2018-07-27 | 2020-01-30 | 10X Genomics, Inc. | Systems and methods for metabolome analysis |
| EP3830289A1 (en) | 2018-08-03 | 2021-06-09 | 10X Genomics, Inc. | Methods and systems to minimize barcode exchange |
| US12065688B2 (en) | 2018-08-20 | 2024-08-20 | 10X Genomics, Inc. | Compositions and methods for cellular processing |
| WO2020041148A1 (en) | 2018-08-20 | 2020-02-27 | 10X Genomics, Inc. | Methods and systems for detection of protein-dna interactions using proximity ligation |
| EP4471156A3 (en) | 2018-10-01 | 2025-02-26 | Becton, Dickinson and Company | Determining 5' transcript sequences |
| WO2020097315A1 (en) * | 2018-11-08 | 2020-05-14 | Cellular Research, Inc. | Whole transcriptome analysis of single cells using random priming |
| US11459607B1 (en) | 2018-12-10 | 2022-10-04 | 10X Genomics, Inc. | Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes |
| CN113195717A (zh) | 2018-12-13 | 2021-07-30 | 贝克顿迪金森公司 | 单细胞全转录组分析中的选择性延伸 |
| US20220081714A1 (en) | 2019-01-04 | 2022-03-17 | Northwestern University | Storing temporal data into dna |
| US12169198B2 (en) | 2019-01-08 | 2024-12-17 | 10X Genomics, Inc. | Systems and methods for sample analysis |
| US11845983B1 (en) | 2019-01-09 | 2023-12-19 | 10X Genomics, Inc. | Methods and systems for multiplexing of droplet based assays |
| US11371076B2 (en) | 2019-01-16 | 2022-06-28 | Becton, Dickinson And Company | Polymerase chain reaction normalization through primer titration |
| WO2020154247A1 (en) | 2019-01-23 | 2020-07-30 | Cellular Research, Inc. | Oligonucleotides associated with antibodies |
| SG11202108788TA (en) | 2019-02-12 | 2021-09-29 | 10X Genomics Inc | Methods for processing nucleic acid molecules |
| US11851683B1 (en) | 2019-02-12 | 2023-12-26 | 10X Genomics, Inc. | Methods and systems for selective analysis of cellular samples |
| WO2020167862A1 (en) | 2019-02-12 | 2020-08-20 | 10X Genomics, Inc. | Systems and methods for transfer of reagents between droplets |
| US12275993B2 (en) | 2019-02-12 | 2025-04-15 | 10X Genomics, Inc. | Analysis of nucleic acid sequences |
| US12305239B2 (en) | 2019-02-12 | 2025-05-20 | 10X Genomics, Inc. | Analysis of nucleic acid sequences |
| US11467153B2 (en) | 2019-02-12 | 2022-10-11 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
| WO2020167866A1 (en) | 2019-02-12 | 2020-08-20 | 10X Genomics, Inc. | Systems and methods for transposon loading |
| EP3924506A1 (en) | 2019-02-14 | 2021-12-22 | Becton Dickinson and Company | Hybrid targeted and whole transcriptome amplification |
| US11655499B1 (en) | 2019-02-25 | 2023-05-23 | 10X Genomics, Inc. | Detection of sequence elements in nucleic acid molecules |
| WO2020185791A1 (en) | 2019-03-11 | 2020-09-17 | 10X Genomics, Inc. | Systems and methods for processing optically tagged beads |
| US10633693B1 (en) | 2019-04-16 | 2020-04-28 | Celsee Diagnostics, Inc. | System and method for leakage control in a particle capture system |
| US11965208B2 (en) | 2019-04-19 | 2024-04-23 | Becton, Dickinson And Company | Methods of associating phenotypical data and single cell sequencing data |
| SG11202112151UA (en) | 2019-05-07 | 2021-12-30 | Bio Rad Laboratories | System and method for automated single cell processing |
| US11273439B2 (en) | 2019-05-07 | 2022-03-15 | Bio-Rad Laboratories, Inc. | System and method for target material retrieval from microwells |
| KR20250084977A (ko) | 2019-06-14 | 2025-06-11 | 바이오 래드 래버러토리스 인코오포레이티드 | 자동화된 단일 세포 처리 및 분석을 위한 시스템 및 방법 |
| CN114051534B (zh) | 2019-07-22 | 2025-02-21 | 贝克顿迪金森公司 | 单细胞染色质免疫沉淀测序测定 |
| US12235262B1 (en) | 2019-09-09 | 2025-02-25 | 10X Genomics, Inc. | Methods and systems for single cell protein analysis |
| EP4407041A3 (en) | 2019-11-08 | 2024-09-25 | Becton Dickinson and Company | Using random priming to obtain full-length v(d)j information for immune repertoire sequencing |
| CN115038794A (zh) | 2019-12-23 | 2022-09-09 | 10X基因组学有限公司 | 在基于分区的测定中使用固定生物样品的组合物和方法 |
| AU2021208466A1 (en) | 2020-01-13 | 2022-08-11 | Fluent Biosciences Inc. | Single cell sequencing |
| US11827936B2 (en) | 2020-01-13 | 2023-11-28 | Fluent Biosciences Inc. | Methods and systems for single cell gene profiling |
| US11649497B2 (en) | 2020-01-13 | 2023-05-16 | Becton, Dickinson And Company | Methods and compositions for quantitation of proteins and RNA |
| CA3167729A1 (en) | 2020-01-13 | 2021-07-22 | Fluent Biosciences Inc. | Emulsion based drug screening |
| US20210230681A1 (en) | 2020-01-24 | 2021-07-29 | 10X Genomics, Inc. | Methods for spatial analysis using proximity ligation |
| EP4471155A3 (en) | 2020-01-29 | 2024-12-18 | Becton, Dickinson and Company | Barcoded wells for spatial mapping of single cells through sequencing |
| US20210238661A1 (en) * | 2020-01-31 | 2021-08-05 | Becton, Dickinson And Company | Mesophilic dna polymerase extension blockers |
| US12449419B1 (en) | 2020-02-12 | 2025-10-21 | 10X Genomics, Inc. | Methods for detecting binding of peptide-MHC monomers to T cells |
| IL295297A (en) | 2020-02-14 | 2022-10-01 | Univ Johns Hopkins | Methods and materials for assessing nucleic acids |
| CN115151810A (zh) | 2020-02-25 | 2022-10-04 | 贝克顿迪金森公司 | 实现使用单细胞样品作为单色补偿对照的双特异性探针 |
| US11926863B1 (en) | 2020-02-27 | 2024-03-12 | 10X Genomics, Inc. | Solid state single cell method for analyzing fixed biological cells |
| US11504719B2 (en) | 2020-03-12 | 2022-11-22 | Bio-Rad Laboratories, Inc. | System and method for receiving and delivering a fluid for sample processing |
| CA3175931A1 (en) | 2020-03-16 | 2021-09-23 | Fluent Biosciences Inc. | Multi-omic analysis in monodisperse droplets |
| EP4127058A4 (en) | 2020-03-24 | 2024-04-24 | Fluent Biosciences Inc. | VIRAL DETECTION USING MATRIX EMULSIFICATION |
| US11851700B1 (en) | 2020-05-13 | 2023-12-26 | 10X Genomics, Inc. | Methods, kits, and compositions for processing extracellular molecules |
| CN115605614A (zh) | 2020-05-14 | 2023-01-13 | 贝克顿迪金森公司(Us) | 用于免疫组库谱分析的引物 |
| WO2021236929A1 (en) | 2020-05-22 | 2021-11-25 | 10X Genomics, Inc. | Simultaneous spatio-temporal measurement of gene expression and cellular activity |
| EP4157300A4 (en) * | 2020-05-29 | 2024-07-17 | BioHSV Holdings, Inc. | MASS NUCLEIC ACID TEST |
| US12265079B1 (en) | 2020-06-02 | 2025-04-01 | 10X Genomics, Inc. | Systems and methods for detecting analytes from captured single biological particles |
| US12157913B2 (en) | 2020-06-02 | 2024-12-03 | Becton, Dickinson And Company | Oligonucleotides and beads for 5 prime gene expression assay |
| US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
| CA3189597A1 (en) | 2020-07-15 | 2022-01-20 | Fluent Biosciences Inc. | Tiered ligation oligos |
| US12391940B2 (en) | 2020-07-31 | 2025-08-19 | Becton, Dickinson And Company | Single cell assay for transposase-accessible chromatin |
| EP4192951A1 (en) | 2020-08-06 | 2023-06-14 | Illumina, Inc. | Preparation of rna and dna sequencing libraries using bead-linked transposomes |
| US20230366021A1 (en) * | 2020-09-30 | 2023-11-16 | Ecole Polytechnique Federale De Lausanne (Epfl) | METHOD OF PREPARATION OF cDNA LIBRARY USEFUL FOR EFFICIENT mRNA SEQUENCING AND USES THEREOF |
| US12480158B1 (en) | 2020-11-05 | 2025-11-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
| US12084715B1 (en) | 2020-11-05 | 2024-09-10 | 10X Genomics, Inc. | Methods and systems for reducing artifactual antisense products |
| US11739443B2 (en) | 2020-11-20 | 2023-08-29 | Becton, Dickinson And Company | Profiling of highly expressed and lowly expressed proteins |
| US12392771B2 (en) | 2020-12-15 | 2025-08-19 | Becton, Dickinson And Company | Single cell secretome analysis |
| US12398262B1 (en) | 2021-01-22 | 2025-08-26 | 10X Genomics, Inc. | Triblock copolymer-based cell stabilization and fixation system and methods of use thereof |
| EP4298244A1 (en) | 2021-02-23 | 2024-01-03 | 10X Genomics, Inc. | Probe-based analysis of nucleic acids and proteins |
| EP4196605B1 (en) | 2021-09-01 | 2024-12-04 | 10X Genomics, Inc. | Methods for blocking a capture probe on a spatial array |
| CN118369438A (zh) | 2021-12-10 | 2024-07-19 | 伯乐实验室有限公司 | 用形态可调节功能化颗粒进行样品处理的组合物、方法和系统 |
| CN116200474A (zh) * | 2022-12-30 | 2023-06-02 | 阅尔基因技术(苏州)有限公司 | 一种分析颗粒细胞基因表达的方法 |
| EP4435114A1 (en) | 2023-03-24 | 2024-09-25 | Miltenyi Biotec B.V. & Co. KG | Syntheis of highly multiplexed oligo-barcoded fluorescent beads for single cell seq applications |
Family Cites Families (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
| US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
| US5681702A (en) | 1994-08-30 | 1997-10-28 | Chiron Corporation | Reduction of nonspecific hybridization by using novel base-pairing schemes |
| US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
| US5962271A (en) | 1996-01-03 | 1999-10-05 | Cloutech Laboratories, Inc. | Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end |
| US6265163B1 (en) | 1998-01-09 | 2001-07-24 | Lynx Therapeutics, Inc. | Solid phase selection of differentially expressed genes |
| US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
| US6480791B1 (en) * | 1998-10-28 | 2002-11-12 | Michael P. Strathmann | Parallel methods for genomic analysis |
| US6197554B1 (en) | 1998-11-20 | 2001-03-06 | Shi-Lung Lin | Method for generating full-length cDNA library from single cells |
| PL362977A1 (en) * | 2000-07-21 | 2004-11-02 | Global Genomics Ab | Methods for analysis and identification of transcribed genes, and fingerprinting |
| US6706476B1 (en) | 2000-08-22 | 2004-03-16 | Azign Bioscience A/S | Process for amplifying and labeling single stranded cDNA by 5′ ligated adaptor mediated amplification |
| US20030077611A1 (en) | 2001-10-24 | 2003-04-24 | Sention | Methods and systems for dynamic gene expression profiling |
| AU2003299541A1 (en) | 2002-10-02 | 2004-05-25 | California Institute Of Technology | Microfluidic nucleic acid analysis |
| GB0319332D0 (en) * | 2003-08-16 | 2003-09-17 | Astrazeneca Ab | Amplification |
| ATE461292T1 (de) | 2003-09-10 | 2010-04-15 | Althea Technologies Inc | Erstellung von expressionsprofilen unter verwendung von mikroarrays |
| JP2008510456A (ja) | 2004-07-30 | 2008-04-10 | アジェンコート バイオサイエンス コーポレーション | 多官能基コート化固相担体を用いる核酸の単離方法 |
| US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
| JP2009508495A (ja) * | 2005-09-16 | 2009-03-05 | 454 ライフ サイエンシーズ コーポレイション | cDNAライブラリー調製 |
| JP5073967B2 (ja) | 2006-05-30 | 2012-11-14 | 株式会社日立製作所 | 単一細胞の遺伝子発現定量方法 |
| CN101675169B (zh) | 2006-06-14 | 2018-01-02 | 维里纳塔健康公司 | 使用样品拆分和dna标签进行稀有细胞分析 |
| US20080108804A1 (en) | 2006-11-02 | 2008-05-08 | Kabushiki Kaisha Dnaform | Method for modifying RNAS and preparing DNAS from RNAS |
| CN101720359A (zh) * | 2007-06-01 | 2010-06-02 | 454生命科学公司 | 从多重混合物中识别个别样本的系统和方法 |
| US8039214B2 (en) | 2007-06-29 | 2011-10-18 | Cellscript, Inc. | Synthesis of tagged nucleic acids |
| US20100035249A1 (en) | 2008-08-05 | 2010-02-11 | Kabushiki Kaisha Dnaform | Rna sequencing and analysis using solid support |
| EP3998346A1 (en) | 2009-03-30 | 2022-05-18 | Illumina, Inc. | Gene expression analysis in single cells |
-
2010
- 2010-03-23 EP EP21204801.1A patent/EP3998346A1/en active Pending
- 2010-03-23 DK DK15190426.5T patent/DK3002337T3/en active
- 2010-03-23 DK DK18201978.6T patent/DK3495498T3/da active
- 2010-03-23 WO PCT/US2010/028361 patent/WO2010117620A2/en not_active Ceased
- 2010-03-23 EP EP15190426.5A patent/EP3002337B1/en not_active Revoked
- 2010-03-23 US US13/255,433 patent/US20120010091A1/en not_active Abandoned
- 2010-03-23 EP EP10762102.1A patent/EP2414548B1/en not_active Revoked
- 2010-03-23 ES ES15190426T patent/ES2706227T3/es active Active
- 2010-03-23 ES ES18201978T patent/ES2903425T3/es active Active
- 2010-03-23 EP EP18201978.6A patent/EP3495498B1/en active Active
- 2010-03-23 DK DK10762102.1T patent/DK2414548T3/en active
- 2010-03-23 ES ES10762102.1T patent/ES2555389T3/es active Active
Also Published As
| Publication number | Publication date |
|---|---|
| ES2555389T3 (es) | 2015-12-30 |
| EP3002337A1 (en) | 2016-04-06 |
| EP3495498A1 (en) | 2019-06-12 |
| WO2010117620A3 (en) | 2011-02-17 |
| EP2414548A2 (en) | 2012-02-08 |
| EP2414548B1 (en) | 2015-10-21 |
| DK2414548T3 (en) | 2015-12-21 |
| EP3495498B1 (en) | 2021-10-27 |
| US20120010091A1 (en) | 2012-01-12 |
| WO2010117620A2 (en) | 2010-10-14 |
| EP2414548A4 (en) | 2012-10-10 |
| DK3495498T3 (da) | 2022-01-17 |
| EP3002337B1 (en) | 2018-10-24 |
| HK1221266A1 (en) | 2017-05-26 |
| ES2903425T3 (es) | 2022-04-01 |
| EP3998346A1 (en) | 2022-05-18 |
| DK3002337T3 (en) | 2019-02-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2706227T3 (es) | Análisis de expresión génica en células individuales | |
| US20240376460A1 (en) | High-throughput single-cell sequencing with reduced amplification bias | |
| US11629379B2 (en) | Single cell nucleic acid detection and analysis | |
| US11441180B2 (en) | Compositions and methods for accurately identifying mutations | |
| Picelli et al. | Full-length RNA-seq from single cells using Smart-seq2 | |
| ES2667346T3 (es) | Estrategias de secuenciación de región genómica 3-D de interés | |
| JP7460539B2 (ja) | 核酸を結合、修飾、および切断する物質の基質選択性および部位のためのin vitroでの高感度アッセイ | |
| JP2023506631A (ja) | 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製 | |
| WO2024033411A1 (en) | Methods for determining the location of a target sequence and uses | |
| US10844427B2 (en) | Four-leaf clover qRT-PCR: an efficient and convenient method for selective quantification of mature tRNA | |
| HK40077630A (en) | Gene expression analysis in single cells | |
| HK40010085A (en) | Gene expression analysis in single cells | |
| HK40010085B (en) | Gene expression analysis in single cells | |
| CN117845339B (zh) | 一种用于检测与目标基因座相互作用的dna片段的文库构建方法 | |
| US20250084484A1 (en) | Methods and compositions for transcriptome analysis | |
| HK1221266B (en) | Gene expression analysis in single cells | |
| RU2833615C2 (ru) | Высокопроизводительное секвенирование одиночной клетки со сниженной ошибкой амплификации | |
| EP4536854A1 (en) | Optimised set of oligonucleotides for bulk rna barcoding and sequencing | |
| Mordstein | Coding-sequence determinants of gene expression in human cells |