ES2926722T3 - Secuenciación de alto rendimiento de biblioteca de polinucleótidos y análisis de transcriptoma - Google Patents
Secuenciación de alto rendimiento de biblioteca de polinucleótidos y análisis de transcriptoma Download PDFInfo
- Publication number
- ES2926722T3 ES2926722T3 ES18731697T ES18731697T ES2926722T3 ES 2926722 T3 ES2926722 T3 ES 2926722T3 ES 18731697 T ES18731697 T ES 18731697T ES 18731697 T ES18731697 T ES 18731697T ES 2926722 T3 ES2926722 T3 ES 2926722T3
- Authority
- ES
- Spain
- Prior art keywords
- polynucleotides
- polynucleotide
- barcoded
- cell
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 866
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 866
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 866
- 238000011222 transcriptome analysis Methods 0.000 title claims abstract description 7
- 238000012165 high-throughput sequencing Methods 0.000 title description 10
- 238000000034 method Methods 0.000 claims abstract description 255
- 108091008874 T cell receptors Proteins 0.000 claims abstract description 176
- 238000012163 sequencing technique Methods 0.000 claims abstract description 114
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 66
- 238000004458 analytical method Methods 0.000 claims abstract description 26
- 230000014509 gene expression Effects 0.000 claims abstract description 26
- 210000004027 cell Anatomy 0.000 claims description 408
- 239000013615 primer Substances 0.000 claims description 386
- 230000000295 complement effect Effects 0.000 claims description 206
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 claims description 150
- 239000002299 complementary DNA Substances 0.000 claims description 115
- 230000003321 amplification Effects 0.000 claims description 111
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 111
- 108091034117 Oligonucleotide Proteins 0.000 claims description 109
- 125000003729 nucleotide group Chemical group 0.000 claims description 100
- 239000002773 nucleotide Substances 0.000 claims description 99
- 210000002865 immune cell Anatomy 0.000 claims description 89
- 230000037452 priming Effects 0.000 claims description 87
- 238000010839 reverse transcription Methods 0.000 claims description 86
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 64
- 230000027455 binding Effects 0.000 claims description 62
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 52
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 43
- 239000000839 emulsion Substances 0.000 claims description 38
- 108091093088 Amplicon Proteins 0.000 claims description 27
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 26
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 26
- 239000000203 mixture Substances 0.000 claims description 25
- 230000000694 effects Effects 0.000 claims description 24
- 239000011324 bead Substances 0.000 claims description 21
- 238000004519 manufacturing process Methods 0.000 claims description 20
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 20
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 claims description 19
- 239000007787 solid Substances 0.000 claims description 18
- 230000036961 partial effect Effects 0.000 claims description 17
- 229920001184 polypeptide Polymers 0.000 claims description 17
- 230000009977 dual effect Effects 0.000 claims description 16
- 230000001413 cellular effect Effects 0.000 claims description 14
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 14
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 claims description 12
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 claims description 12
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 claims description 10
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 claims description 10
- 239000003094 microcapsule Substances 0.000 claims description 9
- 229930024421 Adenine Natural products 0.000 claims description 7
- 229960000643 adenine Drugs 0.000 claims description 7
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 7
- 210000004698 lymphocyte Anatomy 0.000 claims description 7
- 229940113082 thymine Drugs 0.000 claims description 7
- 108091026890 Coding region Proteins 0.000 claims description 6
- 238000000137 annealing Methods 0.000 claims description 6
- 230000002934 lysing effect Effects 0.000 claims description 6
- 239000003155 DNA primer Substances 0.000 claims description 4
- 108091028664 Ribonucleotide Proteins 0.000 claims description 4
- 150000001413 amino acids Chemical class 0.000 claims description 4
- 230000035755 proliferation Effects 0.000 claims description 4
- 239000002336 ribonucleotide Substances 0.000 claims description 4
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 4
- 230000020411 cell activation Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 2
- 102100034343 Integrase Human genes 0.000 claims 4
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 claims 2
- 230000009258 tissue cross reactivity Effects 0.000 abstract description 25
- 238000003559 RNA-seq method Methods 0.000 abstract description 3
- 108091008915 immune receptors Proteins 0.000 abstract 1
- 102000027596 immune receptors Human genes 0.000 abstract 1
- 108020004635 Complementary DNA Proteins 0.000 description 161
- 238000006243 chemical reaction Methods 0.000 description 149
- 238000010804 cDNA synthesis Methods 0.000 description 113
- 230000002441 reversible effect Effects 0.000 description 103
- 229920002477 rna polymer Polymers 0.000 description 101
- 239000000523 sample Substances 0.000 description 101
- 238000003752 polymerase chain reaction Methods 0.000 description 89
- 108020004999 messenger RNA Proteins 0.000 description 80
- 239000000427 antigen Substances 0.000 description 70
- 108091007433 antigens Proteins 0.000 description 70
- 102000036639 antigens Human genes 0.000 description 70
- 102000053602 DNA Human genes 0.000 description 69
- 108020004414 DNA Proteins 0.000 description 69
- 150000007523 nucleic acids Chemical class 0.000 description 62
- 102100031780 Endonuclease Human genes 0.000 description 61
- 102000039446 nucleic acids Human genes 0.000 description 60
- 108020004707 nucleic acids Proteins 0.000 description 60
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 47
- 239000012634 fragment Substances 0.000 description 43
- 239000012530 fluid Substances 0.000 description 37
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 26
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 26
- 239000012472 biological sample Substances 0.000 description 26
- 102000004169 proteins and genes Human genes 0.000 description 25
- 108060003951 Immunoglobulin Proteins 0.000 description 24
- 102000018358 immunoglobulin Human genes 0.000 description 24
- 238000011144 upstream manufacturing Methods 0.000 description 22
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 21
- 235000018102 proteins Nutrition 0.000 description 21
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 20
- 201000010099 disease Diseases 0.000 description 20
- 102000004190 Enzymes Human genes 0.000 description 19
- 108090000790 Enzymes Proteins 0.000 description 19
- 229940088598 enzyme Drugs 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 19
- 206010028980 Neoplasm Diseases 0.000 description 18
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 17
- 230000000875 corresponding effect Effects 0.000 description 17
- 229910052720 vanadium Inorganic materials 0.000 description 16
- 241001465754 Metazoa Species 0.000 description 15
- 239000003153 chemical reaction reagent Substances 0.000 description 15
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 14
- 210000004369 blood Anatomy 0.000 description 14
- 239000008280 blood Substances 0.000 description 14
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 13
- 125000003275 alpha amino acid group Chemical group 0.000 description 13
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 13
- 239000000654 additive Substances 0.000 description 12
- 239000008346 aqueous phase Substances 0.000 description 12
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 11
- 239000012071 phase Substances 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 239000000243 solution Substances 0.000 description 11
- -1 antibody Proteins 0.000 description 10
- 238000002372 labelling Methods 0.000 description 10
- 239000003921 oil Substances 0.000 description 10
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 9
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- 229940098773 bovine serum albumin Drugs 0.000 description 9
- 201000011510 cancer Diseases 0.000 description 9
- 238000002844 melting Methods 0.000 description 9
- 230000008018 melting Effects 0.000 description 9
- 238000003757 reverse transcription PCR Methods 0.000 description 9
- 239000007858 starting material Substances 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- 239000004971 Cross linker Substances 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 239000000539 dimer Substances 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 238000000018 DNA microarray Methods 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000010438 heat treatment Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 241000713838 Avian myeloblastosis virus Species 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 102000003960 Ligases Human genes 0.000 description 6
- 108090000364 Ligases Proteins 0.000 description 6
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 6
- DLLXAZJTLIUPAI-XLPZGREQSA-N [[(2r,3s,5r)-5-(2-amino-4-oxo-1h-pyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 DLLXAZJTLIUPAI-XLPZGREQSA-N 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 239000000090 biomarker Substances 0.000 description 6
- 238000001574 biopsy Methods 0.000 description 6
- 238000004581 coalescence Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 210000004602 germ cell Anatomy 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 6
- 238000009830 intercalation Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- YMBCJWGVCUEGHA-UHFFFAOYSA-M tetraethylammonium chloride Chemical compound [Cl-].CC[N+](CC)(CC)CC YMBCJWGVCUEGHA-UHFFFAOYSA-M 0.000 description 6
- FBEVECUEMUUFKM-UHFFFAOYSA-M tetrapropylazanium;chloride Chemical compound [Cl-].CCC[N+](CCC)(CCC)CCC FBEVECUEMUUFKM-UHFFFAOYSA-M 0.000 description 6
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 5
- 108050005493 CD3 protein, epsilon/gamma/delta subunit Proteins 0.000 description 5
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 5
- 238000002617 apheresis Methods 0.000 description 5
- 239000008366 buffered solution Substances 0.000 description 5
- 239000002775 capsule Substances 0.000 description 5
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 5
- 230000001900 immune effect Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 238000011176 pooling Methods 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 4
- 108091008875 B cell receptors Proteins 0.000 description 4
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 238000007400 DNA extraction Methods 0.000 description 4
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 4
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 4
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 4
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 4
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 4
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 4
- 230000000890 antigenic effect Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 229960003237 betaine Drugs 0.000 description 4
- 239000003599 detergent Substances 0.000 description 4
- 238000007847 digital PCR Methods 0.000 description 4
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 4
- 238000011304 droplet digital PCR Methods 0.000 description 4
- 210000003743 erythrocyte Anatomy 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 210000003071 memory t lymphocyte Anatomy 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000001717 pathogenic effect Effects 0.000 description 4
- 238000002823 phage display Methods 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 210000003296 saliva Anatomy 0.000 description 4
- 238000007860 single-cell PCR Methods 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 239000013077 target material Substances 0.000 description 4
- 210000002700 urine Anatomy 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 241000251730 Chondrichthyes Species 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 108010010803 Gelatin Proteins 0.000 description 3
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 3
- 108091006905 Human Serum Albumin Proteins 0.000 description 3
- 102000008100 Human Serum Albumin Human genes 0.000 description 3
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 3
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 3
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 3
- 241000714177 Murine leukemia virus Species 0.000 description 3
- 108091000054 Prion Proteins 0.000 description 3
- 102000029797 Prion Human genes 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 239000013504 Triton X-100 Substances 0.000 description 3
- 229920004890 Triton X-100 Polymers 0.000 description 3
- 101150117115 V gene Proteins 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 210000000612 antigen-presenting cell Anatomy 0.000 description 3
- 230000001363 autoimmune Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000002981 blocking agent Substances 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 230000006037 cell lysis Effects 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000002848 electrochemical method Methods 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- 238000005189 flocculation Methods 0.000 description 3
- 230000016615 flocculation Effects 0.000 description 3
- 230000008014 freezing Effects 0.000 description 3
- 238000007710 freezing Methods 0.000 description 3
- 239000008273 gelatin Substances 0.000 description 3
- 229920000159 gelatin Polymers 0.000 description 3
- 235000019322 gelatine Nutrition 0.000 description 3
- 235000011852 gelatine desserts Nutrition 0.000 description 3
- 235000011187 glycerol Nutrition 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000007849 hot-start PCR Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 229940072221 immunoglobulins Drugs 0.000 description 3
- 239000012678 infectious agent Substances 0.000 description 3
- 239000011777 magnesium Substances 0.000 description 3
- 229910052749 magnesium Inorganic materials 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000001806 memory b lymphocyte Anatomy 0.000 description 3
- 210000001616 monocyte Anatomy 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000003472 neutralizing effect Effects 0.000 description 3
- 208000037916 non-allergic rhinitis Diseases 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 244000045947 parasite Species 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 210000005105 peripheral blood lymphocyte Anatomy 0.000 description 3
- 229920000136 polysorbate Polymers 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 210000000952 spleen Anatomy 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 125000005207 tetraalkylammonium group Chemical group 0.000 description 3
- 125000003396 thiol group Chemical group [H]S* 0.000 description 3
- NFGXHKASABOEEW-UHFFFAOYSA-N 1-methylethyl 11-methoxy-3,7,11-trimethyl-2,4-dodecadienoate Chemical compound COC(C)(C)CCCC(C)CC=CC(C)=CC(=O)OC(C)C NFGXHKASABOEEW-UHFFFAOYSA-N 0.000 description 2
- 241001156002 Anthonomus pomorum Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 101150111062 C gene Proteins 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical group [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000979599 Homo sapiens Protein NKG7 Proteins 0.000 description 2
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 108010031099 Mannose Receptor Proteins 0.000 description 2
- 108090000526 Papain Proteins 0.000 description 2
- 102000057297 Pepsin A Human genes 0.000 description 2
- 108090000284 Pepsin A Proteins 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 102100023370 Protein NKG7 Human genes 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- 102100039390 Toll-like receptor 7 Human genes 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000003463 adsorbent Substances 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 125000000217 alkyl group Chemical group 0.000 description 2
- 210000000628 antibody-producing cell Anatomy 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 210000001772 blood platelet Anatomy 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 108091092328 cellular RNA Proteins 0.000 description 2
- 241000902900 cellular organisms Species 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 239000002738 chelating agent Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 210000003162 effector t lymphocyte Anatomy 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- 239000008240 homogeneous mixture Substances 0.000 description 2
- 210000004408 hybridoma Anatomy 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 210000001165 lymph node Anatomy 0.000 description 2
- 210000003563 lymphoid tissue Anatomy 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- UEGPKNKPLBYCNK-UHFFFAOYSA-L magnesium acetate Chemical compound [Mg+2].CC([O-])=O.CC([O-])=O UEGPKNKPLBYCNK-UHFFFAOYSA-L 0.000 description 2
- 239000011654 magnesium acetate Substances 0.000 description 2
- 235000011285 magnesium acetate Nutrition 0.000 description 2
- 229940069446 magnesium acetate Drugs 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 2
- 235000019341 magnesium sulphate Nutrition 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 210000005087 mononuclear cell Anatomy 0.000 description 2
- 210000000822 natural killer cell Anatomy 0.000 description 2
- 238000001668 nucleic acid synthesis Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 238000005580 one pot reaction Methods 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 229940055729 papain Drugs 0.000 description 2
- 235000019834 papain Nutrition 0.000 description 2
- 229940111202 pepsin Drugs 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 210000004976 peripheral blood cell Anatomy 0.000 description 2
- 230000004962 physiological condition Effects 0.000 description 2
- 229920001993 poloxamer 188 Polymers 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 210000003289 regulatory T cell Anatomy 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 210000000582 semen Anatomy 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 2
- MXHRCPNRJAMMIM-ULQXZJNLSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidine-2,4-dione Chemical compound O=C1NC(=O)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 MXHRCPNRJAMMIM-ULQXZJNLSA-N 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108010032595 Antibody Binding Sites Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 102000019260 B-Cell Antigen Receptors Human genes 0.000 description 1
- 108010012919 B-Cell Antigen Receptors Proteins 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 102000000119 Beta-lactoglobulin Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001598984 Bromius obscurus Species 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 108050009160 DNA polymerase 1 Proteins 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 230000010777 Disulfide Reduction Effects 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 102100029966 HLA class II histocompatibility antigen, DP alpha 1 chain Human genes 0.000 description 1
- 102000006354 HLA-DR Antigens Human genes 0.000 description 1
- 108010058597 HLA-DR Antigens Proteins 0.000 description 1
- 101000690301 Homo sapiens Aldo-keto reductase family 1 member C4 Proteins 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000935587 Homo sapiens Flavin reductase (NADPH) Proteins 0.000 description 1
- 101000864089 Homo sapiens HLA class II histocompatibility antigen, DP alpha 1 chain Proteins 0.000 description 1
- 101000930802 Homo sapiens HLA class II histocompatibility antigen, DQ alpha 1 chain Proteins 0.000 description 1
- 101000968032 Homo sapiens HLA class II histocompatibility antigen, DR beta 3 chain Proteins 0.000 description 1
- 101001046686 Homo sapiens Integrin alpha-M Proteins 0.000 description 1
- 101000917858 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-A Proteins 0.000 description 1
- 101000917839 Homo sapiens Low affinity immunoglobulin gamma Fc region receptor III-B Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101001116548 Homo sapiens Protein CBFA2T1 Proteins 0.000 description 1
- 101000946860 Homo sapiens T-cell surface glycoprotein CD3 epsilon chain Proteins 0.000 description 1
- 101000946843 Homo sapiens T-cell surface glycoprotein CD8 alpha chain Proteins 0.000 description 1
- 101000669402 Homo sapiens Toll-like receptor 7 Proteins 0.000 description 1
- 102000012745 Immunoglobulin Subunits Human genes 0.000 description 1
- 108010079585 Immunoglobulin Subunits Proteins 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 102100022338 Integrin alpha-M Human genes 0.000 description 1
- 101150008942 J gene Proteins 0.000 description 1
- 108010060630 Lactoglobulins Proteins 0.000 description 1
- 102100029185 Low affinity immunoglobulin gamma Fc region receptor III-B Human genes 0.000 description 1
- 102000043129 MHC class I family Human genes 0.000 description 1
- 108091054437 MHC class I family Proteins 0.000 description 1
- 102100025354 Macrophage mannose receptor 1 Human genes 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- GOOHAUXETOMSMM-UHFFFAOYSA-N Propylene oxide Chemical compound CC1CO1 GOOHAUXETOMSMM-UHFFFAOYSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- ABBQHOQBGMUPJH-UHFFFAOYSA-M Sodium salicylate Chemical compound [Na+].OC1=CC=CC=C1C([O-])=O ABBQHOQBGMUPJH-UHFFFAOYSA-M 0.000 description 1
- 241001613917 Staphylococcus virus 29 Species 0.000 description 1
- 102100035794 T-cell surface glycoprotein CD3 epsilon chain Human genes 0.000 description 1
- 102100034922 T-cell surface glycoprotein CD8 alpha chain Human genes 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 229920002359 Tetronic® Polymers 0.000 description 1
- 101000865057 Thermococcus litoralis DNA polymerase Proteins 0.000 description 1
- 108010060825 Toll-Like Receptor 7 Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 238000004082 amperometric method Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000009830 antibody antigen interaction Effects 0.000 description 1
- 238000004630 atomic force microscopy Methods 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 239000003876 biosurfactant Substances 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000002458 cell surface marker Substances 0.000 description 1
- 238000000701 chemical imaging Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- GDPJWJXLKPPEKK-SJAYXVESSA-N dT4 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 GDPJWJXLKPPEKK-SJAYXVESSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000003936 denaturing gel electrophoresis Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000572 ellipsometry Methods 0.000 description 1
- 210000002308 embryonic cell Anatomy 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000000834 fixative Substances 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 239000012595 freezing medium Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 210000004837 gut-associated lymphoid tissue Anatomy 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 102000054751 human RUNX1T1 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000008073 immune recognition Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 210000000428 immunological synapse Anatomy 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000005305 interferometry Methods 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000001616 ion spectroscopy Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000000867 larynx Anatomy 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000005210 lymphoid organ Anatomy 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 238000007837 multiplex assay Methods 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000002741 palatine tonsil Anatomy 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 238000012510 peptide mapping method Methods 0.000 description 1
- 230000008823 permeabilization Effects 0.000 description 1
- 239000008191 permeabilizing agent Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 210000003720 plasmablast Anatomy 0.000 description 1
- 210000004180 plasmocyte Anatomy 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000001448 refractive index detection Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 229960004025 sodium salicylate Drugs 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 1
- 238000000672 surface-enhanced laser desorption--ionisation Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 229940124598 therapeutic candidate Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- AISMNBXOJRHCIA-UHFFFAOYSA-N trimethylazanium;bromide Chemical class Br.CN(C)C AISMNBXOJRHCIA-UHFFFAOYSA-N 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 239000012808 vapor phase Substances 0.000 description 1
- 239000007762 w/o emulsion Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/155—Modifications characterised by incorporating/generating a new priming site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/179—Modifications characterised by incorporating arbitrary or random nucleotide sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/159—Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
Abstract
En el presente documento se proporcionan métodos para la secuenciación de genes diana y códigos de barras de células individuales junto con el análisis de la expresión génica en células individuales. En algunas realizaciones, el gen diana es una molécula inmunitaria, como un anticuerpo o TCR. En algunas realizaciones, los métodos se pueden usar para llevar a cabo la secuenciación del transcriptoma, por ejemplo, la secuenciación del ARN, para capturar el transcriptoma de células individuales emparejadas con secuencias de receptores inmunitarios del receptor completo de modo que se pueda determinar la información sobre el repertorio inmunitario y el transcriptoma de una célula. También se proporcionan bibliotecas de polinucleótidos para su uso en la realización de análisis de transcriptomas y secuenciación de moléculas inmunitarias, por ejemplo, anticuerpos o TCR. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Secuenciación de alto rendimiento de biblioteca de polinucleótidos y análisis de transcriptoma
Referencia cruzada a solicitudes relacionadas
[0001] Esta solicitud reivindica prioridad de la solicitud de patente provisional de los EE.UU. N.° 62/511,949, presentada el 26 de mayo de 2017, titulada «HIGH-THROUGHPUT POLYNUCLEOTIDE LIBRARY SEQUENCING AND TRANSCRIPTOME ANALYSIS,».
Campo
[0002] La presente divulgación se refiere a métodos para la secuenciación de genes diana y codificación con código de barras de células únicas en conjunto con el análisis de la expresión genética en células únicas. En algunos modos de realización, el gen diana es una molécula inmunitaria, como un anticuerpo o un TCR. En algunos modos de realización, los métodos se pueden emplear para llevar a cabo la secuenciación del transcriptoma, p. ej., la secuenciación de ARN, para capturar un transcriptoma de células únicas emparejadas con secuencias del inmunoreceptor completas, de manera que se puede determinar la información sobre el repertorio inmune y el transcriptoma de una célula. La presente divulgación también se refiere a bibliotecas de polinucleótidos para su uso en el proceso de análisis transcriptómico y secuenciación de la molécula inmunitaria, p. ej., anticuerpo o TCR.
Antecedentes
[0003] La determinación del contenido transcriptómico de una célula o un tejido (p. ej., «perfil de expresión génica») proporciona un método para el análisis funcional de células o tejidos normales o enfermos, incluyendo el proporcionar información de caracterización sobre el «estado» de la célula o del tejido o identificar características de subpoblaciones de células. Las herramientas existentes para la secuenciación del transcriptoma de célula única tienen un rendimiento limitado y/o no son capaces de capturar secuencias inmunoreceptoras de longitud completa.
[0004] El documento WO2017/053905 divulga un método de caracterización de células en un recipiente que emplea un polinucleótido con código de barras fijado a un conjugado de afinidad-oligonucleótido, donde la porción de afinidad se une a un antígeno diana y la porción de oligonucleótido comprende una secuencia de identificación del antígeno. El documento WO2016/044227 divulga métodos para la codificación con código de barras de células únicas empleando primeros y segundos polinucleótidos complementarios a primeros y segundos polinucleótidos de la célula. Se precisan métodos mejorados. Se proporcionan métodos y composiciones que satisfacen estas necesidades.
Sumario
[0005] Se proporcionan métodos de producción de una biblioteca de polinucleótidos a partir de células individuales o de una pluralidad de células, donde se producen una o más secuencias de polinucleótidos diana con código de barras de longitud completa o fragmentos seleccionados de estas, mientras se cogenera una multitud de secuencias de polinucleótidos con código de barras, cuyo conjunto representa sustancialmente el transcriptoma o genoma de una célula o una pluralidad de células. El código de barras permite analizar y cuantificar la expresión o presencia de polinucleótidos de una misma célula. También se proporcionan bibliotecas de polinucleótidos producidas mediante los métodos de la presente memoria. También se proporcionan métodos de análisis del transcriptoma de una célula única o de una multitud de células y la combinación del análisis del transcriptoma con el análisis de la(s) secuencia(s) diana.
[0006] En algunos modos de realización, los métodos incluyen la producción de una biblioteca de polinucleótidos, que incluye la adición de un segundo adaptador a cada uno de una pluralidad de polinucleótidos monocatenarios con código de barras en un extremo terminal, o cerca de este, que está opuesto a un primer adaptador fijado a cada uno de los polinucleótidos monocatenarios con código de barras, conteniendo la pluralidad de polinucleótidos monocatenarios con código de barras: (i) uno o más polinucleótidos monocatenarios diana, incluyendo un amplicón de uno o más polinucleótidos diana, o (un) complemento(s) de este, presente en una célula de una población de células; y (ii) un conjunto de polinucleótidos monocatenarios, que contienen cada uno un amplicón de un polinucleótido, o un complemento de este, en la célula; y donde cada uno de la pluralidad de polinucleótidos monocatenarios con código de barras incluye un código de barras de recipiente que es el mismo para todos los polinucleótidos de (i) y (ii) de la misma célula de la población de células.
[0007] En algunos modos de realización, la pluralidad de polinucleótidos monocatenarios con código de barras incluye polinucleótidos de (i) y (ii) de una pluralidad de células en la población de células. En algunos modos de realización, la pluralidad de polinucleótidos monocatenarios con código de barras además contiene un código de barras molecular que es único para cada polinucleótido monocatenario o un producto amplificado de este.
[0008] En algunos modos de realización, el conjunto de polinucleótidos monocatenarios de cada célula de la población de células, colectivamente, contiene cadenas de ADN complementario (ADNc) de un transcriptoma o de un transcriptoma
parcial. En algunos modos de realización, el transcriptoma o el transcriptoma parcial, colectivamente, contienen al menos el 60 %, 70 %, 75 %, 80 %, 85 % 90 % 95 %, 96 %, 97 %, 98 %, 99 % o el 100 % de los transcritos presentes en el genoma de la célula.
[0009] En algunos modos de realización del método, cada uno de los polinucleótidos monocatenarios con código de barras presenta un tamaño que es superior a o superior a alrededor de 50 pares de bases, superior a 100 pares de bases, o superior a 200 pares de bases. En algunos modos de realización, cada uno de los polinucleótidos monocatenarios con código de barras presenta un tamaño de o de alrededor de 50 pares de bases (pb) a 1500 pb, 50 pb a 1250 pb, 50 pb a 1000 pb, 50 pb a 750 pb, 50 pb a 500 pb, 100 pb a 1500 pb, 100 pb a 1250 pb, 100 pb a 1000 pb, 100 pb a 750 pb, 100 pb a 500 pb, 200 pb a 1500 pb, 200 pb a 1250 pb, 200 pb a 1000 pb, 200 pb a 750 pb o 250 pb a 500 pb.
[0010] En algunos modos de realización del método, el segundo adaptador se añade en una mezcla homogénea que contiene la pluralidad de polinucleótidos monocatenarios con código de barras.
[0011] En algunos modos de realización, el primer adaptador contiene el código de barras de recipiente.
[0012] En algunos modos de realización de los métodos de producción de una biblioteca de polinucleótidos, el método incluye: (a) la lisis de células dentro de cada uno de una pluralidad de recipientes, donde cada uno de dichos recipientes contiene una célula de una muestra que contiene una población de células; (b) la producción, en cada recipiente, de una pluralidad de polinucleótidos complementarios, incluyendo dicha producción de dicha pluralidad de polinucleótidos complementarios (i) la producción de uno o más polinucleótidos diana, que sean complementarios a uno o más polinucleótidos diana presentes en la célula empleando uno o más cebadores específicos de diana; y (ii) la producción de un conjunto de polinucleótidos diana, cada uno de los cuales es complementario a un polinucleótido en la célula. En algunos modos de realización, el conjunto de polinucleótidos (ii) se produce empleando cebadores oligo aleatorios y/o redundantes y/o no específicos. En algunos modos de realización, el conjunto de polinucleótidos en (ii) se produce empleando cebadores oligo dT.
[0013] En algunos modos de realización, cada uno de dichos recipientes además contiene una pluralidad de oligonucleótidos con código de barras molecular, un acervo de oligonucleótidos con código de barras de recipiente y, opcionalmente, un primer adaptador, y el método además incluye: (c) la fijación de una pluralidad de, opcionalmente cada uno de la pluralidad de, polinucleótidos complementarios a uno de la pluralidad de oligonucleótidos con código de barras molecular, generando así una pluralidad de polinucleótidos con código de barras, como polinucleótidos con código de barras molecular, conteniendo cada uno un código de barras molecular, opcionalmente donde el código de barras molecular es distinto de los códigos de barras moleculares contenidos por otros polinucleótidos con código de barras dentro de la pluralidad y/o es un código de barras molecular único; (d) la fijación de uno de un o de un acervo de oligonucleótidos con código de barras de recipiente, o un producto amplificado de este, a una pluralidad de, opcionalmente a cada uno de, los polinucleótidos con código de barras, generando así polinucleótidos con código de barras doble, donde cada uno de los polinucleótidos con código de barras doble en el mismo recipiente contiene el mismo código de barras de recipiente. En algunos modos de realización, el paso (d) comprende la fijación de uno del uno o de un acervo de oligonucleótidos con código de barras de recipiente, o un producto amplificado de este, y el primer adaptador o uno del acervo de primeros adaptadores, o un producto amplificado de este, a una pluralidad de, opcionalmente de, los polinucleótidos con código de barras molecular, generando así una pluralidad de polinucleótidos con código de barras doble, opcionalmente, polinucleótidos monocatenarios con código de barras doble, donde cada uno de los polinucleótidos con código de barras doble en el mismo recipiente comprende el mismo código de barras de recipiente.
[0014] En algunos modos de realización, los métodos además incluyen (e) la producción de un amplicón monocatenario de una pluralidad de, opcionalmente cada uno de, la pluralidad de polinucleótidos con código de barras doble y/o (f) la adición de un segundo adaptador a cada uno de los amplicones monocatenarios, añadiendo así el adaptador al polinucleótido monocatenario con código de barras doble, donde el primer adaptador y el segundo adaptador están presentes en extremos opuestos, o cerca de estos, de cada uno de los polinucleótidos monocatenarios con código de barras doble.
[0015] En algunos modos de realización, los métodos de producción de una biblioteca de polinucleótidos incluyen los pasos de: (a) la lisis de células dentro de cada uno de una pluralidad de recipientes, donde cada uno de dichos recipientes contiene una célula de una muestra que contiene una población de células, una pluralidad de oligonucleótidos con código de barras molecular, y uno o un acervo de oligonucleótidos con código de barras de recipiente y, opcionalmente, un primer adaptador o un acervo de primeros adaptadores; (b) la producción, en cada recipiente, de una pluralidad de polinucleótidos complementarios, incluyendo dicha producción de dicha pluralidad (i) la producción de uno o más polinucleótidos diana que es complementaria a uno o más polinucleótidos diana presentes en la célula; y (ii) la producción de un conjunto de polinucleótidos, cada uno de los cuales es individualmente complementario a un polinucleótido en la célula; (c) la fijación a cada polinucleótido complementario de uno de una pluralidad de oligonucleótidos con código de barras molecular, generando así una pluralidad de polinucleótidos con código de barras, conteniendo cada uno un código de barras molecular único; (d) la fijación de uno del uno o un acervo de oligonucleótidos con código de barras de recipiente, o un producto amplificado de este, y el primer adaptador o uno del acervo de primeros adaptadores, o un producto amplificado de estos, a cada uno de los polinucleótidos con código de barras, generando así una pluralidad de polinucleótidos con
código de barras doble, opcionalmente, polinucleótidos monocatenarios con código de barras doble, donde cada uno de los polinucleótidos con código de barras doble comprende un código de barras molecular y un código de barras de recipiente, y cada uno de los polinucleótidos con código de barras doble en el mismo recipiente comprende el mismo código de barras de recipiente; (e) la producción de un amplicón monocatenario de cada uno de la pluralidad de polinucleótidos con código de barras doble; y (f) la adición de un segundo adaptador a cada uno de los amplicones monocatenarios, añadiendo así el segundo adaptador a un polinucleótido monocatenario con código de barras doble, donde el primer adaptador y el segundo adaptador están presentes en extremos opuestos, o cerca de estos, de cada uno de los polinucleótidos monocatenarios con código de barras doble.
[0016] En algunos modos de realización, el adaptador, como el primer adaptador, contiene el oligonucleótido con código de barras de recipiente. En algunos modos de realización, el oligonucleótido con código de barras de recipiente contiene el primer adaptador. En algunos modos de realización, el conjunto de polinucleótidos monocatenarios de cada célula de la población de células, colectivamente, contiene secuencias complementarias a transcritos de un transcriptoma o de un transcriptoma parcial de una célula. En algunos modos de realización, el transcriptoma o el transcriptoma parcial contiene al menos el 60 %, 70 %, 75 %, 80 %, 85 % 90 % 95 %, 96 %, 97 %, 98 %, 99 % o el 100 % de los transcritos presentes en el genoma de la célula.
[0017] En algunos modos de realización, el uno o más polinucleótidos diana y/o el polinucleótido en la célula es un ADN. En algunos modos de realización, el uno o más polinucleótidos diana de (i) y/o el polinucleótido de (ii), a partir del que se deriva(n) el amplicón en (i) y/o el amplicón en (ii), es/son un ADN. En algunos modos de realización, el uno o más polinucleótidos diana y/o el polinucleótido en la célula es un ARN, como un ARNm. En algunos modos de realización, el uno o más polinucleótidos diana de (i) y/o el polinucleótido de (ii), a partir del que se deriva(n) el amplicón en (i) y/o el amplicón en (ii), es un ARN, como un ARNm.
[0018] En algunos modos de realización, cada uno o uno o más de los polinucleótidos complementarios de (b) es un ADNc. En algunos modos de realización, cada uno o uno o más de los polinucleótidos monocatenarios con código de barras es una cadena de ADNc.
[0019] En algunos modos de realización de los métodos, el primer adaptador y/o el segundo adaptador contienen al menos un sitio de cebado universal. En algunos modos de realización, el primer adaptador y el segundo adaptador son diferentes; y/o el primer adaptador contiene un primer sitio de cebado universal y el segundo adaptador contiene un segundo sitio de cebado universal, opcionalmente donde el primer sitio de cebado universal y el segundo sitio de cebado universal son diferentes. En algunos modos de realización, el primer sitio de cebado universal y/o el segundo sitio de cebado universal es o contiene un sitio de cebado P7 (C7) o una porción contigua a este o un sitio de cebado P5 o una porción contigua a este, opcionalmente donde la porción contigua a este es suficiente para alinearse a una secuencia complementaria. En algunos modos de realización, el primer sitio de cebado universal es o contiene el sitio de cebado P7 (C7) o una porción contigua a este y el segundo sitio de cebado universal es o contiene el sitio de cebado P5 (C5) o una porción contigua a este. En algunos modos de realización, el sitio de cebado P7 (C7) contiene la secuencia AGATCGGAAGAGCACACGTCTGAACTCCA (SEQ ID NO: 77), o es una porción contigua a esta. En algunos modos de realización, el sitio de cebado P5 contiene la secuencia AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCC GTATCATT (SEQ ID NO: 78), o es una porción contigua a esta. En algunos modos de realización, la porción contigua contiene al menos o al menos alrededor de 15, 20, 25 o 30 nucleótidos en longitud. En algunos modos de realización, el sitio de cebado P5 es una porción contigua establecida en SEQ ID NO: 25 (AGATCGGAAGAGCGTCGTGT).
[0020] En algunos modos de realización, la adición del segundo adaptador incluye la hibridación de un oligonucleótido de empalme a cada uno de los polinucleótidos monocatenarios con código de barras en presencia de un oligonucleótido, que incluye un segundo sitio de cebado universal, donde el oligonucleótido de empalme contiene (i) una secuencia complementaria al segundo sitio de cebado universal y (ii) una secuencia saliente redundante capaz de alinearse aleatoriamente al extremo 3' del polinucleótido monocatenario con código de barras. En algunos casos, antes de la hibridación, el oligonucleótido de empalme y el oligonucleótido que contiene el segundo sitio de cebado universal se alinean para formar un adaptador de empalme doble. En algunos aspectos, la secuencia saliente redundante contiene la secuencia (N)13-12, donde N es cualquier nucleótido.
[0021] En algunos de cualesquiera de estos modos de realización, la secuencia saliente redundante contiene la secuencia NNNNNN, donde N es cualquier nucleótido (SEQ ID NO: 24). En algunos modos de realización, el oligonucleótido de empalme contiene la secuencia ACACGACGCTCTTCCGATCTNNNNNN, donde N es cualquier aminoácido (SEQ ID NO: 26). En algunos de cualesquiera de estos modos de realización, el oligonucleótido que contiene el segundo sitio de cebado universal contiene la secuencia AGATCGGAAGAGCGTCGTGT (SEQ ID NO: 25).
[0022] En algunos de cualesquiera de estos modos de realización, el oligonucleótido con código de barras de recipiente contiene al menos o alrededor de al menos 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 o 50 nucleótidos. En algunos de cualesquiera de estos modos de realización, el oligonucleótido con código de barras de recipiente contiene de, o alrededor de, 10 a 30 nucleótidos. En algunos de cualesquiera de estos modos de realización, el oligonucleótido con código de barras de recipiente contiene una secuencia redundante. En algunos de cualesquiera de estos modos de realización, el
oligonucleótido con código de barras de recipiente contiene la secuencia (N)i4-17, donde N es cualquier nucleótido, opcionalmente donde al menos uno o dos N en la secuencia son W, donde W es adenina o timina. En algunos de cualesquiera de estos modos de realización, el oligonucleótido con código de barras de recipiente contiene la secuencia NNNNWNNNNWNNNN (SEQ ID NO: 80), WNNNNWNNNNWNNNN (SEQ ID NO: 81), NWNNNWNNNNWNNNN (SEQ ID NO: 82) o NNWNNNNWNNNNWNNNN (SEQ ID NO: 83), donde N es cualquier nucleótido y W es adenina o timina.
[0023] En algunos de cualesquiera de estos modos de realización, cada recipiente contiene un acervo de primeros adaptadores, donde cada oligonucleótido con código de barras de recipiente del acervo de primeros adaptadores contiene al menos un cambio de base o una adición de base en comparación con al menos uno de los otros oligonucleótidos con código de barras de recipiente en el acervo. En algunos de cualesquiera de estos modos de realización, los oligonucleótidos con código de barras de recipiente del acervo de primeros adaptadores contienen las secuencias NNNNWNNNNWNNNN (SEQ ID NO: 80), WNNNNWNNNNWNNNN (SEQ ID NO: 81), NWNNNWNNNNWNNNN (SEQ ID NO: 82) y NNWNNNNWNNNNWNNNN (SEQ ID NO: 83), donde N es cualquier nucleótido y W es adenina o timina.
[0024] En algunos de cualesquiera de estos modos de realización, en el paso (d), el método además incluye la amplificación de uno o del acervo de oligonucleótidos con código de barras de recipiente o de uno o del acervo de primeros adaptadores, donde los primeros adaptadores comprenden el uno o el acervo de oligonucleótidos con código de barras de recipiente, donde la amplificación se lleva a cabo antes de la fijación, o simultáneamente a esta, del oligonucleótido con código de barras de recipiente al polinucleótido con código de barras molecular. En algunos modos de realización, la fijación del oligonucleótido con código de barras de recipiente incluye la hibridación de una región del oligonucleótido con código de barras de recipiente a una región de cada uno de los polinucleótidos complementarios o a una región de cada uno de los polinucleótidos con código de barras molecular que contienen un código de barras molecular. En algunos casos, la región contiene un polinucleótido de marcaje 3' que es complementario a una región terminal 3' del código de barras molecular de los polinucleótidos con código de barras. En algunos modos de realización, la región contiene un polinucleótido de marcaje 3' que es complementario a una región terminal 5' del oligonucleótido con código de barras molecular.
[0025] En algunos de cualesquiera de estos modos de realización, en el paso (b), el uno o más polinucleótidos diana se producen mediante la transcripción inversa del/de los polinucleótido(s) diana en presencia de una transcriptasa inversa y uno o más cebadores específicos de diana complementarios a una secuencia diana del/de los polinucleótido(s) diana; y/o el conjunto de polinucleótidos se produce mediante la transcripción inversa de polinucleótidos, como transcritos de polinucleótido, en la célula en presencia de una transcriptasa inversa y uno o más cebadores de transcriptoma complementarios a un polinucleótido, como un transcrito de polinucleótido, en la célula.
[0026] En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen un polinucleótido de una molécula inmunitaria o de una cadena de esta; En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen al menos dos polinucleótidos diana, conteniendo cada uno un polinucleótido de una cadena de molécula inmunitaria.
[0027] En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen un polinucleótido de un TCR o de una cadena de este; En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen un primer polinucleótido de un receptor de las células T alfa (TCRa) y un segundo polinucleótido de un receptor de las células T (TCRp). En algunos modos de realización, el uno o más polinucleótidos diana contienen un primer polinucleótido de un receptor de las células T gamma (TCRy) y un segundo polinucleótido de un receptor de las células T delta (TCRdelta).
[0028] En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen un polinucleótido de un anticuerpo o de una cadena de este; En algunos modos de realización, el uno o más polinucleótidos diana contienen un primer polinucleótido de un polinucleótido de cadena pesada de inmunoglobulina (IgH) y un segundo polinucleótido de un polinucleótido de cadena ligera de inmunoglobulina (IgL). En algunos modos de realización, el uno o más cebadores específicos de diana y/o el uno o más cebadores de transcriptoma incluyen una polisecuencia (T).
[0029] En algunos de cualesquiera de estos modos de realización, el uno o más cebadores de transcriptoma contienen una mezcla de cebadores hexámeros aleatorios de oligonucleótido. En algunos modos de realización, el uno o más cebadores específicos de diana contienen uno o más cebadores complementarios a (una) secuencia(s) de la(s) secuencia(s) diana del polinucleótido diana. En algunos casos, el uno o más cebadores específicos de diana contienen al menos dos cebadores, p. ej., un primer cebador y un segundo cebador. En algunos modos de realización, el uno o más cebadores específicos de diana contienen cebadores para una secuencia diana de una pluralidad de polinucleótidos diana, codificando cada uno una molécula inmunitaria o una cadena de esta. En algunos aspectos, la molécula inmunitaria es un receptor de las células T o un anticuerpo.
[0030] En algunos de cualesquiera de estos modos de realización, al menos el primer cebador es complementario a una secuencia diana de un polinucleótido de una primera cadena de una molécula inmunitaria y un segundo cebador es complementario a una secuencia diana de un polinucleótido de una secuencia diana de la molécula inmunitaria. En
algunos modos de realización, los primeros y segundos cebadores son complementarios a una secuencia diana de diferentes polinucleótidos de cadena de TCR de un TCR.
[0031] En algunos de cualesquiera de estos modos de realización, el primer cebador es complementario a una secuencia diana de una secuencia polinucleotídica de TCRalfa y el segundo cebador es complementario a una secuencia diana de una secuencia polinucleotídica de TCRbeta; o el primer cebador es complementario a una secuencia diana de una secuencia polinucleotídica TCRbeta; o el primer cebador es complementario a una secuencia de una secuencia polinucleotídica de TCRgamma y el segundo cebador es complementario a una secuencia diana de una secuencia polinucleotídica de TCRdelta. En algunos aspectos, la secuencia diana de los polinucleótidos de cadena de TCR es una secuencia de la región constante.
[0032] En algunos de cualesquiera de estos modos de realización, el primer cebador es complementario a una secuencia diana de una secuencia polinucleotídica de la región constante de TCRalfa y el segundo cebador es complementario a una secuencia diana de una secuencia polinucleotídica de la región constante de TCRbeta; o el primer cebador es complementario a una secuencia diana de una secuencia polinucleotídica de la región constante de TCRgamma y el segundo cebador es complementario a una secuencia diana de una secuencia polinucleotídica de la región constante de TCRdelta. En algunos modos de realización, al menos el primer y segundo cebador son complementarios a una secuencia diana de diferentes polinucleótidos de cadena de anticuerpos de un anticuerpo. En algunos modos de realización, el primer cebador es complementario a una secuencia diana de una secuencia polinucleotídica de cadena pesada de inmunoglobulina (IgH) y el segundo cebador es complementario a una secuencia diana de una secuencia polinucleotídica de cadena ligera de inmunoglobulina (IgL). En algunos modos de realización, la secuencia diana de los polinucleótidos de cadena de anticuerpo es una secuencia de la región constante.
[0033] En algunos de cualesquiera de estos modos de realización, el primer cebador es complementario a una secuencia diana de una secuencia polinucleotídica de región constante de la cadena pesada (CH) y un segundo cebador es complementario a una secuencia diana de una secuencia polinucleotídica de región constante de la cadena ligera (CL). En algunos casos, la secuencia diana del polinucleótido de la CH es de IgM, IgD, IgA, IgE o IgG o combinaciones de estas; y/o la secuencia diana de la secuencia del polinucleótido de la CL es de Igkappa, Iglambda o combinaciones de estas.
[0034] En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen una secuencia de codificación de longitud completa. En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana y el conjunto de polinucleótidos se producen en el recipiente en el mismo volumen de reacción.
[0035] En algunos de cualesquiera de estos modos de realización del método, en el paso (b), la producción de la pluralidad de polinucleótidos complementarios contiene el uso de una transferasa terminal sin plantilla, donde se añaden tres o más nucleótidos sin plantilla, ribonucleótidos o análogos de estos al extremo 3' de cada polinucleótido complementario producido. En algunos casos, la transferasa terminal sin plantilla es una transcriptasa inversa o una polimerasa. En algunos aspectos, la transferasa terminal sin plantilla es una transcriptasa inversa, y donde la transcriptasa inversa se selecciona de entre la transcriptasa inversa Superscript II, la transcriptasa inversa Maxima, la transcriptasa inversa Protoscript II, la transcriptasa inversa del virus de la leucemia murina de Maloney (MMLV-RT), la transcriptasa inversa HighScriber, la transcriptasa inversa del virus de la mieloblastosis aviar (AMV), cualquier transcriptasa inversa, incluyendo cualquier transcriptasa inversa que incluya actividad de desoxinucleotidil transferasa terminal, y combinaciones de estas.
[0036] En algunos de cualesquiera de estos modos de realización del método, en el paso (c), la fijación incluye la hibridación de una región de una de la pluralidad de oligonucleótidos con código de barras molecular a los tres o más nucleótidos sin plantilla de cada uno de los polinucleótidos complementarios. En algunos modos de realización, la pluralidad de oligonucleótidos con código de barras molecular se proporciona como una pluralidad de oligonucleótidos de cambio de plantilla, incluyendo cada uno una porción 3' complementaria a los tres o más nucleótidos sin plantilla. En algunos casos, el oligonucleótido de cambio de plantilla además incluye una región terminal 5' que es complementaria a un polinucleótido marcado 3' del primer adaptador que incluye el código de barras de recipiente. En algunos casos, el oligonucleótido de cambio de plantilla además comprende una región terminal 5' que es complementaria a una porción del primer adaptador, donde el primer adaptador comprende el oligonucleótido con código de barras de recipiente.
[0037] En algunos de cualesquiera de estos modos de realización, la transcriptasa inversa presenta actividad de cambio de plantilla; al menos algunas cadenas de la pluralidad de polinucleótidos complementarios producidos contienen un saliente 3' que contiene tres o más nucleótidos sin plantilla; la pluralidad de oligonucleótidos con código de barras molecular se proporciona como una pluralidad de oligonucleótido con cambio de plantilla, conteniendo cada uno (1) una región terminal 5' que es complementaria a un oligonucleótido de mareaje 3' que comprende el primer adaptador y el oligonucleótidos con código de barras de recipiente, (2) el código de barras molecular y (3) una porción 3' complementaria a los tres o más nucleótidos sin plantilla del saliente 3'; y el oligonucleótido de cambio de plantilla sirve como plantilla para la transcriptasa inversa, de manera que el código de barras molecular se incorpora a cada polinucleótido complementario para producir los polinucleótidos con código de barras molecular.
[0038] En algunos de cualesquiera de estos modos de realización, la porción 3' complementaria a los tres o más nucleótidos sin plantilla incluye un nucleótido, ribonucleótido u análogo de estos. En algunos de cualesquiera de estos modos de realización, los tres o más nucleótidos sin plantilla incluyen tres o más nucleótidos C y la porción 3' complementaria a tres de más nucleótidos sin plantilla contienen uno o más nucleótidos G o un ribonucleótido o análogo de estos.
[0039] En algunos de cualesquiera de estos modos de realización, el oligonucleótido de cambio de plantilla además contiene un nucleótido 3' modificado que bloquea la extensión del oligonucleótido de cambio de plantilla mediante una transcriptasa inversa o una ADN polimerasa. En algunos casos, la modificación es una modificación desoxi, fosfato, amino o alquilo del nucleótido terminal 3'.
[0040] En algunos de cualesquiera de estos modos de realización del método, el paso (d) además incluye la extender cada uno de la pluralidad de polinucleótidos complementarios después de la fijación. En algunos modos de realización, el paso (d) además comprende extender cada uno de la pluralidad de los polinucleótidos con código de barras molecular después de la fijación para generar la pluralidad de polinucleótidos con código de barras doble.
[0041] En algunos de cualesquiera de estos modos de realización, el recipiente es un pocillo, una emulsión, una gotícula o una microcápsula.
[0042] En algunos de cualesquiera de estos modos de realización, el método incluye, antes del paso (e), la combinación de los contenidos de dos o más de la pluralidad de recipientes, generando así una mezcla homogénea que incluye los dos o más de la pluralidad de polinucleótidos monocatenarios con código de barras doble. En algunos aspectos, la combinación de los contenidos de la pluralidad de recipientes incluye la rotura de dos o más de la pluralidad de recipientes y la agrupación de polinucleótidos monocatenarios con código de barras doble a partir de dos o más recipientes rotos.
[0043] En algunos modos de realización, el método incluye, antes del paso (e), la selección o purificación de los polinucleótidos monocatenarios con código de barras doble que presentan un tamaño que es superior a o superior a alrededor de 50 pares de bases, superior a 100 pares de bases, o superior a 200 pares de bases. En algunos modos de realización, el método incluye, antes del paso (e), la selección o purificación de los polinucleótidos monocatenarios con código de barras doble que presentan un tamaño de o de alrededor de 50 pares de bases (pb) a 1500 pb, 50 pb a 1250 pb, 50 pb a 1000 pb, 50 pb a 750 pb, 50 pb a 500 pb, 100 pb a 1500 pb, 100 pb a 1250 pb, 100 pb a 1000 pb, 100 pb a 750 pb, 100 pb a 500 pb, 200 pb a 1500 pb, 200 pb a 1250 pb, 200 pb a 1000 pb, 200 pb a 750 pb o 250 pb a 500 pb.
[0044] En algunos de cualesquiera de estos modos de realización, los polinucleótidos monocatenarios con código de barras doble contienen por orden (5' a 3'): el primer adaptador, el código de barras de recipiente; el código de barras molecular y el segundo adaptador. En algunos de cualesquiera de estos modos de realización, el primer adaptador está posicionado en la región 5', o cerca de esta, del polinucleótido monocatenario con código de barras, opcionalmente el polinucleótido monocatenario con código de barras doble. En algunos de cualesquiera de estos modos de realización, el segundo adaptador está posicionado en la región 3', o cerca de esta, del polinucleótido monocatenario con código de barras, opcionalmente el polinucleótido monocatenario con código de barras doble.
[0045] En algunos de cualesquiera de estos modos de realización del método, uno o más de los pasos (a)-(f) se llevan a cabo en solución y/o no se llevan a cabo en presencia de un soporte sólido, opcionalmente donde el soporte es una perla. En algunos de cualesquiera de estos modos de realización, al menos los pasos (c) y (d) se llevan a cabo en solución y/o no se llevan a cabo en presencia de un soporte sólido, opcionalmente donde el soporte es una perla. En algunos modos de realización, cada uno o más de los pasos (a)-(e) se lleva a cabo en solución y/o no se lleva a cabo en presencia de un soporte sólido, opcionalmente donde el soporte es una perla.
[0046] En algunos de cualesquiera de estos modos de realización, la población de células contiene al menos, o alrededor de al menos, 1 * 103, 5 * 103, 1 * 104, 5 * 104, 1 * 105, 5 * 105, 1 * 106, o 5 * 106 células. En algunos modos de realización, la población de células es de una muestra biológica de un sujeto. En algunos ejemplos, la muestra biológica es, o contiene, una muestra de sangre entera, una muestra de capa leucocitaria, una muestra de células mononucleares de sangre periférica (PBMC, por sus siglas en inglés), una muestra de una célula T no fraccionada, una muestra de linfocito, una muestra de leucocito, un producto de aféresis o un producto de leucaféresis.
[0047] En algunos de cualesquiera de estos modos de realización, la población de células contiene células inmunitarias. En algunos modos de realización, las células inmunitarias contienen linfocitos o células que presentan antígenos. En algunos de cualesquiera de estos modos de realización, la célula inmunitaria es un linfocito o un subtipo de este, una célula B o un subtipo de esta, una célula T o un subtipo de esta, o una combinación de estas. En algunos ejemplos, la célula inmunitaria es una célula T que es una célula T CD4+ y/o CD8+.
[0048] En algunos de cualesquiera de estos modos de realización, la población de células está enriquecida en células T de memoria central, células T de memoria efectora, células T naive, células T madre de memoria central, células T efectoras y células T reguladoras, o las contiene. En algunos de cualesquiera de estos modos de realización, la población de células está enriquecida en células B de memoria, células B naive o células B plasmablásticas.
[0049] En algunos de cualesquiera de estos modos de realización, el sujeto es un sujeto humano. En algunos modos de realización, el sujeto padece un cáncer, una infección o una afección autoinmune. En algunos casos, la infección es una infección viral, fúngica o bacteriana.
[0050] En algunos de cualesquiera de estos modos de realización, el método además incluye la amplificación de la pluralidad de polinucleótidos monocatenarios con código de barras, generando así una pluralidad de plantillas de polinucleótido. En algunos de cualesquiera de estos modos de realización, la amplificación de la pluralidad de los polinucleótidos monocatenarios con código de barras se lleva a cabo en presencia de un primer conjunto de cebadores que incluye un primer cebador complementario a la primera secuencia de adaptador y un segundo cebador complementario a la segunda secuencia de adaptador. En algunos aspectos, el primer y/o segundo cebador es un cebador universal. En algunos casos, el primer y/o segundo cebador es complementario al sitio de cebado P7 (C7) o a una porción contigua a este o al segundo sitio de cebado P5 (C5) o a una porción contigua a este. En algunos casos, el primer cebador es complementario al sitio de cebado P7 (C7) o a una porción contigua a este y el segundo cebador es complementario al sitio de cebado P5 (C5) o a una porción contigua a este. En algunos modos de realización, el cebador que es complementario al sitio de cebado P7 (C7) o a una porción contigua de este presenta o contiene la secuencia CAAGCAGAAGACGGCATACGAGAT (SEQ ID NO: 39); y/o el cebador que es complementario al sitio de cebado P5 (C5) o a una porción de este contiene la secuencia ACACGACGCTCTTCCGATCT (SEQ ID NO: 27). En algunos de cualesquiera de estos modos de realización, el primer y/o segundo cebador además contienen un adaptador de secuenciación. En algunos modos de realización, el cebador que es complementario al sitio de cebado P7 (C7) o a una porción contigua de este además contiene la secuencia CAAGCAGAAGACGGCATACGAGAT[NNNNNN]GTGACTGGAGTTCAGACGTGTGCT CTTCCGATCT (SEQ ID NO: 28); y/o el cebador que es complementario al sitio de cebado P5 (C5) o a una porción de este contiene la secuencia AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCC(SEQ ID NO: 76).
[0051] En algunos modos de realización, el método además incluye la purificación de cada uno de la pluralidad de polinucleótidos monocatenarios con código de barras, opcionalmente polinucleótidos monocatenarios con código de barras doble.
[0052] Se proporciona una biblioteca de polinucleótidos que contiene una pluralidad de polinucleótidos con código de barras producidos mediante el método de cualquiera de los modos de realización descritos. También se proporciona una biblioteca de polinucleótidos que contiene una pluralidad de polinucleótidos con código de barras, donde la pluralidad de polinucleótidos con código de barras contiene (i) uno o más polinucleótidos diana que contienen un amplicón de uno o más polinucleótidos diana presentes en una célula de una población de células; y (ii) un conjunto de polinucleótidos que contienen cada uno el amplicón de un polinucleótido en la célula, donde cada polinucleótido con código de barras contiene un primer adaptador que incluye un primer sitio de cebado universal que es complementario a un primer cebador universal; un oligonucleótido con código de barras de recipiente que comprende un código de barras de recipiente, donde el código de barras de recipiente es el mismo para todos los polinucleótidos con código de barras de (i) y (ii) de la misma célula de la población de células; y una segunda secuencia de adaptador que contiene un segundo sitio de cebado universal que es complementario a un segundo cebador universal.
[0053] En algunos modos de realización, cada uno de la pluralidad de polinucleótidos con código de barras contiene un código de barras molecular que es único para cada polinucleótido o plantilla de polinucleótido. En algunos aspectos, el conjunto de plantillas de polinucleótido con código de barras para cada célula de la población de células, colectivamente, contiene cadenas de ADN complementario (ADNc) de un transcriptoma o de un transcriptoma parcial o un complemento de estos. En algunos modos de realización, el transcriptoma o el transcriptoma parcial, colectivamente, contiene al menos el 60 %, 70 %, 75 %, 80 %, 85 % 90 % 95 %, 96 %, 97 %, 98 %, 99 % o el 100 % de los transcritos presentes en el genoma de la célula.
[0054] En algunos de cualesquiera de estos modos de realización, cada uno de los polinucleótidos con código de barras presenta un tamaño que es superior a, o superior a alrededor de, 50 pares de bases, superior a 100 pares de bases, o superior a 200 pares de bases. En algunos modos de realización, cada uno de los polinucleótidos monocatenarios con código de barras presenta un tamaño de o de alrededor de 50 pares de bases (pb) a 1500 pb, 50 pb a 1250 pb, 50 pb a 1000 pb, 50 pb a 750 pb, 50 pb a 500 pb, 100 pb a 1500 pb, 100 pb a 1250 pb, 100 pb a 1000 pb, 100 pb a 750 pb, 100 pb a 500 pb, 200 pb a 1500 pb, 200 pb a 1250 pb, 200 pb a 1000 pb, 200 pb a 750 pb o 250 pb a 500 pb.
[0055] En algunos de cualesquiera de estos modos de realización, el primer adaptador contiene el código de barras de recipiente. En algunos modos de realización, los polinucleótidos con código de barras son monocatenarios. En algunos modos de realización, los polinucleótidos con código de barras son bicatenarios. En algunos modos de realización, el primer adaptador y el segundo adaptador son diferentes.
[0056] En algunos de cualesquiera de estos modos de realización, el primer sitio de cebado universal y/o el segundo sitio de cebado universal son, o contienen, un sitio de cebado P7 (C7) o una porción contigua a este, o un sitio de cebado P5 (C5) o una porción contigua a este, opcionalmente donde la porción contigua con esta es suficiente para alinearse a una secuencia complementaria. En algunos modos de realización, el primer sitio de cebado universal es, o contiene, el sitio de cebado P7 (C7) o una porción contigua a este, y el segundo sitio de cebado universal es, o contiene, el sitio de
cebado P5 (C5) o una porción contigua a este. En algunos aspectos, el sitio de cebado P7 (C7) contiene la secuencia AGATCGGAAGAGCACACGTCTGAACTCCA (SEQ ID NO: 77), o es una porción contigua a esta. En algunos ejemplos, el sitio de cebado P5 contiene la secuencia AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCA TT (SEQ ID NO: 78), o es una porción contigua a esta.
[0057] En algunos de cualesquiera de estos modos de realización, la porción contigua contiene al menos o al menos alrededor de 15, 20, 25 o 30 nucleótidos en longitud. En algunos modos de realización, el sitio de cebado P5 es una porción contigua detallada en SEQ ID NO: 25 (AGATCGGAAGAGCGTCGTGT).
[0058] En algunos de cualesquiera de estos modos de realización, el oligonucleótido con código de barras de recipiente contiene al menos o alrededor de al menos 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 o 50 nucleótidos. En algunos modos de realización, el oligonucleótido con código de barras de recipiente contiene de, o alrededor de, 10 a 30 nucleótidos.
[0059] En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen un polinucleótido de una molécula inmunitaria o de una cadena de esta; En algunos modos de realización, el uno o más polinucleótidos diana contienen al menos dos polinucleótidos diana, conteniendo cada uno un polinucleótido de una cadena de molécula inmunitaria.
[0060] En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen uno o más polinucleótidos de un TCR o de una cadena de este. En algunos modos de realización, el uno o más polinucleótidos diana contienen un primer polinucleótido de un receptor de las células T alfa (TCRa) y un segundo polinucleótido de un receptor de las células T (TCRP). En algunos modos de realización, el uno o más polinucleótidos diana contienen un primer polinucleótido de un receptor de las células T gamma (TCRy) y un segundo polinucleótido de un receptor de las células T delta (TCRdelta).
[0061] En algunos de cualesquiera de estos modos de realización, el uno o más polinucleótidos diana contienen un polinucleótido de un anticuerpo o una cadena de este; En algunos modos de realización, el uno o más polinucleótidos diana contienen un primer polinucleótido de un polinucleótido de cadena pesada de inmunoglobulina (IgH) y un segundo polinucleótido de un polinucleótido de cadena ligera de inmunoglobulina (IgL).
[0062] En algunos de cualesquiera de estos modos de realización, los polinucleótidos con código de barras contienen por orden (5' a 3'): el primer adaptador, el código de barras de recipiente; el código de barras molecular y el segundo adaptador. En algunos modos de realización, el primer adaptador está posicionado en la región 5', o cerca de esta, del polinucleótido monocatenario con código de barras doble. En algunos modos de realización, el segundo adaptador está posicionado en la región 3', o cerca de esta, del polinucleótido monocatenario con código de barras doble.
[0063] Se proporcionan métodos de secuenciación, incluyendo la secuenciación de uno o más de la pluralidad de polinucleótidos, como polinucleótidos con código de barras (p. ej., polinucleótidos con código de barras doble), producidos mediante cualquiera de los modos de realización descritos o a partir de cualquiera de los modos de realización de las bibliotecas de polinucleótidos descritos. En algunos ejemplos, se secuencia el transcriptoma de la pluralidad de polinucleótidos, como plantillas de polinucleótidos. En algunos casos, el método además incluye la amplificación del transcriptoma entero o una porción de este previa a la secuenciación. En algunos aspectos, la amplificación se lleva a cabo empleando un primer cebador y un segundo cebador específicos para la primera y segunda secuencias del adaptador, respectivamente.
[0064] En algunos modos de realización, se secuencian el uno o más polinucleótidos diana de la pluralidad de plantillas de polinucleótido. En algunos casos, el método además incluye la amplificación del uno o más polinucleótidos diana de la pluralidad de plantillas de polinucleótido previa a la secuenciación. En algunos ejemplos, se amplifica la(s) secuencia(s) de longitud completa del uno o más polinucleótidos diana.
[0065] En algunos modos de realización, la amplificación se lleva a cabo en presencia de un segundo conjunto de cebadores que contiene uno o más primeros cebadores complementarios a uno o más polinucleótidos diana y un segundo cebador complementario a la primera secuencia de adaptador. En algunos casos, el segundo cebador del segundo conjunto de cebadores es complementario al sitio de cebado P7 (C7) o a una porción contigua a este o al segundo sitio de cebado P5 (C5) o a una porción contigua a este. En algunos aspectos, el segundo cebador del segundo conjunto de cebadores es complementario al sitio de cebado P7 (C7) o a una porción contigua a este. En algunos modos de realización, el segundo cebador del segundo conjunto de cebadores presenta o contiene la secuencia CAAGCAGAAGACGGCATACGAGAT (SEQ ID NO: 39) o
C A AGC AGA AGACGGC AT AC GAGAT [NNNNNN] GT GAC T GGAGTT C AGAC GT GT GC T
CTTCCGATCT (SEQ ID NO:28).
[0066] En algunos modos de realización, el uno o más primeros cebadores complementarios al uno o más polinucleótidos diana son específicos de una secuencia diana de una molécula inmunitaria o una cadena de esta. En algunos casos, la molécula inmunitaria es un receptor de las células T o un anticuerpo. En algunos aspectos, el uno o más primeros cebadores son específicos para una secuencia diana de una región constante de la molécula inmunitaria.
[0067] En algunos modos de realización, la molécula inmunitaria es un TCR y el uno o más primeros cebadores incluyen AGTCTCTCAGCTGGTACACGG (SEQ ID NO: 37), ATGGCTCAAACACAGCGACCTC (SEQ ID NO: 38) o una combinación de estas. En algunos modos de realización, la molécula inmunitaria es un anticuerpo y el uno o más primeros cebadores incluyen cualquiera de SEQ ID NOS: 29-36 o una combinación de estas.
[0068] En algunos de cualesquiera de estos modos de realización, el método incluye la determinación del origen celular del uno o más polinucleótidos con código de barras, opcionalmente polinucleótidos con código de barras doble. En algunos casos, la determinación del origen celular incluye la identificación de información de secuencia, o secuencias de polinucleótidos con código de barras doble, que presentan el mismo código de barras de recipiente como si fueran de la misma célula.
[0069] En algunos de cualesquiera de estos modos de realización, el polinucleótido diana es una molécula inmunitaria que contiene una primera cadena de polinucleótido y una segunda cadena de polinucleótido y el método incluye aparear la primera cadena de polinucleótido y la segunda cadena de polinucleótido diana con la misma célula mediante la presencia del mismo código de barras de recipiente en los polinucleótidos con código de barras doble secuenciados. En algunos modos de realización, el método además incluye la cuantificación y determinación del número de polinucleótidos con el mismo código de barras, opcionalmente el mismo código de barras molecular y/ código de barras de recipiente.
[0070] En algunos de cualesquiera de estos modos de realización, la pluralidad de polinucleótidos con código de barras son polinucleótidos con código de barras doble que comprenden un código de barras molecular y un código de barras de recipiente, y el método además incluye la identificación de secuencias de transcriptoma y secuencias de polinucleótido diana que presentan el mismo código de barras de recipiente, identificando así información transcriptómica de la célula que porta el/los polinucleótido(s) diana.
[0071] Se proporcionan métodos para el análisis del transcriptoma que incluyen (a) la secuenciación de uno o más polinucleótidos diana a partir de la pluralidad de polinucleótidos con código de barras producidos mediante cualquiera de los métodos descritos o a partir de la pluralidad de polinucleótidos con código de barras de cualquiera de las bibliotecas de polinucleótidos descritas, donde los polinucleótidos con código de barras son polinucleótidos con código de barras doble que comprenden un código de barras molecular y un código de barras de recipiente, generando así información de secuencia para el polinucleótido diana a partir de la pluralidad de células; (b) la secuenciación del transcriptoma entero o de una porción de este a partir de la pluralidad de polinucleótidos con código de barras producidos mediante cualquiera de los métodos descritos o a partir de la pluralidad de polinucleótidos con código de barras de cualquiera de las bibliotecas de polinucleótidos descritas, donde los polinucleótidos con código de barras son polinucleótidos con código de barras doble que comprenden un código de barras molecular y un código de barras de recipiente, generando así datos de transcriptoma a partir de la pluralidad de células; y (c) la identificación de información de secuencia a partir de (a) y de (b) que presentan el mismo código de barras de recipiente como si fueran de la misma célula.
[0072] Se proporcionan métodos para el análisis de un transcriptoma de una célula única seleccionada, que incluyen (a) la amplificación y secuenciación de uno o más polinucleótidos diana a partir de una pluralidad de la pluralidad de polinucleótidos con código de barras producidos mediante cualquiera de los métodos descritos o a partir de la pluralidad de polinucleótidos con código de barras de cualquiera de las bibliotecas de polinucleótidos descritas, donde los polinucleótidos con código de barras son polinucleótidos con código de barras doble que comprenden un código de barras molecular y un código de barras de recipiente, generando así información de secuencia para cada uno de los polinucleótidos diana en al menos una de la pluralidad de células; (b) la identificación de/de los código(s) de barras de recipiente asociados a uno de los polinucleótidos diana secuenciados en (a), identificando así una célula única seleccionada que porta el polinucleótido diana; (c) la amplificación y secuenciación del transcriptoma o de una porción de este a partir de la pluralidad de polinucleótidos con código de barras de la célula que porta el código de barras de recipiente identificado en (b), generando así datos de transcriptoma a partir de la célula de expresión de polipéptido seleccionada. En algunos modos de realización, el transcriptoma o la porción de este se amplifica o secuencia a partir de la célula seleccionada empleando un cebador específico para el código de barras de recipiente identificado en (b) y un cebador específico para la segunda secuencia de adaptador de los polinucleótidos con código de barras.
[0073] En algunos modos de realización, el método incluye emparejar información de secuencia del transcriptoma o de una porción de este y de al menos uno de los polinucleótidos diana que proceden de la misma célula, donde la información de secuencia se determina a partir de la pluralidad de polinucleótidos con código de barras producidos mediante cualquiera de los métodos descritos o a partir de la pluralidad de polinucleótidos con código de barras de cualquiera de las bibliotecas de polinucleótidos descritas o se determina a partir de cualquiera de los métodos descritos, donde los polinucleótidos con código de barras que comprenden un código de barras molecular y un código de barras de recipiente,. En algunos casos, las secuencias que presentan el mismo código de barras de recipiente se aparean como si procedieran de la misma célula. En algunos modos de realización, los datos de transcriptoma incluyen un parámetro, característica,
rasgo o fenotipo asociado con una función o actividad de la célula. En algunos casos, los datos de transcriptoma se asocian a la actividad de activación, agotamiento o proliferación de la célula.
Breve descripción de las figuras
[0074]
La FIG. 1A describe un esquema de una fase de codificación con código de barras: un método de ejemplo descrito en la presente memoria. El boceto representa un método de amplificación y codificación con código de barras de dos o más polinucleótidos, como un polinucleótido diana y uno o más polinucleótidos genómicos o transcriptómicos, o secuencias emparejadas, como Ig variables emparejadas (p. ej., ARNm Vh y Vl) o secuencias de TCR (p. ej., ARNm Va/Vp y Vy/Vó), para la preparación de bibliotecas y secuenciación inmunológica. Código de barras de recipiente (VB); código de barras molecular (MB). (Arriba) Una sola gotícula (de una pluralidad de gotículas) de una emulsión, como un recipiente de ejemplo, que contiene una sola célula y otros componentes de reacción (p. ej., enzimas, tampones, oligonucleótidos). (En medio) Métodos ejemplares de lisis celular y transcripción inversa de ARN de células lisadas empleando cebadores de transcripción inversa específicos, aleatorios, y/o oligo-dT. (Abajo) Fase de cambio de plantilla y marcado con código de barras molecular (MB) de moléculas únicas durante la fase de transcripción inversa.
La FIG. 1B describe un esquema de una fase de amplificación de un método de ejemplo descrito en la presente memoria. El boceto representa un método de amplificación y codificación con código de barras de dos o más polinucleótidos, como un polinucleótido diana y uno o más polinucleótidos genómicos o transcriptómicos, o secuencias emparejadas, como Ig variables emparejadas (p. ej., ARNm Vh y Vl) y secuencias de TCR (p. ej., ARNm Va/Vp y Vy/Vó), para la preparación de bibliotecas y secuenciación inmunológica. (Arriba) La amplificación independiente de códigos de barras de recipiente (VB) genera una pluralidad de copias de VB idénticos en cada gotícula. Las moléculas de ADNc con código de barras molecular (MB) se marcan simultáneamente con los VB durante las fases de alineación y extensión de la amplificación. (En medio) Amplificación simultánea de moléculas de ADNc con código de barras doble durante el ciclo de amplificación. (Abajo) Moléculas de ADNc con código de barras doble de ejemplo preparadas para procesamiento adicional (p. ej., purificación, selección de tamaño, ligación de adaptador, amplificación y secuenciación).
La FIG. 2 describe la amplificación y secuenciación de transcritos con código de barras doble, en la presente memoria, se describen métodos de ejemplo. (Arriba) Amplificación y secuenciación de transcritos que codifican un gen diana de interés empleando un cebador específico para la secuencia de cebado universal del primer adaptador y de un cebador específico de diana, estando cada cebador ligado a un adaptador de secuenciación para secuenciación. (En medio) Amplificación y secuenciación de todos los transcritos en la biblioteca, p. ej., el transcriptoma, o porción de este, de una o más células, empleando cebadores específicos para la secuencia de cebado universal del primer adaptador y la secuencia de cebado universal del segundo adaptador. (Abajo) Amplificación y secuenciación del transcriptoma para una célula de interés seleccionada, como una célula que se ha determinado que contiene transcritos de ARNm de un gen diana de interés, empleando un cebador específico para el código de barras de recipiente (VB) determinado, común para polinucleótidos de la misma célula y un cebador específico para la secuencia de cebado universal del segundo adaptador.
La FIG. 3 describe gráficos t-SNE de datos del transcriptoma de célula única, coloreados por identidad de clúster inferida con la herramienta de software Seurat (A; las líneas discontinuas indican clústeres de eventos que muestran el mismo color de forma predominante) o coloreados por el tipo de inmunoreceptor de longitud completa, receptor de las células B (BCR) o receptor de las células T (TCR) (B; las líneas discontinuas indican clústeres de eventos que muestran el mismo color de forma predominante).
La FIG. 4 describe los gráficos t-SNE de datos de transcriptoma de célula única de la FIG. 3, coloreados para identificar células que expresan las secuencias identificadas: El receptor de tipo toll 7 (TLR7; A ), glicoproteína de la superficie de la célula T de la cadena CD3 épsilon (CD3E; B), proteína de gránulos de célula asesina natural 7 (NKG7; C), receptor de manosa de tipo C 1 (MRC1; D)
Descripción detallada
[0075] En la presente memoria, se proporcionan métodos y composiciones para el análisis de expresión génica en células únicas o en una pluralidad de células únicas. Los métodos proporcionados permiten la generación eficiente de una pluralidad de bibliotecas de secuenciación de polinucleótidos de célula única de alta calidad (p. ej., ADN), que contienen polinucleótidos del transcriptoma completo, o una porción de este, y una o más secuencias de polinucleótidos de longitud completa de un gen diana de interés, como un producto inmunoreceptor emparejado de longitud completa, p. ej., un TCR o un anticuerpo, por lo que pueden identificarse el/los polinucleótido(s) diana y los polinucleótidos del transcriptoma completo o parcial, procedentes de la misma célula. En algunos modos de realización, cada uno de la pluralidad de polinucleótidos en la biblioteca contienen secuencias de adaptador (p. ej., un primer adaptador y un segundo adaptador) que permiten la secuenciación de última generación del total de productos recuperados, a diferencia de los
genes específicos que deben decidirse al realizar el experimento. Por consiguiente, en algunos aspectos del método proporcionado, la amplificación por PCR se puede llevar a cabo mediante el uso de cebadores específicos para estas secuencias de adaptador y/o cebadores específicos de polinucleótidos diana de interés y/o cebadores específicos de células. En algunos modos de realización, los métodos proporcionados permiten el procesamiento de decenas o cientos de células en un solo experimento, obteniendo así datos de secuenciación de células únicas, p. ej., datos ARN-seq, como recuentos de ARNm, combinados con secuencias de molécula inmunitaria de longitud completa, p. ej., el anticuerpo o TCR de una manera eficiente y de alto rendimiento.
[0076] En algunos casos, la secuenciación directa de todo o parte del contenido genómico y de ARNm de un tejido se emplea cada vez más para permitir el análisis de regiones reguladoras/promotoras de empalme alternativo, y señales de poliadenilación sin tener que preseleccionar genes conocidos previamente (Cloonan et al., Nat Methods 5(7):613-9 (2008)). No obstante, los métodos actuales para el análisis del contenido de ARNm de las células mediante la secuenciación directa dependen del análisis a granel del ARNm obtenido a partir de muestras de tejido, que a menudo contienen millones de células. Esto significa que gran parte de la información funcional presente en células únicas se pierde o se difumina cuando la expresión génica se analiza en ARNm a granel. Además, la expresión génica durante procesos dinámicos, como el ciclo celular, es difícil de observar en medias poblacionales. Por lo tanto, en algunas aplicaciones, los enfoques de secuenciación directa basados en células individuales se prefieren a las muestras a granel.
[0077] En algunos ejemplos, conviene analizar el contenido genómico o de ARNm de una célula seleccionada, como una célula que expresa un gen o genes concretos de interés, como un gen diana. En algunos ejemplos, conviene obtener el contenido genómico o transcriptómico de una célula seleccionada mientras que también se obtiene la secuencia de longitud completa de un gen diana, como un inmunoreceptor. Las herramientas existentes para la secuenciación del transcriptoma de célula única incluyen micromatrices, métodos basados en 96 pocillos, como la clasificación tradicional en pocillos de FACS, e instrumentos microfluídicos, como el Fluidigm C1. Estas herramientas se pueden emplear para preparar bibliotecas de transcriptomas diana y enteros, pero su rendimiento es limitado, dado que se ven limitados en su número de células para analizar (p. ej., cientos de miles de células).
[0078] En algunos ejemplos, conviene analizar el contenido genómico o de ARNm de una célula seleccionada, como una célula que expresa un gen o genes concretos de interés, como un gen diana (p. ej., un inmunoreceptor). Se han descrito métodos de altísimo rendimiento empleando matrices de micropocillo o emulsiones para permitir la secuenciación del transcriptoma de célula única entero (véase p. ej., Klein et al., Cell (2015) 161(5): 1187-1201; Macosko et al., Cell (2015) 161(5): 1202-1214; el documento WO/2015/164212; el documento WO/2016/040476), pero la captura eficiente de secuencias diana de longitud completa, como secuencias de inmunoreceptor de longitud completa, no es posible con la tecnología existente. Estos métodos también se ven limitados a números más pequeños de células, a menudo de pocos miles, debido a las limitaciones impuestas por el enfoque basado en perlas, que requiere gotículas más grandes y mayores volúmenes de reacción por célula.
[0079] En algunos modos de realización de los métodos proporcionados, las secuencias diana, como las moléculas inmunitarias diana (p. ej., anticuerpo o TCR), y las secuencias genómicas o transcriptómicas de una pluralidad de células se producen en una reacción simultánea, y proporcionan un mecanismo para vincular la información de secuencia de secuencias derivadas de la misma célula. En algunos aspectos, los métodos divulgados actualmente, cuando se acoplan a tecnología de secuenciación de alto rendimiento, permiten el análisis de un vasto número de células individuales y el logro del análisis en un solo ensayo de reacción. En principio, uno puede secuenciar cualquier número de células y cualquier número de regiones diana por célula. En algunos aspectos, el número de células únicas que se puede procesar está limitado solo por restricciones prácticas, como la velocidad de la secuenciación de alto rendimiento. En algunos modos de realización, los métodos divulgados en la presente memoria son adaptables para uso con perlas. En otros modos de realización, los métodos divulgados en la presente memoria no incluyen un paso de secuenciación o amplificación basados en perlas.
[0080] En algunos aspectos, los métodos proporcionados resuelven, o reducen, los problemas de los métodos existentes al proporcionar un método de preparación de bibliotecas de ADNc que se pueden emplear para analizar la expresión génica en una pluralidad de células únicas. En algunos modos de realización, los métodos proporcionados dan lugar a la producción de una biblioteca de polinucleótidos, para la secuenciación de altísimo rendimiento, que permite la recuperación de secuencias diana de longitud completa listas para síntesis, incluyendo secuencias de dianas heterodiméricas o multiméricas emparejadas, mientras simultáneamente capturan información cuantitativa genómica o transcriptómica de las células identificadas como que expresan la(s) secuencia(s) diana.
[0081] En concreto, los métodos proporcionados son para preparar una biblioteca de polinucleótidos, p. ej., una biblioteca de ADNc, a partir de una pluralidad de células únicas. Los métodos se basan en la determinación de los niveles de expresión génica a partir de una población de células individuales, que se pueden emplear para identificar variaciones naturales en la expresión génica en una célula por nivel celular. Los métodos también se pueden emplear para identificar y caracterizar la composición celular de una población de células, incluso en ausencia de un marcador de superficie celular adecuado. Los métodos descritos en la presente memoria también proporcionan la ventaja de generar una biblioteca de ADNc representativa del contenido de ARN en una población de células empleando células únicas, mientras que las bibliotecas de ADNc preparadas mediante métodos clásicos suelen requerir el ARN total aislado de una gran población.
Por consiguiente, en algunos aspectos, una biblioteca de ADNc producida empleando los métodos proporcionados permite al menos la representación equivalente del contenido de ARN en la población de células al emplear una subpoblación de células individuales más pequeña, junto con ventajas adicionales, como se describe en la presente memoria.
[0082] Los modos de realización proporcionados se basan en métodos basados en emulsión para el secuenciado de células diana únicas, como la secuenciación de diana inmunitaria y análisis transcriptómico. En algún aspecto, las células de una muestra que contienen una población de células se encapsulan en recipientes unicelulares (p. ej., gotículas), como por ejemplo utilizando métodos microfluídicos basados en emulsión. A continuación, se llevan a cabo métodos para fijar códigos de barras específicos de recipiente (p. ej., gotícula) a polinucleótidos diana (p. ej., amplicones de transcritos ARNm del transcriptoma completo o parcial) y una pluralidad de polinucleótidos (p. ej., amplicones de transcritos ARNm del transcriptoma completo o parcial) dentro de gotículas de emulsión, permitiendo así el análisis genético y de expresión de alto rendimiento de células únicas contenidas dentro de las gotículas. En algunos aspectos, los códigos de barras de recipiente están presentes inicialmente como plantillas de ADN de molécula individual con una porción de secuencia central aleatoria flanqueada por sitios de cebado conocidos. Las plantillas pueden transcribirse de forma inversa para generar un amplicón y/o PCR amplificado para producir uno o más amplicones dentro de los recipientes, como gotículas, y pueden quedar fijados a ácidos nucleicos derivados de células mediante la superposición de secuencia. En algunos aspectos del método, un ácido nucleico derivado de célula se amplifica empleando un cebador de PCR específico del gen para amplificar un gen diana o genes diana de interés, p. ej., una molécula inmunitaria, como un anticuerpo o un receptor de las células T (TCR). En algunos casos, la capacidad de amplificar varios genes diana puede proporcionar información sobre diferentes rasgos de las células, como el fenotipo, la actividad u otros rasgos de las células.
[0083] En algunos casos, la adición de genes diana adicionales puede vincular la información sobre una molécula inmunitaria concreta, p. ej., TCR, a la información del fenotipo celular de la célula. En aspectos adicionales del método, los ácidos nucleicos derivados de células transcriptómicas se pueden amplificar empleando cebadores que permiten la secuenciación del transcriptoma completo o de una porción de este de las células que deben secuenciarse, y emparejar los transcritos procedentes de la misma célula. En algunos aspectos, los cebadores aleatorios de transcripción inversa se emplean para generar amplicones correspondientes a transcritos del transcriptoma. En determinados modos de realización, se puede añadir un sitio de cebado universal a los extremos de los polinucleótidos con código de barras, como mediante los primeros y segundos adaptadores añadidos, de manera que se puede amplificar la biblioteca completa a granel y secuenciarla por perdigonada de una manera de alto rendimiento.
[0084] En algunos modos de realización, la reacción para amplificar un ácido nucleico derivado de la célula se puede llevar a cabo en una reacción en un único recipiente que puede llevar a cabo a) lisis celular; b) transcripción inversa de ARNm diana; c) codificación con código de barras molecular de cada ADNc; d) amplificación por PCR de un código de barras específico del recipiente; y e) fijación de una copia del código de barras de recipiente a cada ADNc. En algunos modos de realización, los productos se pueden recuperar y secuenciar, como por ejemplo al emplear cualquiera de una variedad de plataformas de secuenciación. Por ejemplo, se puede utilizar una plataforma MiSeq de Illumina empleando 325 x 300 pb para secuenciar la longitud completa de cada producto. En algunos aspectos, los códigos de barras de gotícula permiten la identificación de todos los productos a partir de cada célula individual. En determinados aspectos, los códigos de barras moleculares permiten la cuantificación de la expresión para cada célula y, en algunos casos, la eliminación de errores de secuenciación y RT-PCR.
[0085] En los modos de realización proporcionados, el proceso de secuenciación del transcriptoma se puede llevar a cabo de forma separada a partir de la secuenciación dirigida de unos pocos transcritos elegidos, como un TCR, ya que la biblioteca amplificada puede procesarse por separado. Esto permite que el método se lleve a cabo una cantidad de veces en alícuotas separados de la misma biblioteca con código de barras amplificada. Se puede llevar a cabo una variedad de enfoques útiles a través de los métodos proporcionados debido a la capacidad de llevar a cabo diferentes experimentos en momentos diferentes en la misma biblioteca con código de barras amplificada. En un ejemplo, los métodos se pueden emplear para primero llevar a cabo la secuenciación dirigida de una molécula diana de interés, p. ej., TCR, en una muestra, que puede dar lugar a la identificación de unas cuantas células concretas de interés. En algunos aspectos, los oligonucleótidos de PCR o captura pueden estar diseñados entonces para dirigirse a los códigos de barras de recipiente que representan esas células de interés, permitiendo la captura y secuenciación de todos los transcritos con código de barras de solo esas células. En algunos aspectos, esto reduce en gran medida los costes de secuenciación de la secuenciación de la biblioteca entera.
[0086] En determinados aspectos, los métodos y composiciones descritos en la presente memoria son útiles para el análisis de células únicas, como, p. ej., para el estudio de genomas, transcriptomas, proteomas, vías metabólicas y similares de las muestras celulares complejas. Los análisis de múltiples células en poblaciones celulares heterogéneas son especialmente útiles en el estudio de muestras y mezclas complejas. Las muestras o mezclas celulares complejas incluyen, por ejemplo, muestras de células mononucleares de sangre periférica (PBMC), muestras metagenómicas, secciones de tejidos normales y cancerosos, colonias de células embrionarias y células madre. La secuenciación genómica y transcriptómica conviene para identificar tipos celulares divergentes o en células en etapas determinadas, como en etapas diferentes de activación, agotamiento o proliferación. Entre las aplicaciones concretas se encuentran la elaboración de perfiles moleculares de receptores de las células T y B, el haplotipo y la tipificación HLA.
[0087] «Muestras metagenómicas» se refiere a muestras que contienen genomas de procedencias, como especies, múltiples. Por ejemplo, el enfoque actual se puede aplicar a mezclas de especies bacterianas para permitir la secuenciación de ácidos nucleicos de múltiples bacterias en un ensayo, seguida de la correlación de las secuencias con la misma célula bacteriana. De manera similar, las secuencias de ácido nucleico de un tipo de célula entre las células de otro tipo de célula, como las células inmunitarias que se infiltran en un tumor. En tales casos, los ácidos nucleicos de una célula inmunitaria que se infiltra en un tumor se pueden correlacionar con la(s) secuencia(s) de longitud completa del inmunoreceptor o fragmento de unión de este empleando los métodos proporcionados en la presente memoria.
[0088] Algunos modos de realización de los métodos proporcionados también permiten el muestreo de un número más alto de células únicas. Se puede elaborar un mapa de células que muestre cómo se relacionan las células al emplear la similitud de los patrones de expresión. Este mapa se puede emplear para distinguir tipos de células in silico, en la detección de clústeres de células estrechamente relacionadas. Al muestrear no solo unas pocas, sino grandes números de células únicas, se puede emplear la similitud de patrones de expresión para elaborar un mapa de células y de cómo están relacionadas. Este método permite el acceso a datos de expresión sin diluir de cada tipo distinto de célula presente en una población, sin la necesidad de purificación previa de esos tipos de células. Además, cuando hay marcadores conocidos disponibles, estos se pueden emplear in silico para trazar células de interés.
[0089] Entre los modos de realización proporcionados se encuentra un método de preparación de una biblioteca de polinucleótidos, p. ej., una biblioteca de ADNc, a partir de una pluralidad de células únicas a través de la liberación de ARNm de cada célula única para proporcionar una pluralidad de muestras individuales, donde el ARNm en cada muestra de ARNm individual es de una célula individual, que sintetiza una primera cadena de ADNc (esto es, el amplicón) del ARNm en cada muestra de ARNm individual e incorpora un código de barras de nucleótido (p. ej., código de barras molecular y/o código de barras de recipiente) dentro del ADNc del amplicón para proporcionar una pluralidad de muestras de ADNc (esto es, donde el ADNc de cada muestra de ADNc con código de barras es complementaria a un ARNm de una célula única que agrupa las muestras de ADNc con código de barras y amplifica las muestras de ADNc agrupadas para generar una biblioteca de ADNc que comprende ADNc bicatenario con código de barras) con código de barras (p. ej., código de barras doble). En algunos modos de realización, el amplicón resultante es un ADNc monocatenario con código de barras doble, como un ADNc monocatenario con código de barras doble que corresponde a una o más plantillas de ARNm. En algunos modos de realización, el ADNc bicatenario con código de barras está desnaturalizado para generar ADNc monocatenario con código de barras para facilitar la adición de un adaptador, como un adaptador para facilitar la secuenciación. Al emplear el método anterior, es posible preparar muestras para secuenciación de varios cientos de células únicas en poco tiempo. Los métodos tradicionales para preparar una biblioteca de fragmentos de ARN para secuenciación incluyen pasos de escisión de gel que resultan laboriosos. En algunos aspectos de los métodos descritos en la presente, se prepara una pluralidad de células como una muestra única (tras las síntesis de ADNc) que hace posible preparar una pluralidad, como varios cientos de células para secuenciación. Además, la variación técnica se puede minimizar dado que cada conjunto de la pluralidad de células se preparar conjuntamente (en un solo tubo).
[0090] En algunos aspectos de la invención, cada muestra de ADNc obtenida de una célula única está etiquetada con un código de barras, que permite la expresión génica que ha de analizarse en el nivel de una célula única. Esto permite estudiar la expresión durante procesos dinámicos, como el ciclo celular y analizar distintos tipos de células en un tejido complejo (p. ej., el cerebro). En algunos aspectos, las muestras de ADNc se pueden agrupar antes del análisis. La agrupación de muestras significa la manipulación de las muestras de cada célula única y reduce el tiempo necesario para analizar la expresión génica en las células únicas, que permite el análisis de alto rendimiento de la expresión génica. La agrupación de muestras de ADNc previa a la amplificación también presenta la ventaja de la variación técnica entre muestras queda prácticamente eliminada. Además, dado que las muestras de ADNc se agrupan antes de la amplificación, se requiere menor amplificación para generar cantidades suficientes de ADNc para el análisis subsecuente comparado con la amplificación y tratamiento de las muestras de ADNc de cada célula única por separado. Esto reduce el sesgo de amplificación y también significa que cualquier sesgo será similar en todas las células empleadas para proporcionar muestras de ADNc agrupadas. Tampoco se requieren la purificación, el almacenamiento y la manipulación de ARN, que ayuda a eliminar problemas provocados por la naturaleza inestable del ARN.
[0091] Los pares de cadena de receptor de las células T y pares de cadena de inmunoglobulina de anticuerpo son dos tipos de inmunoreceptores contemplados para secuenciación mediante los métodos divulgados en la presente memoria. En algunos modos de realización, los métodos proporcionados permiten la generación de bibliotecas de polinucleótidos para secuenciación de alto rendimiento y análisis de expresión génica que incluye secuencias de una o más secuencias diana, como una o más secuencias diana de un inmunoreceptor, y secuencias que pueden combinarse para proporcionar información de secuenciación genómica y/o transcriptómica. En algunos modos de realización, se puede desarrollar una biblioteca de polinucleótidos que es un panel de biblioteca derivada humana para el descubrimiento del anticuerpo y/o TCR de pacientes y cohortes con atributos comunes específicos. En algunos modos de realización del método proporcionado, el material inicial puede ser cualquier fuente que contenga una población de células de interés que no contenga, o que no suela contener, el polinucleótido diana de interés, como la molécula inmunitaria o inmunoreceptor, p. ej., el anticuerpo o TCR. En algunos modos de realización, el material inicial puede ser sangre periférica o de una biopsia tisular, de la que se aíslan globalmente las células inmunitarias o se subclasifican en células naive, de memoria y/o secretoras de anticuerpos (ASC) si se desea. En algunos modos de realización, el método proporcionado se puede aplicar
a múltiples tipos diferentes de secuencias variables individuales o emparejadas, p. ej., pares de cadena de receptor de las células T y pares de cadena de inmunoglobulina de anticuerpo.
[0092] En algunos aspectos, las bibliotecas de ADNc producidas mediante los métodos proporcionados son adecuadas para el análisis de perfiles de expresión génica de células inmunoglobulina anticuerpo mediante la secuenciación directa, y no es posible emplear estas bibliotecas para estudiar la expresión de los genes, incluyendo la expresión de los genes, o de las células que los portan, asociada con un polinucleótido diana concreto de interés, como una molécula inmunitaria o inmunoreceptor, p. ej., el antígeno, anticuerpo o TCR. En algunos modos de realización, se pueden analizar los perfiles de expresión génica que no se conocen previamente. En algunos modos de realización, los métodos proporcionados se pueden emplear para caracterizar o comparar cada una de la pluralidad de células de una muestra según su estado transcripcional de la célula, p. ej., activado, agotado o proliferante, u otros parámetros o atributos deseados de las células. En algunos modos de realización, los métodos proporcionados se pueden emplear para facilitar el descubrimiento de candidatos terapéuticos, como TCRs, mediante la observación de la respuesta de células concretas que portan un TCR concreto específico de un antígeno de interés. En algunos modos de realización de los métodos proporcionados, es posible identificar las células que expresan un TCR que está asociado con una respuesta deseada, p. ej., la naturaleza o el grado de activación de las células T. En algunos modos de realización, los métodos proporcionados hacen posible la captura de un conjunto de datos más rico mediante el análisis del transcriptoma entero a diferencia de los métodos existentes que requieren conocimiento previo y/o la selección de un panel más pequeño de genes candidatos.
I. Biblioteca de polinucleótidos para diana y análisis transcriptóm ico
[0093] En algunos modos de realización, los métodos proporcionados en la presente se dirigen a la amplificación y secuenciación de una o más moléculas de polinucleótidos diana y la amplificación y secuenciación de un conjunto de polinucleótidos, como una o más moléculas diana y un conjunto de polinucleótidos de una célula única o de una población de células. En algunos modos de realización, los métodos y las composiciones descritas en la presente memoria son útiles para el análisis de células únicas, como, p. ej., para el estudio de genomas, transcriptomas, proteomas, vías metabólicas y similares de muestras celulares complejas. En otros aspectos, los métodos y las composiciones descritas en la presente memoria se pueden emplear para el descubrimiento de inmunoreceptores, p. ej., mediante el emparejamiento de inmunoglobulina ligera y pesada o de cadenas receptoras de las células T en células B y T únicas, así como para la tipificación HLA. En otros modos de realización, la información sobre el emparejamiento de anticuerpos y el análisis de células individuales se puede combinar para asociar la función celular o la información sobre el estado de la célula con la expresión de la secuencia identificada del inmunoreceptor. En otros aspectos adicionales, los métodos y las composiciones descritos en la presente memoria se pueden emplear para monitorizar el impacto de pequeñas moléculas y fármacos o inmunoterapias y su(s) efecto(s) en muestras complejas normales o cancerosas para diagnósticos o el descubrimiento de nuevos fármacos o regímenes de tratamiento. En otro aspecto más, los métodos y las composiciones se pueden emplear para la detección y el análisis de patógenos diana, como bacterias o virus en muestras biológicas.
[0094] En algunos modos de realización, los métodos proporcionados pueden incluir varios rasgos de los métodos tal como se describe en las publicaciones internacionales N.° WO20l2/048341, WO2014/144495, WO2016/044227, WO2016/176322, o WO2017/053902.
[0095] La presente invención emplea pasos en los que se manipulan los ácidos nucleicos a fin de generar bibliotecas de polinucleótidos para secuenciación. En algunos modos de realización, la presente invención emplea pasos en los que se manipulan los ácidos nucleicos a fin de producir moléculas de polinucleótidos diana, que incluyen secuencias que comprenden regiones variables de un inmunoreceptor, como un anticuerpo o un TCR producido por una célula inmunitaria. En algunos casos, la molécula de polinucleótido diana incluye anticuerpos monoclonales recombinantes. En algunos modos de realización, la presente invención emplea pasos en los que se manipulan los ácidos nucleicos a fin de producir polinucleótidos que representen el transcriptoma o el genoma de una o más células. En un sentido amplio, en algunos modos de realización de la invención, la amplificación del material genético de una célula, como de una célula inmunitaria y/o una célula T, p. ej., la transcripción inversa de la reacción en cadena de la polimerasa (transcripción inversa-PCR), se emplea para generar la amplificación de ADNc del material genético de la célula inmunitaria.
[0096] En algunos modos de realización, los métodos se pueden emplear para obtener la información de secuencia sobre un polinucleótido diana de interés dentro de una célula, como un TCR o un anticuerpo. Los genes diana se pueden obtener del ADN o ARNm genómico de una célula de una muestra o población de células. La muestra o población de células puede incluir células inmunitarias. Por ejemplo, para las moléculas de anticuerpo diana, los genes de inmunoglobulina se pueden obtener a partir de ADN o ARNm genómico de células inmunitarias o células T. El ARN puede ser de cadena pesada (segmentos V, D, J), o cadena ligera (segmentos V, J). En algunos modos de realización, el material inicial es ARN de células inmunitarias de segmentos génicos V, D, J que codifica para un anticuerpo, y contiene una región constante.
[0097] En algunos modos de realización, además de la obtención de los datos de secuencia de longitud completa de un polinucleótido diana de interés, p. ej., la molécula inmunitaria, como el anticuerpo o TCR, los métodos proporcionados también permiten la generación eficaz de bibliotecas de secuenciación de ADN de alta calidad tanto del producto del
transcriptoma entero y el/los polinucleótido(s) diana de longitud completa, incluyendo la diana de múltiples subunidades, p. ej., el anticuerpo o TCR, incluyendo el producto de inmunoreceptor emparejado de longitud completa.
[0098] En algunos modos de realización, estos métodos incluyen la adición (p. ej., ligadura) de la secuencia de ADN adaptador a los productos de polinucleótido monocatenario, que pueden permitir la amplificación y la secuenciación de última generación del transcriptoma de una célula individual o de una pluralidad de células individuales.
A. Bibliotecas de polinucleótidos
[0099] Una biblioteca producida de acuerdo con los métodos descritos en la presente memoria puede ser una biblioteca que comprende una secuencia diana larga o de longitud completa, como una secuencia de anticuerpo o de TCR, con códigos de barras adecuados, como códigos de barras de recipiente y códigos de barras moleculares. En algunos modos de realización, la biblioteca contiene una secuencia diana larga o de longitud completa, p. ej., la secuencia de anticuerpo o de TCR, y secuencias que corresponden a uno o más transcritos de un transcriptoma completo o parcial de la célula de la que proviene la secuencia diana, p. ej., el anticuerpo o el TCR, cada uno con un código de barras de recipiente y un código de barras molecular. En estos modos de realización, la secuencia diana larga o de longitud completa, p. ej., la secuencia de anticuerpo o de TCR, y la(s) secuencia(s) que corresponden a uno o más transcritos de un transcriptoma completo o parcial de la célula de la que proviene la secuencia diana, p. ej., el anticuerpo o el TCR, contiene el mismo código de barras de recipiente y contiene un código de barras molecular que es único para cada transcrito original del transcriptoma. En algunos aspectos, el código de barras se incluye en un primer adaptador que está fijado a cada polinucleótido diana y cada polinucleótido del conjunto de polinucleótidos representa transcritos del transcriptoma.
[0100] En algunos modos de realización, se proporcionan métodos para la producción de una biblioteca de polinucleótidos, donde se añade un adaptador (en adelante, también denominado un segundo adaptador) a cada uno de una pluralidad de polinucleótidos monocatenarios con código de barras previamente o en primer lugar marcados con un adaptador, de manera que los adaptadores se encuentran en extremos opuestos de los polinucleótidos, donde la pluralidad de polinucleótidos monocatenarios con código de barras incluye (i) uno o más polinucleótidos monocatenarios diana que son complementarios a uno o más polinucleótidos diana presentes en una célula de una población de células; y (ii) un conjunto de polinucleótidos monocatenarios que cada uno es complementario a un polinucleótido en la célula, donde cada uno de la pluralidad de polinucleótidos monocatenarios con código de barras contiene el código de barras de recipiente que es el mismo para todos los polinucleótidos complementarios de la misma célula en la población de células. El adaptador, como cada uno del primer y segundo adaptador, contiene una secuencia de cebado universal que se puede emplear para la amplificación o secuenciación de los polinucleótidos con código de barras doble marcados con el adaptador.
[0101] En algunos modos de realización, se puede secuenciar la biblioteca de polinucleótidos. En algunos modos de realización, una biblioteca producida de acuerdo con los métodos descritos en la presente memoria puede contener segmentos de clúster adecuados para secuenciación. En algunos modos de realización, se pueden generar numerosa copias de códigos de barras moleculares idénticos. En algunos modos de realización, se pueden generar muchas copias de polinucleótidos que contienen códigos de barras moleculares idénticos para cada molécula de polinucleótido diana única inicial. En algunos modos de realización, se pueden generar muchas copias de polinucleótidos que contienen códigos de barras moleculares idénticos para cada molécula de polinucleótido diana única inicial marcada con un código de barras de recipiente. Todas estas secuencias, o cualquiera de ellas, se pueden secuenciar y emparejar, por ejemplo, para determinar el transcriptoma completo o parcial de una célula que expresa la(s) secuencia(s) diana.
[0102] El material inicial puede ser ARN o ADN de una célula, como de células inmunitarias o células T. En algunos casos, la célula puede ser una que se sabe que contiene un polinucleótido diana deseado, o que se sospecha que lo contiene, como un inmunoreceptor, por ejemplo, un TCR o un anticuerpo. Por ejemplo, en el caso de un anticuerpo, una célula diana es una que comprende los segmentos génicos V, D, J que codifican para un anticuerpo, y contiene la región constante. En algunos modos de realización, el polinucleótido diana comprende segmentos de cadena pesada (segmentos V, D, J), o segmentos de cadena ligera (segmentos V, J).
[0103] El material polinucleotídico inicial, como el ARN, puede transcribirse de forma inversa a ADNc empleando uno o un acervo de polinucleótidos. Los ejemplos de cebadores en un acervo de polinucleótidos para transcribir de forma inversa un polinucleótido diana pueden comprender una porción complementaria a una región del polinucleótido diana y/o pueden comprender secuencias para transcripción inversa del transcriptoma entero o de una porción de este. En algunos casos, los polinucleótidos pueden comprender una porción complementaria a una región del ARN diana, como en una región constante de la diana o a una cola de poli-A del ARNm. En algunos casos, los oligonucleótidos múltiples, como los cebadores, se pueden emplear para alinear una o más secuencias diana, como regiones constantes. En algunos aspectos, el uno o más polinucleótidos incluyen la secuencia específica, polidT y/o cebadores hexámeros aleatorios.
[0104] Se puede emplear una transcriptasa inversa para llevar a cabo la reacción de la transcripción inversa. En modos de realización concretos, una transcriptasa inversa puede comprender una actividad de transferasa terminal sin plantilla. Cuando una transcriptasa inversa que comprende actividad de transferasa terminal sin plantilla alcanza el final de una plantilla, puede añadir tres o más residuos sin plantilla, como tres o más residuos de citosina sin plantilla. En algunos
modos de realización, la transcriptasa inversa Superscript II se emplea para este fin. En algunos modos de realización, la transcriptasa inversa Maxima™ se emplea para este fin. En algunos modos de realización, la transcriptasa inversa Protoscript II™ se emplea para este fin. En algunos modos de realización, la transcriptasa inversa del virus de la leucemia murina de Maloney (MMLV-RT) se emplea para este fin. En algunos modos de realización, la transcriptasa inversa HighScriber™ se emplea para este fin. En algunos modos de realización, se emplea una desoxinucleotidil transferasa terminal para este fin. En algunos modos de realización, la transcriptasa inversa del virus de la mieloblastosis aviar (AMV) se emplea para este fin. Se puede emplear cualquier transcriptasa inversa capaz de transcribir ARN que presente actividad de transferasa terminal sin plantilla. Se puede emplear cualquier polimerasa inversa capaz de transcribir ARN que presente actividad de transferasa terminal sin plantilla. Se puede emplear cualquier polimerasa inversa capaz de transcribir ADN que presente actividad de transferasa terminal sin plantilla. El ADNc resultante de la transcripción inversa se puede marcar con uno o más códigos de barras. En algunos ejemplos, el ADNc resultante de la transcripción inversa se puede marcar con un código de barras de recipiente y un código de barras molecular. Se pueden emplear varios nucleótidos de diseño concreto para la marcación con código de barras.
[0105] En algunos modos de realización, el cambio de plantilla se puede emplear para generar bibliotecas, como para la secuenciación de repertorio inmunológico y/o el análisis del transcriptoma. Por ejemplo, el cambio de plantilla se puede emplear durante la transcripción inversa para generar una región en el producto de la transcripción inversa que es complementaria a un polinucleótido que alberga un código de barras, como un polinucleótido con código de barras de recipiente o un polinucleótido con código de barras molecular. El cambio de plantilla se puede emplear durante la transcripción inversa para eliminar problemas de sesgo de la PCR. Estos métodos se pueden emplear para la secuenciación de anticuerpos, como a través del uso de una plataforma de secuenciación de alto rendimiento.
[0106] En algunos modos de realización, un código de barras de recipiente incluye una porción de secuencia aleatoria flanqueada por sitios de cebado conocidos. Por ejemplo, el ADNc se puede marcar con un código de barras de recipiente que puede incluir un tramo de ~20 nucleótidos redundantes con o sin una o más posiciones de base intercalantes conocidas, como NNNNWNNNNWNNNNWNNNNW (SEQ ID NO: 99; donde N es cualquier nucleótido y W es una base intercalante conocida que es A o T) o NNNNWISCNNNWISCNNN (SEQ ID NO: 100; donde N es cualquier nucleótido; W es una base intercalante que es A o T; I es una base intercalante conocida que es A, T, G o C (esto es, N); S es una base intercalante que es G o C; y C es una citosina intercalante conocida). Otras secuencias de ejemplo incluidas en oligonucleótidos con código de barras de recipiente incluyen NNNNWNNNNWNNNN (SEQ ID NO: 80), WNNNNWNNNNWNNNN (SEQ ID NO: 81), NWNNNWNNNNWNNNN (SEQ ID NO: 82) o NNWNNNNWNNNNWNNNN (SEQ ID NO: 83), donde N es cualquier nucleótido y W es adenina o timina. El código de barras de recipiente también puede incluir sitios de cebado que son capaces de ser reconocidos por un cebador directo e inverso para la amplificación de códigos de barras de recipiente en una mezcla de reacción previa a su fijación o marcado, como mediante alineación, a transcritos. Los cebadores con código de barras de recipiente se exponen en SEQ ID NO: 4 y SEQ ID NO: 5 o SEQ ID N0: 10 y SEQ ID N0: 11. En algunos casos, se proporciona un acervo de códigos de barras de recipiente que contienen los mismos sitios de cebado pero cambian de base en la porción redundante, como dos o más códigos de barras de recipiente establecidos en cualquiera de los SEQ ID NOS: 80, 81,83, 99 o 100, para que un recipiente de lugar a productos de polinucleótido marcados que cambian de base para aumentar la diversidad durante la secuenciación. En algunos modos de realización, un oligonucleótido que contiene un código de barras de recipiente es parte de un adaptador, como un primer adaptador, que contiene un sitio de cebador universal (p. ej., P7). Como se describe en la presente memoria, un primer adaptador puede incluir un sitio de cebado universal y un código de barras de recipiente. Los ejemplos de estos oligonucleótidos que contienen códigos de barras de recipiente, incluido un sitio de cebado universal, una porción redundante y cebadores, se exponen en SEQ ID NOS: 2, 6, 7, 8 o 9, o son un acervo de cualquiera de dos o más SEQ ID NOS: 6, 7, 8 o 9. En algunos casos, el código de barras de recipiente, o un acervo de códigos de barras de recipiente, puede emplearse para marcar las moléculas de ADNc procesadas en el mismo recipiente. En ejemplos concretos, las moléculas de ADNc procesadas en el mismo recipiente son complementarias a las moléculas de ARN de la misma célula.
[0107] En algunos modos de realización, un código de barras molecular incluye una secuencia redundante para marcar de forma unívoca transcritos de polinucleótido de la reacción de la transcripción inversa. En algunos aspectos, el código de barras molecular es parte de oligonucleótido de cambio de plantilla, donde el oligonucleótido de cambio de plantilla incluye secuencias de plantilla para la transcriptasa inversa, de manera que el código de barras molecular se incorpora a cada polinucleótido complementario. En algunos modos de realización, un oligonucleótido de cambio de plantilla puede contener (1) una región terminal 5' que es complementaria a un polinucleótido de mareaje 3' del primer adaptador que contiene el código de barras de recipiente, (2) el código de barras molecular y (3) una porción 3' complementaria al saliente 3'. En algunos modos de realización, una molécula de cambio de plantilla, como un oligonucleótido de cambio de plantilla que contiene un código de barras molecular (p. ej., un código de barras molecular) puede incorporar bases modificadas para minimizar la formación del objeto. En SEQ ID NO: 3 se exponen un oligonucleótido de cambio de plantilla de ejemplo, que contiene un código de barras molecular.
[0108] Las reacciones de transcripción inversa, como las descritas anteriormente, se pueden llevar a cabo en presencia de un polinucleótido de marcaje 3'. Un polinucleótido de marcaje 3' puede ser un polinucleótido empleado para añadir ácidos nucleicos a un extremo 3' de un polinucleótido seleccionado, como un ADNc diana, o a un polinucleótido (p. ej., ADNc) que es complementario a un transcrito del transcriptoma en una célula. Un polinucleótido de marcaje 3' puede ser un polinucleótido empleado como una plantilla para la adición de ácidos nucleicos a un extremo 3' de un polinucleótido
diana, como un ADNc. Un polinucleótido de mareaje 3' puede ser un polinucleótido que se híbrida a un extremo 3' de un polinucleótido diana, como un ADNc. Un polinucleótido de marcaje 3' puede ser un polinucleótido que contiene una región terminal 3' que se hibrida a un extremo 3' de un polinucleótido diana, como un ADNc. Por ejemplo, un polinucleótido de marcaje 3' puede comprender un segmento, como un segmento que se alinea a tres o más residuos sin plantilla. En algunos modos de realización, un polinucleótido de marcaje 3' es un polinucleótido con código de barras molecular. En algunos modos de realización, un polinucleótido de marcaje 3' puede comprender un código de barras molecular. En algunos modos de realización, un polinucleótido de marcaje 3' puede comprender residuos de riboguanosina o análogos de estos en el extremo 3' (rGrGrG) (bases de ARN) que son complementarios a una cadena, o están alineados con ella, producida por la enzima de transcripción inversa (p. ej., la secuencia CCC). En algunos modos de realización, se pueden emplear tres o más residuos de guanina en lugar de residuos de riboguanosina (nucleótidos de ADN en lugar de nucleótidos de ARN). En algunos modos de realización, un polinucleótido de marcaje 3' puede comprender 1 o 2 residuos de riboguanosina en el extremo 3' y un residuo de riboguanosina o un análogo de esta en el extremo 3' (rGrGrG) que son complementarios a una cadena, o están alineados con ella, producida por la enzima de transcripción inversa (p. ej., CCC).
[0109] Tras la alineación de un polinucleótido de marcaje 3' a una CCC de la cadena de ADNc, una transcriptasa inversa puede continuar extendiendo el ADNc en el polinucleótido de marcaje, fijando así un código de barras molecular o un complemento de este a una población diana de polinucleótidos, como ADNc, en la reacción. Por ejemplo, un polinucleótido de marcaje 3' puede ser un polinucleótido que contiene una región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender una región que no es complementaria al polinucleótido diana, como un ADNc. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender un código de barras de recipiente. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender una región complementaria a un polinucleótido con código de barras de recipiente o complemento de este. En otros experimentos, el cambio de plantilla se puede llevar a cabo en reacciones separadas. Por ejemplo, se puede añadir un polinucleótido de marcaje 3' tras la reacción de la transcripción inversa, y las enzimas como una transcriptasa o polimerasa inversa se pueden emplear para extenderse al polinucleótido de marcaje. Debido a que un polinucleótido de marcaje puede albergar un código de barras molecular único redundante en cada molécula en un recipiente, cada ADNc en un recipiente puede marcarse de forma unívoca con un código de barras molecular. En algunos modos de realización, el cambio de plantilla se puede realizar al mismo tiempo que se lleva a cabo la reacción de la transcripción inversa.
[0110] En algunos modos de realización, un polinucleótido de marcaje 3', como un polinucleótido con código de barras molecular puede además comprender una región terminal 5' que es complementaria al polinucleótido de marcaje 3' o complemento de este que contiene otro código de barras, como un código de barras de recipiente. En algunos modos de realización, un polinucleótido de diana que contiene un código de barras molecular o complemento de este, como una molécula de ADNc marcada, puede comprender una región 3', como una región terminal 3' que es complementaria al polinucleótido de marcaje 3' o complemento de este que contiene otro código de barras, como un código de barras de recipiente.
[0111] En algunos modos de realización, un polinucleótido de marcaje 3' es un polinucleótido con código de barras de recipiente. Tras la generación de un polinucleótido que contiene un código de barras molecular o un complemento de este de un polinucleótido diana, se puede añadir un código de barras de recipiente al polinucleótido diana con código de barras molecular. Un polinucleótido de marcaje 3' puede ser un polinucleótido empleado para la adición de ácidos nucleicos a un extremo 3' de un polinucleótido diana, como un polinucleótido diana con código de barras molecular. Un polinucleótido de marcaje 3' puede ser un polinucleótido empleado para la adición de ácidos nucleicos a un extremo 3' de un polinucleótido diana, como un polinucleótido diana con código de barras molecular. Un polinucleótido de marcaje 3' puede ser un polinucleótido que se hibrida a un extremo 3' de un polinucleótido diana, como un polinucleótido con código de barras molecular. Un polinucleótido de marcaje 3' puede ser un polinucleótido que contiene una región 3', como una región terminal 3', que se hibrida a un extremo 3' de un polinucleótido diana, como un polinucleótido diana con código de barras molecular. Un polinucleótido con código de barras de recipiente puede comprender una región 3', como una región terminal 3', que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular.
[0112] Tras la alineación de un polinucleótido de marcaje 3' a un polinucleótido diana con código de barras molecular, una transcriptasa inversa puede continuar extendiendo el ADNc en el polinucleótido de marcaje 3', como un polinucleótido con código de barras de recipiente, fijando así un código de barras de recipiente o un complemento de este a una población diana de polinucleótidos, como polinucleótidos diana con código de barras molecular, en la reacción. Por ejemplo, un polinucleótido de marcaje 3' puede ser un polinucleótido que contiene una región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender una región que no es complementaria al polinucleótido diana o al polinucleótido diana con código de barras molecular. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender un código de barras de recipiente.
[0113] En algunos modos de realización, un polinucleótido de marcaje 3' es un producto amplificado. En algunos modos de realización, un polinucleótido de marcaje 3' es un producto amplificado derivado de una molécula única. En algunos modos de realización, un polinucleótido de marcaje 3' es un producto amplificado de un polinucleótido con código de
barras de recipiente. En algunos modos de realización, un polinucleótido de mareaje 3' es un producto amplificado derivado de un polinucleótido con código de barras de recipiente único. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender una región complementaria a un cebador o complemento de este. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender una región complementaria a un cebador o complemento de este que se empleó para amplificar el polinucleótido con código de barras de recipiente.
[0114] En algunos modos de realización, el polinucleótido de marcaje 3' puede actuar como un cebador, como un cebador directo, para la amplificación del ADNc con código de barras molecular, y la ADN polimerasa puede extender la secuencia para generar una molécula de polinucleótido monocatenario con código de barras doble que es complementaria al ADNc y contiene el código de barras de recipiente, el código de barras molecular y la secuencia de codificación para el gen o transcrito diana. En algunos modos de realización, la molécula de polinucleótido monocatenario con código de barras doble contiene 5' a 3': un código de barras de recipiente, un código de barras molecular, una secuencia de codificación para el gen o transcrito diana, y un primer adaptador. En algunos modos de realización, el oligonucleótido que contiene el código de barras de recipiente contiene un segundo adaptador, y la molécula de polinucleótido monocatenario con código de barras doble contiene 5' a 3': un segundo adaptador, un código de barras de recipiente, un código de barras molecular, una secuencia de codificación para el gen o transcrito diana, y el primer adaptador.
[0115] El ADNc marcado resultante de la transcripción inversa se puede amplificar una o más veces, como mediante amplificación por PCR. Se pueden emplear varios cebadores de diseño concreto para la amplificación. Se puede amplificar un producto de una primera reacción de amplificación, como la PCR, empleando una segunda reacción de amplificación, como una primera o segunda fase de PCR. Se pueden emplear varios cebadores para el paso de amplificación. Se puede generar una biblioteca de polinucleótidos amplificados mediante los métodos descritos en la presente memoria. En algunos ejemplos, una biblioteca resultante puede comprender una secuencia de anticuerpo o TCR completa o parcial con códigos de barras moleculares y de recipiente adecuados. La biblioteca también puede contener secuencias correspondientes a uno o más transcritos de un transcriptoma completo o parcial con códigos de barras moleculares y de recipiente adecuados.
[0116] Luego, se puede amplificar un polinucleótido diana con código de barras doble, como un ADNc que contiene un código de barras molecular y un código de barras de recipiente, como mediante PCR. Después se puede llevar a cabo la PCR al emplear un conjunto de cebadores. Se puede amplificar una o más veces un producto de la reacción de PCR anteriormente mencionada, como mediante una o más rondas de PCR, o secuenciada directamente. En algunos modos de realización, el conjunto de cebadores puede implicar cebador(es) directo(s) o inverso(s) que es/son específico(s) para el/los primer(os) y segundo(s) adaptador(es). En algunos modos de realización, el conjunto de cebadores puede incluir el oligonucleótido que contiene el código de barras de recipiente como un cebador directo y un cebador inverso que es específico para el primer adaptador. En algunos modos de realización, el conjunto de cebadores puede incluir conjuntos de cebadores que incluyen cebadores directos e inversos que ligan los segundos y primeros adaptadores y el oligonucleótido que contiene el código de barras de recipiente como un cebador adicional, como un cebador directo adicional. Los cebadores de ejemplo se describen en los ejemplos de la presente memoria.
[0117] Tras la secuenciación, las secuencias con códigos de barras moleculares idénticos se pueden aparear o emparejar. Tras la secuenciación, las secuencias con códigos de barras de recipiente idénticos se pueden aparear o emparejar. Tras la secuenciación, las secuencias con secuencias diana idénticas se pueden aparear o emparejar. En algunos modos de realización, las lecturas de secuenciación se pueden agrupar en secuencias de consenso. Agrupar lecturas de secuenciación apareadas o emparejadas en una secuencia de consenso puede, así, reducir o eliminar los errores de secuenciación y PCR. La secuenciación se puede llevar a cabo empleando un primer sitio de cebado para una primera lectura. La secuenciación se puede llevar a cabo empleando el primer sitio de cebado para una segunda lectura. La secuenciación se puede llevar a cabo empleando un segundo sitio de cebado para una segunda lectura.
[0118] En algunos modos de realización, se pueden emparejar las cadenas de un inmunoreceptor, como las cadenas de un TCR o un anticuerpo, que contienen los mismos códigos de barras de recipiente. En algunos casos, se pueden emparejar las cadenas ligeras y pesadas del anticuerpo que contienen los mismos códigos de barras de recipiente. En algunos modos de realización, las cadenas emparejadas se pueden clonar en un sistema de vectores de mamíferos. El constructo del inmunoreceptor, como el anticuerpo, se puede expresar en otras líneas celulares huésped de humanos o mamíferos. El constructo se puede validar después mediante ensayos de transfección transitoria y análisis de Western blot del anticuerpo o TCR de interés expresados.
[0119] En aspectos determinados, la invención proporciona un método para elaborar una biblioteca de secuencias de anticuerpo de cadena ligera o pesada con código de barras único y secuencias de TCR de cadena alfa y beta y/o secuencias de TCR de cadena gamma y delta, incluyendo la obtención de una pluralidad de constructos de ácido nucleico donde cada constructo incluye un N-mer único y un N-mer funcional. El N-mer funcional puede ser un N-mer aleatorio, un cebador de PCR, un cebador universal, un anticuerpo, un extremo cohesivo o cualquier otra secuencia. El método puede incluir la elaboración de conjuntos M de un número N de compartimentos fluidos, conteniendo cada uno una o más copias de un constructo único. El método puede crear bibliotecas de código de barras de mayor complejidad mediante la adición de un constructo adicional a cada compartimento en un conjunto, y la repetición para cada conjunto produce
compartimentos M, conteniendo cada uno un par único de constructos. Estos pares se pueden hibridar o ligar para producir nuevos constructos. En cada constructo en una biblioteca de código de barras, cada N-mer único puede adaptarse para la identificación mediante la secuenciación, hibridación con sondas, otros métodos o una combinación de métodos.
[0120] Los métodos de amplificación del ARN o ADN son conocidos, y se pueden emplear de acuerdo con la presente invención sin necesidad de experimentación indebida sobre la base de las enseñanzas y orientaciones presentadas en la presente memoria. Entre los métodos conocidos de amplificación de ADN o ARN se incluyen, sin carácter limitativo, la reacción en cadena de la polimerasa (PCR, por sus siglas en inglés) y procesos de amplificación relacionados (véase, p. ej., las Pat. de EE. UU. N.° 4,683,195, 4,683,202, 4,800,159, 4,965,188, de Mullis, et al.; 4,795,699 y 4,921,794 de Tabor, et al; 5,142,033 de Innis; 5,122,464 de Wilson, et al.; 5,091,310 de Innis; 5,066,584 de Gyllensten, et al; 4,889,818 de Gelfand, et al.; 4,994,370 de Silver, et al.; 4,766,067 de Biswas; 4,656,134 de Ringold) y la amplificación mediada por ARN que emplea ARN antisentido para la secuencia diana como una plantilla para la síntesis de ADN bicatenario (la Pat. de EE. UU. N.° 5,130,238 de Malek, et al, con el nombre comercial NASBA), (véase, p. ej., Current Protocols in Molecular Biology (CPMB) (Fred M. Ausubel, et al. ed., John Wiley and Sons, Inc.); o J. Sambrook et al., Molecular Cloning: A Laboratory Manual, 1989, 2a Ed., Cold Spring Harbour Laboratory Press: New York, N.Y.).
[0121] Convenientemente, los pasos del método descritos en la presente memoria, como la amplificación, secuenciación y similares, pueden llevarse o no llevarse a cabo en un formato de ensayo multiplex que emplea una fase sólida donde una pluralidad de sustratos, p. ej., antígenos y similares se inmovilizan, como una matriz. En algunos modos de realización, la matriz es un biochip de proteína. Se pueden cribar cientos e incluso miles de antígenos mediante biochips de proteína. Tal como se emplea en la presente memoria, «matriz», «micromatriz» o «biochip» se refieren a un sustrato sólido que presenta una superficie planar, por lo general, a la que se fija un adsorbente. A menudo, la superficie del biochip comprende una pluralidad de ubicaciones localizables mediante dirección, cada una de las cuales presenta el adsorbente ligado ahí. Los biochips se pueden adaptar para acoplar una interfaz de sonda y, por lo tanto, funcionan como sondas. Un «biochip de proteína» se refiere a un biochip adaptado para la captura de polipéptidos. Se han descrito muchos biochips de proteína en la técnica. Se describen métodos de producción de matrices de polipéptido, p. ej., en De Wildt et al, 2000, Nat. Biotechnol. 18:989-994; Lueking et al., 1999, Anal. Biochem. 270: 103-1 11; Ge, 2000, Nucleic Acids Res.
28, e3, 1-VH; MacBeath y Schreiber, 2000, Science 289: 1760-1763; los documentos WO 01/40803 y WO 99/51773A1. El uso de matrices permite que un número de pasos, como de cribado, se lleven a cabo de manera robótica y/o de una manera de alto rendimiento. Los polipéptidos para el matriz se pueden observar a alta velocidad, p. ej., empleando un aparato robótico disponible comercialmente, p. ej., de MicroSystems o BioRobotics. El sustrato de la matriz puede ser, por ejemplo, nitrocelulosa, plástico, vidrio, p. ej., vidrio con superficie modificada. La matriz también puede incluir una matriz porosa, p. ej., acrilamida, agarosa, u otro polímero.
[0122] Tras la captura en un biochip, se pueden detectar analitos mediante una variedad de métodos seleccionados de entre, por ejemplo, un método de espectrometría iónica en fase gaseosa, un método óptico, un método electroquímico, una microscopia de fuerza atómica y un método de radiofrecuencia. El uso de espectrometría de masas es de especial interés, y en concreto, el de SELDI (por sus siglas en inglés). Los métodos ópticos incluyen, por ejemplo, la detección de la fluorescencia, luminiscencia, quimioluminiscencia, absorbancia, reflectancia, transmitancia, birrefringencia o del índice de refracción (p. ej., resonancia de plasmones superficiales, elipsometría, un método de espejo resonante, un método de guía de onda con acoplador de rejilla o interferometría). Entre los métodos ópticos se incluyen microscopía (tanto confocal como no confocal), métodos de imagen y métodos sin imagen. Los inmunoanálisis en distintos formatos (p. ej., ELISA) son métodos populares para la detección de analitos capturados en una fase sólida. Entre los métodos electroquímicos se incluyen métodos de vatimetría y amperometría. Entre los métodos de radiofrecuencia se incluye espectroscopia de resonancia multipolar.
[0123] En algunos modos de realización de la invención, se emplean las técnicas que se han establecido para el trabajo con células individuales o la selección de poblaciones de células concretas. Una técnica de ejemplo incorpora un accesorio especial que se puede emplear en FACS (por sus siglas en inglés) para desviar células individuales hacia contenedores separados. Estos accesorios están disponibles comercialmente y se conocen en la técnica. Estos accesorios son útiles para la dispensación de células únicas en compartimentos seleccionados de, por ejemplo, placas estándar de microvaloración de cultivos de 96 pocillos. Por otra parte, las células se pueden depositar en una placa de microvaloración en una dilución limitante para asegurar la deposición de células individuales.
[0124] Una segunda técnica es la PCR realizada en células inmunitarias únicas para amplificar los segmentos Vh y Vl o Va y Vp o Vy y V6 además de la amplificación opcional del transcriptoma de las células inmunitarias únicas. En algunos modos de realización, la PCR de célula única se emplea para conservar el emparejamiento nativo de Vl y Vh o Va y Vp o Vy y Y6 en la célula individual. La especificidad de un anticuerpo, o de un TCR, se determina mediante las regiones determinantes de la complementariedad (CDR, por sus siglas en inglés) dentro de la región Vl y la región Vh, o las regiones Va y Vp o Vy y V6, respectivamente.
[0125] Los métodos para llevar a cabo la PCR de célula única son conocidos (p. ej., Larrick, J.W. et al., Bio/Technology 7:934 (1989)). Por ejemplo, las células B productoras de anticuerpo de la biblioteca de células B o de las células T productoras de TCR de la biblioteca de células T se pueden fijar con una solución fijadora o una solución que contiene un producto químico como formaldehído, glutaraldehído o similares. Después, las células se permeabilizan con una solución
de permeabilización que comprende, por ejemplo, un detergente. El proceso de fijación y permeabilización debería proporcionar porosidad suficiente para permitir la entrada de enzimas, nucleótidos y otros reactivos en las células sin la destrucción indebida de compartimentos celulares o de los ácidos nucleicos que contienen. La adición de enzimas y nucleótidos puede, entonces, entrar en las células para transcribir de forma inversa el ARNm celular, incluyendo ARNm Vh y Vl o Va y Vp o Vy y Vó, por ejemplo, en las secuencias de ADNc correspondientes. En otros ejemplos, la PCR de célula única se puede llevar a cabo en la solución de células lisadas y no fijas, como se describe en la presente memoria.
[0126] La transcripción inversa se puede llevar a cabo en un solo paso u opcionalmente junto con un procedimiento de PCR, empleando una transcriptasa inversa, cantidades suficientes de los cuatro dNTP, y cebadores que ligan el ARNm que proporciona un grupo 3' hidroxilo para que la transcriptasa inversa inicie la polimerización. Los cebadores específicos de diana y los cebadores de oligonucleótido hexámero aleatorio se pueden emplear para iniciar la reacción de transcripción inversa y generar bibliotecas de secuenciación de alta calidad.
[0127] Se puede emplear cualquier cebador complementario al ARNm diana para las secuencias diana, pero se prefiere emplear cebadores complementarios al extremo terminal 3' de las moléculas Vh y Vl o Va y Vp o Vy y Vó para facilitar la selección de la región variable de ARNm. Numerosos estudios han indicado que se pueden preparar polinucleótidos redundantes para que actúen como cebadores del extremo 5' para V h y Vl o Va y Vp o Vy y Vó. El método de biblioteca combinatoria de elaboración de moléculas de selección se basa en estos cebadores. Además, numerosos experimentos han mostrado que la PCR puede amplificar los segmentos génicos de interés, como Vh y Vl o Va y Vp o Vy y Vó, de una célula única. Debido a la habilidad de trabajar incluso con una célula única, este enfoque de PCR puede generar anticuerpos, incluso donde las células inmunitarias de interés se producen a baja frecuencia.
[0128] En algunos modos de realización, tras la clasificación de FACS, las células de la biblioteca de células inmunitarias se agrupan y la transcripción inversa-PCR se realiza sobre el acervo completo de células. La generación de ARNm para la clonación de anticuerpos o TCR se realiza fácilmente mediante procedimientos conocidos para la preparación y caracterización de anticuerpos o TCR (véase, p. ej., Antibodies: A Laboratory Manual, 1988; incorporado a la presente memoria por referencia). Por ejemplo, el ARN total de la biblioteca de células B se extrae mediante los métodos adecuados, que son habituales y convencionales en la técnica. Luego se sintetiza el ADNc a partir del ARN mediante los métodos adecuados, p. ej., empleando polinucleótidos hexámeros aleatorios, o cebadores específicos del gen C o de la familia del gen C, o cebadores específicos del gen V o de la familia del gen V. De nuevo, estos procesos son conocidos para los expertos en la técnica como se ha explicado anteriormente. Las bibliotecas de moléculas de ácido nucleico derivadas de las bibliotecas de células B o de células T, p. ej., una biblioteca de moléculas de ARN o ADNc derivadas de estos linfocitos B o T, se pueden clonar en vectores de expresión para formar bibliotecas de expresión. En algunos modos de realización, se amplifica solo el dominio Vh o Va o Vy, derivado de la biblioteca de células inmunitarias, para generar una biblioteca de dominios Vh o Va o Vy. Se emplea una biblioteca de Vl o Vp o Vó de otra fuente en conjunto con la biblioteca de Vh o Va o Vy para generar anticuerpos o TCR empleando los métodos descritos en la presente memoria. Las bibliotecas de anticuerpos o fragmentos de t Cr se pueden crear mediante la combinación de las bibliotecas V h y Vl o Va y Vp o Vy y Vó de cualquier modo conocido por el experto en la técnica. Por ejemplo, cada biblioteca puede crearse en diferentes vectores, y los vectores recombinarse in vitro o in vivo. Por otra parte, las bibliotecas pueden clonarse secuencialmente en el mismo vector, o ensamblarse juntas por PCR y clonarse después. El ensamblaje por PCR también se puede emplear para unir ADN Vh y Vl o Va y Vp o Vy y Vó con a Dn que codifica un espaciador peptídico flexible para formar bibliotecas de cadena única Fv (scFv) como se describe en otra parte de la presente memoria. En otra técnica más, el ensamblaje por PCR en célula se emplea para combinar genes Vh y Vl o Va y Vp o Vy y Vó en linfocitos por PCR y luego clonar repertorios de genes vinculados.
1. Polinucleótidos diana
[0129] En los modos de realización, los métodos proporcionados en la presente memoria se dirigen a la amplificación y secuenciación de una molécula de polinucleótido diana, como una molécula de polinucleótido de una célula. En algunos casos, los métodos proporcionados en la presente se dirigen a la amplificación y secuenciación de dos o más regiones de una molécula de polinucleótido diana. En algunos casos, los métodos proporcionados en la presente memoria se dirigen a la amplificación y secuenciación de dos o más moléculas de polinucleótido diana, como dos o más moléculas emparejadas de forma natural. En un aspecto, los polinucleótidos diana son ARN. En un aspecto, los polinucleótidos diana son ácidos nucleicos genómicos. El ADN derivado del material genético en los cromosomas de un organismo concreto puede ser ADN genómico.
[0130] En algunos modos de realización, la referencia a una «molécula de ácido nucleico diana», un «polinucleótido diana», una «molécula de polinucleótido diana» se refiere a cualquier ácido nucleico de interés.
[0131] En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden regiones variables de un inmunoreceptor, como un anticuerpo o TCR producido por una célula inmunitaria.
[0132] En algunos modos de realización, los polinucleótidos diana incluyen dos o más cadenas de un inmunoreceptor que se emparejan de forma natural para generar un inmunoreceptor o un fragmento de unión de este. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena pesada
de un anticuerpo producido por una célula inmunitaria. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena ligera de un anticuerpo producido por una célula inmunitaria. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena pesada y secuencias que comprenden una cadena ligera variable de un anticuerpo producido por la misma célula inmunitaria.
[0133] El término «anticuerpo» en la presente memoria se emplea en el sentido más amplio e incluye anticuerpos policlonales y monoclonales, incluidos anticuerpos intactos y fragmentos de anticuerpos funcionales (de unión al antígeno), incluidos los fragmentos de unión a antígeno (Fab), los fragmentos F(ab')2, los fragmentos Fab', los fragmentos Fv, los fragmentos de IgG recombinante (rIgG), los fragmentos de anticuerpos de cadena única, incluidos los fragmentos variables de cadena única (scFv), y los anticuerpos de dominio único (p. ej., sdAb, sdFv, nanocuerpo). El término engloba formas de inmunoglobulinas modificadas genéticamente u de otra manera, como intracuerpos, pepticuerpos, anticuerpos quiméricos, anticuerpos completamente humanos, anticuerpos humanizados y anticuerpos heteroconjugados, anticuerpos multiespecíficos, p. ej., biespecíficos, anticuerpos, diacuerpos, triacuerpos y tetracuerpos, di-scFv en tándem, tri-scFv en tándem. A menos que se indique lo contrario, debería entenderse que el término «anticuerpo» abarca fragmentos de anticuerpo funcional de este. El término también abarca los anticuerpos intactos o de longitud completa, incluidos los anticuerpos de cualquier clase o subclase, incluidas las IgG y sus subclases, IgM, IgE, IgA e IgD.
[0134] Los términos «región determinante de la complementariedad» y «CDR», sinónimos de «región hipervariable» o «HVR» se conocen en la técnica para referirse a secuencias de aminoácidos no contiguas dentro de las regiones de anticuerpos variables que confieren especificidad y/o afinidad de unión al antígeno. En general, hay tres CDR en cada región variable de la cadena pesada (CDR-H1, CDR-H2 y CDR-H3) y tres CDR en cada región variable de la cadena ligera (CDR-L1, CDR-L2 y CDR-L3). Las «regiones marco» y «FR» se conocen en la técnica para referirse a porciones sin CDR de las regiones variables de las cadenas ligeras y pesadas. En general, hay cuatro FR en cada región variable de la cadena pesada de longitud completa (FR-H1, FR-H2, FR-H3 y FR-H4) y cuatro FR en cada región variable de la cadena ligera de longitud completa (f R-L1, Fr -L2, FR-L3 y FR-L4).
[0135] Los límites precisos de la secuencia aminoacídica de una CDR o FR dada pueden determinarse fácilmente empleando cualquiera de los esquemas conocidos, incluidos los descritos por Kabat et al. (1991), «Sequences of Proteins of Immunological Interest», 5th Ed. Public Health Service, National Institutes of Health, Bethesda, MD (esquema de numeración «Kabat»), Al-Lazikani et al., (1997) JMB 273,927-948 (esquema de numeración «Chothia»), MacCallum et al., J. Mol. Biol. 262:732-745 (1996), «Antibody-antigen interactions: Contact analysis and binding site topography», J. Mol. Biol. 262, 732-745. » (esquema de numeración «Contact»), Lefranc MP et al., «IMGT unique numbering for immunoglobulin and T cell receptor variable domains and Ig superfamily V-like domains», Dev Comp Immunol, 2003 Jan;27(1):55-77 (esquema de numeración «IMGT»), y Honegger A y Plückthun A, «Yet another numbering scheme for immunoglobulin variable domains: an automatic modeling and analysis tool», J Mol Biol, 2001 Jun 8;309(3):657-70, (esquema de numeración «Aho»).
[0136] Por consiguiente, a no ser que se especifique lo contrario, debería entenderse que una «CDR» o «región determinante de la complementariedad», o CDR individuales especificadas (p. ej., «CDR-H1, CDR-H2), de un anticuerpo dado o una región de este, como una región variable de este, engloba una región determinante de la complementariedad (o la específica), tal como definen los esquemas anteriormente mencionados. Por ejemplo, cuando se indica que una CDR concreta (p. ej., una CDR-H3) contiene la secuencia aminoacídica de una CDR correspondiente en una secuencia aminoacídica Vh o Vl dada, se entiende que una CDR presenta una secuencia de la CDR correspondiente (p. ej., CDR-H3) en la región variable, tal como define cualquiera de los esquemas anteriormente mencionados. En algunos modos de realización, se especifican secuencias de CDR concretas.
[0137] Asimismo, a no ser que se especifique lo contrario, debería entenderse que una FR o FR individual(es) especificada(s) (p. ej., FR-H1, FR-H2) de un anticuerpo dado o una región de este, como una región variable de este, engloban una región marco (o la específica), tal como define cualquiera de los esquemas conocidos. En algunos ejemplos, el esquema para la identificación de una determinada CDR, FR o FR o CDR, como la CDR definida por el método Kabat, Chothia o Contact. En otros casos, se da la secuencia aminoacídica concreta de una CDR o FR.
[0138] El término «región variable» o «dominio variable» se refiere al dominio de una cadena ligera o pesada de anticuerpo que está relacionada con la unión del anticuerpo al antígeno. En general, los dominios variables de la cadena pesada y la cadena ligera (Vh y Vl, respectivamente) de un anticuerpo nativo presentan estructuras similares, con cada dominio comprendiendo cuatro regiones marco (FR) y tres CDR conservadas. (Véase, p. ej., Kindt et al. Kuby Immunology, 6th ed., W.H. Freeman and Co., p. 91 (2007). Un solo dominio Vh o Vl puede ser suficiente para conferir especificidad de unión al antígeno. Además, los anticuerpos que unen un antígeno concreto pueden aislarse por medio de un dominio V h o Vl de un anticuerpo que une el antígeno para cribar una biblioteca de dominios Vl o Vh complementarios, respectivamente. Véase, p. ej., Portolano et al., J. Immunol. 150:880-887 (1993); Clarkson et al., Nature 352:624-628 (1991).
[0139] Entre los anticuerpos proporcionados se encuentran fragmentos de anticuerpo. Un «fragmento de anticuerpo» se refiere a una molécula distinta de un anticuerpo intacto que comprende una porción de un anticuerpo intacto que se
une al antígeno al que se une el anticuerpo intacto. Entre los ejemplos de fragmentos de anticuerpo se incluyen, sin carácter limitativo, Fv, Fab, Fab', Fab'-SH, F(ab')2; diacuerpos, anticuerpos lineales; moléculas de anticuerpos monocatenarios (p. ej., scFv); y anticuerpos multiespecíficos formados por fragmentos de anticuerpo. En modos de realización concretos, los anticuerpos son fragmentos de anticuerpo monocatenario que comprenden una región variable de la cadena pesada y/o una región variable de la cadena ligera, como scFv.
[0140] Las inmunoglobulinas (Ig) expresadas por las células B son, en algunos aspectos, proteínas que consisten en cuatro cadenas polipeptídicas, dos cadenas pesadas (IgH) y dos cadenas ligeras (IgL), que forman una estructura H2L2. Cada par de cadenas de IgH e IgL contiene un dominio hipervariable que consiste en una región VL y una VH y un dominio constante. Las cadenas de IgH de Ig son de varios tipos, p, 6, y, a, y p. La diversidad de Ig en un individuo viene determinada principalmente por el dominio hipervariable. Parecido al TCR, el dominio V de las cadenas de IgH se crea mediante la unión combinatoria de segmentos génicos VH, DH y JH. La adición o deleción independiente de nucleótidos en las uniones de VH-DH, DH-JH y VH-JH durante el proceso de reordenamiento del gen de Ig además aumenta la diversidad de la secuencia del dominio hipervariable. Aquí, la inmunocompetencia se refleja en la diversidad de Ig.
[0141] El término «región variable» o «dominio variable» se refiere al dominio de una cadena ligera o pesada de anticuerpo que está relacionada con la unión del anticuerpo al antígeno. En general, los dominios variables de la cadena pesada y la cadena ligera (Vh y Vl, respectivamente) de un anticuerpo nativo presentan estructuras similares, con cada dominio comprendiendo cuatro regiones marco (FR) y tres CDR conservadas. (Véase, p. ej., Kindt et al. KubyImmunology, 6th ed., W.H. Freeman and Co., p. 91 (2007). Un solo dominio Vh o Vl puede ser suficiente para conferir especificidad de unión al antígeno. Además, los anticuerpos que unen un antígeno concreto pueden aislarse por medio de un dominio V h o Vl de un anticuerpo que une el antígeno para examinar una biblioteca de dominios V l o Vh complementarios, respectivamente. Véase, p. ej., Portolano et al., J. Immunol. 150:880-887 (1993); Clarkson et al., Nature 352:624-628 (1991).
[0142] La «región hipervariable» se refiere a los residuos de aminoácidos de un anticuerpo o TCR que son responsables de la unión al antígeno. La región hipervariable comprende residuos de aminoácido de una región determinante de la complementariedad o CDR. Los residuos marco o FR son aquellos residuos del dominio variable distintos de los residuos de la región hipervariable, tal como se define en la presente memoria.
[0143] Entre los anticuerpos proporcionados se encuentran fragmentos de anticuerpo. Un «fragmento de anticuerpo» se refiere a una molécula distinta de un anticuerpo intacto que comprende una porción de un anticuerpo intacto que se une al antígeno al que se une el anticuerpo intacto. Entre los ejemplos de fragmentos de anticuerpo se incluyen, sin carácter limitativo, Fv, Fab, Fab', Fab'-SH, F(ab')2; diacuerpos, anticuerpos lineales; moléculas de anticuerpos monocatenarios (p. ej., scFv); y anticuerpos multiespecíficos formados por fragmentos de anticuerpos. En modos de realización concretos, los anticuerpos son fragmentos de anticuerpos monocatenarios que comprenden una región variable de la cadena pesada y/o una región variable de la cadena ligera, como scFv.
[0144] Los anticuerpos de dominio único son fragmentos de anticuerpos que comprenden todo el dominio variable de la cadena pesada, o una porción de este, o todo el dominio variable de una cadena ligera, o una porción de este, de un anticuerpo. En ciertos modos de realización, un anticuerpo de dominio único es un anticuerpo de dominio único humano.
[0145] Los fragmentos de anticuerpo se pueden elaborar mediante diversas técnicas, incluidas, sin carácter limitativo, la digestión proteolítica de un anticuerpo intacto, así como la producción por células huésped recombinantes. En algunos modos de realización, los anticuerpos son fragmentos producidos de forma recombinante, como fragmentos que comprenden disposiciones que no tienen lugar de forma natural, como aquellas con dos o más regiones de anticuerpos o cadenas unidas por enlazadores sintéticos, p. ej., enlazadores peptídicos, y/o que no se producen mediante la digestión enzimática de un anticuerpo intacto que se produce de forma natural. En algunos aspectos, los fragmentos de anticuerpos son scFv.
[0146] Los polipéptidos de unión a antígenos también incluyen dímeros de cadena pesada como, por ejemplo, anticuerpos de camélidos y tiburones. Los anticuerpos de camélidos y tiburones comprenden un par homodimérico de dos cadenas de dominios tipo V y tipo C (ninguna presenta una cadena ligera). Dado que la región de VH de un dímero de cadena pesada de IgG en un camélido no tiene que interactuar de forma hidrofóbica con una cadena ligera, la región en la cadena pesada que normalmente entra en contacto con una cadena ligera se cambia por residuos de aminoácidos hidrofílicos en un camélido. Los dominios VH de IgG de dímero de cadena pesada se denominan dominios VHH. Los Ig-NAR de tiburón comprenden un homodímero de un dominio variable (denominado dominio V-NAR) y cinco dominios constantes similares a C (dominios C-NAR). En los camélidos, la diversidad del repertorio de anticuerpos está determinada por las CDR 1, 2 y 3 de las regiones VH o VHH. La CDR3 de la región VHH del camello se caracteriza por su longitud relativamente larga, con un promedio de 16 aminoácidos (Muyldermans et al., 1994, Protein Engineering 7(9): 1129).
[0147] Un anticuerpo «humanizado» es un anticuerpo donde todos o esencialmente todos los residuos de aminoácidos de CDR se derivan de CDR no humanas y todos o esencialmente todos los residuos de aminoácido de FR se derivan de FR humanas. Un anticuerpo humanizado puede incluir opcionalmente al menos una porción de una región constante de anticuerpo derivada de un anticuerpo humano. Una «forma humanizada» de un anticuerpo no humano se refiere a una
variante del anticuerpo no humano que se ha humanizado, normalmente para reducir la inmunogenicidad para los humanos, mientras se mantiene la especificidad y afinidad del anticuerpo no humano parental. En algunos modos de realización, los residuos de FR en un anticuerpo humanizado se sustituyen con los residuos correspondientes de un anticuerpo no humano (p. ej., el anticuerpo del que derivan los residuos de CDR), p. ej., para restaurar o mejorar la especificidad o afinidad de anticuerpo.
[0148] Entre los anticuerpos proporcionados se encuentran anticuerpos humanos. Un «anticuerpo humano» es un anticuerpo con una secuencia aminoacídica que corresponde a la de un anticuerpo producido por un humano o una célula humana, o una fuente no humana que emplea repertorios de anticuerpos humanos u otras secuencias codificantes de anticuerpos humanos, incluidas las bibliotecas de anticuerpos humanos. El término excluye formas humanizadas de anticuerpos no humanos que comprenden regiones de unión al antígeno no humano, como aquellas donde todas o esencialmente todas las CDR son no humanas.
[0149] Los anticuerpos humanos pueden prepararse mediante la administración de un inmunógeno a un animal transgénico que ha sido modificado para producir anticuerpos humanos intactos o anticuerpos intactos con regiones humanas variables en respuesta al reto antigénico. Estos animales normalmente contienen todo o una porción de los loci de la inmunoglobulina humana que sustituyen a los loci de la inmunoglobulina endógena, o que están presentes de manera extracromosómica o integrados de manera aleatoria en los cromosomas del animal. Por lo general, en estos animales transgénicos, los loci de inmunoglobulina endógena se han inactivado. Los anticuerpos humanos también pueden derivar de bibliotecas de anticuerpos humanos, incluidas las bibliotecas de despliegue en fagos y libres de células, que contienen secuencias codificantes de anticuerpos derivadas de un repertorio humano.
[0150] Entre los anticuerpos proporcionados hay anticuerpos monoclonales, incluidos fragmentos de anticuerpos monoclonales. El término «anticuerpo monoclonal», tal como se emplea en la presente memoria, se refiere a un anticuerpo obtenido a partir de o dentro de una población de anticuerpos esencialmente homogéneos, esto es, los anticuerpos individuales que comprenden la población son idénticos, salvo por las posibles variantes que contienen mutaciones que tienen lugar de forma natural o que surgen durante la producción de una preparación de anticuerpos monoclonales, estando estas variantes presentes en cantidades menores. A diferencia de las preparaciones de anticuerpos policlonales, que normalmente incluyen diferentes anticuerpos dirigidos contra diferentes epítopos, cada anticuerpo monoclonal de una preparación de anticuerpos monoclonales se dirige contra un solo epítopo de un antígeno. El término no debe interpretarse como que requiere la producción del anticuerpo mediante cualquier método concreto. Se puede elaborar un anticuerpo monoclonal mediante diversas técnicas, incluidas, sin carácter limitativo, la generación a partir de un hibridoma, métodos de ADN recombinante, despliegue en fagos y otros métodos de despliegue de anticuerpos.
[0151] En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena alfa de un TCR producido por una célula inmunitaria. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena beta de un TCR producido por una célula inmunitaria. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena alfa de un TCR y secuencias que comprenden una región variable de una cadena beta de un TCR producido por la misma célula inmunitaria. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena gamma de un TCR producido por una célula inmunitaria. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena delta de un TCR producido por una célula inmunitaria. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena gamma de un TCR y secuencias que comprenden una región variable de una cadena delta de un TCR producido por la misma célula inmunitaria.
[0152] En algunos modos de realización, un TCR engloba TCR completos, así como porciones de unión al antígeno o fragmentos de unión al antígeno (también denominados fragmentos de unión MHC-péptido) de estos. En algunos modos de realización, el TCR es un TCR intacto o de longitud completa. En algunos modos de realización, el TCR es una porción de unión al antígeno que es menor que un TCR de longitud completa pero que se une a un péptido antigénico específico unido a (esto es, en el contexto de) una molécula MHC, esto es, un complejo MHC-péptido. En algunos casos, la porción o el fragmento de unión al antígeno de un TCR puede contener solo una porción de los dominios estructurales de una longitud completa o TCR intacto, pero aun así es capaz de unirse al epítopo (p. ej., el complejo MHC-péptido) al que se une el TCR completo. En algunos casos, una porción o un fragmento de unión al antígeno de un TCR contiene dominios variables de un TCR, como una cadena a variable y una cadena p variable de un TCR, suficiente para formar un sitio de unión para unirse a un complejo específico MHC-péptido, como, en general, cuando cada cadena contiene tres regiones determinantes de la complementariedad. Se incluyen los polipéptidos o las proteínas que presentan un dominio de unión que es un dominio de unión al antígeno o que es homólogo a un dominio de unión al antígeno. Estos términos también contemplan los anticuerpos y TCR injertados en la región determinante de la complementariedad (CDR) y otros anticuerpos y TCR humanizados (incluidas las modificaciones de la CDR y las modificación de la región marco). Cabe apreciar que mientras que se puede hacer referencia tan solo a las cadenas de inmunoglobulina (p. ej., cadenas pesadas y cadenas ligeras), la invención divulgada puede aplicarse a otros múltiples tipos diferentes de secuencias emparejadas, p. ej., pares de cadena de receptor de las células T (cadenas de TCRa y de TCRp y cadenas de TCRy y de TCR8), y no se limita a las inmunoglobulinas.
[0153] La habilidad de las células T de reconocer antígenos asociados a varios cánceres u organismos infecciosos viene conferida por su TCR, que se compone tanto de una cadena alfa (a) y una cadena beta (p) o una cadena gamma (Y) y una cadena delta (6). Las proteínas que componen estas cadenas están codificadas por el ADN, que emplea un mecanismo único para generar la enorme diversidad del TCR. Este receptor de reconocimiento inmunitario de múltiples subunidades se asocia con el complejo CD3 y une los péptidos presentados por las proteínas de MHC de clase I y II en la superficie de las células que presentan antígenos (APC). La unión de un TCR al péptido antigénico en la APC es un acontecimiento central en la activación de células T, que tiene lugar en una sinapsis inmunológica en el punto de contacto entre la célula T y la APC.
[0154] Cada TCR comprende regiones determinantes de la complementariedad (CDR) variables, así como regiones marco (FR). La secuencia aminoacídica de los bucles de la tercera región determinante de la complementariedad (CDR3) de los dominios variables de la cadena a y p determina en gran medida la diversidad de secuencia de las células T ap que surgen de la recombinación entre los segmentos génicos variables (Vp), de diversidad (Dp) y de unión (Jp) en el locus de la cadena p, y entre los segmentos génicos análogos Va y Ja en el locus de la cadena a , respectivamente. La existencia de múltiples de estos segmentos génicos en los loci de la cadena de TCR a y p permite codificar un gran número de secuencias CDR3 distintas. La adición o deleción independiente de nucleótidos en las uniones de Vp-Dp, Dp-Jp y Va-Ja durante el proceso de reordenamiento del gen de TCR además aumenta la diversidad de la secuencia de c Dr 3. En este sentido, la inmunocompetencia se refleja en la diversidad de los TCR.
[0155] También se proporcionan fragmentos de TCR, incluidos fragmentos de unión al antígeno. En algunos modos de realización, el TCR es una porción de unión al antígeno de este, como una variante o un TCR de longitud completa que no contiene la(s) región(es) transmembrana y/o citoplásmica(s) del mismo, que puede denominarse como un TCR soluble completo. En algunos modos de realización, el TCR es un TCR dimérico (dTCR). En algunos modos de realización, el TCR es un TCR monocatenario (scTCR), como un scTRC que presenta una estructura como se describe en las publicaciones de patente PCT n.° WO 03/020763, WO 04/033685, o WO 2011/044186. En determinados modos de realización, el TCR es un fragmento de TCR monocatenario que comprende una región variable de cadena alfa unida a una región variable de cadena beta, como un scTv. En algunos modos de realización, un scTv también se denomina scFv.
[0156] En algunos aspectos, un Fv monocatenario o scFv se refiere a fragmentos de anticuerpo o TCR que comprenden Los dominios de la cadena pesada variable (VH) y la cadena ligera variable (VL) de un anticuerpo o los dominios de la cadena alfa o gamma (Va o Vy) y la cadena variable beta o delta (Vp o V8) de un TCR, donde estos dominios están presentes en una cadena polipeptídica individual. En general, el polipéptido Fv además comprende un enlazador polipeptídico entre los dominios VH y VL o los dominios Va y Vp o los dominios Vy y V6 que permite que el scFv forme la estructura deseada para la unión al antígeno.
[0157] En algunos aspectos, un diacuerpo se refiere en algunos aspectos a pequeños fragmentos de anticuerpo y/o TCR con dos sitios de unión al antígeno, cuyos fragmentos comprenden un VH conectado a un VL en la misma cadena polipeptídica (VH-VL) o un Va conectado a un Vp en la misma cadena polipeptídica (Va-Vp) o un Vy conectado a un V6 en la misma cadena polipeptídica (Yy-V6). Al emplear un enlazador que sea demasiado corto como para permitir el emparejamiento entre los dos dominios en la misma cadena, los dominios quedan forzados a emparejarse con los dominios complementarios de otra cadena y crean dos sitios de unión al antígeno. Por ejemplo, en los documentos EP404097 y WO93111161 se describen diacuerpos de ejemplo más detalladamente.
[0158] Un anticuerpo biespecífico o un TCR biespecífico se refiere en algunos aspectos a un anticuerpo o TCR que muestra especificidades de dos tipos diferentes de antígenos. Los términos tal como se emplean en la presente memoria incluyen, sin limitación, los anticuerpos y TCR que muestran especificidad de unión para un antígeno diana y para otra diana que facilita la administración a un tejido concreto. Asimismo, los anticuerpos y TCR multiespecíficos presentan dos o más especificidades de unión.
[0159] En algunos aspectos, un anticuerpo linear o «TC linear» se refiere en algunos aspectos a un par de segmentos de Fd en tándem (p. ej., VH-CH1-VH-CH1 o Va-Ca1-Va-Ca1) que forman un par de regiones de unión al antígeno. Los anticuerpos y TCR lineales pueden ser biespecíficos o monoespecíficos, por ejemplo, como se describe en Zapata et al., Protein Eng. 8(10): 1057-1062 (1995).
[0160] En algunos aspectos, un dominio de unión al antígeno se refiere a uno o más fragmentos de un anticuerpo o TCR que mantienen la habilidad unirse específicamente a un antígeno. Entre los ejemplos no limitativos de fragmentos de anticuerpo incluidos en esos términos se incluyen, sin carácter limitativo, (i) un fragmento Fab, un fragmento monovalente que consiste en los dominios VL, VH, CL y CH1; (ii) un fragmento F(ab')2, un fragmento bivalente que contiene dos fragmentos Fab ligados por un puente disulfuro en la región bisagra; (iii) un fragmento Fd que consiste en dominios VH y CH1; (iv) un fragmento Fv que contiene los dominios VL y VH de un solo brazo de un anticuerpo, incluidos scFv, (v) un fragmento dAb (Ward et al., (1989) Nature 341:544546), que contiene un dominio VH; y (vi) una CDR aislada. En esta definición además se incluyen anticuerpos que comprenden una sola cadena pesada y una sola cadena ligera o TCR con una sola cadena alfa o una sola cadena beta.
[0161] Las fracciones «F(ab')2» y «Fab» se pueden producir al tratar una Ig con una proteasa como pepsina y papaína, e incluyen fragmentos de anticuerpo generados al digerir la inmunoglobulina cerca de los enlaces disulfuro existentes entre las regiones bisagra en cada una de las dos cadenas pesadas. Por ejemplo, la papaína escinde la IgG antes de los enlaces disulfuro existentes entre las regiones bisagra en cada una de las dos cadenas pesadas para generar dos fragmentos de anticuerpo homólogos en los que una cadena ligera compuesta por VL y CL, y un fragmento de cadena pesada compuesto por VH y CHy I (región y1 en la región constante de la cadena pesada) están conectados en sus regiones terminales C mediante un enlace disulfuro. Cada uno de estos dos fragmentos de anticuerpo homólogos se llaman 'Fab'. La pepsina también escinde la IgG después de los enlaces de disulfuro existentes entre las regiones bisagra en cada una de las dos cadenas pesadas para generar un fragmento de anticuerpo ligeramente más grande que el fragmento donde los dos 'Fab' anteriormente mencionados están conectados en la región bisagra. Este fragmento de anticuerpo se llama F('ab')2. El fragmento Fab también contiene el dominio constante de la cadena ligera y el primer dominio constante (CH1) de la cadena pesada. Los fragmentos 'Fab'difieren de los fragmentos Fab por la adición de unos cuantos residuos en el carboxilo terminal del dominio de la cadena pesada CH1, incluyendo una o más cisteínas de la región bisagra del anticuerpo. En la presente memoria, Fab'-SH es la denominación para Fab’ donde el/los residuo(s) de cisteína de los dominios constantes llevan un grupo tiol libre. Los fragmentos de anticuerpo F(ab')2 originalmente se producen como pares de fragmentos Fab’ que presentan cisteínas de bisagra entre ellos.
[0162] En algunos aspectos, Fv se refiere a un fragmento de anticuerpo o TCR que contiene un reconocimiento completo del antígeno o un sitio de unión al antígeno. Esta región consiste en un dímero de una cadena pesada y un dominio variable de cadena ligera o una cadena TCRa y una cadena TCRp o una cadena TCRy y una cadena TCR8 en asociación estrecha y no covalente. Es en esta configuración donde los tres CDR de cada dominio variable interactúan para definir un sitio de unión al antígeno en la superficie del dímero VH-VL o dímero Va-Vp o dímero Yy-V6. En conjunto, una combinación de uno o más de las CDR de cada una de las cadenas V h y Vl o de las cadenas Va y Vp o de las cadenas Vy y V6 confiere especificidad de unión del antígeno al anticuerpo o TCR. Por ejemplo, debería entenderse que, por ejemplo, la CDRH3 y la CDRL3 podrían ser suficientes para conferir especificidad de unión del antígeno a un anticuerpo o TCR cuando se transfieren a las cadenas V h y Vl o a las cadenas Va y Vp o a las cadenas Vy y V6 un anticuerpo receptor seleccionado, TCR o fragmento de unión al antígeno de este, y esta combinación de CDR se puede probar para unión, afinidad, etc. Incluso un solo dominio variable (o la mitad de un Fv que comprenda solo tres CDR específicas para un antígeno) tiene la habilidad de reconocer y unirse al antígeno, aunque probablemente con una menor afinidad que cuando se combina con un segundo dominio variable. Además, aunque los dos dominios de un fragmento Fv (VL y VH o Va y Vp o Vy y V6) están codificados por genes separados, se pueden unir empleando métodos recombinantes mediante un enlazador que permite hacerlos como una sola cadena proteica donde las regiones de la cadena VL y VH o Va y Vp o Vy y V6 se emparejan para formar moléculas monovalentes (conocidas como Fv monocatenario (scFv); Bird et al. (1988) Science 242:423-426; Huston et al. (1988) Proc. Natl. Acad. Sci. EE. UU. 85:5879-5883; y Osbourn et al. (1998) Nat. Biotechnol. 16:778). El término «porción de unión del antígeno» de un anticuerpo también pretende englobar estos scFv. Cualesquiera secuencias VH y VL de un scFv específico se pueden unir a un ADNc de la región Fc o a secuencias genómicas, con el fin de generar vectores de expresión que codifiquen moléculas completas de Ig (p. ej., IgG) u otros isotipos. VH y VL también pueden emplearse en la generación de fragmentos Fab, Fv u otros fragmentos de Ig mediante ya sea química proteica o tecnología de ADN recombinante.
[0163] Una «secuencia de la línea germinal» se refiere a una secuencia genética de la línea germinal (los gametos haploides y aquellas células diploides de las que se forman). El ADN de la línea germinal contiene segmentos génicos múltiples que codifican una sola cadena ligera o pesada de Ig, o una sola cadena TCRa o TCRp, o una cadena TCRy o TCR6. Estos segmentos génicos se transportan en las células germinales, pero no se pueden transcribir o traducir hasta que se disponen en genes funcionales. Durante la diferenciación de células B y células T en la médula ósea, estos segmentos génicos son mezclados al azar por un sistema genético dinámico capaz de generar más de 180 especificidades. La mayoría de estos segmentos génicos se publican y recopilan en la base de datos de la línea germinal.
[0164] En algunos modos de realización, la molécula inmunitaria puede ser o probablemente puede ser un anticuerpo neutralizante o un TCR neutralizante. En algunos aspectos, un anticuerpo o TCR neutralizante es un anticuerpo o TCR que inhibe la duplicación de un patógeno, como un virus o una bacteria, sin importar el mecanismo mediante el que se logra la neutralización.
[0165] En algunos modos de realización, la muestra, como una población de células o una célula única puede contener un repertorio inmunológico, p. ej., repertorio de anticuerpos o repertorio de TCR, y puede elucidarse mediante los métodos proporcionados. En algunos modos de realización, un repertorio de anticuerpo o repertorio de TCR se refiere a un conjunto de anticuerpos, TCR o fragmentos de estos. En algunos modos de realización, un repertorio de anticuerpo se puede emplear, por ejemplo, para seleccionar un anticuerpo o criba concretos para una propiedad concreta, como la capacidad de unión, la especificidad de unión, la capacidad de transporte gastrointestinal, estabilidad, afinidad y similares. El término incluye bibliotecas de anticuerpos y TCR, incluidas todas las formas de bibliotecas combinatorias como, por ejemplo, bibliotecas de despliegue en fagos, incluidas, sin carácter limitativo, bibliotecas de despliegue en fagos de anticuerpos de cadena única (scFv) y Fab de cualquier fuente, incluidas bibliotecas naive, sintéticas y semisintéticas.
[0166] Los polinucleótidos diana pueden obtenerse de prácticamente cualquier fuente y pueden prepararse mediante los métodos conocidos en la técnica. Por ejemplo, los polinucleótidos diana se pueden aislar directamente sin
amplificación empleando métodos conocidos en la técnica, incluidos, sin carácter limitativo, la extracción de un fragmento de ADN o ARNm genómico de un organismo o una célula (p. ej., una célula inmunitaria) para obtener polinucleótidos diana. Un polinucleótido diana también puede abarcar ADNc generado a partir de ARN (como ARNm) a través de PCR con transcripción inversa. En algunos casos, un polinucleótido diana es una molécula de ARN. En algunos casos, un polinucleótido diana es una molécula de ARNm, o un ADNc producido a partir de la molécula de ARNm. En algunos casos, un polinucleótido diana es una molécula de ARNm, o una molécula de ADNc producida a partir de la molécula de ARNm, de una célula inmunitaria única. En algunos casos, los polinucleótidos diana son moléculas de ARNm, o moléculas de ADNc producidas a partir de las moléculas de ARNm, de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia de anticuerpo de una célula inmunitaria única. En algunos casos, los polinucleótidos diana son moléculas que codifican secuencias de anticuerpo de cadena pesada de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia de anticuerpo de cadena pesada de una célula inmunitaria única. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias de anticuerpo de cadena ligera de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia de anticuerpo de cadena ligera de una célula inmunitaria única. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias variables de anticuerpo de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia variable de anticuerpo de una célula inmunitaria única. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias variables de anticuerpo de cadena ligera de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia variable de anticuerpo de cadena ligera una de célula inmunitaria única. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias variables de anticuerpo de cadena pesada de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia variable de anticuerpo de cadena pesada de una célula inmunitaria única. En algunos casos, un polinucleótido diana puede ser un ácido nucleico libre de células, p. ej., ADN o ARN. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias variables de TCR de cadena alfa, beta, gamma y/o delta de células inmunitarias individuales.
[0167] Los métodos descritos en la presente se pueden emplear para generar una biblioteca de polinucleótidos de uno o más polinucleótidos diana para secuenciación. Los polinucleótidos diana incluyen cualesquiera polinucleótidos de interés que no son producto de una reacción de amplificación. Por ejemplo, un polinucleótido diana puede incluir un polinucleótido en una muestra biológica. Por ejemplo, los polinucleótidos diana no incluyen productos de una reacción de PCR. Por ejemplo, los polinucleótidos diana pueden incluir una plantilla de polinucleótido empleada para generar productos de una reacción de amplificación, pero no incluyen los propios productos de amplificación. Por ejemplo, los polinucleótidos diana pueden incluir una plantilla de polinucleótido empleada para generar productos de una reacción de transcripción inversa o reacción de extensión del cebador, y también incluyen los propios productos de la reacción de la transcripción inversa o de la reacción de extensión del cebador. Por ejemplo, los polinucleótidos diana incluyen polinucleótidos de interés que se pueden someter a una reacción de transcripción inversa o a una reacción de extensión del cebador. Por ejemplo, los polinucleótidos diana incluyen ARN o ADN. Por ejemplo, los polinucleótidos diana incluyen ADNc. En algunos modos de realización, los polinucleótidos de ARN diana son ARNm. En algunos modos de realización, los polinucleótidos de ARN diana están poliadenilados. En algunos modos de realización, los polinucleótidos de ARN no están poliadenilados. En algunos modos de realización, los polinucleótidos diana son polinucleótidos de ADN. Los polinucleótidos de ADN pueden ser ADN genómico. Los polinucleótidos de ADN pueden comprender exones, intrones o regiones no traducidas, o cualquier combinación de estos.
[0168] En algunos modos de realización, las bibliotecas se pueden generar a partir de dos o más regiones de un polinucleótido diana. En algunos modos de realización, las bibliotecas se pueden generar a partir de dos o más regiones de un polinucleótido diana. En algunos modos de realización, los polinucleótidos diana son ácidos nucleicos genómicos o ADN derivado de cromosomas. En algunos modos de realización, los polinucleótidos diana incluyen secuencias que comprenden una variante, como un polimorfismo o una mutación. En algunos modos de realización, los polinucleótidos diana incluyen ADN y no ARN. En algunos modos de realización, los polinucleótidos diana incluyen ARN y no ADN. En algunos modos de realización, los polinucleótidos diana incluyen ADN y ARN. En algunos casos, un polinucleótido diana es una molécula de ARNm. En algunos casos, un polinucleótido diana es una molécula de ADN. En algunos modos de realización, un polinucleótido diana es un polinucleótido monocatenario. En algunos modos de realización, un polinucleótido diana es un polinucleótido bicatenario. En algunos modos de realización, un polinucleótido diana es una sola cadena de un polinucleótido bicatenario.
[0169] Los polinucleótidos diana pueden obtenerse a partir de cualquier muestra biológica y prepararse mediante métodos conocidos en la técnica. En algunos modos de realización, los polinucleótidos diana se aíslan directamente sin amplificación. Los métodos para aislamiento directo son conocidos en la técnica. Los ejemplos no limitativos incluyen la extracción de ADN o ARNm genómico de una muestra biológica, organismo o célula.
[0170] En algunos modos de realización, uno o más polinucleótidos diana se purifican a partir de una muestra biológica. En algunos modos de realización, un polinucleótido diana no se purifica a partir de una muestra biológica donde está contenido. En algunos modos de realización, un polinucleótido diana se aísla a partir de una muestra biológica. En algunos modos de realización, un polinucleótido diana no se aísla a partir de una muestra biológica donde está contenido. En
algunos modos de realización, un polinucleótido diana puede ser un ácido nucleico libre de células. En algunos modos de realización, un polinucleótido diana puede ser un ácido nucleico fragmentado. En algunos modos de realización, un polinucleótido diana puede ser un ácido nucleico transcrito. En algunos modos de realización, un polinucleótido diana es un polinucleótido modificado. En algunos modos de realización, un polinucleótido diana es un polinucleótido no modificado.
[0171] En algunos modos de realización, un polinucleótido diana es un polinucleótido de una sola célula. En algunos modos de realización, los polinucleótidos diana provienen de células individuales. En algunos modos de realización, un polinucleótido diana es un polinucleótido de una muestra que contiene una pluralidad de células.
[0172] En algunos modos de realización, un polinucleótido diana codifica una secuencia de biomarcador. En algunos modos de realización, un polinucleótido diana codifica dos o más secuencias de biomarcador. En algunos modos de realización, una pluralidad de polinucleótidos diana codifica una secuencia de biomarcador. En algunos modos de realización, una pluralidad de polinucleótidos diana codifica dos o más secuencias de biomarcador. En algunos modos de realización, una pluralidad de polinucleótidos diana codifica 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 o más secuencias de biomarcador.
[0173] En algunos modos de realización, una pluralidad de polinucleótidos diana comprende un panel de secuencias de inmunoglobulina. En algunos modos de realización, una pluralidad de polinucleótidos diana comprende un panel de secuencias de TCR. Por ejemplo, un panel de secuencias de inmunoglobulina puede ser secuencias V h y/o V l . En algunos modos de realización, un panel de secuencias de inmunoglobulina o de TCR contiene 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 secuencias de inmunoglobulina o de TCR. En algunos modos de realización, un panel de secuencias de inmunoglobulina o de TCR contiene al menos 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 3000, 4000, 5000, 6000, 7000, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000, 20.000, 25.000, 30.000, 35.000, 40.000, 45.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, l * l06, 2 * l06, 3 * l06, 4 * l06, 5l06, 6 * l06, 7 * l06, 8 * l06, 9 * l06, l * l07, 2 * l07, 3 * l07, 4 * l07, 5 * l07, 6 * l07, 7 * l07, 8 * l07, 9 * 107, l * 108, 2 * l08, 3 * l08, 4 * l08, 5 * l08, 6 * l08, 7 * l08, 8 * l08, 9 * l08, l * l09, 2 * l09, 3 * l09, 4 * l09, 5 * l09, 6 * l09, 7 * l09, 8 * 109, 9 * l09, 1 * l010, 2 * l010, 3 * l010, 4 * l010, 5 * l010, 6 * l010, 7 * l010, 8 * l010, 9 * l010, 1 * l011, 2 * l011, 3 * l011, 4 * l011, 5 * l011, 6 * l011, 7 x l011, 8 * l011, 9 * l011, l * l012, 2 * l012, 3 * l012, 4 * l012, 5 * l012, 6 * l012, 7 * l012, 8 * l012, o 9 * l012 secuencias de inmunoglobulina o de TCR. En algunos modos de realización, un panel de secuencias de inmunoglobulina o de TCR contiene como mucho alrededor de 0, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000, 20.000, 25.000, 30.000, 35.000, 40.000, 45.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, l * 106, 2 * l06, 3 * l06, 4 * l06, 5l06, 6 * l06, 7 * l06, 8 * l06, 9 * l06, l * l07, 2 * l07, 3 * l07, 4 * l07, 5 * l07, 6 * l07, 7 * l07, 8 * 107, 9 * l07, l * l08, 2 * l08, 3 * l08, 4 * l08, 5 * l08, 6 * l08, 7 * l08, 8 * l08, 9 * l08, l * l09, 2 * l09, 3 * l09, 4 * l09, 5 * l09, 6 * l09, 7 * l09, 8 * l09, 9 * l09, 1 * l010, 2 * l010, 3 * l010, 4 * l010, 5 * l010, 6 * l010, 7 * l010, 8 * l010, 9 * l010, l * l011, 2 * l011, 3 * l011, 4 * l011, 5 * l011, 6 * l011, 7 * l011, 8 * l011, 9 * l011, l * l012, 2 * l012, 3 * l012, 4 * l012, 5 * l012, 6 * l012, 7 * l012, 8 * l012 o 9 * l012 secuencias de inmunoglobulina o de TCR. En algunos modos de realización, un panel de secuencias de inmunoglobulina o de TCR contiene desde alrededor de 10-20, 10-30, 10-40, 10-30, 10-40, 10-50, 10-60, 10-70, 10-80, 10-90, 10-100, 50-60, 50-70, 50-80, 50-90, 50-100, 100-200, 100-300, 100-400, 100-300, 100-400, 100-500, 100-600, 100-700, 100-800, 100-900, 100-1000, 500-600, 500-700, 500-800, 500-900, 500-1000, 1000-2000, 1000-3000, 1000 4000, 1000-3000, 1000-4000, 1000- 5000, 1000-6000, 1000-7000, 1000-8000, 1000-9000, 1000-10.000, 5000-6000, 5000-7000, 5000- 8000, 5000-9000, 5000-10.000, 1-1 * 105, 1-2 * 105,1-3 * 105, 1-4 * 105, 1-5 * 105, 1-6 x 105, 1-7 * 105, 1-8 * 105, 9 * 105, 1-1 * 106, 1-2 * 106, 1-3 * 106, 1-4 * 106, 1-5 * 106, 1-6 * 106, 1-7 * 106, 1-8 * 106, 9 * 106,1-1 * 107, 1-2 * 107, 1-3 * 107, 1-4 * 107, 1-5 * 107, 1-6 * 107, 1-7 * 107, 1-8 * 107, 1-9 * 107, 1-1 * 108, 1-2 * 108, 1-3 * 108, 1-4 * 108, 1-5 * 108, 1-6 * 108, 1-7 * 108, 1-8 * 108, 1-9 * 108, 1-1 * 109, 1-2 * 109, 1-3 * 109, 1-4 * 109, 1-5 * 109, 1-6 * 109,1 7 * 109, 1-8 * 1091-9 * 109,1-1 * 1010, 1-2 * 1010, 1-3 * 1010, 1-4 * 1010, 1-5 * 1010, 1-6 * 1010, 1-7 * 1010, 1-81010, 1-9 * 1010, 1-1 * 1011, 1-2 * 1011, 1-3 * 1011, 1-4 * 1011, 1-5 * 1011, 1-6 * 1011, 1-7 * 1011, 1-8 * 1011, 1-9 * 1011, 1-1 * 1012, 1 2 * 1012, 1-3 * 1012, 1-4 * 1012, 1-5 * 1012, 1-6 * 1012, 1-7 * 1012, 1-8 * 1012 o 1-9 * 1012 secuencias de inmunoglobulina o de TCR.
[0174] En algunos modos de realización, un polinucleótido diana presenta alrededor de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000 o 20.000 bases o pares de bases en longitud. En algunos modos de realización, un polinucleótido diana presenta al menos alrededor de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000 o 20.000 bases o pares de bases en longitud. En algunos modos de realización, un polinucleótido diana presenta como mucho alrededor de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000 o 20.000 bases o pares de bases en longitud. En algunos modos de realización, un polinucleótido diana presenta alrededor de 10-20, 10-30, 10-40, 10- 30, 10 40, 10-50, 10-60, 10-70, 10-80, 10-90, 10-100, 50-60, 50-70, 50-80, 50-90, 50-100, 100-200, 100-300, 100-400, 100-300,
100-400, 100-500, 100-600, 100-700, 100-800, 100-900, 100-1000, 500-600, 500-700, 500-800, 500-900, 500-1000, 1000 2000, 1000-3000, 1000-4000, 1000-3000, 1000-4000, 1000-5000, 1000-6000, 1000-7000, 1000-8000, 1000-9000, 1000 10.000, 5000-6000, 5000-7000, 5000-8000, 5000-9000 o 5000-10.000 bases o pares de bases en longitud. En algunos modos de realización, la longitud promedio de los polinucleótidos diana, o fragmentos de estos, pueden presentar menos de alrededor de 100, 200, 300, 400, 500 o 800 pares de bases, o menos de alrededor de 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 o 200 nucleótidos, o menos de alrededor de 1, 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 kilobases. En algunos modos de realización, una secuencia diana de una plantilla relativamente corta, como una muestra que contiene un polinucleótido diana, presenta alrededor de 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 bases. En ciertos modos de realización, los datos de secuenciación se alinean contra las secuencias conocidas o esperadas mediante una base de datos que contiene secuencias o secuencias de inmunoglobulina o de TCR asociadas con una enfermedad o afección.
2. Colecciones de polinucleótidos, p. ej., transcriptoma
[0175] Se puede obtener un conjunto de polinucleótidos correspondientes a los polinucleótidos genómicos o transcriptómicos de prácticamente cualquier fuente, como una célula o una pluralidad de células, y se pueden preparar mediante los métodos conocidos en la técnica. Por ejemplo, se puede aislar directamente el conjunto de polinucleótidos de una sola célula o de una pluralidad de células sin amplificación empleando métodos conocidos en la técnica, incluidos, sin carácter limitativo, la extracción de un fragmento de ADN o ARNm genómico de un organismo o una célula (p. ej., una célula inmunitaria) para obtener el conjunto de polinucleótidos. El conjunto de polinucleótidos genómicos o transcriptómicos también puede abarcar ADNc generado a partir de ARN (como ARNm) a través de PCR con transcripción inversa. En algunos casos, el conjunto de polinucleótidos es un conjunto de moléculas de ARN. En algunos casos, el conjunto de polinucleótidos es un conjunto de moléculas de ARNm, o un conjunto de moléculas de ADNc producido a partir de las moléculas de ARNm. En algunos casos, el conjunto de polinucleótidos es un conjunto de moléculas de ARNm, o un conjunto de moléculas de ADNc producidas a partir de las moléculas de ARNm, de una célula inmunitaria única. En algunos casos, el conjunto de polinucleótidos es un conjunto de moléculas de ARNm, o moléculas de ADNc producidas a partir de las moléculas de ARNm, de células inmunitarias individuales.
[0176] Los métodos descritos en la presente memoria se pueden emplear para generar una biblioteca que contenga un conjunto de polinucleótidos de una o más células para secuenciación. El conjunto de polinucleótidos puede derivarse del ADN o ARN genómico, como transcritos de ARNm de una o de una pluralidad de células de una muestra biológica. Por ejemplo, el ADN genómico o ARN celular, como el ARNm se puede emplear como plantilla para generar productos de una reacción de amplificación, como una reacción de transcripción inversa o una reacción de extensión del cebador. En algunos ejemplos, el conjunto de polipéptidos se puede generar a partir de ADNc. En algunos modos de realización, el conjunto de polinucleótidos se genera a partir de polinucleótidos de ADN son ARNm, y el conjunto esencialmente representa el transcriptoma de una o más células de una muestra biológica. En algunos modos de realización, el conjunto de polinucleótidos se genera a partir de polinucleótidos de ARN que están poliadenilados. En algunos modos de realización, los polinucleótidos de ARN no están poliadenilados. En algunos modos de realización, el conjunto de polinucleótidos se genera a partir de polinucleótidos de ADN. Los polinucleótidos de ADN pueden ser ADN genómico. Los polinucleótidos de ADN pueden comprender exones, intrones o regiones no traducidas, o cualquier combinación de estos. Por ejemplo, el conjunto de polinucleótidos de la presente invención puede contener la información genómica o transcriptómica de al menos 5, 10, 100, 250, 500, 750, 1000, 2500, 5000, 10.000, 25.000, 50.000, 75.000, 10.000, 250.000, 500.000, 750.000, 1.000.000, 2.500.000, 5.000.000, 7.500.000 o 100.000.000 células individuales o subconjuntos, como células inmunitarias individuales que expresan diferentes anticuerpos o TCR o subconjuntos de estas.
[0177] En algunos modos de realización, el conjunto de polinucleótidos se puede generar mediante la reacción de la transcriptasa inversa o de extensión del cebador, empleando cebadores hexámeros aleatorios. En algunos modos de realización, el conjunto de polinucleótidos se puede generar mediante la reacción de la transcriptasa inversa o de extensión del cebador, empleando un cebador dirigido contra una secuencia de nucleótido poli A. En algunos ejemplos, el conjunto de polinucleótidos se puede generar mediante la reacción de transcriptasa inversa o de extensión del cebador empleando un oligo-dT. En algunos ejemplos, los cebadores pueden estar biotinilados. Opcionalmente, se pueden purificar los conjuntos de polinucleótidos seguido a las reacciones de transcripción inversa o extensión del cebador. Por ejemplo, los conjuntos de polinucleótidos generados mediante cebadores biotinilados se pueden purificar, opcionalmente, mediante técnicas de purificación con estreptavidina. En otros modos de realización, se pueden purificar los polinucleótidos mediante una o más entre purificación por afinidad o electroforesis en gel de agarosa.
3. Bibliotecas de gotículas
[0178] En general, una biblioteca de gotículas se compone de un número de elementos de biblioteca que se agrupan en un solo conjunto. La complejidad de las bibliotecas puede variar de un solo elemento de biblioteca a l * l015 elementos de biblioteca o más. Cada elemento de biblioteca es uno o más componentes en una concentración fija. El elemento puede ser, sin carácter limitativo, células, perlas, aminoácidos, proteínas, polipéptidos, ácidos nucleicos, polinucleótidos o compuestos químicos de pequeña molécula. El elemento puede contener un identificador como un código de barras molecular, un código de barras de recipiente o ambos.
[0179] Un elemento de biblioteca puede incluir, sin carácter limitativo, hibridomas, células B, células T, células primarias, líneas celulares cultivadas, células cancerosas, células madre o cualquier otro tipo de célula. Los elementos de biblioteca celular se preparan mediante la encapsulación de un número de células de una a decenas de miles en gotículas individuales El número de células encapsuladas suele venir dado por la estadística de Poisson a partir de la densidad del número de células y el volumen de la gotícula. No obstante, en algunos casos el número se desvía de la estadística de Poisson, como se describe en Edd et al., «Controlled encapsulation of single-cells into monodisperse picoliter drops.» Lab Chip, 8(8): 1262-1264, 2008. La naturaleza discreta de las células permite preparar bibliotecas en masa con una pluralidad de variantes celulares, como células inmunitarias que producen un anticuerpo o un TCR cada una, todas ellas presentes en un único medio de partida y luego ese medio se divide en recipientes individuales, como gotículas o cápsulas, que contienen como mucho una célula. Después, las células dentro de los recipientes individuales, p. ej., gotículas o cápsulas, se lisan, y los polinucleótidos liberados dentro del recipiente, como el ARNm celular y el ADN genómico, incluidos el ARNm o el ADN diana (por ejemplo, polinucleótidos de cadena pesada y cadena ligera y/o polinucleótidos de cadena alfa y beta y/o polinucleótidos de cadena gamma y delta), de las células lisadas se codifican con códigos de barras moleculares y códigos de barras de recipiente y se amplifican. Los productos de polinucleótido con código de barras doble se combinan o agrupan, después, para formar una biblioteca que consiste en los elementos de la biblioteca de transcriptoma o de genoma y diana (p. ej., la cadena ligera y pesada y/o la cadena alfa y beta y/o la cadena gamma y delta). En concreto, se agrupan las bibliotecas diana y de transcriptoma.
[0180] Un elemento de biblioteca basado en perla contiene una o más perlas, y también puede contener otros reactivos, como anticuerpos, enzimas u otras proteínas. En caso de que todos los elementos de la biblioteca contengan diferentes tipos de perlas, pero los mismos medios circundantes, todos los elementos de biblioteca pueden prepararse a partir de un solo fluido de partida o presentar una variedad de fluidos de partida. En caso de bibliotecas celulares preparadas en masa a partir de un conjunto de variantes, los elementos de biblioteca se prepararán a partir de una variedad de fluidos de partida. Es conveniente tener exactamente una célula por gotícula, con solo unas cuantas gotículas que contengan más de una célula cuando se parte de una pluralidad de células. En algunos casos, se pueden lograr las variaciones de las estadísticas de Poisson para proporcionar una carga mejorada de gotículas de manera que haya más gotículas con exactamente una célula por gotícula y unas cuantas excepciones de gotículas vacías o gotículas que contengan más de una célula.
[0181] En algunos modos de realización, conviene tener exactamente un polinucleótido con código de barras de recipiente por gotícula con solo unas cuantas gotículas que contengan más de un polinucleótido con código de barras de recipiente cuando se parta de una pluralidad de polinucleótidos con código de barras de recipiente. En algunos casos, se pueden lograr las variaciones de las estadísticas de Poisson para proporcionar una carga mejorada de gotículas de manera que haya más gotículas con exactamente un polinucleótido con código de barras de recipiente por gotícula y unas cuantas excepciones de gotículas vacías o gotículas que contengan más de un polinucleótido con código de barras de recipiente.
[0182] Los ejemplos de bibliotecas de gotículas son conjuntos de gotículas que presentan diferentes contenidos, desde perlas, células, pequeñas moléculas, ADN, cebadores, anticuerpos y polinucleótidos con código de barras. El tamaño de las gotículas oscila en tamaño desde aproximadamente 0.5 micras hasta 500 micras de diámetro, que corresponde a alrededor de 1 picolitro hasta 1 nanolitro. Sin embargo, las gotículas pueden ser tan pequeñas como 5 micras y tan grandes como 500 micras. Preferiblemente, las gotículas son inferiores a 100 micras, de un diámetro de alrededor de 1 micra a alrededor de 100 micras. El tamaño más preferido es de alrededor de 20 a 40 micras de diámetro (de 10 a 100 picolitros). Las propiedades preferidas examinadas de bibliotecas de gotículas incluyen equilibrio de la presión osmótica, tamaño uniforme y rangos de tamaño.
[0183] Las gotículas comprendidas dentro de la biblioteca de gotículas proporcionadas por la invención actual presentan un tamaño, preferiblemente, uniforme. Esto es, el diámetro de cada gotícula de la biblioteca variará menos del 5 %, 4 %, 3 %, 2 %, 1 % o 0.5 % al compararse con el diámetro de otras gotículas de la misma biblioteca. El tamaño uniforme de las gotículas en la biblioteca puede ser imprescindible para mantener la estabilidad e integridad de las gotículas y también puede ser esencial para el uso posterior de las gotículas de la biblioteca para los diferentes ensayos biológicos y químicos descritos en la presente memoria.
[0184] La invención proporciona una biblioteca de gotículas que comprende una pluralidad de gotículas acuosas dentro de un fluido inmiscible, donde cada gotícula es preferiblemente de tamaño esencialmente uniforme y comprende un elemento de biblioteca diferente. La invención proporciona un método para la formación de la biblioteca de gotículas que comprende proporcionar un solo fluido acuoso que comprenda elementos de biblioteca diferentes, con cada elemento de biblioteca encapsulado en una gotícula acuosa dentro de un fluido inmiscible.
[0185] En modos de realización determinados, los diferentes tipos de elementos (p. ej., células o perlas) se agrupan en una sola fuente contenida en el mismo medio. Tras la agrupación inicial, los elementos se encapsulan entonces en gotículas para generar una biblioteca de gotículas donde cada gotícula con un tipo diferente de perla o célula es un elemento de biblioteca diferente. La dilución de la solución inicial permite el proceso de encapsulación. En otros modos de realización, las gotículas formadas contendrán o bien un solo elemento o no contendrán nada, es decir, estarán vacías. En otros modos de realización, las gotículas formadas contendrán copias múltiples de un elemento de biblioteca. Los
elementos encapsulados son, en general, variantes de un tipo. En un ejemplo, los elementos son células inmunitarias de una muestra de sangre, y cada célula inmunitaria se encapsula para amplificar y codificar con código de barras las secuencias de anticuerpo de los nucleótidos en las células inmunitarias.
[0186] Por ejemplo, en un tipo de biblioteca de emulsión, se dan elementos de biblioteca que presentan diferentes partículas, esto es, células o polinucleótidos con código de barras en un medio diferente y se encapsulan previamente a agruparse. En un ejemplo, un número específico de elementos de biblioteca, es decir, un número n de diferentes células, o polinucleótidos con código de barras, está contenido en diferentes medios. Cada uno de los elementos de biblioteca se emulsiona por separado y se agrupa, momento en que cada uno de los números n de diferentes elementos de biblioteca agrupados se agrupan y combinan en un solo acervo. El acervo resultante contiene una pluralidad de gotículas de emulsión de agua en aceite, conteniendo cada una un tipo diferente de partícula.
[0187] En algunos modos de realización, las gotículas formadas contendrán o bien un solo elemento de biblioteca o no contendrán nada, es decir, estarán vacías. En otros modos de realización, las gotículas formadas contendrán copias múltiples de un elemento de biblioteca. Los contenidos de las perlas siguen una distribución de Poisson, donde hay una distribución de probabilidad discreta que expresa la probabilidad de que se produzca una serie de eventos en un periodo de tiempo fijo si estos eventos se producen en un intervalo medio conocido e independientemente del tiempo transcurrido desde el último evento. Los aceites y surfactantes empleados para crear bibliotecas impiden el intercambio de contenidos de la biblioteca entre gotículas.
B. Métodos de producción de la biblioteca de polinucleótidos con código de barras doble de célula única
[0188] En algunos modos de realización, se proporcionan métodos para la producción de una biblioteca de polinucleótidos que incluyen los pasos de (a) lisis de células dentro de cada uno de una pluralidad de recipientes, donde cada uno de dichos recipientes comprende una célula de una muestra que comprende una población de células, una pluralidad de oligonucleótidos con código de barras molecular y un primer adaptador que comprende un oligonucleótido con código de barras de recipiente; (b) producción, en cada recipiente, de una pluralidad de polinucleótidos monocatenarios que comprenden (i) uno o más polinucleótido monocatenarios diana que son complementarios a uno o más polinucleótidos presentes en la célula; y (ii) un conjunto de polinucleótidos monocatenarios, cada uno complementario a un polinucleótido en la célula; (c) fijación de uno de la pluralidad de oligonucleótidos con código de barras molecular a cada polinucleótido monocatenario, generando así una pluralidad de polinucleótidos monocatenarios con código de barras, comprendiendo cada uno un código de barras molecular único; (d) fijación del primer adaptador que comprende el oligonucleótidos con código de barras de recipiente, o de un producto amplificado de este, a cada uno de los polinucleótidos monocatenarios con código de barras, generando así una pluralidad de polinucleótidos monocatenarios con código de barras doble, donde cada uno de los polinucleótidos monocatenarios con código de barras doble comprende el mismo código de barras de recipiente; y (e) adición de un segundo adaptador a cada uno de los polinucleótidos monocatenarios con código de barras doble, donde el primer adaptador y el segundo adaptador están presentes en extremos opuestos, o cerca de estos, de cada uno de los polinucleótidos monocatenarios con código de barras doble. Entre los recipientes de ejemplo donde se produce la biblioteca de polinucleótido se incluyen un pocillo, una emulsión, una gotícula o una microcápsula.
1. Preparación de la muestra
[0189] Cualquier muestra biológica, incluida una muestra que contenga una población de células, que contenga polinucleótidos, puede emplearse en los métodos descritos en la presente memoria. Cualquier muestra que contenga una célula puede emplearse, en general, en los métodos descritos en la presente memoria. Por ejemplo, una muestra puede ser una muestra biológica de un sujeto o de una muestra derivada del mismo que contenga ARN o ADN. Los polinucleótidos se pueden extraer de la muestra biológica, o la muestra se puede someter directamente a los métodos sin la extracción o purificación de los polinucleótidos. La muestra puede ser ADN o ARN extraído o aislado. Una muestra también puede ser ARN o ADN total extraído de un espécimen biológico, una biblioteca de ADNc, o ADN viral o genómico. En un modo de realización, los polinucleótidos se aíslan a partir de una muestra biológica que contiene una variedad de otros componentes, como proteínas, lípidos y ácidos nucleicos sin plantilla. Las moléculas de plantilla de ácido nucleico se pueden obtener a partir de cualquier material celular, obtenido de un animal, una planta, una bacteria, un hongo o cualquier otro organismo celular.
[0190] En modos de realización determinados, los polinucleótidos se obtienen a partir de una sola célula, como una célula presente en una población de células. Los polinucleótidos se pueden obtener directamente de un organismo o de una muestra biológica obtenida de un organismo. Cualquier espécimen de tejido o de fluido corporal se puede emplear como fuente de ácido nucleico para uso en la invención. Los polinucleótidos también se pueden aislar de células cultivadas, como un cultivo celular primario o una línea celular. En algunos modos de realización, la célula puede ser una célula sanguínea, una célula inmunitaria, una célula tisular o una célula tumoral. En algunos modos de realización, la célula es una célula inmunitaria, como una célula B o una célula T. La célula B puede ser un plasmoblasto, una célula B de memoria o una célula plasmática. Las células o tejidos de los que se obtienen ácidos nucleicos de plantilla pueden estar infectados con un virus u otro patógeno intracelular.
[0191] En algunos modos de realización, la población de células, como una población que contiene células inmunitarias, puede aislarse de la sangre u otras muestras biológicas de un sujeto o huésped, como un ser humano u otro animal, como un ser humano u otro animal que ha sido inmunizado o que padece una infección, un cáncer o una afección autoinmune o cualquier otra enfermedad. En algunos modos de realización, el ser humano puede estar diagnosticado con una enfermedad, presentar síntomas de una enfermedad, no estar diagnosticado con ninguna enfermedad o no presentar síntomas de ninguna enfermedad. En algunos modos de realización, el sujeto o huésped, p. ej., un sujeto humano, puede ser un sujeto que estuvo expuesto un agente infeccioso (p. ej., virus, bacterias, parásitos, priones, etc.), antígeno, enfermedad o un antígeno asociado con una enfermedad o condición, p. ej., un antígeno asociado a un tumor, y/o que es capaz de producir TCR contra estos. En algunos modos de realización, las células inmunitarias pueden proceder de cualquier muestra biológica que contenga células T, como células presentes en PBMC, bazo u otro órgano linfoide. En algunos modos de realización, las células inmunitarias proceden de una fuente de célula T de un sujeto normal o sano. En algunos modos de realización, las células inmunitarias proceden de una fuente de célula T de un sujeto enfermo. En algunos modos de realización, se pueden aislar u obtener células CD4+ o CD8+. En algunos casos, se pueden aislar u obtener células mononucleares de sangre periférica (PBMC). En algunos casos, se pueden aislar u obtener linfocitos infiltrantes de tumor (TIL, por sus siglas en inglés).
[0192] En ciertos modos de realización, las células inmunitarias que producen el anticuerpo o TCR pueden aislarse de la sangre u otras muestras biológicas de un sujeto o huésped, como un ser humano u otro animal, como un ser humano u otro animal que ha sido inmunizado o que padece una infección, un cáncer, una afección autoinmune o cualesquiera otras enfermedades para identificar un anticuerpo o TCR específico para un patógeno, un tumor y/o una enfermedad de importancia clínica potencial. Por ejemplo, el ser humano puede estar diagnosticado con una enfermedad, presentar síntomas de una enfermedad, no estar diagnosticado con ninguna enfermedad o no presentar síntomas de ninguna enfermedad. Por ejemplo, el ser humano puede haber estado expuesto a un agente infeccioso (p. ej., virus, bacterias, parásitos, priones, etc.), antígeno o enfermedad, o puede crear anticuerpos o TCR útiles contra estos. Por ejemplo, el animal puede haber estado expuesto a un agente infeccioso (p. ej., virus, bacterias, parásitos, priones, etc.), antígeno o enfermedad, o puede crear anticuerpos o TCR útiles contra estos. En algunos ejemplos, el animal, como un ser humano, ya no presenta síntomas de una enfermedad o afección. Determinadas células inmunitarias de huéspedes inmunizados producen anticuerpos o TCR contra uno o más antígenos diana y/o uno o más antígenos desconocidos. En la presente invención, el acervo de linfocitos se puede enriquecer en células inmunitarias deseadas mediante cualquier método adecuado, como cribado o clasificación de las células empleando clasificación de células activadas por fluorescencia (FACS), clasificación de células activadas por magnetismo (MACS, por sus siglas en inglés), barrido u otros método de cribado para generar una pluralidad de células inmunitarias a partir de una muestra, como una biblioteca de células inmunitarias, antes de que se secuencien las cadenas de anticuerpo, se produzcan los anticuerpos o se produzca una biblioteca o bibliotecas de expresión. A diferencia de los métodos de enriquecimiento de la técnica anterior, que solo proporcionan unos pocos subconjuntos de células inmunitarias que expresan diferentes anticuerpos y, por lo tanto, solo unas pocas combinaciones naturales de dominios variables, la biblioteca de células inmunitarias de la presente invención contiene al menos 2 subconjuntos de células inmunitarias o células inmunitarias individuales que expresan diferentes anticuerpos o TCR. Por ejemplo, la biblioteca de células inmunitarias de la presente invención puede contener al menos 5, 10, 100, 250, 500, 750, 1000, 2500, 5000, 10.000, 25.000, 50.000, 75.000, 10.000, 250.000, 500.000, 750.000, 1.000.000, 2.500.000, 5000,000, 7.500.000 o 100.000.000 subconjuntos de células inmunitarias o células inmunitarias individuales que expresan diferentes anticuerpos o TCR. Los métodos de la presente invención maximizan la recuperación de célula inmunitaria y permiten una diversidad muy elevada.
[0193] Las células T se pueden obtener de varias fuentes, entre ellas, las células mononucleares de sangre periférica, la médula ósea, el timo, la biopsia tisular, el tumor, el tejido de los ganglios linfáticos, el tejido linfoide asociado al intestino, el tejido linfoide asociado a la mucosa, el tejido del bazo o cualquier otro tejido linfoide y los tumores. Las células T pueden obtenerse de líneas de células T y de fuentes autógenas o alogénicas. Las células T se pueden obtener de un solo individuo o de una población de individuos, por ejemplo, una población de individuos donde todos padecen la misma enfermedad, como un cáncer o una enfermedad infecciosa. En algunos modos de realización, las células de la sangre circulante de un individuo se obtienen mediante aféresis o leucaféresis. El producto de aféresis suele contener linfocitos, entre ellos, células T, monocitos, granulocitos, células B, otros glóbulos blancos nucleados, glóbulos rojos y plaquetas. En un modo de realización, las células recogidas por aféresis o leucaféresis se pueden lavar para eliminar la fracción de plasma y colocar las células en un tampón o medio adecuado para los pasos de procesamiento posteriores. En un modo de realización de la invención, las células se lavan con tampón fosfato salino (PBS, por sus siglas en inglés). En un modo de realización alternativo, la solución de lavado carece de calcio y puede carecer de magnesio, o puede carecer de muchos si no todos los cationes divalentes. Como los expertos en la técnica apreciarán fácilmente, el paso de lavado puede llevarse a cabo mediante métodos conocidos por los expertos en la técnica, como el uso de una centrifugadora semiautomática de «flujo continuo».
[0194] Tras el lavado, las células se pueden volver a suspender en una variedad de tampones biocompatibles, como, por ejemplo, PBS libre de Ca++/Mg++. De forma alternativa, se pueden eliminar los componentes indeseables de la muestra de aféresis y resuspender las células directamente en medios de cultivo. En otros modos de realización, las células T se aíslan de los linfocitos de sangre periférica mediante la lisis de los glóbulos rojos y la centrifugación con un gradiente PERCOLL™. Se puede aislar adicionalmente una subpoblación de células T específica, como células T CD28+, CD4+, CD8+, CD45RA+, y CD45RO+ mediante técnicas de selección positiva o negativa. Por ejemplo, las células T
CD3+, CD28+ se pueden seleccionar de forma positiva empleando perlas magnéticas conjugadas CD3/CD28 (p. ej., DYNABEADS® M-450 CD3/CD28 T Cell Expander).
[0195] En algunos modos de realización, se puede lograr el enriquecimiento de una población de células T por selección negativa con una combinación de anticuerpos dirigida a marcadores de superficie únicos de las células seleccionadas de forma negativa. Uno de estos métodos es la clasificación de células y/o selección por medio de inmunoadherencia magnética o citometría de flujo que emplea un cóctel de anticuerpos monoclonales dirigidos a los marcadores de superficie celular presentes en las células seleccionadas de forma negativa. Por ejemplo, para enriquecimiento en células CD4+ mediante la selección negativa, un cóctel de anticuerpo monoclonal suele incluir anticuerpos para CD14, CD20, CD11b, CD16, HLA-DR y CD8. Otro método de preparación de células T para estimulación es congelar las células tras el paso de lavado, lo que no requiere el paso de eliminación de monocitos. La congelación y posterior descongelación puede proporcionar un producto más uniforme al eliminar granulocitos y, en cierta medida, monocitos en la población de células. Tras el paso de lavado que elimina plasma y plaquetas, las células se pueden suspender en una solución de congelación. Mientras que muchas soluciones y parámetros de congelación se conocen en la técnica y serán útiles en este contexto, un método implica el uso de PBS que contiene 20 % de DMSO y 8 % de seroalbúmina humana (HSA) u otros medios de congelación adecuados. A continuación, esto se diluye 1:1 con el medio para que la concentración final de DMSO y HSA sea del 10 % y del 4 %, respectivamente. Después, las células se congelan hasta - 80 °C a una velocidad de 1 °C por minuto y se almacenan en la fase de vapor de un tanque de almacenamiento de nitrógeno líquido.
[0196] En algunos modos de realización, la población de células se enriquece a partir de una muestra. En algunos modos de realización, las células se enriquecen en un subconjunto o subtipo de célula concreto. En algunos modos de realización, la población de células está enriquecida en células T o células B, o las contiene. En algunos modos de realización, la población de células está enriquecida en células CD4+ o CD8+ , o las contiene. En algunos modos de realización, la población de células está enriquecida en células T de memoria central, células T de memoria efectora, células T naive, células T madre de memoria central, células T efectoras y células T reguladoras, o las contiene. En algunos modos de realización, la población de células está enriquecida en células B de memoria, células B naive o células B plasmablásticas, o las contiene.
[0197] En algunos modos de realización, las células inmunitarias se pueden seleccionar en función de la afinidad de los inmunoreceptores de la célula para un antígeno o complejo diana seleccionado. En algunos aspectos, la afinidad se refiere a la constante de equilibrio para la unión reversible de dos agentes y se expresa como Kd . La afinidad de una proteína de unión a un ligando como la afinidad de un anticuerpo para un epítopo o como la afinidad para un TCR para un complejo MHC-péptido puede ser, por ejemplo, de alrededor de 100 nanomolares (nM) a alrededor de 0.1 nM, de alrededor de 100 nM a alrededor de 1 picomolar (pM), o de alrededor de 100 nM a alrededor de 1 femtomolar (fM). El término «avidez» se refiere a la resistencia de un complejo de dos o más agentes para la disociación tras la dilución.
[0198] En algunos modos de realización, un epítopo se refiere, en algunos aspectos, a una porción de un antígeno o de otra macromolécula capaz de formar una interacción de unión con el bolsillo de unión de la región variable de un anticuerpo o TCR. Estas interacciones de unión se pueden manifestar como un contacto intermolecular con uno o más residuos de aminoácidos de uno o más CDR. La unión del antígeno puede implicar, por ejemplo, una CDR3, un par de CDR3 o, en algunos casos, las interacciones de hasta las seis CDR de las cadenas V h y Vl . Un epítopo puede ser una secuencia peptídica lineal (esto es, «continua») y puede componerse de secuencias de aminoácidos no contiguas (esto es, «conformacional» o «discontinua»). Un anticuerpo o un TCR puede reconocer una o más secuencias de aminoácido; por lo tanto, un epítopo puede definir más de una secuencia aminoacídica distinta. En algunos aspectos, un TCR puede reconocer una o más secuencias de aminoácidos o epítopos en el contexto de un MHC. Los epítopos reconocidos por anticuerpos y TCR se pueden determinar mediante técnicas de mapeo de péptidos y de análisis de secuencias conocidos por el experto en la técnica. Las interacciones de unión se manifiestan como contactos intermoleculares con uno o más residuos de aminoácidos de una o más CDR.
[0199] En algunos modos de realización, la referencia a un inmunoreceptor, tal como se expresa en una célula inmunitaria, por ejemplo, un anticuerpo o TCR, con una unión específica se refiere a una situación en la que un anticuerpo o TCR no mostrará ninguna unión significativa a moléculas distintas del antígeno que contiene el epítopo reconocido por el anticuerpo o TCR. El término también es aplicable cuando, por ejemplo, un dominio de unión al antígeno es específico para un epítopo concreto que es portado por varios antígenos, en cuyo caso el anticuerpo seleccionado, el t Cr o el fragmento de unión al antígeno de este que lleva el dominio de unión al antígeno será capaz de unirse a los diversos antígenos que portan el epítopo.
[0200] Los términos «se une(n) preferentemente» o «se une(n) específicamente» significan que los anticuerpos, TCR o fragmentos de estos se unen a un epítopo con mayor afinidad que a secuencias de aminoácidos no relacionadas y, si son reactivos de forma cruzada con otros polipéptidos que contienen el epítopo, no son tóxicos a los niveles en los que se formulan para su administración al uso humano. En un aspecto, esta afinidad es al menos 1 vez mayor, al menos 2 veces mayor, al menos 3 veces mayor, al menos 4 veces mayor, al menos 5 veces mayor, al menos 6 veces mayor, al menos 7 veces mayor, al menos 8 veces mayor, al menos 9 veces mayor, 10 veces mayor, al menos 20 veces mayor, al menos 30 veces mayor, al menos 40 veces mayor, al menos 50 veces mayor, al menos 60 veces mayor, al menos 70 veces mayor, al menos 80 veces mayor, al menos 90 veces mayor, al menos 100 veces mayor, o al menos 1000 veces mayor
que la afinidad del anticuerpo, TCR o fragmento de estos para secuencias de aminoácidos no relacionadas. El término «unión» se refiere a una asociación directa entre dos moléculas, debida a, por ejemplo, interacciones covalentes, electrostáticas, hidrofóbicas e iónicas y/o de enlace de hidrógeno en condiciones fisiológicas, e incluye interacciones como los puentes salinos y los puentes de agua, así como cualquier otro medio convencional de unión.
[0201] En algunos modos de realización, el término «unión» se refiere a una asociación directa entre dos moléculas, debida a, por ejemplo, interacciones covalentes, electrostáticas, hidrofóbicas e iónicas y/o de enlace de hidrógeno en condiciones fisiológicas, e incluye interacciones como los puentes salinos y los puentes de agua, así como cualquier otro medio convencional de unión.
[0202] En algunos modos de realización, las células inmunitarias se pueden seleccionar en función de la afinidad del inmunoreceptor, p. ej., TCR, de la célula para un tetrámero u otro multímero del MHC-péptido. En algunos modos de realización, el término «tetrámero» se puede referir a un complejo que comprende cuatro subunidades unidas a una sola molécula de estreptavidina, que puede unirse a una población de células y así identificarla. Una subunidad puede ser un complejo MHC-péptido. Una subunidad puede ser un MHC sin un péptido asociado. Una subunidad puede ser un antígeno receptor de células B. Una población de células identificadas por un tetrámero puede ser una población que expresa un receptor, como un TCR o BCR, que se une a una subunidad del tetrámero. La población de células pueden ser células T específicas de antígeno. La población de células pueden ser células B específicas de antígeno. Un tetrámero puede estar marcado fluorescentemente. Tal como se EE. u U. en la presente memoria, el tetrámero MHC-péptido se puede emplear de forma intercambiable con MHCp.
[0203] En algunos ejemplos, las células inmunitarias se pueden seleccionar en función de la afinidad para un conjugado de oligonucleótido de afinidad (véase, p. ej., el documento WO 2017/053905). Las células seleccionadas en función de la unión o el reconocimiento del antígeno o complejo diana seleccionado, como un conjugado de oligonucleótido de afinidad, se puede aislar adicionalmente mediante técnicas de selección positiva o negativa descritas en la presente memoria.
[0204] En algunos modos de realización, se emplean las células inmunitarias de seres humanos o donantes no humanos no inmunizados. El repertorio naive de un animal (el repertorio antes del desafío antigénico) proporciona anticuerpos o TCR al animal que pueden unirse con afinidad moderada (Ka de alrededor de 1 * 10'6 a 1 x 10-7 M) a esencialmente cualquier molécula no propia. La diversidad de secuencias de los sitios de unión de anticuerpos o TCR no se codifica directamente en la línea germinal, sino que se ensambla de forma combinatoria a partir de segmentos de genes V. Las inmunizaciones desencadenan que cualquier célula inmunitaria que forme una combinación V h -Vl o Va -Vp o Yy-Yb que se una al inmunógeno prolifere (expansión clonal) y segregue el anticuerpo correspondiente, como se ha señalado anteriormente. No obstante, el uso de células del bazo y/o células inmunitarias u otros linfocitos de sangre periférica (PBL) de un sujeto no inmunizado pueden proporcionar una mejor representación del repertorio de anticuerpo o TCR posible, y también permite la construcción de un anticuerpo o TCR de células B o células T o una biblioteca de TCR posterior empleando cualquier especie animal.
[0205] En algunos modos de realización, la muestra es saliva. En algunos modos de realización, la muestra es sangre entera. En algunos modos de realización, a fin de obtener la cantidad suficiente de polinucleótidos para estudio, se extrae un volumen de sangre de al menos alrededor de 0.001, 0.005, 0.01, 0.05, 0.1, 0.5, 1, 2, 3, 4, 5, 10, 20, 25, 30, 35, 40, 45 o 50 mL. En algunos casos, a fin de obtener suficiente ácido nucleico para estudio, se extrae un volumen de sangre de al menos 0.001, 0.005, 0.01, 0.05, 0.1, 0.5, 1,2, 3, 4, 5, 10, 20, 25, 30, 35, 40, 45 o 50 mL.
[0206] En algunos casos, el material inicial es sangre periférica. Las células de sangre periférica pueden estar enriquecidas para un tipo celular concreto (p. ej., células mononucleares; glóbulos rojos; células CD4+; células CD8+; células inmunitarias; células T, células NK, o similares). Las células de sangre periférica también pueden estar agotadas de forma selectiva para un tipo celular concreto (p. ej., células mononucleares; glóbulos rojos; células CD4+; células CD8+; células inmunitarias; células T, células NK, o similares).
[0207] En algunos casos, el material de partida puede ser una muestra de tejido que comprende un tejido sólido, con ejemplos no limitativos entre los que se incluyen piel, cerebro, hígado, pulmón, riñón, próstata, ovario, bazo, ganglio linfático (incluida la amígdala), tiroides, páncreas, corazón, músculo esquelético, intestino, laringe, esófago y estómago. En otros casos, el material de partida pueden ser células que contienen ácidos nucleicos, células inmunitarias y, en concreto, células B o células T. En algunos casos, el material de partida puede ser una muestra que contiene ácidos nucleicos, de cualquier organismo del que se pueda obtener material genético. En algunos casos, una muestra es un fluido, p. ej., sangre, saliva, linfa u orina.
[0208] Una muestra se puede tomar de un sujeto que padece una afección. En algunos casos, el sujeto al que se le toma la muestra puede ser un paciente, por ejemplo, un paciente de cáncer o un paciente que se sospecha que padece cáncer. El sujeto puede ser un mamífero, p. ej., un ser humano, y puede ser macho o hembra. En algunos modos de realización, la hembra está embarazada. La muestra puede ser una biopsia tumoral. La biopsia puede ser llevada a cabo, por ejemplo, por un proveedor de asistencia sanitaria, incluido un médico, médico auxiliar, enfermero, veterinario, dentista, quiropráctico, paramédico, dermatólogo, oncólogo, gastroenterólogo o cirujano.
[0209] En algunos casos, los materiales de ácido no nucleico pueden eliminarse del material de partida mediante tratamientos enzimáticos (como la digestión de proteasa).
[0210] En algunos casos, la sangre se puede recolectar en un aparato que contiene un quelante de magnesio que incluye, sin carácter limitativo, EDTA, y se almacena a 4 °C. Opcionalmente, se puede añadir un quelante de calcio que incluye, sin carácter limitativo, EGTA. En otro caso, se añade un inhibidor de la lisis celular a la sangre que incluye, sin carácter limitativo, formaldehído, derivados de formaldehído, formalina, glutaraldehído, derivados de glutaraldehído, un reticulante de proteína, un reticulante de ácido nucleico, un reticulante de proteína y ácido nucleico, reticulantes reactivos de amina primaria, reticulantes reactivos de sulfhidrilo, adición de sulfhidrilo o reducción de disulfuro, reticulantes reactivos de carbohidratos, reticulantes reactivos de carboxilo, reticulantes fotorreactivos y reticulantes escindibles.
[0211] En algunos casos, cuando el material extraído comprende ARN monocatenario, ARN bicatenario, o ADN-ARN híbrido, estas moléculas se pueden convertir en ADN bicatenario empleando técnicas conocidas en el campo. Por ejemplo, la transcriptasa inversa se puede emplear para sintetizar moléculas de ADN a partir de ARN. En algunos casos, la conversión de ARN en ADN puede requerir un paso de ligación previo, para ligar un fragmento de enlace al ARN, permitiendo así el uso de cebadores universales para iniciar la transcripción inversa. En otros casos, se puede emplear la cola de poli-A de una molécula de ARNm, por ejemplo, para iniciar la transcripción inversa. Seguido a la conversión de ADN, los métodos detallados en la presente memoria se pueden emplear, en algunos casos, además para capturar, seleccionar, marcar o aislar una secuencia deseada.
[0212] Las moléculas de ácido nucleico incluyen ácido desoxirribonucleico (ADN) y/o ácido ribonucleico (ARN). Las moléculas de ácido nucleico pueden ser sintéticas o derivadas de fuentes producidas de forma natural. En un modo de realización, las moléculas de ácido nucleico se aíslan a partir de una muestra biológica que contiene una variedad de otros componentes, como proteínas, lípidos y ácidos nucleicos sin plantilla. Las moléculas plantilla de ácido nucleico se pueden obtener a partir de cualquier material celular, obtenido de un animal, planta, bacteria, hongo o cualquier otro organismo celular. En modos de realización determinados, las moléculas de ácido nucleico se obtienen a partir de una sola célula. Las muestras biológicas para uso en la presente invención incluyen partículas o preparaciones virales. Las moléculas de ácido nucleico se pueden obtener directamente de un organismo o de una muestra biológica obtenida de un organismo, p. ej., de sangre, orina, líquido cefalorraquídeo, líquido seminal, saliva, esputo, heces y tejido. Cualquier espécimen de tejido o de fluido corporal se puede emplear como fuente de ácido nucleico para uso en la invención. Las moléculas de ácido nucleico también se pueden aislar de células cultivadas, como un cultivo celular primario o una línea celular. Las células o tejidos de los que se obtienen ácidos nucleicos plantilla pueden estar infectados con un virus u otro patógeno intracelular.
[0213] Una muestra también puede ser ARN total extraído de un espécimen biológico, una biblioteca de ADNc, o ADN viral o genómico. En modos de realización determinados, las moléculas de ácido nucleico están ligadas a otras moléculas diana como proteínas, enzimas, sustratos, anticuerpos, agentes aglutinantes, perlas, pequeñas moléculas, péptidos o cualquier otra molécula. En general, se puede extraer ácido nucleico de una muestra biológica mediante una variedad de técnicas como las descritas por Sambrook y Russell, Molecular Cloning: A Laboratory Manual, 3a Ed., Cold Spring Harbor, N.Y. (2001). Las moléculas de ácido nucleico pueden ser monocatenarias, bicatenarias o bicatenarias con regiones monocatenarias (por ejemplo, estructuras en horquilla).
[0214] Los métodos de extracción de ADN son conocidos en la técnica. Un protocolo de aislamiento clásico de ADN se basa en la extracción mediante disolventes orgánicos como una mezcla de fenol y cloroformo, seguida de la precipitación con etanol (J. Sambrook et al., Molecular Cloning: A Laboratory Manual, 1989, 2a Ed., Cold Spring Harbour Laboratory Press: New York, N.Y.). Otros métodos incluyen: precipitación de ADN por sales (P. Sunnucks et al., Genetics, 1996, 144: 747-756; S. M. Aljanabi et al., Nucl. Acids Res. 1997, 25: 4692-4693), extracción de ADN con sales de bromuro de trimetilamonio (S. Gustincich et al., BioTechniques, 1991, 11: 298-302) y extracción de ADN con tiocianato de guanidinio (J. B. W. Hammond et al., Biochemistry, 1996, 240: 298-300). Existe una variedad de kits disponibles comercialmente para la extracción de ADN de muestras biológicas (p. ej., BD Biosciences Clontech (Palo Alto, CA): Epicentre Technologies (Madison, WI); Gentra Systems, Inc. (Minneapolis, MN); MicroProbe Corp. (Bothell, WA); Organon Teknika (Durham, NC); y Qiagen Inc. (Valencia, CA)).
[0215] Los métodos de extracción de ARN también son conocidos en la técnica (p. ej., J. Sambrook et al., Molecular Cloning: A Laboratory Manual 1989, 211d Ed., Cold Spring Harbour Laboratory Press: New York) y también existen kits disponibles comercialmente para la extracción de ARN de fluidos corporales (p. ej., Ambion, Inc. (Austin, TX); Amersham Biosciences (Piscataway, n J); BD Biosciences Clontech (Palo Alto, CA); BioRad Laboratories (Hercules, CA); Dynal Biotech Inc. (Lake Success, NY); Epicentre Technologies (Madison, WI); Gentra Systems, Inc. (Minneapolis, MN); GIBCO BRL (Gaithersburg, MD); Invitrogen Life Technologies (Carlsbad, CA); MicroProbe Corp. (Bothell, WA); Organon Teknika (Durham, NC); Promega, Inc. (Madison, WI); y Qiagen Inc. (Valencia, CA)).
[0216] Una o más muestras pueden proceder de una o más fuentes. Una o más muestras pueden proceder de dos o más fuentes. Una o más muestras pueden proceder de uno o más sujetos. Una o más muestras pueden proceder de dos o más sujetos. Una o más muestras pueden proceder del mismo sujeto. Uno o más sujetos pueden pertenecer a la misma
especie. Uno o más sujetos pueden pertenecer a diferentes especies. El uno o más sujetos pueden estar sanos. El uno o más sujetos pueden padecer una enfermedad, un trastorno o una afección.
[0217] En algunos modos de realización, una muestra es un fluido, como sangre, saliva, linfa, orina, líquido cefalorraquídeo, líquido seminal, esputo, heces o tejidos homogeneizados.
[0218] Una muestra se puede tomar de un sujeto que padece una afección. En algunos modos de realización, el sujeto al que se le toma la muestra puede ser un paciente, por ejemplo, un paciente de cáncer o un paciente que se sospecha que padece cáncer. El sujeto puede ser un mamífero, p. ej., un ser humano, y puede ser macho o hembra. En algunos modos de realización, la hembra está embarazada. La muestra puede ser una biopsia tumoral. La biopsia puede ser llevada a cabo, por ejemplo, por un proveedor de asistencia sanitaria, incluido un médico, médico auxiliar, enfermero, veterinario, dentista, quiropráctico, paramédico, dermatólogo, oncólogo, gastroenterólogo o cirujano.
[0219] En algunos modos de realización, los polinucleótidos están ligados a otras moléculas diana como proteínas, enzimas, sustratos, anticuerpos, agentes aglutinantes, perlas, pequeñas moléculas, péptidos o cualquier otra molécula. En algunos modos de realización, los polinucleótidos no están ligados a un soporte sólido. Se pueden extraer ácidos nucleicos de una muestra biológica mediante una variedad de técnicas (Sambrook et al., Molecular Cloning: A Laboratory Manual, 3a Ed., Cold Spring Harbor, N.Y. (2001)).
[0220] En algunos modos de realización, las suspensiones celulares se pueden precalentar antes del análisis. En algunos modos de realización, las suspensiones celulares se calientan inmediatamente antes de la generación de la emulsión (descrita en la sección B.2 a continuación) hasta una temperatura y durante un periodo suficiente que aumente la actividad de la ADN polimerasa dentro de la célula, pero que minimice los efectos no deseados, como la degradación del ARN. Por consiguiente, las células se calientan para optimizar el rendimiento de los métodos proporcionados en la presente memoria. En algunos ejemplos, las células se calientan hasta aproximadamente de 30 °C a 70 °C, como 30 a 60 °C, de 25 a 60 °C, de 30 a 60 °C, de 40 a 60 °C, de 45 a 55 °C, durante un periodo de 1, 23, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 minutos. Tras calentar las células, la suspensión celular puede mantenerse a temperatura ambiente o colocarse en hielo durante 30 segundos hasta 4 horas, como 30 segundos, 45 segundos, 1 minuto, 2 minutos, 3 minutos, 4 minutos, 5 minutos, 6 minutos, 7 minutos, 8 minutos, 9 minutos, 10 minutos, 15 minutos, 20 minutos, 25 minutos, 30 minutos, 35 minutos, 40 minutos, 45 minutos, 1 hora, 1.5 horas, 2 horas, 2.5 horas, 3 horas, 3.5 horas o 4 horas antes de la formación de la emulsión.
[0221] Una pluralidad de muestras puede comprender al menos 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 o más muestras. La pluralidad de muestras puede comprender al menos alrededor de 2, 100, 200, 300, 400, 500, 600, 40, 50, 60, 700, 800, 900 o 1000 o más muestras. La pluralidad de muestras puede comprender al menos alrededor de 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000 muestras, 9000 o 10.000 muestras, o 100.000 muestras, o 1.000.000 o más muestras. La pluralidad de muestras puede comprender al menos alrededor de 10.000 muestras.
[0222] El uno o más polinucleótidos en una primera muestra pueden ser diferentes de uno o más polinucleótidos en una segunda muestra. El uno o más polinucleótidos en una primera muestra pueden ser diferentes de uno o más polinucleótidos en una pluralidad de muestras. Uno o más polinucleótidos en una muestra pueden comprender al menos alrededor del 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia. En algunos modos de realización, uno o más polinucleótidos de una muestra pueden diferir en menos de aproximadamente 100, 90, 80, 70, 60, 50, 40, 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 o 1 par de bases o nucleótidos. Una pluralidad de polinucleótidos en una 0 más muestras de la pluralidad de muestras puede comprender dos o más secuencias idénticas. Al menos alrededor del 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 %, 98 %, 99 % o 100 % del total de polinucleótidos en una o más de la pluralidad de muestras puede comprender la misma secuencia. Una pluralidad de polinucleótidos en una o más muestras de la pluralidad de muestras puede comprender al menos dos secuencias diferentes. Al menos alrededor del 5 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % del total de polinucleótidos en una o más de la pluralidad de muestras puede comprender al menos dos secuencias diferentes. En algunos modos de realización, uno o más polinucleótidos son variantes entre sí. Por ejemplo, uno o más polinucleótidos pueden contener polimorfismos de nucleótido único u otros tipos de mutaciones. En otro ejemplo, uno o más polinucleótidos son variantes de empalme.
[0223] Una primera muestra puede comprender una o más células y la segunda muestra puede comprender una o más células. La una o más células de la primera muestra pueden ser del mismo tipo celular, como la una o más células seleccionadas de la segunda muestra. La una o más células de la primera muestra pueden ser de un tipo celular diferente, como una o más células diferentes de una pluralidad de muestras.
[0224] La pluralidad de muestras se puede obtener simultáneamente. Una pluralidad de muestras se puede obtener al mismo tiempo. La pluralidad de muestras se puede obtener consecutivamente. Una pluralidad de muestras se puede obtener a lo largo de los años, p. ej., 100 años, 10 años, 5 años, 4 años, 3 años, 2 años o 1 año de obtención de una o más muestras diferentes. Se pueden obtener una o más muestras en alrededor de un año de obtención de una o más
muestras diferentes. Se pueden obtener una o más muestras a los 12 meses, 11 meses, 10 meses, 9 meses, 8 meses, 7 meses, 6 meses, 5 meses, 4 meses, 3 meses, 2 meses o 1 mes de obtención de una o más muestras diferentes. Se pueden obtener una o más muestras a los 30 días, 28 días, 26 días, 24 días, 21 días, 20 días, 18 días, 17 días, 16 días, 15 días, 14 días, 13 días, 12 días, 11 días, 10 días, 9 días, 8 días, 7 días, 6 días, 5 días, 4 días, 3 días, 2 días o 1 día de obtención de una o más muestras diferentes. Se pueden obtener una o más muestras a las 24 horas, 22 horas, 20 horas, 18 horas, 16 horas, 14 horas, 12 horas, 10 horas, 8 horas, 6 horas, 4 horas, 2 horas o 1 hora de obtención de una o más muestras diferentes. Se pueden obtener una o más muestras a los 60 segundos, 45 segundos, 30 segundos, 20 segundos, 10 segundos, 5 segundos, 2 segundos o 1 segundo de obtención de una o más muestras diferentes. Se pueden obtener una o más muestras en menos de un segundo de obtención de una o más muestras diferentes.
[0225] Los diferentes polinucleótidos de una muestra pueden estar presentes en concentraciones o cantidades diferentes (p. ej., diferente número de moléculas). Por ejemplo, la concentración o cantidad de un polinucleótido puede ser mayor que la concentración o cantidad de otro polinucleótido en la muestra. En algunos modos de realización, la concentración o cantidad de al menos un polinucleótido en la muestra es de al menos alrededor de 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más veces mayor que la concentración o cantidad de al menos un otro polinucleótido en la muestra. En otro ejemplo, la concentración o cantidad de un polinucleótido es menor que la concentración o cantidad de otro polinucleótido en la muestra. La concentración o cantidad de al menos un polinucleótido en la muestra puede ser de al menos alrededor de 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más veces menor que la concentración o cantidad de al menos un otro polinucleótido en la muestra.
[0226] En algunos modos de realización, dos o más muestras pueden contener cantidades o concentraciones diferentes de polinucleótidos. En algunos modos de realización, la concentración o cantidad de un polinucleótido en una muestra puede ser mayor que la concentración o cantidad del mismo polinucleótido en una muestra diferente. Por ejemplo, una muestra de sangre puede contener una cantidad más alta de un polinucleótido concreto que una muestra de orina. De forma alternativa, se puede dividir una sola muestra en dos o más submuestras. Las submuestras pueden contener cantidades y concentraciones diferentes del mismo polinucleótido. La concentración o cantidad de al menos un polinucleótido en una muestra puede ser de al menos alrededor de 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más veces mayor que la concentración o cantidad de al menos el mismo polinucleótido en otra muestra. De forma alternativa, la concentración o cantidad de un polinucleótido en una muestra puede ser menor que la concentración o cantidad del mismo polinucleótido en una muestra diferente. Por ejemplo, la concentración o cantidad de al menos un polinucleótido en una muestra puede ser de al menos alrededor de 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más veces menor que la concentración o cantidad del mismo polinucleótido en otra muestra.
2. Generación de gotículas y codificación con código de barras de célula única
[0227] Para la codificación con código de barras de célula única con un código de barras de recipiente y código de barras molecular, los recipientes, como emulsiones de agua en aceite, se pueden crear de manera que los recipientes resultantes contengan una célula o menos por recipiente. Los recipientes se pueden crear de manera que los recipientes resultantes también contengan 1 código de barras de recipiente por recipiente. Los recipientes se pueden crear de manera que los recipientes resultantes también contengan 1 polinucleótido con código de barras molecular por recipiente. Los recipientes se pueden crear de manera que los recipientes resultantes también contengan dos o más, o una pluralidad de polinucleótidos con código de barras molecular por recipiente. Las células/recipientes pueden someterse a un protocolo de codificación con código de barras simple de ARN o ADN como se describe en la presente memoria, y el código de barras de recipiente y uno o más códigos de barras moleculares de cada recipiente pueden fusionarse con una diana de interés, como un polinucleótido celular. En algunos modos de realización, los polinucleótidos con código de barras de recipiente que coinciden pueden fusionarse con componentes celulares presentes en el mismo recipiente que el uno o más polinucleótidos con código de barras molecular. A continuación de la secuenciación, se puede emplear la deconvolución del código de barras de recipiente y del código de barras molecular para identificar qué ARN (o ADN) se ha originado de qué célula. En algunos modos de realización, los recipientes, como emulsiones de agua en aceite, se pueden crear de manera que las emulsiones resultantes contengan 1 célula o más por emulsión. En algunos modos de realización, las emulsiones de agua en aceite se pueden crear de manera que las emulsiones resultantes contengan 1 polinucleótido con código de barras de recipiente y dos o más polinucleótidos con código de barras molecular por recipiente. En algunos modos de realización, los recipientes se pueden crear de manera que los recipientes resultantes contengan más de 1 polinucleótido con código de barras de recipiente y dos o más polinucleótidos con código de barras molecular por recipiente. En algunos modos de realización, un código de barras de recipiente y un código de barras molecular pueden introducirse en los recipientes cuando están en la solución. En algunos modos de realización, un código de barras del recipiente y un código de barras molecular pueden introducirse en los recipientes cuando no están fijados a un soporte sólido, como una perla. Entre los recipientes de ejemplo se incluyen un pocillo, una emulsión, una gotícula y una microcápsula.
[0228] En algunos aspectos, las células individuales pueden aislarse dentro de una emulsión, que puede actuar como un compartimento (p. ej., un recipiente). Se pueden lisar las células y codificar con código de barras los transcritos de las
células. Cada uno de los transcritos se puede fusionar con un código de barras molecular o un código de barras de recipiente, de manera que cuando se detectan dos o más transcritos de ARN con el mismo código de barras de recipiente, se puede determinar que se han originado de la misma célula de partida. Esto se puede aplicar a muchos tipos diferentes de secuencias. Una aplicación concreta puede ser vincular cadenas VH y VL o Va y Vp o Vy y V5 de las secuencias de TCR y anticuerpo.
[0229] Se pueden aislar una o más células individuales en una o más emulsiones en presencia de un código de barras de recipiente y códigos de barras moleculares, de manera que un recipiente, como una gotícula, de la una o más emulsiones puede contener un máximo de 1 célula o menos. Las células se pueden lisar químicamente con un tampón contenido en una emulsión o por medio de congelación-descongelación, liberando así los contenidos de una célula en una emulsión.
[0230] Los ARN de una célula individual se pueden transcribir de forma inversa a ADNc. Se puede realizar una reacción de transcripción inversa con una transcriptasa inversa que posea actividad de transferasa terminal sin plantilla que añada unos 3 residuos de citosina como se ha descrito anteriormente. Todos los tampones, enzimas y nucleótidos de transcripción inversa pueden estar presentes durante la formación de una emulsión. En algunos modos de realización, se puede generalizar un cebador (como un polinucleótido que comprende una secuencia de poli dT) para dirigirse a todo el ARNm. En algunos modos de realización, se puede emplear ADN. En algunos modos de realización, más de 2 ARN pueden ser diana.
[0231] En algunos modos de realización, un código de barras de recipiente se puede vincular a un ARN durante la transcripción inversa. En algunos modos de realización, un código de barras molecular se puede vincular a un ARN durante la transcripción inversa. En algunos modos de realización, un código de barras de recipiente y un código de barras molecular se pueden vincular a un ARN durante la transcripción inversa. La división de una muestra de una pluralidad de células en pequeños volúmenes de reacción, junto con el código de barras molecular y de recipiente de polinucleótidos de, o derivados de, una célula individual de la pluralidad de células puede permitir la secuenciación de alto rendimiento de un repertorio de secuencias, como secuencias de biomarcadores.
[0232] La división de una muestra de una pluralidad de células en pequeños volúmenes de reacción, o recipientes que contengan una o más células, junto con el código de barras molecular y de recipiente de polinucleótidos de, o derivados de, una célula individual de la pluralidad de células puede permitir la secuenciación de alto rendimiento de un repertorio de secuencias, como secuencias que representan un porcentaje del transcriptoma en un organismo. Por ejemplo, un repertorio de secuencias puede comprender una pluralidad de secuencias que representan al menos alrededor del 0.00001 %, 0.00005 %, 0.00010 %, 0.00050 %, 0.001 %, 0.005 %, 0.01 %, 0.05 %, 0.1 %, 0.5 %, 1 %, 2 %, 2.5 %, 3 %, 3.5 %, 4 %, 4.5 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 30 %, 35 %, 40 %, 45, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % o el 100 % del transcriptoma de un organismo.
[0233] La división de una muestra de células inmunitarias en pequeños volúmenes de reacción, o recipientes que contengan una o más células inmunitarias, junto con el código de barras molecular y de recipiente de polinucleótidos de, o derivados de, una célula individual inmunitaria de la pluralidad de células inmunitarias puede permitir la secuenciación de alto rendimiento de un repertorio de secuencias de cadena ligera y pesada. Estos métodos también pueden permitir el emparejamiento de las cadenas pesadas y ligeras tras la secuenciación en función de las secuencias con código de barras. La división de una muestra en pequeños volúmenes de reacción, tal como se describe en la presente memoria, también puede permitir el uso de cantidades reducidas de reactivos, reduciendo así el coste material del análisis.
[0234] En algunos casos, la reacción de transcripción inversa y/o la reacción de amplificación (p. ej., PCR) se llevan a cabo en gotículas, como en una PCR digital de gotícula. En aspectos determinados, la invención proporciona compartimentos fluídicos, o recipientes, para contener todo el material diana o una porción de este, En algunos modos de realización, un compartimento o recipiente es una gotícula. Si bien se hace referencia a «gotículas» a lo largo de la especificación, esos términos se utilizan indistintamente con compartimiento de fluido y partición de fluido a menos que se indique lo contrario. Un recipiente puede comprender un compartimento fluido o una partición fluida o consistir en estos. Salvo donde se indique lo contrario, se emplea «gotícula» por conveniencia y se puede emplear cualquier partición o compartimento fluido. Las gotículas, empleadas en la presente memoria, pueden incluir composiciones de emulsión (o mezclas de dos o más fluidos inmiscibles), como se describe en la patente de EE. UU. N.° 7,622,280. Las gotículas se pueden generar mediante dispositivos descritos en el documento WO/2010/036352. El término emulsión, como se emplea en la presente memoria, se puede referir a una mezcla de líquidos inmiscibles (como agua y aceite). Las emulsiones en fase oleosa y/o de agua en aceite permiten la compartimentación de mezclas de reacción con gotículas acuosas. Las emulsiones pueden comprender gotículas acuosas dentro de una fase oleosa continua. Las emulsiones proporcionadas en la presente memoria pueden ser emulsiones de aceite en agua, donde las gotículas son gotículas oleosas dentro de una fase acuosa continua. Las gotículas descritas en la presente están diseñadas para impedir que los compartimentos se mezclen, con cada compartimento protegiendo sus contenidos frente a la evaporación y/o la coalescencia con los contenidos de otros compartimentos.
[0235] Las mezclas o emulsiones descritas en la presente memoria pueden ser estables o inestables. Las emulsiones pueden ser relativamente estables y presentar coalescencia mínima. La coalescencia tiene lugar cuando se combinan
pequeñas gotículas para formar gotículas progresivamente más grandes. En algunos casos, menos del 0.00001 %, 0.00005 %, 0.00010 %, 0.00050 %, 0.001 %, 0.005 %, 0.01 %, 0.05 %, 0.1 %, 0.5 %, 1 %, 2 %, 2.5 %, 3 %, 3.5 %, 4 %, 4.5 %, 5 %, 6 %, 7 %, 8 %, 9 % o el 10 % de gotículas generadas a partir de un generador de gotículas se fusiona con otras gotículas. Las emulsiones también pueden presentar floculación limitada, un proceso por el que la fase dispersa sale de la suspensión en escamas.
[0236] Las gotículas se pueden generar con un diámetro medio de alrededor, menos de alrededor, o más de alrededor, o al menos alrededor de 0.001, 0.01, 0.05, 0.1, 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 100, 120, 130, 140, 150, 160, 180, 200, 300, 400 o 500 micras. Las gotículas pueden presentar un diámetro de alrededor de 0.001 a alrededor de 500, alrededor de 0.01 a alrededor de 500, alrededor de 0.1 a alrededor de 500, alrededor de 0.1 a alrededor de 100, alrededor de 0.01 a alrededor de 100, o alrededor de 1 a alrededor de 100 micras. Se conocen métodos microfluídicos para la producción de gotículas de emulsión que emplean un enfoque de flujo cruzado en microcanal o la agitación física por producir tanto emulsiones monodispersas como polidispersas. Las gotículas pueden ser recipientes o gotículas monodispersas. Las gotículas se pueden generar de manera que el tamaño de las gotículas no varíe en más o menos del 5 % del tamaño medio de las gotículas. En algunos casos, las gotículas se generan de manera que el tamaño de las gotículas no varíe en más o menos del 2% del tamaño medio de las gotículas. Un generador de gotículas puede generar una población de gotículas a partir de una sola muestra, donde ninguna de las gotículas varía de tamaño en más o menos de alrededor del 0.1 %, 0.5 %, 1 %, 1.5 %, 2 %, 2.5 %, 3 %, 3.5 %, 4 %, 4.5 %, 5 %, 5.5 %, 6 %, 6.5 %, 7 %, 7.5 %, 8 %, 8.5 %, 9 %, 9.5 % o el 10% del tamaño medio del total de la población de gotículas.
[0237] Se puede formar una gotícula o un recipiente al hacer fluir una fase oleosa a través de una muestra acuosa. La fase acuosa puede comprender una solución tamponada y reactivos para llevar a cabo una reacción de amplificación, que incluye células, nucleótidos, análogos de nucleótido, polinucleótidos con código de barras molecular, cebadores de polinucleótidos con código de barras de recipiente, ácidos nucleicos de plantilla, y enzimas, como una ADN polimerasa, una ARN polimerasa y/o una transcriptasa inversa. En algunos modos de realización, la fase acuosa puede contener un reactivo de lisis celular, como un reactivo químico de lisis celular.
[0238] La fase acuosa puede comprender una solución tamponada y reactivos para llevar a cabo una reacción de amplificación con o sin una superficie sólida, como una perla. La solución tamponada puede comprender alrededor, más de alrededor, o menos de alrededor de 1,5, 10, 15, 20, 30, 50, 100 o 200 mM de Tris. En algunos casos, la concentración de cloruro potásico puede ser alrededor, más de alrededor, o menos de alrededor de 10, 20, 30, 40, 50, 60, 80, 100, 200 mM. La solución tamponada puede comprender alrededor de 15 mM de Tris y 50 mM de KC1. Los nucleótidos pueden comprender moléculas de desoxirribonucleótido trifosfato, que incluyen dATP, dCTP, dGTP y dTTP, en concentraciones de alrededor, más de alrededor, o menos de alrededor de 50, 100, 200, 300, 400, 500, 600 o 700 pM cada una. En algunos casos, se añade dUTP en la fase acuosa hasta una concentración de alrededor, más de alrededor o menos de alrededor de 50, 100, 200, 300, 400, 500, 600 o 700, 800, 900 o 1000 pM. En algunos casos, el cloruro de magnesio o acetato de magnesio (se añade MgCl a la fase acuosa en una concentración de alrededor, más de alrededor, o menos de alrededor de 1.0, 2.0, 3.0, 4.0 o 5.0 mM) La concentración de MgCl puede ser de alrededor de 3.2 mM. En algunos casos, se emplea acetato de magnesio o magnesio. En algunos casos, se emplea sulfato de magnesio.
[0239] Puede emplearse un agente bloqueante no específico como BSA (por sus siglas en inglés) o gelatina de piel bovina, donde la gelatina o la BSA está presente en un rango de concentración de aproximadamente 0.1-0.9 % p/v. Otros agentes bloqueantes posibles pueden incluir betalactoglobulina, caseína, leche en polvo u otros agentes bloqueantes comunes. En algunos casos, las concentraciones preferidas de BSA y gelatina son de alrededor de 0.1 % p/v.
[0240] Los cebadores para amplificación dentro de la fase acuosa pueden presentar una concentración de alrededor, más de alrededor, o menos de alrededor de 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.2, 1.5, 1.7 o 2.0 pM. La concentración del cebador dentro de la fase acuosa puede ser de alrededor de 0.05 a alrededor de 2, de alrededor de 0.1 a alrededor de 1.0, de alrededor de 0.2 a alrededor de 1.0, de alrededor de 0.3 a alrededor de 1.0, de alrededor de 0.4 a alrededor de 1.0, o de alrededor de 0.5 a alrededor de 1.0 pM. La concentración de cebadores puede ser de alrededor de 0.5 mM. Los rangos del ácido nucleico objetivo en la PCR incluyen, sin carácter limitativo, entre aproximadamente 1 pg y aproximadamente 500 ng.
[0241] En algunos casos, la fase acuosa puede comprender también aditivos que incluyen, sin carácter limitativo, ácidos nucleicos de fondo no específicos/bloqueantes (por ejemplo, ADN de esperma de salmón), bioconservantes (p. ej., azida sódica), potenciadores de la PCR (p. ej., betaína, trehalosa, etc), e inhibidores (p. ej., inhibidores de la ARNsa). Otros aditivos pueden incluir, p. ej., dimetilsulfóxido (DMSO), glicerina, (mono)hidrato de betaína (W,W,W-trimetilglicina = [carboximetil] trimetilamonio), trehalosa, 7-Deaza-2'- desoxiguanosina trifosfato (dC7GTP o 7-deaza-2'-dGTP), BSA (albúmina de suero bovino), formamida (metanamida), cloruro de tetrametilamonio (TMAC), otros derivados del tetraalquilamonio (p. ej., cloruro de tetraetilamonio (TEA-C1) y cloruro de tetrapropilamonio (TPrACI), detergente no iónico (p. ej., Triton X-100, TWEEN® 20, Nonidet P-40 (NP-40)) o PREXCEL-Q. En algunos casos, la fase acuosa puede comprender 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 aditivos diferentes. En otros casos, la fase acuosa puede comprender al menos 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 aditivos diferentes.
[0242] En algunos casos, un copolímero en bloque de óxido de etileno u óxido de propileno no iónico se puede añadir a la fase acuosa en una concentración de alrededor del 0.1 %, 0.2 %, 0.3 %, 0.4 %, 0.5 %, 0.6 %, 0.7 %, 0.8 %, 0.9 % o 1.0 %. Entre los biosurfactantes comunes se incluyen surfactantes no iónicos como Pluronic F-68, Tetronics y Zonyl FSN. Se puede encontrar Pluronic F-68 presente en una concentración de alrededor de 0.5% p/v.
[0243] En algunos casos, el sulfato de magnesio se puede sustituir por cloruro de magnesio, en concentraciones similares. La solución tamponada se puede sustituir un amplio rango de tampones de PCR comerciales de diversos proveedores.
[0244] Se contemplan recipientes que presentan una interfaz similar a la de un líquido o similar a la de un sólido con una fase circundante. Por ejemplo, en algunos modos de realización, la emulsión se puede formular para producir gotículas altamente monodispersas, que sirvan de recipientes, que posean una película interfacial de tipo líquido que se pueda transformar por calentamiento en microcápsulas que posean una película interfacial de tipo sólido; estas microcápsulas se pueden comportar como biorreactores capaces de retener sus contenidos a través de un proceso de reacción como la amplificación por PCR. La transformación del recipiente a una forma de microcápsula puede tener lugar durante el calentamiento. Por ejemplo, esta transformación puede tener lugar a una temperatura superior a alrededor de 50 °C, 60 °C, 70 °C, 80 °C, 90 °C o 95 °C. En algunos casos, el calentamiento se produce por medio de un termociclador. Durante el proceso de calentamiento, se puede emplear un recubrimiento de aceite fluido o mineral para impedir la evaporación. El exceso de aceite en fase continua puede eliminarse o no antes del calentamiento. Las cápsulas biocompatibles pueden ser resistentes a la coalescencia y/o la floculación en una amplia gama de procesamientos térmicos y mecánicos. Tras la transformación, las cápsulas se pueden almacenar a alrededor, más de alrededor, o menos de alrededor de 3 °C, 4 °C, 5 °C, 6 °C, 7 °C, 8 °C, 9 °C 10 °C, 15 °C, 20 °C, 25 °C, 30 °C, 35 °C o 40 °C. Estos recipientes en forma de cápsula pueden ser útiles en aplicaciones biomédicas, como la encapsulación estable y digitalizada de macromoléculas, concretamente fluidos biológicos acuosos que contienen una mezcla de ácidos nucleicos o proteína, o los dos juntos; administración de fármacos y vacunas; bibliotecas biomoleculares; aplicaciones de imagen química y otras.
[0245] Las microcápsulas pueden contener uno o más polinucleótidos y pueden resistir la coalescencia, especialmente a altas temperaturas. Por consiguiente, las reacciones de amplificación por PCR pueden producirse a una densidad muy alta (p. ej., un número de reacciones por unidad de volumen). En algunos casos, pueden producirse más de 100.000, 500.000, 1.000.000, 1.500.000, 2.000,000, 2.500.000, 5000,000 o 100.000.000 reacciones diferentes por ml. En algunos casos, las reacciones se producen en un único pocillo, p. ej., un pocillo de una placa de microvaloración, sin que se produzcan mezclas entre los volúmenes de reacción. Las microcápsulas también pueden contener otros componentes necesarios para permitir que se produzca una transcripción inversa, una extensión del cebador y/o una reacción de PCR, p. ej., cebadores, sondas, dNTP, polimerasas del a Dn o ARN, etc. Estos recipientes en forma de cápsula presentan resistencia a la coalescencia y floculación en una amplia gama de procesamientos térmicos y mecánicos.
[0246] En algunos casos, el paso de amplificación se lleva a cabo al realizar la PCR digital, como la PCR digital basada en microfluidos o la PCR digital de gotícula.
[0247] En algunos modos de realización, los recipientes pueden ser gotículas. Las gotículas se pueden generar mediante sistemas o dispositivos microfluídicos. Como se emplea en la presente memoria, el prefijo «micro» (por ejemplo, como «microcanal» o «microfluídico», en general se refiere a elementos o artículos que presentan anchuras o diámetros de menos de alrededor de 1 mm, y menos de alrededor de 100 micras (micrómetros) en algunos casos. En algunos casos, el elemento o artículo incluye un canal a través del que puede fluir un fluido. Además, «microfluídico», tal como se emplea en la presente memoria, se refiere a un dispositivo, aparato o sistema que incluye al menos un canal de microescala.
[0248] Los sistemas y dispositivos microfluídicos se han descrito en diversos contextos, a menudo en el contexto del análisis miniaturizado de laboratorio (p. ej., clínico). Asimismo, se han descrito otros usos. Por ejemplo, las publicaciones de solicitudes de patente internacional N.° WO 01/89788; WO 2006/040551; WO 2006/040554; WO 2004/002627; WO 2008/063227; WO 2004/091763; WO 2005/021 151; WO 2006/096571; WO 2007/089541; WO 2007/081385 y WO 2008/063227.
[0249] Por lo general, una gotícula incluye una cantidad de un primer fluido de muestra en un segundo fluido portador. Se puede emplear cualquier técnica conocida en la técnica para la formación de gotículas con métodos de la invención. Un método de ejemplo consiste en hacer fluir una corriente del fluido de muestra que contiene el material diana (p. ej., la célula inmunitaria), de manera que se cruce con dos corrientes opuestas del fluido portador que fluye. El fluido portador es inmiscible con el fluido de muestra. El cruce del fluido de muestra con las dos corrientes opuestas del fluido portador que fluye resulta en la separación del fluido de muestra en microgotas de muestra individuales, que pueden servir como recipientes, que contienen el material diana.
[0250] El fluido portador puede ser cualquier fluido que es inmiscible con el fluido de muestra. Un fluido portador de ejemplo es aceite. En modos de realización determinados, el fluido portador incluye un surfactante.
[0251] El mismo método se puede aplicar para crear gotículas o recipientes individuales que contienen otros reactivos como reactivos para una reacción de amplificación como una reacción en cadena de la polimerasa (PCR) o una reacción
de amplificación no basada en PCR, como la amplificación de desplazamiento de cadena múltiple, u otros métodos conocidos por el experto en la técnica. Los reactivos adecuados para llevar a cabo las reacciones de amplificación basadas en PCR son conocidos por los expertos en la técnica e incluyen, sin carácter limitativo, polimerasas del ADN, cebadores directos e inversos, desoxirribonucleótido trifosfato (dNTP) y uno o más tampones.
[0252] En ciertos modos de realización, los compartimentos fluídicos se forman al proporcionar una primera partición de fluido (p. ej., una gotícula) que comprende un material diana (p. ej., una célula inmunitaria y/o un soporte sólido como una perla) y un segundo fluido (p. ej., como una corriente de fluido o dentro de gotículas). El primer y segundo fluido se funden para formar una gotícula, que puede servir como recipiente para los métodos proporcionados. La fusión se puede lograr mediante la aplicación de un campo eléctrico a los dos fluidos. En ciertos modos de realización, el segundo fluido contiene reactivos para conducir una reacción de amplificación, como una reacción en cadena de la polimerasa o una reacción de amplificación.
[0253] En las manipulaciones microfluídicas puede ser útil mayor estabilidad mecánica y el procesamiento fluídico de mayor cizallamiento (por ejemplo, en los capilares microfluídicos o a través de giros de 90 grados, como las válvulas, en la trayectoria fluídica). Los recipientes de gotícula o los recipientes de cápsula tratados pre y postérmicamente pueden ser mecánicamente estables a las manipulaciones con pipeta estándar y centrifugación.
3. Transcripción inversa
[0254] En algunos casos, los polinucleótidos diana se preparan a partir de ARN, como ARNm, por transcripción inversa. En algunos casos, los polinucleótidos diana se preparan a partir de ADN por extensión del cebador, como por medio de una polimerasa. Durante la reacción de transcripción inversa, el ARN celular, como el ARNm, se transcribe de forma inversa para producir ADN complementario (ADNc) y un código de barras molecular único se añade a cada ADNc para generar un polinucleótido monocatenario con código de barras complementario al transcrito celular. Estos polinucleótidos monocatenarios con código de barras se pueden generar para cada transcrito en el transcriptoma.
[0255] Los métodos descritos en la presente memoria se pueden emplear en la transcripción inversa-PCR acoplada (transcripción inversa-PCR). Por ejemplo, la transcripción inversa y la PCR se pueden llevar a cabo en dos pasos distintos. En primer lugar, se puede sintetizar una copia de ADNc del mismo ARNm de muestra mediante ya sea un cebador de polinucleótido dT, un cebador específico de secuencia, un cebador universal, una mezcla de cebadores de oligonucleótido hexámero aleatorio, o cualquier cebador descrito en la presente memoria. En algunos ejemplos, se puede generar una copia de ADNc del ARN por medio de una mezcla de cebadores, como una secuencia de cebador específico de secuencia y una mezcla de cebadores de oligonucleótido hexámero aleatorio, por ejemplo, para capturar moléculas de ARN diana específicas de una célula además de un conjunto de polinucleótidos que corresponden esencialmente al transcriptoma de la misma célula.
[0256] La transcripción inversa y PCR se puede llevar a cabo en una única reacción en recipiente cerrado. Por ejemplo, se pueden emplear una multitud de cebadores, uno o más cebadores para transcripción inversa y dos o más cebadores para PCR en el mismo recipiente cerrado. El/los cebador(es) para transcripción inversa pueden unirse al ARNm 3' a la posición del primer amplicón de PCR. En algunos modos de realización, las condiciones de la PCR pueden modificarse para restringir esencialmente la amplificación al primer adaptador, o al acervo de primeros adaptadores, utilizando cebadores específicos para el mismo, y limitar la amplificación del ADNc con código molecular mayor. Aunque no es imprescindible, el/los cebador(es) de transcripción inversa pueden incluir residuos de ARN o análogos modificados como bases de ARN 2'- O-metilo, que no formarán un sustrato para ARNsa H cuando se hibriden con el ARNm.
[0257] La temperatura para llevar a cabo la reacción de la transcripción inversa depende de la transcriptasa inversa que esté siendo empleada. En algunos casos, se emplea una transcriptasa inversa termoestable y la reacción de la transcripción inversa se lleva a cabo de alrededor de 37 °C a alrededor de 75 °C, de alrededor de 37 °C a alrededor de 50 °C, de alrededor de 37 °C a alrededor de 55 °C, de alrededor de 37 °C a alrededor de 60 °C, de alrededor de 55 °C a alrededor de 75 °C, de alrededor de 55 °C a alrededor de 60 °C, a alrededor de 37 °C o alrededor de 60 °C. En algunos casos, se emplea una transcriptasa inversa que transfiere 3 o más nucleótidos terminales sin plantilla a un extremo del producto transcrito.
[0258] Se pueden llevar a cabo una reacción de transcripción inversa y la reacción de PCR descritas en la presente memoria en varios formatos conocidos en la técnica, como en tubos, placas de microvaloración, dispositivos microfluídicos o, preferiblemente, gotículas.
[0259] Se puede llevar a cabo una reacción de transcripción inversa en volúmenes que van de 5 pL a 100 pL, o en volúmenes de reacción de 10 pL a 20 pL. En gotículas, los volúmenes de reacción pueden ir de 1 pL a 100 nL o de 10 pL a 1 nL. En algunos casos, la reacción de transcripción inversa se lleva a cabo en una gotícula que presenta un volumen que es alrededor o menos de 1 nL.
[0260] Los polinucleótidos diana, como el ARN, puede transcribirse de forma inversa a ADNc empleando uno o más cebadores de transcripción inversa. El uno o más cebadores de transcripción inversa pueden comprender una región
complementaria a una región del ARN, como una región constante (p. ej., una región constante de la cadena ligera o pesada o una cola de poli-A de ARNm). En algunos modos de realización, los cebadores de transcripción inversa pueden comprender un primer cebador de transcripción inversa con una región complementaria a una región constante de un primer ARN, y un segundo cebador de transcripción inversa con una región complementaria a una región constante de un segundo ARN. En algunos modos de realización, los cebadores de transcripción inversa pueden comprender un primer cebador de transcripción inversa con una región complementaria a una región constante de un primer ARN, y uno o más cebadores de transcripción inversa con una región complementaria a una región constante de uno o más ARN, respectivamente.
[0261] En algunos modos de realización, los cebadores de transcripción inversa pueden modificarse para minimizar la formación de objetos mediante la amplificación exponencial de los productos de cebador-dímero o cebador-cambio de plantilla en la reacción. En algunos modos de realización, los cebadores de transcripción inversa se modifican por la adición de una 2'-O-metilación de una o más bases del cebador. En algunos modos de realización, la una o más bases 2'-O-metiladas se sitúan cerca del centro de la secuencia de cebador. Estos cebadores modificados se suelen emplear en reacciones que contienen una ADN polimerasa que no pueden incorporar una base opuesta al residuo modificado con 2'O-metilo. Los cebadores modificados con 2'O-metilo se exponen en SEQ ID NO: 12-22).
[0262] En algunos modos de realización, los cebadores de transcripción inversa son una mezcla de oligonucleótidos hexámeros aleatorios. Estos cebadores pueden unirse al ARN en ubicaciones aleatorias, cebando así la reacción de transcripción inversa de secuencias desconocidas. En estos ejemplos, se emplean suministros suficientes de cebadores hexámeros aleatorios para ejecutar la transcripción inversa de esencialmente el transcriptoma de la célula. Por consiguiente, en estos modos de realización, se genera un conjunto de polinucleótidos, como un conjunto de polinucleótidos de ADNc que corresponde al transcriptoma de la célula.
[0263] En algunos modos de realización, los cebadores de transcripción inversa no comprenden un código de barras.
[0264] Los cebadores de transcripción inversa pueden comprender, además, una región que no es complementaria a una región del ARN. En algunos modos de realización, la región que no es complementaria a una región del ARN está 5' a una región de los cebadores que es complementaria al ARN. En algunos modos de realización, la región que no es complementaria a una región del ARN está 3' a una región de los cebadores que es complementaria al ARN. En algunos modos de realización, la región que no es complementaria a una región del ARN es una región saliente 5'. En algunos modos de realización, la región que no es complementaria a una región del ARN comprende un sitio de cebado para amplificación y una reacción de secuenciación, como un adaptador. Al emplear el uno o más cebadores descritos en la presente, las moléculas de ARN se transcriben de forma inversa empleando reactivos adecuados conocidos en la técnica.
[0265] En modos de realización concretos, una transcriptasa inversa puede comprender una actividad de transferasa terminal sin plantilla. Cuando una transcriptasa inversa que comprende actividad de transferasa terminal sin plantilla alcanza el final de una plantilla, puede añadir tres o más residuos sin plantilla, como tres o más residuos de citosina sin plantilla. En algunos modos de realización, la transcriptasa inversa Superscript II se emplea para este fin. En algunos modos de realización, la transcriptasa inversa Maxima™ se emplea para este fin. En algunos modos de realización, la transcriptasa inversa Protoscript II™ se emplea para este fin. En algunos modos de realización, la transcriptasa inversa del virus de la leucemia murina de Maloney (MMLV-RT) se emplea para este fin. En algunos modos de realización, la transcriptasa inversa HighScriber™ se emplea para este fin. En algunos modos de realización, la desoxinucleotidil transferasa terminal se emplea para este fin. En algunos modos de realización, la transcriptasa inversa del virus de la mieloblastosis aviar (AMV) se emplea para este fin. Se puede emplear cualquier transcriptasa inversa capaz de transcribir ARN que presenta actividad de transferasa terminal sin plantilla. Se puede emplear cualquier polimerasa inversa capaz de transcribir ARN que presenta actividad de transferasa terminal sin plantilla. Se puede emplear cualquier polimerasa inversa capaz de transcribir ADN que presenta actividad de transferasa terminal sin plantilla.
[0266] Las reacciones de transcripción inversa, como las descritas anteriormente, se pueden llevar a cabo en presencia de un polinucleótido de marcaje 3'. Un polinucleótido de marcaje 3' puede ser un polinucleótido empleado para la adición de ácidos nucleicos a un extremo 3' de un polinucleótido diana, como un ADNc. Un polinucleótido de marcaje 3' puede ser un polinucleótido empleado como una plantilla para la adición de ácidos nucleicos a un extremo 3' de un polin ucleótido diana, como un ADNc. Un polinucleótido de marcaje 3' puede ser un polinucleótido que se hibrida a un extremo 3' de un polinucleótido diana, como un ADNc. Un polinucleótido de marcaje 3' puede ser un polinucleótido que contiene una región 3', como una región terminal 3', que se hibrida a un extremo 3' de un polinucleótido diana, como un ADNc. Por ejemplo, un polinucleótido de marcaje 3' puede comprender un segmento, como un segmento que se alinea a tres o más residuos sin plantilla. En algunos modos de realización, un polinucleótido de marcaje 3' es un polinucleótido con código de barras molecular. En algunos modos de realización, un polinucleótido de marcaje 3' puede comprender un código de barras molecular. En algunos modos de realización, un polinucleótido de marcaje 3' puede comprender residuos de riboguanosina 3' o análogos de estos en el extremo 3' (rGrGrG) (bases de ARN) que son complementarios a una cadena, o están alineados con ella, producida por la enzima de transcripción inversa. En algunos modos de realización, se pueden emplear tres o más residuos de guanina en lugar de riboguanosina (nucleótido de ADN en lugar de nucleótido de ARN). En algunos modos de realización, un polinucleótido de marcaje 3' puede comprender 1 o 2 residuos de riboguanosina en
el extremo 3' y un residuo de riboguanosina o un análogo de esta en el extremo 3' (rGrGrG) que son complementarios a una cadena, o están alineados con ella, producida por la enzima de transcripción inversa.
[0267] T ras la alineación de un polinucleótido de marcaje 3' a una CCC de la cadena de ADNc, una transcriptasa inversa puede continuar extendiendo el ADNc en el polinucleótido de marcaje, fijando así un código de barras molecular o un complemento de este a una población diana de polinucleótidos, como ADNc, en la reacción. Por ejemplo, el polinucleótido de marcaje 3' puede ser un polinucleótido que contiene una región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender una región que no es complementaria al polinucleótido diana, como un ADNc. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender un código de barras molecular. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender una región complementaria a un polinucleótido con código de barras de recipiente o complemento de este. En otros experimentos, el cambio de plantilla se puede llevar a cabo en reacciones separadas. Por ejemplo, se puede añadir un polinucleótido de marcaje 3' tras la reacción de la transcripción inversa, y las enzimas como una transcriptasa o polimerasa inversa se pueden emplear para extenderse a un polinucleótido de marcaje. Debido a que un polinucleótido de marcaje puede albergar un código de barras molecular único redundante en cada molécula en un recipiente, cada ADNc en un recipiente puede marcarse de forma unívoca con un código de barras molecular. En algunos modos de realización, el cambio de plantilla se puede realizar al mismo tiempo que se lleva a cabo la reacción de la transcripción inversa.
[0268] Una reacción de transcripción inversa se puede llevar a cabo en presencia de un polinucleótido de marcaje 3'. Un polinucleótido de marcaje 3' puede comprender un segmento P7 que se puede emplear para alinear un cebador de secuenciación. Un polinucleótido de marcaje 3' puede comprender un código de barras de recipiente o un código de barras molecular. Un polinucleótido de marcaje 3' puede comprender residuos de riboguanosina en un extremo 3' (rGrGrG) (bases de ARN) que pueden ser complementarios a una cadena, o están alineados con ella, producida por la enzima de transcripción inversa. Por consiguiente, un código de barras de recipiente y un código de barras molecular se pueden añadir a un extremo terminal de un ADNc en esta misma emulsión por medio de las enzimas de transcripción inversa. En algunos modos de realización, se pueden emplear residuos de guanina en lugar de residuos de riboguanosina (nucleótidos de ADN en lugar de nucleótidos de ARN). T ras la alineación de un polinucleótido de marcaje 3' a una CCC de una cadena de ADNc, una transcriptasa inversa continúa extendiendo un ADNc en un polinucleótido de marcaje, creando así una etiqueta código de barras molecular para todos los ADNc en la reacción. T ras la alineación de un polinucleótido de marcaje 3' a una región de un ADNc con código de barras molecular, una transcriptasa o polimerasa inversa continúa extendiendo un ADNc con código de barras molecular en otro polinucleótido de marcaje 3', creando así una etiqueta código de barras de recipiente para todos los ADNc en la reacción.
[0269] En algunos modos de realización, el cambio de plantilla puede llevarse a cabo en una reacción diferente en lugar de llevarse a cabo al mismo tiempo que la reacción de transcripción inversa. En algunos modos de realización, se puede añadir un polinucleótido de marcaje 3' tras una reacción de la transcripción inversa, y las enzimas como una transcriptasa 0 polimerasa inversa se pueden emplear para extenderse al polinucleótido de marcaje de manera similar. Debido a que un polinucleótido de marcaje 3' puede albergar un código de barras molecular único redundante en cada molécula individual, cada ADNc puede marcarse de forma unívoca con un código de barras molecular. Debido a que un polinucleótido de marcaje 3' puede albergar un mismo código de barras de recipiente redundante en cada molécula individual de un solo recipiente, cada ADNc puede marcarse con un código de barras de recipiente único para el recipiente.
[0270] En algunos modos de realización, una molécula de cambio de plantilla, como un oligonucleótido de cambio de plantilla que contiene un código de barras molecular (p. ej., un código de barras molecular) puede incorporar bases modificadas para minimizar la formación del objeto. En algunos ejemplos, un oligonucleótido de cambio de plantilla puede contener 2'deoxi uridina, que se puede transcribir de forma inversa, pero que la ADN polimerasa no puede copiar. En algunos modos de realización, la riboguanosina se puede incorporar en el oligonucleótido de cambio de plantilla. En algunos modos de realización, el oligonucleótido de cambio de plantilla puede modificarse en el extremo 3' para impedir la extensión por medio de transcriptasa inversa o ADN polimerasa. Estas modificaciones incluyen la modificación 3'deoxi, 3'fosfato, 3'amino y 3'alquilo para llevar a cabo el bloqueo de la extensión del cebador.
4. Reacción en cadena de la polimerasa (PCR)
[0271] Tras llevar a cabo las reacciones de transcripción inversa de las moléculas del ARN, las moléculas de ADNc con código de barras único resultantes pueden codificarse con código de barras de forma simultánea con un código de barras de recipiente y amplificarse por medio de una o más reacciones de PCR para producir uno o más amplicones. En algunos ejemplos, la PCR se emplea para generar la cadena de ADNc con código de barras doble que contiene la secuencia de codificación que corresponde a la secuencia de transcrito de ARNm y es complementaria a la cadena de ADNc generada durante la reacción de transcriptasa inversa. Los diseños de enzimas y de cebador para PCR son conocidos y en la presente memoria se describen ejemplos no limitativos de estos reactivos. Cualquiera de estos reactivos se puede seleccionar y emplear para la PCR en los métodos proporcionados.
[0272] En algunos casos, una reacción de PCR se da en una gotícula que presenta un volumen de reacción que va de 1 pL a 100 nL, preferiblemente de 10 pL a 1 nL. En algunos casos, la reacción de PCR se lleva a cabo en una gotícula
que presenta un volumen que es alrededor o menos de 1 nL. En algunos casos, una reacción de transcripción inversa y una reacción de PCR se llevan a cabo en la misma gotícula que presenta un volumen de reacción que va de 1 pL a 100 nL o de 10 pL a 1 nL. En algunos casos, la reacción de transcripción inversa y la reacción de PCR se llevan a cabo en una gotícula que presenta un volumen que es alrededor o menos de 1 nL o un volumen que es alrededor o menos de 1 nL. En algunos casos, una reacción de transcripción inversa y una reacción de PCR se llevan a cabo en una gotícula diferente. En algunos casos, una reacción de transcripción inversa y una reacción de PCR llevan a cabo en una pluralidad de gotículas, cada una con un volumen de reacción que va de 1 pL a 100 nL o de 10 pL a 1 nL. En algunos casos, la reacción de transcripción inversa y la reacción de PCR se llevan a cabo en una pluralidad de gotículas, cada una con un volumen que es alrededor o menos de 1 nL.
[0273] En algunos casos, una primera reacción de PCR se da en una primera gotícula que presenta un volumen de reacción que va de 1 pL a 100 nL, preferiblemente de 10 pL a 1 nL y una segunda reacción de PCR se da en una segunda gotícula que presenta un volumen de reacción que va de 1 pL a 100 nL, preferiblemente de 10 pL a 1 nL. En algunos casos, una primera reacción de PCR se da en una primera gotícula con un volumen que es alrededor o menos de 1 nL y una segunda reacción de PCR se da en una segunda gotícula que presenta un volumen que es alrededor o menos de 1 nL.
[0274] En algunos casos, una primera reacción de PCR y una segunda reacción de PCR se llevan a cabo en una pluralidad de gotículas, cada una con un volumen de reacción que va de 1 pL a 100 nL o de 10 pL a 1 nL. En algunos casos, una primera reacción de PCR y una segunda reacción de PCR se llevan a cabo en una pluralidad de gotículas, cada una con un volumen que es alrededor o menos de 1 nL.
[0275] En algunos modos de realización de los métodos proporcionados en la presente memoria, las condiciones de las reacciones se pueden modificar para provocar la amplificación de las secuencias seleccionadas y minimizar la amplificación de otras secuencias. Estas modificaciones pueden incluir alterar la temperatura, como la temperatura de fusión durante el termociclado de PCR. Por ejemplo, los ciclos «fríos» de PCR se pueden emplear para amplificar selectivamente oligonucleótidos más cortos. Los ciclos «fríos» de PCR se diferencian de los ciclos «calientes» de PCR en su temperatura de desnaturalización. Los ciclos «fríos» de PCR pueden provocar desnaturalización a una temperatura más baja para amplificar, preferiblemente, secuencias más cortas que son más fáciles de desnaturalizar que secuencias monocatenarias más largas. Por consiguiente, los ciclos «fríos» de PCR se emplean para amplificar secuencias más cortas, mientras que limitan la amplificación de secuencias más largas. En algunos ejemplos, se emplea una combinación de ciclos «fríos» y de «ciclos calientes» para generar amplicones deseados.
[0276] En algunos modos de realización, la duración de los pasos de desnaturalización, cebado y/o elongación de la PCR se pueden modificar para amplificar, selectiva o preferiblemente, secuencias concretas en el volumen de reacción. En algunos ejemplos, los cebadores empleados para la amplificación por PCR se pueden seleccionar o modificar para reducir o aumentar la amplificación por PCR en condiciones concretas. En algunos ejemplos, se pueden añadir grupos accesorios lábiles al calor al extremo 3' de la mayoría de las bases por medio de enlaces fofotriéster para dejar los cebadores de oligonucleótido inactivos a bajas temperaturas, pero activos una vez expuestos a temperaturas más cálidas. En algunos ejemplos, los oligonucleótidos, vinculados a un grupo accesorio lábil al calor en el extremo 3' se emplean en los métodos proporcionados, de manera que los oligonucleótidos son incapaces de la extensión del cebador a temperaturas más bajas, como las temperaturas a las que las reacciones de transcriptasa inversa ocurren, pero quedan activos con la exposición a una temperatura más alta, como antes o durante la PCR.
[0277] Tras llevar a cabo las reacciones de transcripción inversa de las moléculas de ARN o la extensión del cebador de las moléculas genómicas, se amplía el oligonucleótido contenedor del código de barras de recipiente mediante la reacción en cadena de la polimerasa para generar múltiples copias para anexarse a polinucleótidos con código de barras molecular. En algunos ejemplos, los oligonucleótidos contenedores del código de barras de recipiente se amplifican mediante cebadores que han sido modificados por la adición de un grupo accesorio lábil al calor en el extremo 3' para impedir la extensión del cebador durante la reacción de la transcriptasa inversa, pero que permiten la extensión del cebador y la amplificación posterior durante la PCR. En algunos modos de realización, la amplificación del oligonucleótido contenedor del código de barras de recipiente se llevó a cabo mediante termociclado «frío» tal como se describe en la presente memoria.
[0278] Tras llevar a cabo las reacciones de transcripción inversa de las moléculas del ARN, las moléculas de ADNc resultantes pueden codificarse con un código de barras molecular y un código de barras de recipiente y amplificarse por medio de una o más reacciones de PCR, como una primera y/o segunda reacción de PCR. La primera y/o segunda reacción de PCR puede utilizar un par de cebadores o una pluralidad de primeros pares. La primera y/o segunda reacción de PCR puede utilizar una pluralidad de cebadores directos/inversos y un cebador inverso. La primera y/o segunda reacción de PCR puede utilizar una pluralidad de cebadores directos/inversos y un cebador directo. Un primer y/o segundo cebador de una pluralidad de cebadores directos/inversos puede ser un cebador directo/inverso que contiene una región complementaria a las moléculas de ADNc o moléculas de ADNc con código de barras. Un primer y/o segundo cebador de una pluralidad de cebadores directos/inversos puede ser un cebador directo/inverso que contiene una región complementaria a las moléculas de ADNc con código de barras.
[0279] En algunos modos de realización, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos en la pluralidad de cebadores directos/inversos comprende una región complementaria a una o más regiones en dirección 5' o en dirección 3' a un segmento V de los ADNc o ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región en dirección 5' o dirección 3' a un segmento V de los ADNc o ADNc con código de barras y otro u otros cebadores directos/inversos que comprenden una región complementaria a la una o más regiones en dirección 5' o en dirección 3' a un segmento V de los ADNc o ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un segmento V de los ADNc o ADNc con código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un segmento V de los ADNc o ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un segmento V de los ADNc o ADNc con código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un segmento V de los ADNc o ADNc con código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región en dirección 5' o dirección 3' a un segmento V de los ADNc o ADNc con código de barras, etc. Los cebadores en la pluralidad de cebadores directos/inversos se pueden emplear para alinearse a todas las regiones en dirección 5' o en dirección 3' posibles de todos los segmentos V expresados por las células, como las células B o células T inmunitarias, en la muestra.
[0280] En algunos modos de realización, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos en la pluralidad de cebadores directos/inversos comprende una región complementaria a una o más regiones en dirección 5' o en dirección 3' al segmento C de los ADNc o ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región en dirección 5' o dirección 3' a un segmento C de los ADNc o ADNc con código de barras y otro u otros cebadores directos/inversos que comprenden una región complementaria a la una o más regiones en dirección 5' o en dirección 3' a un segmento C de los ADNc o ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un segmento C de los ADNc o ADNc con código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un segmento C de los ADNc o ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un segmento C de los ADNc o ADNc con código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un segmento C de los ADNc o ADNc con código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región en dirección 5' o dirección 3' a un segmento C de los ADNc o ADNc con código de barras, etc. Los cebadores en la pluralidad de cebadores directos/inversos se pueden emplear para alinearse a todas las regiones en dirección 5' o en dirección 3' posibles de todos los segmentos C expresados por las células, como las células B o células T inmunitarias, en la muestra.
[0281] En algunos modos de realización, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos en la pluralidad de cebadores directos/inversos comprende una región complementaria a una o más regiones en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras y otro u otros cebadores directos/inversos que comprenden una región complementaria a la una o más regiones en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región en dirección 5' o dirección 3' a un código de barras molecular de los ADNc con código de barras, etc. La pluralidad de cebadores directos/inversos se pueden emplear para alinearse a todas las regiones en dirección 5' o dirección 3' posibles de todos los códigos de barras moleculares expresados por las células, como las células B o células T inmunitarias, en la muestra.
[0282] En algunos modos de realización, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos en la pluralidad de cebadores
directos/inversos comprende una región complementaria a una o más regiones en dirección 5' o dirección 3' a un código de barras de recipiente del ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región en dirección 5' o dirección 3' a un código de barras de recipiente de los ADNc con código de barras y otro u otros cebadores directos/inversos que comprenden una región complementaria a la una o más regiones en dirección 5' o dirección 3' a un código de barras de recipiente de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un código de barras de recipiente de los ADNc con código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un código de barras de recipiente de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región en dirección 5' o dirección 3' a un código de barras de recipiente de los ADNc con código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región en dirección 5' o dirección 3' a un código de barras de recipiente de los ADNc con código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región en dirección 5' o dirección 3' a un código de barras de recipiente de los ADNc con código de barras, etc. Los cebadores de la pluralidad de cebadores directos/inversos se pueden emplear para alinearse a todas las regiones en dirección 5' o dirección 3' posibles de todos los códigos de barras de recipiente expresados por las células, como las células B o células T inmunitarias, en la muestra.
[0283] Los cebadores directos/inversos en la pluralidad de cebadores directos/inversos además comprenden una región que no es complementaria a una región del ARN. En algunos modos de realización, la región que no es complementaria a una región del ARN está 5' a una región de los cebadores que es complementaria al ARN (esto es, regiones en dirección 5' o dirección 3' de un segmento V). En algunos modos de realización, la región que no es complementaria a una región del ARN está 3' a una región de los cebadores directos/inversos que es complementaria al ARN. En algunos modos de realización, la región que no es complementaria a una región del ARN es una región saliente 5'. En algunos modos de realización, la región que no es complementaria a una región del ARN comprende un sitio de cebado para amplificación y/o una segunda reacción de secuenciación. En algunos modos de realización, la región que no es complementaria a una región del ARN comprende un sitio de cebado para amplificación y/o una tercera reacción de secuenciación. En algunos modos de realización, la región que no es complementaria a una región del ARN comprende un sitio de cebado para una segunda y una tercera reacción de secuenciación. En algunos modos de realización, la secuencia del sitio de cebado para la segunda y la tercera reacción de secuenciación son la misma. Al emplear el uno o más cebadores directos/inversos y un cebador inverso como se describe en la presente memoria, las moléculas de ADNc se amplifican empleando reactivos adecuados conocidos en la técnica. En algunos modos de realización, una región es complementaria a una región del ARN, como la región constante o una cola de poli-A de ARNm.
5. Códigos de barras
[0284] Un código de barras puede ser un código de barras molecular o un código de barras de recipiente. En algunos modos de realización, cada código de barras, como un código de barras molecular o un código de barras de recipiente, puede presentar una longitud dentro de un rango de 2 a 36 nucleótidos, 4 a 36 nucleótidos, o de 6 a 30 nucleótidos, o de 8 a 20 nucleótidos, 2 a 20 nucleótidos, 4 a 20 nucleótidos, o de 6 a 20 nucleótidos. En aspectos determinados, las temperaturas de fusión de códigos de barras en un conjunto se encuentran dentro de 10 °C entre sí, dentro de 5 °C entre sí, o dentro de 2 °C entre sí. En aspectos determinados, las temperaturas de fusión de códigos de barras en un conjunto no se encuentran dentro de 10 °C entre sí, dentro de 5 °C entre sí, o dentro de 2 °C entre sí. En otros aspectos, los códigos de barras son miembros de un conjunto de hibridación cruzada mínima. Por ejemplo, la secuencia de nucleótido de cada miembro de dicho conjunto puede ser suficientemente diferente de la de cualquier otro miembro del conjunto como para que ningún miembro pueda formar un dúplex estable con el complemento de cualquier otro miembro en condiciones de hibridación estrictas. En algunos modos de realización, la secuencia de nucleótido de cada miembro de un conjunto de hibridación cruzada mínima se diferencia de las de cualquier otro miembro en al menos dos nucleótidos. Se describen tecnologías de códigos de barras en Winzeler et al. (1999) Science 285:901; Brenner (2000) Genome Biol.
1:1 Kumar et al. (2001) Nature Rev. 2:302; Giaever et al. (2004) Proc. Natl. Acad. Sci. EE. UU. 101:793; Eason et al. (2004) Proc. Natl. Acad. Sci. EE. UU. 101:1 1046; y Brenner (2004) Genome Biol. 5:240.
[0285] Tal como se emplea en la presente memoria, un código de barras molecular comprende información que es única para una molécula única de una célula única o de un recipiente único, o dos o más moléculas de una pluralidad o biblioteca de moléculas de dos o más células únicas o de dos o más recipientes únicos. Tal como se emplea en la presente memoria, un código de barras de recipiente comprende información que es única para los polinucleótidos de una célula única o de un recipiente único, comparados con los polinucleótidos de una célula única diferente o de un recipiente único diferente. En algunos modos de realización, la información única comprende una secuencia única de nucleótidos. Por ejemplo, la secuencia del código de barras molecular o un código de barras de recipiente puede determinarse al determinar la identidad y el orden de la secuencia única de nucleótidos y aleatoria que comprende el código de barras molecular o un código de barras de recipiente. En algunos modos de realización, el primer adaptador incluye un código de barras de recipiente.
[0286] En algunos modos de realización, la información única no se puede emplear para identificar la secuencia de un polinucleótido diana. Por ejemplo, un código de barras molecular puede fijarse a un polinucleótido diana, pero el código de barras molecular no se puede emplear para determinar el polinucleótido diana al que está fijado. En algunos modos de realización, la información única no es una secuencia conocida vinculada a la identidad de la secuencia de un polinucleótido diana. Por ejemplo, un código de barras de recipiente puede fijarse a uno o más polinucleótidos diana, pero el código de barras de recipiente no se puede emplear para determinar a cuál del uno o más polinucleótidos diana está fijado. En algunos modos de realización, la información única comprende una secuencia aleatoria de nucleótidos. En algunos modos de realización, la información única comprende una o más secuencias únicas de nucleótidos en un polinucleótido. En algunos modos de realización, la información única comprende una secuencia redundante de nucleótidos o un código de barras redundante. Un código de barras redundante puede comprender una composición o secuencia de base de nucleótido variable. Por ejemplo, un código de barras redundante puede ser una secuencia aleatoria. En algunos modos de realización, una secuencia complemento de un código de barras molecular o un código de barras de recipiente es también una secuencia de código de barras molecular o código de barras de recipiente.
[0287] Un código de barras molecular o un código de barras de recipiente puede comprender cualquier longitud de nucleótidos. Por ejemplo, un código de barras molecular o un código de barras de recipiente puede comprender al menos alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos. Por ejemplo, un código de barras molecular o un código de barras de recipiente puede comprender como mucho alrededor de 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos. En algunos modos de realización, un código de barras molecular o un código de barras de recipiente presenta una longitud de nucleótidos concreta. Por ejemplo, un código de barras molecular o un código de barras de recipiente puede presentar alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos en longitud.
[0288] En algunos modos de realización, cada código de barras molecular o código de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente presenta al menos alrededor de 2 nucleótidos. Por ejemplo, cada código de barras molecular o un código de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente puede presentar al menos alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos en longitud. En algunos modos de realización, cada código de barras molecular o código de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente presenta como mucho alrededor de 1000 nucleótidos. Por ejemplo, cada código de barras molecular o un código de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente puede presentar como mucho alrededor de 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos en longitud. En algunos modos de realización, cada código de barras molecular o código de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente presenta la misma longitud de nucleótidos. Por ejemplo, cada código de barras molecular o un código de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente puede presentar 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos en longitud. En algunos modos de realización, uno o más códigos de barras moleculares o códigos de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente presenta una longitud diferente de nucleótidos. Por ejemplo, uno o más primeros códigos de barras moleculares o códigos de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente puede presentar alrededor, o al menos alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos y uno o más segundos códigos de barras moleculares o códigos de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente pueden presentar alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos, donde el número de nucleótidos del uno o más primeros códigos de barras moleculares o códigos de barras de recipiente es diferente que el uno o más segundos códigos de barras moleculares o códigos de barras de recipiente.
[0289] El número de códigos de barras moleculares puede ser superior al número total de moléculas que deben marcarse en una pluralidad de recipientes. El número de códigos de barras de recipiente puede ser superior al número total de moléculas que deben marcarse en una pluralidad de recipientes. Por ejemplo, el número de códigos de barras moleculares o códigos de barras de recipiente puede ser al menos alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 o 100 veces mayor que el número total de moléculas que deben marcarse en una pluralidad de recipientes.
[0290] El número de códigos de barras moleculares diferentes puede ser superior al número total de moléculas que deben marcarse en una pluralidad de recipientes. En algunos modos de realización, el número de códigos de barras
moleculares diferentes es al menos alrededor de 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 o 100 veces mayor que el número total de moléculas que deben marcarse en una pluralidad de recipientes.
[0291] El número de códigos de barras moleculares diferentes en un único recipiente puede ser superior al número de moléculas diferentes que deben marcarse en el recipiente único. En algunos modos de realización, el número de códigos de barras moleculares diferentes en un único recipiente es al menos alrededor de 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 o 100 veces mayor que el número de moléculas diferentes que deben marcarse en un único recipiente.
[0292] El número de códigos de barras de recipiente diferentes puede ser inferior al número total de moléculas que deben marcarse en una pluralidad de recipientes. En algunos modos de realización, el número de códigos de barras de recipiente diferentes es al menos alrededor de 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 o 100 veces inferior que el número total de moléculas que deben marcarse en una pluralidad de recipientes.
[0293] El número de moléculas de producto amplificado de un polinucleótido con código de barras de recipiente en un único recipiente puede ser superior al número de moléculas diferentes que deben marcarse en el recipiente único. En algunos modos de realización, el número de moléculas de producto amplificado de un polinucleótido con código de barras de recipiente en un único recipiente es al menos alrededor de 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 o 100 veces mayor que el número de moléculas diferentes que deben marcarse en un único recipiente.
[0294] El número de moléculas de polinucleótido con código de barras de recipiente en un único recipiente puede ser inferior al número de moléculas diferentes que deben marcarse en el recipiente único. En algunos modos de realización, el número de moléculas de polinucleótido con código de barras de recipiente en un único recipiente es al menos alrededor de 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 o 100 veces inferior al número de moléculas diferentes que deben marcarse en el recipiente único.
[0295] El número de moléculas de polinucleótido con código de barras de recipiente en un único recipiente puede ser de una molécula. El número de moléculas de polinucleótido con código de barras de recipiente sin amplificar en un único recipiente puede ser de una molécula.
[0296] En algunos modos de realización, al menos alrededor del 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 % de los códigos de barras moleculares diferentes pueden presentar la misma concentración. En algunos modos de realización, al menos alrededor del 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 % de los códigos de barras de recipiente diferentes pueden presentar la misma concentración.
[0297] En algunos modos de realización, al menos alrededor del 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 % de los códigos de barras moleculares diferentes pueden presentar una concentración diferente. En algunos modos de realización, al menos alrededor del 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 % de los códigos de barras de recipiente diferentes pueden presentar una concentración diferente.
[0298] Los códigos de barras moleculares o códigos de barras de recipiente en una pluralidad de códigos de barras moleculares o códigos de barras de recipiente pueden presentar al menos alrededor de 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más secuencias diferentes. Por ejemplo, los códigos de barras moleculares o códigos de barras de recipiente en una población pueden presentar al menos 2000, 3000, 4,000, 5000, 6,000, 7,000, 8,000, 9,000, 10.000, 15.000, 20.000, 25.000, 30.000, 35.000, 40.000, 45.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, 1.000.000 o más secuencias diferentes. Por consiguiente, una pluralidad de códigos de barras moleculares o códigos de barras de recipiente puede emplearse para generar al menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más secuencias diferentes de uno o más polinucleótidos, como polinucleótidos diana. Por ejemplo, una pluralidad de códigos de barras moleculares o códigos de barras de recipiente se puede emplear para generar al menos 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 15.000, 20.000, 25.000, 30.000, 35.000, 40.000, 45.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, l * l06, 2 * l06, 3 * l06, 4 * l06, 5 * l06, 6 * l06, 7 * l06, 8 * l06, 9 * l06, l * l07, 2 * l07, 3 * l07, 4 * l07, 5 * l07, 6 * l07, 7 * l07, 8 * l07, 9 * l07, l * l08, 2 * l08, 3 * l08, 4 * l08, 5 * l08, 6 * l08, 7 * l08, 8 * l08, 9 * l08, l * l09, 2 * l093 * l09, 4 * l09, 5 * l096 * l09, 7 * l09, 8 * l09, 9 * l09, l * l010, 2 * l010, 3 * l010, 4 * l010, 5 * l010, 6 * l010, 7 * l010, 8 * l010, 9 * l010, l * l011, 2 * l011, 3 * l011, 4 * l011, 5 * l011, 6 * l011, 7 * l011, 8 * l011, 9 * l011, l * l012, 2 * l012, 3 * l012, 4 * l012, 5 * l012, 6 * l012, 7 * l012, 8 * l012, 9 * l012 o más secuencias diferentes de uno o más polinucleótidos, como polinucleótidos diana. Por ejemplo, una pluralidad de códigos de barras moleculares o códigos de barras de recipiente se pueden emplear para generar al menos alrededor de 10, 15, 20, 25, 30, 35, 40,45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 15.000, 20.000, 25.000, 30.000, 35.000, 40.000, 45.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000,
800.000, 900.000, l x |06, 2 x |06, 3 x |06, 4 x |06, 5 x |06, 6 x |06, 7 x |06, 8 x |06, 9 x |06, 1 x |07, 2 x |07, 3 x |07, 4 x |07, 5 x l07, 6 x |07, 7 x |07, 8 x |07, 9 x |07, | x |08, 2x|08, 3 x |08, 4 x |08, 5 x |08, 6 x |08, 7 x |08, 8 x |08, 9 x |08, 1 x |09, 2 x |09, 3 x |09, 4 x |09, 5 x |09, 6 x |09, 7 x |09, 8 x |09, 9 x |09, | x |010, 2 x |010, 3 x |010, 4 x |010, 5 x |010, 6 x |010, 7 x |010, 8 x |010, 9 x |010, | x |011, 2 x |011, 3 x |011, 4 x |011, 5 x |011, 6 x |011, 7 x |011, 8 x |011, 9 x |011, | x |012, 2 x |012, 3 x |012, 4 x |012, 5 x |012, 6 x |012, 7 x |012, 8 x |012, 9 x 1012 o más secuencias diferentes de a| menos a|rededor de 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 15.000, 20.000, 25.000, 30.000, 35.000, 40.000, 45.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, | x |06, 2 x |06, 3 x |06, 4 x |06, 5 x |06, 6 x |06, 7 x |06, 8 x |06, 9 x |06, | x |07, 2 x |07, 3 x |07, 4 x |07, 5 x |07, 6 x |07, 7 x |07, 8 x |07, 9 x |07, | x |08, 2 x |08, 3 x |08, 4 x |08, 5 x |08, 6 x |08, 7 x |08, 8 x |08, 9 x |08, | x |09, 2 x |09, 3 x |09, 4 x |09, 5 x |09, 6 x |09, 7 x |09, 8 x |09, 9 x |09, | x |010, 2 x |010, 3 x |010, 4 x |010, 5 x |010, 6 x |010, 7 x |010, 8 x |010, 9 x |010, | x |011, 2 x |011, 3 x |011, 4 x |011, 5 x |011, 6 x |011, 7 x |011, 8 x |011, 9 x |011, | x |012, 2 x |012, 3 x |012, 4 x |012, 5 x |012, 6 x |012, 7 x |012, 8 x |012, 9 x |012 o más po|inuc|eótidos diana.
[0299] En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares se emp|ean para agrupar o cong|omerar secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado contienen e| mismo código de barras mo|ecu|ar. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares o códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado comprenden un conjunto de amp|icón. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado comprenden una p|ura|idad de secuencias donde |os po|inuc|eótidos a partir de |os cua|es se generó |a p|ura|idad de secuencias se originaron a partir de |a misma mo|écu|a de po|inuc|eótido en una reacción de amp|ificación.
[0300] En a|gunos modos de rea|ización, uno o más códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado contienen e| mismo código de barras de recipiente. En a|gunos modos de rea|ización, uno o más códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado comprenden uno o más conjuntos de amp|icón. En a|gunos modos de rea|ización, uno o más códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado comprenden una p|ura|idad de secuencias donde |os po|inuc|eótidos a partir de |os cua|es se generó |a p|ura|idad de secuencias se originaron a partir de po|inuc|eótidos de un recipiente único o de una cé|u|a única.
[0301] En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado contienen e| mismo código de barras mo|ecu|ar y código de barras de recipiente. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado comprenden uno o más conjuntos de amp|icón. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, donde |as secuencias en cada cong|omerado comprenden una p|ura|idad de secuencias donde |os po|inuc|eótidos a partir de |os cua|es se generó |a p|ura|idad de secuencias se originaron a partir de| mismo po|inuc|eótido en una reacción de amp|ificación y de |a misma cé|u|a o recipiente únicos. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente no se emp|ean para a|inear secuencias.
[0302] En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares no se emp|ean para a|inear secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares se emp|ean para a|inear secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares se emp|ean para agrupar o cong|omerar secuencias, y una región específica de diana se emp|ea para a|inear secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras de recipiente no se emp|ean para a|inear secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras de recipiente se emp|ean para a|inear secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, y una región específica de diana se emp|ea para a|inear secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente se emp|ean para a|inear secuencias. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente se emp|ean para agrupar o cong|omerar secuencias, y una región específica de diana se emp|ea para a|inear secuencias.
[0303] En a|gunos modos de rea|ización, |a secuencia a|ineada contiene e| mismo código de barras mo|ecu|ar. En a|gunos modos de rea|ización, |a secuencia a|ineada contiene e| mismo código de barras de recipiente. En a|gunos modos de rea|ización, |as secuencias a|ineadas contienen e| mismo código de barras mo|ecu|ar y código de barras de recipiente. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares y códigos de barras de recipiente se emp|ean para a|inear secuencias, donde |as secuencias a|ineadas comprenden dos o más secuencias de un conjunto de amp|icón. En a|gunos modos de rea|ización, uno o más códigos de barras mo|ecu|ares o códigos de barras de recipiente se emp|ean para a|inear secuencias, donde |as secuencias a|ineadas comprenden una p|ura|idad de secuencias donde |os
polinucleótidos a partir de los cuales se generó la pluralidad de secuencias se originaron a partir de la misma molécula de polinucleótido en una reacción de amplificación. En algunos modos de realización, uno o más códigos de barras moleculares o códigos de barras de recipiente se emplean para alinear secuencias, donde las secuencias alineadas comprenden una pluralidad de secuencias donde los polinucleótidos a partir de los cuales se generó la pluralidad de secuencias se originaron a partir de una célula única o de un recipiente único.
C. Ligadura del adaptador
[0304] Antes de la ligadura del adaptador, los polinucleótidos o amplicones con código de barras doble pueden purificarse y/o seleccionarse por tamaño. El tamaño de los polinucleótidos con código de barras doble se puede seleccionar para optimizar el método seleccionado para secuenciación. El tamaño de polinucleótido deseado se determina mediante las limitaciones de instrumentación de secuenciación y por la aplicación específica de secuenciación. En algunos ejemplos, el tamaño de polinucleótido deseado es de 0 pares de bases (pb) a 100.000 pb (100 kilobases (kb)), 50 pb a 50 kb, 100bp a 25 kb. En algunos modos de realización, se emplea un secuenciador de lectura corta para secuenciar los polinucleótidos generados en la presente memoria. Por lo general, los tamaños de polinucleótido óptimos para secuenciadores de lectura corta varían en longitud desde alrededor de 20 pares de bases (pb) a 2000 pb, 50 pb a 1500 pb, 50 pb a 1250 pb, 50 pb a 1000 pb, 50 pb a 750 pb, 50 pb a 500 pb, 100 pb a 1500 pb, 100 pb a 1250 pb, 100 pb a 1000 pb, 100 pb a 750 pb, 100 pb a 500 pb, 200 pb a 1500 pb, 200 pb a 1250 pb, 200 pb a 1000 pb, 200 pb a 750 pb o 250 pb a 500 pb.
[0305] En algunos modos de realización, se emplea un secuenciador de lectura larga para secuenciar los polinucleótidos generados en la presente memoria. Por lo general, los tamaños de polinucleótido óptimos para secuenciadores de lectura corta varían en longitud desde alrededor de 1 kilobase (kb) a 100 kb, como 1 kb a 50 kb, 5 kb a 25 kb, 5 kb a 20 kb, o aproximadamente 1 kb, 5 kb, 10 kb, 15 kb o 20 kb.
[0306] Para generar un conjunto de polinucleótidos del tamaño deseado, el conjunto de polinucleótidos puede dimensionarse mediante la modificación de las condiciones de las reacciones de transcripción inversa y extensión del cebador, como la modificación del tiempo del paso de extensión de las reacciones. En algunos modos de realización, el conjunto de polinucleótidos puede fragmentarse o dimensionarse hasta lograr una longitud deseada mediante métodos físicos (es decir, cizallamiento acústico y sonicación) o métodos enzimáticos (es decir, cócteles de endonucleasas inespecíficas y reacciones de etiquetado de transposasa). Se pueden aislar los polinucleótidos del tamaño deseado mediante electroforesis en gel de agarosa, como electroforesis en gel desnaturalizante, métodos de exclusión por tamaño, o métodos automatizados o kits comerciales (Quail et al, Electrophoresis (2012) 33(23):3521-3528; Duhaime et al., Environ Microbiol (2012) 14(9):2526-2537).
[0307] En algunos modos de realización, los polinucleótidos bicatenarios con código de barras doble se purifican antes de la selección de tamaño, por ejemplo, mediante purificación por afinidad. En algunos modos de realización, los polinucleótidos bicatenarios con código de barras doble se desnaturalizan antes de la selección de tamaño. En algunos modos de realización, los polinucleótidos bicatenarios con código de barras doble se desnaturalizan mediante la rotura de los enlaces de hidrógeno entre las cadenas complementarias de ADN. En algunos modos de realización, la desnaturalización de ADN bicatenario se produce mediante la aplicación de ácido o base, una sal inorgánica concentrada, un disolvente orgánico, (p. ej., alcohol o cloroformo), radiación o calor. En algunos modos de realización, la desnaturalización de ADN bicatenario se produce mediante la exposición a agentes químicos como formamida, guanina, salicilato de sodio, dimetilsulfóxido (DMS), propilenglicol, urea o NaOH. En algunos modos de realización, las moléculas de ADN bicatenario se tratan con NaOH, como 0.1 M de NaOH para generar moléculas monocatenarias.
[0308] Tras la selección de tamaño y/o purificación, se puede añadir un segundo adaptador a los polinucleótidos con código de barras doble marcados con adaptador, que son polinucleótidos generados por el método que contiene un primer adaptador con una secuencia de cebado universal, un código de barras de recipiente y un código de barras molecular. El adaptador contiene una secuencia de cebado universal, que se puede emplear para la amplificación o secuenciación de los polinucleótidos con código de barras doble marcados con el adaptador. Los adaptadores pueden contener cualquier secuencia de cebado universal conocida o fragmento de esta. Entre las secuencias de cebado universal de ejemplo se incluyen las secuencias de cebado P7, C7, P5 o C5.
[0309] La adición del segundo adaptador se puede llevar a cabo mediante cualquier método conocido. El adaptador se puede añadir a un polinucleótido monocatenario o a un polinucleótido bicatenario. En algunos ejemplos, el adaptador se añade a un polinucleótido monocatenario. En otros ejemplos, un adaptador, como un adaptador bicatenario se añade a un polinucleótido bicatenario. En algunos modos de realización, se emplea una ligasa para ligar un adaptador monocatenario. Por ejemplo, se pueden emplear una Thermostable App ligase (NEB) o CircLigase II (Epicentre) para ligar un segundo adaptador a un adaptador monocatenario a un polinucleótido monocatenario con código de barras doble marcado con adaptador.
[0310] En algunos modos de realización, se puede añadir un segundo adaptador a los polinucleótidos monocatenarios con código de barras doble marcados con adaptador mediante el alineamiento de un adaptador de empalme redundante. Por ejemplo, se puede añadir un segundo adaptador mediante la adición de un adaptador de empalme doble un extremo
del polinucleótido monocatenario con código de barras doble marcado con el adaptador. Estos adaptadores de empalme doble contienen un oligonucleótido bicatenario emparejado que presenta un saliente redundante en un extremo de la molécula. El saliente redundante puede presentar 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 bases. Los nucleótidos redundantes de la porción saliente de la molécula están alineados a un extremo del polinucleótido monocatenario con código de barras doble marcado con el adaptador opuesto al extremo de la primera secuencia de adaptador. En algunos modos de realización del método, se alinea un adaptador de empalme doble con un saliente 3' al extremo 3' del polinucleótido monocatenario con código de barras doble marcado con adaptador, opuesto al primer adaptador. En algunos modos de realización del método, se alinea un adaptador de empalme doble con un saliente 5' al extremo 5' del polinucleótido monocatenario con código de barras doble marcado con adaptador, opuesto al primer adaptador. Una ligasa, como una ligasa blunt/TA puede facilitar el alineamiento con un adaptador de empalme doble con los polinucleótidos monocatenarios con código de barras doble marcados con adaptador.
[0311] En algunos modos de realización del método, la adición enzimática de nucleótidos sin plantilla se puede añadir a un extremo de los polinucleótidos monocatenarios marcados con adaptador, con el que un adaptador está alineado. En algunos modos de realización, un segundo adaptador se alinea directamente con los nucleótidos sin plantilla empleando el emparejamiento de bases complementarias. En algunos modos de realización, un adaptador de empalme doble se puede alinear a los nucleótidos sin plantilla para producir la adición del adaptador al extremo de la molécula. En algunos modos de realización, el adaptador se añade al extremo 3' de los polinucleótidos monocatenarios con código de barras doble marcados con adaptador. En algunos modos de realización, el adaptador se añade al extremo 5' de los polinucleótidos monocatenarios con código de barras doble marcados con adaptador. Una ligasa, como una ligasa blunt/TA puede facilitar el alineamiento con el segundo adaptador o adaptador de empalme doble con los polinucleótidos monocatenarios con código de barras doble marcados con adaptador.
[0312] El segundo adaptador contiene una secuencia de cebado universal o un sitio de cebado universal o una porción contigua de una secuencia de cebado universal o un sitio de cebado universal suficiente para alinearse a una secuencia complementaria. Las secuencias de cebado universal o los sitios de cebado universal contienen secuencias de oligonucleótido que son complementarias a cebadores universales o a una porción contigua de estos. En la sección D a continuación se listan cebadores universales de ejemplo.
D. Amplificación y secuenciación
[0313] La muestra contiene polinucleótidos con código de barras doble, con un primer y segundo adaptador en extremos opuestos, o cerca de estos, de los polinucleótidos con código de barras doble, correspondientes a una o más secuencias de polinucleótido diana y/o todo o parte del transcriptoma de la célula, tal como se genera en los procedimientos arriba, se puede amplificar para generar múltiples copias de la biblioteca de polinucleótidos con código de barras doble. La amplificación se puede llevar previamente a la secuenciación. En algunos modos de realización, los cebadores con adaptadores de secuenciación se pueden emplear para amplificar una o más secuencias en la biblioteca. En algunos modos de realización, los transcritos seleccionados se amplifican y preparan para secuenciación.
[0314] En algunos modos de realización, se emplean cebadores adaptadores con adaptadores de secuencia para amplificar todos los transcritos en la biblioteca, y preparar la misma para secuenciación. En algunos modos de realización, se emplean un cebador adaptador con un adaptador de secuenciación y un cebador específico de diana con un adaptador de secuenciación para amplificar un gen diana, y preparar el gen diana para secuenciación. En algunos modos de realización, se emplean un cebador específico de célula, como un cebador para el código de barras de recipiente, con un adaptador de secuenciación y un cebador para el adaptador en el extremo opuesto del transcrito del código de barras de recipiente con un adaptador de secuenciación se emplea para amplificar el transcriptoma de una célula seleccionada y preparar la misma para secuenciación. La FIG. 2 representa la amplificación seleccionada de ejemplo de polinucleótidos en la biblioteca generada por medio del uso de cebadores seleccionados tal como se describe en la presente memoria.
1. Amplificación
[0315] La muestra contenedora del polinucleótido diana puede comprender ADN correspondiente al transcrito completo de ARNm, o (un) fragmento(s) de este, que se puede(n) amplificar. En algunos casos, la longitud promedio del transcrito de ARNm correspondiente, o el/los fragmento(s) de este, puede presentar menos de alrededor de 100, 200, 300, 400, 500 o 800 pares de bases, o menos de alrededor de 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 o 200 nucleótidos, o menos de alrededor de 1, 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 kilobases. En algunos casos, se amplifica una secuencia diana de una plantilla relativamente corta, como una muestra que contiene una plantilla que presenta alrededor de 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 bases.
[0316] Una reacción de amplificación puede comprender uno o más aditivos. En algunos casos, el uno o más aditivos son dimetilsulfóxido (DMSO), glicerina, (mono)hidrato de betaína N,N,N-trimetilglicina = [carboximetil] trimetilamonio), trehalosa, 7-Deaza-2'- desoxiguanosina trifosfato (dC7GTP o 7-deaza-2'-dGTP), BSA (albúmina de suero bovino), formamida (metanamida), cloruro de tetrametilamonio (TMAC), otros derivados del tetraalquilamonio (p. ej., cloruro de tetraetilamonio (TEA-C1) y cloruro de tetrapropilamonio (TPrACI), detergente no iónico (p. ej., Triton X-100, TWEEN® 20, Nonidet P-40 (NP-40)) o PREXCEL-Q. En algunos casos, una reacción de amplificación comprende 0, 1, 2, 3, 4, 5, 6, 7,
8, 9 o 10 aditivos diferentes. En otros casos, una reacción de amplificación comprende al menos 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 aditivos diferentes.
[0317] Las reacciones de termociclado se pueden llevar a cabo en muestras contenidas en volúmenes de reacción (p. ej., gotículas). Las gotículas pueden ser polidispersas o preferiblemente monodispersas, generadas mediante agitación, sonicación o microfluidicamente a través de la unión de canales en T u otros medios por los familiarizados con la técnica. Las densidades pueden superar 20.000 gotículas/40pL (1 nL de gotículas), 200.000 gotículas/40pL (100 pL de gotículas). Las gotículas pueden permanecer intactas durante el termociclado. Las gotículas pueden permanecer intactas durante el termociclado en densidades mayores de alrededor de 10.000 gotículas/pL, 100.000 gotículas/pL, 200.000 gotículas/pL, 300.000 gotículas/pL, 400.000 gotículas/pL, 500.000 gotículas/pL, 600.000 gotículas/pL, 700.000 gotículas/pL, 800.000 gotículas/pL, 900.000 gotículas/pL, o 1.000.000 gotículas/pL. En otros casos, dos o más gotículas no coalescen durante el termociclado. En otros casos, más de 100 o más de 1000 gotículas no coalescen durante el termociclado.
[0318] Se puede emplear cualquier ADN polimerasa que catalice la extensión del cebador, incluyendo, sin carácter limitativo, ADN polimerasa de E. coli, el fragmento de Klenow de la ADN polimerasa 1 de E. coli, la ADN polimerasa T7, la ADN polimerasa T4, la ADN polimerasa Taq, la ADN polimerasa Pfu, la ADN polimerasa Vent, el bacteriófago 29, REDTaq™, la ADN polimerasa genómica o la secuenasa. En algunos casos, se emplea una ADN polimerasa termoestable. Una PCR de arranque en caliente también se puede llevar a cabo cuando la reacción se calienta hasta 95 °C durante dos minutos antes de la adición de la polimerasa o la polimerasa se puede mantener inactiva hasta el primer paso de calentamiento en el ciclo 1. Se puede usar la PCR de arranque en caliente para minimizar la amplificación no específica.
[0319] Se puede emplear cualquier número de ciclos de PCR para amplificar el ADN, p. ej., alrededor, más de alrededor o menos de alrededor de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44 o 45 ciclos. El número de ciclos de amplificación pueden ser alrededor de 1-45, 10-45, 20-45, 30-45, 35-45, 10-40, 10-30, 10-25, 10-20, 10-15, 20-35, 25-35, 30-35 o 35-40.
[0320] La amplificación de ácidos nucleicos diana se puede llevar a cabo mediante cualquier medio conocido. Los ácidos nucleicos diana se pueden amplificar mediante la reacción en cadena de la polimerasa (PCR) o la amplificación isotérmica del ADN. Entre los ejemplos de técnicas de PCR que se pueden emplear se incluyen, sin carácter limitativo, PCR cuantitativa, PCR cuantitativa fluorescente (QF-PCR), PCR múltiple fluorescente (MF-PCR), PCR en tiempo real (transcripción inversa-PCR), PCR de célula única, PCR de polimorfismo de longitud de fragmentos de restricción (PCR-RFLP), PCR-RFLP/transcripción inversa-PCR-RFLP, PCR de arranque en caliente, PCR anidada, PCR de colonias de polimerasa in situ, amplificación por círculo rodante (RCA) in situ, PCR digital (PCRd), PCR digital en gotículas (PCRdd), PCR de puente, PCR de picolitro y PCR en emulsión. Otros métodos de amplificación adecuados incluyen la reacción en cadena de la ligasa (LCR), la amplificación de transcripción, PCR de sonda de inversión molecular (MIP), la replicación de secuencia autosostenida, la amplificación selectiva de secuencias de polinucleótido diana, la reacción en cadena de la polimerasa cebada con secuencias de consenso (CP-PCR), la reacción en cadena de la polimerasa cebada arbitrariamente (AP-PCR), la PCR cebada con polinucleótidos degenerados (DOP-PCR) y la amplificación de secuencias basada en ácidos nucleicos (NABSA). Otros métodos de amplificación que se pueden emplear en la presente memoria incluyen aquellos descritos en las patentes de EE. UU. N.° 5,242,794; 5,494,810; 4,988,617; y 6,582,938, así como se incluye la amplificación de ARN mediada por la replicasa Q beta. La amplificación puede ser amplificación isotérmica, p. ej., amplificación lineal isotérmica.
[0321] En algunos modos de realización, la amplificación no se da en un soporte sólido. En algunos modos de realización, la amplificación no se da en un soporte sólido en una gotícula. En algunos modos de realización, la amplificación sí se da en un soporte sólido cuando la amplificación no es en una gotícula.
[0322] Una reacción de amplificación puede comprender uno o más aditivos. En algunos modos de realización, el uno o más aditivos son dimetilsulfóxido (DMSO), glicerina, (mono)hidrato de betaína N,N,N-trimetilglicina = [carboximetil] trimetilamonio), trehalosa, 7-Deaza-2'- desoxiguanosina trifosfato (dC7GTP o 7-deaza-2'-dGTP), BSA (albúmina de suero bovino), formamida (metanamida), cloruro de tetrametilamonio (TMAC), otros derivados del tetraalquilamonio (p. ej., cloruro de tetraetilamonio (TEA-C1) y cloruro de tetrapropilamonio (TPrACI), detergente no iónico (p. ej., Triton X-100, TWEEN® 20, Nonidet P-40 (NP-40)) o PREXCEL-Q. En algunos modos de realización, una reacción de amplificación puede comprender 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 aditivos diferentes. En otros casos, una reacción de amplificación puede comprender al menos 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 aditivos diferentes.
[0323] Por lo general, se pueden emplear uno o más pares de cebadores en una reacción de amplificación; un cebador de un par de cebadores puede ser un cebador directo y un cebador de un par de cebadores puede ser un cebador inverso.
[0324] En algunos casos, un primer par de cebadores se puede emplear en la reacción de amplificación; un cebador del primer par puede ser un cebador directo complementario a una secuencia de una primera molécula de polinucleótido diana y un cebador del primer par puede ser un cebador inverso que puede ser complementario a una segunda secuencia de la primera molécula del polinucleótido diana, y un primer locus diana puede residir entre la primera secuencia y la segunda secuencia. En algunos modos de realización, el primer locus diana comprende una secuencia V h o Va o Vy.
[0325] En algunos casos, un segundo par de cebadores se puede emplear en la reacción de amplificación; un cebador del segundo par puede ser un cebador directo complementario a una primera secuencia de la segunda molécula de polinucleótido diana y un cebador del segundo par puede ser un cebador inverso complementario a una segunda secuencia de la segunda molécula del polinucleótido diana, y un segundo locus diana puede residir entre la primera secuencia y la segunda secuencia. En algunos modos de realización, el segundo locus diana comprende una secuencia Vl o Vp o V5.
[0326] En algunos casos, un tercer par de cebadores se puede emplear en la reacción de amplificación; un cebador del tercer par puede ser un cebador directo complementario a una primera secuencia de una tercera molécula de polinucleótido diana y un cebador del tercer par puede ser un cebador inverso complementario a una segunda secuencia de la tercera molécula del polinucleótido diana, y un tercer locus diana puede residir entre la primera secuencia y la segunda secuencia. En algunos modos de realización, el tercer locus diana comprende un código de barras, como un código de barras molecular o un código de barras de recipiente.
[0327] En algunos casos, se pueden emplear pares múltiples de cebadores en la reacción de amplificación. En algunos ejemplos, un cebador de un par de cebadores puede ser un cebador directo complementario a una primera secuencia de adaptador y un cebador del par de cebadores puede ser un cebador inverso a una segunda secuencia de adaptador. En algunos ejemplos, un cebador de un par de cebadores puede ser un cebador directo complementario a una segunda secuencia de adaptador y un cebador del par de cebadores puede ser un cebador inverso a una primera secuencia de adaptador.
[0328] La longitud del cebador directo y el cebador inverso puede depender de la secuencia del polinucleótido diana y el locus diana. Por ejemplo, se puede optimizar la longitud y/o T del cebador directo y del cebador inverso. En algún caso, un cebador puede presentar alrededor, más de alrededor o menos de alrededor de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 o 60 nucleótidos en longitud. En algunos casos, un cebador presenta de alrededor de 15 a alrededor de 20, alrededor de 15 a alrededor de 25, alrededor de 15 a alrededor de 30, alrededor de 15 a alrededor de 40, alrededor de 15 a alrededor de 45, alrededor de 15 a alrededor de 50, alrededor de 15 a alrededor de 55, alrededor de 15 a alrededor de 60, alrededor de 20 a alrededor de 25, alrededor de 20 a alrededor de 30, alrededor de 20 a alrededor de 35, alrededor de 20 a alrededor de 40, alrededor de 20 a alrededor de 45, alrededor de 20 a alrededor de 50, alrededor de 20 a alrededor de 55 o alrededor de 20 a alrededor de 60 nucleótidos en longitud.
[0329] Un cebador puede ser un ADN monocatenario antes de la unión con un polinucleótido con plantilla. En algunos casos, el cebador comprende, inicialmente, la secuencia bicatenaria. La longitud adecuada de un cebador puede depender del uso previsto del cebador, pero puede variar en alrededor de 6 a alrededor de 50 nucleótidos, o en alrededor de 15 a 35 nucleótidos. Las moléculas de cebadores cortas pueden requerir, en general, temperaturas más frías para formar complejos híbridos lo suficientemente estables con una plantilla. En algunos modos de realización, un cebador no requiere reflejar la secuencia exacta del ácido nucleico con plantilla, pero puede ser lo suficientemente complementario para hibridarse con una plantilla. En algunos casos, un cebador puede ser parcialmente bicatenario antes de la unión con un polinucleótido con plantilla. Un cebador con secuencia bicatenaria puede presentar una estructura en horquilla de alrededor, más de alrededor, o menos de alrededor de 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 bases. Una porción bicatenaria de un cebador puede presentar alrededor, más de alrededor o menos de alrededor, o al menos alrededor de 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49 o 50 pares de bases. El diseño de cebadores adecuados para la amplificación de una secuencia diana dada es conocido en la técnica.
[0330] Los cebadores pueden incorporar rasgos adicionales que permiten la detección e inmovilización del cebador pero que no alteran una propiedad básica del cebador (p. ej., actuando como punto de inicio de la síntesis de ADN). Por ejemplo, los cebadores pueden contener una secuencia de ácido nucleico adicional en el extremo 5' que no se hibrida con un ácido nucleico diana, pero que facilita la clonación o amplificación adicional, o la secuenciación de un producto amplificado. Por ejemplo, la secuencia adicional puede comprender un sitio de unión al cebador, como un sitio de unión al cebador universal, que puede ser un adaptador. En la presente memoria se puede hacer referencia a una región del cebador que es lo suficientemente complementaria a una plantilla para hibridar como una región de hibridación.
[0331] En otro caso, un cebador utilizado en los métodos y las composiciones descritas en la presente memoria, pueden comprender uno o más nucleósidos universales. Los ejemplos no limitativos de nucleósidos universales son 5-nitroindolo e inosina, como se describe en las solicitudes de EE. Uu . publicadas N.° 2009/0325169 y 2010/0167353.
[0332] Se pueden diseñar cebadores de acuerdo con parámetros conocidos para evitar estructuras secundarias y autohibridación. Los diferentes pares de cebadores pueden alinearse y fundirse a alrededor de las mismas temperaturas, por ejemplo, dentro de 1 °C, 2 °C, 3 °C, 4 °C, 5 °C, 6 °C, 7 °C, 8 °C, 9 °C o 10 °C de otro par de cebadores. En algunos casos, se emplean más de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 500, 1000, 5000, 10.000 cebadores inicialmente. Estos cebadores pueden hibridarse a polinucleótidos diana descritos en la presente memoria.
[0333] Se pueden preparar cebadores mediante una variedad de métodos, incluidas, sin carácter limitativo, la clonación de secuencias adecuadas y la síntesis química directa por medio de métodos conocidos en la técnica (Narang et al, Methods Enzymol. 68:90 (1979); Brown et al, Methods Enzymol. 68:109 (1979)). También se pueden obtener cebadores de fuentes comerciales. Los cebadores pueden tener una temperatura de fusión idéntica. Los cebadores pueden tener una temperatura de fusión no idéntica. Las longitudes de los cebadores pueden alargarse o acortarse en el extremo 5' o en el extremo 3' para producir cebadores con temperaturas de fusión deseadas. Uno de los cebadores de un par de cebadores puede ser más largo que el otro cebador. Las longitudes de alineación 3' de los cebadores, dentro de un par de cebadores, pueden ser diferentes. Igualmente, la porción de alineación de cada par de cebadores puede diseñarse de manera que la secuencia y longitud de los pares de cebadores produzcan la temperatura de fusión deseada. Una ecuación para determinar la temperatura de fusión de cebadores inferiores a 25 pares de bases es la regla de Wallace (T = 2 (A T) 4 (G C)). También se pueden emplear programas de ordenador para el diseño de cebadores. La T m (temperatura de fusión o alineación) de cada cebador se puede calcular empleando programas de software. La temperatura de alineación de los cebadores puede recalcularse y aumentarse tras cualquier ciclo de amplificación, incluidos, sin carácter limitativo, el ciclo 1,2, 3, 4, 5, los ciclos 6-10, los ciclos 10-15, los ciclos 15-20, los ciclos 20-25, los ciclos 25-30, los ciclos 30-35 o los ciclos 35-40. Tras los ciclos iniciales de amplificación, la mitad 5' de los cebadores se puede incorporar a los productos de cada loci de interés; por lo tanto, se puede recalcular la Tm en función de ambas de las secuencias de la mitad 5' y la mitad 3' de cada cebador.
[0334] Llevar a cabo la una o más reacciones de los métodos divulgados en la presente memoria puede comprender el uso de uno o más cebadores. Tal como se emplea en la presente memoria, un cebador comprende un polinucleótido bicatenario, monocatenario, o parcialmente monocatenario, que es lo suficientemente complementario para hibridarse con un polinucleótido de plantilla. Un cebador puede ser un ADN monocatenario antes de la unión con un polinucleótido con plantilla. En algunos modos de realización, el cebador comprende, inicialmente, la secuencia bicatenaria. Un sitio de cebado incluye el área de la plantilla con la que se hibrida un cebador. En algunos modos de realización, los cebadores son capaces de actuar como punto de iniciación para la síntesis de ácido nucleico dirigida por plantilla. Por ejemplo, los cebadores pueden iniciar la síntesis de ácido nucleico dirigida por plantilla cuando cuatro nucleótidos diferentes y un agente o una enzima de polimerización, como la ADN o ARN polimerasa o la transcriptasa inversa.
[0335] Un par de cebadores incluye 2 cebadores: un primer cebador con una región en dirección 5' que se hibrida con un extremo 5' de una secuencia de plantilla, y un segundo cebador con una región en dirección 3' que se hibrida con el complemento del extremo 3' de la secuencia de plantilla. Un conjunto de cebadores incluye dos o más cebadores: un primer cebador o una primera pluralidad de cebadores con una región en dirección 5' que se hibrida con un extremo 5' de una secuencia de plantilla o pluralidad de secuencias de plantilla, y un segundo cebador o una segunda pluralidad de cebadores con una región en dirección 3' que se hibrida con el complemento del extremo 3' de la secuencia de plantilla o pluralidad de secuencias de plantilla.
[0336] En algunos modos de realización, un cebador comprende una secuencia específica de diana. En algunos modos de realización, un cebador comprende una secuencia de muestra con código de barras. En algunos modos de realización, un cebador comprende una secuencia de cebado universal. En algunos modos de realización, un cebador comprende una secuencia de cebado de PCR. En algunos modos de realización, un cebador comprende una secuencia de cebado de PCR empleada para iniciar la amplificación de un polinucleótido. (Dieffenbach, PCR Primer: A Laboratory Manual, 2a Ed. (Cold Spring Harbor Press, New York (2003)). El sitio o la secuencia de unión de cebador universal permite la unión de un cebador universal a un polinucleótido y/o amplicón. Los cebadores universales son conocidos en la técnica e incluyen, sin carácter limitativo, -47F (M13F), alfaMF, AOX3', AOX5', BGHr, CMV-30, CMV-50, CVMf, LACrmt, lambda gt 10F, lambda gt 10R, lambda gt 11F, lambda gt 11R, M13 rev, M13Forward(-20), M13Reverse, male, pQEproseq, pQE, pA-120, pet4, pGAP Forward, pGLRVpr3, pGLpr2R, pKLAC14, pQEFS, pQERS, pucUl, pucU2, reversA, seqIREstam, seqIRESzpet, seqori, seqPCR, seqplRES-, seqpIRES+, seqpSecTag, seqpSecTag+, seqretro+PSI, SP6, T3-prom, T7-prom, y T7-termInv.
[0337] Tal como se emplea en la presente memoria, «unión» puede referirse tanto a las interacciones covalentes y a no covalentes como a cualquiera de ellas. La unión del cebador universal al sitio de unión al cebador universal se puede emplear para la amplificación, detección y/o secuenciación del polinucleótido y/o amplicón. El sitio de unión al cebador universal puede comprender al menos alrededor de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 o 1000 nucleótidos o pares de bases. En otro ejemplo, el sitio de unión al cebador universal comprende al menos alrededor de 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500 o 10.000 nucleótidos o pares de bases. En algunos modos de realización, el sitio de unión al cebador universal comprende 1-10, 10-20, 10-30 o 10-100 nucleótidos o pares de bases. En algunos modos de realización, el sitio de unión al cebador universal comprende de alrededor de 1-90, 1-80, 1-70, 1 60, 1-50, 1-40, 1-30, 1-20, 1-10, 2-90, 2-80, 2- 70, 2-60, 2-50, 2-40, 2-30, 2-20, 2-10, 1-900, 1-800, 1-700, 1-600, 1-500, 1-400, 1-300, 1-200, 1-100, 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 5-90, 5-80, 5-70, 5-60, 5-50, 5- 40, 5-30, 5-20, 5-10, 10-90, 10-80, 10-70, 10-60, 10-50, 10-40, 10-30, 10-20, 10-10, 5-900, 5-800, 5- 700, 5-600, 5-500, 5-400, 5-300, 5-200, 5-100, 10-900, 10-800, 10-700, 10-600, 10-500, 10-400, 10- 300, 10-200, 10-100, 25-900, 25-800, 25-700, 25-600, 25-500, 25-400, 25-300, 25-200, 25-100, 100- 1000, 100-900, 100-800, 100-700, 100-600, 100-500, 100 400, 100-300, 100-200, 200-1000, 200- 900, 200-800, 200-700, 200-600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400-600, 400-500, 500-1000, 500
900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900, 700-800, 800-1000, 800-900 o 900-1000 nucleótidos o pares de bases.
[0338] Los cebadores pueden tener una longitud compatible con su uso en la síntesis de productos de extensión del cebador. Un cebador puede ser un polinucleótido que presenta de 8 a 200 nucleótidos en longitud. La longitud del cebador puede depender de la secuencia del polinucleótido de plantilla y el locus de plantilla. Por ejemplo, se puede optimizar la longitud y/o temperatura de fusión (Tm) de un cebador o conjunto de cebadores. En algún caso, un cebador puede presentar alrededor, más de alrededor o menos de alrededor de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 o 60 nucleótidos en longitud. En algunos modos de realización, los cebadores presentan alrededor de 8-100 nucleótidos en longitud, por ejemplo, 10-75, 15-60, 15-40, 18-30, 20-40, 21-50, 22-45, 25-40, 7-9, 12-15, 15-20, 15-25, 15-30, 15-45, 15-50, 15-55, 15-60, 20-25, 20-30, 20-35, 20-45, 20-50, 20-55 o 20-60 nucleótidos en longitud y cualquier longitud intermedia. En algunos modos de realización, los cebadores presentan como mucho alrededor de 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 nucleótidos en longitud.
[0339] Por lo general, se pueden emplear uno o más pares de cebadores en una reacción de amplificación exponencial; un cebador de un par de cebadores puede ser un cebador directo y un cebador de un par de cebadores puede ser un cebador inverso. En algunos modos de realización, un primer par de cebadores se puede emplear en la reacción de amplificación exponencial; un cebador del primer par puede ser un cebador directo complementario a una secuencia de una primera molécula de polinucleótido de plantilla y un cebador del primer par puede ser un cebador inverso complementario a una segunda secuencia de la primera molécula del polinucleótido de plantilla, y un primer locus de plantilla puede residir entre la primera secuencia y la segunda secuencia. En algunos modos de realización, un segundo par de cebadores se puede emplear en la reacción de amplificación; un cebador del segundo par puede ser un cebador directo complementario a una primera secuencia de la segunda molécula de polinucleótido diana y un cebador del segundo par puede ser un cebador inverso complementario a una segunda secuencia de la segunda molécula del polinucleótido diana, y un segundo locus diana puede residir entre la primera secuencia y la segunda secuencia. En algunos modos de realización, el segundo locus diana comprende una secuencia de anticuerpo de cadena ligera variable. En algunos modos de realización, un tercer par de cebadores se puede emplear en la reacción de amplificación; un cebador del tercer par puede ser un cebador directo complementario a una primera secuencia de la tercera molécula de polinucleótido de plantilla y un cebador del tercer par puede ser un cebador inverso complementario a una segunda secuencia de la tercera molécula del polinucleótido de plantilla, y un tercer locus de plantilla puede residir entre la primera secuencia y la segunda secuencia.
[0340] El uno o más cebadores pueden alinearse con al menos una porción de una pluralidad de polinucleótidos de plantilla. El uno o más cebadores pueden alinearse con el extremo 3' y/o el extremo 5' de la pluralidad de polinucleótidos de plantilla. El uno o más cebadores pueden alinearse con una región interna de la pluralidad de polinucleótidos de plantilla. La región interna puede presentar al menos alrededor de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 100, 150, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 o 1000 nucleótidos de los extremos 3' o extremos 5' de la pluralidad de polinucleótidos de plantilla. El uno o más cebadores pueden comprender un panel fijo de cebadores. El uno o más cebadores pueden comprender al menos uno o más cebadores a medida. El uno o más cebadores pueden comprender al menos uno o más cebadores de control. El uno o más cebadores pueden comprender al menos uno o más cebadores de genes de mantenimiento El uno o más cebadores pueden comprender un cebador universal. El cebador universal puede alinearse con un sitio de unión al cebador universal. En algunos modos de realización, el uno o más cebadores a medida se alinean con un SBC, una región específica de diana, complementos de estos o cualquier combinación de estos. El uno o más cebadores pueden comprender un cebador universal. El uno o más cebadores pueden diseñarse para amplificar o llevar a cabo la extensión del cebador, transcripción inversa, extensión lineal, amplificación no exponencial, amplificación exponencial, PCR o cualquier otro método de amplificación de uno o más polinucleótidos diana o de plantilla.
[0341] La región específica de diana puede comprender al menos alrededor de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39,40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 100, 150, 200, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 o 1000 nucleótidos o pares de bases. En otro ejemplo, la región específica de diana comprende al menos alrededor de 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500 o 10.000 nucleótidos o pares de bases en algunos modos de realización, la región específica de diana comprende alrededor de 5-10, 10-15, 10-20, 10-30, 15-30, 10-75, 15-60, 15-40, 18-30, 20-40, 21-50, 22-45, 25-40, 7-9, 12-15, 15-20, 15-25, 15-30, 15-45, 15-50, 15-55, 15-60, 20-25, 20-30, 20-35, 20-45, 20-50, 20-55, 20-60, 2-900, 2-800, 2-700, 2-600, 2 500, 2-400, 2-300, 2-200, 2-100, 25-900, 25-800, 25-700, 25- 600, 25-500, 25-400, 25-300, 25-200, 25-100, 100-1000, 100-900, 100-800, 100-700, 100-600, 100- 500, 100-400, 100-300, 100-200, 200-1000, 200-900, 200-800, 200-700, 200 600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400-600, 400-500, 500-1000, 500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600 700, 700-1000, 700-900, 700-800, 800-1000, 800-900 o 900-1000 nucleótidos o pares de bases.
[0342] Se pueden diseñar cebadores de acuerdo con parámetros conocidos para evitar estructuras secundarias y autohibridación. En algunos modos de realización, los diferentes pares de cebadores pueden alinearse y fundirse a alrededor de las mismas temperaturas, por ejemplo, dentro de 1 °C, 2 °C, 3 °C, 4 °C, 5 °C, 6 °C, 7 °C, 8 °C, 9 °C o 10 °C de otro par de cebadores. En algunos modos de realización, uno o más cebadores en una pluralidad de cebadores pueden alinearse y fundirse a alrededor de las mismas temperaturas, por ejemplo, dentro de 1,2, 3, 4, 5, 6, 7, 8, 9 o 10 °C de otro cebador en la pluralidad de cebadores. En algunos modos de realización, uno o más cebadores en una pluralidad pueden alinearse y fundirse a diferentes temperaturas que otro cebador en la pluralidad de cebadores.
[0343] Una pluralidad de cebadores para uno o más pasos de los métodos descritos en la presente memoria puede comprender una pluralidad de cebadores que comprenden alrededor, como mucho alrededor o al menos alrededor de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000, 20.000, 30.000, 40.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, 1.000.000, 50.000.000, 100.000,000 cebadores diferentes. Por ejemplo, cada cebador en la pluralidad de cebadores puede comprender una secuencia o región específica de diana o plantilla diferente.
[0344] La FIG. 2 representa reacciones de amplificación de ejemplo para la amplificación de la biblioteca de polinucleótidos proporcionada en la presente memoria, generada por los métodos proporcionados en la presente memoria. En los métodos de ejemplo proporcionados en la presente memoria, la amplificación de la biblioteca para los propósitos de secuenciación emplea cebadores vinculados a un adaptador de secuenciación que ha de emplearse para la secuenciación, como secuenciación de última generación. Estos cebadores son conocidos y se describen en la presente memoria. Los cebadores de secuenciación marcados con adaptador se emplean en las aplicaciones de ejemplo proporcionadas a continuación.
[0345] En algunos modos de realización, se amplifica un gen diana para secuenciación. En algunos modos de realización, el gen diana se amplifica empleando un cebador dirigido a una secuencia de adaptador en un extremo del polinucleótido y un cebador específico de diana colocado para secuenciar el polinucleótido diana de longitud completa o la porción seleccionada de este. En algunos ejemplos, la secuencia diana puede estar presente en la biblioteca de una sola célula o de una pluralidad de células. En algunos modos de realización, se amplifican una o más secuencias diana empleando cebadores específicos para una secuencia de cebado universal del polinucleótido y uno o más cebadores específicos de diana. En algunos modos de realización, se amplifican dos o más secuencias diana, cada una con la secuencia universal y cebadores específicos de diana, tal como se describe. En algunos modos de realización, las dos o más secuencias diana están enlazadas, como dos secuencias diana que se coexpresan en una célula, por ejemplo, secuencias diana que se expresan como un dímero (p. ej., un heterodímero). Por consiguiente, al emplear el modo de realización proporcionado, se puede obtener la información de secuencia emparejada, como la información de secuencia de longitud completa emparejada, por medio de los métodos proporcionados.
[0346] En algunos modos de realización, toda la biblioteca de polinucleótidos preparada puede amplificarse para secuenciación empleando cebadores específicos para la secuencia de cebado universal del primer adaptador y la secuencia de cebado universal del segundo adaptador. La amplificación de las bibliotecas de polinucleótidos proporcionadas en la presente memoria empleando cebadores específicos para las secuencias de cebado universal en los dos extremos de los polinucleótidos de la biblioteca puede proporcionar el transcriptoma o genoma, o la porción de estos, de todas las células empleadas para elaborar la biblioteca. Esta información transcriptómica puede emplearse para la extracción en momentos en el tiempo posteriores y/o para evaluar la expresión (a nivel del transcrito) de varios genes dentro de la población de células a partir de las que se preparó la muestra. En algunos modos de realización, la información transcriptómica de las células se puede analizar y emplear para generar clústeres de células con perfiles de expresión de transcritos similares de la población total de células a partir de las que se produjo la biblioteca.
[0347] En algunos modos de realización, los polinucleótidos de una sola célula se pueden amplificar y secuenciar específicamente por medio de un cebador específico para la secuencia de código de barras de recipiente y un cebador específico para un sitio de cebado universal presente en el segundo adaptador. En estos modos de realización, se amplifican una o más secuencias diana tal como se describe arriba, y se identifica(n) el/los código(s) de barras de recipiente en la(s) secuencia(s) diana que se han identificado como de interés. Como todos los polinucleótidos de la misma célula están codificados el mismo código de barras de recipiente, esta aplicación del método proporciona información de secuencia de todos los polinucleótidos de la célula o células seleccionadas. La amplificación de todos los polinucleótidos en la biblioteca de la célula o células seleccionadas puede proporcionar, después, perfiles de expresión o perfiles genéticos de la célula o células que expresan la una o más secuencias diana concretas.
2. Secuenciación
[0348] T ras llevar a cabo uno o más de los pasos del método o los métodos descritos en la presente memoria, se puede secuenciar una biblioteca de polinucleótidos generada.
[0349] La secuenciación se puede llevar a cabo por medio de cualquier método de secuenciación conocido en la técn ica. En algunos modos de realización, la secuenciación se puede llevar a cabo en alto rendimiento. Las tecnologías de secuenciación de última generación adecuadas incluyen la plataforma 454 Life Sciences (Roche, Branford, CT) (Margulies et al., Nature, 437, 376-380 (2005)); el Genome Analyzer de lllumina, el ensayo de metilación GoldenGate o los ensayos de metilación Infinium, esto es, Infinium HumanMethylation 27K BeadArray o el ensayo de metilación VeraCode GoldenGate (lllumina, San Diego, CA; Bibkova et al, Genome Res. 16, 383-393 (2006); y las patentes de EE. UU. N.° 6,306,597, 7,598,035, 7,232,656), o la secuenciación del ADN por ligadura, sistema SOLiD (Applied Biosystems/Life Technologies; las patentes de EE. UU. N.° 6,797,470, 7,083,917, 7,166,434, 7,320,865, 7,332,285, 7,364,858 y 7,429,453); o la tecnología de secuenciación del ADN Helicos True Single Molecule (Harris et al, Science, 320, 106-109 (2008); y las patentes de EE. UU. N.° 7,037,687, 7,645,596, 7,169,560 y 7,769,400), la tecnología de molécula única en tiempo real (SMRTTm) de Pacific Biosciences, y secuenciación (Soni et al, Clin. Chem. 53, 1996-2001 (2007)). Estos sistemas permiten la secuenciación multiplexada en paralelo de muchos nucleótidos aislados de una muestra (Dear, Brief Funct. Genomic Proteomic, 1(4), 397-416 (2003) y McCaughan et al, J. Pathol, 220, 297-306 (2010)).
[0350] En algunos modos de realización, los polinucleótidos se secuencian mediante la secuenciación por ligadura de sondas modificadas con colorante, pirosecuenciación o secuenciación de molécula única. La determinación de la secuencia de un polinucleótido puede realizarse mediante métodos de secuenciación como la secuenciación de una sola molécula de Helioscope™, la secuenciación del ADN de Nanopore, la secuenciación masiva en paralelo en paralelo de la firma (MPSS, por sus siglas en inglés) de Lynx Therapeutics, la pirosecuenciación de 454, la secuenciación de molécula única en tiempo real (RNAP), la secuenciación de lllumina (Solexa), la secuenciación de SOLiD, Ion Torrent™, la secuenciación de semiconductores Ion, la secuenciación de molécula única SMRT(TM), la secuenciación de colonia de polimerasa, la secuenciación de nanobolas de ADN y el enfoque de VisiGen Biotechnologies. Por otro lado, la determinación de la secuencia polinucleotídica puede emplear plataformas de secuenciación, incluyendo, pero sin carácter limitativo, Genome Analyzer IIx, HiSeq y MiSeq ofrecidos por Illumina, tecnología de molécula única en tiempo real (SMRTTM), como el sistema PacBio RS ofrecido por Pacific Biosciences (California) y el secuenciador Solexa, tecnología de secuenciación de molécula única verdadera (tSMSTM) como el secuenciador HeliScope™ ofrecido por Helicos Inc. (Cambridge, MA). La secuenciación puede comprender secuenciación MiSeq. La secuenciación puede comprender secuenciación HiSeq. En algunos modos de realización, la determinación de la secuencia de un polinucleótido comprende secuenciación de extremos emparejados, secuenciación de nanoporo, secuenciación de alto rendimiento, secuenciación aleatoria, secuenciación de terminación con colorante, secuenciación de ADN de cebado múltiple, recorrido de cebadores, secuenciación de didesoxi de Sanger, secuenciación de Maxim-Gilbert, pirosecuenciación, secuenciación de molécula única verdadera, o cualquier combinación de estas. Por otro lado, la secuencia de un polinucleótido se puede determinar mediante microscopia electrónica o un ensayo de transistores de efecto de campo químicamente sensibles (chemFET).
[0351] Un método puede comprender además la secuenciación de uno o más polinucleótidos en la biblioteca. Un método puede comprender además la alineación de una o más secuencias de polinucleótidos, lecturas de secuencias, secuencias de amplicones o conjuntos de secuencias de amplicones entre sí.
[0352] Tal como se emplea en la presente, el alineamiento comprende comparar una secuencia de prueba, como una lectura de secuencia, con una o más secuencias de prueba, secuencias de referencia o una combinación de estas. En algunos modos de realización, el alineamiento se puede emplear para determinar una secuencia de consenso de una pluralidad de secuencias o secuencias alineadas. En algunos modos de realización, el alineamiento comprende determinar una secuencia de consenso de una pluralidad de secuencias donde cada una presenta un código de barras molecular o código de barras de recipiente idéntico. En algunos modos de realización, la longitud de una secuencia alineada para fines comparativos es al menos el 30 %, al menos el 40 %, al menos el 50 %, al menos el 60 %, al menos el 70 %, al menos el 80 %, al menos el 90 %,o al menos el 95 % de la longitud de una secuencia de referencia. La comparación real de las dos o más secuencias puede lograrse mediante métodos conocidos, por ejemplo, empleando un algoritmo matemático. Un ejemplo no limitativo de este algoritmo matemático se describe en Karlin, S. y Altschul, S., Proc. Natl. Acad. Sci. EE. UU., 90- 5873-5877 (1993). Este algoritmo se incorpora en los programas NBLAST y XBLAST (versión 2.0), tal como se describe en Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997). Cuando se emplean programas BLAST y Gapped BLAST, se puede emplear cualquier parámetro relevante de los programas respectivos (p. ej., NBLAST). Por ejemplo, los parámetros para la comparación de secuencia se pueden establecer en puntuación = 100, longitud de palabra = 12, o se pueden variar (p. ej., W = 5 o W = 20). Otros ejemplos incluyen el algoritmo de Myers y Miller, CABIOS (1989), ADVANCE, ADAM, BLa T y FASTA. En algunos modos de realización, el porcentaje de identidad entre dos secuencias de aminoácidos puede lograrse empleando, por ejemplo, el programa GAP del paquete de software GCG (Accelrys, Cambridge, Reino Unido).
[0353] La secuenciación puede comprender la secuenciación de al menos alrededor de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 o más nucleótidos o pares de bases de los polinucleótidos. En algunos modos de realización, la secuenciación comprende la secuenciación de al menos alrededor de 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más nucleótidos o pares de bases de los polinucleótidos. En otros casos, la secuenciación comprende la secuenciación de al menos alrededor de 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000 o más nucleótidos o pares de bases de los polinucleótidos.
[0354] La secuenciación puede comprender la secuenciación de al menos alrededor de 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más lecturas de secuenciación por pasada. Tal como se emplea en la presente memoria, una lectura de secuencia comprende una secuencia nucleotídica determinada a partir de una secuencia o corriente de datos generados por una técnica de secuenciación. En algunos modos de realización, la secuenciación comprende la secuenciación de al menos alrededor de 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000 o más lecturas de secuenciación por pasada. La secuenciación puede comprender más, menos, o igual a alrededor de 1.000.000,000 lecturas de secuenciación por pasada. La secuenciación puede comprender más, menos, o igual a alrededor de 200.000,000 lecturas por pasada.
[0355] En algunos modos de realización, el número de lecturas de secuencia empleado para determinar una secuencia de consenso es de alrededor de 2-1000 lecturas de secuencia. Por ejemplo, el número de lecturas de secuencia empleado para determinar una secuencia de consenso puede ser de alrededor de 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 25-900, 25-800, 25-700, 25-600, 25-500, 25-400, 25-300, 25-200, 25-100, 100-1000, 100-900, 100-800, 100-700, 100-600, 100-500, 100-400, 100-300, 100-200, 200-1000, 200-900, 200-800, 200-700, 200-600, 200-500, 200 400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400-600, 400-500, 500-1000, 500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900, 700-800, 800-1000, 800-900 o 900-1000 lecturas de secuencia. En algunos modos de realización, el número de lecturas de secuencia empleado para determinar una secuencia de consenso es de al menos alrededor de 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000, 20.000, 25.000, 30.000,35.000, 40.000, 45.000, 50.000, 55.000, 60.000, 65.000, 70.000, 75.000, 80.000, 85.000, 90.000, 95000, 100.000, 150.000, 200.000, 250.000, 300.000, 350.000, 400.000, 450.000, 500.000, 550.000, 600.000, 650.000, 700.000, 750.000, 800.000, 850.000, 900.000, 950.000, 1.000.000, 50.000.000 o 100.000,000 lecturas. En algunos modos de realización, el número de lecturas de secuencia empleado para determinar una secuencia de consenso es como mucho alrededor de 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000, 20.000, 25.000, 30.000,35.000, 40.000, 45.000, 50.000, 55.000, 60.000, 65.000, 70.000, 75.000, 80.000, 85.000, 90.000, 95000, 100.000, 150.000, 200.000, 250.000, 300.000, 350.000, 400.000, 450.000, 500.000, 550.000, 600.000, 650.000, 700.000, 750.000, 800.000, 850.000, 900.000, 950.000, 1.000. 000, 50.000.000 o 100.000,000 lecturas.
[0356] Un método puede comprender lecturas de secuenciación incorrectas. Un método puede comprender determinar el número de lecturas incorrectas, como para determinar una condición de reacción o diseñar secuencias de cebador. La comparación del número de lecturas incorrectas generadas en una o más primeras condiciones o conjuntos de condiciones se puede emplear para determinar una condición o un conjunto de condiciones preferidas. Por ejemplo, se puede llevar a cabo un primer método con una alta concentración de sal durante una reacción de PCR, y se puede llevar a cabo un segundo método con una baja concentración de sal durante una reacción de PCR, donde el primer y el segundo método se llevan a cabo esencialmente igual aparte de la diferencia en la concentración de sal. Si el primer método da lugar a un mayor número de lecturas incorrectas, como un mayor número de lecturas incorrectas para una secuencia polinucleotídica diana o cebador concretos, se puede determinar que se prefiere una condición de reacción de sal más baja para esa secuencia polinucleotídica diana o cebador concretos.
II. Clonación y expresión de genes diana
[0357] En algunos modos de realización, los genes diana identificados y secuenciados de acuerdo con los métodos proporcionados se pueden clonar en vectores para expresión en o de células. Se puede generar una biblioteca de expresión de genes diana, como inmunoreceptores, p. ej., anticuerpos o TCR.
[0358] «Biblioteca de expresión de anticuerpo» o «biblioteca de expresión de TCR» o «biblioteca de expresión», tal como se emplean en la presente, pueden referirse a un conjunto de moléculas (es decir, dos o más moléculas) en cualquiera del ácido nucleico o nivel de proteína. Por consiguiente, este término puede referirse a un conjunto de vectores de expresión que codifican una pluralidad de moléculas de anticuerpo o TCR (es decir, en el nivel del ácido nucleico) o puede referirse a un conjunto de moléculas de anticuerpo o TCR después de que hayan sido expresadas en un sistema de expresión adecuado (es decir, en el nivel de proteína). Por otro lado, los vectores de expresión/la biblioteca de expresión puede(n) contenerse en células huésped adecuadas en las que se pueden expresar. Las moléculas de anticuerpo que están codificadas o expresadas en las bibliotecas de expresión de la invención pueden estar en cualquier formato adecuado, p. ej., pueden ser moléculas enteras de anticuerpo o TCR o pueden ser fragmentos de anticuerpo o TCR, p. ej., anticuerpos monocatenarios (p. ej., anticuerpos scFv), anticuerpos Fv, anticuerpos Fab', fragmentos de (Fab')2, diacuerpos, etc. Los términos «codificante» o «que codifica para», como es la secuencia de ácido nucleico «codificante de 'V' que codifica para» o una secuencia codificante de ADN de o una secuencia nucleotídica «codificante de 'V' que codifica para» una enzima particular, así como otros términos sinónimos, se refieren a una secuencia de ADN que se transcribe y traduce en una enzima cuando se coloca bajo el control de secuencias reguladoras adecuadas. Una «secuencia promotora» es una región reguladora de ADN capaz de unir la ARN polimerasa en una célula e iniciar la transcripción de una secuencia de codificación en dirección 3'. El promotor es parte de la secuencia de ADN. Esta región de la secuencia presenta un codón inicial en su extremo terminal 3'. La secuencia promotora incluye el número mínimo de bases con elementos necesario para iniciar la transcripción en niveles detectables por encima del fondo. Sin embargo, después de que la ARN polimerasa se una la secuencia y se inicie la transcripción en el codón inicial (el extremo terminal
3' con un promotor), la transcripción prosigue en la dirección 3'. Dentro de la secuencia promotora se encontrará un sitio de iniciación de transcripción (convenientemente definido por el mapeo con la nucleasa SI), así como dominios de unión a proteína (secuencias de consenso) responsables de la unión a la ARN polimerasa.
[0359] Las moléculas de anticuerpo o TCR identificadas, derivadas, seleccionadas u obtenidas a partir de las bibliotecas de expresión de anticuerpos o TCR de la invención constituyen otro aspecto adicional de la invención. De nuevo, estas moléculas de anticuerpo o TCR pueden ser proteínas o ácidos nucleicos que codifican moléculas de anticuerpo o TCR, cuyos ácidos nucléicos pueden estar incorporados, a su vez, en un vector de expresión adecuado y/o contenidos en una células huésped adecuada.
[0360] El acervo de ADNc puede someterse a una reacción de PCR con polinucleótidos que se hibridan con una región constante de la cadena pesada de genes de anticuerpo y polinucleótidos que se hibridan con el extremo 5' de la región de la cadena V h o Va o Vy de los genes de anticuerpo o TCR. El acervo de ADNc puede someterse a una reacción de PCR con polinucleótidos que se hibridan con una región constante de la cadena pesada o alfa o gamma de genes de anticuerpo o TCR y polinucleótidos que se hibridan con la región 5' al extremo 5' de la región de la cadena V h o Va o Vy de un polinucleótido con código de barras que comprende una secuencia de anticuerpo o de TCR. Una reacción de PCR también puede configurar la amplificación del acervo de cadenas V l o Vp o Vy de, por ejemplo, las clases kappa y lambda. El acervo de ADNc puede someterse a una reacción de PCR con polinucleótidos que se hibridan con una región constante de la cadena ligera de genes de anticuerpo y polinucleótidos que se hibridan con el extremo 5' de la región de la cadena Vl o Vp o Vy de los genes de anticuerpo o TCR. El acervo de ADNc puede someterse a una reacción de PCR con polinucleótidos que se hibridan con una región constante de la cadena ligera de genes de anticuerpo y polinucleótidos que se hibridan con la región 5' al extremo 5' de la región de la cadena V l o Vp o Vy de un polinucleótido con código de barras que comprende una secuencia de anticuerpo o TCR. Estos oligonucleótidos o cebadores pueden diseñarse en función de información de base de datos de secuencia de genes de inmunoglobulina o TCR disponibles públicamente.
[0361] En algunos modos de realización, las secuencias V h y Vl o Va y Vp o Vy y V5 se pueden obtener convenientemente de una biblioteca de secuencias V h y Vl o Va y Vp o Vy y V5 producidas mediante amplificación por PCR empleando uno o más cebadores que no son específicos para genes de cadena pesada o ligera y, en concreto, para una o ambas de las regiones de polinucleótidos V h y Vl o Va y Vp o Vy y Vó. En algunos modos de realización, las secuencias V h y Vl se pueden obtener convenientemente de una biblioteca de secuencias V h y Vl o Va y Vp o Vy y Vó producidas mediante amplificación por PCR empleando cebadores específicos para una región del polinucleótido con código de barras de recipiente. En algunos modos de realización, las secuencias V h y Vl se pueden obtener convenientemente de una biblioteca de secuencias V h y Vl o Va y Vp o Vy y Vó producidas mediante amplificación por PCR empleando cebadores específicos de la familia del gen C o cebadores específicos del gen C. En algunos modos de realización, las secuencias V h y Vl se pueden obtener convenientemente de una biblioteca de secuencias V h y Vl o Va y Vp o Vy y Vó producidas mediante amplificación por PCR empleando un conjunto de cebadores con un primer cebador específico para una región del polinucleótido con código de barras de recipiente y un segundo cebador o una pluralidad de segundos cebadores que son cebadores específicos de la familia del gen C o cebadores específicos del gen C. En algunos modos de realización, las secuencias V h y Vl o Va y Vp o Vy y Vó se pueden obtener convenientemente de una biblioteca de secuencias Vh y V l o Va y Vp o Vy y Vó producidas mediante amplificación por PCR empleando un conjunto de cebadores con un primer cebador específico para una región del polinucleótido con código de barras de recipiente y un segundo cebador específico para una secuencia universal.
[0362] En algunos modos de realización, tras la transcripción inversa, las secuencias de ADNc resultantes se pueden amplificar por PCR empleando uno o más cebadores específicos para genes de la inmunoglobulina y, en concreto, para una o ambas de las regiones terminales de los polinucleótidos Vh y VL o Va y Vp o Vy y Vó. En algunos modos de realización, las secuencias VH y VL se pueden obtener de una biblioteca de secuencias VH y VL o Va y Vp o Vy y Vó producidas mediante amplificación por PCR empleando cebadores específicos de la familia del gen V o cebadores específicos del gen V (Nicholls et al, J. Immunol. Meth., 1993, 165:81; documento WO93/12227) o están diseñadas de acuerdo con métodos estándar conocidos en la técnica basados en la información de secuencia disponible. (Las secuencias VH y VL o Va y Vp o Vy y Vó pueden ligarse, a menudo con una secuencia espaciadora intermedia (p. ej., que codifica un espaciador peptídico flexible en fase), que forma un casete que codifica un anticuerpo monocatenario). Las secuencias de la región V pueden clonarse, convenientemente, como ADNc o productos de amplificación por PCR para células de expresión de inmunoglobulina. Las regiones VH y VL o Va y Vp o Vy y Vó se secuencian, opcionalmente, en los métodos descritos en la presente memoria y, concretamente, después de ciertos pasos como se ha señalado (p. ej., después de la PCR de célula única; después de la visualización de la superficie celular de mamíferos u otra, después del cribado FACS y similares). La secuenciación se puede emplear, entre otros motivos, para verificar que el nivel de diversidad se encuentra en un nivel aceptable. La secuenciación puede incluir secuenciación de alto rendimiento, secuenciación masiva (donde el mismo gen se secuencia a partir de una pluralidad de muestras individuales para identificar las diferencias en las secuencias), o combinaciones de las dos.
[0363] En algunos modos de realización, es innecesario vincular físicamente las combinaciones naturales de VH y VL o Va y Vp o Vy y Vó empleando los métodos descritos en la presente memoria. En algunos modos de realización, los ADNc, polinucleótidos con código de barras, o ADNc con código de barras amplificado por PCR no están vinculados
físicamente. En algunos modos de realización, los ADNc, polinucleótidos con código de barras, o ADNc con código de barras amplificado por PCR no están vinculados físicamente en la misma reacción o recipiente.
[0364] En algunos modos de realización, las combinaciones naturales de VH y VL o Va y Vp o Vy y V5 están vinculadas físicamente, empleando, además de los cebadores de ADNc, un cebador o una pluralidad de cebadores para el extremo 5' del gen VH o Va o Vy y otro cebador o pluralidad de cebadores para el extremo 5' del gen VL o Vp o Vó. Estos cebadores también contienen extremos complementarios de secuencia extra, para permitir el autoensamblaje de los genes VH y VL o Va y Vp o Vy y Vó. Tras la amplificación por PCR y la vinculación, la probabilidad de obtener productos mezclados, en otras palabras, regiones variables mezcladas, es mínima debido a que las reacciones de amplificación y vinculación se llevaron a cabo dentro de cada célula. El riesgo de mezcla puede reducirse aún más mediante el uso de reactivos voluminosos como nucleótidos marcados con digoxigenina para garantizar además que los pares de ADNc de la región V no abandonan el compartimento celular y se entremezclan, sino que se mantienen dentro de la célula para amplificación por PCR y vinculación. Las secuencias amplificadas están vinculadas mediante la hibridación de secuencias terminales complementarias. Tras la vinculación, las secuencias pueden recuperarse de células para uso en pasos del método adicionales descritos en la presente memoria. Por ejemplo, el ADN recuperado puede amplificarse por PCR mediante cebadores terminales, si es necesario, y clonarse en vectores que pueden ser plásmidos, fagos, cósmidos, fásmidos, vectores virales o combinaciones de estos como se detalla a continuación. Pueden incorporarse sitios de restricción de enzimas convenientes en las secuencias hibridadas para facilitar la clonación. Estos vectores también pueden almacenarse como una biblioteca de regiones variables vinculadas para uso posterior.
[0365] En algunos modos de realización donde se desea proporcionar combinaciones adicionales de VH y VL o Va y Vp o Vy y Vó, se escoge un sistema de expresión para facilitarlo. Por ejemplo, los sistemas de expresión de bacteriófagos permiten la recombinación aleatoria de secuencias de cadena ligera y pesada. Otros sistemas de expresión adecuados son conocidos para los expertos en el arte.
[0366] Cabe apreciar que en el caso de las secuencias VH y V l o Va y Vp o Vy y Vó derivadas de seres no humanos, en algunos modos de realización, puede ser preferible quimerizar estas secuencias con un Fc completamente humano. Tal como se emplea en la presente memoria, «quimerizado» se refiere a una inmunoglobulina o un TCR, donde las regiones variables de la cadena ligera y pesada o las regiones Va y Vp o Vy y Vó no son de origen humano y donde las regiones constantes de la cadena ligera y pesada o las regiones Va y Vp o Vy y Vó son de origen humano. Esto se consigue mediante la amplificación y clonación de dominios variables en un Fc humano. El Fc humano puede formar parte del vector, o estar en una molécula aparte, y también se puede emplear una biblioteca de Fc. En un modo de realización preferido, las moléculas quimerizadas cultivadas en células de mamífero, como las células CHO, se criban con FACS dos veces para enriquecer la población de células en células que expresan el anticuerpo de interés. Los anticuerpos o TCR quimerizados se caracterizan ya sea mediante secuenciación seguida de caracterización funcional o caracterización funcional directa o cinética. El cultivo, cribado y caracterización se describen detalladamente a continuación.
[0367] Es importante señalar que las reacciones de PCR se describen para la clonación de anticuerpos en forma de IgG. Se prefieren estos ya que, por lo general, se asocian a una respuesta inmunitaria más madura y, por lo general, muestran mayor afinidad que los anticuerpos de IgM, lo que los hace más convenientes para determinadas aplicaciones terapéuticas y de diagnóstico. Sin embargo, es evidente que pueden diseñarse polinucleótidos que permitirán la clonación de una o más de las otras formas de moléculas de inmunoglobulina, p. ej., IgM, IgA, IgE e IgD si se desea o es adecuado.
[0368] Una vez que se ha identificado un anticuerpo o TCR y se ha aislado la población adecuada de dichas células en un momento adecuado y se ha enriquecido opcionalmente como se describe arriba, no es necesario generar inmediatamente las bibliotecas de expresión de anticuerpo o TCR, siempre que el material genético contenido en las células pueda mantenerse intacto, permitiendo así que la biblioteca se forme en una fecha posterior. Así, por ejemplo, las células, un lisado celular, o el ácido nucleico, p. ej., ARN o ADN derivado de las mismas, pueden almacenarse hasta una fecha posterior mediante métodos adecuados, p. ej., por congelación, y las bibliotecas de expresión generarse en una fecha posterior cuando se desee.
[0369] Una vez se ha generado la biblioteca de vectores de expresión, las moléculas de anticuerpo codificadas pueden expresarse en un sistema de expresión adecuado y cribarse mediante las técnicas adecuadas que se conocen y están documentadas en la técnica. Por lo tanto, el método de la invención definido anteriormente puede comprender los pasos adicionales de expresión de la biblioteca de vectores de expresión en un sistema de expresión adecuado y el cribado de la biblioteca expresada en busca de anticuerpos con las propiedades deseadas, como se explica más detalladamente a continuación.
[0370] Tal como se indica en la presente memoria, los polinucleótidos preparados mediante los métodos de la divulgación que comprenden un polinucleótido que codifica secuencias de anticuerpo y TCR pueden incluir, sin carácter limitativo, aquellos que codifican la secuencia aminoacídica de un fragmento de anticuerpo o de TCR, por sí mismo, la secuencia no codificante para el anticuerpo o TCR completo o una porción de estos, la secuencia codificante para un anticuerpo o TCR, fragmento o porción, así como secuencias adicionales, como la secuencia codificante de al menos un péptido señal líder o de fusión, con o sin las secuencias codificantes adicionales anteriormente mencionadas, como al menos un intrón, junto con secuencias no codificantes adicionales, que incluyen, sin carácter limitativo, secuencias 5' y 3'
no codificantes, como las secuencias transcritas no traducidas que desempeñan una función en la transcripción y el procesamiento del ARNm, que incluyen señales de empalme y poliadenilación (por ejemplo, unión al ribosoma y estabilidad del ARNm); una secuencia codificante adicional que codifica para aminoácidos adicionales, como aquellos que proporcionan funcionalidades adicionales. Así, la secuencia que codifica un anticuerpo puede fusionarse con una secuencia marcadora, como una secuencia que codifica un péptido que facilita la purificación del anticuerpo o TCR fusionado que comprende un fragmento o una porción de anticuerpo o TCR.
[0371] Los productos de PCR primarios pueden someterse, opcionalmente, a una segunda reacción de PCR con conjuntos de polinucleótidos nuevos que se hibridan a los extremos 5' y 3' de los dominios variables VH, VL kappa y VL lambda o Va y v o Vy y V5 (según sea adecuado en función de si la reacción de PCR primaria con la que se han empleado los conjuntos de polinucleótidos nuevos se ha diseñado para amplificar porciones de genes de anticuerpo de cadena ligera o pesada o genes de TCR Va o Vp o genes de TCR Vy o Vó) del anticuerpo o TCR. Estos polinucleótidos incluyen ventajosamente secuencias de ADN específicas para un conjunto definido de enzimas de restricción (es decir, sitios de enzimas de restricción) para su posterior clonación. Las enzimas de restricción seleccionadas deben seleccionarse de manera que no corten segmentos de anticuerpo humano o gen V del TCR. pueden diseñarse en función de la información de la base de datos de secuencias de genes de inmunoglobulina o TCR y enzimas de restricción conocida y disponible públicamente. No obstante, los sitios de enzimas de restricción preferidos que deben incluirse son Ncol, Hind III, M y Notl. Los productos de estas reacciones de PCR secundarias son repertorios de varios fragmentos/dominios de anticuerpo de cadena pesada V, ligera V kappa y ligera V lambda. Este tipo de reacción de PCR secundaria generalmente se lleva a cabo, por lo tanto, cuando el formato de la biblioteca de expresión de interés es un formato scFv o Fv, donde solo los dominios Vh y V l o Va y V o Vy y Vó de un anticuerpo o TCR están presentes.
[0372] Los productos de PCR también pueden someterse a una reacción de PCR con conjuntos de cebadores nuevos que se hibridan a los extremos 5' y 3' de los polinucleótidos con código de barras. Estos polinucleótidos pueden incluir ventajosamente secuencias de ADN específicas para un conjunto definido de enzimas de restricción (es decir, sitios de enzimas de restricción) para su posterior clonación. Las enzimas de restricción seleccionadas deben seleccionarse de manera que no corten segmentos de anticuerpo humano o gen V del TCR. Estos oligonucleótidos pueden diseñarse en función de información de base de datos de la secuencia genética de inmunoglobulina o TCR disponibles públicamente y de la enzima de restricción. No obstante, los sitios de enzimas de restricción preferidos que deben incluirse son Ncol, Hind III, Mlul y Notl. Los productos de estas reacciones de PCR secundarias son repertorios de varios fragmentos/dominios de anticuerpo Vh , Vl kappa y Vl lambda o fragmentos/dominios de TCR Va y Vp o Vy y Vó.
[0373] Un experto en la técnica reconocerá que en este sistema también se pueden emplear fragmentos Fv o Fab de la cadena ligera o pesada o de la cadena Va o Vp o de la cadena Vy o Vó, o anticuerpos o TCR monocatenarios. Una cadena ligera o pesada o cadena Va o Vp o cadena Vy o Vó puede mutagenizar tras la adición de la cadena complementaria a la solución. A continuación, se permite que las dos cadenas se combinen y formen un fragmento de anticuerpo funcional. La adición de secuencias aleatorias no específicas de la cadena ligera o pesada o de la cadena Va o Vp o de la cadena Vy o Vó permite la producción de un sistema combinatorio para generar una biblioteca de diversos miembros.
[0374] Las bibliotecas de dichos repertorios de fragmentos clonados que comprenden las regiones variables de la cadena pesada o de la cadena Va o de la cadena Vy, o fragmentos de estas, y/o las regiones variables de la cadena ligera o de la cadena Vp o de la cadena Vó, o fragmentos de estas, de los genes de anticuerpos o de TCR derivados de los linfocitos B o T de huéspedes inmunocomprometidos, como se define en la presente memoria, constituyen otros aspectos de la invención. Estas bibliotecas que comprenden regiones variables clonadas pueden insertarse opcionalmente en vectores de expresión para formar bibliotecas de expresión.
[0375] En algunos modos de realización, las reacciones de PCR pueden configurarse de manera que se conserven todas o parte de las regiones constantes de las diversas cadenas de anticuerpos o de TCR contenidas en la población de células inmunitarias aisladas. Esto resulta conveniente cuando el formato de la biblioteca de expresión es un formato Fab, donde el componente de cadena pesada o alfa o gamma comprende dominios V h o Va o Vy y Ch o Ca o Cy y el componente de cadena ligera o cadena Vp o cadena Vy comprende dominios de cadena VL o Vp o Vó y CL o p o ó. De nuevo, las bibliotecas de estos fragmentos clonados que comprende toda o parte de las regiones constantes de cadenas de anticuerpo o TCR constituyen aspectos adicionales de la invención.
[0376] Estos ácidos nucleicos pueden comprender convenientemente secuencias además de un polinucleótido de la presente invención. Por ejemplo, puede insertarse en el ácido nucleico un sitio de clonación múltiple que comprenda uno o más sitios de restricción de endonucleasa para contribuir al aislamiento del polinucleótido. También pueden insertarse secuencias traducibles para contribuir al aislamiento del polinucleótido traducido de la presente invención. Por ejemplo, una secuencia marcadora de hexahistidina proporciona un medio conveniente para purificar las proteínas de la presente invención. El ácido nucleico de la presente invención, excluyendo la secuencia codificante, es, opcionalmente, un vector, adaptador o enlazador para clonación y/o expresión de un polinucleótido de la presente invención.
[0377] Las secuencias adicionales se pueden añadir a estas secuencias de clonación y/o expresión para optimizar su función en la clonación y/o expresión, para contribuir en el aislamiento del polinucleótido o para mejorar la introducción
del polinucleótido en una célula. El uso de vectores de clonación, vectores de expresión, adaptadores y enlazadores es conocido en la técnica. (Véase, p. ej., Current Protocols in Molecular Biology (CPMB) (Fred M. Ausubel, et al. ed., John Wiley and Sons, Inc.); o J. Sambrook et al., Molecular Cloning: A Laboratory Manual, 1989, 2a Ed., Cold Spring Harbour Laboratory Press: New York, N.Y.).
[0378] Las bibliotecas divulgadas en la presente pueden emplearse en una variedad de aplicaciones. Tal como se emplea en la presente memoria, una biblioteca comprende una pluralidad de moléculas. En algunos modos de realización, una biblioteca comprende una pluralidad de polinucleótidos. En algunos modos de realización, una biblioteca comprende una pluralidad de cebadores. En algunos modos de realización, una biblioteca comprende una pluralidad de lecturas de secuencia de uno o más polinucleótidos, amplicones o conjuntos de amplicones. Una biblioteca puede almacenarse y emplearse múltiples veces para generar muestras para análisis. Algunas aplicaciones incluyen, por ejemplo, el genotipado de polimorfismos, el estudio del procesamiento del ARN, y la selección de representantes clonales para la secuenciación de acuerdo con los métodos proporcionados en la presente memoria. Las bibliotecas que comprenden una pluralidad de polinucleótidos, como cebadores o bibliotecas para secuenciación o amplificación, pueden generarse, donde una pluralidad de polinucleótidos comprende al menos alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 15000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000, 20.000, 30.000, 40.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, 1.000.000, 50.000.000, 100.000,000 o más códigos de barras moleculares o códigos de barras de recipiente. En algunos modos de realización, las bibliotecas de polinucleótidos comprenden una pluralidad de al menos alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10.000, 11.000, 12.000, 13.000, 14.000, 15.000, 16.000, 17.000, 18.000, 19.000, 20.000, 30.000, 40.000, 50.000, 60.000, 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, 1.000.000, 50.000.000, 100.000,000 o más polinucleótidos únicos, donde cada polinucleótido único comprende uno o más códigos de barras moleculares o códigos de barras de recipiente.
III. Análisis del transcriptoma
[0379] En algunos modos de realización, los métodos proporcionados se pueden emplear para esclarecer la información del transcriptoma para células, que puede combinarse con la captura de la secuencia polinucleotídica diana, por ejemplo, el anticuerpo o el TCR, de una célula concreta. En algunos modos de realización, una célula o una pluralidad de células identificadas por la secuencia de polinucleótido diana pueden caracterizarse por su estado celular transcripcional, incluso con respecto a un estado, rasgo o atributo concreto de la célula. En algunos modos de realización, pueden determinarse perfiles transcriptómicos individualizados de células y proporcionar información relativa a uno o más rasgos de una célula. Entre los ejemplos de tales rasgos se incluyen, sin carácter limitativo, el estado de activación, el estado de proliferación, el estado de agotamiento, el estado de transición, la etapa del ciclo celular u otro parámetro asociado con el estado funcional o fenotípico de la célula.
[0380] En algunos modos de realización, se puede emplear la información del estado para identificar las células que expresan un gen diana concreto, p. ej., anticuerpo o TCR, que exhibe una respuesta deseada o de interés. En algunos aspectos, los métodos proporcionados permiten el apareamiento del perfil transcriptómico de una célula con el polinucleótido diana, p. ej., anticuerpo o t Cr , amplificado o secuenciado de la célula. En modos de realización concretos, la información del transcriptoma y la secuencia del polinucleótido diana se aparean gracias al transcriptoma amplificado y secuenciado y los polinucleótidos diana que presentan el mismo código de barras de recipiente, que identifica perfiles transcriptómicos y polinucleótidos diana que se derivaron de la misma célula.
[0381] En la técnica se conocen varios métodos para el procesamiento de datos del transcriptoma. En algunos aspectos, los datos obtenidos de los métodos se pueden visualizar en un mapa. Se puede elaborar un mapa del número y ubicación de dianas de una muestra empleando la información generada por medio de los métodos descritos en la presente memoria. El mapa se puede emplear para ubicar una ubicación física de una diana. El mapa se puede emplear para identificar la ubicación de múltiples dianas.
[0382] En algunos modos de realización, el sistema comprende medios legibles por ordenador que incluyen código para proporcionar el análisis de datos para los conjuntos de datos de secuencia generados a partir de los métodos proporcionados. Entre los ejemplos de la funcionalidad del análisis de datos que se pueden proporcionar por el software de análisis de datos se incluyen, sin carácter limitativo, (i) algoritmos para la descodificación/demultiplexación del código de barras de recipiente, código de barras molecular, y secuencia diana o datos del transcriptoma de la muestra proporcionados mediante la secuenciación de la biblioteca de polinucleótidos, (ii) algoritmos para la determinación del número de lecturas por gen por célula, y el número de moléculas de transcripción únicas por gen por célula, basándose en los datos, y la creación de tablas de resumen, (iii) el análisis estadístico de los datos de secuencia, p. ej., para la agrupación de células por datos de expresión génica, o para la predicción de intervalos de confianza para las determinaciones del número de moléculas de transcripción por gen y por célula, etc., (iv) algoritmos para la identificación de subpoblaciones de células raras, por ejemplo, empleando el análisis de componentes principales, clúster jerárquico, clúster k-medias, mapas autoorganizados, redes neuronales, etc., (v) capacidades de alineación de secuencias para el
alineamiento de datos de secuencias genéticas con secuencias de referencia conocidas y detectar marcadores mutantes y polimórficos y variantes de empalme, y (vi) clusterización automatizada de etiquetas moleculares para compensar errores de amplificación o secuenciación.
[0383] En algunos modos de realización, se pueden emplear programas computacionales para producir ensamblajes del transcriptoma. Entre los programas computacionales de ejemplo para ensamblajes de lectura corta se incluyen aquellos descritos en Robertson et al., Nat Methods. 2010;7:909-12; Grabherr et al., Nat Biotechnol. 2011;29:644-52; Schulz et al., Bioinformatics. 2012;28:1086-92, y Xie et al., Bioinformatics. 2014;30:1660-6. El ensamblaje del transcriptoma puede ser complicado debido a la amplia variación en los niveles de expresión entre los transcritos, el sesgo de secuenciación y el empalme alternativo. Por lo tanto, la fusión de ensamblajes del transcriptoma en función de las longitudes de k-mer o el uso de un valor fijo de k-mer pueden emplearse para compensar los diferentes grados de abundancia de transcritos y mejorar el ensamblaje del transcriptoma (véase, p. ej., Robertson et al., Nat Methods.
2010;7:909-12, Grabherr et al., Nat Biotechnol. 2011;29:644-52 y Surget-Groba Genome Res. 2010;20:1432-40).
[0384] En algunos modos de realización, el software disponible comercialmente se puede emplear para llevar a cabo todo o una parte del análisis de datos. En algunos modos de realización, el software de análisis de datos puede incluir opciones para proporcionar los resultados de la secuenciación en formatos gráficos útiles, p. ej., mapas de calor que indican el número de copias de uno o más genes que se producen en cada célula de un conjunto de células. En algunos modos de realización, el software de análisis de datos puede comprender, además, algoritmos para la extracción del significado biológico de los resultados de secuenciación, por ejemplo, al correlacionar el número de copias de uno o más genes que se producen en cada célula de un conjunto de células con un tipo de célula, un tipo de célula rara o una célula derivada de un sujeto que padece una enfermedad o afección específica. En algunos modos de realización, el software de análisis de datos puede comprender, además, algoritmos para la comparación de poblaciones de células a lo largo de diferentes muestras biológicas.
[0385] En algunos modos de realización, toda la funcionalidad del análisis de datos puede estar comprendida dentro de un solo paquete de software. En algunos modos de realización, el conjunto completo de las capacidades del análisis de datos puede comprender un conjunto de paquetes de software. En algunos modos de realización, el software de análisis de datos puede ser un paquete independiente que se pone a disposición de los usuarios independientemente del sistema de instrumentos de ensayo. En algunos modos de realización, el software puede estar basado en web y puede permitir a los usuarios compartir datos.
[0386] En algunos ejemplos, el análisis de clúster se puede llevar a cabo para identificar una o más poblaciones celulares diferentes. En algunos ejemplos, las poblaciones celulares están agrupadas en función de la expresión de uno o más genes diana. La presencia, regulación al alza o regulación a la baja de genes o transcritos conocidos, representativos de un estado celular transcripcional, pueden emplearse para agrupar células dentro de una pluralidad de células.
[0387] En algunos modos de realización, los genes del transcriptoma de interés se identifican mediante sus códigos de barras de recipiente y se aparean o se unen a la salida de la amplificación y secuenciación de la molécula diana de longitud completa de interés, por ejemplo, el anticuerpo o el TCR. En consecuencia, mediante la práctica de los métodos proporcionados, cada código de barras de recipiente se aparea o se puede anotar con información de recuentos de genes (p. ej., transcriptoma) y molécula diana (p. ej., anticuerpo o TCR de longitud completa).
[0388] En algunos modos de realización, puede generarse un perfil de expresión, representado por las secuencias de ácido nucleico presentes en el transcriptoma. Los perfiles de expresión pueden generarse de un subconjunto de células, como células que expresan uno o más genes diana, y que comparten un código de barras de recipiente.
IV. Diagnósticos
[0389] En algunos modos de realización, un método puede comprender, además, el diagnóstico, el pronóstico, el seguimiento, la mejora y/o la prevención de una enfermedad, un trastorno, un síntoma y/o una afección en un sujeto. En algunos modos de realización, un método puede comprender, además, el diagnóstico, el pronóstico, el seguimiento, la mejora y/o la prevención de una enfermedad, un trastorno, un síntoma y/o una afección en un sujeto en función de una presencia, una ausencia o un nivel de un polinucleótido diana y/o un estado celular transcripcional concreto, como un estado celular descrito anteriormente en la presente memoria. En algunos modos de realización, un método puede comprender, además, el diagnóstico, el pronóstico, el seguimiento, la mejora y/o la prevención de una enfermedad, un trastorno, un síntoma y/o una afección en un sujeto en función de una presencia, una ausencia o un nivel de uno o más polinucleótidos diana y/o el estado transcripcional de una o más células.
[0390] En algunos modos de realización, un método puede comprender, además, el diagnóstico, el pronóstico, el seguimiento, la mejora y/o la prevención de una enfermedad, un trastorno, un síntoma y/o una afección en un sujeto en función de una presencia, una ausencia, un nivel o una secuencia de una o más de las secuencias obtenidas empleando los métodos descritos en la presente memoria. Por ejemplo, un diagnóstico de una enfermedad puede hacerse en función de una presencia, una ausencia, un nivel o una secuencia de una secuencia variante obtenida empleando los métodos
descritos en la presente memoria. En algunos modos de realización, un método puede comprender, además, el diagnóstico, el pronóstico, el seguimiento, la mejora y/o la prevención de una enfermedad, un trastorno, un síntoma y/o una afección en un sujeto en función de una presencia, una ausencia, un nivel o una secuencia, una o más de las lecturas de secuencia obtenidas empleando los métodos descritos en la presente memoria. En algunos modos de realización, un método puede comprender, además, el diagnóstico, el pronóstico, el seguimiento, la mejora y/o la prevención de una enfermedad, un trastorno, un síntoma y/o una afección en un sujeto en función de una presencia, una ausencia, un nivel o una secuencia de una o más secuencias de consenso obtenidas empleando los métodos descritos en la presente memoria. En algunos modos de realización, un método puede comprender, además, el diagnóstico, el pronóstico, el seguimiento, la mejora y/o la prevención de una enfermedad, un trastorno, un síntoma y/o una afección en un sujeto en función de una determinación de un nivel (p. ej., una cantidad o concentración) de un polinucleótido diana en una muestra. Un nivel de un polinucleótido diana en una muestra puede determinarse en función de una o más lecturas de secuencia, secuencias, secuencias de consenso o cualquier combinación de estos. Un nivel de cada uno de la pluralidad de polinucleótidos diana en una muestra puede determinarse empleando los métodos descritos en la presente memoria. Un nivel de cada uno de una pluralidad de polinucleótidos diana en una muestra puede determinarse en función de un número de lecturas de secuencia, secuencias, secuencias de consenso o cualquier combinación de estos de cada polinucleótido diana en la pluralidad. Por ejemplo, un nivel de un primer polinucleótido diana y un nivel de un segundo polinucleótido diana puede determinarse empleando los métodos descritos en la presente memoria.
[0391] En algunos modos de realización, los primeros y segundos polinucleótidos diana de una pluralidad de polinucleótidos diana son los mismos. Por ejemplo, un primer polinucleótido diana puede comprender una primera copia de una molécula de ARNm y un segundo polinucleótido diana puede comprender una segunda copia de una molécula de ARNm. En algunos modos de realización, los primeros y segundos polinucleótidos diana son diferentes. Por ejemplo, un primer polinucleótido diana puede comprender una primera molécula de ARNm y un segundo polinucleótido diana puede comprender una segunda molécula de ARNm transcrita de un gen distinto al de la primera molécula de ARNm. Por ejemplo, un primer polinucleótido diana puede comprender un primer alelo y un segundo polinucleótido diana puede comprender un segundo alelo. Por ejemplo, un primer polinucleótido diana puede comprender una secuencia de tipo salvaje y un segundo polinucleótido diana puede comprender una secuencia variante.
[0392] En algunos modos de realización, un método puede comprender adicionalmente el diagnóstico o pronóstico de un sujeto con una enfermedad, trastorno, síntoma y/o afección con al menos el 50 % de certeza. Por ejemplo, un diagnóstico o pronóstico de un sujeto con una enfermedad, trastorno, síntoma y/o afección puede determinarse con al menos el 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % o el 100 % de certeza. En algunos modos de realización, un diagnóstico o pronóstico de un sujeto con una enfermedad, trastorno, síntoma y/o afección puede determinarse con un 50 %-100 % de certeza. Por ejemplo, un diagnóstico o pronóstico de un sujeto con una enfermedad, trastorno, síntoma y/o afección puede determinarse con un 60 %-100 %, 70 %-100 %, 80 %-100 %, 90 %-100 %, 50 %-90 %, 50 %-80 %, 50 %- 70 %, 50 %-60 %, 60 %-90 %, 60 %-80 %, 60 %-70 %, 70 %-90 %, 70 %-80 % o un 80 %-90 % de certeza.
[0393] En algunos modos de realización, la presencia, la ausencia, el nivel, la secuencia o cualquier combinación de estos de un polinucleótido diana en el sujeto, como un biomarcador, puede determinarse con al menos el 50 % de certeza. Por ejemplo, la presencia, la ausencia, el nivel, la secuencia o cualquier combinación de estos de un polinucleótido diana en el sujeto puede determinarse con al menos el 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % o el 100 % de certeza. En algunos modos de realización, la presencia, la ausencia, el nivel, la secuencia o cualquier combinación de estos de un polinucleótido diana en el sujeto puede determinarse con un 50 %-100% de certeza. Por ejemplo, la presencia, la ausencia, el nivel, la secuencia o cualquier combinación de estos de un polinucleótido diana en el sujeto puede determinarse con un 60 %-100 %, 70 %-100 %, 80 %-100 %, 90 %-100 %, 50 %-90 %, 50 %-80 %, 50 %-70 %, 50 %-60 %, 60 %-90 %, 60 %-80 %, 60 %-70 %, 70 %-90 %, 70 %-80 % o un 80 %-90 % de certeza.
V. Enzimas
[0394] Los métodos y kits divulgados en la presente memoria pueden comprender una o más enzimas. Entre los ejemplos de enzimas se incluyen, sin carácter limitativo, ligasas, transcriptasas inversas, polimerasas y nucleasas de restricción.
[0395] En algunos modos de realización, la fijación de un adaptador a polinucleótidos comprende el uso de una o más ligasas. Entre los ejemplos de ligasas se incluyen, sin carácter limitativo, ligasas de ADN, como la ligasa de ADN I, ligasa de ADN III, ligasa de ADN IV y ligasa de ADN T4, y ligasas de ARN como ligasa de ARN T4 I y ligasa de ARN T4 II.
[0396] Los métodos y kits divulgados en la presente memoria pueden comprender, además, el uso de una o más transcriptasas inversas. En algunos modos de realización, la transcriptasa inversa es una transcriptasa inversa HIV-1, una transcriptasa inversa MMLV, una transcriptasa inversa AMV y una transcriptasa inversa telomerasa. En algunos modos de realización, la transcriptasa inversa es una transcriptasa inversa M-MLV.
[0397] En algunos modos de realización, los métodos y kits divulgados en la presente memoria comprenden el uso de una o más proteasas.
[0398] En algunos modos de realización, los métodos y kits divulgados en la presente memoria comprenden el uso de una o más polimerasas. Entre los ejemplos de polimerasas se incluyen, sin carácter limitativo, polimerasas del ADN y polimerasas del ARN. En algunos modos de realización, la ADN polimerasa es una ADN polimerasa I, una ADN polimerasa II, una ADN polimerasa III holoenzima y una ADN polimerasa IV. Entre las polimerasas del ADN disponibles comercialmente se incluyen, sin carácter limitativo, ADN polimerasa Bst 2.0, ADN polimerasa Bst 2.0 WarmStart™, ADN polimerasa Bst, ADN polimerasa Sulfolobus IV, ADN polimerasa Taq, ADN polimerasa 9°NTMm, (exo)ADN polimerasa Deep VentR™, ADN polimerasa Deep VentR™, Hemo KlenTaq™, ADN polimerasa LongAmp® Taq, ADN polimerasa OneTaq®, ADN polimerasa Phusion®, ADN polimerasa de alta fidelidad Q5TM, ADN polimerasa Therminator™ y, ADN polimerasa Therminator™, ADN polimerasa Therminator™ II, ADN polimerasa Therminator™ III, ADN polimerasa VentR®, (exo)ADN polimerasa VentR®, ADN polimerasa Bsu, ADN polimerasa phi29, ADN polimerasa T4, ADN polimerasa T7, transferasa terminal, polimerasa Titanium® Taq, ADN polimerasa KAPA Taq y ADN polimerasa KAPA Taq Hot Start.
[0399] En algunos modos de realización, la polimerasa es una ADN polimerasa como una ARN polimerasa I, ARN polimerasa II, ARN polimerasa III, E. coli poli(A) polimerasa, ARN polimerasa phi6 (RdRP), poli(U) polimerasa, ARN polimerasa SP6 y ARN polimerasa T7.
VI. Kits y reactivos adicionales (no forman parte de la invención reivindicada, pero se pueden emplear jun to con los métodos reivindicados)
[0400] En la presente memoria se describen artículos de fabricación o kits que comprenden uno o más reactivos para llevar a cabo los métodos proporcionados. Los kits pueden incluir de manera opcional uno o más componentes como instrucciones de uso, dispositivos y reactivos adicionales (p. ej., agua estéril o soluciones salinas para dilución y/o reconstitución de reactivos o componentes), y componentes, como tubos, contenedores y jeringas para la práctica de los métodos. En algunos modos de realización, los kits pueden contener además reactivos para la recogida de muestras o la preparación y el procesamiento de muestras. En algunas enseñanzas, los kits pueden proporcionarse como artículos de fabricación que incluyen materiales de empaquetado para el empaquetado de los reactivos y componentes del kit. Por ejemplo, los kits pueden contener contenedores, frascos, tubos, viales y cualquier material de empaquetado adecuado para la separación y organización de los componentes del kit.
[0401] Los métodos y kits divulgados en la presente memoria pueden comprender el uso de uno o más reactivos. Entre los ejemplos de los reactivos se incluyen, sin carácter limitativo, reactivos de PCR, reactivos de ligadura, reactivos de transcripción inversa, reactivos enzimáticos, reactivos de hibridación, reactivo de preparación de la muestra, reactivos de captura de afinidad, soportes sólidos, como perlas, y reactivos para purificación y/o aislamiento de ácido nucleico.
[0402] Un soporte sólido puede comprender prácticamente cualquier material insoluble o sólido, y a menudo se selecciona una composición de soporte sólido que es insoluble en agua. Por ejemplo, un soporte sólido puede consistir esencialmente en gel de sílice, vidrio (p. ej., vidrio de poro controlado (CPG)), nylon, Sephadex®, Sepharose®, celulosa, una superficie metálica (p. ej., acero, oro, plata, aluminio, silicio y cobre), un material magnético, un material plástico (p. ej., polietileno, polipropileno, poliamida, poliéster, difluoruro de polivinilideno (PVDF)) y similares, o comprender estos. Entre los ejemplos de perlas para uso de acuerdo con los modos de realización pueden incluir una fracción de afinidad que permite que la perla interactúe con una molécula de ácido nucleico. Una fase sólida (p. ej., una perla) puede comprender un miembro de un par de enlace (p. ej., avidina, estreptavidina o un derivado de estas). Por ejemplo, la perla puede ser una perla recubierta de estreptavidina y una molécula de ácido nucleico para la inmovilización en la perla puede incluir una fracción de biotina. En algunos casos, cada molécula de polinucleótido puede incluir dos moléculas de afinidad, como biotina, para estabilizar aún más el polinucleótido. Las perlas pueden incluir rasgos adicionales para uso en la inmovilización de ácidos nucleicos o que se pueden emplear en procesos de cribado o selección posteriores. Por ejemplo, la perla puede incluir una fracción de enlace, una etiqueta fluorescente o un desactivador fluorescente. En algunos casos, la perla puede ser magnética. En algunos ejemplos, el soporte sólido es una perla. Entre los ejemplos de perlas se incluyen, sin carácter limitativo, perlas de estreptavidina, perlas de agarosa, perlas magnéticas, Dynabeads®, microperlas MACS®, perlas conjugadas con anticuerpos (p. ej., microperla de antiinmunoglobulina), perlas conjugadas con proteína A, perlas conjugadas con proteína G, perlas conjugadas con proteína A/G, perlas conjugadas con proteína L, perlas conjugadas con polinucleótido-dT, perlas de sílice, microperla antibiotina, microperla antifluorocromo y perlas magnéticas terminadas en carboxilo de BcMag™. Las perlas o partículas pueden ser hinchables (p. ej., perlas poliméricas como la resina Wang) o no hinchables (p. ej., CPG). En algunos modos de realización, una fase sólida es esencialmente hidrofílica. En algunos modos de realización, una fase sólida (p. ej., una perla) es esencialmente hidrofóbica. En algunos modos de realización, una fase sólida comprende un miembro de un par de enlace (p. ej., avidina, estreptavidina o un derivado de estas) y es esencialmente hidrofóbico o esencialmente hidrofílico. En algunos modos de realización, una fase sólida comprende un miembro de un par de enlace (p. ej., avidina, estreptavidina o derivado de estas) y presenta una capacidad de enlace superior a alrededor de 1350 picomolares de agente de captura libre (p. ej., biotina libre) por mg de soporte sólido. En algunos modos de realización, la capacidad de enlace de una fase sólida que comprende un miembro de un par de enlace es superior a 800, 900, 1000, 1100, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1600, 1800, 2000 picomoles de agente de captura libre por mg de soporte sólido. Otros ejemplos de perlas que son adecuados para la invención son perlas o coloides de oro como perlas de poliestireno o perlas de sílice. Esencialmente se puede emplear cualquier radio de perla. Entre los ejemplos de perlas se pueden incluir perlas que presentan un radio que oscila entre 150 nanómetros a 10 micras. También se pueden emplear otros tamaños.
[0403] Los métodos y kits divulgados en la presente memoria pueden comprender el uso de uno o más tampones. Entre los ejemplos de tampones se incluyen, sin carácter limitativo, tampones de lavado, tampones de ligadura, tampones de hibridación, tampones de amplificación y tampones de transcripción inversa. En algunos modos de realización, el tampón de hibridación es un tampón disponible comercialmente, como una solución TMAC Hyb, una solución de hibridación SSPE y un tampón de hibridación ECONOTM. Los tampones divulgados en la presente memoria pueden comprender uno o más detergentes.
[0404] Los métodos y kits divulgados en la presente memoria pueden comprender el uso de uno o más portadores. Los portadores pueden aumentar o mejorar la eficiencia de una o más reacciones divulgadas en la presente memoria (p. ej., reacción de ligación, transcripción inversa, amplificación, hibridación). Los portadores pueden reducir o impedir la pérdida no específica de las moléculas o cualesquiera productos de estas (p. ej., un polinucleótido y/o amplicón). Por ejemplo, el portador puede reducir la pérdida no específica de un polinucleótido mediante la absorción a superficies. El portador puede reducir la afinidad de un polinucleótido a una superficie o un sustrato (p. ej., contenedor, tubo Eppendorf, punta de pipeta). Alternativamente, el portador puede aumentar la afinidad de un polinucleótido a una superficie o un sustrato (p. ej., perla, matriz, vidrio, portaobjetos o chip). Los portadores pueden proteger el polinucleótido frente a la degradación. Por ejemplo, los portadores pueden proteger una molécula de ARN frente a las ribonucleasas. Alternativamente, los portadores pueden proteger una molécula de ADN frente a una ADNasa. Entre los ejemplos de portadores se incluyen, sin carácter limitativo, polinucleótidos como ADN y/o ARN, o polipéptidos. Entre los ejemplos de portadores de ADN se incluyen plásmidos, vectores, ADN poliadenilado y polinucleótidos de ADN. Entre los ejemplos de portadores de ARN se incluyen ARN poliadenilado, ARN fago, ARN fago MS2, ARN E. coli, ARN levadura, ARNt levadura, ARN mamífero, ARNt mamífero, ribonucleótidos sintéticos poliadenilados cortos y polinucleótidos del ARN. El portador de ARN puede ser un ARN poliadenilado. Alternativamente, el portador de ARN puede ser un ARN no poliadenilado. En algunos modos de realización, el portador proviene de una bacteria, una levadura o un virus. Por ejemplo, el portador puede ser un polinucleótido o un polipéptido derivado de una bacteria, una levadura o un virus. Por ejemplo, el portador es una proteína de Bacillus subtilis. En otro ejemplo, el portador es un polinucleótido de Escherichia coli. Como alternativa, el portador es un polinucleótido o péptido de un mamífero (p. ej., humano, ratón, cabra, rata, vaca, oveja, cerdo, perro o conejo), ave, anfibio o reptil.
[0405] Los métodos y kits divulgados en la presente memoria pueden comprender el uso de uno o más agentes de control. Los agentes de control pueden incluir polinucleótidos de control, enzimas inactivas y/o competidores no específicos. Como alternativa, los agentes de control comprenden hibridación brillante, controles de sonda brillante, plantillas de ácido nucleico, controles de adición, controles de amplificación por PCR. Los controles de amplificación por PCR pueden ser controles positivos. En otros ejemplos, los controles de amplificación por PCR son controles negativos. Los controles de plantilla de ácido nucleico pueden ser de concentraciones conocidas. Los agentes de control pueden comprender una o más etiquetas.
[0406] Los controles de adición pueden ser plantillas que se han añadido a una reacción o muestra. Por ejemplo, se puede añadir una plantilla de adición a una reacción de amplificación. Se puede añadir la plantilla de adición a la reacción de amplificación en cualquier momento tras el primer ciclo de amplificación. En algunos modos de realización, la plantilla de adición se añade a una reacción de amplificación tras el ciclo número 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45 o 50. Se puede añadir la plantilla de adición a la reacción de amplificación en cualquier momento previo al último ciclo de amplificación. La plantilla de adición puede comprender uno o más nucleótidos o pares de bases de ácido nucleico. La plantilla de adición puede comprender ADN, a Rn o cualquier combinación de estos. La plantilla de adición puede comprender una o más etiquetas.
[0407] En la presente memoria se describen moléculas, materiales, composiciones y componentes que son productos de los métodos y las composiciones divulgados en la presente o que pueden emplearse para estos, en conjunto con estos o en la preparación de estos. Se entiende que cuando estas combinaciones, subconjuntos, interacciones, grupos, etc., de estos materiales se divulgan y que, mientras no se puede divulgar explícitamente la referencia específica de cada uno de las diversas combinaciones y permutaciones individuales y colectivas de estas moléculas y compuestos, cada una se contempla y se describe específicamente en la presente memoria. Por ejemplo, si se divulga y trata un nucleótido o ácido nucleico y se trata un número de modificaciones que se pueden hacer a un número de moléculas que incluyen el nucleótido o el ácido nucleico, cada una y todas las combinaciones y permutaciones del nucleótido o ácido nucleico y las modificaciones posibles se contemplan específicamente a no ser que se indique específicamente lo contrario. Este concepto se aplica a todos los aspectos de esta aplicación que incluyen, sin carácter limitativo, pasos en los métodos de elaboración y uso de los métodos y composiciones divulgados. Por consiguiente, si se da una variedad de pasos adicionales que pueden llevarse a cabo, se entiende que cada uno de estos pasos adicionales pueden llevarse a cabo con cualquier modo de realización específico o combinación de modos de realización de los métodos divulgados, y que cada una de estas combinaciones se contempla específicamente y debería considerarse divulgada.
[0408] Mientras que algunos modos de realización descritos en la presente memoria se han mostrado y descrito en la presente memoria, estos modos de realización se proporcionan tan solo a modo de ejemplo. A los expertos en la técnica se les ocurrirán ahora numerosas variaciones, cambios y sustituciones sin apartarse de la divulgación proporcionada en la presente memoria. Debe entenderse que diversas alternativas a los modos de realización descritos en la presente memoria pueden emplearse en la práctica de los métodos descritos en la presente memoria.
[0409] A no ser que se explique lo contrario, todos los términos técnicos y científicos empleados en la presente memoria poseen el mismo significado que el que entiende comúnmente un experto en la técnica a la que pertenece esta divulgación. Las referencias que siguen contienen modos de realización de los métodos y composiciones que pueden emplearse en la presente memoria: The Merck Manual of Diagnosis and Therapy, 18a Ed., publicado por Merck Research Laboratories, 2006 (ISBN 0-91 19102); Benjamin Lewin, Genes IX, publicado por Jones & Bartlett Publishing, 2007 (ISBN-13: 9780763740634); Kendrew et al. (eds.), The Encyclopedia of Mol. Biology, publicada por Blackwell Science Ltd., 1994 (ISBN 0-632-02182-9); y Robert A. Meyers (ed.), Mol. Biology and Biotechnology: a Comprehensive Desk Reference, publicada por VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8).
[0410] Se describen procedimientos de la presente divulgación, p. ej., en Maniatis et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., EE. UU. (1982); Sambrook et al., Molecular Cloning: A Laboratory Manual (2 ed.), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., EE. UU. (1989); Davis et al, Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, EE. UU. (1986); o Methods in Enzymology: Guide to Molecular Cloning Techniques Vol. 152, S. L. Berger y A. R. Kimmerl (eds.), Academic Press Inc., San Diego, EE. UU. (1987)). Current Protocols in Molecular Biology (CPMB) (Fred M. Ausubel, et al. ed., John Wiley and Sons, Inc.), Current Protocols in Protein Science (CPPS) (John E. Coligan, et al, ed., John Wiley and Sons, Inc.), Current Protocols in Immunology (CPI) (John E. Coligan, et. al., ed. John Wiley and Sons, Inc.), Current Protocols in Cell Biology (CPCB) (Juan S. Bonifacino et. al. ed., John Wiley and Sons, Inc.), Culture of Animal Cells: A Manual of Basic Technique by R. Ian Freshney, Publisher: Wiley-Liss; 5a Ed. (2005), y Animal Cell Culture Methods (Methods in Cell Biology, Vol. 57, Jennie P. Mather y David Barnes eds., Academic Press, 1a Ed., 1998).
VII. Definiciones
[0411] La terminología empleada en la presente memoria tiene el propósito de describir solo casos concretos y no pretende ser limitativa. A no ser que se defina lo contrario, todos los términos de la técnica, notaciones y otros términos y terminología técnicos y científicos empleados en la presente memoria pretenden poseer el mismo significado que el comúnmente entendido por un experto en la técnica a la que pertenece el asunto de estudio reivindicado. En algunos casos, los términos con significados entendidos comúnmente se definen en la presente memoria para mayor claridad y/o facilitar la referencia, y la inclusión de dichas definiciones en la presente memoria no debe interpretarse necesariamente como una diferencia sustancial con respecto a lo que se entiende por lo general en la técnica.
[0412] Tal como se emplean en la presente, las formas singulares «un», «una», «el», «la» pretenden incluir también las formas plurales, a no ser que el contexto claramente indique lo contrario. Además, en la medida en que los términos «incluyendo», «incluye», «presenta», «tiene», «posee», «con», o variantes de estos, se emplean en la descripción detallada y/o las reivindicaciones, estos términos pretenden ser inclusivos de manera similar al término «comprende».
[0413] El término «alrededor» o «aproximadamente» puede significar dentro de un rango de error aceptable para el valor concreto según lo determinado por un experto en la técnica, que dependerá en parte de cómo se mide o determina el valor, es decir, las limitaciones del sistema de medición. Por ejemplo, «alrededor» puede significar dentro de 1 o más de 1 desviación estándar, según la práctica en el arte. De forma alternativa, «alrededor» puede significar un rango de hasta el 20 %, hasta el 10 %, hasta el 5 % o hasta el 1 % de un valor dado. De forma alternativa, concretamente con respecto a los sistemas o procesos biológicos, el término puede significar dentro de un orden de magnitud, dentro de 5 veces, y más preferiblemente dentro de 2 veces, de un valor. Cuando se describan valores particulares en la solicitud y en las reivindicaciones, a menos que se indique lo contrario, debe asumirse que el término «alrededor» significa dentro de un rango de error aceptable para el valor particular.
[0414] Los términos «polipéptido» y «proteína» se emplean indistintamente para referirse a un polímero de residuos de aminoácidos, y no están limitados a una longitud mínima. Los polipéptidos, que incluyen los anticuerpos y cadenas de anticuerpos y otros polipéptidos proporcionados, p. ej., enlazadores y péptidos de enlace, pueden incluir residuos de aminoácidos que incluyen residuos de aminoácidos naturales y/o no naturales. Los términos también incluyen modificaciones tras la expresión del polipéptido, por ejemplo, glicosilación, sialilación, acetilación, fosforilación y similares. En algunos aspectos, los polipéptidos pueden contener modificaciones con respecto a una secuencia nativa o natural, siempre que la proteína mantenga la actividad deseada. Estas modificaciones pueden ser deliberadas, como en el caso de la mutagénesis dirigida al sitio, o pueden ser accidentales, como en el caso de las mutaciones de huéspedes que producen las proteínas o los errores debidos a la amplificación por PCR.
[0415] Una reacción en cadena de la polimerasa (PCR) se refiere a una reacción de amplificación in vitro de secuencias polinucleotídicas mediante la extensión simultánea de cebadores de cadenas complementarias de un polinucleótido de doble cadena. Las reacciones de PCR producen copias de un polinucleótido de plantilla flanqueado por sitios de unión de cebadores. El resultado, con dos cebadores, es un aumento exponencial del número de copias del polinucleótido de plantilla de ambas cadenas con cada ciclo, porque con cada ciclo se replican ambas cadenas. El polinucleótido doble posee terminaciones correspondientes a los extremos de los cebadores empleados. La PCR puede comprender una o más repeticiones de desnaturalización de un polinucleótido de plantilla, alineación de cebadores a sitios de unión del cebador, y la extensión de cebadores mediante una polimerasa del ADN o ARN en presencia de nucleótidos. Las temperaturas concretas, duraciones en cada paso y tasas de variación entre pasos dependen de muchos factores
conocidos para el experto en la técnica. (McPherson et al., IRL Press, Oxford (1991 y 1995)). Por ejemplo, en una PCR convencional empleando ADN polimerasa Taq, un polinucleótido de plantilla bicatenario puede desnaturalizarse a una temperatura >90 °C, los cebadores pueden alinearse a una temperatura en el rango de 50-75 °C, y los cebadores pueden extenderse a una temperatura en el rango de 72-78 °C. En algunos modos de realización, la PCR comprende PCR con transcripción inversa (RT-PCR), PCR en tiempo real, PCR anidada, PCR cuantitativa, PCR multiplexada o similares. En algunos modos de realización, la PCR no comprende RT-PCR. (Patentes de EE. UU. N.° 5,168,038, 5,210,015, 6,174,670, 6,569,627, y 5,925,517; Mackay et al., Nucleic Acids Research, 30: 1292-1305 (2002)). La RT-PCR comprende una reacción de PCR precedida por una reacción de transcripción inversa y un ADNc resultante se amplifica, la PCR anidada comprende una PCR de dos etapas donde un amplicón de una primera reacción de PCR emplea un primer conjunto de cebadores se convierte en la muestra para una segunda reacción de PCR que emplea un segundo conjunto de cebadores, al menos uno que se une a una ubicación interna de un amplicón de una primera reacción de PCR. La PCR multiplexada comprende una reacción de PCR, donde una pluralidad de secuencias polinucleotídicas se somete a la PCR en la misma mezcla de reacción simultáneamente. Los volúmenes de reacción de PCR pueden estar en cualquier punto entre 0.2 pL-1000 pL. La PCR cuantitativa comprende una reacción de PCR designada para medir una cantidad, abundancia o concentración absoluta o relativa de una o más secuencias en una muestra. Las medidas cuantitativas pueden incluir la comparación de una o más secuencias o estándares de referencia con una secuencia polinucleotídica de interés. (Freeman et al., Biotechniques, 26: 112-126 (1999); Becker-Andre et al., Nucleic Acids Research, 17: 9437-9447 (1989); Zimmerman et al., Biotechniques, 21: 268-279 (1996); Diviacco et al., Gene, 122: 3013- 3020 (1992); Becker-Andre et al., Nucleic Acids Research, 17: 9437-9446 (1989)).
[0416] «Nucleótido», «nucleósido», «residuo de nucleótido» y «residuo de nucleósido» como se emplea en la presente memoria, pueden significar un residuo de desoxirribonucleótido o ribonucleótido, u otro análogo nucleósido similar capaz de servir como un componente de un cebador adecuado para uso en una reacción de amplificación (p. ej., reacción de PCR). Estos nucleósidos y derivados de estos pueden emplearse como los bloques estructurales de los cebadores descritos en la presente memoria, salvo cuando se indica lo contrario. Nada en esta solicitud pretende impedir la utilización de derivados de nucleósidos o bases que hayan sido modificados químicamente para mejorar su estabilidad o utilidad en una reacción de amplificación, siempre que la modificación química no interfiera con su reconocimiento por una polimerasa como desoxiguanina, desoxicitosina, desoximidina o desoxiadenina, según corresponda. En algunos modos de realización, los análogos de nucleótido pueden estabilizar la formación de híbridos. En algunos modos de realización, los análogos de nucleótido pueden desestabilizar la formación de híbridos. En algunos modos de realización, los análogos de nucleótido pueden aumentar la especificidad de hibridación. En algunos modos de realización, los análogos de nucleótido pueden reducir la especificidad de hibridación.
[0417] Un «ácido nucleico», o sus equivalentes gramaticales, se refiere a cualquiera de un solo nucleótido o de al menos dos nucleótidos vinculados de manera covalente.
[0418] Un «polinucleótido», o sus equivalentes gramaticales, se refiere a al menos dos nucleótidos vinculados de manera covalente. Un polinucleótido comprende una molécula que contiene dos o más nucleótidos. Un polinucleótido comprende la forma polimérica de nucleótidos de cualquier longitud, ya sean ribonucleótidos, desoxirribonucleótidos o ácidos nucleicos peptídicos (PNA), que comprenden bases de purina y pirimidina, u otras bases de nucleótido naturales, modificadas química o bioquímicamente, no naturales o derivadas de estas. La cadena principal del polinucleótido puede comprender azúcares y grupos fosfato, o grupos de azúcar o fosfato modificados o sustituidos. Un polinucleótido puede comprender nucleótidos modificados, como nucleótidos metilados y análogos de nucleótido. La secuencia nucleotídica puede verse interrumpida por componentes no nucleótidos. Un polinucleótido puede incluir otras moléculas, como otro polinucleótido hibridado. Los polinucleótidos incluyen secuencias de ácido desoxirribonucleico (ADN), ácido ribonucleico (ARN) o ambos. Entre los ejemplos no limitativos de polinucleótidos se incluyen un gen, un fragmento génico, un exón, un intrón, ADN intergénico (incluido, sin carácter limitativo, ADN heterocromático), ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ribozimas, pequeño ARN de interferencia (ARNpi), ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de una secuencia, ARN aislado de una secuencia, sondas de ácido nucleico y cebadores. Los polinucleótidos pueden aislarse de fuentes naturales, recombinantes o sintetizarse artificialmente.
[0419] Los polinucleótidos pueden incluir nucleótidos no estándar, como análogos de nucleótido o nucleótidos modificados. En algunos modos de realización, los nucleótidos no estándar pueden estabilizar la formación de híbridos. En algunos modos de realización, los nucleótidos no estándar pueden desestabilizar la formación de híbridos. En algunos modos de realización, los nucleótidos no estándar pueden aumentar la especificidad de hibridación. En algunos modos de realización, los nucleótidos no estándar pueden reducir la especificidad de hibridación. Entre los ejemplos de modificaciones de nucleótidos no estándar se incluyen 2' O-Me, 2' O-alilo, 2' O-propargilo, 2' O-alquilo, 2' fluoro, 2' arabino, 2' xilo, 2' fluoro arabino, fosforotioato fosforoditioato, fosforoamidatos, 2' amino, pirimidina sustituida por 5-alquilo, 3' desoxiguanosina, pirimidina sustituida por 5 halo, purina sustituida por alquilo, purina sustituida por halo, nucleótidos bicíclicos, 2'MOE, moléculas de PNA, moléculas de LNA, moléculas similares a LNA, diaminopurina, S2T, 5-fluorouracilo, 5-bromouracilo, 5-clorouracilo, 5-iodouracilo, hipoxantina, xantina, 4-acetilcitosina, 5-(carboxihidroxilmetil)uracilo, 5-carboximetilaminometil-2-tiouridina, 5-carboximetilaminometiluracilo, dihidrouracilo, beta-D-galactosilqueosina, inosina, N6-isopenteniladenina, 1-metilguanina, 1-metilinosina, 2,2-dimetilguanina, 2-metiladenina, 2-metilguanina, 3-metilcitosina, 5-metilcitosina, N6-adenina, 7-metilguanina, 5-metilaminometiluracilo, 5-metoxiaminometil-2-tiouracilo, betaD-manosilqueosina, 5'5'-metoxicarboximetiluracilo, 5-metoxiuracilo, 2-metiltio-D46-isopenteniladenina, ácido uracilo-5-oxiacético (v), wibutoxosina, pseudouracilo, queosina, 2-tiocitosina, 5-metil-2-tiouracilo, 2-tiouracilo, 4-tiouracilo, 5-metiluracilo, uracilo-5-oxiacético, ácido uracilo-5-oxiacético (v), 5-metil-2-tiouracilo, 3-(3-amino-3-N-2-carboxipropilo) uracilo, (acp3)w, 2,6-diaminopurina, y sus derivados.
[0420] Un «sujeto», «individuo», «huésped» o «paciente» se refiere a un organismo vivo, como un mamífero. Entre los ejemplos de sujetos y huéspedes se incluyen, sin carácter limitativo, caballos, vacas, camellos, ovejas, cerdos, cabras, perros, gatos, conejos, cobayas, ratas, ratones (p. ej., ratones humanizados), jerbos, primates no humanos (p. ej., macacos), humanos y similares, no mamíferos, incluidos, por ejemplo, vertebrados no mamíferos, como aves (p. ej., pollos o patos) peces (p. ej., tiburones) o ranas (p. ej., Xenopus) e invertebrados no mamíferos, así como especies transgénicas de estos. En ciertos aspectos, un sujeto se refiere a un solo organismo (p. ej., humano). En ciertos aspectos, se proporciona un grupo de individuos que componen una pequeña cohorte que posee un factor inmunológico común de estudio y/o para la enfermedad, y/o una cohorte de individuos sin la enfermedad (p. ej., control negativo/normal). Un sujeto del que se obtienen las muestras puede padecer una enfermedad y/o trastorno (p. ej., una o más alergias, infecciones, cánceres o trastornos autoinmunes o similares) y puede compararse con un sujeto de control negativo que no padezca la enfermedad.
[0421] Un «kit» se refiere a un sistema de suministro de materiales o reactivos para llevar a cabo un método divulgado en la presente memoria. En algunos modos de realización, los kits incluyen sistemas que permiten el almacenamiento, transporte o suministro de reactivos de reacción (p. ej., sondas, enzimas, etc. en los contenedores adecuados) y/o materiales de apoyo (p. ej., tampones, instrucciones escritas para llevar a cabo el ensayo, etc.) de una ubicación a otra. Por ejemplo, los kits incluyen uno o más cerramientos (p. ej., cajas) que contienen los reactivos de reacción relevantes y/o materiales de apoyo. Estos contenidos pueden administrarse al receptor previsto en conjunto o por separado. Por ejemplo, un primer contenedor puede contener una enzima para uso en un ensayo, mientras que un segundo contenedor contiene una pluralidad de cebadores.
[0422] Un «polipéptido» se refiere en algunos aspectos a una molécula que comprende al menos dos aminoácidos. En algunos modos de realización, el polipéptido consiste en un solo péptido. En algunos modos de realización, un polipéptido comprende dos o más péptidos. Por ejemplo, un polipéptido puede comprender al menos alrededor de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 o 1000 péptidos o aminoácidos. Entre los ejemplos de polipéptidos se incluyen, sin carácter limitativo, cadenas de aminoácidos, proteínas, péptidos, hormonas, sacáridos polipeptídicos, lípidos, glicolípidos, fosfolípidos, anticuerpos, enzimas, quinasas, receptores, factores de transcripción y ligandos.
[0423] Una «muestra» se refiere, en algunos aspectos, a una muestra biológica, ambiental, médica, de un sujeto o de un paciente o a una muestra que contiene un polinucleótido, como un polinucleótido diana.
[0424] «Farmacéuticamente aceptable» se refiere a entidades y composiciones moleculares que son tolerables fisiológicamente y no suelen producir una reacción alérgica o adversa similar, como malestar gástrico, mareo y similares, cuando se administran a un ser humano.
[0425] «Prevención» se refiere a la profilaxis, la prevención de la aparición de los síntomas, la prevención de la progresión de una enfermedad o un trastorno asociado con niveles excesivos de proteína o correlacionados con actividad proteica.
[0426] «Inhibición», «tratamiento» y «tratar» se emplean indistintamente y se refieren, por ejemplo, al estancamiento de los síntomas, prolongación de la supervivencia, mejora total o parcial de los síntomas, y erradicación total o parcial de una afección, una enfermedad o un trastorno asociado con niveles excesivos de proteína o correlacionados con actividad proteica. Por ejemplo, el tratamiento del cáncer incluye, sin carácter limitativo, estancamiento, eliminación total o parcial de un tumor o crecimiento canceroso. El tratamiento o eliminación parcial incluye, por ejemplo, una reducción del tamaño y/o del volumen del tumor o crecimiento como por ejemplo alrededor de 2 veces, alrededor de 3 veces, alrededor de 4 veces, alrededor de 5 veces, alrededor de 10 veces, alrededor de 20 veces, alrededor de 50 veces o cualquier reducción intermedia. Del mismo modo, el tratamiento o la eliminación parcial puede incluir una reducción porcentual del tamaño y/o volumen del tumor o crecimiento de alrededor del 1 %, 2 %, 3 %, 4 %, 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 % o cualquier reducción porcentual intermedia.
[0427] Si una de las definiciones establecidas en el presente documento es contraria o incoherente con una definición establecida en las patentes, solicitudes, aplicaciones publicadas y otras publicaciones a las que se hace referencia en la presente memoria, la definición establecida en la presente memoria prevalece sobre la definición de la referencia.
[0428] A continuación se describen numerosos aspectos con referencia a las aplicaciones de ejemplo a modo de ilustración. Debe entenderse que numerosos detalles, relaciones y métodos específicos se exponen para proporcionar una comprensión completa de los rasgos descritos en la presente memoria. Un experto en la técnica relevante, no obstante, reconocerá fácilmente que los rasgos descritos en la presente memoria pueden ponerse en práctica sin uno o más de los detalles específicos o con otros métodos. Los rasgos descritos en la presente memoria no están limitados por
el orden ilustrado de los actos o eventos, dado que algunos actos pueden tener lugar en diferentes órdenes y/o simultáneamente con otros actos o eventos. Además, no se requieren todos los actos o eventos ilustrados para implementar una metodología de acuerdo con las características aquí descritas.
[0429] Los títulos de las secciones utilizados en el presente documento tienen tan solo fines organizativos y no deben interpretarse como una limitación del asunto de estudio descrito.
VIII. Ejemplos
[0430] Los siguientes ejemplos se incluyen meramente para fines ilustrativos y no pretenden limitar el alcance de la invención.
Ejemplo 1 - Codificación con código de barras de transcritos en emulsión para secuenciación de polinucleótido de célula única
A. Preparación de células
[0431] Las suspensiones de células únicas para llevar a cabo la secuenciación de polinucleótidos de célula única se obtuvieron a partir de células mononucleares de sangre periférica (PBMC) totales. Se extrajeron aproximadamente 50 mL de sangre en tubos de preparación celular Vacutainer CPT con heparina sódica (BD), centrifugados durante 20 min a 1800 x g, lavados dos veces en tampón de preparación celular (1x PBS suplementados con 2 % de suero bovino fetal y 2 mM de EDTA), empleando espíns a 200 x g para eliminar plaquetas, y las PBMC resultantes se criopreservaron en medio RPMI-1640 (Life Technologies) 20 % de suero bovino fetal a -80 °C hasta que se necesitaron. Antes de la generación de la emulsión, las PBMC se descongelaron, se lavaron dos veces mediante centrifugación (200 x g durante 10 min) en tampón celular: 1 x tampón fosfato salino (PBS) de Dulbecco. Después, las células se diluyeron en tampón celular hasta una concentración celular de 3.5x106 células/mL. A continuación, se pipeteó la suspensión a través de un colador de células de 20 pm.
B. Codificación con código de barras en emulsión
[0449] Se formó una emulsión que contenía las células preparadas y una mezcla de reacción. La mezcla de reacción se preparó como un concentrado 2x que se mezcló con una proporción de volumen de 1:1 con la suspensión celular durante el proceso de formación de gotículas.
1. Preparación de la mezcla de reacción de emulsión
[0433] Se mezcló a temperatura ambiente una mezcla de reacción de emulsión, que contenía los reactivos y oligonucleótidos en la tabla E1 a continuación, en una campana libre de PCR.
2. Generación de bibliotecas de transcritos con código de barras doble de células únicas
[0434] En las FIG 1A y la FIG. IB se muestra un resumen de un método de ejemplo para la generación de bibliotecas de polinucleótidos con código de barras doble. Se formó una emulsión empleando las células preparadas y la mezcla de reacción. La plataforma de generación de emulsiones incluía tres bombas Mitos P (Dolomite Microfluidics) accionadas por un único compresor de aire, cada una con un sensor de velocidad de flujo Mitos, para permitir el flujo controlado por ordenador de dos fases acuosas y una fase continua de aceite fluorofílico en un chip Dolomite Small de dos reactivos de cuarzo recubierto fluorofílicamente. Un canal de entrada acuoso contenía las células a la densidad requerida para producir el nivel de ocupación de células por gotícula deseado (en algunos modos de realización este nivel de ocupación de células por gotícula deseado es uno), mientras que el segundo canal acuoso contenía la mezcla de la lisis y la reacción.
[0435] Se empleó una jeringa Hamilton Microliter de 100 pL para sobrecargar un bucle de muestra de tubo PEEK de 100 pl de diámetro interno en dos inyecciones de aproximadamente 100 pl cada una de la mezcla de reacción. Se empleó una jeringa Hamilton Gastight de 100 pL para cargar aproximadamente 110 pL de la suspensión celular en un bucle de tubo FEP de ~110 pL, 0.2 mm de diámetro interno. El bucle se fijó a un rotador mecánico que invertía constantemente el bucle celular aproximadamente una vez cada 1-2 segundos para evitar que las células se asentaran y/o se agruparan. La emulsión se formó mediante el vertido de flujo concentrado de las fases acuosas a velocidades de flujo idénticas a través de un chip de reactivo Dolomite 2 con flujo de aceite simultáneo desde los dos canales de aceite del chip. Los canales de aceite exteriores contenían un surfactante a base de polietilenglicol de 0.5-5.0 % (p/v) en aceite de fluorocarbono HFE7500 (Novec 7500). Se hizo correr el vertido de emulsión a una velocidad de flujo constante (igual en los canales de la fase celular y de la fase de reacción). La salida del chip de emulsión se recogió a través de un tubo de PEEK de 12 cm y 0,5 mm de diámetro interno, dejándolo caer en tubos de tiras de PCR de 0,2 mL (Eppendorf) que se mantuvieron a aproximadamente 0 °C en un bloque refrigerado.
[0436] El exceso de aceite se retiró del fondo de cada tubo con una micropipeta capilar. Cada fracción de emulsión se superpuso suavemente con 40 pl de solución de superposición: 25 mM de Na-EDTA, pH 8.0.
[0437] Las emulsiones se incubaron en un termociclador para la reacción de marcado de transcritos. Brevemente, durante un paso de transcripción inversa de 45 min, se transcribió el ARN de forma inversa a 42 °C con un cebador de RT específico de poli-A (cebador oligo-dT) (SEQ ID NO: 1), con la adición basada en cambio de plantilla de una secuencia de adaptador universal (SEQ ID NO: 3) que contiene un código de barras molecular aleatorio (véase p. ej., la FIG. 1A). Tras la RT, las emulsiones se sometieron a 40 ciclos de termociclado (cada ciclo: 82 °C durante 10 sec, 65 °C durante 25 sec) para llevar a cabo la amplificación por PCR de las plantillas de código de barras de recipiente (SEQ ID NO: 2), que se diluyeron en la lisis inicial y la mezcla de reacción hasta las 30.000 copias (cp)/pL, generando una concentración en la mezcla final de 15.000 cp/pL o ~1 por ~65 pL de gotícula (véase, p. ej., la FIG. 1B). Un extremo del código de barras de recipiente (al que en la presente memoria también se hace referencia como «código de barras de gotícula») contiene el sitio de cebado de la lectura 2 de Illumina («P7») (SEQ ID NO: 77), mientras que el otro extremo coincide con la secuencia común del oligonucleótido adaptador universal (SEQ ID NO: 4). Por lo tanto, durante la PCR, los ADNc cambiados de plantilla podrían alinearse con las cadenas amplificadas del código de barras del recipiente y empalmarse por extensión solapada para producir productos de longitud completa que contengan las secuencias de código de barras molecular y de código de barras del recipiente.
[0438] Los métodos descritos arriba pueden adaptarse para añadir un adaptador tal como se describe en el ejemplo 5 y emplearse para el análisis del transcriptoma y específico de diana tal como se describe en los ejemplos 6-8.
Ejemplo 2 - Codificación con código de barras de transcritos en emulsión empleando cebadores específicos de diana para secuenciación de polinucleótido de célula única
A. Preparación de células
[0439] Se extrajeron 50 mL de sangre en tubos de preparación celular Vacutainer CPT con heparina sódica (BD), centrifugados durante 20 min a 1800 x g, lavados dos veces en tampón de preparación celular (1x PBS suplementados con 2 % de suero bovino fetal y 2 mM de EDTA), empleando espíns a 200 x g para eliminar plaquetas, y las PBMC resultantes se criopreservaron en medio RPMI-1640 (Life Technologies) 20 % de suero bovino fetal a -80 °C hasta que se necesitaron. Antes de la generación de la emulsión, las PBMC se descongelaron y se lavaron dos veces en el tampón de preparación celular y el contador. Las células B se aislaron empleando un kit de enriquecimiento de células B humanas basado en la selección negativa (Stem Cell Technologies). Se hizo pasar las células a través de un colador de células de 20 micras y se diluyeron hasta 6.2E+06 células/ml (experimento de 3 millones de células B) o 3.1E+06 células/ml (experimentos de donante de PGT y de tumor ovárico) en el tampón de preparación celular.
B. Codificación con código de barras de inmunoreceptor en emulsión
[0440] La plataforma de generación de emulsiones consistía en tres bombas Mitos P (Dolomite Microfluidics) accionadas por un único compresor de aire, cada una con un sensor de velocidad de flujo Mitos, para permitir el flujo controlado por ordenador de dos fases acuosas y una fase continua de aceite fluorofílico en un chip Dolomite Small de 2 reactivos de cuarzo recubierto fluorofílicamente. Un canal de entrada acuoso contenía las células a la densidad requerida para producir el nivel de ocupación de células por gotícula deseado, mientras que el segundo canal acuoso contenía la mezcla de lisis y reacción, que consistía en el tampón de reacción y oligonucleótidos según se indica en la Tabla E2 a continuación, 5 unidades/pL de transcriptasa inversa basada en MuMLV (Thermo Scientific) y 0,1 unidades/pL de PCR de polimerasa Herculase II. Se empleó una jeringa Hamilton Microliter de 100 pL para sobrecargar un bucle de muestra de tubo PEEK de 100 pl de diámetro interno en dos inyecciones de ~100 pl cada una de la mezcla de LR. Se empleó una jeringa Hamilton Gastight de 100 pL para cargar ~110 pL de la suspensión celular en un bucle de tubo FEP de ~110 pL, 0.2 mm de diámetro interno. La emulsión se formó mediante el vertido de flujo concentrado de las fases acuosas a velocidades de flujo idénticas a través del chip de 2 reactivos con flujo de aceite simultáneo desde los dos canales de aceite del chip. La emulsión que salía del canal de salida del chip se dejó gotear en tubos de tiras de PCR de 0.2 ml (Eppendorf) sobre un bloque frío, tras lo cual se eliminó el exceso de aceite con una pipeta desde el fondo del tubo, se añadieron 40 pl de solución de superposición (25 mM de Na-EDTA, pH 8.0) y se transfirieron los tubos a un termociclador estándar para la reacción de marcado de transcritos.
[0441] Durante un paso de transcripción inversa (RT) de 45 minutos se transcribió el ARN de forma inversa a 42 °C con cebadores de RT específicos de diana (Table E2) con la adición basada en cambio de plantilla de una secuencia de
adaptador universal que contenía un código de barras molecular tal como se ha descrito anteriormente (Shugay, M. et al. «Towards error-free profiling of immune repertoires». Nat. Methods 11,653-655 (2014); Islam, S. et al. «Highly multiplexed and strand-specific single-cell RNA 5' end sequencing». Nat. Protoc. 7, 813-828 (2012)) (véase, p. ej., la FIG. 1A). Tras la RT, las emulsiones se sometieron a 40 ciclos de termociclado (cada ciclo: 82 °C durante 10 sec, 65 °C durante 25 sec) para llevar a cabo la amplificación por PCR de las plantillas de código de barras de gotícula, que se diluyeron en la lisis inicial y la mezcla de reacción hasta las 30000 cp/pL, generando una concentración en la mezcla final de 15000 cp/pL o ~1 por ~65 pL de gotícula. Un extremo del código de barras de recipiente (código de barras de gotícula) comprendía el sitio de cebado de la lectura 2 de Illumina («P7») (SEQ ID NO: 77), mientras que el otro extremo coincide con la secuencia común del oligonucleótido adaptador universal (SEQ ID NO: 4) (véase, p. ej., la FIG. 1B). Por lo tanto, durante la PCR, los ADNc cambiados de plantilla pueden alinearse con las cadenas amplificadas del código de barras del recipiente y empalmarse por extensión solapada para producir productos de longitud completa que contengan las secuencias diana del código de barras molecular y del código de barras del recipiente.
[0442] Los métodos descritos arriba se pueden adaptar para incluir cebadores para transcribir de forma inversa el transcriptoma o una porción de este, como mediante la inclusión de oligonucleótidos hexámeros aleatorios durante la fase de transcripción inversa. Estos métodos también pueden adaptarse para añadir un adaptador tal como se describe en el ejemplo 5 y emplearse para el análisis del transcriptoma y específico de diana tal como se describe en los ejemplos 6-8.
Ejemplo 3 - Método de codificación con código de barras de transcritos de una secuencia diana y un transcriptoma en emulsión para la secuenciación de polinucleótido de célula única
A. Preparación de células
[0443] La suspensión de PBMC criopreservada se descongeló rápidamente y se añadió a 10 volúmenes de RPMI+10% FBS a temperatura ambiente. Las células se sedimentaron por centrifugación a 350 * g durante 8 minutos y se volvieron a suspender en RPMI 10 % de a 2 * 10A6 células/mL. Las PBMC se dejaron reposar en una incubadora de cultivo tisular durante aproximadamente 16 horas.
[0444] Las PBMC reposadas se cocultivaron con células autólogas presentadoras de antígeno en un radio de aproximadamente 10 : 1 PBMC : APC. En este caso, las APC eran células dendríticas autólogas derivadas de monocitos que habían sido expuestas a células HeLa irradiadas e infectadas por VHS. El cocultivo se incubó durante 5 horas. Sin pretender limitar el método descrito en la presente memoria, se contempla que un periodo de incubación de unas 5 horas es suficiente para permitir que las células específicas de antígeno expresen nuevos ARNm en respuesta al antígeno, o en respuesta a las citocinas liberadas en el medio por otras células.
[0445] Las PBMC se retiraron del cocultivo pipeteando suavemente hacia arriba y hacia abajo y pasando a un nuevo tubo. Las células se colocaron en hielo y se lavaron en el tampón CELL (20 g/L de gelatina de piel de pescado (Biotium), 155 mM de KCl, 0,05% de azida sódica, 5 mM de HEPES-Na pH 7.5) 2 mM de EDTA, luego en el tampón CELL, y finalmente se colaron a través de un colador de malla de 20 micras y se volvieron a suspender en el tampón CELL. Se contaron las células y se evaluó la viabilidad mediante tinción con naranja de acridina y yoduro de propidio. La densidad celular final se ajustó a 3.5 * 10A6 células viables (yoduro de propidio negativo)/mL y se mantuvo en hielo.
[0446] La suspensión celular se calentó y colocó de nuevo en hielo durante 1 min. inmediatamente antes de la generación de emulsión.
B. Codificación con código de barras en emulsión
[0447] Como en el ejemplo anterior, se formó una emulsión que contenía las células preparadas y una mezcla de reacción para una posterior reacción de etiquetado de transcripciones para la adición de un código de barras molecular y un código de barras de recipiente a las moléculas de polinucleótidos de una sola célula. La mezcla de reacción se preparó como un concentrado 2x, que se mezcló con una proporción de volumen de 1:1 con la suspensión celular durante el proceso de formación de gotículas.
1. Preparación de la mezcla de reacción de emulsión
[0448] Se preparó la mezcla de reacción, que contenía los reactivos y oligonucleótidos en la tabla E3 a continuación. Los oligos VB 1 (SEQ ID NO: 6), 2 (SEQ ID NO: 7), 3 (SEQ ID NO: 8) y 4 (SEQ ID NO: 9) se añadieron como una mezcla equimolar para producir un conjunto de amplicones con desplazamiento de bases (escalonado) para aumentar la diversidad durante la secuenciación. La mezcla de reacción se cargó en el bucle de muestra de reacción del aparato generador de emulsión descrito en el ejemplo anterior.
2. Generación de bibliotecas de transcritos con código de barras doble de células únicas
[0449] Se formó una emulsión empleando las células preparadas y la mezcla de reacción. La plataforma de generación de emulsiones incluía tres bombas Mitos P (Dolomite Microfluidics) accionadas por un único compresor de aire, cada una con un sensor de velocidad de flujo Mitos, para permitir el flujo controlado por ordenador de 2 fases acuosas y una fase continua de aceite fluorofílico en un chip Dolomite Small de dos reactivos de cuarzo recubierto fluorofílicamente. Un canal de entrada acuoso contenía las células a la densidad requerida para producir el nivel de ocupación de células por gotícula deseado, mientras que el segundo canal acuoso contenía la lisis y la mezcla de reacción.
[0450] Se empleó una jeringa Hamilton Microliter de 100 pL para sobrecargar un bucle de muestra de tubo PEEK de 100 pl de diámetro interno en dos inyecciones de aproximadamente 100 pl cada una de la mezcla de reacción. Se empleó una jeringa Hamilton Gastight de 100 pL para cargar aproximadamente 110 pL de la suspensión celular en un bucle de tubo FEP de ~110 pL, 0.2 mm de diámetro interno. El bucle se fijó a un rotador mecánico que invertía constantemente el bucle celular aproximadamente una vez cada 1 -2 segundos para evitar que las células se asentaran y/o se agruparan. La emulsión se formó mediante el vertido de flujo concentrado de las fases acuosas a velocidades de flujo idénticas a través de un chip Dolomite de 2 reactivos con flujo de aceite simultáneo desde los dos canales de aceite del chip. Los canales de aceite exteriores contenían un surfactante a base de polietilenglicol de 0.5-5.0 % (p/v) en aceite de fluorocarbono HFE7500 (Novec 7500). Se hizo correr el vertido de emulsión a una velocidad de flujo constante (igual en los canales de la fase celular y de la fase de reacción). La salida del chip de emulsión se recogió a través de un tubo de PEEK de 12 cm y 0,5 mm de diámetro interno, dejándolo caer en 4 tubos de tiras de PCR de 0.2 mL replicados (Eppendorf) que se mantuvieron a aproximadamente 0 °C en un bloque refrigerado. El exceso de aceite se retiró del fondo de cada tubo con una micropipeta capilar.
[0451] Las emulsiones se incubaron en un termociclador para la reacción de marcado de transcrito. Brevemente, la reacción se preenfrió a 4 °C durante 10 minutos. A continuación, durante un paso de transcripción inversa (RT) de 45 min, se transcribió el ARN de forma inversa a 37 °C, con cebadores específicos de diana o con cebado aleatorio basado en la unión de los oligonucleótidos hexámeros, y la adición basada en el cambio de plantilla de una secuencia de adaptador universal que contenía un código de barras molecular aleatorio, generando moléculas de ADNc cada una con un identificador molecular único (código de barras). Tras la RT, la temperatura se mantuvo a 94 °C durante 10 min. Las emulsiones se sometieron, a continuación, a 50 ciclos de termociclado (cada ciclo: 83 °C durante 10 sec (desnaturalización), 65 °C durante 25 sec (extensión)) para amplificar el oligo de código de barras de recipiente. Tras la amplificación del oligo de VB, la emulsión se sometió a 10 ciclos de termociclado de temperatura más alta (cada ciclo: 95 °C durante 10 sec (desnaturalización), 63 °C durante 25 sec (alineación), 72 °C durante 2 min 20 sec (extensión)). Tras la finalización de los ciclos de termociclado, la emulsión se mantuvo a 4 °C.
Ejemplo 4 - Purificación de ADNc con código de barras doble
[0452] Para cada tubo de fracción de emulsión, seguido a los transcritos de ADNc con código de barras doble generados en el ejemplo anterior, se rompió la emulsión (tras la PCR) mediante la mezcla con un volumen equivalente a 1:1 (v:v) de perfluorooctanol:FC-40, y se añadió EDTA a la concentración final de 5 mM para detener la polimerización del ADNc. Aproximadamente se añadió 0.1 de volumen de proteasa Qiagen y la emulsión rota se incubó a 50 °C durante 10 a 15 minutos, seguido a la inactivación térmica de la proteasa al incubar los tubos a 95 °C durante 3 minutos. El tubo se centrifugó brevemente y la fase acuosa superior se transfirió a un tubo nuevo.
[0453] El ADNc con código de barras doble se concentró y se desaló mediante purificación con 1.8 volúmenes de AMPure XP (Beckman Coulter) de acuerdo con las instrucciones del fabricante. El ADNc se eluyó de las perlas y desnaturalizó mediante la adición de 8 pL de 0.1 M de hidróxido de sodio 1 mM de EDTA y calentamiento hasta 50 °C durante 3 minutos. Si los productos de longitud completa contenían biotina debido a la biotinilación en 5' del cebador de RT, dichos productos de longitud completa se separaron de los productos de PCR con código de barras de gotícula en exceso mediante la limpieza en perlas de estreptavidina,
[0454] Tras añadir 2 pl de colorante de carga de ADN 6X (New England Biolabs), el ADNc monocatenario desnaturalizado se separó en un gel de agarosa al 1.5 % (p/v) en NaOH 30 mM 1 mM de EDTA a 5 V/cm durante 35 minutos. Una vez neutralizado el pH del gel, se extirpó el gel que contenía ADNc dentro del rango de tamaño correspondiente a 100 - 1000 nt, y se purificó el ADNc de la agarosa extirpada con un kit de recuperación de ADN (p. ej., kit de recuperación de gel de ADN Zymoclean™, Zymo Research), con elución en 20 pl de 10 mM Tris-Cl, pH 8.5 0.05 % TWEEN® 20. El ADNc se desaló adicionalmente con 1.8 volúmenes de perlas AMPure XP y se eluyó en 10.5 pl de Tris-Cl 10 mM, pH 8.0 0,05 % de TWEEN® 20 calentándolo a 95 °C durante 10 seg y precipitándolo mediante la colocación en hielo.
Ejemplo 5 - Ligadura de la secuencia de adaptador 3' a transcritos de ADNc con código de barras doble [0455] Una secuencia de adaptador, que contenía un sitio de cebado conocido, se añadió a los transcritos de ADNc con código de barras doble generados tal como se describe en el ejemplo 3, y tras la purificación tal como se describe en el ejemplo 4. La adición de la secuencia de adaptador permite la amplificación, clonación y secuenciación, como la secuenciación de última generación, de todos los transcritos con un cebador conocido. Se conocen numerosas secuencias
de adaptador y se emplean de forma rutinaria para secuenciación, como la secuencia de adaptador P5 de ejemplo empleada en la presente memoria.
1. Métodos de adición de la secuencia de adaptador 3'
[0456] Se emplearon varios métodos para añadir una secuencia de adaptador al extremo 3' desconocido de las secuencias de ADNc monocatenario con código de barras doble. Las ligasas, como la ligasa Thermostable App (NEB) y CircLigase II (Epicentre), que se ligan como un adaptador de ADNss, se emplearon para la adición de una secuencia de adaptador al extremo 3' de los transcritos de ADNc con código de barras doble. También se empleó un kit comercial de (kit de ADN Accel-NGS 1S de Swift Biosciences) basado en la adición enzimática de nucleótidos sin plantilla al extremo 3' del ADNc para la adición de una secuencia de adaptador. Además, se emplearon métodos que emplean un empalme redundante alineado con el adaptador que sobresale del extremo 3' del ADNc, con salientes redundantes de hasta 6 nucleótidos (esto es, NNNNNN; Se Q ID NO: 24). Para los salientes redundantes, parece que NNNNNN (SEQ ID NO: 24) era el que mejor funcionaba en los protocolos probados.
2. Adición de la secuencia de adaptador 3' a ADNc con código de barras doble por medio de un empalme redundante con un saliente de 6-nucleótidos
[0457] Se formó una molécula de adaptador de empalme doble al mezclar los oligonucleótidos que contenían una secuencia de cebado P5 corta, /5Phos/ AGATCGGAAGAGCGTCGTGT /3AmMO/ (SEQ ID NO: 25) y un oligonucleótido de empalme indicado como ACACGACGCTCTTCCGATCT NNNNNN /3AmMO/ (SEQ ID NO: 26) en una proporción de 1.2:1. Se añadió el tampón de alineación a 30 mM de HEPES-Na pH 7.5, 0.1 M de KCl. La solución se calentó a 85 °C durante 2 minutos en un termociclador y se dejó enfriar hasta 37 °C a una velocidad de 0.1°C/sec.
[0458] Los transcritos de ADNc con código de barras doble, recuperados de la parte A arriba, se mezclaron luego con la solución de adaptador de empalme. Los adaptadores se ligaron después a los transcritos de ADNc mediante la adición de un volumen equivalente de Blunt/TA Ligase Master Mix (New England Biolabs) a la mezcla y su incubación a temperatura ambiente. El ADN adaptador en exceso se eliminó mediante la purificación de la mezcla con AMPure XP y la elución del ADN en 10 mM de Tris-Cl, pH 8.0 0.05% TWEEN® 20.
Ejemplo 6 - Amplificación por PCR y secuenciación de biblioteca de transcriptoma A. Amplificación de la biblioteca de polinucleótidos
[0459] Las secuencias purificadas etiquetadas con código de barras doble y adaptador universal se amplificaron por PCR durante 8 ciclos, mediante un cebador directo complementario a la secuencia de adaptador universal C7 (SEQ ID NO: 28), situado en 5' del código de barras doble y de la secuencia de codificación del transcrito (extremo 5' del transcrito de ADNc), y un cebador inverso complementario a la secuencia de adaptador universal P5 (SEQ ID NO: 27), situado 3' del código de barras doble y de la secuencia de codificación del transcrito (extremo 3' del transcrito de ADNc) (PCR0).
[0460] La mezcla de reacción de PCR0 (que contenía ADNc ligado con adaptador) (generado en el ejemplo 5), polimerasa del ADN, un cebador directo C7, un cebador inverso P5, dNTP y tampón de reacción) se desnaturalizó inicialmente a 98 °C durante 1 min, seguido de 8 ciclos de termociclado (cada ciclo: 98 °C durante 10 seg, 69 °C durante 20 seg, 72 °C durante 10 seg) y un periodo de extensión final 2 min a 72 °C. Tras la finalización de la PCR, la mezcla se mantuvo a 4 °C.
[0461] Cada secuencia de ADNc generada por PCRO contenía una secuencia de adaptador C7, secuencias de un código de barras de recipiente (para la secuenciación de células huésped), un código de barras molecular (para la identificación de transcritos), un transcrito y una secuencia de adaptador p 5. La biblioteca amplificada (producto de PCRO) se purificó entonces empleando perlas AMPure XP y se eluyó en 10 mM de Tris-Cl, pH 8.0 0.05 % TWEEN® 20.
[0462] La biblioteca de transcriptoma purificada se empleó entonces para secuenciar uno o más de los siguientes: uno o más genes diana de longitud completa, como un receptor inmunitario, el transcriptoma de todas las células de la emulsión y/o el transcriptoma de una o más células seleccionadas dentro de la emulsión, tal como se describe debajo.
B. Secuenciación de genes diana
1. PCR1: amplificación de gen(es) diana
[0463] Para la amplificación de un gen diana seleccionado, se amplificó un producto de PCR0 mediante el cebador universal directo empleado para la PCR0 (cebador P7-index-C7; SEQ ID NO: 28) y un cebador inverso específico de la(s) diana(s) deseada(s) (p. ej., cebadores específicos de receptores de inmunoglobulina o de las células T). Los cebadores de ejemplo empleados para la reacción de PCR1 figuran en la Tabla E4 a continuación.
[0464] La mezcla de reacción de PCR1 (que contenía producto de PCR0 (generado en la parte A arriba), polimerasa del ADN, un cebador directo C7-index-P7, un cebador inverso específico de diana, dNTP y tampón de reacción) se desnaturalizó inicialmente a 98 °C durante 1 min, seguido de 10 ciclos de termociclado (cada ciclo: 98 °C durante 10 seg, 61 °C durante 20 seg, 72 °C durante 20 seg) y un periodo de extensión final de 2 min a 72 °C. Tras la finalización de la PCR1, la mezcla se mantuvo a 4 °C. El producto de PCR1 (secuencia(s) de genes diana) se purificó con perlas AMPure XP, y se eluyó en 10 mM de Tris-Cl, pH 8.0 0.05 % TWEEN® 20.
2. PCR2: amplificación de gen diana, añadiendo secuencia de adaptador de secuenciación 3'
[0465] Se amplificó el producto de PCR1 purificado mediante un cebador directo C7 (SEQ ID NO: 39) y cebadores específicos de diana que contenían una secuencia de cebado universal P5 corta. Los cebadores de ejemplo empleados para la reacción de PCR2 figuran en la Tabla E5 a continuación.
[0466] La mezcla de reacción de PCR2 (que contenía el producto de PCR1 (generado en la parte B 1 arriba), polimerasa del ADN, cebador directo C7 (SEQ ID NO: 39), un cebador inverso P5 corto específico de diana, dNTP y tampón de reacción) se desnaturalizó inicialmente a 98 °C durante 1 min, seguido de 6 ciclos de termociclado (cada ciclo: 98 °C durante 10 seg, 65 °C durante 20 seg, 72 °C durante 20 seg) y un periodo de extensión final de 2 min a 72 °C. Tras la finalización de la PCR2, la mezcla se mantuvo a 4 °C. El producto de PCR2 (secuencia(s) de genes diana) se purificó con perlas AMPure XP y se eluyó en 10 mM de Tris-Cl, pH 8.0 0.05% TWEEN® 20.
3. PCR cuantitativa (PCRq3) y secuenciación de gen diana
[0467] El producto de PCR2 o PCRO purificado se empleó para PCR cuantitativa (PCRq) para determinar el número de ciclos de amplificación para lograr el punto final de la PCRq3. El material preamplificado ligado al adaptador de la PCR0, o el material de IG o TR de longitud completa de la PCR2, se amplificó con los cebadores C7 (directo; SEQ ID NO: 39) y C5-P5 (inverso; SEQ ID NO: 76).
[0468] Brevemente, la mezcla de reacción de PCRq3 (que contenía producto de PCR0 o PCR2 (generado en las partes A o B1 arriba, respectivamente), polimerasa del ADN, un cebador directo C7 (SEQ ID NO: 39), un cebador inverso C5-P5 (SEQ ID NO: 76), dNTP, EvaGreen y tampón de reacción) se desnaturalizó inicialmente a 98 °C durante 1 min, seguido de 3 ciclos de termociclado (cada ciclo: 98 °C durante 10 seg, 60 °C durante 20 seg, 72 °C durante 20 sec), seguido de 30 ciclos de una segunda ronda de termociclado (cada ciclo: 98 °C durante 10 seg, 70 °C durante 20 seg, 72 °C durante 20 seg). El gráfico de intensidad de PCRq se inspeccionó para determinar el ciclo de amplificación en el que la intensidad de la fluorescencia era máxima pero la amplificación del ADN aún no había terminado. Se determinó que este era el número de ciclo final para el punto final de la PCRq3.
[0469] T ras determinar el número de ciclos de PCR necesarios para amplificar cada biblioteca hasta la fase exponencial, se repitió la misma PCR de forma no cuantitativa hasta el número de ciclos deseado y se purificó con 1 AMPure XP y se eluyó en 10 mM de Tris-Cl, pH 8.0 0.05 % de TWEEN® 20. Opcionalmente, los resultados de la PCRq3 se normalizaron por medio de DASH (Gu et al., Genome Biology 2016, 17:41). Los resultados se analizaron en una cinta Agilent Tapestation D1000, se cuantificaron con el kit KAPA NGS Quant para Illumina y se secuenciaron con el kit Illumina NextSeq de alto rendimiento de 75 ciclos (por ejemplo, 32 ciclos de lectura 1, 6 ciclos de lectura de índice 17, 54 ciclos
de lectura 2) para la biblioteca ligada al adaptador, o el kit MiSeq de Illumina V3 de 600 ciclos (por ejemplo, 325 ciclos de lectura 1, 6 ciclos de lectura de índice 17, 300 ciclos de lectura 2) para las bibliotecas de IG y TR de longitud completa. En algunos casos, el secuenciador de NextSeq empleó 56 ciclos de una lectura 1, 6 ciclos de una lectura de índice 17 y 33 ciclos de una lectura 2.
C. Secuenciación de transcriptomas de todas las células
[0470] Para generar una biblioteca del transcriptoma de todas las células, se llevaron a cabo las reacciones de PCR1, PCR2 y PCR3q descritas arriba, excepto la sustitución de los cebadores inversos específicos de diana por cebadores inversos universales dirigidos a la secuencia de adaptador 3' (por ejemplo, SEQ ID NOS: 27 y 76), para uso en conjunto con los cebadores directos universales (p. ej., SEQ ID NOS: 28 y 39) para amplificación. Por lo tanto, se pueden emplear cebadores directos e inversos universales para secuenciar todos los transcritos de todas las células en la emulsión.
D. Secuenciación de transcriptoma de células seleccionadas
[0471] Para generar una biblioteca del transcriptoma a partir de células seleccionadas, las reacciones de PCR1, PCR2 y PCRq3 se llevan a cabo como se ha descrito anteriormente, excepto por el uso de cebadores directos que son complementarios al código de barras de recipiente (VB) de una célula o células deseadas, como una célula o células que contienen una molécula de Ig o un TCR de interés secuenciado en la parte A anterior, y cebadores inversos universales dirigidos a la secuencia de adaptador 3' (p. ej., SEQ ID NOS: 27 y 76).
Ejemplo 7 - Análisis de datos de secuencia
[0472] Las lecturas de MiSeq se procesaron para generar secuencias de consenso de longitud completa para moléculas de ARNm y gotículas, anotadas con IgBLAST e IMGT/HighV-QUEST, y procesadas con scripts personalizados y el paquete Change-0 para generar estadísticas y figuras. Las lecturas de MiSeq se demultiplexaron empleando software de Illumina. Las posiciones con una calidad inferior a Phred 5 se enmascararon con Ns. Los cebadores específicos del isotipo, los códigos de barras de recipiente (VB), los códigos de barras moleculares (MB) y las secuencias de adaptador se identificaron en el amplicón y se recortaron, utilizando pRESTO MaskPrimers-cut con un error máximo de 0.2.
A. Análisis de datos de secuencia de datos de la secuencia de inmunoreceptor seleccionada
[0473] En un ejemplo, se prepararon y secuenciaron las secuencias de longitud completa de los receptores inmunitarios seleccionados. Se generó una secuencia de consenso de lectura 1 y una secuencia de consenso de lectura 2 por separado para cada ARNm a partir de lecturas agrupadas por el identificador molecular único (UMI, por sus siglas en inglés) que comprende el VB y el MB juntos, que son réplicas de PCR que surgen de la misma molécula original de ARNm de origen. Los grupos de lecturas de UMI se alinearon con MUSCLE y se empleó pRESTO para elaborar secuencias de consenso con los parámetros que siguen: maxdiv = 0.1; bf PRIMER; prfreq = 0.6; maxmiss = 0.5; q = 5; > 60 % de concordancia de la secuencia del cebador de PCR llamado para el grupo de lecturas; máxima diversidad de nucleótidos = 0.1; utilizando la regla de la mayoría en las posiciones de indel; y enmascarando las columnas de alineación con baja calidad posterior (consenso). Las secuencias de consenso de los extremos emparejados se unieron en dos rondas. En primer lugar, se optimizó la alineación sin grapado de los extremos de la secuencia de consenso de cada par de lecturas utilizando una aproximación de puntuación Z y se puntuó con un valor p binomial, tal y como se implementó en pRESTO AssemblePairsalign con los siguientes parámetros: longitud mínima = 8; alfa 1xlO5; y error máximo = 0.3. Para los pares de lecturas que no se pudieron unir de esta manera, se intentó llevar a cabo la unión mediante los exones V de la línea germinal del b Cr y el TCR humanos para estructurar cada lectura antes de unir o volver a colindar las lecturas con espacios, por medio de los parámetros de AssemblePairs-reference de pRESTO: identidad mínima = 0.5; valor e 1x\lO 5.
1. Anotación de segmento V D J y confirmación de isotipo
[0474] Se utilizaron IgBLAST, Change-0 y scripts personalizados para identificar los genes de origen V(D)J de la línea germinal, recortar las secuencias de ARNm a una región V(D)J, identificar las regiones CDR3 y calcular la mutación a partir de las secuencias nucleotídicas V de la línea germinal. IgBLAST cuenta los Ns como desapareamientos, pero las secuencias de ARNm con más de 6 Ns de la región V se filtraron para los análisis de mutaciones y el análisis de precisión del emparejamiento de las fracciones cruzadas. En el caso de las cadenas pesadas de IG, la identidad del isotipo se confirmó mediante el apareamiento de las regiones C no cebadoras (exones de la región constante) con las secuencias esperadas mediante los parámetros de puntuación de pRESTO MaskPrimers: inicio = 0; error máximo = 0.2. Se descartaron los amplicones con llamadas identificaciones de regiones C cebadoras/no cebadoras, excepto dos combinaciones cebadoras/no cebadoras en las que se resolvió un evento específico de superposición de cebadores mediante inspección visual.
2. Agrupación de secuencias V(D)J en linajes clonales
[0475] Las secuencias V(D)J se agruparon en clones por medio de la clusterización de enlace único con una distancia intraclonal ponderada. La clusterización se llevó a cabo con el paquete Change-0 DefineClones con los parámetros de
grupo: modelo = mln; gen = primero; dist = 4.0; norm = ninguno. Primero, todas las secuencias de consenso de las cadenas funcionales de Ig V h se depositaron en contenedores de unión V-J, de forma que las secuencias que posiblemente surgieran del mismo evento de recombinación inicial se agruparan juntas (basándose en el gen de Ig V h mejor apareado, el gen de Ig Jh mejor apareado y la longitud de la unión identificada por IMGT/HighV-QUEST. El umbral de la distancia intraclonal se eligió generando un histograma de las distancias entre los vecinos más cercanos dentro de cada contenedor de Ig Vh utilizando la función distToNearest del paquete shm de Change-0, e inspeccionando visualmente el histograma en busca de un límite de distancia natural (en el valle de un histograma bimodal). Se definieron clústeres de cadenas ligeras empleando el mismo modelo y umbral de distancia.
3. Filtrado de gotícula, cálculo de la fidelidad de emparejamiento
[0476] La certeza del emparejamiento pesado-ligero se evaluó de dos maneras independientes: utilizando la concordancia de secuencias de ARNm intragotícula y la concordancia de par interreplicado. La concordancia intragotícula de ARNm se definió como la diferencia media de nucleótidos por pares (pi de Nei < 0.02) de las secuencias V(D)J dentro de un locus. Las secuencias de ARNm se recortaron hasta secuencias codificantes de nucleótidos V(D)J mediante las anotaciones de IgBLAST. Dentro de cada gotícula, todas las secuencias de ARNm productivas se agruparon por locus V. Dentro de cada grupo, se alinearon múltiples secuencias por medio de MUSCLE, tal como se implementó en pRESTO AlignSets empleando los parámetros por defecto. Se construyeron cadenas de consenso de gotículas a partir de múltiples ARNm por locus mediante los parámetros de pRESTO BuildConsensus.py; div máx = 0.2; per máx = 0.5. Se utilizaron gotículas mezcladas aleatoriamente para seleccionar el corte de diversidad pi <0.02. En las gotículas mezcladas, menos del 0,01 % de los loci de cadena pesada (<0.2% de los loci de cadena ligera) cumplían este criterio. Se separaron las gotículas multicelulares o con inmunoreceptores para análisis de mayor precisión.
[0477] La precisión de emparejamiento se calculó en función de la observación del mismo par de clones a través de múltiples réplicas (experimentos de emulsión separados), centrándose en aquellos clústeres de VDJ que probablemente contengan un único linaje, es decir, que surjan de un único reordenamiento V(D)J y VJ seguido de expansión. Pueden surgir reordenamientos VDJ similares dentro de un individuo múltiples veces independientes, dando lugar al mismo reordenamiento V(D)J de cadena pesada emparejado nativamente con múltiples reordenamientos VJ de cadena ligera diferentes. Debido a que los reordenamientos V(D)J poco frecuentes proporcionarían una medida más exacta de la precisión técnica lograda por los métodos descritos en la presente memoria, los CDR3 largos y pesados (CDR3H) para un enfoque para este este análisis (como un proxy para reordenamientos V(D)J más raros). También se eliminaron las secuencias con > 6N para aumentar la certeza en la asignación clonal. La precisión del emparejamiento aumentó con la longitud de CDR 3 H hasta más del 96 % para el cuartil de clones más largo observado en todas las fracciones (2,604 clones con una longitud de unión >54 nt). Dado que la probabilidad de concordancia entre pares de clones es la probabilidad conjunta de los pares verdaderos en dos experimentos independientes, la precisión del emparejamiento se estimó como la raíz cuadrada de la concordancia de emparejamiento entre las réplicas, calculada como sigue, donde
#
di
n
,
i
es el número de códigos de barras de recipiente d con el clon pesado emparejado h y el clon ligero 1, y encontrados en la fracción física f. La precisión de emparejamiento media (al cuadrado) para cada experimento se estima promediando, sobre los clones pesados h y todos los pares de fracciones (f, g), la concordancia de los clones ligeros emparejados (1, k):
pares pesados ligeros consistentes en todas las fracciones
pares totales donde se observó el clon pesado en todas las fracciones
[0478] Por lo tanto, la precisión media de cada experimento, (dentro de la varianza de la precisión entre experimentos) fue del 96.1 % según este experimento de ejemplo.
B. Análisis de datos de secuencia de transcriptoma
[0479] Para los datos de la secuencia del transcriptoma, las lecturas que comprendían el mismo VB se agruparon, y las secuencias se alinearon con un genoma humano de referencia para identificar los transcritos (HiSAT2). Se manipuló el alineamiento del archivo de salida mediante samtools y se asignaron las lecturas a los transcritos por ubicación genómica.
[0480] Para cada mapeo VB-genoma, las lecturas se agruparon por MB. Se elaboró una matriz de recuentos de MB, mapeada para cada gen de referencia individual por gotícula. A continuación, se fusionaron estos datos con datos diana, p. ej., datos de la secuencia inmunoreceptora procesados tal como se describe arriba en la parte A. Se anotaron los datos de cada VB (gotícula) con recuentos génicos e información del receptor. Los conjuntos de datos combinados se analizaron entonces para examinar el perfil de secuencia de ARN de una sola célula (secARNsc). La reducción, clusterización y visualización dimensionales se llevaron a cabo por medio de t-SNE, Seurat, ZIFA, PCA, LDA y otros programas de ejemplo.
Ejemplo 8 - Ejemplo de análisis de datos de secuencia transcriptómica de alto rendimiento y trazado de una multitud de células únicas
[0481] Se prepararon alrededor de 7000 PBMC y se secuenciaron los transcriptomas y los receptores BCR y TCR de longitud completa como se describe en general en los Ejemplos 4A y 4B, anteriormente.
[0482] Antes del análisis mediante Illumina NextSeq, las bibliotecas de secuenciación transcriptómica de la emulsión, preparadas tal como se describe en el Ejemplo 4B, se analizaron mediante D1000 DNA tapestation. El transcriptoma se representó mediante secuencias cuyo tamaño oscilaba entre 170-900 pb aproximadamente. Las secuencias de TCR de longitud completa, secuenciadas mediante secuenciación dirigida descrita en el ejemplo 4A, también fueron analizadas mediante D1000 DNA tapestationantes del análisis NextSeq, que indicó picos de TCR alfa y beta en 628 y 664 pb, respectivamente.
[0483] Tras el análisis NextSeq, todos los perfiles celulares de gotículas > 1000 lecturas (n = 6,707) se analizaron mediante la incrustación de vecinos estocásticos distribuidos en t (t-SNE) y la clusterización Seurat. Los datos del transcriptoma de célula única multidimensional se visualizaron mediante gráficos t-SNE, y las células se codificaron por colores según la clusterización Seurat de células con un perfil transcripcional similar (FIG. 3A) o por la naturaleza del inmunoreceptor secuenciado (esto es, BCR (rojo/gris medio) o TCR (verde/gris oscuro)) (FIG. 3B), que muestran la clusterización de células con fenotipos similares.
[0484] Se analizaron los datos del transcriptoma para los genes de ejemplo en las células secuenciadas y se identificó la información de la secuencia con el mismo código de barras del receptor inmunitario secuenciado como procedente de la misma célula. Los datos del transcriptoma de una sola célula para los genes de ejemplo del transcriptoma se codificaron por colores basándose en un mapa de calor de los niveles de expresión y se muestran para el receptor tipo Toll 7 (TLR7; FIG. 4A), la glicoproteína de superficie de las células T cadena épsilon CD3 (CD3E; FIG.4B), la proteína granular de las células asesinas naturales 7 (NKG7; FIG. 4C), MRC1 receptor de manosa tipo C (MRC1; FiG. 4D).
[0485] Estos resultados indican que los perfiles de expresión de ARN de todo el genoma pueden capturarse junto con los receptores inmunitarios de una manera de alto rendimiento, ya que los marcadores génicos asociados con las células T (CD3E) o las células B (TLR7) se clusterizaron por lo general en las células que expresaban un TCR o BCR de longitud completa, respectivamente. Asimismo, los marcadores génicos que no están asociados a las células T o B, como el marcador de células NK de ejemplo NKG7 o el marcador de ejemplo de monocitos MRC1, no parecían clusterizarse en las células con los receptores inmunitarios TCR o BCR de longitud completa.
[0486] La presente invención no pretende verse limitada en alcance a los modos de realización concretos divulgados, que se proporcionan, por ejemplo, para ilustrar distintos aspectos de la invención. Varias modificaciones a las composiciones y los métodos descritos serán evidentes a partir de la descripción y enseñanzas en la presente memoria.
SECUENCIAS
Claims (21)
1. Método de producción de una biblioteca de polinucleótidos, comprendiendo el método:
(a) la lisis de células dentro de cada uno de una pluralidad de recipientes, donde cada uno de dichos recipientes comprende una célula de una población de células, y además comprende una pluralidad de oligonucleótidos con código de barras molecular, uno o un acervo de oligonucleótidos con código de barras de recipiente, y un primer adaptador o un acervo de primeros adaptadores;
(b) la producción, en cada recipiente, de una pluralidad de polinucleótidos complementarios, comprendiendo dicha producción:
(i) la producción de uno o más polinucleótidos diana que sean complementarios a uno o más transcritos de polinucleótido diana presentes en la célula empleando uno o más cebadores específicos de diana; y
(ii) la producción de un conjunto de polinucleótidos, cada uno de los cuales es individualmente complementario a una transcripción de polinucleótido en la célula;
(c) la fijación a una pluralidad de polinucleótidos complementarios de uno de la pluralidad de oligonucleótidos con código de barras molecular, generando así una pluralidad de polinucleótidos con código de barras molecular, comprendiendo cada uno un código de barras molecular;
(d) la fijación de uno del uno o un acervo de oligonucleótidos con código de barras de recipiente, o de un producto amplificado de este, y el primer adaptador o uno del acervo de primeros adaptadores, o un producto amplificado de este, a una pluralidad de los polinucleótidos con código de barras molecular, generando así una pluralidad de polinucleótidos con código de barras doble;
(e) la producción de un amplicón monocatenario de una pluralidad de la pluralidad de polinucleótidos con código de barras doble; y
(f) la adición de un segundo adaptador a cada uno de los amplicones monocatenarios, donde el primer adaptador y el segundo adaptador están presentes en extremos opuestos, o cerca de estos, de cada uno de los polinucleótidos monocatenarios con código de barras doble,
donde el primer adaptador y/o el segundo adaptador comprenden al menos un sitio de cebado universal.
2. Método de la reivindicación 1, donde:
el uno o más polinucleótidos diana comprenden una secuencia de codificación de longitud completa de un gen diana; y/o
el conjunto de polinucleótidos en (ii) se produce empleando cebadores oligoméricos aleatorios.
3. Método de la reivindicación 1 o 2, donde el código de barras molecular de cada uno de los polinucleótidos con código de barras molecular es distinto de los códigos de barras moleculares comprendidos por otros polinucleótidos con código de barras molecular dentro de la pluralidad o es un código de barras molecular único; y los polinucleótidos con código de barras doble son polinucleótidos monocatenarios con código de barras doble, comprendiendo cada uno un código de barras molecular y un código de barras de recipiente, donde cada uno de los polinucleótidos con código de barras doble en el mismo recipiente comprende el mismo código de barras de recipiente.
4. Método de cualquiera de las reivindicaciones 1-3, donde el primer adaptador comprende el oligonucleótido con código de barras de recipiente.
5. Método de cualquiera de las reivindicaciones 1-4, donde el recipiente es un pocillo, una emulsión, una gotícula o una microcápsula.
6. Método de cualquiera de las reivindicaciones 1-5, donde el conjunto de polinucleótidos de cada célula del recipiente, colectivamente, comprende secuencias complementarias a transcritos de polinucleótido de un transcriptoma o un transcriptoma parcial de cada célula, opcionalmente donde el transcriptoma o transcriptoma parcial comprende al menos el 60 %, 70 %, 75 %, 80 %, 85 % 90 % 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de los transcritos presentes en el genoma de la célula.
7. Método de cualquiera de las reivindicaciones 1-6, donde:
cada uno o uno o más de los polinucleótidos complementarios de (b) es un ADNc, y/o
cada uno o uno o más de los polinucleótidos monocatenarios con código de barras es una cadena de ADNc.
8. Método de cualquiera de las reivindicaciones 1-7, donde:
el primer adaptador y el segundo adaptador son diferentes; y/o
el primer adaptador comprende un primer sitio de cebado universal y el segundo adaptador comprende un segundo sitio de cebado universal, opcionalmente donde el primer sitio de cebado universal y el segundo sitio de cebado universal son diferentes.
9. Método de cualquiera de las reivindicaciones 1-8, donde la adición del segundo adaptador comprende la hibridación de un oligonucleótido de empalme a cada uno de los polinucleótidos monocatenarios con código de barras en presencia de un oligonucleótido que comprende un segundo sitio de cebado universal, donde el oligonucleótido de empalme comprende (i) una secuencia complementaria al segundo sitio de cebado universal y (ii) una secuencia saliente redundante capaz de alinearse aleatoriamente al extremo 3' del polinucleótido monocatenario con código de barras, opcionalmente donde, antes de la hibridación, el oligonucleótido de empalme y el oligonucleótido que comprende el segundo sitio de cebado universal se alinean para formar un adaptador de empalme doble, y/u opcionalmente donde:
la secuencia saliente redundante comprende la secuencia (N)3-12, donde N es cualquier nucleótido;
la secuencia saliente redundante comprende la secuencia NNNNNN, donde N es cualquier nucleótido (SEQ ID NO: 24);
el oligonucleótido de empalme comprende la secuencia
ACACGACGCTCTTCCGATCTNNNNNN, donde N es cualquier aminoácido (SEQ ID NO: 26); y/o
el oligonucleótido que comprende el segundo sitio de cebado universal comprende la secuencia AGATCGGAAGAGCGTCGTGT (SEQ ID NO: 25).
10. Método de cualquiera de las reivindicaciones 1-9, donde el oligonucleótido con código de barras de recipiente:
comprende al menos o alrededor de al menos 3 nucleótidos;
comprende o comprende alrededor de 10 a 30 nucleótidos;
comprende una secuencia redundante;
comprende la secuencia (N)14-17, donde N es cualquier nucleótido, opcionalmente donde al menos uno o dos N en la secuencia son W, donde W es adenina o timina; y/o
comprende la secuencia NNNNWNNNNWNNNN (SEQ ID NO: 80), WNNNNWNNNNWNNNN (SEQ ID NO: 81), NWNNNWNNNNWNNNN (SEQ ID NO: 82) o NNWNNNNWNNNNWNNNN (SEQ ID NO: 83), donde N es cualquier nucleótido y W es adenina o timina.
11. Método de cualquiera de las reivindicaciones 1-10, donde cada recipiente comprende un acervo de primeros adaptadores que comprende un acervo de oligonucleótidos con código de barras de recipiente, donde cada oligonucleótido con código de barras de recipiente del acervo de primeros adaptadores comprende al menos un desplazamiento de base o una adición de base en comparación con al menos uno de los otros oligonucleótidos con código de barras de recipiente en el acervo, opcionalmente donde los oligonucleótidos con código de barras de recipiente del acervo de primeros adaptadores comprenden las secuencias NNNNWNNNNWNNNN (SEQ ID NO: 80), WNNNNWNNNNWNNNN (SEQ ID NO: 81), NWNNNWNNNNWNNNN (SEQ ID NO: 82) y NNWNNNNWNNNNWNNNN (SEQ ID NO: 83), donde N es cualquier nucleótido y W es adenina o timina.
12. Método de cualquiera de las reivindicaciones 1-11, donde:
(A) en el paso (d) el método además comprende:
(i) amplificación:
de uno o del acervo de oligonucleótidos con código de barras de recipiente; o
de uno o del acervo de primeros adaptadores, donde los primeros adaptadores comprenden el uno o el acervo de oligonucleótidos con código de barras de recipiente, donde:
la amplificación se lleva a cabo antes de la fijación del oligonucleótido con código de barras de recipiente o de manera simultánea; y/o
(ii) la expansión de cada uno de la pluralidad de los polinucleótidos con código de barras molecular después la fijación para generar una pluralidad de polinucleótidos con código de barras doble; y/o
(B) en el paso (b):
(i) el uno o más polinucleótidos diana se producen mediante la transcripción inversa del/de los polinucleótido(s) diana en presencia de una transcriptasa inversa y uno o más cebadores específicos de diana complementarios a una secuencia diana del/de los polinucleótido(s) diana, opcionalmente donde el uno o más cebadores específicos de diana comprenden uno o más cebadores complementarios a (una) secuencia(s) de la(s) secuencia(s) diana del polinucleótido diana y/o el uno o más cebadores específicos de diana comprenden cebadores para una secuencia
diana de una pluralidad de polinucleótidos diana, codificando cada uno una molécula inmunitaria o una cadena de esta;
(ii) el conjunto de polinucleótidos se produce mediante la transcripción inversa de transcritos de polinucleótido en la célula en presencia de una transcriptasa inversa y uno o más cebadores de transcriptoma complementarios a un transcrito de polinucleótido en la célula, donde el uno o más cebadores de transcriptoma comprenden una polisecuencia (T) o una mezcla de cebadores de oligonucleótidos hexámeros aleatorios; y/o
(iii) la producción de la pluralidad de polinucleótidos complementarios comprende el uso de una transferasa terminal sin plantilla, opcionalmente donde la transferasa terminal sin plantilla es una transcriptasa inversa o una polimerasa, y donde tres o más nucleótidos sin plantilla, ribonucleótidos o análogos de estos se añaden al extremo 3' de cada polinucleótido complementario producido; y/o
(C) en el paso (c):
la fijación comprende la hibridación de una región de uno de la pluralidad de oligonucleótidos con código de barras molecular a los tres o más nucleótidos sin plantilla de cada uno de los polinucleótidos complementarios, opcionalmente donde la pluralidad de oligonucleótidos con código de barras molecular se proporcionan como una pluralidad de oligonucleótidos de cambio de plantilla, comprendiendo cada uno una porción 3' complementaria a los tres o más nucleótidos sin plantilla; opcionalmente donde el oligonucleótido de cambio de plantilla además comprende una región terminal 5' que es complementaria a una porción del primer adaptador, donde el primer adaptador comprende el oligonucleótido con código de barras de recipiente.
13. Método de cualquiera de las reivindicaciones 1-12, donde el uno o más polinucleótidos diana comprenden:
un polinucleótido de una molécula inmunitaria o de una cadena de esta;
al menos dos polinucleótidos diana, comprendiendo cada uno un polinucleótido de una cadena de molécula inmunitaria;
un polinucleótido de un TCR o de una cadena de este;
un primer polinucleótido de un polinucleótido receptor de las células T alfa (TCRa) y un segundo polinucleótido de un polinucleótido receptor de las células T (TCRp);
un primer polinucleótido de un polinucleótido receptor de las células T gamma (TCRy) y un segundo polinucleótido de un polinucleótido receptor de las células T delta (TCRdelta; TCR6);
un polinucleótido de un anticuerpo o de una cadena de este; y/o
un primer polinucleótido de una cadena pesada de inmunoglobulina (IgH) y un segundo polinucleótido de una cadena ligera de inmunoglobulina (IgL).
14. Método de cualquiera de las reivindicaciones 1-13, donde los polinucleótidos monocatenarios con código de barras doble comprenden por orden (5' a 3'): el primer adaptador, el código de barras de recipiente, el código de barras molecular y el segundo adaptador.
15. Método de cualquiera de las reivindicaciones 1-14, donde:
uno o más de los pasos (a)-(f) se llevan a cabo en solución y/o no se llevan a cabo en presencia de un soporte sólido, opcionalmente donde el soporte sólido es o comprende una perla;
al menos los pasos (c) y (d) se llevan a cabo en solución y/o no se llevan a cabo en presencia de un soporte sólido, opcionalmente donde el soporte sólido es una perla;
cada uno o más de los pasos (a)-(e) se lleva a cabo en solución y/o no se lleva a cabo en presencia de un soporte sólido, opcionalmente donde el soporte sólido es una perla; y/o
la población de células comprende al menos, o alrededor de al menos, 1 * 103, 5 * 103, 1 * 104, 5 * 104, 1 * 105, 5 * 105, 1 * 106, o 5 * 106 células.
16. Método de cualquiera de las reivindicaciones 1-15, donde la población de células comprende células inmunitarias, opcionalmente donde la célula inmunitaria es un linfocito o un subtipo de este, una célula B o un subtipo de esta, una célula T o un subtipo de esta, o una combinación de estas, opcionalmente una célula T que es una célula T CD4+ o una célula T CD8+.
17. Método de cualquiera de las reivindicaciones 1-16, que además comprende la amplificación de la pluralidad de polinucleótidos monocatenarios con código de barras, generando así una pluralidad de plantillas de polinucleótido, opcionalmente donde la amplificación de la pluralidad de polinucleótidos monocatenarios con código de barras se lleva a cabo en presencia de un primer conjunto de cebadores que comprende un primer cebador complementario a la primera secuencia de adaptador y un segundo cebador complementario a la segunda secuencia de adaptador, opcionalmente donde el primer y/o el segundo cebador es un cebador universal.
18. Biblioteca de polinucleótidos que comprende una pluralidad de polinucleótidos con código de barras producidos mediante el método de cualquiera de las reivindicaciones 1-17.
19. Método de secuenciación de uno o más polinucleótidos diana y/o un transcriptoma completo o parcial de una o más células, que comprende la secuenciación de uno o más de la pluralidad de polinucleótidos con código de barras doble producidos mediante el método de cualquiera de las reivindicaciones 1-17 o a partir de la biblioteca de polinucleótidos de la reivindicación 18, comprendiendo los polinucleótidos con código de barras doble un código de barras molecular y un código de barras de recipiente, opcionalmente donde el método además comprende:
(1) la amplificación del transcriptoma completo o de una porción de este previa a la secuenciación, opcionalmente donde la amplificación se lleva a cabo empleando un primer conjunto de cebadores que comprende un primer cebador y un segundo cebador específicos para la primera y la segunda secuencia del adaptador, respectivamente;
(2) la amplificación del uno o más polinucleótidos diana a partir de la pluralidad de polinucleótidos con código de barras doble previa a la secuenciación, opcionalmente donde se amplifica(n) la(s) secuencia(s) de longitud completa del uno o más polinucleótidos diana;
(3) la determinación del origen celular del uno o más polinucleótidos con código de barras doble; y/o
(4) la cuantificación o determinación del número de polinucleótidos con el mismo código de barras molecular.
20. Método para el análisis del transcriptoma, comprendiendo el método:
(a) la secuenciación de uno o más polinucleótidos diana a partir de la pluralidad de polinucleótidos con código de barras producidos mediante el método de cualquiera de las reivindicaciones 1-17 o a partir de la pluralidad de polinucleótidos con código de barras de la biblioteca de polinucleótidos de la reivindicación 18, donde los polinucleótidos con código de barras son polinucleótidos con código de barras doble que comprenden un código de barras molecular y un código de barras de recipiente, generando así información de secuencia para el polinucleótido diana a partir de la pluralidad de células;
(b) la secuenciación del transcriptoma completo o de una porción de este a partir de la pluralidad de polinucleótidos con código de barras producidos mediante el método de cualquiera de las reivindicaciones 1-17 o a partir de la pluralidad de polinucleótidos con código de barras de la biblioteca de polinucleótidos de la reivindicación 18, donde los polinucleótidos con código de barras son polinucleótidos con código de barras doble que comprenden un código de barras molecular y un código de barras de recipiente, generando así manera datos de transcriptoma a partir de la pluralidad de células; y
(c) la identificación de la información de secuencia a partir de (a) y a partir de (b) que presenta el mismo código de barras de recipiente como si fuera de la misma célula; opcionalmente donde los datos de transcriptoma comprenden un parámetro, una característica, un rasgo o un fenotipo asociado a la función o la actividad de la célula; y/o los datos de transcriptoma se asocian a la actividad de activación, agotamiento o proliferación de la célula.
21. Método de análisis de un transcriptoma de una célula única seleccionada, que comprende:
(a) la amplificación y secuenciación de uno o más polinucleótidos diana a partir de la pluralidad de polinucleótidos con código de barras producidos mediante el método de cualquiera de las reivindicaciones 1-17 o a partir de la pluralidad de polinucleótidos con código de barras de la biblioteca de polinucleótidos de la reivindicación 18, donde los polinucleótidos con código de barras son polinucleótidos con código de barras doble que comprenden un código de barras molecular y un código de barras de recipiente, generando así información de secuencia para cada uno de los polinucleótidos diana en al menos una de la pluralidad de células;
(b) la identificación del/de los código(s) de barras de recipiente asociados a uno de los polinucleótidos diana secuenciados en (a), identificando así una célula única seleccionada que contenga el polinucleótido diana; (c) la amplificación y secuenciación del transcriptoma o de una porción de este a partir de la pluralidad de polinucleótidos con código de barras de la célula que contiene el código de barras de recipiente identificado en (b), generando así datos de transcriptoma a partir de la célula diana de expresión de polipéptido seleccionada; opcionalmente donde los datos de transcriptoma comprenden un parámetro, una característica, un rasgo o un fenotipo asociado a la función o la actividad de la célula; y/o los datos de transcriptoma se asocian a la actividad de activación, agotamiento o proliferación de la célula.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762511949P | 2017-05-26 | 2017-05-26 | |
| PCT/US2018/034768 WO2018218222A1 (en) | 2017-05-26 | 2018-05-25 | High-throughput polynucleotide library sequencing and transcriptome analysis |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2926722T3 true ES2926722T3 (es) | 2022-10-27 |
Family
ID=62621068
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES18731697T Active ES2926722T3 (es) | 2017-05-26 | 2018-05-25 | Secuenciación de alto rendimiento de biblioteca de polinucleótidos y análisis de transcriptoma |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US12049667B2 (es) |
| EP (1) | EP3631012B1 (es) |
| JP (1) | JP7308187B2 (es) |
| KR (1) | KR102550778B1 (es) |
| CN (1) | CN111148849A (es) |
| AU (1) | AU2018273999A1 (es) |
| CA (1) | CA3064205A1 (es) |
| ES (1) | ES2926722T3 (es) |
| MA (1) | MA49352A (es) |
| WO (1) | WO2018218222A1 (es) |
Families Citing this family (54)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
| HK1206069A1 (en) | 2012-02-27 | 2015-12-31 | Cellular Research, Inc. | Compositions and kits for molecular counting |
| AU2014312208B2 (en) | 2013-08-28 | 2019-07-25 | Becton, Dickinson And Company | Massively parallel single cell analysis |
| CN107208158B (zh) | 2015-02-27 | 2022-01-28 | 贝克顿迪金森公司 | 空间上可寻址的分子条形编码 |
| EP3277843A2 (en) | 2015-03-30 | 2018-02-07 | Cellular Research, Inc. | Methods and compositions for combinatorial barcoding |
| ES2745694T3 (es) | 2015-09-11 | 2020-03-03 | Cellular Res Inc | Métodos y composiciones para normalización de biblioteca de ácido nucleico |
| US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
| US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
| US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
| SG11201901733PA (en) | 2016-09-26 | 2019-04-29 | Cellular Res Inc | Measurement of protein expression using reagents with barcoded oligonucleotide sequences |
| US11319583B2 (en) | 2017-02-01 | 2022-05-03 | Becton, Dickinson And Company | Selective amplification using blocking oligonucleotides |
| US12049667B2 (en) | 2017-05-26 | 2024-07-30 | Abvitro Llc | High-throughput polynucleotide library sequencing and transcriptome analysis |
| CA3059559A1 (en) | 2017-06-05 | 2018-12-13 | Becton, Dickinson And Company | Sample indexing for single cells |
| CN118910215A (zh) | 2018-05-03 | 2024-11-08 | 贝克顿迪金森公司 | 在相对的转录物末端进行分子条形码化 |
| JP7407128B2 (ja) | 2018-05-03 | 2023-12-28 | ベクトン・ディキンソン・アンド・カンパニー | ハイスループットマルチオミクスサンプル解析 |
| EP3861134B1 (en) | 2018-10-01 | 2024-09-04 | Becton, Dickinson and Company | Determining 5' transcript sequences |
| CN112969789A (zh) | 2018-11-08 | 2021-06-15 | 贝克顿迪金森公司 | 使用随机引发的单细胞全转录组分析 |
| CN113195717A (zh) | 2018-12-13 | 2021-07-30 | 贝克顿迪金森公司 | 单细胞全转录组分析中的选择性延伸 |
| CN113396227A (zh) * | 2018-12-28 | 2021-09-14 | 新加坡国立大学 | 用于目标互补dna富集的方法 |
| CN113574178B (zh) | 2019-01-23 | 2024-10-29 | 贝克顿迪金森公司 | 与抗体关联的寡核苷酸 |
| EP3924506A1 (en) | 2019-02-14 | 2021-12-22 | Becton Dickinson and Company | Hybrid targeted and whole transcriptome amplification |
| WO2021016239A1 (en) | 2019-07-22 | 2021-01-28 | Becton, Dickinson And Company | Single cell chromatin immunoprecipitation sequencing assay |
| EP4010472B1 (en) * | 2019-08-05 | 2025-01-01 | Mission Bio, Inc. | Method and apparatus for single-cell analysis for determining a cell trajectory |
| AU2020361515A1 (en) * | 2019-10-09 | 2022-05-26 | Edward Fritsch | Multi-domain protein vaccine |
| ES2987640T3 (es) | 2019-11-08 | 2024-11-15 | Becton Dickinson Co | Uso de cebado aleatorio para obtener información de V(D)J de longitud completa para la secuenciación del repertorio inmunitario |
| US12163189B2 (en) | 2019-11-27 | 2024-12-10 | University Of Washington | Method for preparation and high-throughput microbial single-cell RNA sequencing of bacteria |
| CN115244184A (zh) | 2020-01-13 | 2022-10-25 | 贝克顿迪金森公司 | 用于定量蛋白和rna的方法和组合物 |
| EP4097228B1 (en) | 2020-01-29 | 2024-08-14 | Becton, Dickinson and Company | Barcoded wells for spatial mapping of single cells through sequencing |
| WO2021168015A1 (en) * | 2020-02-17 | 2021-08-26 | Universal Sequencing Technology Corporation | Methods of barcoding nucleic acid for detection and sequencing |
| CN115151810A (zh) | 2020-02-25 | 2022-10-04 | 贝克顿迪金森公司 | 实现使用单细胞样品作为单色补偿对照的双特异性探针 |
| EP4150118A1 (en) | 2020-05-14 | 2023-03-22 | Becton Dickinson and Company | Primers for immune repertoire profiling |
| US20230235392A1 (en) * | 2020-05-20 | 2023-07-27 | Element Biosciences, Inc. | Methods for paired-end sequencing library preparation |
| JP7423101B2 (ja) * | 2020-05-29 | 2024-01-29 | 国立研究開発法人理化学研究所 | 細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法 |
| CN115803445A (zh) * | 2020-06-02 | 2023-03-14 | 贝克顿迪金森公司 | 用于5撇基因表达测定的寡核苷酸和珠 |
| KR102468839B1 (ko) | 2020-06-03 | 2022-11-18 | 주식회사 제노헬릭스 | Rna 검출 방법 |
| CN111549025B (zh) * | 2020-06-08 | 2021-09-14 | 郑州大学第一附属医院 | 链置换引物和细胞转录组文库构建方法 |
| US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
| CN116194589A (zh) | 2020-07-31 | 2023-05-30 | 贝克顿迪金森公司 | 用于转座酶可及染色质的单细胞测定 |
| TW202223389A (zh) * | 2020-09-07 | 2022-06-16 | 美商伯克利之光生命科技公司 | 檢測生物細胞之方法 |
| EP4240842B1 (en) * | 2020-11-03 | 2024-12-18 | ACT Genomics (IP) Limited | Targeted sequencing method and kit thereof for detecting gene alteration |
| WO2022109343A1 (en) | 2020-11-20 | 2022-05-27 | Becton, Dickinson And Company | Profiling of highly expressed and lowly expressed proteins |
| US12378596B2 (en) * | 2020-12-03 | 2025-08-05 | Roche Sequencing Solutions, Inc. | Whole transcriptome analysis in single cells |
| WO2022132206A1 (en) | 2020-12-15 | 2022-06-23 | Becton, Dickinson And Company | Single cell secretome analysis |
| US11111489B1 (en) | 2021-01-06 | 2021-09-07 | Think Therapeutics, Inc. | Multiplexed testing of lymphocytes for antigen specificity |
| CN113512767B (zh) * | 2021-04-30 | 2022-09-23 | 天津诺禾致源生物信息科技有限公司 | 用于构建small RNA文库的接头、试剂盒及small RNA文库的构建方法 |
| CN113322523B (zh) * | 2021-06-17 | 2024-03-19 | 翌圣生物科技(上海)股份有限公司 | Rna快速建库方法及其应用 |
| CN113462750B (zh) * | 2021-06-29 | 2024-08-27 | 浙江峻山生物科技有限公司 | 一种提高病毒核酸检测灵敏度的样本保存液及其制备方法 |
| CA3225604A1 (en) * | 2021-07-20 | 2023-01-26 | R. Keith SLOTKIN | All-in-one rna sequencing assay and uses thereof |
| US20250011833A1 (en) * | 2021-11-09 | 2025-01-09 | William Marsh Rice University | Methods and compositions for sequencing and fusion detection using randomer reverse primers |
| WO2023141604A2 (en) * | 2022-01-21 | 2023-07-27 | Mission Bio, Inc. | Methods of molecular tagging for single-cell analysis |
| WO2025019313A1 (en) * | 2023-07-14 | 2025-01-23 | The Broad Institute, Inc. | Method for assembling gene libraries from a pool of oligonucleotides |
| CN118280446B (zh) * | 2024-05-31 | 2024-08-13 | 浙江大学 | 植物单细胞非编码基因鉴定和功能预测方法、装置及应用 |
| CN118727162B (zh) * | 2024-06-05 | 2025-04-04 | 首都医科大学附属北京口腔医院 | 单细胞4c文库构建方法和检测方法 |
| CN120400136A (zh) * | 2025-07-01 | 2025-08-01 | 杭州华大生命科学研究院 | 模板转换寡核苷酸、试剂盒及其应用 |
Family Cites Families (85)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4656134A (en) | 1982-01-11 | 1987-04-07 | Board Of Trustees Of Leland Stanford Jr. University | Gene amplification in eukaryotic cells |
| US5242794A (en) | 1984-12-13 | 1993-09-07 | Applied Biosystems, Inc. | Detection of specific sequences in nucleic acids |
| US4965188A (en) | 1986-08-22 | 1990-10-23 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme |
| US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
| US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
| US4766067A (en) | 1985-05-31 | 1988-08-23 | President And Fellows Of Harvard College | Gene amplification |
| GB8601597D0 (en) | 1986-01-23 | 1986-02-26 | Wilson R H | Nucleotide sequences |
| US4800159A (en) | 1986-02-07 | 1989-01-24 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences |
| US4889818A (en) | 1986-08-22 | 1989-12-26 | Cetus Corporation | Purified thermostable enzyme |
| US4921794A (en) | 1987-01-14 | 1990-05-01 | President And Fellows Of Harvard College | T7 DNA polymerase |
| US4795699A (en) | 1987-01-14 | 1989-01-03 | President And Fellows Of Harvard College | T7 DNA polymerase |
| US4988617A (en) | 1988-03-25 | 1991-01-29 | California Institute Of Technology | Method of detecting a nucleotide change in nucleic acids |
| US5168038A (en) | 1988-06-17 | 1992-12-01 | The Board Of Trustees Of The Leland Stanford Junior University | In situ transcription in cells and tissues |
| US5130238A (en) | 1988-06-24 | 1992-07-14 | Cangene Corporation | Enhanced nucleic acid amplification process |
| US5142033A (en) | 1988-09-23 | 1992-08-25 | Hoffmann-La Roche Inc. | Structure-independent DNA amplification by the polymerase chain reaction |
| US5091310A (en) | 1988-09-23 | 1992-02-25 | Cetus Corporation | Structure-independent dna amplification by the polymerase chain reaction |
| US5066584A (en) | 1988-09-23 | 1991-11-19 | Cetus Corporation | Methods for generating single stranded dna by the polymerase chain reaction |
| US4994370A (en) | 1989-01-03 | 1991-02-19 | The United States Of America As Represented By The Department Of Health And Human Services | DNA amplification technique |
| DE3920358A1 (de) | 1989-06-22 | 1991-01-17 | Behringwerke Ag | Bispezifische und oligospezifische, mono- und oligovalente antikoerperkonstrukte, ihre herstellung und verwendung |
| US5494810A (en) | 1990-05-03 | 1996-02-27 | Cornell Research Foundation, Inc. | Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease |
| US5210015A (en) | 1990-08-06 | 1993-05-11 | Hoffman-La Roche Inc. | Homogeneous assay system using the nuclease activity of a nucleic acid polymerase |
| WO1993012227A1 (en) | 1991-12-17 | 1993-06-24 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
| EP1136556B1 (en) | 1991-11-25 | 2005-06-08 | Enzon, Inc. | Method of producing multivalent antigen-binding proteins |
| US5925517A (en) | 1993-11-12 | 1999-07-20 | The Public Health Research Institute Of The City Of New York, Inc. | Detectably labeled dual conformation oligonucleotide probes, assays and kits |
| US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
| US6852487B1 (en) | 1996-02-09 | 2005-02-08 | Cornell Research Foundation, Inc. | Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays |
| AU730633B2 (en) | 1996-05-29 | 2001-03-08 | Phillip Belgrader | Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions |
| PT912766E (pt) | 1996-06-04 | 2009-07-16 | Univ Utah Res Found | Monitorização da hibridização durante a pcr |
| US6054276A (en) | 1998-02-23 | 2000-04-25 | Macevicz; Stephen C. | DNA restriction site mapping |
| WO1999051773A1 (en) | 1998-04-03 | 1999-10-14 | Phylos, Inc. | Addressable protein arrays |
| CA2330673C (en) | 1998-05-01 | 2009-05-26 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and dna molecules |
| US6780591B2 (en) | 1998-05-01 | 2004-08-24 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
| US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
| GB9928787D0 (en) | 1999-12-03 | 2000-02-02 | Medical Res Council | Direct screening method |
| US6582938B1 (en) | 2001-05-11 | 2003-06-24 | Affymetrix, Inc. | Amplification of nucleic acids |
| US6686184B1 (en) | 2000-05-25 | 2004-02-03 | President And Fellows Of Harvard College | Patterning of surfaces utilizing microfluidic stamps including three-dimensionally arrayed channel networks |
| WO2003020763A2 (en) | 2001-08-31 | 2003-03-13 | Avidex Limited | Soluble t cell receptor |
| GB0127564D0 (en) | 2001-11-16 | 2002-01-09 | Medical Res Council | Emulsion compositions |
| JP2006507921A (ja) | 2002-06-28 | 2006-03-09 | プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ | 流体分散のための方法および装置 |
| NZ539225A (en) | 2002-10-09 | 2006-09-29 | Avidex Ltd | Single chain recombinant T cell receptors |
| US20060078893A1 (en) | 2004-10-12 | 2006-04-13 | Medical Research Council | Compartmentalised combinatorial chemistry by microfluidic control |
| CA2784762A1 (en) | 2003-04-10 | 2004-10-28 | President And Fellows Of Harvard College | Formation and control of fluidic species |
| CN1842368B (zh) | 2003-08-27 | 2014-05-28 | 哈佛大学 | 流体物种的电子控制 |
| US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
| US20050221339A1 (en) | 2004-03-31 | 2005-10-06 | Medical Research Council Harvard University | Compartmentalised screening by microfluidic control |
| US7643818B2 (en) | 2004-11-22 | 2010-01-05 | Seven Networks, Inc. | E-mail messaging to/from a mobile terminal |
| EP1861194A2 (en) | 2005-03-04 | 2007-12-05 | The President and Fellows of Harvard College | Method and apparatus for forming multiple emulsions |
| AU2006335290A1 (en) | 2006-01-11 | 2007-07-19 | Raindance Technologies, Inc. | Microfluidic devices and methods of use in the formation and control of nanoreactors |
| DE602007009811D1 (de) | 2006-01-27 | 2010-11-25 | Harvard College | Koaleszenz fluider tröpfchen |
| EP4190448A3 (en) | 2006-05-11 | 2023-09-20 | Bio-Rad Laboratories, Inc. | Microfluidic devices |
| US8911948B2 (en) | 2008-04-30 | 2014-12-16 | Integrated Dna Technologies, Inc. | RNase H-based assays utilizing modified RNA monomers |
| EP2279263B1 (en) | 2008-04-30 | 2013-09-04 | Integrated Dna Technologies, Inc. | Rnase-h-based assays utilizing modified rna monomers |
| CA3075139C (en) | 2008-09-23 | 2022-04-12 | Bio-Rad Laboratories, Inc. | Droplet-based assay system |
| DK3002337T3 (en) | 2009-03-30 | 2019-02-18 | Illumina Inc | ANALYSIS OF EXPRESSION OF GENES IN SINGLE CELLS |
| WO2011044186A1 (en) | 2009-10-06 | 2011-04-14 | The Board Of Trustees Of The University Of Illinois | Human single-chain t cell receptors |
| GB2497912B (en) | 2010-10-08 | 2014-06-04 | Harvard College | High-throughput single cell barcoding |
| GB2498163B (en) | 2010-10-08 | 2015-07-01 | Harvard College | High-throughput immune sequencing |
| WO2013033271A2 (en) | 2011-08-29 | 2013-03-07 | Derren Barken | Method to augment immune system in response to disease or injury |
| US20140378349A1 (en) * | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
| WO2014108850A2 (en) * | 2013-01-09 | 2014-07-17 | Yeda Research And Development Co. Ltd. | High throughput transcriptome analysis |
| GB2584364A (en) | 2013-03-15 | 2020-12-02 | Abvitro Llc | Single cell bar-coding for antibody discovery |
| RU2578009C2 (ru) | 2013-05-08 | 2016-03-20 | Закрытое акционерное общество "ЕВРОГЕН" | Способ идентификации нативных пар фрагментов днк или рнк, присутствующих в одних и тех же живых клетках |
| CA2915499A1 (en) * | 2013-06-27 | 2014-12-31 | 10X Genomics, Inc. | Compositions and methods for sample processing |
| GB201317301D0 (en) | 2013-09-30 | 2013-11-13 | Linnarsson Sten | Method for capturing and encoding nucleic acid from a plurality of single cells |
| WO2015134552A1 (en) * | 2014-03-03 | 2015-09-11 | Swift Biosciences, Inc. | Enhanced adaptor ligation |
| JP6853667B2 (ja) | 2014-04-21 | 2021-03-31 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸をバーコーディングするためのシステムおよび方法 |
| MX2016016902A (es) * | 2014-06-26 | 2017-03-27 | 10X Genomics Inc | Metodos para analizar acidos nucleicos de celulas individuales o poblaciones de celulas. |
| EP4105337A1 (en) | 2014-09-09 | 2022-12-21 | The Broad Institute, Inc. | A droplet-based method and apparatus for composite single-cell nucleic acid analysis |
| EP3194593B1 (en) | 2014-09-15 | 2019-02-06 | AbVitro LLC | High-throughput nucleotide library sequencing |
| US10993997B2 (en) * | 2014-12-19 | 2021-05-04 | The Broad Institute, Inc. | Methods for profiling the t cell repertoire |
| JP2018508198A (ja) * | 2015-02-04 | 2018-03-29 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 別個の実体におけるバーコード付加による核酸のシーケンシング |
| CA2983122A1 (en) | 2015-04-17 | 2016-10-20 | President And Fellows Of Harvard College | Barcoding systems and methods for gene sequencing and other applications |
| EP3289082A4 (en) | 2015-04-27 | 2018-09-12 | AbVitro LLC | Methods of sequencing, determining, pairing, and validating therapeutic agents and disease specific antigens |
| MY193806A (en) | 2015-09-24 | 2022-10-27 | Abvitro Llc | Affinity-oligonucleotide conjugates and uses thereof |
| CN108289954B (zh) | 2015-09-24 | 2022-05-31 | 阿布维特罗有限责任公司 | Hiv抗体组合物和使用方法 |
| WO2017053903A1 (en) | 2015-09-24 | 2017-03-30 | Abvitro Llc | Single amplicon activated exclusion pcr |
| US10928392B2 (en) | 2015-09-25 | 2021-02-23 | Abvitro Llc | High throughput process for T cell receptor target identification of natively-paired T cell receptor sequences |
| JP6929354B2 (ja) | 2016-09-24 | 2021-09-01 | アブビトロ, エルエルシー | 親和性−オリゴヌクレオチドコンジュゲートおよびその使用 |
| WO2018083849A1 (ja) | 2016-11-02 | 2018-05-11 | 三菱電機株式会社 | 水処理装置及び水処理方法 |
| DK3618842T3 (da) | 2017-05-01 | 2024-01-02 | Juno Therapeutics Inc | Kombination af en celleterapi og en immunomodulerende forbindelse |
| US12049667B2 (en) | 2017-05-26 | 2024-07-30 | Abvitro Llc | High-throughput polynucleotide library sequencing and transcriptome analysis |
| MX2020001491A (es) | 2017-08-09 | 2020-08-06 | Juno Therapeutics Inc | Metodos y composiciones para preparar celulas geneticamente modificadas. |
| US10610865B2 (en) | 2017-08-22 | 2020-04-07 | 10X Genomics, Inc. | Droplet forming devices and system with differential surface properties |
| EP3679370A1 (en) | 2017-09-07 | 2020-07-15 | Juno Therapeutics, Inc. | Methods of identifying cellular attributes related to outcomes associated with cell therapy |
| WO2019089982A1 (en) | 2017-11-01 | 2019-05-09 | Juno Therapeutics, Inc. | Method of assessing activity of recombinant antigen receptors |
-
2018
- 2018-05-25 US US16/616,424 patent/US12049667B2/en active Active
- 2018-05-25 CA CA3064205A patent/CA3064205A1/en active Pending
- 2018-05-25 MA MA049352A patent/MA49352A/fr unknown
- 2018-05-25 ES ES18731697T patent/ES2926722T3/es active Active
- 2018-05-25 CN CN201880049800.9A patent/CN111148849A/zh active Pending
- 2018-05-25 EP EP18731697.1A patent/EP3631012B1/en active Active
- 2018-05-25 WO PCT/US2018/034768 patent/WO2018218222A1/en not_active Ceased
- 2018-05-25 KR KR1020197038441A patent/KR102550778B1/ko active Active
- 2018-05-25 JP JP2020515835A patent/JP7308187B2/ja active Active
- 2018-05-25 AU AU2018273999A patent/AU2018273999A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| EP3631012A1 (en) | 2020-04-08 |
| MA49352A (fr) | 2020-04-08 |
| US20200354784A1 (en) | 2020-11-12 |
| JP2020523034A (ja) | 2020-08-06 |
| US12049667B2 (en) | 2024-07-30 |
| KR102550778B1 (ko) | 2023-07-03 |
| EP3631012B1 (en) | 2022-06-08 |
| RU2019143662A (ru) | 2021-06-28 |
| KR20200039623A (ko) | 2020-04-16 |
| WO2018218222A1 (en) | 2018-11-29 |
| RU2019143662A3 (es) | 2022-02-25 |
| CN111148849A (zh) | 2020-05-12 |
| JP7308187B2 (ja) | 2023-07-13 |
| CA3064205A1 (en) | 2018-11-29 |
| AU2018273999A1 (en) | 2019-12-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2926722T3 (es) | Secuenciación de alto rendimiento de biblioteca de polinucleótidos y análisis de transcriptoma | |
| US20240076732A1 (en) | High-throughput nucleotide library sequencing | |
| JP7341661B2 (ja) | ネイティブに対合するt細胞受容体配列のt細胞受容体標的識別のための高スループットプロセス | |
| RU2790291C2 (ru) | Секвенирование полинуклеотидных библиотек с высокой пропускной способностью и анализ транскриптомов | |
| HK40013790A (en) | High-throughput nucleotide library sequencing | |
| HK40013790B (en) | High-throughput nucleotide library sequencing | |
| HK40026019B (en) | High-throughput polynucleotide library sequencing and transcriptome analysis | |
| HK40026019A (en) | High-throughput polynucleotide library sequencing and transcriptome analysis |