[go: up one dir, main page]

ES3043588T3 - Method for introducing mutations - Google Patents

Method for introducing mutations

Info

Publication number
ES3043588T3
ES3043588T3 ES21190654T ES21190654T ES3043588T3 ES 3043588 T3 ES3043588 T3 ES 3043588T3 ES 21190654 T ES21190654 T ES 21190654T ES 21190654 T ES21190654 T ES 21190654T ES 3043588 T3 ES3043588 T3 ES 3043588T3
Authority
ES
Spain
Prior art keywords
nucleic acid
target nucleic
acid molecule
dna polymerase
mutations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21190654T
Other languages
English (en)
Inventor
Leigh G Monahan
Joyce To
Catherine M Burke
Michael Imelfort
Aaron E Darling
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Singapore Pte Ltd
Original Assignee
Illumina Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Singapore Pte Ltd filed Critical Illumina Singapore Pte Ltd
Application granted granted Critical
Publication of ES3043588T3 publication Critical patent/ES3043588T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/101Modifications characterised by incorporating non-naturally occurring nucleotides, e.g. inosine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/197Modifications characterised by incorporating a spacer/coupling moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/137Concentration of a component of medium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Un método para introducir mutaciones en al menos una molécula de ácido nucleico diana comprende: (a) proporcionar al menos una muestra que comprende al menos una molécula de ácido nucleico diana; y (b) introducir mutaciones en la al menos una molécula de ácido nucleico diana amplificando la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa para proporcionar una al menos una molécula de ácido nucleico diana mutada, en donde el paso (b) se lleva a cabo utilizando dNTP en concentraciones desiguales y en presencia de un análogo de nucleótido. (Traducción automática con Google Translate, sin valor legal)

Description

[0001] DESCRIPCIÓN
[0003] Método para introducir mutaciones
[0005] Campo de la invención
[0007] Esta invención se refiere a un método para introducir mutaciones en una o más moléculas de ácido nucleico.
[0009] Antecedentes de la invención
[0011] Las ADN polimerasas se pueden usar para introducir mutaciones en secuencias de ácidos nucleicos. Esto puede resultar útil en varias aplicaciones. Por ejemplo, las técnicas de mutagénesis pueden ser útiles en aplicaciones que incluyen técnicas de secuenciación asistida por mutagénesis (SAM, por sus siglas en inglés) y para introducir mutaciones en secuencias de proteínas para encontrar mutaciones que afecten a la actividad de la proteína.
[0013] Las mutaciones pueden introducirse usando ADN polimerasas que tienen baja fidelidad. Las ADN polimerasas de baja fidelidad cometen errores durante la replicación que provocan la introducción de mutaciones. Sin embargo, muchas ADN polimerasas de baja fidelidad solo introducen mutaciones a una tasa inferior al 2 % por reacción de mutación (ronda de replicación) y, para algunas aplicaciones, son útiles tasas de mutagénesis más altas. Además, las ADN polimerasas de baja fidelidad pueden introducir mutaciones de manera sesgada. Tales ADN polimerasas pueden denominarse ADN polimerasas de alto sesgo.
[0015] Las mutaciones pueden introducirse al replicar secuencias, mediante la utilización de ADN polimerasas, en presencia de análogos de nucleótidos tales como dPTP. Las ADN polimerasas pueden incorporar los análogos de nucleótidos en lugar de un nucleótido natural. A continuación, en un ciclo posterior de replicación, el análogo de nucleótido puede emparejarse con un nucleótido natural que no estaba presente en la secuencia original, lo que introduce de este modo una mutación. La introducción de mutaciones mediante la replicación de secuencias en presencia de análogos de nucleótidos puede utilizarse para lograr tasas de mutación más altas.
[0017] Las ADN polimerasas de uso común (tales como la polimerasa Taq) se pueden utilizar para incorporar análogos de nucleótidos en lugar de un nucleótido natural. Sin embargo, estas polimerasas son polimerasas de alto sesgo. Las ADN polimerasas de alto sesgo pueden mostrar dos posibles sesgos: el sesgo de mutación y el sesgo de amplificación de molde.
[0019] Algunas polimerasas de alto sesgo tienen un alto sesgo de mutación, ya que no mutan los cuatro nucleótidos naturales (adenina, citosina, guanina y timina) de modo uniforme y aleatorio. Por ejemplo, las ADN polimerasas de alto sesgo pueden mutar algunos nucleótidos con mayor frecuencia que otros. Los pares de adenina/timina están conectados por dos enlaces de hidrógeno, mientras que los pares de guanina/citosina están conectados por tres enlaces de hidrógeno. Por lo tanto, es posible que las ADN polimerasas de alto sesgo tengan más probabilidades de introducir mutaciones en los pares de adenina/timina que en los pares de guanina/citosina.
[0021] Las polimerasas de alto sesgo, que tienen un alto sesgo de mutación, pueden no incorporar análogos de nucleótidos de modo aleatorio. Por ejemplo, las polimerasas de alto sesgo pueden favorecer la sustitución de ciertas bases por análogos de nucleótidos. El DPTP puede interconvertir entre dos formas tautoméricas diferentes, una forma imino y una forma amino. El tautómero imino puede formar pares de bases de Watson-Crick con adenina, mientras que la forma amino puede formar pares de bases de Watson-Crick con guanina (Kong Thoo Lin P, Brown D M (1989). “ Synthesis and duplex stability of oligonucleotides containing cytosine-thymine analogues” . Nucleic Acids Research.
[0022] 17: 10373-10383; Stone M J y col. (1991). “ Molecular basis for methoxyamine-initiated mutagenesis: 1H nuclear magnetic resonance studies of base-modified oligodeoxynucleotides” . Journal of Molecular Biology. 222: 711­ 723; Nedderman A N R y col. (1993). “ Molecular basis for methoxyamine initiated mutagenesis: 1H nuclear magnetic resonance studies of oligonucleotide duplexes containing base-modified cytosine residues” . Journal of Molecular Biology. 230: 1068-1076; Moore M H y col. (1995). “ Direct observation of two base-pairing modes of a cytosine-thymine analogue with guanine in a DNAZ-form duplex. Significance for base analogue mutagenesis” . Journal of Molecular Biology. 251: 665-673). Esto significa eficazmente que la replicación en presencia de los dPTP puede utilizarse para introducir sustituciones en lugar de adenina, citosina, guanina o timina en una secuencia de nucleótidos. Sin embargo, en solución acuosa, se ha demostrado que la relación entre las formas imino y amino del dPTP es de aproximadamente 10:1 (Harris V H y col. (2003). “ The effect of tautomeric constant on the specificity of nucleotide incorporation during DNA replication: support for the rare tautomer hypothesis of substitution mutagenesis” . Journal of Molecular Biology.
[0023] 326: 1389-1401). Por consiguiente, cuando se utiliza una polimerasa tal como la polimerasa Taq para introducir mutaciones utilizando dPTP, introduce sustituciones de adenina y timina con mucha más frecuencia que las sustituciones de guanina y citosina (Zaccolo M y col. (1996). “An approach to random mutagenesis of DNA using mixtures of triphosphate derivatives of nucleoside analogues” . Journal of Molecular Biology. 255: 589-603; Harris V H y col. (2003). “The effect of tautomeric constant on the specificity of nucleotide incorporation during DNA replication: support for the rare tautomer hypothesis of substitution mutagenesis” . Journal of Molecular Biology. 326: 1389-1401).
[0024] En segundo lugar, las polimerasas de alto sesgo pueden demostrar un sesgo de amplificación de molde, esdecir,pueden replicar algunas moléculas de ácido nucleico de molde con una tasa de éxito más alta por ciclo de PCR que otras. Durante muchos ciclos de PCR, este sesgo puede crear diferencias extremas en el número de copias entre moldes. Las regiones de una molécula de ácido nucleico molde pueden formar estructuras secundarias o pueden contener una mayor proporción de algunos nucleótidos (por ejemplo, nucleótidos de guanina o citosina) que otros. Una polimerasa de alto sesgo puede ser más eficaz para amplificar, por ejemplo, moléculas de ácido nucleico molde ricas en guanina y citosina en comparación con moléculas de ácido nucleico molde ricas en adenina y timina, o puede ser más eficaz para amplificar moléculas de ácido nucleico molde que no forman estructuras secundarias.
[0026] Muchas de las aplicaciones de la mutagénesis son más eficaces si la mutagénesis se puede realizar con un sesgo bajo (tanto el sesgo de mutación como la amplificación de molde).
[0028] El ensamblaje preciso de las secuencias del genoma ha demostrado ser difícil, ya que muchas plataformas de secuenciación de segunda generación solo son capaces de secuenciar fragmentos cortos de ácido nucleico, y requieren que las secuencias de ácido nucleico diana se amplifiquen durante el proceso de secuenciación para proporcionar suficientes moléculas de ácido nucleico para la etapa de secuenciación. Si el usuario desea secuenciar una secuencia de ácido nucleico más grande, esto puede lograrse mediante la secuenciación de regiones de las moléculas de ácido nucleico diana. El usuario debe entonces ensamblar computacionalmente la secuencia de la secuencia completa de ácidos nucleicos a partir de las secuencias de las regiones.
[0030] Ensamblar una secuencia de ácido nucleico usando secuencias de regiones puede ser difícil. En particular, cuando las regiones largas de las secuencias son muy similares entre sí, puede ser difícil determinar si las secuencias de dos regiones son ambas secuencias de réplicas de la misma molécula de ácido nucleico molde original o corresponden a secuencias de dos moléculas de ácido nucleico molde originales diferentes. Similarmente, puede ser difícil determinar si las secuencias de dos regiones corresponden a secuencias de réplicas de la misma parte de una molécula de ácido nucleico molde, o si realmente corresponden a dos repeticiones diferentes dentro de la molécula de ácido nucleico molde. Estas dificultades pueden evitarse mediante la introducción de mutaciones en las moléculas de ácido nucleico diana antes de la amplificación. El usuario puede entonces identificar que es probable que los fragmentos que tienen los mismos patrones de mutación se hayan originado a partir de la misma parte de la misma molécula de ácido nucleico molde original. Este tipo de método de secuenciación a veces se denomina secuenciación asistida por mutagénesis (SAM).
[0032] Zaccolo M y col. (1996), “An Approach to Random Mutagenesis of DNA Using Mixtures of T riphosphate Derivatives of Nucleoside Analogues” , J. Mol. Biol. (1996) 255. 589-603, describe un método para la mutagénesis aleatoria del ADN basado en la utilización de una mezcla de trifosfatos de análogos de nucleósidos.
[0034] Pochet S y col. (1997), “Ambiguous Base Pairing of 1-(2-Deoxy-p-D-Ribofuranosyl)-imidazole-4-carboxamide during PCR” , Nucleosides and Nucleotides, 16:7-9, 1749-1752 (1997), informa que dYTP y su derivado propílico dYPrTP dan lugar a un apareamiento de bases ambiguo durante la PCR.
[0036] La patente WO2011/106368 A2 enseña métodos de amplificación para minimizar el sesgo específico de la secuencia.
[0037] Spee JH y col. (1993), “ Efficient random mutagenesis method with adjustable mutation frequency by use ofPCR and dITP” , Nucleic Acids Res. 1993;21(3):777-778, enseña un método de mutagénesis aleatoria utilizando dITP.
[0039] Resumen de la invención
[0041] Los métodos de secuenciación descritos anteriormente son más eficaces cuando las mutaciones que se introducen en las moléculas de ácido nucleico diana son uniformemente aleatorias. Si las mutaciones son uniformemente aleatorias, entonces la probabilidad, por ejemplo, de que cualquier parte dada de una molécula de ácido nucleico molde tenga un patrón de mutación único es mayor. Por lo tanto, existe la necesidad de identificar ADN polimerasas que puedan introducir mutaciones de modo uniforme y aleatorio (tienen un bajo sesgo de mutación).
[0043] Además, pueden limitarse los métodos de secuenciación que utilizan ADN polimerasas que tienen un alto sesgo de amplificación de molde. Las ADN polimerasas que tienen un alto sesgo de amplificación de molde replicarán y/o mutarán algunas moléculas de ácido nucleico diana mejor que otras y, por tanto, un método de secuenciación que utiliza una ADN polimerasa de alto sesgo puede no ser capaz de secuenciar bien algunas moléculas de ácido nucleico diana.
[0045] Los presentes inventores han identificado polimerasas que son polimerasas de bajo sesgo (tienen tanto un bajo sesgo de amplificación de molde como un bajo sesgo de mutación) y, por lo tanto, son particularmente útiles en un método para introducir mutaciones en al menos una molécula de ácido nucleico diana.
[0047] El usuario puede desear usar los métodos de la invención en más de una muestra a la vez. En tales casos, sería ventajoso para el usuario poder identificar qué molécula de ácido nucleico diana proviene de qué muestra original. Tal identificación podría lograrse al marcar las moléculas de ácido nucleico diana con etiquetas de muestra. Sin embargo, las etiquetas de muestra pueden, por sí mismas, mutarse durante el método y, por lo tanto, los presentes inventores han determinado cómo diseñar etiquetas de muestra que puedan distinguirse unas de otras incluso si están mutadas. El usuario también puede desear asegurarse de que los métodos de la invención se utilizan para mutar y amplificar moléculas de ácido nucleico diana largas con preferencia en comparación con moléculas de ácido nucleico cortas. Los presentes inventores han descubierto que esto se puede lograr mediante la introducción de sitios de unión a cebadores especiales en cada extremo de las moléculas de ácido nucleico diana.
[0048] En un primer aspecto de la invención, se proporciona un método para introducir mutaciones en al menos una molécula de ácido nucleico diana, el método comprende:
[0049] utilizar un análogo de nucleótido para introducir mutaciones en al menos una molécula de ácido nucleico diana en al menos una muestra al amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa y en presencia del análogo de nucleótido para proporcionar al menos una molécula de ácido nucleico diana mutada, en donde la etapa de utilizar el análogo de nucleótido para introducir las mutaciones en la al menos una molécula de ácido nucleico diana se realiza utilizando los dNTP en concentraciones desiguales para reducir el sesgo en el perfil de las mutaciones que se introducen.
[0050] Otras realizaciones se proporcionan como se define en las reivindicaciones dependientes.
[0051] Breve descripción de las figuras
[0052] La figura 1 muestra el nivel de mutación logrado con tres polimerasas diferentes en presencia o ausencia de dPTP. El panel A muestra los datos obtenidos mediante el uso de Taq (Jena Biosciences), el panel B muestra los datos obtenidos mediante el uso de LongAmp (New England Biolabs) y el panel C muestra los datos mediante el uso de Primestar GXL (Takara). Las barras de color gris oscuro muestran los resultados obtenidos en ausencia de dPTP y las barras de color gris pálido muestran los resultados obtenidos en presencia de dPTP 0,5 mM.
[0053] La figura 2 describe las tasas de mutaciones obtenidas mediante mutagénesis de dPTP utilizando una polimerasa deThermococcus(Primestar GXL; Takara) en moldes con contenido diverso de G+C. La mediana de la tasa de mutaciones observado fue de 7 % para los moldes de bajo contenido de GC de S.aureus(33 % de GC), mientras que la mediana para los otros moldes fue aproximadamente el 8 %.
[0054] La figura 3 es una lista de secuencias.
[0055] La figura 5 representa la autohibridación de moléculas de ácido nucleico cuando se utilizan un primer sitio de unión al cebador y un segundo sitio de unión al cebador que se hibridan entre sí.
[0056] La figura 6 representa los tamaños de moléculas de ácido nucleico diana amplificadas utilizando adaptadores que se hibridan entre sí (línea a la derecha) o utilizando adaptadores convencionales (línea a la izquierda).
[0057] La figura 7 proporciona una representación gráfica de la mutación utilizando el análogo de nucleótido dPTP (denominado “ P” en la figura 7).
[0058] Descripción detallada de la invención
[0059] Definiciones generales
[0060] A menos que se defina de otro modo, los términos técnicos y científicos usados en el presente documento tienen el mismo significado que el entendido habitualmente por un experto en la técnica a la que pertenece esta invención. Generalmente, el término"que comprende"pretende significar incluyendo, pero sin limitarse a. Por ejemplo, la expresión"un método para introducir mutaciones a al menos una molécula de ácido nucleico diana que comprende"ciertas etapas debe interpretarse que significa que el método incluye las etapas mencionadas, pero que pueden realizarse etapas adicionales.
[0061] En algunas realizaciones de la invención, la expresión“ que comprende”se reemplaza por la expresión“ que consiste en” .La expresión“ que consiste en”pretende ser limitativa. Por ejemplo, debe entenderse que la expresión"un método para introducir mutaciones a al menos una molécula de ácido nucleico diana que consiste en”ciertas etapas significa que el método incluye las etapas mencionadas, y que no se realizan etapas adicionales.
[0062] Para determinar el porcentaje de identidad de dos secuencias (tal como dos secuencias de polinucleótidos), las secuencias se alinean con fines de comparación óptima(p. ej.,se pueden introducir espacios en una primera secuencia para un alineamiento óptimo con una segunda secuencia). A continuación, se comparan los residuos de nucleótidos o aminoácidos en cada una de las posiciones. Cuando una posición en la primera secuencia está ocupada por el mismo residuo que la posición correspondiente en la segunda secuencia, entonces los residuos son idénticos en esa posición. El porcentaje de identidad entre las dos secuencias es una función del número de posiciones idénticas compartidas por las secuencias (es decir, % de identidad = número de posiciones idénticas/número total de posiciones x 100). Normalmente, la comparación de secuencias se realiza a lo largo de la secuencia de referencia. Por ejemplo, para evaluar si una secuencia de prueba es al menos un 95 % idéntica a la Id. de sec. n.°: 2 (la secuencia de referencia), el experto en la técnica realizaría una alineación a lo largo de la Id. de sec. n.°: 2 e identificaría cuántas posiciones en la secuencia de prueba eran idénticas a las de la Id. de sec. n.°: 2. Si al menos el 80 % de las posiciones son idénticas, la secuencia de prueba es al menos un 80 % idéntica a la Id. de sec. n.°: 2. Si la secuencia es más corta que la Id. de sec. n.°: 2, los espacios deben considerarse posiciones no idénticas.
[0064] El experto en la técnica conoce los diferentes programas informáticos que están disponibles para determinar la homología o identidad entre dos secuencias. Por ejemplo, se puede realizar una comparación de secuencias y una determinación del porcentaje de identidad entre dos secuencias usando un algoritmo matemático. En una realización, el porcentaje de identidad entre dos secuencias de aminoácidos o ácidos nucleicos se determina utilizando el algoritmo de Needleman y Wunsch (1970) que se ha incorporado al programa GAP del paquete de software Accelrys GCG (disponible en http://www.accelrys.com/products/gcg/), utilizando una matriz Blosum 62 o una matriz PAM250, y un peso de brecha de 16, 14, 12, l0 , 8, 6 o 4 y un peso de longitud de 1,2, 3, 4, 5 o 6.
[0066] Un método para introducir mutaciones a al menos una molécula de ácido nucleico diana
[0068] La invención se ha descrito en las reivindicaciones adjuntas.
[0070] En un aspecto adicional, se proporciona la utilización de una ADN polimerasa de bajo sesgo en un método para introducir mutaciones en al menos una molécula de ácido nucleico diana.
[0072] Las mutaciones pueden ser mutaciones por sustitución, mutaciones por inserción o mutaciones por deleción.
[0074] A efectos de la presente invención, la expresión"mutación por sustitución”debe interpretarse que significa que un nucleótido se reemplaza por un nucleótido diferente. Por ejemplo, la conversión de la secuencia ATCC en la secuencia AGCC es una mutación por sustitución. A efectos de la presente invención, debe entenderse que la expresión"mutación por inserción”significa que se añade a una secuencia al menos un nucleótido. Por ejemplo, la conversión de la secuencia ATCC a la secuencia ATTCC es un ejemplo de una mutación por inserción (con un nucleótido T adicional que se inserta). A efectos de la presente invención, debe entenderse que la expresión"mutación por deleción”significa que se elimina al menos un nucleótido de una secuencia. Por ejemplo, la conversión de la secuencia ATTCC a ATCC es un ejemplo de una mutación por deleción (con la eliminación de un nucleótido T). Preferiblemente, las mutaciones son mutaciones por sustitución.
[0076] A efectos de la presente invención, una"molécula de ácido nucleico”se refiere a una forma polimérica de nucleótidos de cualquier longitud. Los nucleótidos pueden ser desoxirribonucleótidos, ribonucleótidos o análogos de los mismos. Preferiblemente, la molécula de ácido nucleico diana está compuesta de desoxirribonucleótidos o ribonucleótidos. Incluso más preferiblemente, la molécula de ácido nucleico diana está compuesta por desoxirribonucleótidos,es decir, la molécula de ácido nucleico diana es una molécula de ADN.
[0078] La al menos una"molécula de ácido nucleico diana”puede ser cualquier molécula de ácido nucleico a la que el usuario del método le gustaría introducir mutaciones. La molécula de ácido nucleico diana puede formar parte de una molécula de ácido nucleico más grande, tal como un cromosoma. La molécula de ácido nucleico diana puede comprender un gen, múltiples genes o un fragmento de un gen. La molécula de ácido nucleico diana puede tener un tamaño superior a 1 kpb, superior a 1,5 kpb, superior a 2 kpb, superior a 4 kpb, superior a 5 kpb, superior a 7 kpb, superior a 8 kpb, entre 1 kpb y 50 kpb, o entre 1 kpb y 20 kpb.
[0080] La expresión"al menos una molécula de ácido nucleico diana”se considera intercambiable con la expresión"al menos una molécula de ácido nucleico diana ” .
[0082] La"al menos una molécula de ácido nucleico diana”puede ser monocatenaria, o puede formar parte de un complejo bicatenario. Por ejemplo, si la al menos una molécula de ácido nucleico diana está compuesta por desoxirribonucleótidos, puede formar parte de un complejo de ADN bicatenario. En cuyo caso, se considerará que una cadena (por ejemplo, la cadena codificante) es la al menos una molécula de ácido nucleico diana, y la otra cadena es una molécula de ácido nucleico que es complementaria a la al menos una molécula de ácido nucleico diana.
[0084] La invención se ha descrito en las reivindicaciones adjuntas.
[0086] El método para introducir mutaciones a al menos una molécula de ácido nucleico diana puede comprender:
[0088] a. proporcionar al menos una muestra que comprende al menos una molécula de ácido nucleico diana; y
[0089] b. amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo.
[0090] Proporcionar al menos una muestra que comprende al menos una molécula de ácido nucleico diana
[0091] El método para introducir mutaciones a al menos una molécula de ácido nucleico diana puede comprender una etapa de proporcionar al menos una muestra que comprende al menos una molécula de ácido nucleico diana.
[0093] Al menos una muestra puede comprender cualquier muestra que comprenda al menos una molécula de ácido nucleico diana. Al menos una muestra se puede obtener de cualquier fuente. Por ejemplo, la al menos una muestra puede comprender una muestra de ácidos nucleicos derivados de un ser humano, por ejemplo, una muestra extraída de un hisopo de piel de un paciente humano. Alternativamente, la al menos una muestra puede derivarse de otras fuentes tales como una muestra de un suministro de agua. Tal muestra podría contener miles de millones de moléculas de ácido nucleico molde. Sería posible mutar cada una de estas miles de millones de moléculas de ácido nucleico diana simultáneamente utilizando los métodos de la invención y, por tanto, no hay límite superior en el número de moléculas de ácido nucleico diana que podrían utilizarse en los métodos de la invención.
[0095] En una modalidad, la etapa a. comprende proporcionar más de una muestra. Por ejemplo, la etapa a. puede comprender proporcionar 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 15, 20, 25, 50, 75 o 100 muestras. Opcionalmente, la etapa a. comprende proporcionar menos de 2000, menos de 1000, menos de 750 o menos de 500 muestras. En una realización adicional, la etapa a. comprende proporcionar entre 2 y 100, entre 2 y 75, entre 2 y 50, entre 2 y 25, entre 5 y 15, o entre 7 y 15 muestras.
[0097] Amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo
[0099] Los métodos de la invención pueden comprender amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo.
[0101] Amplificar la al menos una molécula de ácido nucleico diana se refiere a replicar la al menos una molécula de ácido nucleico diana para proporcionar al menos una molécula de ácido nucleico que sea complementaria a la al menos una molécula de ácido nucleico diana y/o réplicas de la al menos una molécula de ácido nucleico diana. Amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo aumenta el número de réplicas de la al menos una molécula de ácido nucleico diana e introduce mutaciones en la al menos una molécula de ácido nucleico diana. Dado que se introducen mutaciones, las réplicas no son necesariamente idénticas a la al menos una molécula de ácido nucleico diana original. La al menos una molécula de ácido nucleico diana original y las réplicas de la al menos una molécula de ácido nucleico diana pueden denominarse colectivamente“al menos una molécula de ácido nucleico diana mutada”
[0103] Por ejemplo, amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo puede comprender incubar la muestra que comprende la al menos una molécula de ácido nucleico diana con la ADN polimerasa de bajo sesgo y cebadores adecuados en condiciones adecuadas para que la ADN polimerasa de bajo sesgo catalice la generación de réplicas de la al menos una molécula de ácido nucleico diana.
[0105] Los cebadores adecuados comprenden moléculas de ácido nucleico cortas complementarias a regiones que flanquean a la al menos una molécula de ácido nucleico molde o a regiones que flanquean a moléculas de ácido nucleico que son complementarias a la al menos una molécula de ácido nucleico diana. Por ejemplo, si la molécula de ácido nucleico diana forma parte de un cromosoma, los cebadores pueden ser complementarios a regiones del cromosoma inmediatamente en 3' al extremo 3' de la molécula de ácido nucleico diana y moléculas de ácido nucleico complementarias a regiones inmediatamente en 5' al extremo 5' de la molécula de ácido nucleico diana, o los cebadores serán complementarios a regiones del cromosoma inmediatamente en 3' al extremo 3' de una molécula de ácido nucleico complementaria a la molécula de ácido nucleico diana y moléculas de ácido nucleico complementarias a regiones inmediatamente en 5' al extremo 5' de una molécula de ácido nucleico complementaria a la molécula de ácido nucleico diana. Alternativamente, el usuario puede introducir sitios de unión a cebadores (secuencias cortas de ácido nucleico) en las regiones que flanquean la al menos una molécula de ácido nucleico diana. Esto se describe con más detalle en la sección titulada“ Códigos de barras, muestras y adaptadores".
[0107] Las condiciones adecuadas incluyen una temperatura a la cual la ADN polimerasa de bajo sesgo puede catalizar la generación de réplicas de la al menos una molécula de ácido nucleico diana. Por ejemplo, se puede utilizar una temperatura de entre 40 °C y 90 °C, entre 50 °C y 80 °C, entre 60 °C y 70 °C, o aproximadamente 68 °C.
[0109] La etapa de amplificar la al menos una molécula de ácido nucleico diana puede comprender múltiples rondas de replicación. Por ejemplo, la etapa de amplificar la al menos una molécula de ácido nucleico diana comprende preferiblemente:
[0111] i) una ronda de replicar la al menos una molécula de ácido nucleico diana para proporcionar al menos una molécula de ácido nucleico que es complementaria a la al menos una molécula de ácido nucleico diana; y
[0112] ii) una ronda de replicar la al menos una molécula de ácido nucleico diana para proporcionar réplicas de la al menos una molécula de ácido nucleico diana.
[0113] Opcionalmente, la etapa de amplificar la al menos una molécula de ácido nucleico diana comprende al menos 2, al menos 4, al menos 6, al menos 8 o al menos 10 rondas de replicación de la al menos una molécula de ácido nucleico diana. Algunas de estas rondas de replicación de la al menos una molécula de ácido nucleico diana pueden tener lugar en presencia de análogos de nucleótidos. Opcionalmente, la etapa de amplificar la al menos una molécula de ácido nucleico diana comprende al menos 1, al menos 2, al menos 3, al menos 4, al menos 5 o al menos 6 rondas de replicación a una temperatura entre 60 °C y 80 °C.
[0114] Opcionalmente, la etapa de amplificar la al menos una molécula de ácido nucleico diana se realiza utilizando la reacción en cadena de la polimerasa (PCR). La PCR es un proceso que implica múltiples tandas de las siguientes etapas para replicar una molécula de ácido nucleico:
[0115] a) fusión;
[0116] b) hibridación;
[0117] c) extensión; y
[0118] d) alargamiento.
[0119] La molécula de ácido nucleico (tal como la al menos una molécula de ácido nucleico diana) se mezcla con cebadores adecuados y una polimerasa, tal como una ADN polimerasa de bajo sesgo de la invención. En la etapa de fusión, la molécula de ácido nucleico se calienta hasta una temperatura mayor de 90 °C de tal manera que una molécula de ácido nucleico bicatenaria se desnaturalice (se separe en dos hebras). En la etapa de hibridación, la molécula de ácido nucleico se enfría hasta una temperatura menor de 75 °C, por ejemplo, entre 55 °C y 70 °C, aproximadamente 55 °C, o aproximadamente 68 °C, para permitir que los cebadores se hibriden a la molécula de ácido nucleico. En la etapa de extensión, la molécula de ácido nucleico se calienta hasta una temperatura mayor de 60 °C para permitir que la ADN polimerasa catalice la extensión de cebadores, la adición de nucleótidos complementarios a la cadena molde. En la etapa de alargamiento, la molécula de ácido nucleico se calienta a una temperatura a la que la ADN polimerasa tiene una alta actividad, tal como una temperatura entre 60 °C y 70 °C, para catalizar la adición de más ácidos nucleicos complementarios para completar la nueva cadena de ácido nucleico.
[0120] Opcionalmente, el método de la invención comprende múltiples rondas de PCR utilizando la ADN polimerasa de bajo sesgo.
[0121] La ADN-polimerasa de bajo sesgo
[0122] Los métodos de la invención pueden comprender una etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo.
[0123] Según la presente invención, una“ADN polimerasa de bajo sesgo”es una ADN polimerasa que (a) presenta un bajo sesgo de mutación, y/o (b) presenta un bajo sesgo de amplificación de molde.
[0124] Bajo sesgo de mutación
[0125] Una ADN polimerasa de bajo sesgo que presenta bajo sesgo de mutación es una ADN polimerasa capaz de mutar adenina y timina, adenina y guanina, adenina y citosina, timina y guanina, timina y citosina, o guanina y citosina a tasas similares. En una realización, la ADN polimerasa de bajo sesgo es capaz de mutar adenina, timina, guanina y citosina a tasas similares.
[0126] Opcionalmente, la ADN polimerasa de bajo sesgo es capaz de mutar adenina y timina, adenina y guanina, adenina y citosina, timina y guanina, timina y citosina, o guanina y citosina a una razón de tasa de 0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2, o aproximadamente 1:1 respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo es capaz de mutar guanina y adenina a una razón de tasa de 0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2, o aproximadamente 1:1, respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo es capaz de mutar timina y citosina a una razón de tasa de 0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2, o aproximadamente 1:1 respectivamente.
[0127] En tales realizaciones, en una etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo, la ADN polimerasa de bajo sesgo muta adenina y timina, adenina y guanina, adenina y citosina, timina y guanina, nucleótidos de timina y citosina, o guanina y citosina en la al menos una molécula de ácido nucleico diana en una relación de tasa de 0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2, o aproximadamente 1:1 respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo muta nucleótidos de guanina y adenina en la al menos una molécula de ácido nucleico diana en una relación de tasa de 0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2, o aproximadamente 1:1 respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo muta nucleótidos de timina y citosina en la al menos una molécula de ácido nucleico diana en una relación de tasa de 0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2, o aproximadamente 1:1 respectivamente.
[0129] Opcionalmente, la ADN polimerasa de bajo sesgo es capaz de mutar adenina, timina, guanina y citosina en una relación de tasa de 0,5-1,5:0,5-1,5:0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4:0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2:0,8-1,2:0,8-1,2, o aproximadamente 1:1:1:1, respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo es capaz de mutar adenina, timina, guanina y citosina en una relación de tasa de 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1.3.
[0131] En tales realizaciones, en una etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo, la ADN polimerasa puede mutar nucleótidos de adenina, timina, guanina y citosina en la al menos una molécula de ácido nucleico diana en una relación de tasa de 0,5-1,5:0,5-1,5:0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4:0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2:0,8-1,2:0,8-1,2, o aproximadamente 1:1:1:1, respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo muta nucleótidos de adenina, timina, guanina y citosina en la al menos una molécula de ácido nucleico diana en una relación de tasa de 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1.3.
[0133] La adenina, timina, citosina y/o guanina pueden sustituirse por otro nucleótido. Por ejemplo, si la ADN polimerasa de bajo sesgo es capaz de mutar adenina, amplificar la al menos una molécula de ácido nucleico diana en la presencia de la ADN polimerasa de bajo sesgo puede sustituir al menos un nucleótido de adenina en la molécula de ácido nucleico por timina, guanina o citosina. Similarmente, si la ADN polimerasa de bajo sesgo es capaz de mutar timina, amplificar la al menos una molécula de ácido nucleico diana en la presencia de la ADN polimerasa de bajo sesgo puede sustituir al menos un nucleótido de timina por adenina, guanina o citosina. Si la ADN polimerasa de bajo sesgo es capaz de mutar guanina, amplificar el al menos un nucleótido diana en la presencia de la ADN polimerasa de bajo sesgo puede sustituir al menos un nucleótido de guanina por timina, adenina o citosina. Si la ADN polimerasa de bajo sesgo es capaz de mutar citosina, amplificar el al menos un nucleótido diana en la presencia de la ADN polimerasa de bajo sesgo puede sustituir al menos un nucleótido de citosina por timina, guanina o adenina.
[0135] La ADN polimerasa de bajo sesgo puede no ser capaz de sustituir un nucleótido directamente, pero todavía puede ser capaz de mutar ese nucleótido al reemplazar el nucleótido correspondiente en la hebra complementaria. Por ejemplo, si la molécula de ácido nucleico diana comprende timina, habrá un nucleótido de adenina presente en la posición correspondiente de la al menos una molécula de ácido nucleico que es complementaria a la al menos una molécula de ácido nucleico diana. La ADN polimerasa de bajo sesgo puede ser capaz de reemplazar el nucleótido de adenina de la al menos una molécula de ácido nucleico que es complementaria a la al menos una molécula de ácido nucleico diana con una guanina y así, cuando se replica la al menos una molécula de ácido nucleico que es complementaria a la al menos una molécula de ácido nucleico diana, esto dará como resultado que una citosina esté presente en la correspondiente al menos una molécula de ácido nucleico diana replicada en donde existía originalmente una timina (una sustitución de timina a citosina).
[0137] En una realización, la ADN polimerasa de bajo sesgo muta entre el 1 % y el 15 %, entre el 2 % y el 10 %, o aproximadamente el 8 % de los nucleótidos en el al menos un ácido nucleico diana. En tales realizaciones, la etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo se realiza de tal modo que se mutan entre el 1 % y el 15 %, entre el 2 % y el 10 %, o aproximadamente el 8 % de los nucleótidos en el al menos un ácido nucleico diana. Por ejemplo, si el usuario desea mutar aproximadamente el 8 % de los nucleótidos de la molécula de ácido nucleico diana, y la ADN polimerasa de bajo sesgo muta aproximadamente el 1 % de los nucleótidos por ronda de replicación, la etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo puede comprender 8 rondas de replicación.
[0139] En una realización, la ADN polimerasa de bajo sesgo es capaz de mutar entre el 0 % y el 3 %, entre el 0 % y el 2 %, entre el 0,1 % y el 5 %, entre el 0,2 % y el 3 %, o aproximadamente el 1,5 % de los nucleótidos en la al menos una molécula de ácido nucleico diana por ronda de replicación. En una realización, la ADN polimerasa de bajo sesgo muta entre el 0 % y el 3 %, entre el 0 % y el 2 %, entre el 0,1 % y el 5 %, entre el 0,2 % y el 3 %, o aproximadamente el 1,5 % de los nucleótidos en la al menos una molécula de ácido nucleico diana por ronda de replicación. La cantidad real de mutación que tiene lugar en cada tanda puede variar, pero puede promediar entre el 0 % y el 3 %, entre el 0 % y el 2 %, entre el 0,1 % y el 5 %, entre el 0,2 % y el 3 %, o aproximadamente el 1,5 %.
[0141] Si una ADN polimerasa es capaz de mutar un nucleótido y, si es así, a qué tasa
[0143] Puede determinarse si la ADN polimerasa de bajo sesgo es capaz de mutar un cierto porcentaje de los nucleótidos en la al menos una molécula de ácido nucleico diana por ronda de replicación mediante la amplificar una molécula de ácido nucleico de secuencia conocida en presencia de la ADN polimerasa de bajo sesgo para un número fijado de rondas de replicación. Luego, la molécula de ácido nucleico amplificada resultante puede secuenciarse, y se calcula el porcentaje de nucleótidos que se mutan por tanda de replicación. Por ejemplo, la molécula de ácido nucleico de la secuencia conocida puede amplificarse mediante el uso de 10 tandas de PCR en presencia de la ADN polimerasa de bajo sesgo. Entonces la molécula de ácido nucleico resultante puede secuenciarse. Si la molécula de ácido nucleico resultante comprende el 10 % de nucleótidos que son diferentes en los nucleótidos correspondientes en la secuencia original conocida, entonces el usuario comprendería que la ADN polimerasa de bajo sesgo es capaz de mutar el 1 % de los nucleótidos en la al menos una molécula de ácido nucleico diana en promedio por ronda de replicación. Similarmente, para ver si la ADN polimerasa de bajo sesgo muta un cierto porcentaje de los nucleótidos en la al menos una molécula de ácido nucleico diana en un método dado, el usuario podría realizar el método en una molécula de ácido nucleico de secuencia conocida y utilizar secuenciación para determinar el porcentaje de nucleótidos que se mutan una vez que se completa el método.
[0145] La ADN polimerasa de bajo sesgo es capaz de mutar un nucleótido tal como adenina, si, cuando se usa para amplificar una molécula de ácido nucleico, proporciona una molécula de ácido nucleico en la cual algunas instancias de ese nucleótido se sustituyen o delecionan. Preferiblemente, el término"mutar”se refiere a la introducción de mutaciones de sustitución y, en algunas realizaciones, el término"mutar”puede reemplazarse por"introduce sustituciones de” .
[0146] La ADN polimerasa de bajo sesgo muta un nucleótido tal como adenina en al menos una molécula de ácido nucleico diana en el método de la invención si, cuando se realiza la etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo, esta etapa da como resultado una mutación de al menos una molécula de ácido nucleico diana en la cual se mutan algunas instancias de ese nucleótido. Por ejemplo, si la ADN polimerasa de bajo sesgo muta adenina en la al menos una molécula de ácido nucleico diana, cuando se realiza la etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo, esta etapa da como resultado al menos una molécula de ácido nucleico diana mutada en la cual al menos una adenina se ha sustituido o delecionado.
[0148] Para determinar si una ADN polimerasa es capaz de introducir ciertas mutaciones, el experto simplemente necesita someter a prueba la ADN polimerasa mediante el uso de una molécula de ácido nucleico de secuencia conocida. Una molécula de ácido nucleico adecuada de secuencia conocida es un fragmento de un genoma bacteriano de secuencia conocida, tal como MG1655 deE. coli.El experto en la técnica podría amplificar la molécula de ácido nucleico de secuencia conocida mediante el uso de PCR en presencia de la ADN polimerasa de bajo sesgo. Luego, el experto podría secuenciar la molécula de ácido nucleico amplificada y determinar si su secuencia es la misma que la secuencia original conocida. De lo contrario, el experto podría determinar la naturaleza de las mutaciones. Por ejemplo, si el experto desea determinar si una ADN polimerasa es capaz de mutar adenina mediante el uso de un análogo de nucleótido, el experto podría amplificar la molécula de ácido nucleico de secuencia conocida mediante el uso de PCR en presencia del análogo de nucleótido y secuenciar la molécula de ácido nucleico amplificado resultante. Si el ADN amplificado tiene mutaciones en posiciones que corresponden a nucleótidos de adenina en la secuencia conocida, entonces el experto en la técnica sabrá que la ADN polimerasa podrá mutar adenina mediante el uso de un análogo de nucleótido.
[0150] Las razones de tasa pueden calcularse de manera similar. Por ejemplo, si el experto desea determinar la razón de tasa a la que se mutan los nucleótidos de guanina y citosina, el experto podría amplificar una molécula de ácido nucleico que tiene una secuencia conocida mediante el uso de PCR en presencia de la ADN polimerasa de bajo sesgo. El experto podría secuenciar entonces la molécula de ácido nucleico amplificada resultante e identificar cuántos de los nucleótidos de guanina se han sustituido o delecionado y cuántos de los nucleótidos de citosina se han sustituido o delecionado. La razón de tasa es la razón del número de nucleótidos de guanina que se han sustituido o delecionado con respecto al número de nucleótidos de citosina que se han sustituido o delecionado. Por ejemplo, si 16 nucleótidos de guanina se han reemplazado o delecionado y 8 nucleótidos de citosina se han reemplazado o delecionado, los nucleótidos de guanina y citosina se han mutado en una razón de tasa de 16:8 o 2:1, respectivamente.
[0152] Uso de análogos de nucleótido
[0154] La ADN polimerasa de bajo sesgo puede no ser capaz de reemplazar nucleótidos por otros nucleótidos directamente (al menos no con alta frecuencia), pero la ADN polimerasa de bajo sesgo puede todavía ser capaz de mutar una molécula de ácido nucleico mediante el uso de un análogo de nucleótido. La ADN polimerasa de bajo sesgo puede ser capaz de reemplazar nucleótidos por otros nucleótidos naturales(es decir,citosina, guanina, adenina o timina) o por análogos de nucleótido.
[0156] Por ejemplo, la ADN polimerasa de bajo sesgo puede ser una ADN polimerasa de alta fidelidad. Las ADN polimerasas de alta fidelidad tienden a introducir muy pocas mutaciones, generalmente, ya que son muy exactas. Sin embargo, los presentes inventores han descubierto que algunas ADN polimerasas de alta fidelidad todavía pueden ser capaces de mutar una molécula de ácido nucleico diana, ya que pueden ser capaces de introducir análogos de nucleótido en una molécula de ácido nucleico diana.
[0158] En una realización, en ausencia de análogos de nucleótido, la ADN polimerasa de alta fidelidad introduce menos del 0,01 %, menos del 0,0015 %, menos del 0,001 %, entre el 0 % y el 0,0015 % o entre el 0 % y el 0,001 % de mutaciones por tanda de replicación.
[0159] En una realización, la ADN polimerasa de bajo sesgo es capaz de incorporar análogos de nucleótido en la al menos una molécula de ácido nucleico diana. En una realización, la ADN polimerasa de bajo sesgo incorpora análogos de nucleótido en la al menos una molécula de ácido nucleico diana. En una realización, la ADN polimerasa de bajo sesgo puede mutar adenina, timina, guanina y/o citosina mediante el uso de un análogo de nucleótido. En una realización, la ADN polimerasa de bajo sesgo muta adenina, timina, guanina y/o citosina en la al menos una molécula de ácido nucleico diana utilizando un análogo de nucleótido. En una realización, la ADN polimerasa reemplaza guanina, citosina, adenina y/o timina por un análogo de nucleótido. En una realización, la ADN polimerasa puede reemplazar guanina, citosina, adenina y/o timina por un análogo de nucleótido.
[0161] La incorporación de análogos de nucleótido en la al menos una molécula de ácido nucleico diana puede utilizarse para mutar nucleótidos, ya que pueden incorporarse en lugar de nucleótidos existentes y pueden aparearse con nucleótidos en la cadena opuesta. Por ejemplo, puede incorporarse dPTP en una molécula de ácido nucleico en lugar de un nucleótido de pirimidina (puede reemplazar la timina o citosina); véase la figura 7. Una vez en una hebra de ácido nucleico, puede aparearse con adenina cuando está en una forma tautomérica imino. Por tanto, cuando se forma una hebra complementaria, esa hebra complementaria puede tener una adenina presente en una posición complementaria al dPTP. De manera similar, una vez en una hebra de ácido nucleico, puede aparearse con guanina cuando está en una forma tautomérica amino. Por tanto, cuando se forma una hebra complementaria, esa hebra complementaria puede tener una guanina presente en una posición complementaria al dPTP.
[0163] Por ejemplo, si se introduce un dPTP en la al menos una molécula de ácido nucleico diana de la invención, cuando se forma una al menos una molécula de ácido nucleico complementaria a la al menos una molécula de ácido nucleico diana, la al menos una molécula de ácido nucleico complementaria a la al menos una molécula de ácido nucleico diana comprenderá una adenina o una guanina en una posición complementaria al dPTP en la al menos una molécula de ácido nucleico diana (dependiendo de si el dPTP está en su forma amino o imino). Cuando se replica la al menos una molécula de ácido nucleico complementaria a la al menos una molécula de ácido nucleico diana, la réplica resultante de la al menos una molécula de ácido nucleico diana comprenderá una timina o una citosina en una posición correspondiente al dPTP en la al menos una molécula de ácido nucleico diana. Por tanto, puede introducirse una mutación a timina o citosina en la al menos una molécula de ácido nucleico diana mutada.
[0165] Alternativamente, si se introduce un dPTP en al menos una molécula de ácido nucleico complementaria a la al menos una molécula de ácido nucleico diana, cuando se forma una réplica de la al menos una molécula de ácido nucleico diana, la réplica de la al menos una molécula de ácido nucleico diana comprenderá una adenina o una guanina en una posición complementaria al dPTP en la al menos una molécula de ácido nucleico complementaria a la al menos una molécula de ácido nucleico diana (dependiendo de la forma tautomérica del dPTP). Por lo tanto, puede introducirse una mutación a adenina o guanina en la al menos una molécula de ácido nucleico diana mutada.
[0167] En una realización, la ADN polimerasa de bajo sesgo puede reemplazar citosina o timina por un análogo de nucleótido. En una realización adicional, la ADN polimerasa de bajo sesgo introduce nucleótidos de guanina o adenina mediante el uso de un análogo de nucleótido a una razón de tasa de 0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2, o aproximadamente 1:1, respectivamente. Los nucleótidos de guanina o adenina pueden introducirse por la ADN polimerasa de bajo sesgo que los aparea opuestos a un análogo de nucleótido tal como dPTP. En otra realización, la ADN polimerasa de bajo sesgo introduce nucleótidos de guanina o adenina mediante el uso de un análogo de nucleótido en una razón de tasa de 0,7-1,3:0,7-1,3, respectivamente.
[0169] El experto en la técnica puede determinar, utilizando métodos convencionales, si la ADN polimerasa de bajo sesgo es capaz de incorporar análogos de nucleótido en la al menos una molécula de ácido nucleico diana o mutar adenina, timina, guanina y/o citosina en la al menos una molécula de ácido nucleico diana utilizando un análogo de nucleótido utilizando métodos convencionales.
[0171] Por ejemplo, para determinar si la ADN polimerasa de bajo sesgo es capaz de incorporar análogos de nucleótido en la al menos una molécula de ácido nucleico diana, el experto en la técnica podría amplificar una molécula de ácido nucleico utilizando una ADN polimerasa de bajo sesgo para dos rondas de replicación. La primera tanda de replicación debe realizarse en presencia del análogo de nucleótido, y la segunda tanda de replicación debe realizarse en ausencia del análogo de nucleótido. Las moléculas de ácido nucleico amplificadas resultantes pueden secuenciarse para ver si se han introducido mutaciones, y de ser así, cuántas mutaciones. El usuario debe repetir el experimento sin el análogo de nucleótido y comparar el número de mutaciones introducidas con y sin el análogo de nucleótido. Si el número de mutaciones que se han introducido con el análogo de nucleótido es significativamente mayor que el número de mutaciones que se han introducido sin el análogo de nucleótido, el usuario puede concluir que la ADN polimerasa de bajo sesgo es capaz de incorporar análogos de nucleótido. De manera similar, el experto en la técnica puede determinar si una ADN polimerasa incorpora análogos de nucleótido o muta adenina, timina, guanina y/o citosina usando un análogo de nucleótido. El experto simplemente necesita realizar el método en presencia de análogos de nucleótido, y ver si el método conduce a mutaciones en las posiciones ocupadas originalmente por adenina, timina, guanina y/o citosina.
[0173] Si el usuario desea mutar la al menos una molécula de ácido nucleico diana utilizando un análogo de nucleótido, el método puede comprender una etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo, donde la etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo se realiza en presencia del análogo de nucleótido, y la etapa de amplificar la al menos una molécula de ácido nucleico diana proporciona al menos una molécula de ácido nucleico diana que comprende el análogo de nucleótido.
[0175] Los análogos de nucleótido adecuados incluyen dPTP (2'desoxi-P-nucleósido-5'-trifosfato), 8-oxo-dGTP (7,8-dihidro-8-oxoguanina), 5Br-dUTP (5-bromo-2'-desoxi-uridina-5'-trifosfato), 2OH-dATP (2-hidroxi-2'-desoxiadenosina-5'-trifosfato), dKTP (9-(2-desoxi-p-D-ribofuranosil)-N6-metoxi-2,6,-diaminopurina-5-trifosfato) y dITP (2'-desoxinosina-5'-trifosfato). El análogo de nucleótido puede ser dPTP. Los análogos de nucleótido pueden usarse para introducir las mutaciones por sustitución descritas en la tabla 1.
[0177] Tabla 1
[0180]
[0183] Los diferentes análogos de nucleótido pueden utilizarse, solos o en combinación, para introducir diferentes mutaciones en la al menos una molécula de ácido nucleico diana. Por consiguiente, la ADN polimerasa de bajo sesgo puede introducir mutaciones por sustitución de guanina a adenina, mutaciones por sustitución de citosina a timina, mutaciones por sustitución de adenina a guanina y mutaciones por sustitución de timina a citosina mediante el uso de un análogo de nucleótido. La ADN polimerasa de bajo sesgo puede ser capaz de introducir mutaciones por sustitución de guanina a adenina, mutaciones por sustitución de citosina a timina, mutaciones por sustitución de adenina a guanina y mutaciones por sustitución de timina a citosina, opcionalmente, mediante el uso de un análogo de nucleótido.
[0184] La ADN polimerasa de bajo sesgo puede ser capaz de introducir mutaciones por sustitución de guanina a adenina, mutaciones por sustitución de citosina a timina, mutaciones por sustitución de adenina a guanina, y mutaciones por sustitución de timina a citosina en una razón de tasa de 0,5-1,5:0,5-1,5:0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4:0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2:0,8-1,2:0,8-1,2, o aproximadamente 1:1:1:1, respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo es capaz de introducir mutaciones por sustitución de guanina a adenina, mutaciones por sustitución de citosina a timina, mutaciones por sustitución de adenina a guanina y mutaciones por sustitución de timina a citosina a una razón de tasa de 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1,3, respectivamente. Los métodos adecuados para determinar si la ADN polimerasa de bajo sesgo es capaz de introducir mutaciones por sustitución y a qué relación de tasa se describen bajo el título“ si una ADN polimerasa es capaz de mutar un nucleótido y, de ser así, a qué tasa” .
[0186] En algunos métodos, la ADN polimerasa de bajo sesgo introduce mutaciones por sustitución de guanina a adenina, mutaciones por sustitución de citosina a timina, mutaciones por sustitución de adenina a guanina, mutaciones por sustitución de adenina a guanina y mutaciones por sustitución de timina a citosina en una razón de tasa de 0,5-1,5:0,5-1,5:0,5-1,5:0,5-1,5, 0,6-1,4:0,6-1,4:0,6-1,4:0,6-1,4, 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1,3, 0,8-1,2:0,8-1,2:0,8-1,2:0,8-1,2, o aproximadamente 1:1:1:1, respectivamente. Preferiblemente, la ADN polimerasa de bajo sesgo introduce mutaciones por sustitución de guanina a adenina, mutaciones por sustitución de citosina a timina, mutaciones por sustitución de adenina a guanina y mutaciones por sustitución de timina a citosina en una razón de tasa de 0,7-1,3:0,7-1,3:0,7-1,3:0,7-1,3, respectivamente. Los métodos adecuados para determinar si se introducen mutaciones por sustitución y a qué relación de tasa se describen bajo el título“si una ADN polimerasa es capaz de mutar un nucleótido y, si es así, a qué tasa”
[0188] Generalmente, cuando una ADN polimerasa de bajo sesgo usa un análogo de nucleótido para introducir una mutación, esto requiere más de una tanda de replicación. En la primera tanda de replicación la a Dn polimerasa de bajo sesgo introduce el análogo de nucleótido en lugar de un nucleótido, y en una segunda tanda de replicación, ese análogo de nucleótido se aparea con un nucleótido natural para introducir una mutación por sustitución en la hebra complementaria. La segunda tanda de replicación puede realizarse en presencia del análogo de nucleótido. Sin embargo, el método puede comprender además una etapa de amplificar la al menos una molécula de ácido nucleico de diana que comprende análogos de nucleótido en ausencia de análogos de nucleótido. La etapa de amplificar la al menos una molécula de ácido nucleico diana que comprende análogos de nucleótido en ausencia de análogos de nucleótido puede realizarse utilizando la ADN polimerasa de bajo sesgo.
[0189] Opcionalmente, el método proporciona al menos una molécula de ácido nucleico diana mutada y el método comprende una etapa adicional de amplificar la al menos una molécula de ácido nucleico diana mutada utilizando la ADN polimerasa de bajo sesgo.
[0191] Bajo sesgo de amplificación de molde
[0193] La ADN polimerasa de bajo sesgo puede tener un bajo sesgo de amplificación de molde. Una ADN polimerasa de bajo sesgo tiene bajo sesgo de amplificación de molde, si es capaz de amplificar diferentes moléculas de ácido nucleico diana con grados similares de éxito por ciclo. Las ADN polimerasas de alto sesgo pueden esforzarse por amplificar las moléculas de ácido nucleico molde que comprenden un alto contenido de G:C o contienen un alto grado de estructura secundaria. En una realización, la ADN polimerasa de bajo sesgo de la invención tiene bajo sesgo de amplificación de molde para moléculas de ácido nucleico molde que tienen menos de 25.000, menos de 10.000, entre 1 y 15.000 o entre 1 y 10.000 nucleótidos de longitud.
[0195] En una realización, para determinar si una ADN polimerasa tiene un bajo sesgo de amplificación de molde, el experto en la técnica podría amplificar un rango de secuencias diferentes mediante el uso de la ADN polimerasa, y ver si las secuencias diferentes se amplifican a niveles diferentes mediante la secuenciación del ADN amplificado resultante. Por ejemplo, el experto podría seleccionar un rango de moléculas de ácido nucleico cortas (posiblemente de 50 nucleótidos) que tienen diferentes características, incluyendo una molécula de ácido nucleico que tiene alto contenido de GC, una molécula de ácido nucleico que tiene bajo contenido de GC, una molécula de ácido nucleico que tiene un alto grado de estructura secundaria y una molécula de ácido nucleico que tiene un bajo grado de segunda estructura. Luego, el usuario podría amplificar esas secuencias mediante el uso de la ADN polimerasa y cuantificar el nivel al cual se amplifica cada una de las moléculas de ácido nucleico. En una realización, si los niveles están dentro del 25 %, el 20 %, el 10 % o el 5 % unos de otros, entonces la ADN polimerasa tiene un bajo sesgo de amplificación de molde.
[0196] Alternativamente, en una realización, una ADN polimerasa tiene un bajo sesgo de amplificación de molde si es capaz de amplificar fragmentos de 7-10 kbp con una D de Kolmolgorov-Smirnov menor de 0,1, menor de 0,09 o menor de 0,08. La D de Kolmolgorov-Smirnov con la cual una ADN polimerasa de bajo sesgo particular es capaz de amplificar fragmentos de 7-10 kbp puede determinarse mediante el uso de un ensayo proporcionado en el ejemplo 4.
[0198] La ADN polimerasa de bajo sesgo puede ser una ADN polimerasa de alta fidelidad. Una ADN polimerasa de alta fidelidad es una ADN polimerasa que no es altamente propensa a errores y, así, no introduce generalmente un gran número de mutaciones cuando se utiliza para amplificar una molécula de ácido nucleico diana en ausencia de análogos de nucleótido. Las ADN polimerasas de alta fidelidad no se usan generalmente en los métodos para introducir mutaciones, ya que se considera generalmente que las ADN polimerasas propensas a errores son más eficaces. Sin embargo, la presente solicitud demuestra que ciertas polimerasas de alta fidelidad son capaces de introducir mutaciones mediante el uso de un análogo de nucleótido, y que esas mutaciones pueden introducirse con menor sesgo en comparación con las ADN polimerasas propensas a errores tales como la polimerasa Taq.
[0200] Las ADN polimerasas de alta fidelidad tienen una ventaja adicional. Las ADN polimerasas de alta fidelidad pueden utilizarse para introducir mutaciones cuando se utilizan con análogos de nucleótido, pero en ausencia de análogos de nucleótido pueden replicar una molécula de ácido nucleico diana con mucha exactitud. Esto significa que el usuario puede mutar la al menos una molécula de ácido nucleico diana a alto efecto y amplificar la al menos una molécula de ácido nucleico diana mutada con alta exactitud utilizando la misma ADN polimerasa. Si se utiliza una ADN polimerasa de baja fidelidad para mutar la molécula de ácido nucleico diana, puede ser necesario retirar de la mezcla de reacción antes de amplificar la molécula de ácido nucleico diana.
[0202] Las ADN polimerasas de alta fidelidad pueden tener una actividad de corrección de lectura. Una actividad de corrección de lectura puede ayudar a la ADN polimerasa a amplificar una secuencia de ácido nucleico diana con alta exactitud. Por ejemplo, una ADN polimerasa de bajo sesgo puede comprender un dominio de corrección de lectura. Un dominio de corrección de lectura puede confirmar si un nucleótido que se ha añadido por la polimerasa es correcto (verifica que se aparee correctamente con el ácido nucleico correspondiente de la hebra complementaria) y, si no, lo escinde de la molécula de ácido nucleico. Los inventores han descubierto, sorprendentemente, que en algunas ADN polimerasas, el dominio de corrección de lectura aceptará apareamientos de nucleótidos naturales con análogos de nucleótido. La estructura y secuencia de los dominios de corrección de lectura adecuados son del conocimiento de un experto en la técnica. Las ADN polimerasas que comprenden un dominio de corrección de lectura incluyen miembros de las familias I, II y III de ADN polimerasas, tales como polimerasa Pfu (derivada dePyrococcus furiosus),polimerasa de T4 (derivada del bacteriófago T4) y las polimerasas termocócicas que se describen con mayor detalle a continuación.
[0204] En una realización, en ausencia de análogos de nucleótido, la ADN polimerasa de alta fidelidad introduce menos del 0,01 %, menos del 0,0015 %, menos del 0,001 %, entre el 0 % y el 0,0015 % o entre el 0 % y el 0,001 % de mutaciones por tanda de replicación.
[0205] Además, la ADN polimerasa de bajo sesgo puede comprender un dominio de mejora de la procesabilidad. Un dominio que mejora la procesabilidad permite que una ADN polimerasa amplifique más rápidamente una molécula de ácido nucleico diana. Esto es ventajoso ya que permite que los métodos de la invención se realicen más rápidamente. Polimerasas termocócicas
[0206] En una realización, la ADN polimerasa de bajo sesgo es un fragmento o una variante de un polipéptido que comprende la Id. de sec. n.°: 2, la Id. de sec. n.°: 4, la Id. de sec. n.°: 6 o la Id. de sec. n.°: 7. Los polipéptidos de ID. DE SEC. N.°: 2, 4, 6 y 7 son polimerasas termocócicas. Las polimerasas de Id. de sec. n.°: 2, Id. de sec. n.°: 4, Id. de sec. n.°: 6 o Id. de sec. n.°: 7 son ADN polimerasas de bajo sesgo que tienen alta fidelidad, y pueden mutar moléculas de ácido nucleico diana mediante la incorporación de un análogo de nucleótido tal como dPTP. Las polimerasas de Id. de sec. n.°: 2, Id. de sec. n.°: 4, Id. de sec. n.°: 6 o Id. de sec. n.°: 7 son particularmente ventajosas, ya que tienen un bajo sesgo de mutación y bajo sesgo de amplificación de molde. También, son altamente procesables y son polimerasas de alta fidelidad que comprenden un dominio de corrección de lectura, lo que significa que, en ausencia de análogos de nucleótido, pueden amplificar moléculas de ácido nucleico diana mutadas de forma rápida y exacta.
[0207] La ADN polimerasa de bajo sesgo puede comprender un fragmento de al menos 400, al menos 500, al menos 600, al menos 700 o al menos 750 aminoácidos contiguos de:
[0208] a. una secuencia de ID. DE SEC. N.°: 2;
[0209] b. una secuencia idéntica en al menos el 95 %, al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 2; c. una secuencia de ID. DE SEC. N.°: 4;
[0210] d. una secuencia idéntica en al menos el 95 %, al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 4; e. una secuencia de ID. DE SEC. N.°: 6;
[0211] f. una secuencia idéntica en al menos el 95 %, al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 6; g. una secuencia de ID. DE SEC. N.°: 7; o
[0212] h. una secuencia idéntica en al menos el 95 %, al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 7.
[0213] Preferiblemente, la ADN polimerasa de bajo sesgo comprende un fragmento de al menos 700 aminoácidos contiguos de:
[0214] a. una secuencia de ID. DE SEC. N.°: 2;
[0215] b. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 2;
[0216] c. una secuencia de ID. DE SEC. N.°: 4;
[0217] d. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 4;
[0218] e. una secuencia de ID. DE SEC. N.°: 6;
[0219] f. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 6;
[0220] g. una secuencia de ID. DE SEC. N.°: 7; o
[0221] h. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 7.
[0222] La ADN polimerasa de bajo sesgo puede comprender:
[0223] a. una secuencia de ID. DE SEC. N.°: 2;
[0224] b. una secuencia idéntica en al menos el 95 %, al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 2; c. una secuencia de ID. DE SEC. N.°: 4;
[0225] d. una secuencia idéntica en al menos el 95 %, al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 4; e. una secuencia de ID. DE SEC. N.°: 6;
[0226] f. una secuencia idéntica en al menos el 95 %, al menos el 98%o al menos el 99% ala ID. DE SEC. N.°: 6; g. una secuencia de ID. DE SEC. N.°: 7; o
[0227] h. una secuencia idéntica en al menos el 95 %, al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 7.
[0228] Preferiblemente, la ADN polimerasa de bajo sesgo comprende:
[0229] a. una secuencia de ID. DE SEC. N.°: 2;
[0230] b. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 2;
[0231] c. una secuencia de ID. DE SEC. N.°: 4;
[0232] d. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 4;
[0233] e. una secuencia de ID. DE SEC. N.°: 6;
[0234] f. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 6;
[0235] g. una secuencia de ID. DE SEC. N.°: 7; o
[0236] h. una secuencia idéntica en al menos el 98 % o al menos el 99 % a la ID. DE SEC. N.°: 7.
[0237] La ADN polimerasa de bajo sesgo puede ser una polimerasa termocócica o un derivado de la misma. Las ADN polimerasas de ID. DE s Ec . N.° 2, 4, 6 y 7 son polimerasas termocócicas. Las polimerasas termocócicas son ventajosas, ya que son generalmente polimerasas de alta fidelidad que pueden usarse para introducir mutaciones mediante el uso de un análogo de nucleótido con sesgo de mutación y sesgo de amplificación de molde bajos. Una polimerasa termocócica es una polimerasa que tiene la secuencia de polipéptidos de una polimerasa aislada de una cepa del géneroThermococcus.Un derivado de una polimerasa termocócica puede ser un fragmento de al menos 400, al menos 500, al menos 600, al menos 700 o al menos 750 aminoácidos contiguos de una polimerasa termocócica o idéntico en al menos el 95 %, al menos el 98 %, al menos el 99 % o el 100 % a un fragmento de al menos 400, al menos 500, al menos 600, al menos 700 o al menos 750 aminoácidos contiguos de una polimerasa termocócica. El derivado de una polimerasa termocócica puede ser idéntico en al menos el 95 %, al menos el 98 %, al menos el 99 % o el 100 % a una polimerasa termocócica. El derivado de una polimerasa termocócica puede ser idéntico en al menos el 98 % a una polimerasa termocócica.
[0238] Una polimerasa termocócica de cualquier cepa puede ser eficaz en el contexto de la presente invención. En una realización, la polimerasa termocócica se deriva de una cepa termocócica seleccionada del grupo que consiste enT. kodakarensis, T. celer, T. siculi,yT. spKS-1. Las polimerasas termocócicas de estas cepas se describen en la ID. DE SEC. N.°: 2, la ID. DE SEC. N.°: 4, la ID. DE SEC. N.°: 6 y la ID. DE SEC. N.°: 7.
[0239] Opcionalmente, la ADN polimerasa de bajo sesgo es una polimerasa que tiene alta actividad catalítica a temperaturas de entre 50 °C y 90 °C, entre 60 °C y 80 °C, o aproximadamente 68 °C.
[0240] Códigos de barras, etiquetas de muestra y adaptadores
[0241] El método puede comprender además introducir códigos de barras en las moléculas de ácido nucleico diana. A efectos de la presente invención, un código de barras es una secuencia de nucleótidos redundante o generada aleatoriamente. La expresión"código de barras”es sinónimo de las expresiones"identifícadores moleculares únicos”(UMI, por sus siglas en inglés) o"etiquetas moleculares únicas”(UMT, por sus siglas en inglés). El método puede comprender introducir 1, 2 o más códigos de barras en las moléculas de ácido nucleico diana. En una realización preferida, el método comprende introducir una variedad de códigos de barras en las moléculas de ácido nucleico diana, de tal modo que, una vez introducidos los códigos de barras, la mayoría de las moléculas de ácido nucleico diana originales comprenden códigos de barras únicos en comparación con otras moléculas de ácido nucleico diana originales. La introducción de códigos de barras en las moléculas de ácido nucleico diana puede ser útil si el método para introducir mutaciones de la invención se utiliza como parte de un método para determinar una secuencia. La utilización de códigos de barras puede ayudar al usuario a identificar de cuál de las al menos una de las moléculas de ácido nucleico diana originales procedía cada secuencia de al menos una de las moléculas de ácido nucleico diana (o al menos una molécula de ácido nucleico diana amplificada o fragmentada). Si los códigos de barras utilizados en cada molécula de ácido nucleico diana original son diferentes, el usuario puede secuenciar los códigos de barras o las moléculas de ácido nucleico diana, y es probable que las secuencias de las moléculas de ácido nucleico diana que comprenden los mismos códigos de barras sean secuencias de moléculas de ácido nucleico diana que se originaron a partir de la misma molécula de ácido nucleico diana original.
[0242] El método para introducir mutaciones en al menos una molécula de ácido nucleico diana puede comprender introducir etiquetas de muestra en las moléculas de ácido nucleico diana. Una etiqueta de muestra es una serie corta de ácidos nucleicos de secuencia conocida (especificada). Por ejemplo, el método de la invención puede realizarse en múltiples moléculas de ácido nucleico diana tomadas de diferentes muestras. Esas muestras se pueden agrupar, pero antes de la agrupación, se puede introducir una etiqueta de muestra en las moléculas de ácido nucleico diana de una muestra (las moléculas de ácido nucleico diana se marcan con una etiqueta de muestra). Las moléculas de ácido nucleico diana de diferentes muestras pueden marcarse con diferentes etiquetas de muestra. Opcionalmente, las moléculas de ácido nucleico diana de la misma muestra se etiquetan con la misma etiqueta de muestra o una etiqueta de muestra del mismo subgrupo de etiquetas de muestra. Por ejemplo, si el usuario decide utilizar dos muestras, las moléculas de ácido nucleico diana de la primera muestra pueden etiquetarse con una primera etiqueta de muestra que tenga una secuencia específica y las moléculas de ácido nucleico diana de la segunda muestra pueden etiquetarse con una segunda etiqueta de muestra que tenga una segunda secuencia especificada. Similarmente, si el usuario decide utilizar dos muestras, las moléculas de ácido nucleico diana de la primera muestra pueden etiquetarse con una etiqueta de muestra de un primer subgrupo de etiquetas de muestra y las moléculas de ácido nucleico diana de la segunda muestra pueden etiquetarse con una etiqueta de muestra de un segundo subgrupo de etiquetas de muestra. El usuario entenderá que cualquier molécula de ácido nucleico diana que comprenda la primera etiqueta de muestra o una etiqueta de muestra del primer subgrupo de etiquetas de muestra se originó a partir de la primera muestra, y cualquier molécula de ácido nucleico diana que comprenda la segunda etiqueta de muestra o una etiqueta de muestra del segundo subgrupo de etiquetas de muestra se originó a partir de la segunda muestra. Es posible determinar qué etiqueta se ha utilizado para marcar una secuencia de ácido nucleico diana mediante la secuenciación de la secuencia de ácido nucleico diana. A continuación se describen métodos de secuenciación adecuados con más detalle.
[0244] En una realización, las etiquetas de muestra se introducen (las moléculas de ácido nucleico diana se marcan con una etiqueta de muestra) antes de la etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo. Esto es ventajoso, ya que significa que las muestras se pueden agrupar en una fase temprana del método, lo que reduce el tiempo de manipulación, el número de reactivos necesarios y la posibilidad de introducir errores en la manipulación de las muestras. Sin embargo, si las etiquetas de muestra se introducen antes de la etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo, es posible que las etiquetas de muestra muten por la ADN polimerasa de bajo sesgo. Los presentes inventores han diseñado grupos de etiquetas de muestras que están diseñados de tal modo que puedan distinguirse entre sí incluso si han sido mutadas.
[0246] En una realización, se utiliza un grupo de etiquetas de muestra y las moléculas de ácido nucleico diana de diferentes muestras se etiquetan con diferentes etiquetas de muestra del grupo. Las moléculas de ácido nucleico diana de la misma muestra pueden marcarse con la misma etiqueta de muestra del grupo o con una etiqueta de muestra del mismo subgrupo de etiquetas de muestras del grupo. Por ejemplo, si el grupo de etiquetas de muestra comprende etiquetas de muestra denominadas A, B, C y D, todas las moléculas de ácido nucleico diana de una primera muestra pueden marcarse utilizando A o A/B, y todas las moléculas de ácido nucleico diana de una segunda muestra pueden etiquetarse utilizando C o C/D. Cada etiqueta de muestra del grupo de etiquetas de muestra puede diferir sustancialmente de todas las demás etiquetas de muestra del grupo en al menos 1 diferencia de mutación de baja probabilidad. Cada etiqueta de muestra del grupo de etiquetas de muestra puede diferir de todas las demás etiquetas de muestra del grupo en al menos 1 diferencia de mutación de baja probabilidad.
[0248] No forma parte de la invención un grupo de etiquetas de muestra, en donde cada etiqueta de muestra del grupo difiere sustancialmente de todas las demás etiquetas de muestra del grupo en al menos 1 diferencia de mutación de baja probabilidad. Cada etiqueta de muestra puede diferir de todas las demás etiquetas de muestra del grupo en al menos 1 diferencia de mutación de baja probabilidad.
[0250] Con la expresión"difiere sustancialmente de todas las demás etiquetas de muestra del grupo en al menos 1 diferencia de mutación de baja probabilidad” , queremos decir que cada etiqueta se ha diseñado de tal modo que si las etiquetas de muestra mutan por al menos 1 mutación de baja probabilidad, las etiquetas seguirán siendo casi diferentes entre sí (sustancialmente todas o todas las demás etiquetas). En una realización, la expresión"sustancialmente todas las demás etiquetas de muestra"se refiere a al menos el 90 %, al menos el 95 % o al menos el 98 % de las otras etiquetas de muestra. Una mutación de baja probabilidad es una mutación que se produce con poca frecuencia en el método para introducir mutaciones de la invención. Por ejemplo, una mutación de baja probabilidad puede ser una mutación de transversión o una mutación indel. Las mutaciones por transversión y las mutaciones indel se producen con poca frecuencia cuando el método para introducir mutaciones de la invención se realiza utilizando dPTP como un análogo de nucleótido. Una mutación por transversión es la sustitución de un nucleótido de purina por un nucleótido de pirimidina (adenina por citosina, adenina por timina, guanina por citosina o guanina por timina) o un nucleótido de pirimidina por un nucleótido de purina (citosina por adenina, citosina por guanina, timina por adenina o timina por guanina). Una mutación indel es una mutación por deleción o una mutación por inserción. Las etiquetas adecuadas pueden diseñarse computacionalmente utilizando métodos estadísticos. Por ejemplo, el experto en la técnica podría determinar qué tipo de mutación es una mutación de baja probabilidad en un método para introducir mutaciones de la invención. El experto en la técnica puede realizar el método para introducir mutaciones de la invención y determinar los tipos de mutaciones que se han introducido secuenciando el producto de la molécula de ácido nucleico. Las mutaciones que ocurren con mayor frecuencia son mutaciones de alta probabilidad y las mutaciones que ocurren con menos frecuencia son mutaciones de baja probabilidad.
[0252] El usuario podría generar etiquetas de muestra adecuadas utilizando el método para diseñar un grupo de etiquetas de muestra
[0254] Opcionalmente, cada etiqueta de muestra difiere sustancialmente de todas las demás etiquetas de muestra del grupo en al menos 2, al menos 3, al menos 4, al menos 5, entre 3 y 50, entre 3 y 25, o entre 3 y 10 diferencias de mutación de baja probabilidad. Opcionalmente, cada etiqueta de muestra difiere de todas las demás etiquetas de muestra del grupo en al menos 2, al menos 3, al menos 4, al menos 5, entre 3 y 50, entre 3 y 25, o entre 3 y 10 diferencias de mutación de baja probabilidad.
[0256] Cada etiqueta de muestra puede diferir sustancialmente de todas las demás etiquetas de muestra del grupo en al menos 2 diferencias de mutación de alta probabilidad. Una diferencia de mutación de alta probabilidad es una mutación que se produce con frecuencia en un método para introducir mutaciones de la invención. Por ejemplo, una diferencia de mutación de alta probabilidad puede ser una mutación de transición. Una mutación de transición es la sustitución de un nucleótido de purina por otro nucleótido de purina (adenina a guanina o guanina a adenina), o un nucleótido de pirimidina por otro nucleótido de pirimidina (citosina a timina o timina a citosina).
[0258] Cada etiqueta de muestra puede diferir de todas las demás etiquetas de muestra del grupo en al menos 2 diferencias de mutación de alta probabilidad, esdecir,cada etiqueta de muestra se ha diseñado de tal modo que si las etiquetas de muestra están mutadas por al menos 2 mutaciones de alta probabilidad, las etiquetas seguirán siendo diferentes entre sí.
[0260] Opcionalmente, cada etiqueta de muestra difiere sustancialmente de todas las demás etiquetas de muestra del grupo en al menos 3, entre 2 y 50, entre 3 y 25, o entre 3 y 10 diferencias de mutación de alta probabilidad. Opcionalmente, cada etiqueta de muestra difiere de todas las demás etiquetas de muestra del grupo en al menos 3, entre 2 y 50, entre 5 y 25, o entre 5 y 10 diferencias de mutación de alta probabilidad.
[0262] En una realización, cada etiqueta de muestra tiene una longitud de al menos 8 nucleótidos, al menos 10 nucleótidos, al menos 12 nucleótidos, entre 8 y 50 nucleótidos, entre 10 y 50 nucleótidos o entre 10 y 50 nucleótidos.
[0264] Las etiquetas de muestra adecuadas son las de las Id. de sec. n.°: 8-136.
[0266] El método puede comprender además introducir adaptadores en cada una de las moléculas de ácido nucleico diana. Los adaptadores pueden comprender un sitio de unión al cebador. A efectos de la invención, los sitios de unión a los cebadores son secuencias conocidas de nucleótidos que son lo suficientemente largas como para que los cebadores se hibriden específicamente con ellas. Opcionalmente, los sitios de unión al cebador tienen al menos 8, al menos 10, al menos 12, entre 8 y 50, o entre 10 y 25 nucleótidos de longitud.
[0268] El método puede comprender introducir un primer adaptador en el extremo 3' de la al menos una molécula de ácido nucleico diana y un segundo adaptador en el extremo 5' de la al menos una molécula de ácido nucleico diana, en donde el primer adaptador y el segundo adaptador pueden hibridarse entre sí.
[0270] La invención se ha descrito en las reivindicaciones adjuntas. En la presente memoria, pero sin formar parte de la invención, se describe un método para amplificar preferentemente moléculas de ácido nucleico que tienen una longitud superior a 1 kpb, que comprende:
[0272] a. proporcionar al menos una muestra que comprende moléculas de ácido nucleico diana;
[0274] b. introducir un primer adaptador en el extremo 3' de las moléculas de ácido nucleico diana y un segundo adaptador en el extremo 5' de las moléculas de ácido nucleico diana; y
[0276] c. amplificar las moléculas de ácido nucleico diana utilizando cebadores que son complementarios a una parte del primer adaptador,
[0278] en donde el primer adaptador y el segundo adaptador pueden hibridarse entre sí.
[0280] El segundo adaptador puede comprender una parte que es complementaria a un primer sitio de unión al cebador y el primer adaptador puede comprender el primer sitio de unión al cebador.
[0282] Los presentes inventores han descubierto que mediante la introducción de un primer adaptador y un segundo adaptador que pueden hibridarse entre sí en la al menos una molécula de ácido nucleico diana, pueden garantizar que los métodos de la invención amplifiquen y/o muten preferentemente las moléculas de ácido nucleico diana largas. Si el primer adaptador puede hibridarse con el segundo adaptador, entonces pueden hacerlo en los métodos de la invención dando como resultado una autohibridación de al menos una molécula de ácido nucleico diana (como se indica en la figura 5). Las moléculas de ácido nucleico diana autohibridadas no se replican y, por lo tanto, no se amplificarán y/o mutarán mediante los métodos de la invención. La probabilidad de que el primer adaptador y el segundo adaptador se hibriden entre sí durante los métodos de la invención será mayor para las moléculas de ácido nucleico diana más cortas que para las moléculas de ácido nucleico diana más largas. Por estas razones, la adición de un primer adaptador y un segundo adaptador a la al menos una molécula de ácido nucleico diana de la invención se puede utilizar para amplificar preferentemente al menos una molécula de ácido nucleico diana más grande.
[0284] El método para amplificar preferentemente las moléculas de ácido nucleico puede ser un método para amplificar preferentemente las moléculas de ácido nucleico diana que tienen una longitud superior a 1,5 kpb. El método puede comprender además una etapa de secuenciación de las moléculas de ácido nucleico diana. Los ejemplos de posibles métodos de secuenciación incluyen la secuenciación de Maxam Gilbert, la secuenciación de Sanger, la secuenciación de nanoporos o la secuenciación que comprende la PCR puente. En una realización típica, las etapas de secuenciación incluyen PCR en puente. Opcionalmente, la etapa de PCR en puente se realiza utilizando un tiempo de extensión mayor de 5, mayor de 10, mayor de 15, o mayor de 20 segundos. Un ejemplo de la utilización de PCR en puente se encuentra en los secuenciadores del analizador de genoma Illumina.
[0286] Es posible que un usuario determine si un primer adaptador y un segundo adaptador pueden recocerse entre sí. En una realización, el usuario puede identificar si un primer adaptador y un segundo adaptador pueden hibridarse entre sí al proporcionar una molécula de ácido nucleico que comprenda el primer adaptador y comprobando si un cebador que comprende el segundo adaptador es capaz de iniciar replicar la molécula de ácido nucleico en condiciones de PCR.
[0288] Alternativamente, en una realización, se puede considerar que el primer adaptador y el segundo adaptador pueden hibridarse entre sí si se hibridan en las siguientes condiciones: las concentraciones equimolares de los dos cebadores se combinan (p. ej., 50 pM) y a continuación se incuban a una temperatura alta, tal como 95 °C, durante 5 minutos para garantizar que los cebadores sean monocatenarios. La solución se enfría luego lentamente a temperatura ambiente (25 °C) durante un período de aproximadamente 45 minutos.
[0290] Los métodos pueden comprender amplificar las moléculas de ácido nucleico diana utilizando cebadores que son idénticos entre sí, o sustancialmente idénticos entre sí. Los cebadores pueden ser complementarios a una parte del primer adaptador. Dos cebadores son"sustancialmente idénticos”entre sí si tienen una secuencia idéntica o una secuencia que difiere en 1, 2 o 3 nucleótidos. En una realización preferida, los métodos de la invención comprenden amplificar las moléculas de ácido nucleico diana utilizando cebadores que son idénticos en secuencia o que difieren en una única diferencia de nucleótidos.
[0292] En una modalidad, el primer adaptador y el segundo adaptador comprenden secuencias que son complementarias entre sí, o sustancialmente complementarias entre sí. El primer adaptador puede ser sustancialmente complementario al segundo adaptador si el primer adaptador es complementario a una molécula de ácido nucleico que es al menos un 80 %, al menos un 90 %, al menos un 95 % o al menos un 99 % idéntica al segundo adaptador.
[0294] El usuario puede utilizar cebadores que comprenden sitios de unión a cebadores, y estos cebadores pueden utilizarse para amplificar preferentemente réplicas de la al menos una molécula de ácido nucleico diana que se generaron en la última ronda de replicación. Por ejemplo, se puede utilizar un primer conjunto de cebadores que comprende un tercer sitio de unión al cebador en una ronda de replicación. En una ronda adicional de replicación, se puede utilizar un segundo conjunto de cebadores que se unen al tercer sitio de unión del cebador. El segundo conjunto de cebadores solo replicará réplicas de la al menos una molécula de ácido nucleico diana que se generaron en una ronda de replicación anterior, utilizando el primer conjunto de cebadores.
[0296] Se pueden utilizar terceros conjuntos de cebadores y adicionales. Replicar preferentemente réplicas de una ronda de replicación anterior es ventajoso, ya que puede garantizar que cada molécula de ácido nucleico diana amplificada comprenda un alto nivel de mutación (ya que solo se replicará al menos una molécula de ácido nucleico diana que haya estado expuesta a al menos una ronda de amplificación por la ADN polimerasa de bajo sesgo).
[0298] En la presente memoria se describen métodos que comprenden:
[0300] (a) introducir un primer adaptador que comprende un primer sitio de unión al cebador en el 3'
[0302] el extremo de la al menos una molécula de ácido nucleico diana o moléculas de ácido nucleico diana y un segundo adaptador que comprende una parte que es complementaria al primer sitio de unión al cebador en el extremo 5' de la al menos una molécula de ácido nucleico diana o moléculas de ácido nucleico diana, en donde el primer adaptador y el segundo adaptador pueden hibridarse entre sí; (b) amplificar las moléculas de ácido nucleico diana utilizando un primer conjunto de cebadores que son complementarios al primer sitio de unión al cebador y comprenden un segundo sitio de unión al cebador, opcionalmente utilizando una ADN polimerasa de bajo sesgo; y (c) amplificar las moléculas de ácido nucleico diana utilizando un segundo conjunto de cebadores que son complementarios al sitio de unión del segundo cebador, opcionalmente utilizando una<a>D<n>polimerasa de bajo sesgo.
[0303] El segundo conjunto de cebadores puede comprender un tercer sitio de unión al cebador, y se pueden realizar etapas de amplificación adicionales utilizando un tercer o más conjuntos de cebadores que son complementarios al tercer o más sitios de unión al cebador.
[0305] Los códigos de barras, etiquetas de muestra y/o adaptadores pueden introducirse utilizando cualquier método adecuado incluyendo PCR, tagmentación y cizalladura física o digestión de restricción de ácidos nucleicos diana combinados con posterior ligadura de adaptadores (opcionalmente ligadura de extremos cohesivos). Por ejemplo, puede realizarse PCR en al menos una molécula de ácido nucleico molde diana mediante el uso de un primer conjunto de cebadores capaces de hibridarse al menos a una molécula de ácido nucleico diana. Los códigos de barras, etiquetas de muestra y/o adaptadores pueden introducirse en cada una de la al menos una molécula de ácido nucleico diana mediante PCR utilizando cebadores que comprenden una parte (una parte de extremo 5') que comprende un código de barras, una etiqueta de muestra y/o un adaptador, y una parte (una parte de extremo 3') que tiene una secuencia que es capaz de hibridarse a (opcionalmente complementaria a) la al menos una molécula de ácido nucleico diana. Tales cebadores se hibridarán con una molécula de ácido nucleico diana; la extensión del cebador por PCR proporcionará entonces una molécula de ácido nucleico que comprende un código de barras, una etiqueta de muestra y/o un adaptador. Puede utilizarse un ciclo adicional de PCR con estos cebadores para añadir un código de barras, etiqueta de muestra y/o adaptador al otro extremo de la al menos una molécula de ácido nucleico diana. Los cebadores pueden ser redundantes, esdecir,las partes del extremo 3' de los cebadores pueden ser similares pero no idénticas entre sí.
[0307] Los códigos de barras, las etiquetas de muestra y/o los adaptadores se pueden introducir mediante tagmentación. Los códigos de barras, etiquetas de muestra y/o adaptadores pueden introducirse utilizando tagmentación directa, o mediante la introducción de una secuencia definida mediante tagmentación seguida por dos ciclos de PCR utilizando cebadores que comprenden una parte capaz de hibridarse a la secuencia definida, y una parte que comprende un código de barras, una etiqueta de muestra y/o un adaptador. Los códigos de barras, etiquetas de muestra y/o adaptadores pueden introducirse mediante digestión de restricción de la al menos una molécula de ácido nucleico original diana seguida por ligadura de ácidos nucleicos que comprenden los códigos de barras, etiquetas de muestra y/o adaptadores. La digestión de restricción de la al menos una molécula de ácido nucleico original debe realizarse de tal manera que la digestión dé como resultado una molécula de ácido nucleico que comprende la región que va a secuenciarse (la al menos una molécula de ácido nucleico molde diana). Los códigos de barras, etiquetas de muestra y/o adaptadores pueden introducirse mediante cizalladura de la al menos una molécula de ácido nucleico diana, seguida por reparación de extremos, adición de cola A y a continuación ligadura de ácidos nucleicos que comprenden los códigos de barras, etiquetas de muestra y/o adaptadores.
[0309] Un método para determinar una secuencia de al menos una molécula de ácido nucleico diana
[0311] En la presente memoria se describe
[0313] un método para determinar una secuencia de al menos
[0315] una molécula de ácido nucleico diana que comprende el método para introducir mutaciones de la invención.
[0317] Como se ha descrito anteriormente, el método para introducir mutaciones de la invención puede ser útil como parte de un método para determinar una secuencia de al menos una molécula de ácido nucleico diana, ya que las mutaciones pueden permitir al experto en la técnica ensamblar secuencias.
[0319] Como se describe en la sección de antecedentes, los métodos de secuenciación pueden mejorarse incorporando etapas que introducen mutaciones en al menos una molécula de ácido nucleico diana que se va a secuenciar. Un usuario con frecuencia amplificará y/o fragmentará la al menos una molécula de ácido nucleico diana antes de secuenciarla. El usuario ensamblará entonces una secuencia de consenso para al menos una de las moléculas de ácido nucleico diana a partir de las secuencias de las regiones de al menos una molécula de ácido nucleico diana amplificada o fragmentada. La introducción de mutaciones en la al menos una molécula de ácido nucleico diana antes de la amplificación o fragmentación puede ayudar al usuario a identificar de cuál de las al menos una molécula de ácido nucleico molde original procedía cada secuencia de regiones de al menos una molécula de ácido nucleico diana amplificada o fragmentada, y así mejorar la precisión de las secuencias de consenso.
[0321] Cuanto más aleatorias sean las mutaciones que se introduzcan, más fácil será identificar de cuál de las al menos una molécula de ácido nucleico diana original procedía cada secuencia de al menos una molécula de ácido nucleico diana amplificada o fragmentada. El método de introducción de mutaciones de la invención, que utiliza una ADN polimerasa de bajo sesgo, puede utilizarse para introducir mutaciones de una manera sustancialmente aleatoria y, por lo tanto, es ideal para su inclusión en un método para determinar una secuencia de al menos una molécula de ácido nucleico diana.
[0323] El método para determinar una secuencia de al menos una molécula de ácido nucleico diana puede comprender las etapas de:
[0324] a. realizar el método para introducir mutaciones en al menos una molécula de ácido nucleico diana de la invención para proporcionar al menos una molécula de ácido nucleico diana mutada;
[0326] b. secuenciar regiones de la al menos una molécula de ácido nucleico diana mutada para proporcionar lecturas de secuencias mutadas; y
[0328] c. ensamblar una secuencia para al menos una parte de la al menos una molécula de ácido nucleico diana utilizando las lecturas de secuencia mutada.
[0330] En general, las etapas de secuenciación pueden realizarse utilizando cualquier método de secuenciación. Los ejemplos de posibles métodos de secuenciación incluyen la secuenciación de Maxam Gilbert, la secuenciación de Sanger, la secuenciación de nanoporos o la secuenciación que comprende la PCR puente. En una realización típica, las etapas de secuenciación incluyen PCR en puente. Opcionalmente, la etapa de p Cr en puente se realiza utilizando un tiempo de extensión mayor de 5, mayor de 10, mayor de 15, o mayor de 20 segundos. Un ejemplo de la utilización de PCR en puente se encuentra en los secuenciadores del analizador de genoma Illumina.
[0332] El método puede comprender secuenciar regiones de al menos una molécula de ácido nucleico diana mutada para proporcionar lecturas de secuencias mutadas. Las regiones pueden corresponder a un fragmento que puede comprender una parte sustancial de la al menos una molécula de ácido nucleico diana mutada. Puede ser que la al menos una molécula de ácido nucleico diana mutada completa no pueda secuenciarse por alguna razón, pero el usuario aún puede encontrar útil la secuencia de una parte de la al menos una molécula de ácido nucleico diana mutada. Las regiones de la al menos una molécula de ácido nucleico diana mutada pueden comprender la longitud completa de la al menos una molécula de ácido nucleico diana mutada.
[0334] El método puede comprender ensamblar una secuencia para al menos una parte de la al menos una molécula de ácido nucleico diana a partir de las lecturas de la secuencia mutada. La secuencia se puede ensamblar al alinear las lecturas de la secuencia mutada y agrupar las lecturas que comparten el mismo patrón de mutación. Se ensamblará una secuencia a partir de lecturas de secuencias mutadas en el mismo grupo. El ensamblaje se puede realizar utilizando software como Clustal W2, IDBA-UD o SoapDeNovo.
[0336] El método para determinar una secuencia de al menos una molécula de ácido nucleico diana puede comprender las etapas de:
[0338] a. realizar el método para introducir mutaciones en al menos una molécula de ácido nucleico diana de la invención para proporcionar al menos una molécula de ácido nucleico diana mutada;
[0340] b. fragmentar y/o amplificar la al menos una molécula de ácido nucleico diana mutada para proporcionar al menos una molécula de ácido nucleico diana mutada fragmentada y/o amplificada;
[0342] c. secuenciar regiones de la al menos una molécula de ácido nucleico diana mutada fragmentada y/o amplificada para proporcionar lecturas de secuencias mutadas; y
[0344] d. ensamblar una secuencia para al menos una parte de la al menos una molécula de ácido nucleico diana utilizando las lecturas de secuencia mutada.
[0346] Una etapa de amplificar la al menos una molécula de ácido nucleico diana mutada podría realizarse mediante cualquier técnica de amplificación adecuada, tal como la PCR. De forma adecuada, la PCR se realiza utilizando la ADN polimerasa de bajo sesgo en condiciones tales como las descritas bajo el título"amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo” .
[0348] Se podría realizar una etapa de fragmentar la de al menos una molécula de ácido nucleico diana mutada utilizando cualquier método apropiado. Por ejemplo, la fragmentación puede realizarse mediante el uso de digestión de restricción o mediante el uso de PCR con cebadores complementarios a al menos una región interna de la al menos una molécula de ácido nucleico diana mutada. Preferiblemente, la fragmentación se realiza mediante el uso de una técnica que produce fragmentos arbitrarios. La expresión"fragmento arbitrario”se refiere a un fragmento generado al azar, por ejemplo, un fragmento generado mediante tagmentación. Los fragmentos generados utilizando enzimas de restricción no son"arbitrarios”ya que la digestión de restricción se produce en secuencias de ADN específicas definidas por la enzima de restricción que se utiliza. Incluso más preferiblemente, la fragmentación se realiza mediante tagmentación. Si la fragmentación se realiza mediante tagmentación, la reacción de tagmentación introduce opcionalmente una región adaptadora en la al menos una molécula de ácido nucleico diana mutada. Esta región adaptadora es una secuencia corta de ADN que puede codificar, por ejemplo, para adaptadores para permitir que la al menos única molécula de ácido nucleico diana mutada se secuencie mediante el uso de la tecnología Illumina.
[0349] La etapa de fragmentación puede comprender una etapa adicional de enriquecer la al menos una molécula de ácido nucleico diana fragmentada mutada. La etapa de enriquecer la al menos una molécula de ácido nucleico diana fragmentada mutada puede realizarse mediante PCR. De forma adecuada, la PCR se realiza utilizando la ADN polimerasa de bajo sesgo en condiciones tales como las descritas bajo el título “amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo” .
[0350] Un método para diseñar una proteína
[0351] El método para introducir mutaciones de la invención puede ser útil como parte de un método para diseñar una proteína. Por ejemplo, la ingeniería de proteínas puede implicar la búsqueda de mutaciones que aumenten o disminuyan la actividad de una proteína o cambien su estructura. Como parte de la ingeniería de proteínas, un usuario puede desear mutar aleatoriamente la proteína y ver cómo las mutaciones afectan a la actividad o estructura de la proteína. El presente método es un método que da como resultado una mutagénesis altamente aleatoria y, por lo tanto, puede usarse ventajosamente como parte de un método para diseñar una proteína.
[0352] En la presente memoria se describe un método para diseñar una proteína que comprende el método para introducir mutaciones. El método puede comprender las etapas de:
[0353] a. realizar un método para introducir mutaciones de la invención para proporcionar al menos una molécula de ácido nucleico diana mutada;
[0354] b. insertar la al menos una molécula de ácido nucleico diana mutada en un vector; y
[0355] c. expresar una proteína codificada por la al menos una molécula de ácido nucleico diana mutada.
[0356] El método puede comprender las etapas de:
[0357] a. realizar un método para introducir mutaciones de la invención para proporcionar al menos una molécula de ácido nucleico diana mutada;
[0358] b. amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo en presencia de un análogo de nucleótido para proporcionar moléculas de ácido nucleico diana que comprenden un análogo de nucleótido;
[0359] c. amplificar las moléculas de ácido nucleico diana que comprenden un análogo de nucleótido en ausencia de análogos de nucleótidos para proporcionar al menos una molécula de ácido nucleico diana mutada;
[0360] d. insertar la al menos una molécula de ácido nucleico diana mutada en un vector; y
[0361] e. expresar una proteína codificada por la al menos una molécula de ácido nucleico diana mutada.
[0362] Puede utilizarse cualquier vector adecuado. Opcionalmente, el vector es un plásmido, un virus, un cósmido o un cromosoma artificial. Normalmente, el vector comprende además una secuencia de control unida operativamente a la secuencia insertada, lo que permite la expresión de un polipéptido. Preferiblemente, el vector de la invención comprende además los iniciadores, promotores, potenciadores y otros elementos apropiados que pueden ser necesarios y que están colocados en la orientación correcta, para permitir la expresión de un polipéptido.
[0363] Opcionalmente, la etapa de expresar la al menos una molécula de ácido nucleico diana mutada se logra transformando células bacterianas, transfectando células eucariotas o transduciendo células eucariotas con el vector. Opcionalmente, las células bacterianas son células deEscherichia coli (E. coli).
[0364] Por ejemplo, la etapa de expresar la al menos una molécula de ácido nucleico diana mutada puede comprender insertar la al menos una molécula de ácido nucleico diana mutada en un vector plasmídico y transformarE. colicon el plásmido. El plásmido puede comprender elementos de control adecuados para expresarse enE. coli,tales como un promotor lac o T7 (Dubendorff JW, Studier FW (1991)). “ Controlling basal expression in an inducible T7 expression system by blocking the target T7 promoter with lac repressor” . Journal of Molecular Biology. 219 (1): 45-59.)). Se describen técnicas de expresión adecuadas en Sambrook, J. y col., (1989) Molecular Cloning: A Laboratory Manual Second Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York.
[0365] Alternativamente, la etapa de expresar la al menos una molécula de ácido nucleico diana mutada puede comprender expresar fragmentos producidos directamente a partir de la etapa de amplificar las moléculas de ácido nucleico diana utilizando un métodoin vitro.
[0366] El método puede comprender además una etapa de probar la actividad o evaluar la estructura de la proteína codificada por la al menos una molécula de ácido nucleico diana mutada.
[0367] La etapa de probar la actividad o evaluar la estructura de la proteína codificada por la al menos una molécula de ácido nucleico diana mutada puede realizarse utilizando cualquier número de técnicas bien conocidas. Por ejemplo, el experto en la técnica conocerá las técnicas adecuadas para evaluar la estructura de una proteína, incluidas técnicas de resonancia magnética nuclear (RMN), técnicas de microscopía tales como la criomicroscopía electrónica, técnicas de dispersión de rayos X de ángulo pequeño o la cristalografía de rayos X. De manera similar, el experto en la técnica conocerá las técnicas que podrían utilizarse para evaluar la actividad de una proteína. El método utilizado dependerá de la proteína que esté codificada por la al menos una molécula de ácido nucleico diana mutada. Por ejemplo, si la proteína que está codificada por la al menos una molécula de ácido nucleico diana mutada es un factor de coagulación sanguínea, el experto en la técnica analizaría la proteína para determinar su actividad de coagulación, por ejemplo, utilizando un ensayo de coagulación cromogénico. Alternativamente, si la proteína que está codificada por la al menos una molécula de ácido nucleico diana mutada es una enzima, el experto en la técnica podría probar la actividad de la enzima midiendo la velocidad a la que cataliza su reacción, por ejemplo, al medir la reducción de la concentración de un producto de partida o el aumento de la concentración de un producto final de la reacción catalizada por la enzima.
[0368] Un método para diseñar un grupo de etiquetas de muestra
[0370] En la presente memoria, pero sin formar parte de la invención, se describe un método para diseñar un grupo de etiquetas de muestra adecuadas para utilizarse en un método para introducir mutaciones en al menos una molécula de ácido nucleico diana que comprende:
[0372] a. analizar el método para introducir mutaciones en al menos una molécula de ácido nucleico diana y determinar el número promedio de mutaciones de baja probabilidad que tienen lugar durante el método para introducir mutaciones en al menos una molécula de ácido nucleico diana; y
[0374] b. determinar las secuencias para un grupo de etiquetas de muestra en donde cada etiqueta de muestra difiere sustancialmente de todas las etiquetas de muestra en el grupo en más diferencias de mutación de baja probabilidad que el número promedio de mutaciones de baja probabilidad que tienen lugar durante el método para introducir mutaciones en al menos una molécula de ácido nucleico diana.
[0376] Por ejemplo, el usuario puede generar una primera etiqueta de muestra putativa utilizando un programa informático para generar una secuencia aleatoria. La primera etiqueta de muestra putativa se añade al grupo de etiquetas de muestra. A continuación, el usuario puede generar una segunda etiqueta de muestra putativa de la misma manera y comparar la secuencia de la segunda etiqueta de muestra putativa con la primera etiqueta de muestra putativa para ver si la segunda etiqueta de muestra difiere de la primera etiqueta de muestra de tal modo que, incluso si se introdujera el número relevante de mutaciones de baja probabilidad en la segunda etiqueta de muestra putativa, aún diferiría de la primera etiqueta de muestra putativa. En caso afirmativo, entonces la segunda etiqueta de muestra putativa se añade al grupo de etiquetas de muestra. Si no, entonces se descarta la segunda etiqueta de muestra putativa. Esto puede repetirse para la tercera y otras supuestas etiquetas de muestra.
[0378] Como se ha descrito anteriormente, es ventajoso añadir etiquetas de muestra a al menos una molécula de ácido nucleico diana en un método para introducir mutaciones en al menos una molécula de ácido nucleico diana. Sin embargo, si las etiquetas de muestra se añaden antes de que se introduzcan las mutaciones, esto puede significar que las etiquetas de muestra están mutadas y no pueden utilizarse entonces para distinguir las moléculas de ácido nucleico diana que se originaron a partir de la misma muestra o de muestras diferentes. Esto se puede evitar diseñando las etiquetas de muestra de tal modo que, incluso si están mutadas, sean lo suficientemente diferentes entre sí para que el usuario pueda distinguirlas.
[0380] El método puede comprender además:
[0382] a.
[0384] (i) analizar el método para introducir mutaciones en al menos una molécula de ácido nucleico diana y determinar el número promedio de mutaciones de alta probabilidad que tienen lugar durante el método para introducir mutaciones en al menos una molécula de ácido nucleico diana; y
[0386] (ii) determinar las secuencias para un grupo de etiquetas de muestra en donde cada etiqueta de muestra difiere sustancialmente de todas las etiquetas de muestra del grupo en más diferencias de mutación de alta probabilidad que el número promedio de mutaciones de alta probabilidad que tienen lugar durante el método para introducir mutaciones en al menos una molécula de ácido nucleico diana.
[0388] Una mutación de baja probabilidad puede ser una mutación de transversión o una mutación indel. Una mutación de alta probabilidad puede ser una mutación de transición.
[0390] El método puede ser un método implementado por ordenador.
[0392] En la presente memoria, pero sin formar parte de la invención, se describe un medio legible por ordenador configurado para realizar el método para diseñar un grupo de etiquetas de muestra adecuadas para utilizarse en un método para introducir mutaciones en al menos una molécula de ácido nucleico diana.
[0393] En un aspecto adicional de la invención, se proporciona un grupo de etiquetas de muestra que se pueden obtener mediante el método para diseñar etiquetas de muestra de la invención. Opcionalmente, el grupo de etiquetas de muestra se obtiene mediante el método para diseñar etiquetas de muestra de la invención.
[0395] Uso de dNTP en concentraciones desiguales
[0397] La etapa de amplificar la al menos un ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo se realiza utilizando dNTP en concentraciones desiguales.
[0399] La invención se ha descrito en las reivindicaciones adjuntas. En la presente memoria se describe un método para introducir mutaciones en
[0401] al menos una molécula de ácido nucleico diana que comprende:
[0403] a. proporcionar al menos una muestra que comprende al menos una molécula de ácido nucleico diana; y
[0404] b. introducir mutaciones en la al menos una molécula de ácido nucleico diana al amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa para proporcionar al menos una molécula de ácido nucleico diana mutada, en donde la etapa b. se realiza utilizando dNTP en concentraciones desiguales
[0406] Para poder amplificar el al menos un ácido nucleico diana utilizando una ADN polimerasa (tal como una ADN polimerasa de bajo sesgo), el ácido nucleico diana puede exponerse a la ADN polimerasa y a los dNTP en condiciones adecuadas para que tenga lugar la replicación del ADN, por ejemplo, en una máquina de PCR. Si se realiza una etapa de amplificar el al menos un ácido nucleico diana utilizando los dNTP en concentraciones desiguales, el ácido nucleico diana se expone a una ADN polimerasa (tal como una ADN polimerasa de bajo sesgo) y dNTP, en donde las concentraciones de los dNTP son diferentes entre sí.
[0408] El término dNTP pretende referirse a desoxinucleótidos. Específicamente, en el contexto de la presente solicitud, el término"dNTP”pretende referirse a una solución que comprende dTTP (trifosfato de desoxitimidina) o dUTP (desoxiuridina), dGTP (trifosfato de desoxiguanidina), dCTP (trifosfato de desoxicitidina) y dATP (trifosfato de desoxiadenosina). Opcionalmente,"dNTP”se refiere a una solución que comprende dTTP (trifosfato de desoxitimidina), dGTP (trifosfato de desoxiguanidina), dCTP (trifosfato de desoxicitidina) y dATP (trifosfato de desoxiadenosina).
[0410] Con la frase"dNTP en concentraciones desiguales”se entiende que los cuatro dNTP están presentes en solución en diferentes concentraciones entre sí. Por ejemplo, un dNTP puede estar presente en una concentración más alta en comparación con los otros tres dNTP, dos dNTP pueden estar presentes en una concentración más alta en comparación con los otros dos dNTP, o tres dNTP pueden estar presentes en una concentración más alta en comparación con el otro dNTP.
[0412] DGTP puede estar presente en una concentración más alta en comparación con dCTP, dTTP y dATP, dGTP puede estar presente en una concentración más alta en comparación con dTTP y dATP, dGTP puede estar presente en una concentración más alta en comparación con dATP, dGTP puede estar presente en una concentración más alta en comparación con dTTP, dCTP puede estar presente en una concentración más alta en comparación con dGTP, dTTP y dATP, dCTP puede estar presente en una concentración más alta en comparación con dTTP y dATP, dCTP puede estar presente en una concentración más alta en comparación con dATP, dCTP puede estar presente en una concentración más alta en comparación con dTTP, dTTP puede estar presente en una concentración más alta en comparación con dGTP, dCTP y dATP, dTTP puede estar presente en una concentración más alta en comparación con dGTP y dCTP, dTTP puede estar presente en una concentración más alta en comparación con dCTP, dTTP puede estar presente en una concentración más alta en comparación con dGTP, dATP pueden estar presente en una concentración más alta en comparación con dGTP, dTTP y dCTP, dATP puede estar presente en una concentración más alta en comparación con dGTP y dCTP, dATP puede estar presente en una concentración más alta en comparación con dGTP, dATP puede estar presente en una concentración más alta en comparación con dGTP, dCTP y dATP puede estar presente en una concentración más alta en comparación con dGTP y dCTP, o dGTP y dCTP puede estar presente en una concentración más alta en comparación con dATP y dTTP.
[0414] El usuario puede preparar soluciones de dNTP en concentraciones desiguales de cualquier manera conveniente. Las soluciones de<d>ATP, dTTP, dGTP y dTTP están fácilmente disponibles en el mercado, y el usuario simplemente necesita mezclarlas en una relación adecuada.
[0416] Opcionalmente, el método:
[0418] (i) comprende una etapa adicional de amplificar la al menos una molécula de ácido nucleico diana que comprende análogos de nucleótidos en ausencia de análogos de nucleótidos y la etapa adicional de amplificar la al menos una molécula de ácido nucleico diana que comprende análogos de nucleótidos en ausencia de análogos de nucleótidos se realiza utilizando dNTP en concentraciones desiguales; o
[0419] (ii) proporciona al menos una molécula de ácido nucleico diana mutada, y comprende una etapa adicional de amplificar la al menos una molécula de ácido nucleico diana mutada utilizando la ADN polimerasa de bajo sesgo y la etapa adicional de amplificar la al menos una molécula de ácido nucleico diana mutada utilizando la ADN polimerasa de bajo sesgo se realiza utilizando dNTP en concentraciones desiguales.
[0421] Opcionalmente, la introducción de mutaciones en la al menos una molécula de ácido nucleico diana al amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa para proporcionar al menos una molécula de ácido nucleico diana mutada se realiza en presencia de un análogo de nucleótido. Opcionalmente, el método para introducir mutaciones en al menos una molécula de ácido nucleico diana comprende una etapa de amplificar la al menos una molécula de ácido nucleico diana mutada en ausencia del análogo de nucleótido, y opcionalmente esta etapa se realiza utilizando dNTP en concentraciones desiguales.
[0423] Cuando se utiliza un análogo de nucleótido para introducir mutaciones en al menos una molécula de ácido nucleico diana, esto implicará generalmente dos etapas de amplificación. En la primera etapa de amplificación, el análogo de nucleótido se incorpora a la molécula de ácido nucleico diana (una etapa de mutación). En la segunda etapa de amplificación, el análogo de nucleótido se empareja con un nucleótido natural, lo que introduce de este modo una mutación en una cadena de la molécula de ácido nucleico diana (una etapa de recuperación). Cuando la molécula de ácido nucleico diana se amplifica aún más, esta mutación se transmitirá a ambas cadenas de la molécula de ácido nucleico diana. Opcionalmente, tanto la primera etapa de amplificación (mutación) como la segunda etapa de amplificación (recuperación) pueden realizarse usando dNTP a concentraciones desiguales. Opcionalmente, los dNTP a concentraciones desiguales son diferentes en la primera etapa de amplificación (mutación) y la segunda etapa de amplificación (recuperación). Por ejemplo, los dNTP en concentraciones desiguales pueden comprender dTTP en una concentración menor que otros dNTP en la primera etapa de amplificación (mutación) y los dNTP en concentraciones desiguales pueden comprender dATP en una concentración menor que otros dNTP en la segunda etapa de amplificación (recuperación). La etapa de amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa de bajo sesgo o las etapas que proporcionan al menos una molécula de ácido nucleico diana mutada pueden corresponder a una o más"etapas de mutación” .Una etapa adicional de amplificar la al menos una molécula de ácido nucleico diana que comprende análogos de nucleótidos en ausencia de análogos de nucleótidos o una etapa adicional de amplificar la al menos una molécula de ácido nucleico diana mutada puede corresponder a una o más"etapas de recuperación ” .
[0425] Opcionalmente, el análogo nucleotídico es dPTP.
[0427] En una modalidad, los dNTP en concentraciones desiguales se usan para alterar el perfil de las mutaciones que se introducen. Los dNTP en concentraciones desiguales se utilizan en métodos que comprenden introducir mutaciones en al menos una molécula de ácido nucleico diana. Por lo tanto, los métodos dan como resultado moléculas de ácido nucleico diana que comprenden mutaciones (tales como las moléculas de ácido nucleico diana mutadas descritas en la presente memoria). El número de mutaciones, el tipo de mutaciones y la posición de cada mutación que se introduce en una molécula de ácido nucleico diana determinada mediante los métodos pueden denominarse"perfil de mutaciones”que se introduce. La expresión"tipo de mutación”se refiere a la naturaleza de la mutación,es decir,si se trata de una mutación por sustitución, una mutación por adición o una mutación por deleción, y si se trata de una mutación por sustitución, ¿cuál fue el nucleótido inicial y a qué mutó el nucleótido inicial(p. ej.,una mutación de A a G tiene un nucleótido de partida A que muta a G)?
[0429] El usuario puede determinar el"perfil de mutaciones”que se introduce mediante un método dado al replicar una molécula de ácido nucleico diana de ensayo y, a continuación, al someter algunas de las réplicas a los métodos que comprenden introducir mutaciones de la invención, pero reservando algunas de las réplicas (sin mutarlas). El usuario puede entonces secuenciar las réplicas que se han sometido a los métodos que comprenden la introducción de mutaciones de la invención y las réplicas reservadas. Finalmente, el usuario puede alinear las secuencias de las réplicas que se han sometido a los métodos que comprenden la introducción de mutaciones de la invención y las réplicas reservadas para determinar el número de mutaciones, el tipo de mutaciones y la posición de cada mutación que se ha introducido. Alternativamente, el usuario puede utilizar una molécula de ácido nucleico diana de prueba de secuencia conocida. El usuario simplemente necesitará someter la molécula de ácido nucleico diana de ensayo a los métodos que comprenden la introducción de mutaciones de la invención y, a continuación, secuenciar la molécula de ácido nucleico diana mutada resultante para ver qué perfil de mutaciones se ha introducido.
[0431] El usuario puede desear alterar el perfil de mutación de varias maneras. Por ejemplo, como se ha descrito anteriormente, es ventajoso poder reducir el sesgo de mutación. Por consiguiente, en una realización, los dNTP en concentraciones desiguales se utilizan para reducir el sesgo en el perfil de las mutaciones que se introducen. En una realización adicional, el método es un método para introducir mutaciones en un perfil de mutación de bajo sesgo.
[0432] La presente solicitud demuestra que la utilización de los dNTP en concentraciones desiguales puede utilizarse para reducir el sesgo en el perfil de las mutaciones que se introducen. Por ejemplo, si se utiliza una ADN polimerasa (tal como la ADN polimerasa de bajo sesgo descrita anteriormente) para mutar una molécula de ácido nucleico diana e introduce un mayor número de mutaciones de G a A en comparación con otras mutaciones, el usuario puede reducir la concentración de dATP en relación con otros dNTP, y esto puede disminuir la frecuencia con la que se incorporan nucleótidos A en lugar de dGTP y, por lo tanto, disminuir el número de mutaciones de G a A.
[0434] De manera similar, si se utiliza un análogo de nucleótido cuando se introducen mutaciones en una molécula de ácido nucleico diana, se puede utilizar la alteración de las concentraciones relativas de los dNTP para alterar el perfil de mutación. Por ejemplo, el dPTP se puede utilizar para introducir mutaciones de G a A, C a T, A a G y T a C. Como se ha descrito con más detalle anteriormente, el dPTP puede reemplazar un nucleótido T o un nucleótido C y, dependiendo de si el dPTP está en su forma amino o imino, puede emparejarse posteriormente con un nucleótido A o un nucleótido G. Esto lleva a dos escenarios. En el primer escenario, el dPTP reemplaza a T (por ejemplo) en la cadena codificante (etapa de mutación) y a continuación puede emparejarse con A (sin mutación) o G (mutación de A a G) en la cadena no codificante. Si el dPTP reemplaza a T y se empareja con G en la cadena no codificante, el mutante G se emparejará con una C para introducir una mutación de T a C en una réplica de la cadena codificante (etapa de recuperación). Por el contrario, el dPTP puede reemplazar a T en la cadena no codificante, lo que puede conducir a una mutación de A a G en la cadena codificante y a una mutación de T a C en una réplica de la cadena no codificante. En el segundo escenario, el dPTP reemplaza a C en la cadena codificante (por ejemplo) y a continuación puede emparejarse con A (mutación de G a A) o G (sin mutación) en la cadena no codificante (etapa de mutación). Si el dPTP reemplaza a C y se empareja con A en la cadena no codificante, el mutante A se emparejará con una T para introducir una mutación C a T en una réplica de la cadena codificante (etapa de recuperación). Por el contrario, el dPTP puede reemplazar a C en la cadena no codificante, lo que puede conducir a una mutación de G a A en la cadena codificante y a una mutación de C a T en una réplica de la cadena no codificante.
[0436] La presente solicitud demuestra que si la tasa de mutaciones de G a A y de C a T es superior a la tasa de mutaciones de A a G y de T a C, reducir la concentración de dTTP en comparación con los otros dNTP (y preferiblemente en comparación con la concentración de dCTP) alentará a incorporar dPTP en lugar de dTTP, aumentando los casos del primer escenario expuesto anteriormente en relación con el segundo escenario, lo que significa que las mutaciones de A a G y de T a C introducidas en el primer escenario aumentarán. De manera similar, la presente solicitud demuestra que si el nivel de los dATP se reduce durante la etapa de recuperación, entonces aumenta el nivel de mutaciones de G a A y de C a T. Esto se debe en que, en el escenario 2 anterior, si el dATP está presente en una concentración más baja en comparación con los otros dNTP (y preferiblemente en comparación con la concentración de dGTP), esto significará que el dPTP que se ha incorporado en lugar de un nucleótido C se emparejará más frecuentemente con G y se introducirán menos mutaciones de G a A o de C a T. Los dos escenarios se exponen en la figura 7.
[0438] Incluso las ADN polimerasas de bajo sesgo descritas en la presente memoria introducen mutaciones en una molécula de ácido nucleico diana con un pequeño sesgo. La presente solicitud demuestra que la utilización de concentraciones desiguales de dNTP con una ADN polimerasa de bajo sesgo puede eliminar prácticamente cualquier sesgo de mutación.
[0440] Basándose en la información proporcionada en la presente solicitud, está dentro de las capacidades del experto en la técnica determinar cómo la alteración de las concentraciones de varios dNTP afectará al perfil de mutación dependiendo de si se utiliza un análogo de nucleótido y, de ser así, cuál. Por consiguiente, en algunas realizaciones, los métodos que utilizan dNTP en concentraciones desiguales comprenden una etapa de identificación de un dNTP cuyo nivel debe aumentarse o disminuirse para reducir el sesgo en el perfil de las mutaciones que se introducen.
[0441] Opcionalmente, los dNTP en concentraciones desiguales comprenden dTTP en una concentración menor que otros dNTP. Como se ha descrito anteriormente, esto puede aumentar la tasa de mutaciones de T a C y de A a G que se introducen cuando se utiliza dPTP como un análogo de nucleótidos. Opcionalmente, los dNTP en concentraciones desiguales comprenden dTTP en una concentración inferior al 75 %, inferior al 70 %, inferior al 60 %, inferior al 55 %, entre el 25 % y el 75 %, entre el 25 % y el 70, entre el 25 % y el 60 %, o aproximadamente el 50 % de la concentración de dATP, dCTP o dGTP. Opcionalmente, los dNTP en concentraciones desiguales comprenden dTTP en una concentración inferior al 60 % de la concentración de dCTP. Opcionalmente, los dNTP en concentraciones desiguales comprenden dTTP en una concentración entre el 25 % y el 60 % de la concentración de dCTP.
[0443] Opcionalmente, los dNTP a concentraciones desiguales comprenden dATP a una concentración más baja en comparación con otros dNTP. Como se describió anteriormente, esto puede disminuir la tasa de mutaciones de G a A o C a T que se introducen cuando se utiliza dPTP como un análogo de nucleótidos. Opcionalmente, los dNTP en concentraciones desiguales comprenden dATP en una concentración inferior al 75 %, inferior al 70 %, inferior al 60 %, inferior al 55 %, entre el 25 % y el 75 %, entre el 25 % y el 70, entre el 25 % y el 60 %, o aproximadamente el 50 % de la concentración de dTTP, dCTP o dGTP. Opcionalmente, los dNTP en concentraciones desiguales comprenden dATP en una concentración inferior al 75 %, inferior al 70 %, inferior al 60 %, inferior al 55 %, entre el 25 % y el 75 %, entre el 25 % y el 70, entre el 25 % y el 60 %, o aproximadamente el 50 % de la concentración de dGTP. Opcionalmente, los dNTP en concentraciones desiguales comprenden dATP en una concentración inferior al 60 % de la concentración de dGTP. Opcionalmente, el dNTP en concentraciones desiguales el dNTP comprende dATP en una concentración entre el 25 % y el 60 % de la concentración de dGTP.
[0445] Como se expuso en los dos escenarios anteriores, cuando se utiliza dPTP como un análogo de nucleótidos, la reducción de los dTTP aumenta las mutaciones de T a C y A a G al fomentar la sustitución de los nucleótidos T en la molécula de ácido nucleico diana por dPTP. Por lo tanto, los dNTP en concentraciones desiguales que comprenden dTTP en una concentración más baja que otros dNTP se utilizan preferiblemente en una etapa de mutagénesis (por ejemplo, una etapa de PCR en presencia de los dPTP). De manera similar, cuando se utiliza dPTP como un análogo de nucleótidos, la reducción de los dATP reduce el número de DPTP que han reemplazado a los nucleótidos C y se emparejan con dATP y, por lo tanto, aumenta las mutaciones de G a A y C a T. Dado que el apareamiento de dPTP con dATP tiende a producirse durante una etapa de recuperación, la reducción de los dATP durante la etapa de recuperación aumenta el número de mutaciones de G a A y de C a T. Por lo tanto, opcionalmente, la etapa de amplificar la al menos una molécula de ácido nucleico diana que comprende análogos de nucleótidos en ausencia de análogos de nucleótidos o amplificar la al menos una molécula de ácido nucleico diana mutada en ausencia del análogo de nucleótidos se realiza utilizando dNTP en concentraciones desiguales, y los dNTP en concentraciones desiguales comprenden dATP en una concentración inferior en comparación con otros dNTP.
[0446] Ejemplos
[0447] Ejemplo 1 - Mutaciones de moléculas de ácido nucleico utilizando PrimeStar GXL de otras polimerasas
[0448] Las moléculas de ADN se fragmentaron hasta el tamaño adecuado (p. ej., 10 kb) y se unió a cada extremo mediante tagmentación un sitio de cebado de secuencia (adaptador) definido.
[0449] La primera etapa es una reacción de tagmentación para fragmentar el ADN. Se sometieron a tagmentación 50 ng de ADN genómico de alto peso molecular en un volumen de 4 pl o menos de una o más cepas bacterianas en las siguientes condiciones. Se combinan 50 ng de ADN con 4 pl de transposasa Nextera (diluida hasta 1:50) y 8 pl de tampón de tagmentación 2X (Tris 20 mM [pH de 7,6], MgCl 20 mM, dimetilformamida al 20 % (v/v)) en un volumen total de 16 pl. Se incubó la reacción a 55 °C durante 5 minutos, se añadieron 4 pl de tampón NT (o SDS al 0,2 %) a la reacción y se incubó la reacción a temperatura ambiente durante 5 minutos.
[0450] Se limpió la reacción de tagmentación mediante el uso de perlas SPRIselect (Beckman Coulter) siguiendo las instrucciones del fabricante para una selección de tamaño de lado izquierdo mediante el uso de 0,6 volumen de perlas, y se eluyó el ADN en agua de grado molecular.
[0451] A esto le siguió una PCR con una combinación de dNTP y dPTP convencionales durante 6 ciclos limitados. Utilizando Primestar GXL, se añadieron 12,5 ng de ADN sometido a tagmentación y purificado a un volumen total de reacción de 25 pl, que contenía 1 x tampón GXL, 200 pM de cada dATP, dTTP, dGTP y dCTP, así como 0,5 mM de dPTP y 0,4 pM de cebadores personalizados (tabla 2).
[0452] Tabla 2:
[0455]
[0457] Tabla 2.Cebadores personalizados usados para la PCR de mutagénesis en moldes de 10 kbp. XXXXXX es una secuencia definida de código de barras de 6-8 nt específica de muestra. NNNNNN es una región de 6 nt de nucleótidos al azar.
[0458] Se sometió la reacción a los siguientes ciclos térmicos en presencia de Primestar GXL. Extensión inicial de huecos a 68 °C durante 3 minutos seguido por 6 ciclos de 98 °C durante 10 segundos, 55 °C durante 15 segundos y 68 °C durante 10 minutos.
[0459] La etapa siguiente es una PCR sin dPTP para eliminar dPTP de los moldes y reemplazarlos por una mutación de transición (“ PCR de recuperación” ). Se limpiaron las reacciones de PCR con perlas SPRIselect para eliminar el exceso de dPTP y los cebadores, luego se sometieron a otras 10 tandas (mínimo 1 tanda, máximo 20) de amplificación mediante el uso de cebadores que se hibridan a los extremos de fragmento introducidos durante los ciclos de incorporación de dPTP (tabla 3).
[0460] Tabla 3
[0461]
[0463] A esto le siguió una etapa de extracción en gel para seleccionar por tamaño los fragmentos amplificados y mutados en un rango de tamaño deseado, por ejemplo, de 7-10 kb. La extracción en gel puede realizarse manualmente o a través de un sistema automatizado, tal como BluePippin. A esto le siguió una ronda adicional de PCR para 16-20 ciclos("PCR de enriquecimiento” ).
[0464] Después de amplificar un número definido de moldes mutados largos, se realizó la fragmentación al azar de los moldes para generar un grupo de fragmentos solapantes más cortos para la secuenciación. Se realizó la fragmentación mediante tagmentación.
[0465] Se sometieron los fragmentos largos de ADN de la etapa previa a una reacción de tagmentación convencional (por ejemplo, Nextera XT o Nextera Flex), excepto que se dividió la reacción en tres combinaciones para la amplificación mediante PCR. Esto permite la amplificación selectiva de fragmentos derivados de cada extremo del molde original (incluyendo el código de barras de muestra) así como fragmentos internos del molde largo que se han sometido a tagmentación recientemente en ambos extremos. Esto crea eficazmente tres combinaciones para la secuenciación en un instrumento Illumina (p. ej., MiSeq o HiSeq).
[0466] Se repitió el método usando una Taq convencional (Jena Biosciences) y una mezcla de Taq y una polimerasa de corrección de lectura (DeepVent) denominada LongAmp (New England Biolabs).
[0467] Se representan los datos obtenidos a partir de este experimento en la figura 1. No se usó dPTP como control. Se mapearon las lecturas contra el genoma deE. coli,y se logró una mediana de tasa de mutaciones de aproximadamente el 8 %.
[0468] Ejemplo 2 - Comparación de frecuencias de mutaciones de diferentes ADN polimerasas
[0469] Se realizó mutagénesis con una variedad de ADN polimerasas diferentes (tabla 4). Se sometió a tagmentación ADN genómico de la cepa de E.coliMG1655 para producir fragmentos largos y se limpiaron con perlas tal como se describe en el método del ejemplo 1. A esto le siguió una “ PCR de mutagénesis” durante 6 ciclos en presencia de dPTP 0,5 mM, purificación con perlas SPRIselect y 14-16 ciclos adicionales de “ PCR de recuperación” en ausencia de dPTP. Luego, se sometieron los moldes mutados largos resultantes a una reacción de tagmentación convencional (véase el ejemplo 1) y se amplificaron fragmentos “ internos” y se secuenciaron en un instrumento Illumina MiSeq.
[0470] Las tasas de mutaciones se describen en la tabla 4, que normalizaron frecuencias de sustitución de bases a través de reacciones de mutagénesis con dPTP, según se midió usando secuenciación de Illumina de ADN a partir del genoma de referencia conocido. Para la polimerasa Taq, sólo se produce aproximadamente el 12 % de mutaciones en sitios G+C molde, incluso cuando se usa en tampón optimizado para polimerasas termocócicas. Las polimerasas similares a las termocócicas producen el 58-69 % de mutaciones en los sitios G+C molde, mientras que la polimerasa derivada dePyrococcusproduce el 88 % de mutaciones en los sitios G+C molde.
[0471] Se obtuvieron enzimas de Jena Biosciences (Taq), Takara (variantes Primestar), Merck Millipore (ADN polimerasa KOD) y New England Biolabs (Phusion).
[0472] Se sometió a prueba Taq con el tampón suministrado y también con el tampón Primestar GXL (Takara) para este experimento. Todas las demás reacciones se llevaron a cabo con el tampón suministrado convencional para cada polimerasa.
[0473] Tabla 4
[0475]
[0476]
[0479] Ejemplo 3 - Determinación de las tasas de mutagénesis con dPTP
[0481] Se realizó mutagénesis con dPTP en un rango de muestras de ADN genómico con diferentes niveles de contenido de G+C (33-66 %) utilizando una polimerasa deThermococcus(Primestar GXL; Takara) en un único conjunto de condiciones de reacción. Se realizaron mutagénesis y secuenciación tal como se describe en el método del ejemplo 3, excepto que se realizaron 10 ciclos de “ PCR de recuperación” . Tal como se predijo, las tasas de mutaciones fueron aproximadamente similares entre las muestras (mediana de la tasa del 7-8 %) a pesar de la diversidad del contenido de G+C (figura 2).
[0483] Ejemplo 4 - Medición del sesgo de amplificación de molde
[0485] Se midió el sesgo de amplificación de molde para dos polimerasas: Kapa HiFi, que es una polimerasa de corrección de lectura usada habitualmente en protocolos de secuenciación de Illumina, y PrimeStar GXL, que es una polimerasa de la familia KOD conocida por su capacidad para amplificar fragmentos largos. En el primer experimento se utilizó Kapa HiFi para amplificar un número limitado de moldes de ADN genómico deE. colicon tamaños de aproximadamente 2 kbp. Luego, se secuenciaron los extremos de estos fragmentos amplificados. Se realizó un experimento similar con PrimeStar GXL en fragmentos de aproximadamente 7-10 kbp de E.coli.Se determinaron las posiciones de cada lectura de secuencia de extremo mediante mapeo en el genoma de referencia de E.coli.Se midieron las distancias entre los extremos de fragmentos vecinos. Estas distancias se compararon con un conjunto de distancias muestreadas al azar a partir de la distribución uniforme. Se realizó la comparación mediante la prueba de Kolmolgorov-Smirnov no paramétrica, D. Cuando dos muestras proceden de la misma distribución, el valor de D se aproxima a cero. Para la polimerasa de bajo sesgo PrimeStar, se observó D=0,07 cuando se mide en 50.000 extremos de fragmento, en comparación con una muestra al azar uniforme de 50.000 posiciones genómicas. Para la polimerasa Kapa HiFi se observó D=0,14 en los 50.000 extremos de fragmento.
[0487] Ejemplo 5 - Utilización de dos sitios de unión a cebadores idénticos y una única secuencia de cebador para la amplificación preferente de moldes más largos
[0489] Tal como se describió anteriormente, puede usarse tagmentación para fragmentar moléculas de ADN e introducir simultáneamente sitios de unión a cebadores (adaptadores) en los extremos de los fragmentos. El sistema de tagmentación Nextera (Illumina) utiliza enzimas transposasas cargadas con uno de dos adaptadores únicos (denominados X e Y en el presente documento). Esto genera una mezcla al azar de productos, algunos con secuencias de extremo idénticas (X-X, Y-Y) y otros con extremos únicos (X-Y). Los protocolos de Nextera convencionales usan dos secuencias de cebador distintas para amplificar selectivamente los productos “X-Y” que contienen diferentes adaptadores en cada extremo (según se requiera para la secuenciación con la tecnología Illumina). Sin embargo, también es posible usar una única secuencia de cebador para amplificar fragmentos “X-X” o “ Y-Y” con adaptadores de extremo idénticos.
[0491] Para generar moldes mutados largos que contienen adaptadores de extremos idénticos, se sometieron 50 ng de ADN genómico de alto peso molecular (cepa de E.coliMG1655) en primer lugar a tagmentación y a continuación se limpiaron con perlas SPRIselect tal como se describió en el ejemplo 1. A esto le siguieron 5 ciclos de “ PCR de mutagénesis” con una combinación de dNTP y dPTP convencionales, que se realizó tal como se detalla en el ejemplo 1 excepto que se usó una única secuencia de cebador (tabla 5).
[0493] Se limpió la reacción de PCR con perlas SPRIselect para eliminar el exceso de dPTP y los cebadores, luego se sometió a 10 ciclos adicionales de “ PCR de recuperación” en ausencia de dPTP para reemplazar dPTP en los moldes por mutaciones de transición. Se realizó PCR de recuperación con un único cebador que se hibrida a los extremos de fragmento introducidos durante los ciclos de incorporación de dPTP, lo que permite de ese modo la amplificación selectiva de los moldes mutados generados en la etapa de PCR previa.
[0495] Tabla 5:
[0498]
[0499]
[0502] Tabla 5.Cebadores usados para generar moldes mutados con la misma estructura adaptadora básica en ambos extremos. Se usó el cebador “ single_mut” para la PCR de mutagénesis en fragmentos de ADN generados mediante tagmentación Nextera. Este cebador contiene una porción en 5' que introduce un sitio adicional de unión a cebadores en los extremos de fragmento. El cebador “ single_rec” es capaz de hibridarse a este sitio, y se usó durante la PCR de recuperación para amplificar selectivamente los moldes mutados generados con el cebador single_mut. XXXXXXXXXXXXX es una secuencia definida de código de barras de 13 nt específica de muestra. NNN es una región de 3 nt de nucleótidos al azar.
[0504] Como control, se generaron moldes mutados con adaptadores diferentes en cada extremo mediante el uso de un protocolo idéntico al descrito anteriormente, excepto que se usaron dos secuencias de cebador distintas tanto durante la PCR de mutagénesis (que se muestra en la tabla 2) como la PCR de recuperación (tabla 3). Se limpiaron los productos de PCR finales con perlas SPRIselect y se analizaron en un chip de ADN de alta sensibilidad mediante el uso del sistema 2100 Bioanalzyer System (Agilent). Tal como se muestra en la figura xxx, los moldes generados con adaptadores de extremo idénticos fueron significativamente más largos que la muestra de control que contiene adaptadores dobles. Pudieron detectarse los moldes de control hasta un tamaño mínimo de ~800 pb, mientras que no se observaron moldes por debajo de 2000 pb para la muestra de adaptador único.
[0506] Se ejecutaron los moldes mutados con adaptadores de extremo idénticos (color azul) y los moldes de control con adaptadores dobles en un instrumento 2100 Bioanalyzer de Agilent (kit de ADN de alta sensibilidad) para comparar los perfiles de tamaño. El uso de adaptadores de extremos idénticos inhibe la amplificación de moldes < 2 kbp. Se presentan los datos en la figura 6.
[0508] Ejemplo 8 - Reducir aún más el sesgo de mutación de las polimerasas de Thermococcus al alterar niveles naturales de dNTP durante la PCR
[0510] Aunque las polimerasas deThermococcusgeneran un perfil de mutación mucho más equilibrado en comparación con otras ADN polimerasas, presentan un pequeño sesgo hacia las mutaciones en los sitios G y C (ver Tabla 4). Para eliminar este sesgo residual, probamos el efecto de alterar las concentraciones de los dNTP naturales durante las etapas de la PCR de mutagénesis y recuperación para influir en las tasas de incorporación relativas de los diferentes nucleótidos.
[0512] En primer lugar, se prepararon moldes con mutaciones largas a partir de ADN genómico bacteriano (cepa MG1655 deE. coli)utilizando el enfoque descrito en el ejemplo 5, excepto que se varió la concentración de nucleótidos individuales en las reacciones de PCR. Esto se logró al añadir soluciones individuales de los cuatro nucleótidos naturales (adquiridos en New England Biolabs) por separado a la mezcla de PCR, ya sea en una concentración final estándar de 200 pM o en una concentración inferior de 160 pM (80 % con respecto al estándar) o 100 pM (50 %). Solo se varió un nucleótido por reacción. Como control, se añadieron todos los nucleótidos naturales en la misma concentración final de 200 pM, utilizando una mezcla de dNTP equimolar proporcionada con la polimerasa Primestar GXL (Takara). Se realizaron cinco ciclos de PCR de mutagénesis y doce ciclos de recuperación utilizando los cebadores que se muestran en la T abla 5. Luego, se sometieron los moldes mutados largos resultantes a una reacción de tagmentación convencional (véase el ejemplo 1) y se amplificaron fragmentos “ internos” y se secuenciaron en un instrumento Illumina MiSeq. Las frecuencias de mutación se determinaron comparándolas con la secuencia de referencia conocida.
[0513] Como se muestra en la Tabla 6, los cambios en la concentración de los dNTP individuales durante la mutagénesis y/o la PCR de recuperación alteraron el perfil observado de las mutaciones. Es importante destacar que limitar la cantidad de dTTP en un 50 % durante la mutagénesis produce frecuencias de mutación prácticamente idénticas para cada nucleótido (Tabla 3). Esto confirma que el sesgo de mutación residual de las polimerasas deThermococcuspuede eliminarse mediante cambios en los niveles de dNTP.
[0515] Tabla 6.
[0517]
[0518]

Claims (15)

1. REIVINDICACIONES
i.Un método para introducir mutaciones en al menos una molécula de ácido nucleico diana, comprendiendo el método:
utilizar un análogo de nucleótido para introducir mutaciones en al menos una molécula de ácido nucleico diana en al menos una muestra al amplificar la al menos una molécula de ácido nucleico diana utilizando una ADN polimerasa y en presencia del análogo de nucleótido para proporcionar al menos una molécula de ácido nucleico diana mutada,
en donde la etapa de utilizar el análogo de nucleótido para introducir las mutaciones en la al menos una molécula de ácido nucleico diana se realiza utilizando los dNTP naturales en concentraciones desiguales para reducir el sesgo en el perfil de las mutaciones que se introducen.
2. El método de la reivindicación 1, en donde el análogo de nucleótido es dPTP.
3. El método de las reivindicaciones 1 o 2, en donde el método comprende una etapa adicional de amplificar la al menos una molécula de ácido nucleico diana mutada en ausencia del análogo de nucleótido, utilizando opcionalmente una ADN polimerasa de alta fidelidad.
4. El método de la reivindicación 3, en donde la etapa de amplificar la al menos una molécula de ácido nucleico diana mutada en ausencia del análogo de nucleótido se realiza utilizando los dNTP en concentraciones desiguales.
5. El método de una cualquiera de las reivindicaciones 1-4, en donde los dNTP en concentraciones desiguales comprenden dATP, dCTP, dTTP y dGTP y uno o dos de dATP, dCTP, dTTP o dGTP están en una concentración inferior en comparación con otros dNTP.
6. El método de una cualquiera de las reivindicaciones 1-5, en donde utilizar los dNTP en concentraciones desiguales comprende una etapa de identificación de un dNTP cuyo nivel debe aumentarse o disminuirse para reducir el sesgo en el perfil de las mutaciones que se introducen en la al menos una molécula de ácido nucleico diana mutada.
7. El método de una cualquiera de las reivindicaciones 1-6, en donde los dNTP en concentraciones desiguales comprenden dTTP en una concentración inferior a la de otros dNTP.
8. El método de la reivindicación 7, en donde los dNTP en concentraciones desiguales comprenden dTTP en una concentración inferior al 75 % de la concentración de dATP, dCTP o dGTP.
9. El método de la reivindicación 7, en donde los dNTP en concentraciones desiguales comprenden dTTP en una concentración entre el 25 % y el 60 % de la concentración de dCTP.
10. El método de una cualquiera de las reivindicaciones 1-6, en donde los dNTP en concentraciones desiguales comprenden dATP en una concentración inferior a la de otros dNTP.
11. El método de la reivindicación 10, en donde los dNTP en concentraciones desiguales comprenden dATP en una concentración inferior al 75 % de la concentración de dTTP, dCTP o dGTP, o en donde los dNTP en concentraciones desiguales comprenden dATP en una concentración entre el 25 % y el 60 % de la concentración de dGTP.
12. El método de una cualquiera de las reivindicaciones 1-11, en donde la al menos una molécula de ácido nucleico diana comprende una pluralidad de moléculas de ácido nucleico diana.
13. El método de cualquiera de las reivindicaciones 1-12, en donde la amplificación comprende la amplificación a través de una reacción en cadena de la polimerasa.
14. El método de una cualquiera de las reivindicaciones anteriores, en donde la ADN polimerasa utilizada para amplificar la al menos una molécula de ácido nucleico diana en presencia del análogo de nucleótido es una ADN polimerasa de bajo sesgo, que tiene un sesgo de mutación bajo y/o un bajo sesgo de amplificación de molde.
15. El método de la reivindicación 14, en donde la ADN polimerasa utilizada para amplificar al menos una molécula de ácido nucleico diana en presencia del análogo de nucleótido es una ADN polimerasa de alta fidelidad.
ES21190654T 2018-02-20 2019-02-19 Method for introducing mutations Active ES3043588T3 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GBGB1802744.1A GB201802744D0 (en) 2018-02-20 2018-02-20 Method

Publications (1)

Publication Number Publication Date
ES3043588T3 true ES3043588T3 (en) 2025-11-25

Family

ID=61783821

Family Applications (2)

Application Number Title Priority Date Filing Date
ES19707096T Active ES2889548T3 (es) 2018-02-20 2019-02-19 Método para introducir mutaciones
ES21190654T Active ES3043588T3 (en) 2018-02-20 2019-02-19 Method for introducing mutations

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES19707096T Active ES2889548T3 (es) 2018-02-20 2019-02-19 Método para introducir mutaciones

Country Status (12)

Country Link
US (3) US11421238B2 (es)
EP (3) EP4008792B1 (es)
JP (2) JP7413283B2 (es)
KR (1) KR20200123458A (es)
CN (1) CN112088219B (es)
AU (1) AU2019223315B2 (es)
CA (1) CA3091770A1 (es)
DK (1) DK3673084T3 (es)
ES (2) ES2889548T3 (es)
GB (1) GB201802744D0 (es)
SG (1) SG11202007924TA (es)
WO (1) WO2019162657A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201802744D0 (en) 2018-02-20 2018-04-04 Longas Tech Pty Ltd Method
WO2024191661A1 (en) 2023-03-10 2024-09-19 Illumina, Inc. Systems and methods of determining a nucleic acid sequence based on mutated sequence reads

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5625048A (en) * 1994-11-10 1997-04-29 The Regents Of The University Of California Modified green fluorescent proteins
US5565340A (en) * 1995-01-27 1996-10-15 Clontech Laboratories, Inc. Method for suppressing DNA fragment amplification during PCR
CA2217545A1 (en) * 1995-04-11 1996-10-17 Marc Vidal Reverse two-hybrid systems
US5780231A (en) * 1995-11-17 1998-07-14 Lynx Therapeutics, Inc. DNA extension and analysis with rolling primers
AU2001263226A1 (en) * 2000-05-17 2001-11-26 The Trustees Of Boston University Novel compositions and methods for carrying out multiple pcr reactions on a single sample
WO2002079502A1 (en) 2001-03-28 2002-10-10 The University Of Queensland A method for nucleic acid sequence analysis
WO2002097078A1 (en) * 2001-05-30 2002-12-05 Stratagene Compositions and methods for random nucleic acid mutagenisis
US20030215914A1 (en) * 2001-12-10 2003-11-20 Erwin Houtzager Structure for presenting desired peptide sequences
AU2003301590A1 (en) * 2002-10-25 2004-05-13 Stratagene California Dna polymerases with reduced base analog detection activity
CN1993468B (zh) 2004-06-04 2011-04-20 宝生物工程株式会社 具有dna聚合酶活性的多肽
GB0522310D0 (en) * 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US9481912B2 (en) * 2006-09-12 2016-11-01 Longhorn Vaccines And Diagnostics, Llc Compositions and methods for detecting and identifying nucleic acid sequences in biological samples
EP2191011B1 (en) * 2007-08-29 2017-03-29 Illumina Cambridge Limited Method for sequencing a polynucleotide template
JP5279339B2 (ja) 2008-05-16 2013-09-04 タカラバイオ株式会社 逆転写反応用組成物
US8759037B2 (en) * 2010-02-23 2014-06-24 Illumina Cambridge Limited Amplification methods to minimise sequence specific bias
US20120183960A1 (en) * 2010-12-07 2012-07-19 Enterologics, Inc. Method for identifying e. coli m-17
US9977861B2 (en) 2012-07-18 2018-05-22 Illumina Cambridge Limited Methods and systems for determining haplotypes and phasing of haplotypes
US9290800B2 (en) * 2013-03-15 2016-03-22 Pacific Biosciences Of California, Inc. Targeted rolling circle amplification
CN103555685A (zh) * 2013-04-26 2014-02-05 江南大学 增强β-环糊精葡萄糖基转移酶产β-环糊精能力的突变方法
EP4039811B1 (en) * 2014-01-31 2023-09-20 Integrated DNA Technologies, Inc. Improved methods for processing dna substrates
CN104232761A (zh) 2014-08-27 2014-12-24 武汉凯吉盈科技有限公司 基因全片段快速测序方法
EP3204521B1 (en) 2014-10-10 2021-06-02 Cold Spring Harbor Laboratory Random nucleotide mutation for nucleotide template counting and assembly
US10487340B2 (en) 2015-10-09 2019-11-26 Yunnan Academy Of Tobacco Agricultural Sciences Tobacco mosaic virus resistant N'au gene and cloning methods and applications thereof
US11821028B2 (en) * 2016-07-12 2023-11-21 QIAGEN Sciences, LLP Single end duplex DNA sequencing
CN109312391B (zh) * 2016-07-18 2022-06-03 豪夫迈·罗氏有限公司 生成用于单分子测序的单链环状dna文库的方法
CN107760771A (zh) 2017-11-16 2018-03-06 杭州迪安医学检验中心有限公司 一种乳腺癌易感基因brca1和brca2全基因捕获引物、试剂盒及其方法
CN107955806B (zh) 2017-12-15 2020-03-31 中国科学院深海科学与工程研究所 一种深渊海参来源的超氧化物歧化酶Cu,Zn SOD的制备方法及其应用
GB201802744D0 (en) 2018-02-20 2018-04-04 Longas Tech Pty Ltd Method
AU2019366472B2 (en) 2018-10-26 2025-07-17 The Board Of Trustees Of The Leland Stanford Junior University Methods and uses of introducing mutations into genetic material for genome assembly

Also Published As

Publication number Publication date
AU2019223315B2 (en) 2025-07-10
CN112088219A (zh) 2020-12-15
JP2021514205A (ja) 2021-06-10
GB201802744D0 (en) 2018-04-04
AU2019223315A1 (en) 2020-10-01
US20210010008A1 (en) 2021-01-14
EP3673084B1 (en) 2021-08-11
KR20200123458A (ko) 2020-10-29
US20250137000A1 (en) 2025-05-01
EP4008792B1 (en) 2025-08-06
WO2019162657A1 (en) 2019-08-29
US11421238B2 (en) 2022-08-23
US12203076B2 (en) 2025-01-21
JP7413283B2 (ja) 2024-01-15
EP4640847A3 (en) 2025-12-10
SG11202007924TA (en) 2020-09-29
CN112088219B (zh) 2025-07-18
JP2024038164A (ja) 2024-03-19
EP4008792C0 (en) 2025-08-06
DK3673084T3 (da) 2021-11-08
ES2889548T3 (es) 2022-01-12
EP3673084A1 (en) 2020-07-01
CA3091770A1 (en) 2019-08-29
US20220348940A1 (en) 2022-11-03
JP7717145B2 (ja) 2025-08-01
EP4008792A1 (en) 2022-06-08
EP4640847A2 (en) 2025-10-29

Similar Documents

Publication Publication Date Title
ES2544288T3 (es) Fast PCR para la genotipificación de STR
CN110036118B (zh) 用于识别核酸分子的组合物和方法
CN105283558B (zh) 使用热稳定的TthPrimPol扩增和测序的方法
ES2873850T3 (es) Bibliotecas de secuenciación de próxima generación
AU2013337280B2 (en) Barcoding nucleic acids
ES2743029T3 (es) Composiciones de extremo del transposón y métodos para modificar ácidos nucleicos
Chen et al. Directed polymerase evolution
ES2874143T3 (es) Métodos y composiciones para reducir códigos de barras, moleculares redundantes creados en reacciones de prolongación de cebadores
US20250137000A1 (en) Methods of preferentially amplifying nucleic acid molecules
JP2020526195A (ja) ライブラリー調製方法ならびにそのための組成物および使用
EA035092B1 (ru) Синтез двухцепочечных нуклеиновых кислот
CN116888276B (zh) 一种用于高通量靶向测序的多重pcr文库构建方法
ES2965194T3 (es) Algoritmo de secuenciación
EP4587567A2 (en) Compositions for preventing repetitive addition of switching oligonucleotides and nonspecific primer extension during cdna synthesis and methods of use thereof
HK40075402A (en) Method for introducing mutations
CN114450420A (zh) 用于肿瘤学精确测定的组合物和方法
HK40031786B (en) Method for introducing mutations
HK40031786A (en) Method for introducing mutations
KR20230028450A (ko) 앰플리콘 포괄적 풍부화
JP2004135628A (ja) Dnaの変異導入法