ES2925905T3 - Composiciones y kits de polimerasa, y métodos de uso y fabricación de los mismos - Google Patents
Composiciones y kits de polimerasa, y métodos de uso y fabricación de los mismos Download PDFInfo
- Publication number
- ES2925905T3 ES2925905T3 ES16794093T ES16794093T ES2925905T3 ES 2925905 T3 ES2925905 T3 ES 2925905T3 ES 16794093 T ES16794093 T ES 16794093T ES 16794093 T ES16794093 T ES 16794093T ES 2925905 T3 ES2925905 T3 ES 2925905T3
- Authority
- ES
- Spain
- Prior art keywords
- polymerase
- seq
- amino acid
- recombinant
- numbering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07007—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
La presente divulgación proporciona composiciones, métodos, kits, sistemas y aparatos que son útiles para la polimerización de ácidos nucleicos. En particular, se proporcionan polimerasas recombinantes y fragmentos biológicamente activos de las mismas que permiten la amplificación de ácidos nucleicos. En algunos aspectos, la descripción proporciona polimerasas recombinantes que producen tasas de error sistemático más bajas y/o precisión mejorada, cuando se usan en la secuenciación mediante reacciones de síntesis en comparación con una polimerasa de control. En un aspecto, la divulgación se refiere a polimerasas recombinantes útiles para la secuenciación de ácidos nucleicos, genotipado, análisis de variación del número de copias, secuenciación de extremos emparejados y otras formas de análisis genético. En otro aspecto, las polimerasas recombinantes son útiles para la amplificación de moldes de ácido nucleico durante PCR, emPCR, amplificación isotérmica, amplificación de polimerasa de recombinasa, amplificación de círculo rodante, amplificación de desplazamiento de cadena y amplificación de ligadura de proximidad. En algunos aspectos, la divulgación se refiere a polimerasas recombinantes útiles para la generación de bibliotecas de ácidos nucleicos y/o plantillas de ácidos nucleicos. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Composiciones y kits de polimerasa, y métodos de uso y fabricación de los mismos
Referencia cruzada a solicitudes relacionadas
Esta solicitud reivindica el beneficio de la solicitud provisional de Estados Unidos con número de serie 62/235,616, presentada el 1 de octubre de 2015.
Listado de secuencias
Esta solicitud por la presente incorpora por referencia el material del Listado de secuencias electrónico presentado al mismo tiempo. Los materiales en el Listado de secuencias electrónico se envían como un archivo de texto (.txt) titulado "LT01102PCT_SeqList_092316.txt" creado el 9-23-16, que tiene un tamaño de archivo de 698 KB.
Campo de la invención
Se proporcionan polimerasas de ADN modificadas y composiciones y kits, y métodos de uso y fabricación de los mismos.
Antecedentes
La capacidad de las enzimas para catalizar reacciones biológicas es fundamental para la vida. Una variedad de aplicaciones biológicas usa enzimas para sintetizar varias biomoléculas in vitro. Una clase particularmente útil de enzimas son las polimerasas, que pueden catalizar la polimerización de biomoléculas (por ejemplo, nucleótidos o aminoácidos) en biopolímeros (por ejemplo, ácidos nucleicos o péptidos). Por ejemplo, las polimerasas que pueden polimerizar nucleótidos en ácidos nucleicos, particularmente en una forma dependiente de plantilla, son útiles en aplicaciones de tecnología de ADN recombinante y secuenciación de ácidos nucleicos. Muchos métodos de secuenciación de ácidos nucleicos monitorean las incorporaciones de nucleótidos durante la síntesis de ácidos nucleicos dependiente de plantilla in vitro catalizada por una polimerasa. La secuenciación de molécula única (SMS) y la secuenciación de extremos emparejados (PES) típicamente incluyen una polimerasa para la síntesis de ácido nucleico dependiente de plantilla. Las polimerasas también son útiles para la generación de bibliotecas de ácidos nucleicos, tales como las bibliotecas creadas durante la PCR en emulsión o la PCR en puente. Las bibliotecas de ácidos nucleicos creadas mediante el uso de tales polimerasas pueden usarse en una variedad de procesos posteriores, tales como genotipado, análisis de polimorfismo de nucleótidos (SNP), análisis de variación del número de copias, análisis epigenético, análisis de expresión génica, matrices de hibridación, análisis de mutaciones génicas que incluyen pero sin limitarse a detección, pronóstico y/o diagnóstico de estados de enfermedad, detección y análisis de mutaciones alélicas raras o de baja frecuencia, y secuenciación de ácidos nucleicos que incluye, pero sin limitarse a, secuenciación de novo o resecuenciación dirigida.
Cuando se realiza la síntesis o amplificación de ácidos nucleicos dependiente de polimerasa, puede ser útil modificar la polimerasa (por ejemplo mediante mutación o modificación química) para alterar sus propiedades catalíticas. En algunos casos, puede resultar útil modificar la polimerasa para mejorar sus propiedades catalíticas. En algunas modalidades, puede ser útil mejorar las propiedades catalíticas de polimerasa a través de la sustitución o eliminación de aminoácidos dirigida al sitio. El rendimiento de la polimerasa en varios ensayos biológicos que implican la síntesis de ácidos nucleicos puede verse limitado por el comportamiento cinético de la polimerasa hacia los sustratos de nucleótidos. Por ejemplo, el análisis de la actividad de polimerasa puede complicarse por un comportamiento indeseable, tal como la tendencia de una polimerasa dada a disociarse de la plantilla; unir y/o incorporar el nucleótido incorrecto, por ejemplo, base no apareada de Watson-Crick, nucleótido; o liberar el nucleótido correcto, por ejemplo, base apareada de Watson-Crick, nucleótido sin incorporación. Estas y otras propiedades deseables pueden mejorarse mediante la selección, manipulación genética y/o modificación adecuadas de una polimerasa de elección. Por ejemplo, tal modificación puede realizarse para alterar favorablemente la tasa de polimerasa de incorporación de nucleótidos, afinidad de unión a la plantilla, capacidad de procesamiento, longitud de lectura promedio, precisión de la incorporación de nucleótidos, sesgo de cadena, error sistemático y/o el rendimiento total de secuenciación; tales alteraciones pueden incrementar la cantidad de información de secuencia y/o la calidad de la información de secuenciación obtenida a partir de una única reacción de secuenciación. Permanece una necesidad en la técnica de composiciones de polimerasa mejoradas que muestren propiedades alteradas, por ejemplo, incremento de la capacidad de procesamiento, mayor longitud de lectura (incluida la longitud de lectura sin errores), incremento de la precisión absoluta y/o afinidad por la plantilla de ADN, incremento del rendimiento de secuenciación, disminución del sesgo de cadena y/o disminución del error sistemático. Tales composiciones de polimerasa pueden ser útiles en una amplia variedad de ensayos que implican la síntesis de ácidos nucleicos dependiente de polimerasa, incluida la secuenciación de ácidos nucleicos, qPCR, PCR, PCR en puente, amplificación isotérmica, amplificación clonal y producción de bibliotecas de ácidos nucleicos. El documento US2015/094211 describe polipéptidos mutantes que tienen actividad de polimerasa de ADN que están asociados con un error sistemático (SE) reducido y/o sesgo de cadena cuando se usan para polimerizar nucleótidos en procesos tales como, por ejemplo, amplificación de ADN y determinación de secuencias. Las mutaciones que se
describen comprenden secuencias que tienen un 80 % de identidad con la SEQ ID NO: 1 y seis sustituciones de aminoácidos, a saber, H46R, E446Q, H572R, H281 M, D423K, N487R.
Resumen
La descripción se refiere en general a polimerasas Bst mutantes de origen no natural, típicamente recombinantes, y composiciones, kits y métodos de uso y fabricación de los mismos. Las polimerasas Bst mutantes (por ejemplo, recombinantes) contienen al menos una mutación de aminoácido (por ejemplo, sustitución, deleción o adición) en comparación con una polimerasa Bst de referencia (por ejemplo, de tipo silvestre) y tienen propiedades mejoradas. En algunas modalidades, las ADN polimerasas Bst mutantes (por ejemplo, recombinantes) han reducido el error sistemático, incrementado la relación de señal con respecto a ruido y/o mejorado la precisión en una reacción de secuenciación por síntesis, especialmente una reacción de secuenciación por síntesis que usa la polimerasa Bst mutante en un etapa en donde se generan y/o detectan iones de hidrógeno, en comparación con una ADN polimerasa Bst de tipo silvestre y/o mutante de referencia. Además, en la presente descripción se proporcionan métodos para realizar una reacción de polimerización que incluyen poner en contacto una ADN polimerasa Bst mutante (por ejemplo, recombinante), o un fragmento biológicamente activo de la misma, proporcionado en la presente descripción, con una plantilla de ácido nucleico en presencia de uno o más nucleótidos, y polimerizar al menos uno de los uno o más nucleótidos mediante el uso de la polimerasa mutante o el fragmento biológicamente activo de la misma.
En consecuencia, la presente invención en modalidades ilustrativas proporciona una ADN polimerasa mutante de origen no natural que típicamente es una ADN polimerasa recombinante, así como también composiciones, kits y métodos que incluyen la ADN polimerasa mutante (por ejemplo, recombinante), en donde la polimerasa tiene un segmento polipeptídico que tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la SEQ ID NO: 1 o un fragmento de la misma, muestra actividad de polimerasa e incluye H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1, e incluye además ya sea (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, h473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. La ADN polimerasa mutante (por ejemplo, recombinante) puede producir una reducción de la tasa de error (por ejemplo, tasa de error sistemático promedio), mejora de la precisión y/o un incremento de la relación de señal con respecto a ruido, cuando se usa en una reacción de secuenciación por síntesis en donde se liberan y/u o detectan iones de hidrógeno, en comparación con una tasa de error, precisión y/o relación de señal con respecto a ruido obtenida mediante el uso de una polimerasa Bst de referencia, tal como la polimerasa Bst de tipo silvestre, la polimerasa Bst mutante de la SEQ ID NO: 2, o la polimerasa Bst mutante de la SEQ ID NO: 35. La reacción de secuenciación por síntesis en la que la polimerasa tiene propiedades mejoradas en ejemplos ilustrativos, es una reacción de secuenciación en la que se liberan y detectan iones de hidrógeno. La polimerasa mutante (por ejemplo, recombinante) en modalidades ilustrativas incluye sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1. En modalidades ilustrativas, la polimerasa mutante (por ejemplo, recombinante) no tiene actividad de exonucleasa de 5' a 3' y/o actividad de exonucleasa de 3' a 5'. En modalidades ilustrativas, la polimerasa mutante (por ejemplo, recombinante) no comprende segmentos de ADN polimerasa Bst de tipo silvestre que tiene actividad de exonucleasa de 3' a 5' y/o actividad de exonucleasa de 5' a 3'.
La ADN polimerasa mutante (por ejemplo, recombinante) en modalidades ilustrativas incluye uno o más de L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1). En consecuencia, en determinados ejemplos proporcionados en la presente descripción, la ADN polimerasa mutante (por ejemplo, recombinante) tiene al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la s Eq ID NO:1, o un fragmento de la misma, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además uno o dos de L252R, H473G y H528T, o incluye todas las L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ilustrativa que tiene tales mutaciones, el mutante de origen no natural tiene la secuencia de la SEQ ID NO: 119.
El segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en las modalidades proporcionadas anteriormente, puede ser al menos el 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante), y puede tener al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 16, que es la polimerasa Bst de tipo silvestre de longitud completa. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H341R, E741Q, H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En una
modalidad ilustrativa que tiene tales mutaciones, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121.
En otro aspecto de la invención, se proporciona un método para realizar una reacción de polimerización, que incluye lo siguiente: (a) poner en contacto una ADN polimerasa mutante (por ejemplo, recombinante) de origen no natural con un ácido nucleico en presencia de uno o más nucleótidos; y (b) polimerizar al menos uno de los uno o más nucleótidos mediante el uso de la ADN polimerasa mutante (por ejemplo, recombinante). La ADN polimerasa mutante (por ejemplo, recombinante) en tal método puede incluir un segmento polipeptídico que tenga al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID No : 1 o un fragmento del mismo, muestra actividad de polimerasa, puede incluir opcionalmente H46R, E446Q, H572R, H281M, D423K y N487R, e incluye ya sea i) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30k , G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o ii) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. La polimerasa recombinante usada en tal método puede tener la propiedad, en modalidades ilustrativas, de producir una tasa de error sistemático más baja, un incremento de la relación de señal con respecto a ruido y/o una mayor precisión, cuando se usa en una reacción de secuenciación por síntesis en comparación con una polimerasa de referencia. La reacción de secuenciación por síntesis de los ejemplos ilustrativos es una reacción en la que se generan y detectan iones de hidrógeno. La polimerasa mutante (por ejemplo, recombinante) usada en el método en modalidades ilustrativas, incluye las sustituciones de aminoácidos H46r , E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1. La sal puede incluirse en una mezcla de reacción en la que se produce el contacto. La mezcla de reacción puede incluir la sal, por ejemplo a una concentración de entre 50 y 250 mM, o entre 100 mM y 200 mM, o entre 120 y 200 mM, o en exceso de 120 mM, tal como entre 125 mM y 250 mM, o entre 125 mM y 175 mM. La sal en los ejemplos ilustrativos es KCI y/o NaCl.
La ADN polimerasa mutante (por ejemplo, recombinante) en el método para realizar una reacción de polimerización proporcionada anteriormente, en ejemplos ilustrativos, incluye uno o más de L252R, H473G y H528T, en donde la numeración es con relación a la s Eq ID NO:1. En consecuencia, en ciertos ejemplos ilustrativos proporcionados en la presente descripción, la ADN polimerasa mutante (por ejemplo, recombinante) usada en el método para realizar una reacción de polimerización tiene al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, o 99 % de identidad con la SEQ ID NO: 1, o un fragmento de la misma, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y H528T en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ejemplar que tiene tales mutaciones, la ADN polimerasa mutante no natural (por ejemplo, recombinante) tiene la secuencia de la SEQ ID NO: 119.
El segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en el método para polimerizar las modalidades proporcionadas anteriormente, puede ser al menos 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante), y puede tener al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % identidad con la SEQ ID NO: 1 o SEQ ID NO: 16, que es la polimerasa Bst de tipo silvestre de longitud completa. La ADN polimerasa mutante (por ejemplo, recombinante) en tales métodos para polimerizar submodalidades, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H341R, E741Q, H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde el la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades ilustrativas, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En modalidades ilustrativas, la polimerasa mutante (por ejemplo, recombinante) no tiene actividad de exonucleasa de 5' a 3' y/o actividad de exonucleasa de 3' a 5'. En un método ilustrativo para la modalidad de polimerización en donde la ADN polimerasa mutante (por ejemplo, recombinante) tiene tales mutaciones, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121.
En otro aspecto de la invención, se proporciona un método para amplificar un ácido nucleico, que incluye lo siguiente: (a) poner en contacto un ácido nucleico en presencia de uno o más nucleótidos, con una a Dn polimerasa mutante (por ejemplo, recombinante) de origen no natural que incluye un segmento polipeptídico que tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1 o un fragmento de la misma, muestra actividad de polimerasa, incluye H46R, E446Q, H572R H281M, D423K y N487R, e incluye ya sea i) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o ii) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. La polimerasa mutante (por ejemplo, recombinante) usada en tal método, tiene la propiedad en modalidades ilustrativas, de producir una tasa de error sistemático más baja y/o una mayor precisión, cuando se usa en una reacción de secuenciación por síntesis en comparación con una polimerasa de referencia. La reacción de secuenciación por síntesis de los ejemplos ilustrativos es una reacción en la que se generan y detectan iones de hidrógeno. La polimerasa mutante (por
ejemplo, recombinante) usada en el método en ejemplos ilustrativos, incluye sustituciones de aminoácidos H46R, E446Q y H572R, y/o puede incluir las mutaciones H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1. La sal puede incluirse en una mezcla de reacción en la que se produce el contacto. La mezcla de reacción puede incluir una sal, por ejemplo a una concentración de entre 50 y 250 mM, o entre 100 mM y 200 mM, o entre 120 mM a 200 mM, o entre 120 y 200 mM, o en exceso de 120 mM, tal como entre 125 mM y 250 mM, o entre 125 mM y 175 mM. La sal en los ejemplos ilustrativos es KCI y/o NaCl.
La ADN polimerasa mutante (por ejemplo, recombinante) en el método para amplificar un ácido nucleico proporcionado anteriormente, en ejemplos ilustrativos incluye uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la s Eq ID NO:1. En consecuencia, en ciertos ejemplos proporcionados en la presente descripción, la ADN polimerasa mutante en la ADN polimerasa recombinante y las modalidades relacionadas tienen al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o un fragmento de la misma, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y H528T en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ilustrativa que tiene tales mutaciones, el mutante de origen no natural tiene la secuencia de la SEQ ID NO: 119.
El segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en el método para amplificar las modalidades proporcionadas anteriormente, puede ser al menos 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante), y tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1 o SEQ ID NO: 16, que es la polimerasa Bst de tipo silvestre de longitud completa. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H341R, E741Q, H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En una modalidad ilustrativa que tiene tales mutaciones, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121.
Un método ilustrativo de amplificación es una reacción en cadena de la polimerasa, una reacción en cadena de la polimerasa en emulsión, una reacción de amplificación isotérmica, una reacción de amplificación de polimerasa recombinasa, una reacción de amplificación por ligación de proximidad, una reacción de amplificación por círculo rodante o una reacción de amplificación por desplazamiento de cadena. En ciertas modalidades, la amplificación consiste en amplificar clonalmente el ácido nucleico en solución o en un soporte sólido.
En otro aspecto de la invención, se proporciona un método para obtener información de secuencias a partir de una plantilla de ácido nucleico, que incluye lo siguiente: (a) proporcionar una mezcla de reacción que comprende un ácido nucleico plantilla, un cebador de secuenciación, uno o más nucleótidos y una ADN polimerasa mutante (por ejemplo, recombinante) de origen no natural de la presente invención; (b) poner en contacto el ácido nucleico plantilla con al menos un tipo de nucleótido, en donde el contacto incluye incorporar uno o más nucleótidos del al menos un tipo de nucleótido en el extremo 3' del cebador de secuenciación y generar un producto de cebador extendido mediante el uso de la ADN polimerasa mutante (por ejemplo, recombinante); y (c) detectar la presencia del cebador extendido en la mezcla de reacción mediante la detección de la liberación de iones de hidrógeno, lo que determina de este modo si se ha producido la incorporación de nucleótidos. La ADN polimerasa mutante (por ejemplo, recombinante) en tal método puede incluir un segmento polipeptídico que tiene al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SeQ iD No : 1 o un fragmento del mismo, muestra actividad de polimerasa, incluye H46R, E446Q, H572R, H281M, D423K y N487R, e incluye (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1.. La polimerasa recombinante usada en tal método, en modalidades ilustrativas, puede producir una menor tasa de error sistemático y/o una mayor precisión, cuando se usa en una reacción de secuenciación por síntesis en comparación con una polimerasa de referencia. La reacción de secuenciación por síntesis de los ejemplos ilustrativos es una reacción en la que se generan y detectan iones de hidrógeno. La mezcla de reacción puede incluir una sal, por ejemplo a una concentración de entre 50 y 250 mM, o entre 100 mM y 200 mM, o entre 120 y 200 mM, o en exceso de 120 mM, tal como entre 125 mM y 250 mM, o entre 125 mM y 175 mM. La sal en los ejemplos ilustrativos es KCl y/o NaCl.
La ADN polimerasa mutante (por ejemplo, recombinante) en el método para obtener información de secuencia a partir de una plantilla de ácido nucleico proporcionada anteriormente, en ejemplos ilustrativos, incluye uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ Id NO:1. En consecuencia, en ciertos ejemplos proporcionados en la presente descripción, la ADN polimerasa mutante en la ADN polimerasa recombinante y las modalidades relacionadas tienen al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99% de identidad con SEQ ID NO: 1, o un fragmento del mismo, muestra actividad de polimerasa, incluye sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y
H528T, en donde la numeración es con relación a la SEQ ID NO: 1,. En una modalidad ilustrativa del método para obtener información de secuencia, la ADN polimerasa mutante (por ejemplo, recombinante) que tiene tales mutaciones, tiene la secuencia de SEQ ID NO: 119.
El método para obtener información de secuencia de una plantilla de ácido nucleico, el segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en las modalidades proporcionadas anteriormente, puede ser al menos 50 %, 60 %, 70 %, 75 %, 80 %, 90 % %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante) y tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98% o 99% de identidad con SEQ ID NO: 1, o SEQ ID NO: 16, que es polimerasa Bst de tipo silvestre de longitud completa. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H341R, E741Q, H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En un método ejemplar para obtener información de secuencia, la ADN polimerasa mutante (por ejemplo, recombinante) que tiene tales mutaciones, tiene la secuencia de aminoácidos de SEQ ID NO: 121.
En las modalidades del método, al menos uno de uno o más nucleótidos incorporados en el extremo 3' del cebador de secuenciación es un nucleótido terminador reversible; el contacto incluye generar uno o más iones de hidrógeno como un subproducto de la incorporación de nucleótidos; la detección incluye medir una concentración de uno o más iones de hidrógeno generados como un subproducto de la incorporación de nucleótidos; y el método incluye además identificar al menos uno de los uno o más nucleótidos incorporados a partir del al menos un tipo de nucleótido. Las etapas de contacto, detección e identificación del método se repiten más de una vez, identificando de este modo una pluralidad de incorporaciones secuenciales de nucleótidos.
Breve descripción de los dibujos
Los dibujos adjuntos, que se incorporan y forman parte de la memoria descriptiva, ilustran una o más modalidades ilustrativas y sirven para explicar los principios de varias modalidades ilustrativas. Los dibujos son solo ilustrativos y explicativos y no deben interpretarse como limitantes o restrictivos de ninguna manera.
La Figura 1 muestra un gráfico que describe un ensayo de disociación ilustrativo realizado de acuerdo con la descripción.
La Figura 2 muestra un gráfico que describe una curva de tasa de disociación ilustrativa para polimerasas modificadas ilustrativas obtenidas de acuerdo con la descripción.
Las Figuras 3A-3F son tablas que proporcionan datos de secuenciación de ácidos nucleicos ilustrativos obtenidos mediante el uso de polimerasas recombinantes ilustrativas de acuerdo con la descripción.
La Figura 4 es una tabla y gráficos que muestran datos de secuenciación de ácidos nucleicos ilustrativos obtenidos mediante el uso de tres polimerasas recombinantes de acuerdo con la descripción.
La Figura 5 es una tabla que proporciona datos de secuenciación de ácidos nucleicos ilustrativos obtenidos mediante el uso de tres polimerasas recombinantes de acuerdo con la descripción.
Descripción detallada
En la presente descripción se proporcionan polimerasas mutantes de origen no natural, típicamente polimerasas recombinantes derivadas de la polimerasa Bst, que tienen propiedades mejoradas, y métodos y kits que incluyen las polimerasas mutantes (por ejemplo, recombinantes). Las polimerasas mutantes (por ejemplo, recombinantes), en ciertas modalidades ilustrativas, cuando se usan en una reacción de secuenciación de ácidos nucleicos, producen mejores resultados. Por ejemplo, las polimerasas mutantes recombinantes de la presente descripción, en determinadas modalidades ilustrativas, cuando se usan en una reacción de secuenciación, tal como una reacción de secuenciación por síntesis, incluidas, pero sin limitarse a, las que generan y detectan iones de hidrógeno, proporcionan una precisión y una longitud de lectura mejoradas. Por lo tanto, las polimerasas mutantes recombinantes proporcionadas en la presente descripción pueden usarse para mejorar la precisión y reducir el costo de la secuenciación de ácidos nucleicos.
Como se usa en la presente descripción, el término "polimerasa" y sus variantes comprenden cualquier enzima que pueda catalizar la polimerización de nucleótidos (incluidos análogos de estos) en una cadena de ácido nucleico. Típicamente, pero no necesariamente, tal polimerización de nucleótidos puede ocurrir de una manera dependiente de la plantilla. Tales polimerasas pueden incluir, sin limitación, polimerasas de origen natural y cualquier subunidad y truncamiento de las mismas, polimerasas mutantes, polimerasas variantes, polimerasas recombinantes, de fusión o manipuladas genéticamente de otra manera, polimerasas modificadas químicamente, moléculas sintéticas o ensamblajes, y cualquier análogo, homólogo, derivados o fragmentos de los mismos que conservan la capacidad de catalizar tal polimerización. Opcionalmente, la polimerasa puede ser una polimerasa mutante que comprende una o
más mutaciones que implican el reemplazo de uno o más aminoácidos con otros aminoácidos, la inserción o eliminación de uno o más aminoácidos de la polimerasa, o el enlace de partes de dos o más polimerasas. Típicamente, la polimerasa comprende uno o más sitios activos en los que puede ocurrir la unión de nucleótidos y/o la catálisis de la polimerización de nucleótidos. El término "polimerasa" y sus variantes, como se usa en la presente descripción, también se refiere a proteínas de fusión que comprenden al menos dos porciones enlazadas entre sí, donde la primera porción comprende un péptido que puede catalizar la polimerización de nucleótidos en una cadena de ácido nucleico y se enlaza a una segunda porción que comprende un segundo polipéptido. En algunas modalidades, el segundo polipéptido puede incluir una enzima indicadora o un dominio potenciador de la capacidad de procesamiento.
Como se usa en la presente descripción, los términos "enlazar", "enlazado", "enlace" y variantes de los mismos comprenden cualquier tipo de fusión, unión, adherencia o asociación que sea lo suficientemente estable para soportar el uso en la aplicación biológica particular de interés. Tal enlace puede comprender, por ejemplo, enlaces covalentes, iónicos, de hidrógeno, dipolo-dipolo, hidrófilos, hidrófobos o de afinidad, enlaces o asociaciones que implican fuerzas de van der Waals, uniones mecánicas y similares. Opcionalmente, tal enlace puede ocurrir entre una combinación de diferentes moléculas, incluyendo pero sin limitarse a: entre una nanopartícula y una proteína; entre una proteína y una etiqueta; entre un enlazador y una nanopartícula funcionalizada; entre un enlazador y una proteína; entre un nucleótido y una etiqueta; y similares. Pueden encontrarse algunos ejemplos de enlaces, por ejemplo, en Hermanson, G., Bioconjugate Techniques, Segunda Edición (2008); Aslam, M., Dent, A., Bioconjugation: Protein Coupling Techniques for the Biomedical Sciences, London: Macmillan (1998); Aslam, M., Dent, A., Bioconjugation: Protein Coupling Techniques for the Biomedical Sciences, London: Macmillan (1998).
Los términos "modificación" o "modificado" y sus variantes, como se usan en la presente descripción con referencia a un polipéptido o proteína, por ejemplo una polimerasa, comprenden cualquier cambio en las propiedades estructurales, biológicas y/o químicas de la proteína. En algunas modalidades, la modificación puede incluir un cambio en la secuencia de aminoácidos de la proteína. Por ejemplo, la modificación puede incluir opcionalmente una o más mutaciones de aminoácidos, incluidas pero sin limitarse a adiciones, eliminaciones y sustituciones de aminoácidos (incluidas las sustituciones conservadoras y no conservadoras). La modificación de una secuencia de aminoácidos de un polipéptido que da como resultado la producción de un polipéptido de origen no natural se denomina En la presente descripción polipéptido "recombinante". Por ejemplo, muchos de los ejemplos de la presente descripción describen el uso de ADN polimerasas recombinantes en reacciones de secuenciación o amplificación de ácidos nucleicos. Además, el Ejemplo 1 describe cómo un experto en la técnica puede preparar una biblioteca de ADN polimerasa recombinante a partir de una polimerasa de referencia. En algunos casos, la ADN polimerasa recombinante puede incluir una o más sustituciones de aminoácidos a lo largo de la ADN polimerasa. En algunas modalidades, las sustituciones de uno o más aminoácidos a lo largo de la ADN polimerasa pueden dar como resultado una ADN polimerasa recombinante que posee una mejor precisión y/o una reducción de la tasa de error sistemático y/o un incremento del rendimiento de secuenciación y/o un incremento de la relación de señal con respecto a ruido en comparación con una polimerasa de control que carece de la una o más sustituciones de aminoácidos.
El término "conservador" y sus variantes, como se usa en la presente descripción con referencia a cualquier cambio en la secuencia de aminoácidos, se refiere a una mutación de aminoácidos en donde uno o más aminoácidos se sustituyen por otro aminoácido que tiene propiedades muy similares. Por ejemplo, uno o más aminoácidos que comprenden cadenas laterales no polares o alifáticas (por ejemplo, glicina, alanina, valina, leucina o isoleucina) pueden sustituirse entre sí. De manera similar, uno o más aminoácidos que comprenden cadenas laterales polares sin carga (por ejemplo, serina, treonina, cisteína, metionina, asparagina o glutamina) pueden sustituirse entre sí. De manera similar, uno o más aminoácidos que comprenden cadenas laterales aromáticas (por ejemplo, fenilalanina, tirosina o triptófano) pueden sustituirse entre sí. De manera similar, uno o más aminoácidos que comprenden cadenas laterales cargadas positivamente (por ejemplo, lisina, arginina o histidina) pueden sustituirse entre sí. De manera similar, uno o más aminoácidos que comprenden cadenas laterales cargadas negativamente (por ejemplo, ácido aspártico o ácido glutámico) pueden sustituirse entre sí. En algunas modalidades, la polimerasa modificada es una variante que comprende una o más de estas sustituciones conservadoras de aminoácidos, o cualquier combinación de las mismas. En algunas modalidades, las sustituciones conservadoras de leucina incluyen: alanina, isoleucina, valina, fenilalanina, triptófano, metionina y cisteína. En otras modalidades, las sustituciones conservadoras de asparagina incluyen: arginina, lisina, aspartato, glutamato y glutamina.
A lo largo de esta descripción, se hace referencia a diversas mutaciones de aminoácidos, incluidas, por ejemplo, sustituciones de aminoácidos, mediante el uso del código de una sola letra del aminoácido e indicando la posición del residuo dentro de una secuencia de aminoácidos de referencia. En el caso de sustituciones de aminoácidos, la identidad del sustituyente también se indica mediante el uso del código de una sola letra del aminoácido. Por ejemplo, una referencia a la sustitución de aminoácido hipotética "D166A, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 7" indica una sustitución de aminoácido en donde un residuo de alanina (A) se sustituye por el residuo de ácido aspártico (D) que se produce normalmente en la posición de aminoácido 166 de la secuencia de aminoácidos de la SEQ ID NO: 7. Muchas de las secuencias de aminoácidos descritas en la presente descripción comienzan con un residuo de metionina ("M"), que típicamente se introduce al comienzo de las secuencias de ácidos nucleicos que codifican los péptidos que se desea expresar en las células
huésped bacterianas. Sin embargo, debe entenderse que la descripción también abarca todas las secuencias de aminoácidos que comienzan desde el segundo residuo de aminoácido en adelante, sin la inclusión del primer residuo de metionina.
Como se usa en la presente descripción, los términos "idéntico" o "porcentaje de identidad" y sus variantes, cuando se usan en el contexto de dos o más secuencias de ácidos nucleicos o polipéptidos, se refieren a dos o más secuencias o subsecuencias que son iguales o tienen un porcentaje de residuos de aminoácidos o nucleótidos que son iguales, cuando se comparan y alinean para obtener la máxima correspondencia, medidos mediante el uso de uno o más de los siguientes algoritmos de comparación de secuencias: Needleman-Wunsch (ver, por ejemplo, Needleman, Saúl B.; y Wunsch, Christian D. (1970). "A general method applicable to the search for similarities in the amino acid sequence of two proteins" Journal of Molecular Biology 48 (3):443-53); Smith-Waterman (ver, por ejemplo, Smith, Temple F.; y Waterman, Michael S., "Identification of Common Molecular Subsequences" (1981) Journal of Molecular Biology 147:195-197); o BLAST (Basic Local Alignment Search Tool; ver, por ejemplo, Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ, "Basic local alignment search tool" (1990) J Mol Biol 215 (3):403-410).
Como se usa en la presente descripción, los términos "sustancialmente idénticos" o "identidad sustancial" y sus variantes, cuando se usan en el contexto de dos o más secuencias de ácidos nucleicos o polipéptidos, se refieren a dos o más secuencias o subsecuencias (tales como fragmentos biológicamente activos) que tengan al menos 60 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, o al menos 99 % de identidad de nucleótidos o residuos de aminoácidos, cuando se comparan y alinean para la máxima correspondencia, según se mide mediante el uso de un algoritmo de comparación de secuencias o mediante inspección visual. Las secuencias sustancialmente idénticas se consideran típicamente homólogas sin referencia a la ascendencia real. En algunas modalidades, existe una "identidad sustancial" sobre una región de las secuencias que se comparan. En algunas modalidades, existe una identidad sustancial en una región de al menos 25 residuos de longitud, al menos 50 residuos de longitud, al menos 100 residuos de longitud, al menos 150 residuos de longitud, al menos 200 residuos de longitud o más de 200 residuos. residuos de longitud. En algunas modalidades, las secuencias que se comparan son sustancialmente idénticas en toda la longitud de las secuencias que se comparan. Típicamente, las secuencias de proteínas o ácidos nucleicos sustancialmente idénticas incluyen menos del 100 % de identidad de nucleótidos o residuos de aminoácidos, ya que tales secuencias generalmente se considerarían "idénticas".
Las proteínas y/o las subsecuencias de proteínas (tales como fragmentos biológicamente activos) son "homólogas" cuando se derivan, natural o artificialmente, de una proteína o secuencia de proteína ancestral común. De manera similar, los ácidos nucleicos y/o las secuencias de ácidos nucleicos son homólogos cuando se derivan, natural o artificialmente, de un ácido nucleico o una secuencia de ácidos nucleicos ancestral común. La homología generalmente se deduce de la similitud de secuencia entre dos o más ácidos nucleicos o proteínas (o fragmentos biológicamente activos o secuencias de los mismos). El porcentaje preciso de similitud entre secuencias que es útil para establecer la homología varía según el ácido nucleico y la proteína en cuestión, pero tan solo un 25 % de similitud de secuencia en 25, 50, 100, 150 o más ácidos nucleicos o residuos de aminoácidos, se usa habitualmente para establecer la homología. También pueden usarse niveles más altos de similitud de secuencia, por ejemplo, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 85 %, 90 %, 95 %, 98 % o 99 %, para establecer la homología.
Los métodos para determinar la homología o los porcentajes de similitud de secuencias (por ejemplo, BLASTP y BLASTN mediante el uso de parámetros predeterminados) se describen en la presente descripción y generalmente están disponibles. Para la comparación de secuencias y la determinación de la homología, normalmente una secuencia actúa como secuencia de referencia con la que se comparan las secuencias de prueba. La Tabla 1 proporcionada en la presente descripción proporciona una lista ilustrativa de mutaciones de aminoácidos homólogos en cuatro clases diferentes de ADN polimerasa, a saber, una ADN polimerasa Bst de longitud completa (SEQ ID NO: 16), el fragmento grande de ADN polimerasa Bst (SEQ ID NO: 1), ADN polimerasa Taq (SEQ iD NO: 15) y fragmento de polimerasa Klenow (SEQ ID NO: 18). La Tabla 1 proporciona una lista ilustrativa de varias posiciones de aminoácidos que pueden mutarse en la SEQ ID NO: 1 e identifica la posición de aminoácido correspondiente en cada una de las otras polimerasas presentadas (es decir, un homólogo). Por ejemplo, se encontró que la sustitución de aminoácido E220K en la SEQ iD NO: 1 era homóloga a E515K en la SEQ ID NO: 16, E245K en la SEQ ID NO: 18 y E471K en la SEQ ID NO: 15. Será evidente para el experto en la técnica que puede usarse una variedad de herramientas de alineación disponibles públicamente para identificar mutaciones de aminoácidos homólogos (tales como sustituciones de aminoácidos) a través de una secuencia de aminoácidos de polimerasa, por ejemplo, las herramientas de alineación NCBI y BLAST. Generalmente, cuando se usa un algoritmo de comparación de secuencias, las secuencias de prueba y de referencia se ingresan en una computadora, se designan las coordenadas de la subsecuencia, si es necesario, y se designan los parámetros del programa del algoritmo de secuencia. A continuación, el algoritmo de comparación de secuencias calcula el porcentaje de identidad de secuencia para la(s) secuencia(s) de prueba en relación con la secuencia de referencia, en función de los parámetros de programa designados. La alineación óptima de las secuencias para la comparación puede realizarse, por ejemplo, mediante el algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482 (1981)), mediante el algoritmo de alineación de homología de Needleman & Wunsch, J. Mol. Biol. 48:443 (1970)), mediante el método de búsqueda de similitud de Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el paquete de
software de Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, Wis.), o mediante inspección visual (ver generalmente Current Protocols in Molecular Biology, Ausubel y otros, eds., Current Protocols, una empresa conjunta entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., complementada hasta 2004). Un ejemplo de un algoritmo que es adecuado para determinar el por ciento de identidad de secuencia y la similitud de secuencia es el algoritmo BLAST, que se describe en Altschul y otros, J. Mol. Biol. 215:403-410 (1990). El software para realizar el análisis BLAST está disponible públicamente a través del Centro Nacional de Información Biotecnológica. Este algoritmo implica primero identificar pares de secuencias de puntuación alta (HSP) mediante la identificación de palabras cortas de longitud "W" en la secuencia de consulta, que coinciden o satisfacen alguna puntuación de umbral de valor positivo "T" cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. Se hace referencia a "T" como el umbral de puntuación de palabras vecinas (Altschul y otros, más arriba). Estos aciertos iniciales de palabras vecinas actúan como semillas para iniciar las búsquedas para encontrar los HSP más largos que los contengan. Los aciertos de palabra se extienden en ambas direcciones a lo largo de cada secuencia hasta donde puede incrementarse la puntuación de alineación acumulada. Las puntuaciones acumulativas se calculan, para las secuencias de nucleótidos, mediante el uso de los parámetros "M" (puntuación de recompensa para un par de residuos coincidentes; siempre >0) y "N" (puntuación de penalización para residuos no coincidentes; siempre <0). Para las secuencias de aminoácidos, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabra en cada dirección se detiene cuando: la puntuación de alineación acumulativa cae por la cantidad X de su valor máximo alcanzado; la puntuación acumulativa llega a cero o menos, debido a la acumulación de uno o más alineaciones de residuos de puntuación negativa; o se alcanza el extremo de cualquiera de las secuencias. Los parámetros del algoritmo BLAST "W', "T" y "X" determinan la sensibilidad y la velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) usa por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, un límite de 100, M=5, N=-4 y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa BLASTP usa por defecto una longitud de palabra (W) de 3, una expectativa (E) de 10 y la matriz de puntuación BLOSUM62 (ver Henikoff y Henikoff (1989) Proc. Natl. Acad. Sci. USA 89:10915).
Además de calcular el por ciento de identidad de secuencia, el algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (ver, por ejemplo, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787 (1993)). Una medida de similitud proporcionada por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de la probabilidad por la cual se produciría por casualidad una coincidencia entre dos secuencias de nucleótidos o aminoácidos. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación del ácido nucleico de prueba con el ácido nucleico de referencia es menor que aproximadamente 0,1, menor que aproximadamente 0,01 o menor que aproximadamente 0,001.
El término "actividad de extensión del cebador" y sus variantes, como se usa en la presente descripción, cuando se usa en referencia a una polimerasa dada, comprende cualquier actividad enzimática in vivo o in vitro característica de una polimerasa dada que se relaciona con catalizar la incorporación de nucleótidos en el extremo 3'OH terminal de una molécula de ácido nucleico que se extiende. Típicamente, pero no necesariamente, tal incorporación de nucleótidos ocurre de una manera dependiente de la plantilla. En algunas modalidades, la actividad de extensión del cebador de una polimerasa dada se puede cuantificar como el número total de nucleótidos incorporados (medidos, por ejemplo, mediante un ensayo radiométrico u otro adecuado) por una cantidad unitaria de polimerasa (en moles) por unidad de tiempo (segundos) bajo un conjunto particular de condiciones de reacción.
El término "actividad de unión al ADN" y sus variantes, como se usa en la presente descripción, cuando se usa en referencia a una polimerasa dada, comprende cualquier actividad enzimática in vivo o in vitro característica de una polimerasa dada que se relaciona con la interacción de la polimerasa con una secuencia de ADN en una manera basada en el reconocimiento. Típicamente, pero no necesariamente, tal interacción incluye la unión de la polimerasa, y más específicamente la unión del dominio de unión al ADN de la polimerasa, a la secuencia de ADN reconocida. En algunas modalidades, el reconocimiento incluye la unión de la polimerasa a una secuencia de ADN específica de secuencia o no específica de secuencia. En algunas modalidades, la actividad de unión al ADN de una polimerasa dada puede cuantificarse como la afinidad de la polimerasa para reconocer y unirse a la secuencia de ADN reconocida. Por ejemplo, la actividad de unión al ADN puede controlarse y determinarse mediante el uso de un cambio de señal de anistrofia (u otro ensayo adecuado) a medida que se forma un complejo de proteína-ADN en un conjunto particular de condiciones de reacción.
Como se usa en la presente descripción, el término "fragmento biológicamente activo" y sus variantes, cuando se usa en referencia a una biomolécula dada, se refiere a cualquier fragmento, derivado, homólogo o análogo de la biomolécula que posee una actividad in vivo o in vitro que es característica de la propia biomolécula. Por ejemplo, una polimerasa puede caracterizarse por diversas actividades biológicas, por ejemplo, actividad de unión al ADN, actividad de polimerización de nucleótidos, actividad de extensión del cebador, actividad de desplazamiento de cadena, actividad de transcriptasa inversa, actividad de polimerasa iniciada por mellas, actividad de exonucleasa 3'-5' (corrección) y similares. En algunas modalidades, un "fragmento biológicamente activo" de una polimerasa es cualquier fragmento, derivado, homólogo o análogo de la polimerasa que puede catalizar la polimerización de nucleótidos (incluidos sus homólogos y análogos) en una cadena de ácido nucleico. En algunas modalidades, el fragmento biológicamente activo, derivado, homólogo o análogo de la polimerasa posee 10 %, 20 %, 30 %, 40 %,
50 %, 60 %, 70 %, 75 %, 80 %, 85 % o 90 % o más de la actividad biológica de la polimerasa en cualquier ensayo in vivo o in vitro de interés tal como, por ejemplo, ensayos de unión de ADN, ensayos de polimerización de nucleótidos (que pueden ser dependientes o independientes de la plantilla), ensayos de extensión del cebador, ensayos de desplazamiento de cadena, ensayos de transcriptasa inversa, ensayos de corrección y similares. En algunas modalidades, la actividad biológica de un fragmento de polimerasa puede analizarse midiendo la actividad de extensión del cebador in vitro del fragmento en condiciones de reacción definidas. En algunas modalidades, la actividad biológica de un fragmento de polimerasa puede analizarse midiendo la actividad de polimerización in vitro del fragmento en condiciones de reacción definidas. En algunas modalidades, la actividad biológica de un fragmento de polimerasa puede analizarse midiendo la actividad de unión al ADN in vitro del fragmento en condiciones de reacción definidas. En algunas modalidades, la actividad biológica de un fragmento de polimerasa puede analizarse midiendo la actividad de desplazamiento de cadena in vitro del fragmento en condiciones de reacción definidas. En algunas modalidades, la actividad biológica de un fragmento de polimerasa puede analizarse midiendo la actividad de transcriptasa inversa in vitro del fragmento en condiciones de reacción definidas. En algunas modalidades, la actividad biológica de un fragmento de polimerasa puede analizarse midiendo la actividad de polimerasa iniciada por mella in vitro del fragmento en condiciones de reacción definidas. En algunas modalidades, la actividad biológica de un fragmento de polimerasa puede analizarse midiendo la actividad de corrección in vitro del fragmento en condiciones de reacción definidas. En algunas modalidades, el fragmento biológicamente activo de una polimerasa puede incluir la medición de la actividad biológica de cualquiera o más de las actividades biológicas de polimerasa descritas en la presente descripción.
Los fragmentos biológicamente activos pueden existir opcionalmente in vivo, como, por ejemplo, fragmentos que surgen del procesamiento postranscripcional o que surgen de la traducción de ARN empalmados alternativamente, o alternativamente pueden crearse mediante manipulación genética, síntesis masiva u otra manipulación adecuada. Los fragmentos biológicamente activos incluyen fragmentos expresados en células nativas o endógenas, así como también los producidos en sistemas de expresión tales como, por ejemplo, en células bacterianas, de levadura, de insecto o de mamífero.
En algunas modalidades, en la presente descripción se proporcionan no solo las polimerasas específicas descritas en la presente descripción, sino también cualquier fragmento biológicamente activo de tales polimerasas, que se incluyen dentro del alcance de la presente descripción. En algunas modalidades, un fragmento biológicamente activo de cualquier polimerasa de la descripción incluye cualquier fragmento que muestre actividad de extensión del cebador y actividad de unión al ADN in vitro. En algunas modalidades, un fragmento biológicamente activo de cualquier polimerasa de la descripción incluye cualquier fragmento que retenga la actividad de polimerasa in vitro. La actividad de polimerasa puede determinarse mediante cualquier método conocido en la técnica. Por ejemplo, la determinación de la actividad de polimerasa puede basarse en la actividad de extensión de un cebador sobre una plantilla.
En algunas modalidades, la descripción generalmente se relaciona con una polimerasa modificada que tiene una o más mutaciones de aminoácidos (como una eliminación, sustitución o adición) en relación con una polimerasa de referencia que carece de una o más mutaciones de aminoácidos, y en donde la polimerasa modificada retiene la actividad de polimerasa in vitro, muestra actividad de unión al ADN in vitro o muestra actividad de extensión del cebador in vitro. En algunas modalidades, la polimerasa modificada incluye cualquier fragmento biológicamente activo de tal polimerasa que conserva la actividad de polimerasa in vitro, muestra actividad de unión al ADN in vitro o muestra actividad de extensión del cebador in vitro.
En algunas modalidades, la descripción generalmente se relaciona con una polimerasa modificada que tiene una o más mutaciones de aminoácidos (tal como una eliminación, sustitución o adición) en relación con una polimerasa de referencia que carece de una o más mutaciones de aminoácidos, y en donde la polimerasa modificada conserva la actividad de corrección in vitro. En algunas modalidades, la descripción generalmente se relaciona con una polimerasa modificada que tiene una o más mutaciones de aminoácidos (tal como una eliminación, sustitución o adición) en relación con una polimerasa de referencia que carece de una o más mutaciones de aminoácidos, y en donde la polimerasa modificada conserva la actividad de corrección in vitro, muestra actividad de polimerasa iniciada por mella in vitro o actividad transcriptasa inversa in vitro. En algunas modalidades, la polimerasa modificada incluye cualquier fragmento biológicamente activo de dicha polimerasa que conserva la actividad de corrección in vitro, muestra actividad de polimerasa iniciada por mella in vitro o muestra actividad de transcriptasa inversa in vitro. La determinación de si una polimerasa muestra actividad de exonucleasa o muestra actividad de exonucleasa reducida puede determinarse fácilmente mediante métodos estándar. Por ejemplo, los polinucleótidos pueden sintetizarse de manera que una proporción detectable de los nucleótidos esté marcada radiactivamente. Estos polinucleótidos pueden incubarse en un amortiguador apropiado en presencia del polipéptido a probar. Después de la incubación, el polinucleótido se precipita y la actividad de exonucleasa es detectable como recuentos radiactivos debido a los nucleótidos libres en el sobrenadante. Como apreciará el experto en la técnica, puede seleccionarse una polimerasa apropiada o un fragmento biológicamente activo de los descritos en la presente descripción basándose en cualquiera de las actividades biológicas anteriores, o combinaciones de las mismas, dependiendo de la aplicación de interés.
Como se usa en la presente descripción, el término "nudeótido" y sus variantes comprenden cualquier compuesto que pueda unirse selectivamente a una polimerasa o que pueda ser polimerizado por ella. Típicamente, pero no necesariamente, la unión selectiva del nucleótido a la polimerasa va seguida de la polimerización del nucleótido en una cadena de ácido nucleico por la polimerasa; ocasionalmente, sin embargo, el nucleótido puede disociarse de la polimerasa sin incorporarse a la cadena de ácido nucleico, un evento denominado en la presente descripción como un evento "no productivo". Tales nucleótidos incluyen no sólo los nucleótidos de origen natural sino también cualquier análogo, independientemente de su estructura, que pueda unirse selectivamente a una polimerasa o que pueda ser polimerizado por ella. Mientras que los nucleótidos de origen natural típicamente comprenden restos de base, azúcar y fosfato, los nucleótidos de la descripción pueden incluir compuestos que carecen de cualquiera, algunos o todos de tales restos. En algunas modalidades, el nucleótido puede incluir opcionalmente una cadena de átomos de fósforo que comprende tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más átomos de fósforo. En algunas modalidades, la cadena de fósforo puede unirse a cualquier carbono de un anillo de azúcar, tal como el carbono 5'. La cadena de fósforo puede enlazarse al azúcar con un O o S intermedio. En una modalidad, uno o más átomos de fósforo en la cadena pueden ser parte de un grupo fosfato que tiene P y O. En otra modalidad, los átomos de fósforo en la cadena pueden enlazarse con O, NH, S, metileno, metileno sustituido, etileno, etileno sustituido, CNH2, C(O), C(CH2), CH2CH2 o C(OH)CH2R (donde R puede ser una 4-piridina o 1-imidazol). En una modalidad, los átomos de fósforo en la cadena pueden tener grupos laterales que tienen O, BH3 o S. En la cadena de fósforo, un átomo de fósforo con un grupo lateral distinto de O puede ser un grupo fosfato sustituido. Algunos ejemplos de análogos de nucleótidos se describen en Xu, patente de Estados Unidos núm. 7,405,281. En algunas modalidades, el nucleótido comprende un marcador (por ejemplo, un resto indicador) y se denomina en la presente descripción "nucleótido marcado"; el marcador del nucleótido marcado se denomina en la presente descripción "marcador de nucleótido". En algunas modalidades, el marcador puede estar en forma de un colorante fluorescente unido al grupo fosfato terminal, es decir, el grupo fosfato o el grupo fosfato sustituto más distal del azúcar. Algunos ejemplos de nucleótidos que pueden usarse en los métodos y composiciones descritos incluyen, pero sin limitarse a, ribonucleótidos, desoxirribonucleótidos, ribonucleótidos modificados, desoxirribonucleótidos modificados, polifosfatos de ribonucleótidos, polifosfatos de desoxirribonucleótidos, polifosfatos de ribonucleótidos modificados, polifosfatos de desoxirribonucleótidos modificados, nucleótidos peptídicos, metalonucleósidos, nucleósidos de fosfonato y nucleótidos de la cadena principal de fosfato-azúcar modificada, análogos, derivados o variantes de los compuestos anteriores y similares. En algunas modalidades, el nucleótido puede comprender restos no oxigenados tales como, por ejemplo, restos tio o borano, en lugar del resto oxigenado que sirve como puente entre el fosfato alfa y el azúcar del nucleótido, o los fosfatos alfa y beta del nucleótido, o los fosfatos beta y gamma del nucleótido, o entre otros dos fosfatos del nucleótido, o cualquier combinación de los mismos.
Como se usa en la presente descripción, el término "incorporación de nucleótidos" y sus variantes comprenden la polimerización de uno o más nucleótidos para formar una cadena de ácido nucleico que incluye al menos dos nucleótidos enlazados entre sí, típicamente, pero no necesariamente a través de enlaces fosfodiéster, aunque pueden ser posibles enlaces alternativos en el contexto de análogos de nucleótidos particulares.
Como se usa en la presente descripción, el término "capacidad de procesamiento" y sus variantes comprenden la capacidad de una polimerasa para permanecer unida a un único híbrido de cebador/plantilla. En algunas modalidades, la capacidad de procesamiento puede medirse por el número de nucleótidos que una polimerasa incorpora en un ácido nucleico (tal como un cebador de secuenciación) antes de la disociación de la polimerasa del híbrido de cebador/plantilla. En algunas modalidades, la polimerasa tiene una capacidad de procesamiento de al menos 100 nucleótidos, aunque en otras modalidades puede incluir una capacidad de procesamiento de al menos 200 nucleótidos, al menos 300 nucleótidos, al menos 400 nucleótidos, al menos 500 nucleótidos o más. Los expertos en la técnica entenderán que cuanto mayor es la capacidad de procesamiento de la polimerasa, más nucleótidos pueden incorporarse antes de la disociación y, por lo tanto, más larga es la secuencia (longitud de lectura) que puede obtenerse. En otras palabras, las polimerasas que tienen una baja capacidad de procesamiento típicamente proporcionarán longitudes de lectura promedio más cortas que las polimerasas que tienen una mayor capacidad de procesamiento. En una modalidad, las polimerasas de la presente descripción que contienen una o más mutaciones de aminoácidos pueden poseer una capacidad de procesamiento mejorada en comparación con una polimerasa de control que carece de una o más mutaciones de aminoácidos.
En un ensayo ilustrativo, la capacidad de procesamiento de una polimerasa dada puede medirse incubando la polimerasa con un dúplex de cebador: plantilla en condiciones de incorporación de nucleótidos y resolviendo los productos de extensión del cebador resultantes mediante el uso de cualquier método adecuado, por ejemplo, mediante electroforesis en gel. El cebador puede incluir opcionalmente un marcador para mejorar la detectabilidad de los productos de extensión del cebador. La mezcla de reacción de incorporación de nucleótidos típicamente incluye un gran exceso de plantilla competidora no marcada, lo que garantiza que prácticamente todos los productos de extensión se produzcan a través de un solo evento de unión de plantilla. Después de tal resolución, la cantidad promedio de productos de extensión de longitud completa puede cuantificarse mediante el uso de cualquier medio adecuado, incluida la detección fluorimétrica o radiométrica de productos de extensión de longitud completa. Para comparar la capacidad de procesamiento de dos o más enzimas diferentes (por ejemplo, polimerasas de referencia y modificadas), cada enzima puede emplearse en una reacción paralela y separada, después de lo cual los productos de extensión del cebador de longitud completa resultantes pueden resolverse y medirse, y compararse tales mediciones.
La capacidad de procesamiento de una polimerasa dada puede medirse mediante el uso de cualquier ensayo adecuado conocido en la técnica, incluidos pero sin limitarse a, los ensayos descritos en Von Hippel, P.H., Faireld, F.R. y Dolejsi, M.K., On the processivity of polymerases, Ann. NY Acad. Sci., 726:118-131 (1994); Bambara, R.A., Uyemura, D. y Choi, T., On the processive mechanism of Escherichia coli DNA polymerase I. Quantitative assessment of processivity, J. Biol. Chem., 253:413-423 (1978); Das, S.K. y Fujimura, R.K., Processiveness of DNA polymerases. Un estudio comparativo mediante el uso de un procedimiento simple, J. Biol. Chem., 254: 1227-1232 (1979); Nasir, M.S. y Jolley, M.E., Fluorescence polarization: An Analytical Tool for Immunoassay and Drug Discovery, Combinational Chemistry and High Throughput Screening, 2:177-190 (1999); Mestas, S.P., Sholders, A.J., y Peersen, O.B., A Fluorescence Polarization Based Screening Assay for Nucleic Acid Polymerase Elongation Activity, Anal. Biochem., 365:194-200 (2007); Nikiforov, T.T., Fluorogenic polymerase, endonuclease, and ligase assays based on DNA substrates labeled with a single fluorophore, Analytical Biochemistry 412: 229-236; y Yan Wang, Dennis E. Prosen, Li Mei, John C. Sullivan, Michael Finney y Peter B. Vander Horn, Nucleic Acids Research, 32(3):1197-1207 (2004).
Los términos "longitud de lectura" o "longitud-lectura" y sus variantes, como se usan en la presente descripción, se refieren al número de nucleótidos que se polimerizan (o se incorporan a una cadena de ácido nucleico existente) de manera dependiente de la plantilla por una polimerasa antes de la disociación de una cadena de ácido nucleico plantilla. En algunas modalidades, una polimerasa que se disocia de la cadena de ácido nucleico plantilla después de cinco incorporaciones típicamente proporcionará una secuencia que tiene una longitud de lectura de 5 nucleótidos, mientras que una polimerasa que se disocia de la cadena de ácido nucleico plantilla después de 500 incorporaciones de nucleótidos típicamente proporcionará una secuencia que tiene una longitud de lectura de aproximadamente 500 nucleótidos. Si bien la capacidad de procesamiento real o absoluta de una polimerasa dada (o la longitud de lectura real de los productos de polimerización producidos por la polimerasa) puede variar de una reacción a otra (o incluso dentro de una sola mezcla de reacción en donde la polimerasa produce diferentes productos que tienen diferentes longitudes de lectura), la polimerasa puede caracterizarse por la capacidad de procesamiento promedio (o la longitud de lectura promedio de los productos de polimerización) observada en un conjunto definido de condiciones de reacción. La "longitud de lectura sin errores" comprende el número de nucleótidos que se incorporan consecutiva y contiguamente sin error (es decir, sin error de apareamiento y/o desviación de un conjunto establecido y predecible de reglas de apareamiento de bases) en la cadena de ácido nucleico recién sintetizada.
Los términos "error sistemático" o "SE" o "SSE" y sus variantes, tal como se usan en la presente descripción, se refieren al porcentaje de errores en los motivos de secuencia que contienen homopolímeros (HP) de una longitud definida, con eliminación sistemática que se produce en la cadena en una frecuencia mínima especificada, y con cobertura de secuenciación de una frecuencia mínima especificada. Por ejemplo, en algunas modalidades, el error sistemático puede medirse como el porcentaje de errores en los motivos de secuencia que contienen homopolímeros de longitud 1-6, con una eliminación sistemática que se produce en la cadena con una frecuencia superior al 15 %, cuando la cobertura (de la corrida de secuenciación) es igual o mayor que 20x. En algunas modalidades, el error sistemático se estima como el porcentaje de errores estocásticos en motivos de secuencia que contienen homopolímeros de longitud 1-6, con una eliminación sistemática que se produce en la cadena con una frecuencia superior al 15 %, cuando la cobertura (del experimento de secuenciación) es igual a o mayor que 20x. Por lo tanto, un SSE de 0,3435 % significa que el 0,3435 % de todas las posiciones tienen un error de cadena sistemático. En algunas modalidades, el porcentaje de error sistemático se reduce cuando se usa una polimerasa mutante (por ejemplo, recombinante) como se describe en la presente descripción en comparación con una polimerasa de referencia (por ejemplo, una polimerasa de tipo silvestre, polimerasa de SEQ ID NO: 2 o polimerasa de SEQ ID NO: 35 (PSP4)) que no contiene la una o más mutaciones de aminoácidos, o contiene algunas, pero no todas, las mutaciones de aminoácidos. Por ejemplo, mientras que el error sistemático real de una polimerasa dada puede variar de una reacción a otra (o incluso dentro de una mezcla de reacción única), la polimerasa puede caracterizarse por el porcentaje de error sistemático observado en un conjunto definido de condiciones de reacción. En algunas modalidades, las polimerasas mutantes de la presente solicitud tienen un porcentaje de error sistemático reducido en comparación con una polimerasa de referencia correspondiente que no tiene una o más de las modificaciones de aminoácidos, por ejemplo, en comparación con la SEQ ID NO: 16, SEQ ID NO: 2, o SEQ ID NO; 35, SEQ ID NO: 1, SEQ ID NO: 120 o s Eq ID NO: 122. En ejemplos ilustrativos, la comparación es con la SEQ ID NO: 35. Las polimerasas mutantes (por ejemplo, recombinantes) de la presente invención producen un porcentaje de error sistemático menor que el 1 %, 0,9 %, 0,8 %, 0,75 %, 0,7 %, 0,6 %, 0,5 %, 0,4 % o 0,3 % de promedio sistemático promedio (SSE promedio), como se proporciona en los Ejemplos de la presente descripción, cuando se usa en una reacción de secuenciación por síntesis en donde se generan y detectan iones de hidrógeno, tal como el sistema Ion Torrent. Las polimerasas mutantes (por ejemplo, recombinantes) proporcionadas en la presente descripción pueden tener una reducción estadísticamente significativa en el error sistemático y/o una tasa de error sistemático que está entre 5, 10, 15, 20, 25, 30, 35, 40, 45 o 50 % en el extremo inferior del intervalo y 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 75, 80, 85 o 90 % en el extremo superior del intervalo, por debajo del SSE promedio obtenido mediante el uso de un polipéptido de referencia como la SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 35, SEQ ID NO: 16, SEQ ID NO: 120 o SEQ ID NO: 122. Por ejemplo, una polimerasa mutante (por ejemplo, recombinante) aislada proporcionada en la presente descripción puede tener una reducción estadísticamente significativa en el error sistemático y/o una tasa de error sistemático que está entre 5, 10, 15, 20 y 25 % en el extremo inferior del intervalo y 10, 15, 20, 25, 30, 35, 40, 45 y 50 % en el extremo superior del intervalo, más bajo
que el SSE promedio obtenido mediante el uso de la SEQ ID NO: 35 como una polimerasa de referencia. En ejemplos ilustrativos de los intervalos anteriores, el SSE se mide como el porcentaje de errores estocásticos en motivos de secuencia que contienen homopolímeros de longitud 1-6, con eliminación sistemática que se produce en la cadena con una frecuencia mayor que el 15 %, cuando la cobertura (de la corrida de secuenciación) es igual o mayor que 20x).
El término "sesgo de cadena", como se usa en la presente descripción, se refiere al porcentaje de bases diana en una corrida de secuenciación donde la lectura (genotipo) de una cadena (por ejemplo, positiva) es diferente de la lectura (genotipo) inferida de la otra cadena (por ejemplo, negativa). La cobertura de una base diana dada se calcula contando el número de bases de lectura asignadas a ella en una alineación. La cobertura media se calcula promediando este valor a través de cada base en la diana. A continuación, la cobertura relativa para una base particular se calcula como la relación de estos valores. Una cobertura relativa de 1 indica que una base en particular está cubierta a la tasa promedio esperada. Una cobertura relativa por encima de 1 indica una cobertura mayor que la esperada y por debajo de 1 indica una cobertura menor que la esperada. En general, la probabilidad de un mapeo ambiguo incrementa a medida que las lecturas se vuelven más cortas o menos precisas. El mapeo ambiguo también es más probable para las lecturas que se derivan de regiones repetitivas o de baja complejidad del genoma, incluidas algunas regiones con un contenido extremo de GC. En algunos ejemplos, el porcentaje de sesgo de cadena se reduce cuando se usa una polimerasa modificada como se describe en la presente descripción, en comparación con una polimerasa de referencia (por ejemplo, una polimerasa de tipo silvestre) que no contiene las correspondientes modificaciones de uno o más aminoácidos. En algunos ejemplos, las polimerasas modificadas de la presente solicitud tienen un sesgo de cadena reducido en comparación con la polimerasa no modificada correspondiente. Si bien el sesgo de cadena real de una polimerasa dada puede variar de una reacción a otra (o incluso dentro de una mezcla de reacción única), la polimerasa puede caracterizarse por el porcentaje de bases diana sin sesgo de cadena, observado en un conjunto definido de condiciones de reacción. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena mayor que el 25 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 30 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 40 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 45 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 50 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 60 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 70 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 75 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 80 %. En algunos ejemplos, las polimerasas modificadas que se describen en la presente descripción comprenden un porcentaje de bases diana sin sesgo de cadena de aproximadamente el 85 %. Por el contrario, en algunos ejemplos las polimerasas modificadas que se describen en la presente descripción pueden incluir aproximadamente un 15 % por ciento de bases diana con sesgo de cadena. En otro ejemplo, las polimerasas modificadas que se describen en la presente descripción pueden incluir aproximadamente un 20 %, 25 %, 30 %, 35 %, 40 %, 45 % o 50 % de bases diana con sesgo de cadena.
Los términos "relación de señal con respecto a ruido" o "SNR" se refieren a la relación entre la potencia de la señal con respecto a la potencia del ruido. Generalmente, SNR es un método para medir una señal deseada en comparación con el nivel de ruido de fondo. En algunos ejemplos, la "relación de señal con respecto a ruido" puede referirse a la relación de la potencia de la señal obtenida durante una corrida de secuenciación en comparación con el ruido de fondo de la misma corrida de secuenciación. En algunos ejemplos, la presente solicitud describe métodos, kits, aparatos y composiciones que proporcionan un medio para incrementar la relación de señal con respecto a ruido. En algunos ejemplos, en la presente descripción se proporciona un método para realizar la secuenciación de ácidos nucleicos que comprende poner en contacto una polimerasa modificada con una plantilla de ácido nucleico en presencia de uno o más nucleótidos, donde la polimerasa modificada incluye una o más modificaciones de aminoácidos en relación con una polimerasa de referencia y tiene un incremento de la relación de señal con respecto a ruido con respecto a la polimerasa de referencia que no tiene una o más mutaciones de aminoácidos, y polimeriza al menos uno de los uno o más nucleótidos mediante el uso de la polimerasa modificada.
Señal clave es la cantidad de señal generada mediante un sistema de secuenciación al secuenciar una secuencia de control conocida que se añade al extremo 5' de una secuencia de interés durante la preparación de la muestra para una reacción de secuenciación. La señal clave depende de la tasa de generación de protones (que está directamente relacionada con la tasa de incorporación de nucleótidos) y la cantidad de amortiguamiento en el sistema. Un incremento de la tasa de incorporación debería incrementar la señal clave, mientras que un incremento del amortiguamiento debería disminuir la señal. Planteamos la hipótesis de que, dado que las histidinas tienen un pKa de 6,5, podrían ser una fuente significativa de amortiguamiento cuando están presentes en una enzima usada en una reacción de secuenciación. Por lo tanto, planteamos la hipótesis de que la eliminación de histidinas podría
proporcionar un incremento de la señal en un sistema de secuenciación de detección de iones tal como el sistema Ion Torrent. Como se demuestra en los Ejemplos de la presente descripción, algunas de las polimerasas mutantes de la invención proporcionan un incremento de la señal, tal como las sustituciones H473G y H528T, numeradas con referencia a la SEQ ID NO: 1.
En algunas modalidades, en la presente descripción se proporcionan composiciones, métodos, sistemas, aparatos y kits que comprenden polimerasas modificadas que se caracterizan por un incremento de la capacidad de procesamiento, longitud de lectura (incluida la longitud de lectura sin errores), rendimiento total de secuenciación y/o precisión en comparación con sus contrapartes no modificadas (por ejemplo, polimerasa de referencia), así como también a métodos para producir y usar tales polimerasas modificadas en una amplia variedad de reacciones biológicas y químicas tales como polimerización de nucleótidos, extensión del cebador, generación de bibliotecas de ácidos nucleicos y reacciones de secuenciación de ácidos nucleicos. En algunas modalidades, en la presente descripción se proporcionan composiciones, métodos, sistemas, aparatos y kits que comprenden polimerasas modificadas que se caracterizan por una disminución del sesgo de cadena y/o un error sistemático en comparación con sus contrapartes no modificadas (por ejemplo, polimerasa de referencia), así como también métodos para fabricar y usar tales polimerasas modificadas en una amplia variedad de reacciones biológicas y químicas tales como polimerización de nucleótidos, extensión del cebador, generación de bibliotecas de ácidos nucleicos y reacciones de secuenciación de ácidos nucleicos. En algunas modalidades, las polimerasas modificadas incluyen una o más mutaciones de aminoácidos (por ejemplo, sustituciones, adiciones o eliminaciones de aminoácidos) con respecto a sus equivalentes no modificados correspondientes. En algunas modalidades, el término precisión como se usa en la presente descripción puede medirse al determinar la tasa de incorporación de un nucleótido correcto durante la polimerización en comparación con la tasa de incorporación de un nucleótido incorrecto durante la polimerización. En algunas modalidades, la tasa de incorporación de un nucleótido incorrecto puede ser mayor que 0,3, 0,4, 0,5, 0,6, 0,7 segundos o más en condiciones salinas elevadas (solución de alta fuerza iónica) en comparación con las condiciones salinas estándar (bajas). Sin desear limitarse a ninguna teoría en particular, los solicitantes han descubierto que la presencia de un nivel elevado de sal durante la polimerización ralentiza la tasa de incorporación del nucleótido incorrecto, produciendo de este modo una constante de incorporación más lenta para el nucleótido incorrecto. En algunas modalidades, una polimerasa modificada de la descripción tiene una precisión mejorada en comparación con una polimerasa relativa, opcionalmente la polimerasa modificada o un fragmento biológico de la misma tiene una precisión mejorada (en comparación con una polimerasa relativa) en presencia de una solución de alta fuerza iónica.
En algunas modalidades, en la presente descripción se proporciona una polimerasa modificada que retiene la actividad de polimerasa en presencia de una solución de alta fuerza iónica. En algunas modalidades, la solución de alta fuerza iónica es de 125 mM de sal a 175 mM de sal tal como KCl y/o NaCl. Será evidente para el experto en la técnica que pueden usarse varias otras sales adecuadas en lugar, o en combinación con KCl y/o NaCl. La solución de fuerza iónica puede incluir además un sulfato.
En algunas modalidades, la polimerasa modificada puede amplificar y/o secuenciar una molécula de ácido nucleico en presencia de una solución de alta fuerza iónica. En algunas modalidades, una polimerasa modificada es capaz de amplificar (y/o secuenciar) una molécula de ácido nucleico en presencia de una solución de alta fuerza iónica en mayor medida (por ejemplo, medida por la precisión) que una polimerasa de referencia que carece de uno o más de las mismas mutaciones (o mutaciones homólogas) en condiciones idénticas. En algunas modalidades, una polimerasa modificada es capaz de amplificar (y/o secuenciar) una molécula de ácido nucleico en presencia de una solución de alta fuerza iónica a una mayor capacidad (por ejemplo, medida por la precisión) que una polimerasa de referencia que carece de una o más de las mutaciones (o mutaciones homólogas) en condiciones estándar de fuerza iónica (es decir, menor fuerza iónica en comparación con una solución de alta fuerza iónica).
La descripción generalmente se refiere a una polimerasa modificada o un fragmento biológicamente activo de la misma que puede realizar la polimerización de nucleótidos o la incorporación de nucleótidos en presencia de condiciones salinas elevadas (exceso de 120 mM de sal) en comparación con una polimerasa de referencia.
La descripción generalmente se refiere a una polimerasa modificada o un fragmento biológicamente activo de la misma que tiene un incremento de la precisión o incremento de la constante de tiempo de disociación en presencia de condiciones salinas elevadas (exceso de 120 mM de sal) en comparación con una polimerasa de referencia.
La descripción generalmente se refiere a una polimerasa modificada o un fragmento biológico de la misma que puede detectar un cambio en la concentración de iones durante la polimerización de nucleótidos en presencia de condiciones salinas elevadas (exceso de 120 mM de sal) en comparación con una polimerasa de referencia.
La descripción generalmente se refiere a una polimerasa modificada o un fragmento biológicamente activo de la misma que puede amplificarse o puede usarse en una reacción de secuenciación de ácidos nucleicos en presencia de condiciones salinas elevadas (en exceso de 120 mM de sal).
En algunas modalidades, la descripción generalmente se refiere a una polimerasa modificada o un fragmento biológicamente activo de la misma que produce un incremento de la precisión en una reacción de secuenciación de ácidos nucleicos en comparación con una polimerasa de referencia.
En algunas modalidades, la descripción generalmente se refiere a una ADN polimerasa mutante, típicamente recombinante, o un fragmento biológicamente activo de la misma, que produce una precisión mejorada y/o un incremento de la constante de tiempo de disociación y/o menores tasas de error sistemático en comparación con una polimerasa de control en condiciones idénticas. Esas condiciones pueden incluir 120 mM de sal, o incluso exceso de 120 mM de sal, tal como 120 mM a 200 mM de sal, tal como NaCl y/o KCl.
La polimerasa de control o de referencia discutida a lo largo de la descripción e ilustrada en la sección de Ejemplos, puede tener una o más de las mutaciones, pero no tiene todas las mutaciones de las polimerasas de la invención. Por ejemplo, la polimerasa de control es un fragmento de ADN polimerasa Bst recombinante que tiene la secuencia de la polimerasa Bst de tipo silvestre, así como también las mutaciones H46R, E446Q y H572R (numeración de posición relativa al fragmento de ADN polimerasa Bst de la SEQ ID NO: 1). Estas mutaciones se denominan a veces en la presente descripción mutaciones amortiguadoras centrales. Por ejemplo, la SEQ ID NO: 2 es un fragmento de polimerasa Bst de 581 aminoácidos que puede usarse como polimerasa de referencia y que incluye estas mutaciones. Una versión de longitud completa (876 aminoácidos) de la polimerasa Bst que tiene estas mismas 3 mutaciones amortiguadoras centrales, que puede usarse como polimerasa de referencia, es la SEQ ID NO: 122. Una polimerasa de referencia puede ser una polimerasa Bst que tiene una secuencia de polimerasa Bst de tipo silvestre excepto por las 3 mutaciones amortiguadoras centrales más 3 mutaciones adicionales: H281M, D423K y N487R (numeración de posición con relación a la SEQ ID NO: 1). Un fragmento de polimerasa Bst de 581 aminoácidos que tiene estas 6 mutaciones en una secuencia de fondo de tipo silvestre es la SEQ ID NO:35. Una versión de longitud completa (876 aminoácidos) de este polipéptido Bst de control con estas 6 mutaciones es la SEQ ID NO: 120.
La descripción generalmente se refiere a una ADN polimerasa recombinante o un fragmento biológico de la misma que puede detectar un cambio en la concentración de iones durante la polimerización de nucleótidos en presencia de al menos 120 mM de sal.
La descripción generalmente se refiere a una ADN polimerasa recombinante o un fragmento biológicamente activo de la misma que puede amplificar un polinucleótido o puede usarse en un método para obtener información de secuencia de ácido nucleico en presencia de al menos o en exceso de 120 mM de sal. Por ejemplo, una polimerasa modificada, mutante y/o recombinante de la presente invención puede usarse en una reacción de secuenciación de alto rendimiento, especialmente una reacción de secuenciación que implica la generación y liberación de iones de hidrógeno y la detección de esos iones.
La Tabla 2 enumera ciertos fragmentos de 581 aminoácidos y polimerasas Bst de longitud completa a las que se hace referencia en esta descripción.
Tabla 2
Todos los mutantes del fragmento de ADN polimerasa Bst de 581 aminoácidos proporcionados en la presente descripción tienen los mismos 581 aminoácidos del extremo C-terminal de la SEQ ID NO: 1, excepto las mutaciones que se indican en esta descripción (por ejemplo, en la Tabla 2) y en la lista de secuencias presentada aquí.
La SEQ ID NO: 35 incluye seis sustituciones de aminoácidos en relación con la SEQ ID NO: 1, a saber, H46R, E446Q, H572R, H281M, D423K y N487R, donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1.
La SEQ ID NO: 119 incluye nueve sustituciones de aminoácidos en relación con la SEQ ID NO: 1, a saber, H46R, E446Q, H572R, H281M, D423K, N487R, L252R, H528T y H473G, donde la numeración es con relación a la secuencia de aminoácidos de SEQ ID NO: 1.
Cada una de las SEQ ID No: 79-118 incluye las mutaciones H46R, E446Q, H572R, H281M, D423K, N487R y una mutación adicional, como se indica en la Tabla 2.
Cada una de las SEQ ID NO: 38 - 77 incluye las mutaciones H576M, D718K y N782R, y una mutación adicional, como se indica en la Tabla 2.
La SEQ ID NO: 31 incluye tres sustituciones de aminoácidos en relación con la SEQ ID NO: 16, a saber, H576M, D718K y N782R, donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16.
La SEQ ID NO: 120 incluye seis sustituciones de aminoácidos en relación con la SEQ ID NO: 16, a saber, H341R, E741Q, H867R, H576M, D718K y N782R, donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16.
La SEQ ID NO: 121 incluye nueve sustituciones de aminoácidos en relación con la SEQ ID NO: 16, a saber, H341R, E741Q, H867R, H576M, D718K, N782R, L547R, H768G y H823T donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16.
La SEQ ID NO: 122 incluye tres sustituciones de aminoácidos en relación con la SEQ ID NO: 16, a saber, H341R, E741Q y H867R, donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16.
El fragmento grande de la ADN polimerasa Bst tiene una longitud de 581 residuos de aminoácidos y contiene los residuos de 581 aminoácidos C terminal de la ADN polimerasa Bst de longitud completa. La ADN polimerasa Bst de longitud completa es una enzima de 876 aminoácidos. En consecuencia, para identificar los números de residuos correspondientes a las sustituciones de aminoácidos en el fragmento grande en la secuencia de ADN polimerasa Bst de longitud completa, se debe añadir 295 al número de residuos.
La presente invención en modalidades ilustrativas proporciona una ADN polimerasa mutante aislada de origen no natural que es típicamente una ADN polimerasa recombinante, o un fragmento biológicamente activo de la misma, así como también composiciones, kits y métodos que incluyen la ADN polimerasa mutante (por ejemplo, recombinante) o el fragmento biológicamente activo de la misma, donde la polimerasa mutante tiene un segmento polipeptídico que tiene al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la SEQ ID NO: 1 o un fragmento de la misma, muestra actividad de polimerasa e incluye H46R, E446Q, H572R, H281M, D423K y N487R, donde la numeración es con relación a la SEQ ID NO: 1, e incluye además (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. La ADN polimerasa mutante (por ejemplo, recombinante) puede producir una tasa de error más baja (por ejemplo, tasa de error sistemático promedio), mejora de la precisión, incremento de la relación de señal con respecto a ruido y/o cualquiera de las propiedades específicas demostradas en los Ejemplos proporcionados en la presente descripción, cuando se usa en una reacción de secuenciación por síntesis en comparación con la tasa de error sistemático promedio obtenida mediante el uso de una polimerasa Bst de referencia, tal como la polimerasa Bst de tipo silvestre de la SEQ ID NO: 1 o la SEQ ID NO: 16, la polimerasa Bst mutante de la SEQ ID NO: 2 o la SEQ ID NO: 122, la polimerasa Bst mutante de la SEQ ID NO: 35 o la SEQ ID NO: 120, o cualquiera de las propiedades mejoradas para estas polimerasas proporcionadas en los Ejemplos de la presente descripción. La reacción de secuenciación por síntesis en la que la polimerasa tiene propiedades mejoradas en ejemplos ilustrativos, es una reacción de secuenciación en la que se liberan y detectan iones de hidrógeno. La polimerasa mutante (por ejemplo, recombinante) incluye sustituciones de aminoácidos H46R, E446Q y H572R, en modalidades ilustrativas, y/o puede incluir mutaciones H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1. En modalidades ilustrativas, la ADN polimerasa mutante (por ejemplo, recombinante) no tiene actividad de exonucleasa de 5' a 3' y/o actividad de exonucleasa de 3' a 5'. En modalidades ilustrativas, la ADN polimerasa mutante (por ejemplo, recombinante) no comprende segmentos de ADN polimerasa Bst de tipo silvestre que tienen actividad de exonucleasa de 3' a 5' y/o actividad de exonucleasa de 5' a 3'. Las propiedades mejoradas generadas por las polimerasas de la invención cuando se usan en una reacción de secuenciación basada en iones pueden ser, como ejemplos no limitantes, mejoras medidas y/o estadísticamente significativas en uno o más errores sistemáticos promedio (SSE prom) o longitud de lectura media (MRL) de AQ20 promedio, señal clave (como una medida de la intensidad de la señal), longitud de lectura sin procesar, precisión de lectura absoluta promedio y precisión verdadera para homopolímero ACGT de 6 pb o 7 pb.
La ADN polimerasa mutante (por ejemplo, recombinante) en los ejemplos ilustrativos incluye uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO:1. En consecuencia, en ciertos ejemplos proporcionados en la presente descripción, la ADN polimerasa mutante (por ejemplo, recombinante) aislada tiene al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o un fragmento de la misma, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ilustrativa que tiene tales mutaciones, el mutante de origen no natural tiene la secuencia de la SEQ ID NO: 119.
El segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) aislada en las modalidades proporcionadas anteriormente puede ser al menos un 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante) y tiene al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 16. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades muestra actividad de polimerasa, incluye, en submodalidades ilustrativas, sustituciones de aminoácidos H341R, E741Q, H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. La polimerasa mutante puede tener cualquiera de las propiedades mejoradas proporcionadas en los Ejemplos de la presente descripción. Por ejemplo, las polimerasas mutantes aisladas (por ejemplo, recombinantes) proporcionadas en la presente descripción pueden
tener una reducción estadísticamente significativa en el error sistemático y/o una tasa de error sistemático que está entre 5, 10, 15, 20, 25, 30, 35, 40, 45, o 50 % en el extremo inferior del intervalo y 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 75, 80, 85 o 90 % en el extremo superior del intervalo, menor que el SSE promedio obtenido mediante el uso de un polipéptido de referencia tal como la SEQ ID NO: 1, SEQ ID nO: 2, SEQ iD NO: 35, SEQ ID NO: 16, SEQ ID NO: 120 o SEQ ID NO: 122. En modalidades ilustrativas, una polimerasa mutante aislada (por ejemplo, recombinante) proporcionada en la presente descripción puede tener una reducción estadísticamente significativa en el error sistemático y/o una tasa de error sistemático que está entre 5, 10, 15, 20 y 25 % en el extremo inferior del intervalo y 10, 15, 20, 25, 30, 35, 40, 45 y 50 % en el extremo superior del intervalo, más bajo que el SSE promedio obtenido mediante el uso de la SEQ ID NO: 35 como una polimerasa de referencia. En ejemplos ilustrativos de los intervalos anteriores, el SSE se mide como porcentaje de errores estocásticos en motivos de secuencia que contienen homopolímeros de longitud 1-6, con eliminación sistemática que se produce en la cadena con una frecuencia mayor que el 15 %, cuando la cobertura (del experimento de secuenciación) es igual o mayor a 20x. En alguna modalidad, la polimerasa mutante aislada de la presente invención tiene una longitud de lectura media (MRL) en aq20 promedio que es al menos 5, 10 o 15 nucleótidos más larga, o entre 5, 10, 15 o 25 nucleótidos más larga en el extremo corto del intervalo, y 20, 25, 30, 40, 50, 60, 75 o 100 nucleótidos más largos en el extremo superior del intervalo, más larga que la SEQ ID NO: 35 o SEQ ID NO: 120 especialmente para mutantes de longitud completa; o 5, 10, 15, 20, 25, 30, 35, 40, 45 o 50 % más larga que la SEQ ID NO: 35 o SEQ ID NO: 120 especialmente para mutantes de longitud completa, o está entre 5, 10, 15, 20, 25, 30, 35 y 40 % más larga que la SEQ ID NO: 35 o Se Q ID NO: 120 en el extremo inferior del intervalo, y 10, 15, 20, 25, 30, 35 y 40, 45, o 50 % más larga que la SEQ ID NO: 35 o SEQ ID NO: 120 para mutantes de longitud completa, en el extremo superior del intervalo. En algunas modalidades, la polimerasa mutante aislada de la invención tiene un incremento estadísticamente significativo en la señal máxima generada a partir de un polipéptido de control tal como SEQ ID NO: 35, o tiene un incremento de la señal máxima de al menos 5, 10, 15 o 20 %, o entre 5 y 10 en el extremo inferior del intervalo, y 10, 20, 25, 30, 40 o 50 % en el extremo superior del intervalo, en comparación con la SEQ ID NO: 35 o SEQ ID NO: 120 para mutantes de longitud completa. En ciertas modalidades ilustrativas, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T (numeración de acuerdo con la SEQ ID NO: 16, aunque la polimerasa puede ser un fragmento de polimerasa Bst 581 mutante y más largo, hasta una polimerasa Bst de longitud completa mutante), y puede ser 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % idéntica a la SEQ ID NO: 119 o SEQ ID NO: 121. En algunas de estas modalidades, la polimerasa mutante aislada tiene una precisión para el homopolímero ACGT 6bp de al menos 80 u 85 % o para un homopolímero de ACGT 6bp o 7bp que es estadísticamente significativamente mayor que, o al menos 5 %, 10 %, 15 %, 20 % o 25 % mayor que la precisión obtenida mediante el uso de la SEQ ID NO: 35 o SEQ ID NO: 35 con L252R como una polimerasa de referencia, o para longitud completa, SEQ ID NO: 120 o SEQ ID NO: 120 con L547R como una referencia. En una modalidad ilustrativa que tiene tales mutaciones y propiedades, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121.
Como se indica en la presente descripción, el segmento polipeptídico de la ADN polimerasa Bst mutante (por ejemplo, recombinante) puede ser al menos un 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99% o 100% de la ADN polimerasa mutante (por ejemplo, recombinante). Por consiguiente, la ADN polimerasa mutante (por ejemplo, recombinante) puede incluir el fragmento de 581 aminoácidos proporcionado en la presente descripción como la ADN polimerasa mutante (por ejemplo, recombinante) completa, o como una porción de la polimerasa mutante. Por ejemplo, la polimerasa mutante puede ser una ADN polimerasa Bst de longitud completa que incluye cualquiera de los fragmentos de ADN polimerasa Bst de 581 aminoácidos mutante proporcionados en la presente descripción, o una ADN polimerasa Bst mutante que incluye cualquier número de aminoácidos contiguos de polimerasa Bst de tipo silvestre de la ADN polimerasa de longitud completa de 876 aminoácidos añadidos al fragmento de 581 aminoácidos de la ADN polimerasa Bst mutante. Para calcular el por ciento de un polipéptido recombinante que es un segmento de polipéptido, típicamente divida el número de residuos de aminoácidos en el segmento por el número de residuos de aminoácidos en la ADN polimerasa mutante completa. Como se explica con más detalle en la presente descripción, se cree que tales ADN polimerasas Bst mutantes que incluyen los fragmentos de ADN polimerasa Bst mutante de 581 aminoácidos proporcionados en la presente descripción y aminoácidos adicionales de la ADN polimerasa Bst de tipo silvestre de longitud completa, conservarán las propiedades mejoradas demostradas en los Ejemplos de la presente descripción para aquellos fragmentos de ADN polimerasa Bst de 581 aminoácidos mutante. Además, tales ADN polimerasas Bst mutantes pueden incluir secuencias adicionales, tales como secuencias de histidina 6X u otras etiquetas de purificación. Como tales, las ADN polimerasas Bst mutantes proporcionadas en la presente descripción pueden ser proteínas de fusión.
En modalidades ilustrativas, la polimerasa mutante (por ejemplo, recombinante) incluye aminoácidos adicionales de la ADN polimerasa Bst de longitud completa, pero no incluye segmentos funcionales de la polimerasa Bst de tipo silvestre que poseen actividad de exonucleasa de 5' a 3' y/o actividad de exonucleasa de 3' a 5'. En consecuencia, en las modalidades ilustrativas de la presente descripción, las ADN polimerasas de Bst mutantes no tienen actividad de exonucleasa de 5' a 3' y/o actividad de exonucleasa de 3' a 5'. En modalidades ilustrativas, la polimerasa mutante (por ejemplo, recombinante) no comprende segmentos de ADN polimerasa Bst de tipo silvestre que tienen actividad de exonucleasa de 3' a 5' y/o actividad de exonucleasa de 5' a 3'.
En algunas modalidades, una ADN polimerasa Bst mutante (por ejemplo, recombinante) proporcionada en la presente descripción incluye las mutaciones indicadas en la presente descripción, pero no incluye el fragmento completo de 581 aminoácidos de la ADN polimerasa Bst. Por ejemplo, tales ADN polimerasas de Bst mutantes
pueden incluir 250, 300, 400, 500, 550, 560, 570, 575, 576. 577. 578. 579 o 580 aminoácidos contiguos de los fragmentos de ADN polimerasa Bst de 581 aminoácidos mutante proporcionados en la presente descripción. En algunas modalidades, un fragmento biológicamente activo de una polimerasa modificada puede incluir al menos 25 residuos de aminoácidos contiguos del dominio catalítico o el dominio de unión al ADN de la ADN polimerasa Bst.
En algunas modalidades, la descripción generalmente se refiere a una ADN polimerasa mutante opcionalmente modificada y típicamente recombinante que tiene al menos un 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con relación a la SEQ ID NO: 2, SEQ ID NO: 31, SEQ ID NO: 35, SEQ ID NO: 78, SEQ ID NO: 120 o SEQ ID NO: 122, o un fragmento del mismo, e incluye H341R, E741Q, H867R, H576M, D718K y N782R, e incluye además una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E325k , G504Q, E515H, E515K o E515T, N529K o N529R, P531I o P531R, V536K, E540R, V546R, L547R, S555K, D559K o D559M, E562M o E562K o E562R, E572T, E589K, T619R, E620R, A639Y, E737R o E737Y, E751R, D775L o D775R, N780R, A787K, E788G o E788R, M790C, N812C o N812K y E817C, en donde la numeración es con relación a la SEQ ID NO: 16; o una o más sustituciones de aminoácidos seleccionadas de L547R; L547R y H823T; L547R y H768G; o L547R, H823T y H768G, en donde la numeración es con relación a la SEQ ID NO: 16 y donde la AdN polimerasa recombinante o un fragmento de la misma produce una precisión mejorada y/o una tasa de error sistemático reducida en comparación con la SEQ ID NO: 2, SEQ ID NO: 31, SEQ ID NO: 35, SEQ ID NO: 78, SEQ ID NO: 120 o SEQ ID NO: 122, respectivamente. En ciertos ejemplos, una polimerasa mutante opcionalmente modificada y típicamente recombinante de la presente invención es una ADN polimerasa Bst mutante que incluye las 3 mutaciones amortiguadoras centrales H341R, E741Q y H867R (numeración de posición con relación a la s Eq ID NO: 16) así como también las mutaciones: H576M, D718K, N782R (numeración de posición con relación a la SEQ ID NO: 16).
En algunas modalidades, la descripción generalmente se refiere a una ADN polimerasa recombinante que tiene al menos un 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 35 o un fragmento de la misma, e incluye H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1, e incluye además (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste de E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1 en donde la numeración es con relación a la SEQ ID NO: 1, y donde la ADN polimerasa recombinante o fragmento de la misma produce precisión mejorada y/o tasa de error sistemático reducida en comparación con SEQ ID NO: 35. En ciertos ejemplos ilustrativos, una polimerasa mutante opcionalmente modificada y típicamente recombinante, de la presente invención es una ADN polimerasa Bst mutante que incluye las 3 mutaciones amortiguadoras centrales H46R, E446Q y H572R (numeración de posición con relación a la SEQ ID NO: 1). En otras modalidades ilustrativas, una polimerasa mutante opcionalmente modificada y típicamente recombinante de la presente invención incluye las 3 mutaciones amortiguadoras centrales H46R, E446Q y H572R (numeración de posición con relación a la SEQ ID NO: 1) así como también las mutaciones: H281M, D423K y N487R (numeración de posición con relación a la SEQ ID NO: 1).
En algunas modalidades, la descripción generalmente se refiere a la ADN polimerasa mutante (por ejemplo, recombinante) de origen no natural que tiene al menos un 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1 o un fragmento de la misma, muestra actividad de polimerasa e incluye H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1, e incluye además (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473g y H528T, en donde la numeración es con relación a SEQ ID NO: 1 La Ad N polimerasa recombinante o fragmento de la misma produce una precisión mejorada y/o una tasa de error sistemático reducida en comparación con la SEQ ID NO: 1.
En la presente descripción se proporcionan métodos, composiciones, sistemas y kits que incluyen el uso de polimerasas mutantes recombinantes de la presente invención en reacciones de polimerización de nucleótidos, incluidas las reacciones de polimerización de nucleótidos en donde la información de secuencia se obtiene a partir de una molécula de ácido nucleico o en reacciones de amplificación clonal, incluidas la síntesis de bibliotecas de ácidos nucleicos. En algunas modalidades, la descripción se refiere a métodos para usar polimerasas modificadas o recombinantes en reacciones de secuenciación de ácidos nucleicos basadas en iones, en donde la información de secuencia se obtiene de un ácido nucleico plantilla mediante el uso de un sistema de secuenciación basado en iones. En la presente descripción se proporcionan composiciones, métodos, sistemas, kits y aparatos para llevar a cabo una pluralidad de reacciones de secuenciación de ADN sin etiquetas (por ejemplo, reacciones de secuenciación basadas en iones) mediante el uso de una matriz a gran escala de sensores electrónicos, por ejemplo, transistores de efecto de campo ("FET").
La descripción se refiere a métodos para usar polimerasas mutantes proporcionadas en la presente descripción durante la amplificación de ácidos nucleicos en una reacción de secuenciación, en donde la información de la secuencia se obtiene de la amplificación de los ácidos nucleicos mediante el uso de un sistema de secuenciación basado en un soporte sólido (por ejemplo, secuenciación basada en PCR en puente). La descripción generalmente se refiere a métodos para amplificar uno o más ácidos nucleicos mediante el uso de un sistema de soporte sólido, amplificando de este modo clonalmente los ácidos nucleicos en el soporte sólido.
En otra modalidad del método la polimerasa mutante o un fragmento biológicamente activo de la misma tiene la secuencia de aminoácidos de SEQ ID NO: 80, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 96, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117, SEQ ID NO: 118 o SEQ ID NO: 119.
En otro aspecto de la invención, se proporciona un método para realizar una reacción de polimerización, que incluye lo siguiente: (a) poner en contacto una ADN polimerasa mutante de origen no natural (por ejemplo, recombinante), o un fragmento biológicamente activo de la misma, con un ácido nucleico en presencia de uno o más nucleótidos; y (b) polimerizar al menos uno del uno o más nucleótidos mediante el uso de la ADN polimerasa mutante (por ejemplo, recombinante). La ADN polimerasa mutante (por ejemplo, recombinante) en tal método puede incluir un segmento polipeptídico que tenga al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1 o un fragmento del mismo, muestra actividad de polimerasa, incluye H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1, e incluye además (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1 La polimerasa recombinante usada en tal método puede tener la propiedad, en modalidades ilustrativas, de producir una tasa de error sistemático más baja y/o una precisión más alta, cuando se usa en una reacción de secuenciación por síntesis en comparación con una polimerasa de referencia. La reacción de secuenciación por síntesis de los ejemplos ilustrativos es una reacción en la que se generan y detectan iones de hidrógeno. La polimerasa mutante (por ejemplo, recombinante) usada en el método en modalidades ilustrativas incluye sustituciones de aminoácidos H46R, E446Q y H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1. La sal puede incluirse en una mezcla de reacción en la que se produce el contacto. La mezcla de reacción puede incluir la sal, por ejemplo a una concentración de entre 50 y 250 mM, o entre 100 mM y 200 mM, o entre 120 y 200 mM, o en exceso de 120 mM, tal como entre 125 mM y 250 mM, o entre 125 mM y 175 mM. La sal en los ejemplos ilustrativos es KCI y/o NaCl.
La ADN polimerasa mutante (por ejemplo, recombinante) en el método para realizar una reacción de polimerización proporcionada anteriormente, en ejemplos ilustrativos, incluye uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la s Eq ID NO:1. En consecuencia, en ciertos ejemplos ilustrativos proporcionados en la presente descripción, la ADN polimerasa mutante (por ejemplo, recombinante) usada en el método para realizar una reacción de polimerización tiene al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, o 99 % de identidad con la SEQ ID NO: 1, o un fragmento de la misma, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y H528T en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ejemplar que tiene tales mutaciones, la ADN polimerasa mutante no natural (por ejemplo, recombinante) tiene la secuencia de la SEQ ID NO: 119.
El segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en el método para polimerizar las modalidades proporcionadas anteriormente, puede ser al menos 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante), y tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 16. La ADN polimerasa mutante (por ejemplo, recombinante) en tales métodos para polimerizar submodalidades, muestra actividad de polimerasa, incluye sustituciones de aminoácidos H341R, E741Q y H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades ilustrativas, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En un método ilustrativo para la modalidad de polimerización en donde la ADN polimerasa mutante (por ejemplo, recombinante) tiene tales mutaciones, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121.
En otro aspecto de la invención, se proporciona un método para amplificar un ácido nucleico, que incluye lo siguiente: (a) poner en contacto un ácido nucleico en presencia de uno o más nucleótidos, con una a Dn polimerasa mutante de origen no natural (por ejemplo, recombinante) de la invención La polimerasa mutante (por ejemplo, recombinante) usada en tal método, tiene la propiedad en modalidades ilustrativas, de producir una menor tasa de error sistemático y/o una mayor precisión, cuando se usa en una reacción de secuenciación por síntesis en
comparación con una referencia polimerasa. La reacción de secuenciación por síntesis de los ejemplos ilustrativos es una reacción en la que se generan y detectan iones de hidrógeno. La polimerasa mutante (por ejemplo, recombinante) usada en el método en los ejemplos ilustrativos incluye sustituciones de aminoácidos h46R, E446Q, and H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1. La sal puede incluirse en una mezcla de reacción en la que se produce el contacto. La mezcla de reacción puede incluir una sal, por ejemplo a una concentración de entre 50 y 250 mM, o entre 100 mM y 200 mM, o entre 120 mM a 200 mM, o entre 120 y 200 mM, o en exceso de 120 mM, tal como entre 125 mM y 250 mM, o entre 125 mM y 175 mM. La sal en los ejemplos ilustrativos es KCI y/o NaCl.
La ADN polimerasa mutante (por ejemplo, recombinante) en el método para amplificar un ácido nucleico proporcionado anteriormente, en ejemplos ilustrativos incluye uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO:1. En consecuencia, en ciertos ejemplos, proporcionados en la presente descripción, la ADN polimerasa mutante en la ADN polimerasa recombinante y las modalidades relacionadas tienen al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o un fragmento del mismo, muestra actividad de polimerasa, incluye sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y H528T en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ilustrativa que tiene tales mutaciones, el mutante de origen no natural tiene la secuencia de la SEQ ID NO: 119.
En submodalidades adicionales, el segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en el método para amplificar las modalidades proporcionadas anteriormente, puede ser al menos 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante), y tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, o 99 % de identidad con SEQ ID NO: 1, o al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 16, que es la polimerasa Bst de tipo silvestre de longitud completa. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades muestra actividad de polimerasa, incluye sustituciones de aminoácidos H341R, E741Q y H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En una modalidad ilustrativa que tiene tales mutaciones, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121
En determinadas modalidades, el método de amplificación es una reacción en cadena de la polimerasa, una reacción en cadena de la polimerasa en emulsión, una reacción de amplificación isotérmica, una reacción de amplificación de la polimerasa recombinasa, una reacción de amplificación por ligamiento de proximidad, una reacción de amplificación por círculo rodante o una reacción de amplificación por desplazamiento de cadena. En ciertas modalidades, la amplificación consiste en amplificar clonalmente el ácido nucleico en solución o en un soporte sólido.
En otro aspecto de la invención, se proporciona un método para obtener información de secuencias a partir de una plantilla de ácido nucleico, que incluye lo siguiente: (a) proporcionar una mezcla de reacción que comprende un ácido nucleico plantilla, un cebador de secuenciación, uno o más nucleótidos y una ADN polimerasa mutante de origen no natural (por ejemplo, recombinante); (b) poner en contacto el ácido nucleico plantilla con al menos un tipo de nucleótido, en donde el contacto incluye incorporar uno o más nucleótidos del al menos un tipo de nucleótido en el extremo 3' del cebador de secuenciación y generar un producto de cebador extendido mediante el uso de la ADN polimerasa mutante (por ejemplo, recombinante); y (c) detectar la presencia del cebador extendido en la mezcla de reacción detectando la generación y/o liberación de un ion tal como un ion hidrógeno o la detección de un ion pirofosfato o fosfato, lo que determina de este modo si se ha producido la incorporación de nucleótidos. La ADN polimerasa mutante (por ejemplo, recombinante) en tal método puede incluir un segmento polipeptídico que tenga al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1 o un fragmento del mismo, muestra actividad de polimerasa, incluye H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1, e incluye además (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. La polimerasa recombinante usada en tal método, en modalidades ilustrativas, puede producir una menor tasa de error sistemático y/o una mayor precisión, cuando se usa en una reacción de secuenciación por síntesis en comparación con una polimerasa de referencia. La reacción de secuenciación por síntesis de los ejemplos ilustrativos es una reacción en la que se generan y detectan iones de hidrógeno. La mezcla de reacción puede incluir una sal, por ejemplo a una concentración de entre 50 y 250 mM, o entre 100 mM y 200 mM, o entre 120 y 200 mM, o en exceso de 120 mM, tal como entre 125 mM y 250 mM, o entre 125 mM y 175 mM. La sal en los ejemplos ilustrativos es KCI y/o NaCl. El método puede ser un método de secuenciación de alto rendimiento.
La ADN polimerasa mutante (por ejemplo, recombinante) en el método para obtener información de secuencia a partir de una plantilla de ácido nucleico proporcionada anteriormente, en ejemplos ilustrativos, incluye uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO:1. En consecuencia, en ciertos ejemplos proporcionados en la presente descripción, la ADN polimerasa mutante en la ADN polimerasa recombinante y las modalidades relacionadas tienen al menos un 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99% de identidad con SEQ ID NO: 1, o un fragmento del mismo, muestra actividad de polimerasa, incluye sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO: 1,. En una modalidad ilustrativa del método para obtener información de secuencia, la ADN polimerasa mutante (por ejemplo, recombinante) que tiene tales mutaciones, tiene la secuencia de SEQ ID NO: 119.
En submodalidades adicionales del método para obtener información de secuencias a partir de una plantilla de ácido nucleico, el segmento polipeptídico de la a Dn polimerasa mutante (por ejemplo, recombinante) en las modalidades proporcionadas anteriormente, puede ser al menos 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante (por ejemplo, recombinante), y tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 16, que es polimerasa Bst de tipo silvestre de longitud completa. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades muestra actividad de polimerasa, incluye sustituciones de aminoácidos H341R, E741Q y H867R, H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En un método ejemplar para obtener información de secuencia, la ADN polimerasa mutante (por ejemplo, recombinante) que tiene tales mutaciones, tiene la secuencia de aminoácidos de SEQ ID NO: 121.
En determinadas modalidades del método para obtener información de secuencia a partir de una plantilla de ácido nucleico, el uno o más nucleótidos incorporados en el extremo 3' del cebador de secuenciación son nucleótidos terminadores reversibles.
En otras modalidades del método para obtener información de secuencia a partir de una plantilla de ácido nucleico, el contacto incluye generar uno o más iones de hidrógeno como subproducto de la incorporación de nucleótidos. Además, en estas u otras modalidades, la detección incluye medir una concentración de uno o más iones de hidrógeno generados como subproducto de la incorporación de nucleótidos. Además, el método en estas y otras modalidades puede incluir la identificación de al menos uno de los uno o más nucleótidos incorporados de al menos un tipo de nucleótido.
Además, en estas modalidades, las etapas de poner en contacto, detección e identificación pueden repetirse más de una vez, identificando de este modo una pluralidad de incorporaciones secuenciales de nucleótidos.
En algunas modalidades, la polimerasa mutante (por ejemplo, recombinante), o un fragmento biológico de la misma, se caracteriza por un cambio (por ejemplo, incremento o disminución) en cualquiera o más de las siguientes propiedades en relación con una polimerasa de control o de referencia, que es una polimerasa que no incluye una o más de las mutaciones en la polimerasa en prueba: constante de tiempo de disociación, tasa de disociación de la polimerasa de una plantilla de ácido nucleico dada (también denominada en la presente descripción "tasa off"), afinidad de unión de la polimerasa para una plantilla de ácido nucleico determinada, longitud de lectura promedio, longitud de lectura mínima, precisión, sesgo de cadena, precisión de lectura sin procesar, error sistemático, rendimiento total de secuenciación, rendimiento en sal (es decir, fuerza iónica), AQ20, longitud de lectura promedio sin errores, valor 100Q17, valor 200Q17 y capacidad de procesamiento.
Como se usa en la presente descripción, los términos "Q17" o "Q20" y sus variantes, cuando se usan en referencia a una polimerasa dada, se refieren a ciertos aspectos del rendimiento de polimerasa, en particular la precisión, en una reacción de polimerasa dada, por ejemplo, en una reacción de secuenciación por síntesis basada en polimerasa. Por ejemplo, en una reacción de secuenciación particular, las métricas de precisión pueden calcularse mediante algoritmos de predicción o mediante la alineación real con un genoma de referencia conocido. Las puntuaciones de calidad pronosticadas ("puntuaciones Q") pueden derivarse de algoritmos que observan las propiedades inherentes de la señal de entrada y hacen estimaciones bastante precisas con respecto a si una base única dada incluida en la "lectura" de secuencia se alineará. En algunas modalidades, tales puntuaciones de calidad predichas pueden ser útiles para filtrar y eliminar lecturas de menor calidad antes de la alineación corriente abajo. En algunas modalidades, la precisión puede informarse en términos de una puntuación Q similar a Phred que mide la precisión en una escala logarítmica tal que: Q10 = 90 %, Q17 = 98 %, q 20 = 99 %, Q30 = 99,9 %, Q40 = 99,99 % y Q50 = 99,999 %. Las puntuaciones de calidad de Phred ("Q") se definen como una propiedad que está relacionada logarítmicamente con las probabilidades de error de llamada de bases ("P"). Frecuentemente, la fórmula dada para calcular "Q" es Q = 10*log10(1/tasa de error). En algunas modalidades, los datos obtenidos de una reacción de polimerasa dada pueden filtrarse para medir solo las lecturas de polimerasa que miden "N" nucleótidos o más y tienen una puntuación Q que supera un cierto umbral, por ejemplo, Q10, Q17, Q100 (denominados en la presente descripción como la puntuación "NQ17"). Por ejemplo, la puntuación 100Q20 puede indicar el número de lecturas obtenidas de una reacción dada que tienen al menos 100 nucleótidos de longitud y tienen puntuaciones Q de Q20
(99 %) o más. De manera similar, la puntuación 200Q20 puede indicar la cantidad de lecturas que tienen al menos 200 nucleótidos de longitud y tienen puntuaciones Q de q 20 (99 %) o más.
En algunas modalidades, la precisión también puede calcularse en función de la alineación adecuada mediante el uso de una secuencia genómica de referencia, denominada en la presente descripción precisión "absoluta". Esta es la precisión de un solo paso, que implica la medición del error "verdadero" por base asociado con una sola lectura, a diferencia de la precisión de consenso, que mide la tasa de error de la secuencia consenso que es el resultado de múltiples lecturas. Las mediciones de precisión absoluta pueden informarse en términos de puntuaciones "AQ" (para calidad alineada). En algunas modalidades, los datos obtenidos de una reacción de polimerasa dada pueden filtrarse para medir solo las lecturas de polimerasa que miden "N" nucleótidos o más que tienen una puntuación AQ que supera un cierto umbral, por ejemplo, AQ10, AQ17, AQ100 (denominado en la presente descripción la puntuación "NAQ17"). Por ejemplo, la puntuación 100AQ20 puede indicar el número de lecturas obtenidas de una reacción de polimerasa dada que tienen al menos 100 nucleótidos de longitud y tienen puntuaciones AQ de AQ20 (99 %) o más. De manera similar, la puntuación 200AQ20 puede indicar el número de lecturas que tienen al menos 200 nucleótidos de longitud y tienen puntuaciones AQ de AQ20 (99 %) o más.
En algunas modalidades, la precisión de la polimerasa (incluida, por ejemplo, la precisión en una reacción de secuenciación dada) puede medirse en términos del número total de lecturas "perfectas" (es decir, cero errores) obtenidas de una reacción de polimerasa que son mayores de 100, 200, 300, 400, 500, 750, 1000, 5000, 10000, 100000 o más nucleótidos de longitud.
En algunas modalidades, la precisión de la polimerasa puede medirse en términos de la lectura perfecta más larga (típicamente medida en términos del número de nucleótidos incluidos en la lectura) que se obtiene de la reacción de polimerasa.
En algunas modalidades, la precisión de la polimerasa puede medirse en términos de incremento en veces en el rendimiento de secuenciación obtenido en una reacción de secuenciación dada. Por ejemplo, en algunas modalidades, una polimerasa recombinante ilustrativa de la presente solicitud puede tener un incremento de la precisión de 2 veces, 5 veces, 10 veces, 20 veces, 50 veces, 75 veces, 100 veces, 150 veces, 200 veces, 400 veces, 500 veces o más, en comparación con una polimerasa de referencia.
Algunas descripciones no limitantes ilustrativas de métricas de precisión pueden encontrarse en: Ewing B, Hillier L, Wendl MC, Green P. (1998): Base-calling of automated sequencer traces using phred. I. Accuracy assessment. Genome Res. 8(3):175-185; Ewing B, Green P. (1998): Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Res. 8(3):186-194; Dear S, Staden R (1992): A standard file format for data from DNA sequencing instruments. DNA Sequence, 3, 107-110; Bonfield JK, Staden R (1995): The application of numerical estimates of base calling accuracy to DNA sequencing projects. Nucleic Acids Res. 25 de abril de 1995; 23(8):1406-10.
En algunas modalidades, la precisión de secuenciación de un conjunto dado de polimerasas (incluyendo cualquiera de las polimerasas mutantes (por ejemplo, recombinantes) descritas en la presente descripción) puede medirse en una corrida de reacciones de secuenciación basada en iones donde se generan y detectan iones de hidrógeno; tales precisiones pueden compararse opcionalmente entre sí para determinar si una mutación de aminoácido dada incrementa o disminuye la precisión de la secuenciación en relación con una polimerasa de referencia o no modificada. En algunas modalidades, la precisión de secuenciación de una o más polimerasas puede medirse mediante el uso de cualquier aparato de secuenciación basado en iones suministrado por Ion Torrent Technologies (Ion Torrent Systems, Life Technologies, Carlsbad, California), incluido, por ejemplo, el Secuenciador Ion Torrent PGM™ (Ion Torrent Systems, Life Technologies, núm. de pieza 4462917), opcionalmente mediante el uso de los protocolos de secuenciación y los reactivos proporcionados por Ion Torrent Systems. Algunos ejemplos de cálculo de las métricas de precisión de una polimerasa dada mediante el uso de tales sistemas de secuenciación basados en iones se describen con más detalle en la Nota de aplicación de Ion Torrent titulada "Ion Torrent: Ion Personal Genome Machine™ Performance Overview, Performance Spring 2011".
Como se usa en la presente descripción, los términos "constante de tasa de disociación" y "constante de tiempo de disociación", cuando se usan en referencia a una polimerasa dada, se refieren a la constante de tiempo para la disociación ("koff") de una polimerasa de una plantilla de ácido nucleico bajo un definido conjunto de condiciones de reacción. Algunos ensayos ilustrativos para medir la constante de tiempo de disociación de una polimerasa se describen más adelante. En algunas modalidades, la constante de tiempo de disociación puede medirse en unidades de tiempo inverso, por ejemplo, seg-1 o min-1.
En algunas modalidades, en la presente descripción se proporciona una polimerasa recombinante aislada que incluye al menos una modificación de aminoácido con relación a una polimerasa de referencia y que proporciona un incremento de la longitud de lectura promedio de productos de extensión del cebador en una reacción de extensión del cebador mediante el uso de la polimerasa recombinante, en relación con la longitud de lectura promedio de productos de extensión del cebador obtenidos mediante el uso de la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante aislada proporciona un incremento de la longitud de lectura sin errores
promedio de los productos de extensión del cebador en una reacción de extensión del cebador mediante el uso de la polimerasa recombinante, en relación con la longitud de lectura sin errores promedio de los productos de extensión del cebador obtenidos mediante el uso de la polimerasa de referencia. Opcionalmente, la polimerasa recombinante incluye dos, tres o más sustituciones de aminoácidos con relación a la polimerasa de referencia.
En algunas modalidades, la reacción de extensión del cebador es una reacción de secuenciación basada en iones. En algunas modalidades, la polimerasa recombinante aislada proporcionada en la presente descripción proporciona un incremento del valor de 100Q17 o 200Q17 en una reacción de secuenciación de ácidos nucleicos (por ejemplo, en una reacción de secuenciación basada en iones) en relación con el valor de 100Q17 o 200Q17 obtenido mediante el uso de una polimerasa de referencia, tal como la SEQ ID NO: 1, SEQ ID NO: 2 o SEQ ID NO: 35.
En algunas modalidades, la polimerasa de referencia incluye una polimerasa de origen natural o de tipo silvestre. En otras modalidades, la polimerasa de referencia incluye una forma derivada, truncada, mutante o variante de una polimerasa de origen natural que es diferente de la polimerasa recombinante, por ejemplo, que tiene una o más sustituciones de aminoácidos omitidas en comparación con la polimerasa recombinante. En algunas modalidades, la polimerasa de referencia es la SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 35, SEQ ID NO: 16, SEQ ID NO: 120 o SEQ ID NO: 122.
En algunas modalidades, en la presente descripción se proporcionan métodos para realizar una reacción de polimerización de nucleótidos, que comprenden: poner en contacto una polimerasa recombinante con una plantilla de ácido nucleico en presencia de uno o más nucleótidos; y polimerizar al menos uno del uno o más nucleótidos mediante el uso de la polimerasa recombinante. La polimerización opcionalmente incluye además la polimerización del al menos un nucleótido de una manera dependiente de plantilla. En algunas modalidades, la polimerasa recombinante incluye una o más sustituciones de aminoácidos con relación a una polimerasa de referencia que no incluye una o más sustituciones de aminoácidos.
En algunas modalidades, el método incluye además la hibridación de un cebador con la plantilla antes, durante o después del contacto. La polimerización puede incluir polimerizar al menos un nucleótido en un extremo del cebador mediante el uso de la polimerasa recombinante.
En algunas modalidades, la polimerización se realiza en la proximidad de un sensor que es capaz de detectar la polimerización de al menos un nucleótido por la polimerasa recombinante.
En algunas modalidades, el método incluye además la detección de una señal que indica la polimerización de al menos uno del uno o más nucleótidos por la polimerasa recombinante mediante el uso del sensor.
El mutante (por ejemplo, la polimerasa) proporcionado en la presente descripción, la polimerasa de referencia, o tanto la polimerasa recombinante de la presente invención como la polimerasa de referencia, son típicamente una ADN polimerasa. En modalidades ilustrativas, la ADN polimerasa es ADN polimerasa Bst mutante.
En algunas modalidades, puede prepararse una polimerasa mutante (por ejemplo, recombinante) o un fragmento biológicamente activo de la misma mediante el uso de cualquier método o ensayo adecuado conocido por un experto en la técnica. En algunas modalidades, la descripción abarca cualquier método adecuado de manipulación genética de proteínas para obtener una polimerasa recombinante o un fragmento biológicamente activo de la misma. Por ejemplo, la mutagénesis dirigida al sitio es una técnica que puede usarse para introducir una o más mutaciones aleatorias o conocidas dentro de un constructo de ADN. La introducción de una o más mutaciones de aminoácidos se puede verificar, por ejemplo, frente a una polimerasa estándar o de referencia o a través de la secuenciación de ácidos nucleicos. Una vez verificada, el constructo que contiene una o más de las mutaciones de aminoácidos puede transformarse en células bacterianas y expresarse. Puede generarse una polimerasa mutante mediante el uso de los ácidos nucleicos y los vectores proporcionados en la presente descripción. Los Ejemplos 1 y 4 proporcionan métodos ilustrativos no limitantes para producir polimerasas mutantes de la presente invención.
Por lo general, las colonias que contienen constructos de expresión mutantes se inoculan en medios, se inducen y se cultivan hasta una densidad óptica deseada antes de la recolección (frecuentemente mediante centrifugación) y la purificación del sobrenadante. Será evidente para el experto en la técnica que el sobrenadante puede purificarse por cualquier medio adecuado. Típicamente, se selecciona una columna para la purificación de proteínas analítica o preparativa. En algunas modalidades, una polimerasa recombinante o un fragmento biológicamente activo de la misma preparado mediante el uso de los métodos puede purificarse, sin limitación, sobre una columna de heparina esencialmente de acuerdo con las instrucciones del fabricante.
Una vez purificada, la polimerasa mutante, opcionalmente modificada y típicamente recombinante, o su fragmento biológicamente activo, puede evaluarse mediante el uso de cualquier método adecuado para diversas actividades de polimerasa. En algunas modalidades, la actividad de polimerasa que se evalúa dependerá de la aplicación de interés. Por ejemplo, una polimerasa usada para amplificar o secuenciar una molécula de ácido nucleico de aproximadamente 400 pb de longitud puede incluir actividades de polimerasa tales como incremento de la capacidad
de procesamiento y/o incremento de la constante de tiempo de disociación con respecto a una polimerasa de referencia. En otro ejemplo, una aplicación que requiere una resecuenciación dirigida profunda de una molécula de ácido nucleico de aproximadamente 100 pb de longitud puede incluir una polimerasa con incremento de la actividad de corrección, incremento de la precisión absoluta, incremento del rendimiento total de secuenciación, disminución del sesgo de cadena, menor error sistemático o incremento de la longitud de lectura mínima. En algunas modalidades, una o más actividades de polimerasa evaluadas pueden estar relacionadas con el rendimiento de polimerasa o la actividad de polimerasa en presencia de una solución de alta fuerza iónica (por ejemplo, condiciones de alta salinidad).
En algunas modalidades, una polimerasa mutante opcionalmente modificada, típicamente recombinante, o un fragmento biológicamente activo de la misma preparado de acuerdo con los métodos de la presente descripción puede evaluarse para la actividad de unión al ADN, la actividad de polimerización de nucleótidos, la actividad de extensión del cebador, la actividad de desplazamiento de cadena, la actividad de transcriptasa inversa, actividad de exonucleasa 3'-5' (corrección) y similares.
En algunas modalidades, una polimerasa recombinante o un fragmento biológicamente activo de la misma preparado de acuerdo con los métodos de la presente descripción puede evaluarse para determinar el incremento de la precisión, incremento de la capacidad de procesamiento, incremento de la longitud de lectura promedio, incremento de la relación de señal con respecto a ruido, incremento de la señal, incremento de la longitud mínima de lectura, incremento del rendimiento total de la secuenciación, reducción del sesgo de cadena, disminución del error sistemático, incremento de AQ20, incremento del valor 200Q17 o la capacidad de realizar la polimerización de nucleótidos en comparación con una polimerasa de referencia. En algunas modalidades, la polimerasa recombinante o el fragmento biológicamente activo de la misma puede evaluarse para cualquiera de las actividades de polimerasa en presencia de una solución de alta fuerza iónica. En algunas modalidades, la solución de alta fuerza iónica comprende de 120 mM a aproximadamente 300 mM de sal. En algunas modalidades, la solución de alta fuerza iónica comprende un intervalo de sal de entre 120, 125, 130 o 135 mM en el extremo inferior y 150, 175, 200, 225, 250, 300, 350, 400 o 500 mM en el extremo superior. En una modalidad, la solución de alta fuerza iónica comprende al menos 125 mM de sal. En una modalidad, la solución de alta fuerza iónica comprende desde 125 mM de sal hasta 175 mM de sal.
En algunas modalidades, una polimerasa recombinante o un fragmento biológicamente activo de la misma se caracteriza opcionalmente por un cambio (por ejemplo, incremento o disminución) en cualquiera o más de las siguientes propiedades (frecuentemente, en relación con una polimerasa que carece de una o más mutaciones de aminoácidos): constante de tiempo de disociación, tasa de disociación de la polimerasa de una plantilla de ácido nucleico dada, afinidad de unión de la polimerasa por una plantilla de ácido nucleico dada, longitud de lectura promedio, longitud de lectura mínima, precisión, número total de lecturas perfectas, rendimiento total de secuenciación, sesgo de cadena, error sistemático, incremento en veces en el rendimiento de una reacción de secuenciación, rendimiento en sal (es decir, fuerza iónica), AQ20, longitud de lectura promedio sin errores, tasa de error, valor 100Q17, valor 200Q17, puntuación Q, precisión de lectura sin procesar, señal, señal con respecto a ruido y capacidad de procesamiento.
En algunas modalidades, una polimerasa recombinante o un fragmento biológicamente activo de la misma puede evaluarse individualmente con respecto a los valores conocidos en la técnica para una polimerasa análoga. En algunas modalidades, una polimerasa recombinante o un fragmento biológicamente activo de la misma preparado de acuerdo con los métodos puede evaluarse frente a una polimerasa conocida o de referencia en condiciones similares o idénticas. En algunas modalidades, las condiciones pueden incluir amplificar o secuenciar una molécula de ácido nucleico en presencia de una solución de alta fuerza iónica. En algunas modalidades, la solución de alta fuerza iónica incluye 120 mM a 300 mM de sal. En una modalidad, la solución de alta fuerza iónica incluye más de 120 mM de sal, tal como entre 125, 130, 140 o 150 mM de sal en el extremo inferior del intervalo, y 150, 160, 170, 175, 180, 190, 200, 225, 250, 275 o 300 mM de sal en el extremo superior del intervalo.
En algunas modalidades, en la presente descripción se proporcionan métodos para producir una pluralidad de polimerasas recombinantes o fragmentos biológicamente activos. En algunas modalidades, en la presente descripción se proporcionan métodos para producir una pluralidad de polimerasas recombinantes o fragmentos biológicamente activos mediante el uso de un sistema automatizado o de alto rendimiento. En algunas modalidades, los métodos comprenden mezclar una pluralidad de polimerasas recombinantes o fragmentos biológicamente activos con una serie de reactivos necesarios para la purificación de proteínas y extraer las polimerasas purificadas o fragmentos biológicamente activos de la mezcla. En un ejemplo, puede prepararse una pluralidad de reacciones de mutagénesis aleatoria o dirigida al sitio en una placa de 96 o 384 pocillos. Opcionalmente, el contenido de la placa de 96 o 384 pocillos puede someterse a un examen inicial para identificar constructos mutantes de polimerasa. El contenido de cada pocillo individual (o el contenido de cada pocillo de una selección inicial) puede enviarse a una serie de matraces, tubos o agitadores para la inoculación y la inducción. Una vez alcanzada la densidad óptica requerida, el matraz, los tubos o los agitadores pueden centrifugarse y recuperar los sobrenadantes. Cada sobrenadante puede someterse a una purificación de proteínas, por ejemplo, a través de una columna de purificación totalmente automatizada (por ejemplo, ver, Camper y Viola, Analytical Biochemistry, 2009, p176-181). Las polimerasas recombinantes purificadas o los fragmentos biológicamente activos pueden evaluarse para una o
una combinación de actividades de polimerasa, tales como unión al ADN, extensión del cebador, desplazamiento de cadena, actividad de transcriptasa inversa y similares. Se prevé que el experto en la técnica pueda usar el método (o variaciones de los métodos que están dentro del alcance de la descripción) para identificar una pluralidad de polimerasas recombinantes o fragmentos biológicamente activos. En algunos aspectos, los métodos pueden usarse para identificar una pluralidad de polimerasas recombinantes o fragmentos biológicamente activos que producen una precisión mejorada en comparación con una polimerasa de referencia. En algunas modalidades, los métodos pueden usarse para identificar una pluralidad de polimerasas recombinantes o fragmentos biológicamente activos de las mismas que producen una precisión mejorada en presencia de una solución de alta fuerza iónica en comparación con una polimerasa de referencia. En algunas modalidades, la solución de alta fuerza iónica puede incluir una sal de KCl y/o NaCl. En algunas modalidades, la solución de alta fuerza iónica puede ser de 120 a 300 mM de sal. En algunas modalidades, la solución de alta fuerza iónica puede ser de 120 mM a 200 mM de sal. En algunas modalidades, la solución de alta fuerza iónica puede ser de 125 mM a 175 mM de sal. Será evidente para el experto en la técnica que pueden usarse varias otras sales adecuadas en su lugar, o en combinación con KCl y/o NaCl. En algunas modalidades, la solución de fuerza iónica puede incluir además un sulfato.
Como será fácilmente evidente para el experto en la técnica, la descripción describe un método ilustrativo automatizado y de alto rendimiento (y aparatos y sistemas relacionados) para generar una biblioteca de polimerasas recombinantes o fragmentos activos biológicos de las mismas. La descripción también describe métodos (y kits, composiciones, aparatos y sistemas relacionados) para evaluar tales polimerasas recombinantes o fragmentos biológicamente activos de las mismas para la actividad de polimerasa. La descripción también abarca que el experto en la técnica puede producir fácilmente una biblioteca mutagenizada de constructos en donde cada aminoácido dentro de la polimerasa de interés puede mutarse. En algunas modalidades, puede prepararse una biblioteca mutagenizada en donde cada aminoácido dentro de la polimerasa muta por cada combinación de aminoácidos posible. Puede preparar una biblioteca mutagenizada donde cada aminoácido dentro de la polimerasa está mutado, y donde la combinación de posibles mutaciones de aminoácidos se limita a sustituciones de aminoácidos conservadoras o no conservadoras. En ambos ejemplos, pueden crear bibliotecas mutagenizadas que contengan un gran número de constructos mutantes que pueden aplicarse a través de un sistema automatizado o de alto rendimiento para la purificación o el tamizaje inicial. En algunas modalidades, las placas de constructos de bibliotecas de 96 o 384 pocillos que representan una biblioteca mutagenizada pueden evaluarse para una o más actividades de polimerasa mediante el uso de un tamizaje de polimerasa On-PGM, mediante el uso de una Máquina de genoma personal y Chips de secuenciación Ion PGM (Life Technologies Corp, CA). En un ejemplo, el tamiz de polimerasa On-PGM puede incluir una o más placas de 96 o 384 pocillos que representan una biblioteca mutagenizada; donde cada pocillo de la placa consiste en un constructo diferente (polimerasa recombinante) que contiene al menos una o más mutaciones de aminoácidos en comparación con una polimerasa de referencia en al menos un pocillo de la misma placa (que carece de al menos una o más mutaciones de aminoácidos). En algunas modalidades, la polimerasa de referencia actúa como una muestra de control dentro de la placa de 96 o 384 pocillos para evaluar la actividad de polimerasa de cada polimerasa recombinante dentro de los pocillos de la placa. En algunas modalidades, la biblioteca de constructos y polimerasa de referencia dentro de la placa puede incluir además un código de barras único para cada polimerasa recombinante dentro de la placa. Por lo tanto, una placa de 96 pocillos puede contener 96 códigos de barras si cada pocillo de la placa contiene una polimerasa de referencia o un constructo de polimerasa recombinante. Una vez purificada, la biblioteca mutagenizada de proteínas se puede evaluar para una o una combinación de actividades de polimerasa, tal como unión al ADN, extensión del cebador, desplazamiento de cadena, transcriptasa inversa, actividad de polimerasa iniciada por mella, precisión absoluta, incremento del rendimiento total de secuenciación, reducción del sesgo de cadena, reducción del error sistemático, longitud de lectura y similares. Las bibliotecas pueden incluir además bibliotecas de plantillas que se sabe que funcionan bien en las condiciones de amplificación propuestas, de modo que las bibliotecas de plantillas que funcionan bien pueden actuar como lectura inicial o de control.
Opcionalmente, las polimerasas recombinantes purificadas o los fragmentos biológicamente activos de las mismas pueden evaluarse adicionalmente en cuanto a otras propiedades tal como la capacidad de amplificar o secuenciar una molécula de ácido nucleico en presencia de un alto contenido de sal (fuerza iónica). La fuente u origen de la polimerasa a mutar generalmente no se considera crítica. Por ejemplo, en los métodos pueden usarse polimerasas eucarióticas, procarióticas, de arqueas, bacterianas, de fagos o virales. La polimerasa puede ser una ADN o una ARN polimerasa. La ADN polimerasa puede incluir una ADN polimerasa de la familia A o de la familia B. Los ejemplos de métodos proporcionados en la presente descripción deben considerarse ilustrativos en vista del campo de la manipulación genética de proteínas y de enzimas y no forman parte de la invención reivindicada de esta solicitud.
La polimerasa típicamente recombinante, mutante y opcionalmente modificada o un fragmento biológicamente activo de la misma, que tiene cualquiera de las mutaciones proporcionadas en la presente descripción, incluye una o más mutaciones de aminoácidos que se encuentran dentro del dominio catalítico de la polimerasa recombinante. La polimerasa recombinante o fragmento biológicamente activo de la misma puede incluir al menos 25, 50, 75, 100, 150 o más residuos de aminoácidos del dominio catalítico. En algunos ejemplos, la polimerasa recombinante o su fragmento biológicamente activo puede incluir cualquier parte del dominio catalítico que comprenda al menos 25, 50, 75, 100, 150 o más residuos de aminoácidos contiguos. En algunos ejemplos, la polimerasa recombinante o fragmento biológicamente activo de la misma puede incluir al menos 25 residuos de aminoácidos contiguos del
dominio catalítico y puede incluir opcionalmente uno o más residuos de aminoácidos en el extremo C-terminal o N-terminal que están fuera del dominio catalítico. En algunos ejemplos, la polimerasa recombinante o un fragmento biológicamente activo puede incluir 25, 50, 75, 100, 150 o más residuos de aminoácidos contiguos del dominio catalítico acoplados a uno o más residuos de aminoácidos del dominio no catalítico.
En algunos ejemplos, la polimerasa modificada o un fragmento biológicamente activo de la misma incluye una o más mutaciones de aminoácidos que se encuentran dentro del dominio de unión al ADN de la polimerasa. En algunos ejemplos, la polimerasa modificada o fragmento biológicamente activo de la misma puede incluir al menos 25, 50, 75, 100, 150 o más residuos de aminoácidos del dominio de unión al ADN de la polimerasa modificada. En algunos ejemplos, la polimerasa modificada o fragmento biológicamente activo de la misma puede incluir cualquier parte del dominio de unión al ADN que comprende al menos 25, 50, 75, 100, 150 o más residuos de aminoácidos contiguos. En algunos ejemplos, la polimerasa modificada o fragmento biológicamente activo de la misma puede incluir al menos 25 residuos de aminoácidos contiguos del dominio de unión y puede incluir opcionalmente uno o más residuos de aminoácidos en el extremo C-terminal o N-terminal que están fuera del dominio de unión. En algunos ejemplos, la polimerasa modificada o un fragmento biológicamente activo puede incluir 25, 50, 75, 100, 150 o más residuos de aminoácidos contiguos del dominio de unión acoplados a uno o más residuos de aminoácidos del dominio de no unión. En algunos ejemplos, la polimerasa modificada (o un fragmento biológicamente activo de la misma) incluye una o más mutaciones de aminoácidos que están ubicadas dentro del dominio de unión al ADN de la polimerasa modificada, y en donde la polimerasa tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad con cualquiera de las polimerasas modificadas descritas en la presente descripción.
En algunos ejemplos, la polimerasa modificada o un fragmento biológicamente activo de la misma incluye una o más mutaciones de aminoácidos que están ubicadas fuera del dominio catalítico (también denominado en la presente descripción hendidura de unión al ADN) de la polimerasa. Los dominios catalíticos de las ADN polimerasas de la familia A, las ADN polimerasas de la familia B y las transcriptasas inversas, así como también las ARN polimerasas dependientes de ARN, son bien conocidos; todos comparten una estructura general común y un mecanismo catalítico. Los dominios catalíticos de todas estas polimerasas tienen una forma que se ha comparado con una mano derecha y consiste en dominios de "palma", "pulgar" y "dedo". El dominio de palma normalmente contiene el sitio catalítico para la reacción de transferencia de fosforilo. Se cree que el pulgar desempeña un papel en el posicionamiento del ADN dúplex y en la capacidad de procesamiento y la translocación. Los dedos interactúan con el nucleótido entrante así como también con la base de plantilla con la que se aparea. Los dominios de palma son homólogos en las familias A, B y RT, pero las disposiciones de los dedos y el pulgar son diferentes. Los dominios de pulgar de las diferentes familias de polimerasas comparten características comunes, que contienen hélices a paralelas o antiparalelas, con al menos una hélice a que interactúa con el surco menor del complejo de cebadorplantilla. El dominio de dedo también conserva una hélice a ubicada en el extremo romo del complejo de cebadorplantilla. Esta hélice contiene cadenas laterales altamente conservadas (el motivo B).
Se han identificado tres motivos conservados, A, B y C para las polimerasas de la familia A. Los motivos A y C típicamente se conservan tanto en las polimerasas de la familia B como en las polimerasas RT. (Delarue y otros, Protein Engineering 3: 461-467 (1990)).
Para las polimerasas de la familia A, el motivo A comprende la secuencia consenso:
DXSXXE (SEQ ID NO: 5).
Para las polimerasas de la familia A, el motivo B comprende la secuencia consenso:
KXXXXXXYG (SEQ ID NO: 6)
Para las polimerasas de la familia A, el motivo C comprende la secuencia consenso:
VHDE (SEQ ID NO: 7)
En algunas modalidades, la polimerasa comprende opcionalmente cualquier polimerasa de la familia A, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma, en donde el resto de enlace se enlaza a cualquier residuo de aminoácido de la polimerasa de la familia A, o un fragmento biológicamente activo mutante, variante o truncamiento del mismo, que se ubica fuera de los motivos A, B o C. En algunas modalidades, el resto de enlace se enlaza a cualquier resto de aminoácido de la polimerasa de la familia A, o fragmento biológicamente activo, que se ubica fuera del motivo A, el motivo B o el motivo C.
Los motivos A y C típicamente forman parte del dominio de palma, y cada motivo típicamente contiene un residuo de ácido aspártico estrictamente conservado, que está implicado en el mecanismo catalítico común para todas las ADN polimerasas. La síntesis de ADN puede estar mediada por la transferencia de un grupo fosforilo del nucleótido entrante al 3' OH del ADN, liberando un resto de polifosfato y formando un nuevo enlace fosfodiéster de ADN. Esta reacción está catalizada típicamente por un mecanismo que implica dos iones metálicos, normalmente Mg2+, y los dos residuos de ácido aspártico conservados.
En algunas modalidades, el residuo de ácido glutámico conservado en el motivo A de las ADN polimerasas de la familia A juega un papel importante en la incorporación del nucleótido correcto, al igual que la tirosina conservada
correspondiente en los miembros de la familia B (Minnick y otros, Proc. Natl. Acad. Sci. USA 99: 1194-1199 (2002); Parsell y otros, Nucleic Acids Res. 35: 3076-3086 (2002). Las mutaciones en la Leu conservada del motivo A afectan la fidelidad de replicación (Venkatesan y otros, J. Biol. Chem. 281: 4486-4494 (2006)).
En algunas modalidades, el motivo B contiene residuos de lisina, tirosina y glicina conservados. Se ha demostrado que el motivo B de pol I de E coli se une a sustratos de nucleótidos y contiene una tirosina conservada que se ha demostrado que está en el sitio activo.
En algunas modalidades, para las polimerasas de la familia B, el motivo A comprende la secuencia consenso:
DXXSLYPS (SEQ ID NO: 8).
Para las polimerasas de la familia B, el motivo B comprende la secuencia consenso:
KXXXNSXYG (SEQ ID NO: 9)
Para las polimerasas de la familia B, el motivo C comprende la secuencia consenso:
YGDTDS (SEQ ID NO: 10)
Los residuos en negrita indican residuos invariables.
El objeto de los siguientes ejemplos que no se relaciona con polimerasas Bst mutantes no forma parte de la invención reivindicada. En algunos ejemplos, la polimerasa recombinante comprende opcionalmente cualquier polimerasa de la familia B, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma, en donde el resto de enlace se enlaza a cualquier residuo de aminoácido de la polimerasa de la familia B, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma que se ubica fuera de los motivos A, B o C. En algunos ejemplos, el resto de enlace se enlaza a cualquier residuo de aminoácido de la polimerasa de la familia B, o fragmento biológicamente activo, que está situado fuera del motivo A, el motivo B o el motivo C.
En algunos ejemplos, las polimerasas de la familia B contienen seis motivos conservados, de los cuales las regiones I y II corresponden a los motivos A y C de la familia A. La región III está implicada en la unión de nucleótidos y es funcionalmente homóloga al motivo B. Las regiones I, II y III convergen en el centro del sitio activo de la palma (I), los dedos (II) y la base del pulgar (III) para producir una superficie conservada contigua. Dentro de estas regiones, un conjunto de residuos altamente conservados forma tres grupos químicamente distintos que consisten en residuos aromáticos expuestos, residuos cargados negativamente y residuos cargados positivamente, respectivamente. Por ejemplo, en la polimerasa de replicación del bacteriófago RB69, estos tres grupos corresponden a los siguientes residuos de aminoácidos: Y416, Y567 e Y391 (residuos aromáticos expuestos), D621, D623, D411, D684 y E686 (residuos cargados negativamente), y K560, R482 y K486 (residuos cargados positivamente). Ver Wang y otros, Cell 89: 1087-1099 (1997). Estos tres grupos típicamente abarcan la región en la que se esperaría que se unieran el extremo del cebador y el nucleótido entrante. En algunos ejemplos, la polimerasa recombinante comprende opcionalmente cualquier polimerasa de la familia B, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma, en donde el resto de enlace se enlaza a cualquier residuo de aminoácido de la polimerasa de la familia B, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma que está ubicado fuera de uno o más de estos grupos o motivos de aminoácidos conservados. En algunos ejemplos, el resto de enlace se enlaza a cualquier residuo de aminoácido de la polimerasa de la familia B, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma que esté ubicado fuera de cualquiera de estos grupos o motivos de aminoácidos conservados.
Las polimerasas RT contienen cuatro motivos de secuencia conservados (Poch y otros, EMBO J. 12: 3867-3874 (1989)), con motivos A y C que contienen los aspartatos catalíticos conservados. La integridad del motivo B también se requiere para la función de transcriptasa inversa.
La secuencia consenso para el motivo A es DXXXXF/Y (SEQ ID NO: 11)
La secuencia consenso para el motivo B es FXGXXXS/A (SEQ ID NO: 12)
La secuencia consenso para el motivo C es YXDD (SEQ ID NO: 13)
La secuencia consenso para el motivo D es GXXXXXXXK (SEQ ID NO: 14).
Las mutaciones en el motivo YXDD (motivo C), el más conservado de estos motivos, pueden anular la actividad de polimerasa y alterar la capacidad de procesamiento y la fidelidad (Sharma y otros, Antiviral Chemistry and Chemotherapy 16: 169-182 (2005)). Además, el residuo de lisina conservado en el motivo D, un bucle que es exclusivo de las polimerasas RT, es un residuo invariable importante para la unión de nucleótidos (Canard y otros, J. Biol. Chem. 274: 35768-35776 (1999)).
En algunos ejemplos, la polimerasa recombinante comprende opcionalmente cualquier RT polimerasa, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma, en donde el resto de enlace se enlaza a
cualquier residuo de aminoácido de la RT polimerasa, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma que está ubicado fuera de uno o más de los motivos A, B, C y D. En algunos ejemplos, el resto de enlace se enlaza a cualquier residuo de aminoácido de la RT polimerasa, o fragmento biológicamente activo, mutante, variante o truncamiento de la misma que esté ubicado fuera de cualquiera de estos motivos.
En algunos ejemplos, la polimerasa recombinante incluye una o más modificaciones (incluidas sustituciones, deleciones, adiciones o modificaciones químicas de aminoácidos) ubicadas en cualquier posición distinta de los residuos conservados o invariables.
En algunos ejemplos, además de los dominios de polimerasa, la ADN polimerasa mutante (por ejemplo, recombinante) con cualquiera de las mutaciones proporcionadas en la presente descripción, o mutaciones análogas si tal polimerasa no se basa en la secuencia de la ADN polimerasa Bst de tipo silvestre, puede incluir una o más dominios funcionales adicionales, incluidos los dominios necesarios para la actividad de exonucleasa 3' -> 5' (inversa) que media la corrección de la cadena de ADN recién sintetizada, o para la actividad de exonucleasa 5' -> 3' (directa) que media la traducción de mellas durante la reparación del ADN, o para la actividad de endonucleasa FLAP. En algunos ejemplos, la polimerasa recombinante tiene actividad de desplazamiento de cadenas y puede catalizar la síntesis de ácidos nucleicos mediante la polimerización de nucleótidos en el extremo 3' de una mella dentro de una plantilla de ácido nucleico de doble cadena mientras desplaza simultáneamente el ácido nucleico ubicado corriente abajo de la mella. La polimerasa recombinante también tiene opcionalmente cualquiera o más de estas actividades.
Los dominios de corrección de exonucleasa 3' a 5' de las ADN polimerasas de la familia A y B contienen tres motivos conservados, llamados Exo I, Exo II y Exo III, cada uno de los cuales contiene un residuo de ácido aspártico invariable esencial para la unión de metales y la función exonucleasa. Las alteraciones de estos residuos de ácido aspártico conservados dan como resultado proteínas que retienen la actividad de polimerasa, pero son deficientes en la actividad de exonucleasa (Hall y otros, J. Gen. Virol. 76: 2999-3008 (1995)). También se han identificado motivos conservados en los dominios exonucleasa 5' a 3' y alteraciones de aminoácidos que afectan la actividad de exonucleasa (patente de Estados Unidos núm. 5,466,591).
Ejemplos representativos de enzimas de la familia A son Pol I de E. coli., o el fragmento Klenow de Pol I de E coli., ADN polimerasa Bst, ADN polimerasa Taq, ADN polimerasa T7 y ADN polimerasa Tth. Una familia de enzimas también incluye la serie ADN polimerasa Platinum Taq.
En algunos ejemplos, las enzimas de la familia A se caracterizan por altas tasas de elongación del ADN, pero pueden tener poca fidelidad debido a la falta de actividad de exonucleasa 3'-5'. En algunos ejemplos, las enzimas de la familia B pueden tener una alta fidelidad debido a su actividad de exonucleasa 3'-5' pero pueden lograr bajas tasas de elongación del ADN.
En algunas modalidades, la polimerasa recombinante se deriva de la ADN polimerasa Bst de Bacillus stearothermophilus, o cualquier fragmento biológicamente activo de la misma. La polimerasa Bst puede ser una ADN polimerasa de la familia A. El fragmento de 581 aminoácidos, a veces denominado en la presente descripción el "fragmento grande", de la ADN polimerasa Bst de origen natural es equivalente al fragmento Klenow de Pol I de E. coli, que mantiene las actividades de polimerasa y de exonucleasa de corrección mientras carece de la actividad de exonucleasa 5' a 3'. En algunas modalidades, la polimerasa derivada de la ADN polimerasa Bst puede carecer de actividad de exonucleasa de 3' a 5'. Como se usa en la presente descripción, el término "ADN polimerasa Bst" puede referirse a una proteína de longitud completa o a un fragmento grande de Bst.
En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto la polimerasa de referencia como la recombinante consisten en, o comprenden, una variante aislada de una ADN polimerasa Bst que tiene, o comprende, la secuencia de aminoácidos de SEQ ID NO: 1, que es la secuencia de aminoácidos del fragmento grande (porción C-terminal) de la ADN polimerasa Bst.
SEQ ID NO: 1 corresponde al fragmento grande de la ADN polimerasa Bst e incluye los motivos de ADN polimerasa A, B y C (ver, por ejemplo, Delarue, más arriba) en los residuos 358-363, 411-420 y 533-536, respectivamente. En algunas modalidades, para mantener la actividad de polimerasa de una polimerasa Bst, pueden realizarse sustituciones, eliminaciones o modificaciones químicas en los residuos de aminoácidos que no están altamente conservados dentro de los motivos A, B o C, tales como los residuos de ácido aspártico invariables D358 y D535 requeridos para la actividad de polimerasa, siempre que tales ADN polimerasas de Bst mutantes incluyan las mutaciones identificadas en la presente descripción. En algunas modalidades, la polimerasa recombinante incluye una forma mutante o variante de una ADN polimerasa Bst que mantiene un nivel detectable de actividad de polimerasa.
En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto la polimerasa de referencia como la recombinante consisten o comprenden una variante aislada de una polimerasa que tiene o comprende una secuencia de aminoácidos que es al menos 80 % idéntica a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, la polimerasa de referencia o la polimerasa recombinante es una variante
aislada de una ADN polimerasa Bst que comprende la secuencia de aminoácidos de la SEQ ID NO: 1, en donde la variante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, o al menos 99 % idéntica a la SEQ ID NO: 1.
En algunas modalidades, la polimerasa de referencia es una ADN polimerasa Bst que tiene, o comprende, la secuencia de aminoácidos de la SEQ ID NO: 1, y la polimerasa recombinante incluye además una o más modificaciones de aminoácidos (por ejemplo, sustituciones, eliminaciones, adiciones o modificaciones químicas de aminoácidos) con respecto a la polimerasa de referencia. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante, o tanto la polimerasa de referencia como la recombinante incluyen una eliminación o sustitución del residuo de metionina en la posición 1, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1.
En algunas modalidades, la polimerasa de referencia y/o la polimerasa recombinante pueden incluir la secuencia de aminoácidos de cualquier fragmento biológicamente activo de una polimerasa que tiene o comprende la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, la polimerasa recombinante puede incluir la secuencia de aminoácidos de cualquier fragmento biológicamente activo de una polimerasa que tiene o comprende una secuencia de aminoácidos que sea al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de la SEQ ID NO: 1.
En algunas modalidades, la polimerasa recombinante consiste en o comprende una variante aislada de una ADN polimerasa Bst que tiene o comprende la secuencia de aminoácidos de la SEQ ID NO: 2.
La SEQ ID NO: 2 incluye tres sustituciones de aminoácidos en relación con la SEQ ID NO: 1, a saber: His46Arg (H46R), Glu446Gln (E446Q) e His572Arg (H572R), en donde la numeración es con relación a la secuencia de aminoácidos de la s Eq ID NO: 1.
En algunas modalidades, la polimerasa recombinante consiste en o comprende una variante aislada de una polimerasa que tiene o comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos de la SEQ ID NO: 2. En algunas modalidades, la polimerasa es una variante de una ADN polimerasa Bst que comprende la secuencia de aminoácidos de SEQ ID NO: 2, en donde la variante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la SEQ ID NO: 2.
En algunas modalidades, la polimerasa de referencia es una ADN polimerasa Bst que tiene, o comprende, la secuencia de aminoácidos de la SEQ ID NO: 2, y la polimerasa recombinante incluye además una o más modificaciones de aminoácidos (por ejemplo, sustituciones, eliminaciones, adiciones o modificaciones químicas de aminoácidos) con respecto a la polimerasa de referencia. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante, o tanto la polimerasa de referencia como la recombinante incluyen una eliminación o sustitución del residuo de metionina en la posición 1, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 2.
La SEQ ID NO: 35 incluye tres sustituciones de aminoácidos en relación con la SEQ ID NO: 2, a saber, D423K, N487R y H281M, donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 2. Esta secuencia es una secuencia de bases para ADN polimerasas Bst ilustrativas proporcionadas en la presente descripción. Como tal, las modalidades ilustrativas de ADN polimerasas Bst de origen no natural proporcionadas en la presente descripción tienen al menos un 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la SEQ ID NO: 35 o un fragmento de la misma, muestran actividad de polimerasa e incluyen (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H o E220T, N234K, P236I o P236R, E245R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T; o (b) dos o más sustituciones de aminoácidos seleccionadas de E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T. Las ADN polimerasas mutantes (por ejemplo, recombinantes) pueden producir una tasa de error sistemático promedio más baja cuando se usan en una reacción de secuenciación por síntesis en comparación con la tasa de error sistemático promedio, o mejoran la precisión cuando se usan en una reacción de secuenciación por síntesis en comparación con la ADN polimerasa Bst mutante de la SEQ ID NO:35. La reacción de secuenciación por síntesis en la que la polimerasa tiene propiedades mejoradas en ejemplos ilustrativos, es una reacción de secuenciación en la que se liberan y detectan iones de hidrógeno. En algunas modalidades, un fragmento biológicamente activo proporcionado en la presente descripción para cualquiera de las ADN polimerasas Bst mutantes puede incluir cualquier parte del dominio de unión al ADN o cualquier parte del dominio catalítico de la polimerasa modificada. En algunas modalidades, el fragmento
biológicamente activo puede incluir opcionalmente 25, 50, 75, 100, 150 o más residuos de aminoácidos contiguos del dominio de unión al ADN o catalítico de cualquiera de las ADN polimerasas mutantes proporcionadas en la presente descripción. En algunas modalidades, un fragmento biológicamente activo de la polimerasa modificada puede incluir al menos 25 residuos de aminoácidos contiguos del dominio catalítico o el dominio de unión al ADN que tiene al menos 80 %, 85 %, 90 %, 95 %, 98 % o 99 % de identidad con cualquiera o más de las polimerasas abarcadas por la descripción, en modalidades ilustrativas SEQ ID NO: 119 o SEQ ID NO: 121.
En algunas modalidades, en la presente descripción se proporcionan composiciones que incluyen una polimerasa recombinante y/o mutante de la SEQ ID NO: 16, o un fragmento de la misma que tiene actividad de polimerasa y tiene 25, 50, 75, 100, 150, 200, 250, 300, 400, 500, 600, 700, 750, 800, 850, 860, 870, 871, 872, 873, 874, o más, residuos de aminoácidos contiguos de la SEQ ID NO: 16, en donde la polimerasa o fragmento de la misma incluye al menos una sustitución de aminoácidos seleccionada de V536K, G504Q, N529K, N529R, P531I, P531R, L547R, E515H, E515K, E515T, S555K, T619R, E562M, E562K, E562R, E572T, E589K, E751R, E788G, E788R, E737R, E737Y, M790C, E620R, A787K, D775L, D775R, A639Y, E540R, E325K, N812C, N812K, V546R, N780R, E817C, D559K, D559M, H823T y H768G (tales mutaciones conocidas colectivamente en la presente descripción como "mutaciones ventajosas" de la polimerasa de longitud completa), en donde la numeración es con relación a la SEQ ID NO: 16. En modalidades ilustrativas, la polimerasa recombinante y/o mutante incluye H341R E741Q H867R e incluye además opcionalmente H576M D718K N782R.
En algunas modalidades, la composición incluye un fragmento de la SEQ ID NO: 35 que tiene actividad de polimerasa, incluidos 25, 50, 75, 100, 150, 200 o más, residuos de aminoácidos contiguos de la SEQ ID NO: 35, y que además incluyen al menos una sustitución de aminoácido seleccionada del grupo que consiste en V241K, G209Q, N234K o N234R, P236I o P236R, L252R, E220H o E220K o E220T, S260K, T324R, E267M o E267K o E267R, E277T, E294K, E456R, E493G o E493R, E442R o E442Y, M495C, E325R, A492K, D480L o D480R, A344Y, E245R, E30K, N517C o N517K, V251R, N485R, E522C, D264K o D264M, H528T y H473G, en donde la numeración es con relación a la SEQ ID NO: 35. La composición muestra típicamente actividad de polimerasa.
En algunas modalidades, la polimerasa modificada recombinante consiste en o comprende una variante aislada de una polimerasa que tiene o comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos de la SEQ ID NO: 35. En algunas modalidades, la polimerasa es una variante de una ADN polimerasa Bst que comprende la secuencia de aminoácidos de la SEQ ID NO: 35, en donde la variante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la SEQ ID NO: 35 y variantes de SEQ ID NO: 35 que incluyen una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, e220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1.
En algunas modalidades, la polimerasa de referencia es una ADN polimerasa Bst que tiene, o comprende, la secuencia de aminoácidos de la SEQ ID NO: 35 y la polimerasa recombinante incluye además una o más modificaciones de aminoácidos (por ejemplo, sustituciones, eliminaciones, adiciones o modificaciones químicas de aminoácidos) en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante, o tanto la polimerasa de referencia como la recombinante incluyen una eliminación o sustitución del residuo de metionina en la posición 1, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 2.
En algunas modalidades, en la presente descripción se proporciona una polimerasa recombinante que incluye una variante aislada de una ADN polimerasa Bst que comprende una secuencia de aminoácidos seleccionada del grupo que consiste en la SEQ ID NO: 31 y SEQ ID NO: 35, e incluye además uno o más mutaciones de aminoácidos. Opcionalmente, la polimerasa recombinante incluye una, dos, tres, cuatro o más sustituciones de aminoácidos en relación con la secuencia de aminoácidos de la SEQ ID NO: 31 y SEQ ID NO: 35.
La polimerasa recombinante puede incluir además una o más mutaciones de aminoácidos seleccionadas del grupo que consiste en: H46R, C93R, Q238C, H273R, H281A, E446Q, H473R, Y477F, H528A, C550Q, H572R, E220K, N234R, A263K, D264A, D264R, H273N, H281M, D423K, D480R, N485K, N487R, E493R, H528F y H528S, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. La polimerasa recombinante tiene una capacidad amortiguadora reducida en relación con la polimerasa de referencia. Sin estar unido a ninguna teoría particular de funcionamiento, puede observarse que una o más de las mutaciones antes mencionadas pueden alterar, por ejemplo, incrementar o disminuir la capacidad amortiguadora de la polimerasa modificada en relación con la polimerasa no modificada. Por lo tanto, tales mutaciones pueden denominarse mutaciones "amortiguadoras".
En algunas modalidades, tal incremento o disminución de la capacidad amortiguadora puede incrementar la señal observada en una reacción de secuenciación basada en iones. Puede encontrarse más información sobre tales mutaciones y su posible efecto sobre la capacidad amortiguadora de la polimerasa, por ejemplo, en la solicitud
provisional de Estados Unidos núm. 60/308,863 presentada el 26 de febrero de 2010; solicitud de patente de Estados Unidos núm. de serie 13/035,081 presentada el 25 de febrero de 2011; 13/035,177 presentada el 25 de febrero de 2011; 13/036,526 presentada el 28 de febrero de 2011; y 13/036,623 presentada el 25 de febrero de 2011; así como también en la solicitud PCT internacional Núm. PCT/US2011/026219 presentada el 25 de febrero de 2011; PCT/US2011/026228 presentada el 25 de febrero de 2011; PCT/US2011/026450 presentada el 28 de febrero de 2011; y PCT/US2011/026468 presentada el 28 de febrero de 2011.
En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto las polimerasas de referencia como las recombinantes pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1.
Opcionalmente, la polimerasa de referencia, la polimerasa recombinante, o tanto las polimerasas de referencia como las recombinantes pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa. Algunas mutaciones ilustrativas que pueden reducir o eliminar la actividad de exonucleasa de la polimerasa se describen más adelante en la presente descripción.
En algunas modalidades, la polimerasa de referencia tiene o comprende la secuencia de aminoácidos de la SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36 o SEQ ID NO: 37 y la polimerasa recombinante tiene o comprende la secuencia de aminoácidos de la polimerasa de referencia, que incluye además una o más mutaciones de aminoácidos en comparación con la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante incluye además una o más sustituciones de aminoácidos en una o más posiciones seleccionadas del grupo que consiste en: 46, 93, 220, 234, 238, 263, 264, 273, 281, 423, 446, 473, 477, 480, 485, 487, 493, 528, 550 y 572, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, una o más de las sustituciones de aminoácidos mencionadas anteriormente pueden alterar, por ejemplo, incrementar o disminuir la capacidad amortiguadora de la polimerasa modificada en relación con la polimerasa de referencia correspondiente que tiene la secuencia de aminoácidos de la SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3 SEQ ID NO: 4 SEQ ID NO: 34, SEQ ID NO: 35 o SEQ ID NO: 37. Por lo tanto, tales mutaciones pueden denominarse mutaciones "amortiguadoras". En algunas modalidades, tal incremento o disminución de la capacidad amortiguadora puede incrementar la señal observada en una reacción de secuenciación basada en iones. En algunas modalidades, las sustituciones de aminoácidos incluyen la sustitución del residuo de aminoácido existente en la posición indicada con cualquier otro residuo de aminoácido (incluidos tanto los residuos de aminoácidos de origen natural y no natural). En algunas modalidades, la sustitución de aminoácidos es una sustitución conservadora; alternativamente, la sustitución de aminoácidos puede ser una sustitución no conservadora. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto las polimerasas de referencia como las recombinantes pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, la polimerasa recombinante muestra un cambio en uno o más parámetros seleccionados del grupo que consiste en: longitud de lectura promedio, precisión, rendimiento total de secuenciación, sesgo de cadena, error sistemático reducido, longitud de lectura mínima, desempeño mejorado en solución de mayor fuerza iónica, capacidad de procesamiento mejorada, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, capacidad amortiguadora, tasa off, constante de tiempo de disociación, AQ20, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas recombinantes y de referencia en una reacción de secuenciación basada en iones. Opcionalmente, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa.
En algunas modalidades, una polimerasa recombinante que incluye una o más de estas mutaciones muestra una afinidad de unión alterada (por ejemplo, incrementada o disminuida) por una plantilla de ácido nucleico en relación con la polimerasa no modificada correspondiente o con una polimerasa de referencia. En algunas modalidades, la polimerasa recombinante tiene una tasa alterada (por ejemplo, incrementada o disminuida) de disociación de la plantilla de ácido nucleico ("tasa off') en relación con la polimerasa no modificada o con una polimerasa de referencia. En algunas modalidades, la polimerasa recombinante muestra una longitud de lectura alterada, por ejemplo, incrementada o disminuida, o una longitud de lectura promedio libre de errores alterada, o valores 100Q17 o 200Q17 observados alterados (por ejemplo, incrementados o disminuidos) en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante muestra un cambio en uno o más de los siguientes parámetros cinéticos: longitud de lectura promedio, longitud de lectura mínima, desempeño mejorado en solución de mayor fuerza iónica, mejora de la capacidad de procesamiento, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la polimerasa en emulsión reacción en cadena, constante de tiempo de disociación, tasa off, AQ20, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas recombinantes y de referencia en una reacción de
secuenciación basada en iones. En algunas modalidades, las sustituciones de aminoácidos incluyen la sustitución del residuo de aminoácido existente en la posición indicada con cualquier otro residuo de aminoácido (incluidos tanto los residuos de aminoácidos de origen natural y no natural). En algunas modalidades, la sustitución de aminoácidos es una sustitución conservadora; alternativamente, la sustitución de aminoácidos puede ser una sustitución no conservadora. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto las polimerasas de referencia como las recombinantes pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, la polimerasa recombinante muestra un cambio en uno o más parámetros seleccionados del grupo que consiste en: longitud de lectura promedio, longitud de lectura mínima, desempeño mejorado en solución de mayor fuerza iónica, mejora de la capacidad de procesamiento, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, capacidad amortiguadora, tasa off, valor 100Q17, valor AQ20 y 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas recombinantes y de referencia en una reacción de secuenciación basada en iones. Opcionalmente, la polimerasa de referencia, la polimerasa recombinante, o tanto las polimerasas de referencia como las recombinantes pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa.
En algunas modalidades, la polimerasa de referencia tiene o comprende la secuencia de aminoácidos de la SEQ ID NO: 2, SEQ ID NO: 35, SEQ ID NO: 119 e incluye una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T y la polimerasa recombinante tiene o comprende la secuencia de aminoácidos de la polimerasa de referencia e incluye además al menos una sustitución de aminoácidos en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante incluye además sustituciones de aminoácidos en cualquiera o más posiciones seleccionadas del grupo que consiste en: 31, 46, 77, 93, 113, 114, 130, 144, 212, 220, 234, 238, 241, 251, 252, 263, 264, 272, 273, 280, 281, 294, 299, 303, 331, 325, 335, 336, 354, 370, 409, 416, 418, 420, 423, 425, 428, 429, 446, 448, 457, 462, 473, 477, 480, 485, 487, 488, 493, 495, 528, 533, 550, 572, 577 y 579, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, las sustituciones de aminoácidos incluyen la sustitución del residuo de aminoácido existente en la posición indicada con cualquier otro residuo de aminoácido (incluidos tanto los residuos de aminoácidos de origen natural y no natural). En algunas modalidades, la sustitución de aminoácidos es una sustitución conservadora; alternativamente, la sustitución de aminoácidos puede ser una sustitución no conservadora. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto las polimerasas de referencia como las recombinantes pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, la polimerasa recombinante muestra un cambio en uno o más parámetros seleccionados del grupo que consiste en: afinidad de unión por una plantilla de ácido nucleico, capacidad amortiguadora, longitud de lectura promedio, longitud de lectura mínima, desempeño mejorado en una solución de mayor fuerza iónica, capacidad de procesamiento mejorada, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, AQ20, constante de tiempo de disociación, tasa off, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas recombinantes y de referencia en una reacción de secuenciación basada en iones. Opcionalmente, la polimerasa de referencia, la polimerasa recombinante, o tanto las polimerasas de referencia como las recombinantes pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa.
Sin estar unido a ninguna teoría particular de funcionamiento, puede observarse que en algunas modalidades una polimerasa recombinante que incluye una o más de estas mutaciones muestra una afinidad de unión alterada (por ejemplo, incrementada o disminuida) por una plantilla de ácido nucleico en relación con una polimerasa no modificada, o una tasa alterada (por ejemplo, incrementada o disminuida) de disociación de la plantilla de ácido nucleico ("tasa off') en relación con la polimerasa no modificada. En algunas modalidades, la polimerasa recombinante muestra una capacidad amortiguadora alterada (por ejemplo, incrementada o disminuida) en relación con la polimerasa no modificada. En algunas modalidades, la polimerasa recombinante muestra una longitud de lectura alterada, por ejemplo, incrementada o disminuida, o una longitud de lectura promedio libre de errores alterada, o una constante de tiempo de disociación alterada, o valores 100Q17 o 200Q17 observados alterados (por ejemplo, incrementados o disminuidos) con relación a la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante muestra una longitud de lectura alterada, por ejemplo, incrementada o disminuida, o una longitud de lectura promedio libre de errores alterada, o valores 100Q17 o 200Q17 observados alterados (por ejemplo, incrementados o disminuidos) en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante muestra un cambio en cualquiera de uno o más parámetros seleccionados del grupo que
consiste en: capacidad amortiguadora, tasa off, longitud de lectura promedio, longitud de lectura mínima, precisión absoluta, rendimiento total de secuenciación, error sistemático, sesgo de cadena, rendimiento mejorado en una solución de mayor fuerza iónica, capacidad de procesamiento mejorada, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, AQ20, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas recombinantes y de referencia en una reacción de secuenciación basada en iones. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto las polimerasas de referencia como las recombinantes pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. Opcionalmente, la polimerasa de referencia, la polimerasa recombinante, o tanto las polimerasas de referencia como las recombinantes pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa.
En algunas modalidades, la polimerasa recombinante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de la polimerasa de referencia. En algunas modalidades, la polimerasa recombinante incluye además sustituciones de aminoácidos en cualquiera o más posiciones seleccionadas del grupo que consiste en: 46, 93, 238, 252, 273, 281, 446, 473, 477, 528, 550 y 572, como así también una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en 31, 77, 113, 114, 130, 144, 212, 220, 234, 241, 251, 263, 264, 272, 280, 294, 299, 303, 331, 325, 335, 336, 354, 370, 409, 416, 418, 420, 423, 425, 428, 429, 448, 457, 462, 480, 485, 487, 488, 493, 495, 533, 577 y 579, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, las sustituciones de aminoácidos incluyen la sustitución del residuo de aminoácido existente en la posición indicada con cualquier otro residuo de aminoácido (incluidos tanto los residuos de aminoácidos de origen natural y no natural). En algunas modalidades, la sustitución de aminoácidos es una sustitución conservadora; alternativamente, la sustitución de aminoácidos puede ser una sustitución no conservadora. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante o tanto las polimerasas de referencia como las recombinantes pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 1. En algunas modalidades, la polimerasa recombinante muestra un cambio en uno o más parámetros seleccionados del grupo que consiste en: afinidad de unión por una plantilla de ácido nucleico, capacidad amortiguadora, longitud de lectura promedio, longitud de lectura mínima, precisión absoluta, rendimiento total de secuenciación, error sistemático, sesgo de cadena, desempeño mejorado en una solución de mayor fuerza iónica, capacidad de procesamiento mejorada, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, AQ20, constante de tiempo de disociación, tasa off, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas recombinantes y de referencia en una reacción de secuenciación basada en iones. Opcionalmente, la polimerasa de referencia, la polimerasa recombinante, o tanto las polimerasas de referencia como las recombinantes pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa.
En algunas modalidades, la polimerasa recombinante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de cualquiera de las SEQ ID NO: 38 - 78 o SEQ ID NO: 120-122.
En algunas modalidades, la polimerasa recombinante comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de cualquiera de las SEQ ID NO: 79 -119.
La SEQ ID NO: 16 comprende la secuencia de aminoácidos de una ADN polimerasa Bst de origen natural (de tipo silvestre).
En algunas modalidades, la polimerasa modificada consiste en o comprende una variante aislada de una ADN polimerasa Bst que tiene o comprende la secuencia de aminoácidos de la SEQ ID NO: 31.
La SEQ ID NO: 31 contiene tres sustituciones de aminoácidos en comparación con la SEQ ID NO: 16, a saber: D718K, N782R y H576M, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16.
En algunas modalidades, la polimerasa de referencia, la polimerasa modificada o tanto las polimerasas de referencia como modificadas consisten en o comprenden una variante aislada de una polimerasa que tiene o comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos de la SEQ ID NO: 31. En algunas modalidades, la polimerasa modificada es una variante de una ADN polimerasa Bst que comprende la secuencia de aminoácidos de la SEQ ID NO: 31, en donde la variante comprende una secuencia de aminoácidos
que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la SEQ ID NO: 31.
En algunas modalidades, la polimerasa de referencia es una ADN polimerasa Bst que tiene, o comprende, la secuencia de aminoácidos de la SEQ ID NO: 31 y la polimerasa modificada incluye además una o más modificaciones de aminoácidos (por ejemplo, sustituciones, eliminaciones, adiciones o modificaciones químicas de aminoácidos) en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas incluyen una eliminación o sustitución del residuo de metionina en la posición 1, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 31.
En algunas modalidades, la polimerasa modificada puede incluir la secuencia de aminoácidos de cualquier fragmento biológicamente activo de una polimerasa que tiene o comprende la secuencia de aminoácidos de la SEQ ID NO: 31. En algunas modalidades, la polimerasa de referencia y/o la polimerasa modificada pueden incluir la secuencia de aminoácidos de cualquier fragmento biológicamente activo de una polimerasa que tiene o comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos de la SEQ ID NO: 31.
La SEQ ID NO: 34 contiene cinco sustituciones de aminoácidos en comparación con la SEQ ID NO: 2, a saber, N487R, H281M, D264A, H273N y E493R, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 2.
La SEQ ID NO: 35 contiene tres sustituciones de aminoácidos en comparación con la SEQ ID NO: 2, a saber, N487R, H281M y D423K, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 2.
En algunas modalidades, la polimerasa modificada comprende una polimerasa recombinante que contiene una secuencia de aminoácidos que tiene al menos un 80 % de homología con la SEQ ID NO: 2 o un fragmento biológicamente activo de la misma, en donde la polimerasa recombinante comprende una ADN polimerasa de la Familia A que tiene uno o más sustituciones de aminoácidos en posiciones correspondientes a posiciones seleccionadas del grupo que consiste en: N487, N485, E493, A263, D264, H528, H273, D423, D480 y H281, en donde la numeración es con relación a la SEQ ID NO: 2, y donde la polimerasa recombinante muestra una disminución de la constante de tasa de disociación en comparación con la SEQ ID NO: 2. En algunas modalidades, la polimerasa recombinante incluye una o más sustituciones de aminoácidos en posiciones correspondientes a posiciones seleccionadas del grupo que consiste en: N487R, N485K, E493R, A263K, D264A, D264R, H528S, H528F, H273N, D423K, D480R y H281M, en donde la numeración es con relación a la SEQ ID NO: 2.
En algunas modalidades, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16. Opcionalmente, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa. Algunas mutaciones ilustrativas que pueden reducir o eliminar la actividad de exonucleasa de la polimerasa se describen más adelante en la presente descripción. En algunas modalidades, la polimerasa de referencia tiene o comprende la secuencia de aminoácidos de la s Eq ID NO: 16, y la polimerasa modificada tiene o comprende la secuencia de aminoácidos de la polimerasa de referencia e incluye además al menos una sustitución de aminoácidos con relación a la polimerasa de referencia. En algunas modalidades, la polimerasa modificada comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de la polimerasa de referencia. En algunas modalidades, la polimerasa modificada incluye además una o más mutaciones de aminoácidos seleccionadas del grupo que consiste en: N326R, N326K, D372K, D372H, D408N, D409R, D425A, D425H, D439M, D439K, L507A, E515K, N529R, N529K, V536K, V546K, A558K, D559A, D559R, D559Q, D559S, Y567R, H568N, L575R, H576M, E589S, E589F, E589G, V594K, V594H, V594F, D598R, I626Q, L630T, E631P, I649W, I649F, I665A, Q704R, G711K, V713M, V713I, G715K, D718S, D718K, D718N, D718R, D718T, D718G, D718I, D718K, G720R, Q723W, N724R, N724K, F743K, N752T, A757T, D775R, D775F, D775H, D775A, D775S, D775N, D775Q, N780W, N780Y, N780K, N782H, N782W, N782F, N782I, E782Q, V783R, E788R, E788Q, M790Q, H823S, H823F V828I, W872Y y D874F, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16. Sin estar unido a ninguna teoría particular de funcionamiento, puede observarse que en algunas modalidades una polimerasa modificada que incluye una o más de estas mutaciones muestra una tasa alterada (por ejemplo, incrementada o disminuida) de disociación de la plantilla de ácido nucleico ("tasa off') en relación con la polimerasa no modificada. En algunas modalidades, la polimerasa modificada muestra una constante de tiempo de disociación alterada, por ejemplo, incrementada o disminuida en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa modificada muestra una longitud de lectura alterada, por ejemplo, incrementada o disminuida, o una longitud de lectura promedio libre de errores alterada, o valores 100Q17 o 200Q17 observados alterados (por ejemplo, incrementados o disminuidos) en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa modificada muestra un cambio en uno o
más de los siguientes parámetros cinéticos: longitud de lectura promedio, longitud de lectura mínima, precisión absoluta, sesgo de cadena, error sistemático, rendimiento total de secuenciación, desempeño mejorado en una solución de mayor fuerza iónica, capacidad de procesamiento mejorada, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, constante de tiempo de disociación, tasa off, AQ20, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas de referencia y modificadas en una reacción de secuenciación basada en iones. En algunas modalidades, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16. Opcionalmente, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa.
En algunas modalidades, la polimerasa recombinante incluye al menos un 80 % de identidad con la SEQ ID NO: 31 o un fragmento de la misma, muestra actividad de polimerasa e incluye además una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E325K, G504Q, N529K o N529R, P531I o P531R, V536K, V546R, L547R, E515H o E515K o E515T, E540R, S555K, D559K o D559M, E562M o E562K o E562R, E572T, E589K, T619R, E620R, A639Y, E751R, E737R, E737Y, H768G, M790C, A787K, D775L, D775R, N780R, E788G o E788R, N812C o N812K, E817C y H823T en donde la numeración es con relación a la SEQ ID NO: 31.
En algunas modalidades, las sustituciones de aminoácidos incluyen la sustitución del residuo de aminoácido existente en la posición indicada con cualquier otro residuo de aminoácido (incluidos tanto los residuos de aminoácidos de origen natural y no natural). En algunas modalidades, la sustitución de aminoácidos incluye una sustitución conservadora; alternativamente, la sustitución de aminoácidos puede incluir una sustitución no conservadora. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante, o tanto la polimerasa de referencia como la recombinante pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 31. En algunas modalidades, la polimerasa recombinante muestra una mejora en uno o más parámetros de secuenciación seleccionados del grupo que consiste en longitud de lectura promedio, precisión, sesgo de cadena, error sistemático, rendimiento total de secuenciación y capacidad de procesamiento mejorada, en comparación con la polimerasa de referencia. Opcionalmente, la mejora en el uno o más parámetros de secuenciación se observa comparando el rendimiento de la polimerasa recombinante y de referencia en una reacción de secuenciación basada en iones. Opcionalmente, la polimerasa de referencia, la polimerasa recombinante o tanto la polimerasa de referencia como la recombinante pueden incluir además una o más sustituciones de aminoácidos que reducen o eliminan la actividad de exonucleasa.
En algunas modalidades, la polimerasa recombinante incluye al menos 80 % de identidad con la SEQ ID NO: 35 o un fragmento de la misma, muestra actividad de polimerasa e incluye además una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H o E220T, N234K, P236I o P236R, E245R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 35.
En algunas modalidades, la polimerasa recombinante incluye al menos 80 % de identidad con la SEQ ID NO: 35 o un fragmento de la misma, muestra actividad de polimerasa e incluye además dos o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 35.
En algunas modalidades, las sustituciones de aminoácidos incluyen la sustitución del residuo de aminoácido existente en la posición indicada con cualquier otro residuo de aminoácido (incluidos tanto los residuos de aminoácidos de origen natural y no natural). En algunas modalidades, la sustitución de aminoácidos incluye una sustitución conservadora; alternativamente, la sustitución de aminoácidos puede incluir una sustitución no conservadora. En algunas modalidades, la polimerasa de referencia, la polimerasa recombinante, o tanto la polimerasa de referencia como la recombinante pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 35. En algunas modalidades, la polimerasa recombinante muestra una mejora en uno o más parámetros de secuenciación seleccionados del grupo que consiste en longitud de lectura promedio, precisión, sesgo de cadena, error sistemático, rendimiento total de secuenciación y capacidad de procesamiento mejorada, en comparación con la polimerasa de referencia. Opcionalmente, la mejora en el uno o más parámetros de secuenciación se observa comparando el rendimiento de la polimerasa recombinante y de referencia en una reacción de secuenciación basada en iones. Opcionalmente, la polimerasa de referencia, la polimerasa recombinante o tanto la polimerasa de referencia como la
recombinante pueden incluir además una o más sustituciones de aminoácidos que reducen o eliminan la actividad de exonucleasa.
En algunas modalidades, la polimerasa modificada comprende una secuencia de aminoácidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 % o al menos 99 % idéntica a la secuencia de aminoácidos de la polimerasa de referencia.
En algunas modalidades, la polimerasa modificada tiene actividad de polimerasa. La polimerasa modificada o el fragmento biológicamente activo puede tener actividad de extensión del cebador in vivo o in vitro.
En algunas modalidades, la polimerasa modificada incluye además al menos una sustitución de aminoácidos seleccionada del grupo que consiste en: H341A, H341R, L547R, H568A, H568R, H576A, H576R, H576M, E741Q, H768A, H768R, Y772F, H823A, H823R, H823K, H867A y H867R, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16. En algunas modalidades, la polimerasa modificada incluye cualquiera de dos, tres, cuatro, cinco o más de estas sustituciones de aminoácidos.
En algunas modalidades, una polimerasa modificada que incluye una o más de estas mutaciones muestra una afinidad de unión alterada (por ejemplo, incrementada o disminuida) por una plantilla de ácido nucleico en relación con la polimerasa no modificada correspondiente o con una polimerasa de referencia. En algunas modalidades, la polimerasa modificada tiene una tasa de disociación alterada (por ejemplo, incrementada o disminuida) de la plantilla de ácido nucleico ("tasa off') en relación con la polimerasa no modificada o con una polimerasa de referencia. En algunas modalidades, la polimerasa modificada muestra una longitud de lectura alterada, por ejemplo, incrementada o disminuida, o precisión absoluta incrementada, o sesgo de cadena disminuido, o error sistemático reducido, o rendimiento total de secuenciación incrementado, o una longitud de lectura promedio libre de errores alterada, o valores 100Q17 o 200Q17 observados alterados (por ejemplo, incrementados o disminuidos) en relación con la polimerasa de referencia. En algunas modalidades, la polimerasa modificada muestra un cambio en uno o más de los siguientes parámetros cinéticos: longitud de lectura promedio, longitud de lectura mínima, precisión absoluta, sesgo de cadena, error sistemático, rendimiento total de secuenciación, desempeño mejorado en una solución de mayor fuerza iónica, capacidad de procesamiento mejorada, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, constante de tiempo de disociación, tasa off, AQ20, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas de referencia y modificadas en una reacción de secuenciación basada en iones. En algunas modalidades, las sustituciones de aminoácidos incluyen la sustitución del residuo de aminoácido existente en la posición indicada con cualquier otro residuo de aminoácido (incluidos tanto los residuos de aminoácidos de origen natural y no natural). En algunas modalidades, la sustitución de aminoácidos es una sustitución conservadora; alternativamente, la sustitución de aminoácidos puede ser una sustitución no conservadora. En algunas modalidades, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una eliminación del residuo de metionina en la posición 1, o una sustitución del residuo de metionina en la posición 1 con cualquier otro residuo de aminoácido, en donde la numeración es con relación a la secuencia de aminoácidos de la SEQ ID NO: 16. En algunas modalidades, la polimerasa modificada muestra un cambio en uno o más parámetros seleccionados del grupo que consiste en: capacidad amortiguadora, longitud de lectura promedio, longitud de lectura mínima, desempeño mejorado en una solución de mayor fuerza iónica, mejora de la capacidad de procesamiento, rendimiento en la reacción en cadena de la polimerasa, rendimiento en la reacción en cadena de la polimerasa en emulsión, tasa off, AQ20, valor 100Q17 y valor 200Q17, en relación con la polimerasa de referencia. Opcionalmente, el cambio se observa comparando el rendimiento de las polimerasas de referencia y modificadas en una reacción de secuenciación basada en iones. Opcionalmente, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan la actividad de exonucleasa.
En algunas modalidades, la polimerasa modificada tiene una afinidad de unión alterada (por ejemplo, incrementada o disminuida) por una plantilla de ácido nucleico en relación con una polimerasa de referencia. En algunas modalidades, la polimerasa modificada tiene una tasa de disociación alterada (por ejemplo, incrementada o disminuida) de la plantilla de ácido nucleico ("tasa off') en relación con una polimerasa de referencia. En algunas modalidades, la polimerasa modificada muestra una longitud de lectura alterada (por ejemplo, incrementada o disminuida), o una longitud de lectura promedio libre de errores alterada (por ejemplo, incrementada o disminuida), o un valor 100Q17 o 200Q17 observado alterado (por ejemplo, incrementado o disminuido) con relación a la polimerasa de referencia. En algunas modalidades, la polimerasa modificada muestra un cambio (por ejemplo, incremento o disminución) en cualquiera o más de las siguientes propiedades: afinidad de unión por una plantilla de ácido nucleico, constante de tiempo de disociación, tasa off, valor 100Q17 y valor 200Q17, con relación a la polimerasa de referencia. En algunas modalidades, la propiedad alterada incrementa o disminuye en al menos un 10 %, 20 %, 30 %, 40 %, 50 %, 75 %, 90 %, 100 %, 200 %, 300 %, 500 %, 750 %, 1000 %, 3000 % o más, con respecto a la polimerasa de referencia correspondiente. Opcionalmente, el cambio se observa comparando las propiedades de las polimerasas de referencia y modificadas en una reacción de secuenciación basada en iones.
Opcionalmente, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas pueden incluir además una o más mutaciones de aminoácidos que disminuyen o eliminan cualquier actividad de exonucleasa de la polimerasa. En algunas modalidades, la polimerasa de referencia, la polimerasa modificada, o tanto las polimerasas de referencia como modificadas, es una ADN polimerasa Bst que tiene actividad de exonucleasa correctora. En diversas modalidades, la actividad de exonucleasa correctora de una ADN polimerasa Bst modificada es al menos aproximadamente 40 %, 50 %, 60 %, 70 %, 80 % o 90 % de la correspondiente proteína de tipo silvestre. Para mantener la actividad de exonucleasa correctora de una ADN polimerasa Bst modificada, el experto en la técnica comprenderá que deben realizarse sustituciones, eliminaciones o modificaciones químicas en los residuos de aminoácidos que no están altamente conservados dentro de los motivos Exo I, Exo II y Exo III.
Como apreciará fácilmente el experto en la técnica, el alcance de la presente descripción abarca no solo las secuencias específicas de aminoácidos y/o nucleótidos descritas en la presente descripción, sino también, por ejemplo, muchas secuencias relacionadas que codifican genes y/o péptidos con las propiedades funcionales descritas en la presente descripción. Por ejemplo, el alcance de la descripción abarca cualquier secuencia de nucleótidos y aminoácidos que codifique variantes conservadoras de las diversas polimerasas descritas en la presente descripción. También será evidente para el experto en la técnica que las polimerasas modificadas descritas en la presente descripción por secuencia de aminoácidos pueden convertirse en la secuencia de nucleótidos correspondiente sin una experimentación indebida, por ejemplo, mediante el uso de una serie de aplicaciones de conversión de secuencias disponibles gratuitamente (por ejemplo, "in-silico"). El objeto de los siguientes ejemplos que no se relaciona con polimerasas Bst mutantes no forma parte de la invención reivindicada.
Tabla 1.
Si bien no se desea limitarse a ninguna teoría en particular, se observó que nueve mutaciones de aminoácidos diferentes por polimerasa (de la Tabla 1) eran transferibles (homólogas) entre las cuatro polimerasas (polimerasa Bst de longitud completa (SEQ ID NO: 16), polimerasa Bst de fragmento grande (581 aminoácidos) (SEQ ID NO: 1), ADN polimerasa Taq (SEQ ID NO: 15) y Fragmento Klenow de Pol I de E. Coli (SEQ ID NO: 18)). Como resultado, se cree razonablemente que una vez que se identifica una mutación de aminoácido en una polimerasa que proporciona propiedades catalíticas alteradas, la mutación de aminoácido puede tamizarse mediante el uso de métodos conocidos por los expertos en la técnica (tal como la alineación de secuencias de aminoácidos o nucleótidos), para determinar si la mutación de aminoácidos puede transferirse a una polimerasa diferente, tal como una especie, clase o familia de polimerasas diferente (como se demuestra en la presente descripción). La mutación de aminoácido transferible (u homóloga) puede incluir una mutación de aminoácido que mejora las propiedades catalíticas, como incremento de la longitud de lectura, incremento de la precisión absoluta, disminución del sesgo de cadena, reducción del error sistemático, mejor precisión del homopolímero, incremento del rendimiento total de secuenciación, incremento de la longitud de lectura sin error, mejora de la capacidad de procesamiento mejorada, incremento del valor 100Q17, incremento del valor 200Q17 y similares. En algunas modalidades, la mutación de aminoácido transferible (u homóloga) puede incluir una mutación de aminoácido que disminuye las propiedades catalíticas tales como disminución de la longitud de lectura, disminución de la longitud de lectura sin error, disminución de la capacidad de procesamiento, reducción del valor 100Q17, reducción del valor 200Q17 reducido y similares. Una mutación de aminoácido transferible (u homóloga) puede incluir la transferencia de una o más mutaciones de aminoácidos a otra polimerasa dentro o entre familias de ADN polimerasa, tal como la familia A de ADN polimerasa, la familia B de ADN polimerasa o la familia C de ADN polimerasa. Será evidente para el experto en la técnica que una mutación de aminoácido transferible (es decir, homóloga), tal como una sustitución de aminoácido presente en una primera polimerasa, puede transferirse a una posición de aminoácido correspondiente en una polimerasa homóloga. Por ejemplo, la alineación de la secuencia de la primera polimerasa que tiene la primera sustitución de aminoácido contra una ADN polimerasa de la familia B, una ADN polimerasa de la familia A o una
ADN polimerasa de la familia C puede dar como resultado la identificación del residuo de aminoácido correspondiente en la ADN polimerasa homóloga de la familia A, familia B o familia C. Los ejemplos de alineación de la polimerasa de ADN de la familia B son bien conocidos en la técnica e incluyen, por ejemplo, Hopfner y otros, Proc. Natl. Acad. Sci. USA (1999), 96: 3600-3605 y Kahler y Antranikian, Bacteriol., (2000), 182: 655-663. Los ejemplos de alineaciones de la ADN polimerasa de las familias A y C también son bien conocidos en la técnica e incluyen, por ejemplo Ito y Braithwaite, Nucleic Acids Research, (1991), Vol. 19, 15: 4045-4057, y Braithwaite and Ito, Nucleic Acids Research, (1993), Vol. 21, 4: 787-802,. Una mutación de aminoácido transferible (u homóloga) puede incluir la transferencia de una o más mutaciones de aminoácidos a una o más polimerasas dentro o entre familias de ADN polimerasas, tal como a través de ADN polimerasas bacterianas, virales, arqueológicas, eucarióticas o de fagos.
La descripción también incluye ADN polimerasas mutantes de la familia A, B o C distintas de la ADN polimerasa Bst, que incluyen mutaciones de aminoácidos correspondientes a (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H o E220T, N234K, P236I o P236R, E245R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T de ADN polimerasa Bst; o (b) dos o más sustituciones de aminoácidos seleccionadas de E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T de ADN polimerasa Bst. La ADN polimerasa mutante (por ejemplo, recombinante) puede producir una tasa de error sistemático promedio más baja o una precisión mejorada cuando se usa en una reacción de secuenciación por síntesis en comparación con la tasa de error sistemático promedio o la precisión lograda mediante el uso de una polimerasa de tipo silvestre correspondiente. La polimerasa mutante (por ejemplo, recombinante) en modalidades ilustrativas, incluye sustituciones de aminoácidos en la polimerasa de las familias de A, B o C que son equivalentes a H46R, E446q y H572R, y/o las mutaciones H281M, D423K y N487R, de la ADN polimerasa Bst. En modalidades ilustrativas, las polimerasas mutantes incluyen polimerasas de la familia A, B o C que incluyen mutaciones de aminoácidos correspondientes a cualquiera o todas las 9 mutaciones de aminoácidos en la SEQ ID NO: 119 descritas en la presente descripción para la ADN polimerasa Bst. El Ejemplo 3 demuestra que pueden generarse mutaciones mutantes de Klenow con una mutación correspondiente (D505R), a un mutante (D775R) del fragmento de 581 aminoácidos de la ADN polimerasa Bst, y proporciona una actividad mejorada similar a la ADN polimerasa Bst mutante. En la presente descripción se proporciona un fragmento Klenow o una polimerasa Taq que incluye la mutación correspondiente al fragmento de polimerasa Bst mutante de 581 aminoácidos que tiene L252R, en donde la numeración es con relación a la SEQ ID NO: 1. Por ejemplo, tal fragmento Klenow tiene L276R o tal polimerasa Taq tiene I503R. En consecuencia, en la presente descripción se proporciona una polimerasa Klenow mutante aislada (por ejemplo, recombinante) que es 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % idéntica a la SEQ ID NO: 18 que tiene L276R, o idéntica a la SEQ ID NO: 18 excepto L276R. Se espera que el mutante Klenow o Taq produzca una reducción del error cuando se usa en una secuenciación basada en iones mediante una reacción de síntesis, tal como una reacción en la que se liberan o detectan iones de hidrógeno. En ejemplos ilustrativos, se proporciona en la presente descripción una polimerasa Taq mutante aislada que es 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % idéntica a la SEQ ID No : 15 que tiene I503R, o idéntica a la SEQ ID NO: 15 excepto para I503R.
Ciertos aspectos de la invención incluyen ácidos nucleicos o polinucleótidos que codifican cualquiera de las ADN polimerasas Bst mutantes proporcionadas en la presente descripción. Tales ácidos nucleicos pueden incluirse en vectores, tales como vectores de expresión que incluyen cualquier elemento de vector adicional conocido en la técnica para tal tipo de vectores. Por ejemplo, tales vectores pueden incluir un origen de replicación, un promotor tal como, por ejemplo, un promotor inducible, una señal poli A y pueden codificar una etiqueta, tal como una etiqueta detectable o una etiqueta de purificación. Como tal, las modalidades en la presente descripción incluyen polipéptidos mutantes proporcionados en la presente descripción, como proteínas de fusión, fusionados con una etiqueta detectable y/o una etiqueta de purificación. La SEQ ID NO: 17 incluye una secuencia de ácido nucleico que codifica una polimerasa modificada ilustrativa que tiene la secuencia de aminoácidos de la SEQ ID NO: 2 e incluye además la mutación D775R. Será fácilmente evidente para el experto en la técnica cómo modificar la secuencia de ácido nucleico de la SEQ ID NO: 17 para generar secuencias de ácido nucleico que codifiquen cualquiera de las otras polimerasas de referencia o modificadas ilustrativas descritas en la presente descripción. Como tal, en la presente descripción se proporcionan moléculas de ácido nucleico recombinante (es decir, polinucleótidos) y vectores de expresión recombinantes que incluyen los mismos, que codifican una ADN polimerasa Bst mutante, que incluyen un segmento de polipéptido que es 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % idénticos a la SEQ ID NO: 1 o s Eq nO: 16, que tienen mutaciones de aminoácidos correspondientes a (a) una o más sustituciones de aminoácidos seleccionadas de la grupo que consiste en (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1 de ADN polimerasa Bst. La ADN polimerasa mutante (por ejemplo, recombinante) codificada puede producir una tasa de error sistemático promedio más baja o una precisión mejorada cuando se usa en una reacción de secuenciación por síntesis en comparación con la tasa de error sistemático promedio o la
precisión lograda mediante el uso de una polimerasa de tipo silvestre correspondiente, o cualquiera de las propiedades mejoradas para estas polimerasas proporcionadas en los Ejemplos de la presente descripción. La polimerasa mutante recombinante codificada en modalidades ilustrativas de ácido nucleico y vectores incluye las sustituciones de aminoácidos H46R, E446Q y H572R y/o las mutaciones H281M, D423K y N487R de la ADN polimerasa Bst. La ADN polimerasa mutante (por ejemplo, recombinante) codificada en ejemplos ilustrativos de ácidos nucleicos y vectores incluye uno o más de L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1). En consecuencia, en ciertos ejemplos proporcionados en la presente descripción, hay ácidos nucleicos (es decir, polinucleótidos) y vectores que incluyen los ácidos nucleicos que codifican una ADN polimerasa mutante (por ejemplo, recombinante) que tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1 o SEQ ID NO: 16, o un fragmento de la misma, muestra actividad de polimerasa, incluye sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además cualquiera de L252R, H473G. o H528T, o todos los L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ilustrativa que tiene tales mutaciones, el ácido nucleico y el vector que incluyen la misma codifican la ADN polimerasa Bst mutante que tiene la secuencia de la SEQ ID NO: 119 o SEQ ID NO: 121. En algunas modalidades, la secuencia de nucleótidos puede diseñarse empleando principios de preferencia de codones para incrementar los niveles de expresión de proteínas en un organismo huésped dado.
En algunas modalidades, para disminuir la tasa de disociación de la plantilla de la polimerasa (e incrementar su capacidad de procesamiento), la polimerasa modificada o cualquier fragmento biológicamente activo de una polimerasa puede incluir una o más mutaciones de aminoácidos que hacen que la modificación se disocie más lentamente de la plantilla de ácido nucleico. Tales mutaciones pueden tener el efecto adicional de incrementar la longitud de lectura (o la longitud de lectura libre de errores) de la polimerasa modificada en relación con su contraparte no modificada.
En algunas modalidades, la polimerasa modificada o cualquier fragmento biológicamente activo de una polimerasa puede incluir uno o más restos de biotina. Como se usa en la presente descripción, los términos "biotina" y "resto de biotina" y sus variantes comprenden biotina (ácido cis-hexahidro-2-oxo-1H-tieno[3,4]imidazol-4-pentanoico) y cualquier derivado y análogo de la misma, incluyendo compuestos similares a la biotina. Tales compuestos incluyen, por ejemplo, biotina-e-N-lisina, biocitina hidrazida, derivados amino o sulfhidrilo de 2-iminobiotina y éster de biotinilácido £-aminocaproico-N-hidroxisuccinimida, sulfosuccinimideiminobiotina, biotinabromoacetilhidrazida, pdiazobenzoil biocitina, 3-(N-maleimidopropionil) biocitina y similares, así como también cualquier variante de biotina que pueda unirse específicamente a un resto de avidina. Los términos "avidina" y "resto de avidina" y sus variantes, como se usan en la presente descripción, comprenden la glicoproteína de clara de huevo nativa avidina, así como también cualquier derivado, análogo y otras formas no nativas de avidina, que pueden unirse específicamente a los restos de biotina. En algunas modalidades, el resto de avidina puede comprender formas desglicosiladas de avidina, estreptavidinas bacterianas producidas por cepas seleccionadas de Streptomyces, por ejemplo, Streptomyces avidinii, estreptavidinas truncadas y avidina recombinante y estreptavidina, así como también derivados de avidina nativa, desglicosilada y recombinante y de estreptavidina nativa, recombinante y truncada, por ejemplo, N-acil avidinas, por ejemplo, N-acetil, N-ftalil y N-succinil avidina, y los productos comerciales ExtrAvidin®, Captavidin®, Neutravidin® y Neutralite Avidin®. Todas las formas de moléculas de tipo avidina, incluidas avidina y estreptavidina nativas y recombinantes, así como también moléculas derivadas, por ejemplo, avidinas no glicosiladas, N-acilavidinas y estreptavidinas truncadas, se incluyen en los términos "avidina" y "resto de avidina". Típicamente, pero no necesariamente, la avidina existe como una proteína tetramérica, en donde cada uno de los cuatro tetrámeros es capaz de unirse al menos a un resto de biotina. Como se usa en la presente descripción, el término "enlace biotinaavidina" y sus variantes se refieren a un enlace específico formado entre un resto de biotina y un residuo de avidina. Típicamente, un resto de biotina puede unirse con alta afinidad a un resto de avidina, con una constante de disociación Kd típicamente del orden de 10-14 a 10-15 mol/L. Típicamente, tal unión se produce a través de interacciones no covalentes.
En algunas modalidades, la polimerasa modificada o cualquier fragmento biológicamente activo de una polimerasa puede incluir uno o más aminoácidos modificados o sustituidos con respecto a una polimerasa de referencia, y puede incluir además un resto de biotina que se enlaza a al menos uno de uno o más aminoácidos modificados o sustituidos. El resto de biotina puede enlazarse a la polimerasa modificada mediante el uso de cualquier método de enlace adecuado. En algunas modalidades, la polimerasa modificada incluye una o más sustituciones de reemplazo de cisteína, y el resto de enlace incluye un resto de biotina que se enlaza a al menos una de las sustituciones de reemplazo de cisteína.
En algunos ejemplos, la polimerasa modificada es una polimerasa biotinilada. El término "biotinilada" y sus variantes, como se usa en la presente descripción, se refiere a cualquier aducto covalente o no covalente de biotina con otros restos tales como biomoléculas, por ejemplo, proteínas, ácidos nucleicos (incluidos ADN, ARN, moléculas quiméricas de ADN/ARN, análogos de ácidos y ácidos nucleicos peptídicos), proteínas (incluyendo enzimas, péptidos y anticuerpos), carbohidratos, lípidos, etc.
La descripción también se refiere en general a las composiciones (así como también a los métodos, kits y aparatos relacionados) que comprenden una polimerasa recombinante que incluye al menos una mutación de aminoácidos en
relación con una polimerasa de referencia, en donde la polimerasa recombinante tiene una tasa de disociación más lenta de una plantilla de ácido nucleico con relación a la polimerasa de referencia. La tasa de disociación puede modificarse de modo que la tasa de disociación incremente la afinidad de unión, por ejemplo, en presencia de osmolitos neutros tales como betaína, N-óxido de trimetilamina, trehalosa, sacarosa, etilenglicoles y similares.
Como se usa en la presente descripción, los términos "tasa de disociación" o "tasa off' se refieren a la tasa de disociación de una polimerasa dada de un ácido nucleico plantilla dado. La tasa de disociación (tasa off) puede variar con las condiciones de reacción, incluidas la temperatura, las concentraciones salinas, las concentraciones relativas de polimerasa y plantilla, y similares. La tasa de disociación puede estimarse midiendo la disminución de la cantidad total de polimerasa unida a un ácido nucleico plantilla en condiciones de reacción dadas. Tales ensayos pueden realizarse opcionalmente mediante el uso de condiciones en las que se evita la unión de la polimerasa a la plantilla después de la disociación de la polimerasa de la plantilla. Por ejemplo, en un experimento de unión por disociación típico para medir la "tasa off' de la polimerasa que se disocia de la plantilla de ácido nucleico, se permite inicialmente que la polimerasa y la plantilla de ácido nucleico se unan, opcionalmente hasta el equilibrio. Opcionalmente, la polimerasa puede marcarse mediante el uso de cualquier marcador adecuado (por ejemplo, marcadores radiactivos o fluorescentes). En este punto, puede bloquearse opcionalmente la unión adicional de la polimerasa a la plantilla para simplificar la medición de la tasa de disociación de la plantilla. Tal bloqueo puede realizarse mediante el uso de cualquier método adecuado. Por ejemplo, en los ejemplos en los que la plantilla se fija a una superficie y la polimerasa se marca, el bloqueo puede lograrse (1) eliminando el amortiguador que incluye la polimerasa marcada y reemplazándolo con un amortiguador que no incluye la polimerasa marcada, o (2) añadiendo a la mezcla de reacción una concentración muy alta de polimerasa sin marcar; o (3) diluir la mezcla de reacción por un factor grande (por ejemplo, al menos 20 o 100 veces), particularmente cuando la concentración inicial de polimerasa marcada es baja. Después de tal bloqueo, la cantidad total de polimerasa unida a la plantilla puede medirse en varios momentos después de tal bloqueo para determinar qué tan rápido se disocia la polimerasa de la plantilla. La cantidad de polimerasa unida a la plantilla puede mapearse (eje Y) frente al tiempo (eje X). En algunas modalidades, la curva resultante se aproxima a una única curva de caída exponencial.
El análisis de los experimentos de unión puede basarse en un modelo simple derivado de la ley de acción de masas. Este modelo asume que la unión es reversible y permite el cálculo de koff, la constante de tasa de disociación. (En el siguiente análisis, la polimerasa y la plantilla de ácido nucleico se denominan "ligando" y "receptor"):
Receptor Ligando Receptor • Ligando
4 Koff
La unión se produce cuando la polimerasa y el ácido nucleico plantilla chocan debido a la difusión, y cuando la colisión tiene la orientación correcta y suficiente energía. La tasa de asociación es:
Número de eventos de unión por unidad de tiempo = [Ligando] • [Receptor] • kon.
Una vez que se ha producido la unión, el ligando y el receptor pueden permanecer unidos durante un período de tiempo aleatorio. La probabilidad de disociación es la misma en cada instante de tiempo.
La tasa de disociación es:
Número de eventos de disociación por unidad de tiempo = [ligando • receptor] • koff.
El equilibrio se alcanza cuando la tasa a la que los nuevos complejos de ligando • receptor se forman es igual a la tasa a la que los complejos de ligando • receptor se disocian. En equilibrio:
[Ligando] • [Receptor] • kon = [Ligando • Receptor] • koff
Esta ecuación se puede reorganizar para definir la constante de disociación de equilibrio Kd.
([Ligando] • [Receptor]) = koff = Kd
([Ligando^Receptor]) kon
Si [Ligando] se establece como igual a Kd en la ecuación anterior, los términos de Kd se cancelan y [Receptor]/ [Ligandô Receptor]=1,
entonces [Receptor] es igual a [Ligando-Receptor]. Dado que todos los receptores son libres o están unidos a un ligando, esto significa que la mitad de los receptores están libres y la otra mitad están unidos a un ligando. En otras palabras, cuando la concentración de ligando sea igual a la Kd, la mitad de los receptores estarán ocupados en el
equilibrio. Si los receptores tienen una alta afinidad por el ligando, la Kd será baja, ya que se necesitará una baja concentración de ligando para unirse a la mitad de los receptores.
En tal modelo, Kd, la constante de disociación de equilibrio, es diferente de koff, la constante de tasa de disociación (también denominada en la presente descripción "constante de tiempo de disociación").
En un ensayo ilustrativo, como se describe en los Ejemplos de la presente descripción, la constante de tiempo de disociación de una polimerasa dada puede medirse incubando la polimerasa con un oligonucleótido marcado que incluye un marcador fluorescente (denominado en la presente descripción "oligonucleótido 221") en condiciones definidas. Cuando el oligonucleótido no se une a la polimerasa, la fluorescencia del marcador fluorescente en el oligonucleótido se apaga; la unión de la polimerasa al oligonucleótido da como resultado la activación del marcador de oligonucleótido y un incremento resultante de la fluorescencia. El bloqueo se inicia al añadir un oligonucleótido competidor no marcado a la mezcla de reacción; a medida que la polimerasa se disocia del oligonucleótido 221 marcado con fluorescencia, el oligonucleótido competidor se hibrida con el oligonucleótido 221 y evita la unión adicional de la polimerasa. La fluorescencia se controla a lo largo del tiempo. La fluorescencia de la mezcla de reacción se mide en varios momentos después de la adición del oligonucleótido competidor. La fluorescencia observada (en RFU o unidades relativas de fluorescencia) se representa gráficamente (eje Y) frente al tiempo (eje X). Para comparar las tasas de disociación de dos o más enzimas diferentes (por ejemplo, una polimerasa de referencia y una modificada), cada enzima puede emplearse en una reacción paralela y separada en la que se mide la fluorescencia de cada mezcla de reacción en varios puntos de tiempo, después de lo cual las tasas de disociación para cada enzima pueden calcularse mediante el uso de cualquier método adecuado y compararse. En los Ejemplos proporcionados en la presente descripción, las tasas de disociación se calculan de acuerdo con la siguiente fórmula:
Y = (Y0 - Meseta)*exp('K,X) Meseta
Donde:
Y0 es el valor de Y cuando X (tiempo) es cero. Se expresa en las mismas unidades que Y,
Meseta es el valor de Y en tiempos infinitos, expresado en las mismas unidades que Y.
K es la constante de tasa, expresada en el recíproco de las unidades de tiempo del eje X. Si X está en minutos, entonces K se expresa en minutos inversos.
Tau es la constante de tiempo, expresada en las mismas unidades que el eje X. Se calcula como el recíproco de K.
La vida media está en las unidades de tiempo del eje X. Se calcula como In(2)/K.
Intervalo, es decir, (Y0 - Meseta), es la diferencia entre Y0 y Meseta, expresada en las mismas unidades que sus valores Y.
La Figura 1 representa los resultados de un ensayo ilustrativo realizado como se describe en los Ejemplos, donde las constantes de tiempo de disociación para varios mutantes de Bst ilustrativos se miden a concentraciones salinas variables y se comparan.
En algunas modalidades, la descripción se relaciona generalmente con un método para incorporar al menos un nucleótido en un cebador, que comprende poner en contacto un complejo de ácido nucleico que incluye un ácido nucleico de plantilla con un cebador y una polimerasa mutante (por ejemplo, recombinante) proporcionada en la presente descripción, en presencia de uno o más nucleótidos, e incorporando al menos uno del uno o más nucleótidos en el cebador de una manera dependiente de la plantilla mediante el uso de dicha polimerasa modificada.
Los métodos para la incorporación de nucleótidos son bien conocidos en la técnica y típicamente comprenden el uso de una mezcla de reacción de polimerasa en la que la polimerasa se pone en contacto con el ácido nucleico plantilla en condiciones de incorporación de nucleótidos. Cuando la reacción de incorporación de nucleótidos comprende la polimerización de nucleótidos en el extremo de un cebador, el proceso se denomina típicamente "extensión del cebador". Típicamente, pero no necesariamente, tal incorporación de nucleótidos se produce de una manera dependiente de la plantilla. La extensión del cebador y otros ensayos de incorporación de nucleótidos se realizan típicamente poniendo en contacto el ácido nucleico plantilla con una polimerasa en presencia de nucleótidos en una solución acuosa en condiciones de incorporación de nucleótidos. En algunas modalidades, la reacción de incorporación de nucleótidos puede incluir un cebador, que opcionalmente puede hibridarse con la plantilla para formar un dúplex de cebador-plantilla. Las condiciones típicas de incorporación de nucleótidos se logran una vez que la plantilla, la polimerasa, los nucleótidos y, opcionalmente, el cebador, se mezclan entre sí en una formulación acuosa adecuada, formando de este modo una mezcla de reacción de incorporación de nucleótidos (o mezcla de extensión del cebador). La formulación acuosa puede incluir opcionalmente cationes y/o sales divalentes,
particularmente iones Mg++ y/o Ca++. La formulación acuosa puede incluir opcionalmente aniones y/o sales divalentes, particularmente SO42-. Las condiciones típicas de incorporación de nucleótidos han incluido parámetros bien conocidos de tiempo, temperatura, pH, reactivos, amortiguadores, reactivos, sales, cofactores, nucleótidos, ADN diana, ADN cebador, enzimas tales como polimerasa dependiente de ácido nucleico, cantidades y/o relaciones de los componentes en las reacciones, y similares. Los reactivos o amortiguadores pueden incluir una fuente de iones monovalentes, tal como KCl, K-acetato, NH4-acetato, K-glutamato, NH4Cl o sulfato de amonio. Los reactivos o amortiguadores pueden incluir una fuente de iones divalentes, tales como Mg2+ y/o Mn2+, MgCh o Mg-acetato. En algunas modalidades, los reactivos o amortiguadores pueden incluir una fuente de detergente tal como Triton y/o Tween. La mayoría de las polimerasas muestran algunos niveles de actividad de incorporación de nucleótidos en un intervalo de pH de aproximadamente 5,0 a aproximadamente 9,5, más típicamente entre aproximadamente pH 7 y aproximadamente pH 9, a veces entre aproximadamente pH 6 y aproximadamente pH 8 y, a veces, entre aproximadamente 7 y 8. El amortiguador puede incluir agentes quelantes tales como e DtA y EGTA y similares. Aunque en algunas modalidades, las reacciones de incorporación de nucleótidos pueden incluir agentes amortiguadores, tales como Tris, Tricina, HEPES, MOPS, ACES o MES, que pueden proporcionar un intervalo de pH de aproximadamente 5,0 a aproximadamente 9,5, tales agentes amortiguadores pueden reducirse o eliminarse opcionalmente cuando se realizan reacciones basadas en iones que requieren la detección de subproductos iónicos. Los métodos para realizar la síntesis de ácidos nucleicos son bien conocidos y se practican ampliamente en la técnica y las referencias que enseñan una amplia gama de técnicas de síntesis de ácidos nucleicos están fácilmente disponibles. Algunas enseñanzas ilustrativas con respecto al rendimiento de la síntesis de ácidos nucleicos (incluyendo, por ejemplo, la incorporación de nucleótidos dependientes de la plantilla, así como también los métodos de extensión del cebador) pueden encontrarse, por ejemplo, en Kim y otros, Nature 376: 612-616 (2002); Ichida y otros, Nucleic Acids Res. 33: 5214-5222 (2005); Pandey y otros, European Journal of Biochemistry, 214:59-65 (1993); Blanco y otros, J. Biol. Chem. 268: 16763-16770 (1993); solicitud de patente de los Estados Unidos núm. de serie 12/002781, ahora publicada como Solicitud de patente de los Estados Unidos núm. 2009/0026082; solicitud de patente de los Estados Unidos núm. de serie 12/474897, ahora publicada como solicitud de patente de los Estados Unidos núm. 2010/0137143; y solicitud de patente de los Estados Unidos núm. de serie 12/492844, ahora publicada como solicitud de patente de los Estados Unidos núm. 2010/0282617; solicitud de patente de los Estados Unidos núm. 12/748359, ahora publicada como solicitud de patente de los Estados Unidos núm. 20110014612. Dada la amplia enseñanza de la extensión del cebador y otras reacciones de incorporación de nucleótidos en la técnica, las condiciones de reacción adecuadas para usar las polimerasas recombinantes de la descripción para realizar la incorporación de nucleótidos serán fácilmente evidentes para el experto en la técnica.
La descripción se refiere en general a composiciones (por ejemplo, reactivos) y kits útiles para realizar reacciones de polimerización de nucleótidos, reacciones de amplificación de ácidos nucleicos y/o reacciones de secuenciación de ácidos nucleicos, mediante el uso de polimerasas mutantes (por ejemplo, recombinantes), que incluyen cualquiera de las polimerasas mutantes recombinantes ilustrativas descritas en la presente descripción. Las reacciones de polimerización de nucleótidos pueden incluir, sin limitación, reacciones de incorporación de nucleótidos (incluyendo reacciones de incorporación de nucleótidos tanto dependientes de la plantilla como independientes de la plantilla) así como también reacciones de extensión del cebador. Como tales, las composiciones proporcionadas en la presente descripción pueden incluir cualquier componente adicional conocido en la técnica para composiciones de polimerización, composiciones de amplificación y/o composiciones de secuenciación de polinucleótidos. La ADN polimerasa mutante (por ejemplo, recombinante) puede estar presente en la composición a una concentración de entre 0,1, 0,2, 0,25, 0,5, 0,75, 0,8, 0,9, 1, 5, 6, 8 o 9, en el extremo inferior del intervalo y 1, 5, 6, 7, 8, 9, 10, 20, 25, 50, 75 o 100 mg/ml en el extremo superior del intervalo. La composición puede incluir opcionalmente una fuente de nucleótidos tales como, entre otros, dNTP, un amortiguador, una sal y/o un cebador. El cebador puede estar presente, por ejemplo, a concentraciones de 10, 20, 25, 50, 75, 100, 125, 150, 200 o 250 uM en el extremo inferior del intervalo, y 50, 75, 100, 125, 150, 200, 250, 500 y 1000 uM en el extremo superior del intervalo. Los nucleótidos pueden estar presentes a cualquier concentración usada en la técnica para reacciones de polimerización, amplificación y/o secuenciación.
En las composiciones de la invención pueden incluirse sales tales como, pero sin limitarse a, NaCl y/o KCl. La composición puede ser una solución de alta fuerza iónica. En ciertas modalidades, la composición incluye más de 120 mM de sal, tal como entre 125, 130, 140 o 150 mM de sal en el extremo inferior del intervalo, y 150, 160, 170, 175 mM de sal en el extremo superior del intervalo.
Una composición de la invención puede incluir además un soporte sólido. Por ejemplo, el soporte sólido puede ser un soporte sólido usado en una reacción de secuenciación de alto rendimiento, tal como una celda de flujo o una población de partículas. Tal(es) soporte(s) sólido(s) puede(n) incluir un cebador de secuenciación y, opcionalmente, una población clonal o sustancialmente clonal de moléculas plantilla. En consecuencia, en cierta modalidad, una composición de la invención incluye una o más moléculas plantilla. En ciertas modalidades, tales moléculas plantilla pueden ser una, o típicamente un conjunto de poblaciones clonales o sustancialmente clonales de moléculas plantilla, tal como se usa en la secuenciación de ácidos nucleicos de alto rendimiento.
Los kits pueden incluir al menos dos recipientes, tales como tubos o pocillos en una placa de múltiples pocillos incluida una tira de pocillos, cada uno de los cuales contiene uno o más componentes de la mezcla de reacción como se proporciona en la presente descripción. Al menos uno de los recipientes incluye una ADN polimerasa
mutante (por ejemplo, recombinante) de origen no natural de la invención y uno o más tubos pueden incluir nucleótidos y/o un amortiguador apropiado para uno de los métodos proporcionados en la presente descripción, por ejemplo. En algunas modalidades, los kits pueden ser kits virtuales en los que se enumeran, comercializan y/o venden juntos varios reactivos separados, tal como en una página web que enumera diferentes reactivos que pueden comprarse juntos.
En algunas modalidades, un kit útil para realizar una reacción de polimerización de ácidos nucleicos incluye un amortiguador, al menos un tipo de nucleótido y una ADN polimerasa mutante de origen no natural, que típicamente es una ADN polimerasa recombinante y está opcionalmente modificada, en donde la polimerasa tiene un segmento polipeptídico que tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la SEQ ID NO: 1 o un fragmento de la misma, muestra actividad de polimerasa, e incluye H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1, e incluye además (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. La ADN polimerasa recombinante puede tener la propiedad de producir una tasa de error sistemático promedio más baja cuando se usa en una reacción de secuenciación por síntesis en comparación con la tasa de error sistemático promedio obtenido mediante el uso de una polimerasa Bst de referencia, tal como la polimerasa Bst de tipo silvestre, la polimerasa Bst mutante de la SEQ ID NO: 2, o la polimerasa Bst mutante de la SEQ ID NO: 35, y/o la a Dn polimerasa recombinante tiene la propiedad de producir una mejor precisión cuando se usa en una reacción de secuenciación por síntesis en comparación con la precisión obtenida mediante el uso, por ejemplo, de las polimerasas Bst de referencia antes mencionadas. La reacción de secuenciación por síntesis en la que la polimerasa tiene propiedades mejoradas en ejemplos ilustrativos, es una reacción de secuenciación en la que se liberan y detectan iones de hidrógeno. La polimerasa mutante (por ejemplo, recombinante) en las modalidades del kit en la presente descripción, puede incluir las sustituciones de aminoácidos H46R, E446Q y H572R, en algunas modalidades, y/o puede incluir las mutaciones H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1.
La ADN polimerasa mutante (por ejemplo, recombinante) en las modalidades del kit proporcionadas en la presente descripción, puede incluir además uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO: 1). En consecuencia, en ciertos ejemplos proporcionados en la presente descripción, la ADN polimerasa mutante en las modalidades del kit en la presente descripción tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o un fragmento de la misma, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. En una modalidad ilustrativa del kit que tiene tales mutaciones, el mutante de origen no natural tiene la secuencia de la SEQ ID NO: 119.
En submodalidades adicionales, el segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en las modalidades proporcionadas anteriormente, puede ser al menos un 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de la ADN polimerasa mutante, y puede tener al menos 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o SEQ ID NO: 16, que es la polimerasa Bst de tipo silvestre de longitud completa. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades del kit muestra actividad de polimerasa, puede incluir opcionalmente las sustituciones de aminoácidos H341R, E741Q y H867R, y/o puede incluir opcionalmente las mutaciones H576M, D718K y N782R, e incluye uno o más de L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En una modalidad ilustrativa que tiene tales mutaciones, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121.
En algunas modalidades, el kit incluye al menos un terminador reversible como el al menos un tipo de nucleótido. En algunas modalidades, el kit incluye al menos un nucleótido de origen no natural como el al menos un tipo de nucleótido. En una modalidad, el al menos un nucleótido de origen no natural incluye dUTP. En algunas modalidades, el kit incluye uno o más nucleótidos de origen natural como el al menos un tipo de nucleótido, tal como dATP, dGTP, dCTP y dTTP. En una modalidad, el al menos un tipo de nucleótido puede incluir un nucleótido marcado con fluorescencia. En algunas modalidades, el kit incluye una pluralidad de recipientes de reacción en los que se realiza la reacción de polimerización de ácidos nucleicos. En otra modalidad, el kit incluye un único recipiente de reacción en el que se realiza la reacción de polimerización de ácidos nucleicos. El kit puede contener opcionalmente otros componentes tales como microesferas, perlas y/o portaobjetos para usar durante la reacción de polimerización. En algunas modalidades, el amortiguador puede incluir un detergente seleccionado del grupo que consiste en un monolaurato de sorbitán polioxietilado, un nonilfenol etoxilado, éteres de alcohol graso etoxilados, lauriléteres, alquilfenoles etoxilados, compuestos de octilfenoxipolietoxietanol, alcoholes de cadena lineal oxietilados y/u oxipropilados modificados, compuestos de monooleato de polietilenglicol, compuestos de polisorbato y éteres de alcoholes grasos fenólicos o una combinación de los mismos.
En algunas modalidades, el kit útil para realizar una reacción de polimerización de ácidos nucleicos puede incluir un amortiguador, al menos un tipo de nucleótido y al menos una polimerasa mutante (por ejemplo, recombinante) de las SEQ ID NO: 79-119.
En algunas modalidades, el kit puede contener opcionalmente un cebador de secuenciación.
En algunas modalidades, el kit incluye al menos un terminador reversible como el al menos un tipo de nucleótido. En algunas modalidades, el kit incluye al menos un nucleótido de origen no natural como el al menos un tipo de nucleótido. En una modalidad, el al menos un nucleótido de origen no natural incluye dUTP. En algunas modalidades, el kit incluye uno o más nucleótidos de origen natural como el al menos un tipo de nucleótido, tal como dATP, dGTP, dCTP y dTTP. En una modalidad, el al menos un tipo de nucleótido puede incluir un nucleótido marcado con fluorescencia. En algunas modalidades, el kit incluye una pluralidad de recipientes de reacción en los que se realiza la reacción de polimerización de ácidos nucleicos. En otra modalidad, el kit incluye un único recipiente de reacción en el que se realiza la reacción de polimerización de ácidos nucleicos. El kit puede contener opcionalmente otros componentes tales como microesferas, perlas y/o portaobjetos para usar durante la reacción de polimerización. En algunas modalidades, el amortiguador puede incluir un detergente seleccionado del grupo que consiste en un monolaurato de sorbitán polioxietilado, un nonilfenol etoxilado, éteres de alcohol graso etoxilados, lauriléteres, alquilfenoles etoxilados, compuestos de octilfenoxipolietoxietanol, alcoholes de cadena lineal oxietilados y/u oxipropilados modificados, compuestos de monooleato de polietilenglicol, compuestos de polisorbato y éteres de alcoholes grasos fenólicos o una combinación de los mismos.
En algunas submodalidades de kits, se proporciona en la presente descripción un kit para realizar una reacción de secuenciación por síntesis que incluye un amortiguador, al menos un tipo de nucleótido y una ADN polimerasa mutante de origen no natural, que es típicamente una ADN polimerasa recombinante, y está opcionalmente modificado, en donde la polimerasa tiene un segmento polipeptídico que tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la SEQ ID NO: 1 o un fragmento de la misma, muestra actividad de polimerasa e incluye (a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H o E220T, N234K, P236I o P236R, E245R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T; o (b) dos o más sustituciones de aminoácidos seleccionadas de E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T. La ADN polimerasa mutante (por ejemplo, recombinante) puede tener la propiedad de producir una tasa de error sistemático promedio más baja cuando se usa en una reacción de secuenciación por síntesis en comparación con la tasa de error sistemático promedio obtenida mediante el uso de una polimerasa Bst de referencia, tal como la polimerasa Bst de tipo silvestre, la polimerasa Bst mutante de la SEQ ID NO: 2, o la polimerasa Bst mutante de la SEQ ID NO: 35, y/o la ADN polimerasa recombinante tiene la propiedad de producir una mejor precisión cuando se usa en una reacción de secuenciación por síntesis en comparación con la precisión obtenida mediante el uso, por ejemplo, de las polimerasas Bst de referencia antes mencionadas. La reacción de secuenciación por síntesis en la que la polimerasa tiene propiedades mejoradas en ejemplos ilustrativos, es una reacción de secuenciación en la que se liberan y detectan iones de hidrógeno. La polimerasa mutante (por ejemplo, recombinante) en submodalidades ilustrativas de kits de secuenciación por síntesis en la presente descripción, puede incluir las sustituciones de aminoácidos H46R, E446Q y H572R, en algunas modalidades, y/o puede incluir las mutaciones H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1.
La ADN polimerasa mutante (por ejemplo, recombinante) en submodalidades ilustrativas de kits de secuenciación por síntesis proporcionadas en la presente descripción, incluye uno o más de L252R, H473G. y H528T, en donde la numeración es con relación a la SEQ ID NO:1. En consecuencia, en ciertos ejemplos proporcionados en la presente descripción, la ADN polimerasa mutante en las submodalidades de kits de secuenciación por síntesis en la presente descripción tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1, o un fragmento de la misma, muestra actividad de polimerasa, incluye las sustituciones de aminoácidos H46R, E446Q, H572R, H281M, D423K y N487R, e incluye además L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1. En un ejemplo de submodalidades de kits de secuenciación por síntesis que tienen tales mutaciones, el mutante de origen no natural tiene la secuencia de la SEQ ID NO: 119.
En submodalidades adicionales de kits de secuenciación por síntesis, el segmento polipeptídico de la ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades puede ser al menos un 50 %, 60 %, 70 %, 75 %, 80 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de la ADN polimerasa mutante, y puede tener al menos 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad con la SEQ ID NO: 1 (fragmento de 581 aminoácidos de tipo silvestre), o SEQ ID NO: 16, que es polimerasa Bst de longitud completa de tipo silvestre. La ADN polimerasa mutante (por ejemplo, recombinante) en tales submodalidades del kit de secuenciación por síntesis muestra actividad de polimerasa, puede incluir opcionalmente sustituciones de aminoácidos H341R, E741Q y H867R, y/o puede incluir opcionalmente las mutaciones H576M, D718K y N782R, e incluye uno o más de, L547R, H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16. En ciertas modalidades, la ADN polimerasa mutante (por ejemplo, recombinante) incluye L547R, H768G y H823T. En una modalidad ilustrativa que
tiene tales mutaciones, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 121. En algunas modalidades, el kit para realizar una reacción de secuenciación por síntesis incluye un amortiguador, al menos un tipo de nucleótido y una ADN polimerasa recombinante de la SEQ ID NO: 119 o SEQ ID NO: 121.
La ADN polimerasa mutante (por ejemplo, recombinante) puede estar presente en el kit a una concentración de entre 0,1, 0,2, 0,25, 0,5, 0,75, 0,8, 0,9, 1, 5, 6, 8 o 9, en el extremo inferior del intervalo y 1, 5, 6, 7, 8, 9, 10, 20, 25, 50, 75 o 100 mg/ml en el extremo superior del intervalo. En algunas submodalidades del kit de secuenciación por síntesis, el kit contiene opcionalmente un cebador de secuenciación. El cebador de secuenciación puede estar presente, por ejemplo, a concentraciones de 10, 20, 25, 50, 75, 100, 125, 150, 200 o 250 uM en el extremo inferior del intervalo, y 50, 75, 100, 125, 150, 200, 250, 500 y 1000 uM en el extremo superior del intervalo. Además, el kit, que incluye al menos 2 contenedores, puede ser opcionalmente una placa de múltiples pocillos, siendo cada pocillo un contenedor separado, tal como una tira de una sola fila de pocillos, puede incluir un soporte sólido, tal como perlas o partículas de secuenciación, tal como las partículas de secuenciación de Ion Torrent, que incluyen un cebador inmovilizado. Además, el kit puede incluir opcionalmente una solución de detergente, y fragmentos de ADN de control de secuencia conocida inmovilizados sobre el soporte sólido. Además, el kit puede incluir reactivos para formar plantillas sustancialmente monoclonales en el soporte sólido para secuenciación de alto rendimiento. Tales reactivos pueden incluir un cebador en solución, al menos una porción del cual se puede biotinilar, para la amplificación clonal o sustancialmente clonal de moléculas plantilla, junto con un cebador inmovilizado en el soporte sólido, un cebador competidor en una solución, que tiene la misma secuencia que el cebador inmovilizado y/o una plantilla de referencia de secuencia conocida. Además, tal kit puede incluir, en algunas modalidades, hidróxido de sodio y una solución de neutralización. Además, tales kits pueden incluir reactivos para la amplificación, incluida la PCR y la amplificación isotérmica. Por ejemplo, el kit puede incluir gránulo(s) seco(s) con reactivos para una reacción isotérmica, tal como la amplificación de la recombinasa polimerasa, uno o más amortiguadores de rehidratación y una fuente de iones de magnesio, tal como el acetato de magnesio (MgOAc). El kit puede incluir cualquiera de las ADN polimerasas mutantes (por ejemplo, recombinantes) descritas en la presente descripción. En modalidades ilustrativas, la ADN polimerasa mutante tiene la secuencia de aminoácidos de la SEQ ID NO: 119 o SEQ ID NO: 121.
En algunas modalidades, el kit para realizar una reacción de secuenciación por síntesis incluye al menos un terminador reversible como al menos un tipo de nucleótido. En algunas modalidades, el kit incluye al menos un nucleótido de origen no natural como el al menos un tipo de nucleótido. En una modalidad, el al menos un nucleótido de origen no natural incluye dUTP. En algunas modalidades, el kit incluye uno o más nucleótidos de origen natural como el al menos un tipo de nucleótido, tal como dATP, dGTP, dCTP y dTTP. En una modalidad, el al menos un tipo de nucleótido puede incluir un nucleótido marcado con fluorescencia. En algunas modalidades, el kit incluye una pluralidad de recipientes de reacción en los que se realiza la reacción de secuenciación por síntesis. En otra modalidad, el kit incluye un único recipiente de reacción en el que se realiza la reacción de secuenciación por síntesis. El kit puede contener opcionalmente otros componentes tales como microesferas, perlas, chips ISFET y/o portaobjetos para su uso durante la reacción de secuenciación por síntesis. En algunas modalidades, el amortiguador puede incluir un detergente seleccionado del grupo que consiste en un monolaurato de sorbitán polioxietilado, un nonilfenol etoxilado, éteres de alcohol graso etoxilados, lauriléteres, alquilfenoles etoxilados, compuestos de octilfenoxipolietoxietanol, alcoholes de cadena lineal oxietilados y/u oxipropilados modificados, compuestos de monooleato de polietilenglicol, compuestos de polisorbato y éteres de alcoholes grasos fenólicos o una combinación de los mismos.
En algunas modalidades, un kit para realizar una reacción de secuenciación por síntesis incluye un amortiguador, al menos un tipo de nucleótido y una polimerasa recombinante que tiene al menos 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o más de identidad con la SEQ ID NO: 35, o un fragmento de la misma, donde la polimerasa recombinante o fragmento de la misma muestra actividad de polimerasa, e incluye una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 35. En algunas modalidades, el kit puede contener opcionalmente un cebador de secuenciación.
En algunas modalidades, el kit para realizar una reacción de secuenciación por síntesis incluye un amortiguador, al menos un tipo de nucleótido y una polimerasa recombinante seleccionada del grupo que consiste en la SEQ ID NO: 80, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 96, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117, SEQ ID NO: 118 o SEQ ID NO: 119. En algunas modalidades, el kit puede contener opcionalmente un cebador de secuenciación.
En algunas modalidades, el kit para realizar una reacción de secuenciación por síntesis incluye al menos un terminador reversible como al menos un tipo de nucleótido. En algunas modalidades, el kit incluye al menos un nucleótido de origen no natural como el al menos un tipo de nucleótido. En una modalidad, el al menos un nucleótido
de origen no natural incluye dUTP. En algunas modalidades, el kit incluye uno o más nucleótidos de origen natural como el al menos un tipo de nucleótido, tal como dATP, dGTP, dCTP y dTTP. En una modalidad, el al menos un tipo de nucleótido puede incluir un nucleótido marcado con fluorescencia. En algunas modalidades, el kit incluye una pluralidad de recipientes de reacción en los que se realiza la reacción de secuenciación por síntesis. En otra modalidad, el kit incluye un único recipiente de reacción en el que se realiza la reacción de secuenciación por síntesis. El kit puede contener opcionalmente otros componentes tales como microesferas, perlas y/o portaobjetos para usar durante la reacción de secuenciación por síntesis. En algunas modalidades, el amortiguador puede incluir un detergente seleccionado del grupo que consiste en un monolaurato de sorbitán polioxietilado, un nonilfenol etoxilado, éteres de alcohol graso etoxilados, lauriléteres, alquilfenoles etoxilados, compuestos de octilfenoxipolietoxietanol, alcoholes de cadena lineal oxietilados y/u oxipropilados modificados, compuestos de monooleato de polietilenglicol, compuestos de polisorbato y éteres de alcoholes grasos fenólicos o una combinación de los mismos. En algunas modalidades, la presente descripción contempla un kit para amplificar un plantilla de ácido nucleico. El kit puede incluir cualquiera de los reactivos descritos en la presente descripción para amplificar un plantilla de ácido nucleico, incluida cualquiera de las ADN polimerasas mutantes (por ejemplo, recombinantes) descritas en la presente descripción. En una modalidad, el kit incluye un amortiguador, al menos un tipo de nucleótido y una polimerasa recombinante seleccionada del grupo que consiste en SEQ ID NO: 39, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 47, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 50, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78 o SEQ ID NO: 121.
En otra modalidad, el kit incluye un amortiguador, al menos un tipo de nucleótido y una polimerasa recombinante seleccionada del grupo que consiste en la SEQ ID NO: 80, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 96, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 116, SEQ ID NO: 117, SEQ ID NO: 118 o SEQ ID NO: 119.
En algunas modalidades, un amortiguador en kits y métodos de la presente descripción puede encontrarse en composiciones de amortiguador que incluyen uno cualquiera o más de los siguientes: una sal de metal monovalente, una sal de metal divalente, un anión divalente y un detergente. Por ejemplo, la composición de amortiguador puede incluir una sal de potasio y/o sodio. En algunas modalidades, la composición de amortiguador puede incluir una sal de manganeso y/o magnesio. En algunas modalidades, la composición de amortiguador puede incluir un sulfato tal como sulfato de potasio y/o sulfato de magnesio. En algunas modalidades, la composición de amortiguador puede incluir un detergente seleccionado del grupo que consiste en un monolaurato de sorbitán polioxietilado, un nonilfenol etoxilado, éteres de alcohol graso etoxilados, lauriléteres, alquilfenoles etoxilados, compuestos de octilfenoxipolietoxietanol, alcoholes lineales oxietilados y/o oxipropilados modificados, compuestos de monooleato de polietilenglicol, compuestos de polisorbato y éteres de alcoholes grasos fenólicos o una combinación de los mismos. En algunas modalidades, la composición de amortiguador puede incluir un detergente seleccionado del grupo que consiste en Triton y Tween.
En algunas modalidades, la composición de amortiguador puede incluir al menos una sal de potasio, al menos una sal de manganeso y Triton X-100 (Pierce Biochemicals). La sal puede ser opcionalmente una sal de cloruro o una sal de sulfato.
En algunas modalidades, la composición de amortiguador puede incluir al menos una sal de potasio, al menos una sal de magnesio y Triton X-100 (Pierce Biochemicals). La sal puede ser opcionalmente una sal de cloruro o una sal de sulfato.
En algunas modalidades, la composición de amortiguador tiene un pH de aproximadamente 7,3 a aproximadamente 8,0, típicamente de aproximadamente 7,4 a aproximadamente 7,9.
En algunas modalidades, la composición de amortiguador incluye sal de magnesio o manganeso a una concentración de entre 1 mM y 20 mM, particularmente 6-15 mM.
En algunas modalidades, la composición de amortiguador incluye un sulfato a una concentración de entre 1 mM y 100 mM, particularmente de 5 a 50 mM.
En algunas modalidades, la composición de amortiguador incluye un detergente (por ejemplo, Triton X-100 o Tween-20) en una concentración de entre 0,001 % y 1 %, típicamente entre 0,0025 y 0,0125 %.
En algunas modalidades, las composiciones de polimerasa modificadas descritas (así como también los métodos, sistemas, aparatos y kits relacionados) pueden usarse para obtener información de secuencia de una molécula de ácido nucleico. En la técnica se conocen muchos métodos para obtener información de secuencia a partir de una
molécula de ácido nucleico, y se apreciará fácilmente que todos estos métodos están dentro del alcance de la presente descripción. Los métodos adecuados de secuenciación mediante el uso de las polimerasas modificadas descritas incluyen, sin limitación: secuenciación de Sanger, secuenciación basada en ligación (también conocida como secuenciación por hibridación) y secuenciación por síntesis. Los métodos de secuenciación por síntesis típicamente implican la síntesis de ácidos nucleicos dependientes de plantilla (por ejemplo, mediante el uso de un cebador que se hibrida con un ácido nucleico plantilla o una plantilla autocebadora, como apreciarán los expertos en la técnica), basándose en la secuencia de un ácido nucleico plantilla. Es decir, la secuencia de la cadena de ácido nucleico recién sintetizada típicamente es complementaria a la secuencia del ácido nucleico plantilla y, por lo tanto, el conocimiento del orden y la identidad de la incorporación de nucleótidos en la cadena sintetizada puede proporcionar información sobre la secuencia de la cadena de ácido nucleico plantilla. La secuenciación por síntesis mediante el uso de las polimerasas modificadas de la descripción típicamente implicará la detección del orden y la identidad de la incorporación de nucleótidos cuando los nucleótidos se polimerizan de forma dependiente de la plantilla mediante la polimerasa modificada. Algunos ejemplos de métodos de secuenciación por síntesis mediante el uso de nucleótidos marcados incluyen la secuenciación de una sola molécula (ver, por ejemplo, las patentes de los Estados Unidos núm. 7,329,492 y U.S. 7,033,764), que típicamente implican el uso de nucleótidos marcados para detectar la incorporación de nucleótidos. En algunas modalidades, las composiciones de polimerasa descritas (y los métodos, kits, sistemas y aparatos relacionados) pueden usarse para obtener información de secuencia para aplicaciones de secuenciación del genoma completo, la secuenciación de amplicones, la resecuenciación dirigida, la secuenciación de una sola molécula, la secuenciación multiplex o con código de barras y secuenciación de extremos emparejados.
En algunas modalidades, las composiciones de polimerasa modificada descritas, así como también los métodos, sistemas, aparatos y kits relacionados, pueden usarse para amplificar moléculas de ácido nucleico. En algunas modalidades, una molécula de ácido nucleico puede amplificarse mediante el uso de una polimerasa modificada, por ejemplo mediante pirosecuenciación, reacción en cadena de la polimerasa, reacción en cadena de la polimerasa en emulsión, reacción en cadena de la polimerasa puente y similares.
En algunas modalidades, las composiciones de polimerasa modificadas descritas (así como también los métodos, sistemas, aparatos y kits relacionados) pueden usarse para generar bibliotecas de ácidos nucleicos. En algunas modalidades, las composiciones de polimerasa modificadas descritas pueden usarse para generar bibliotecas de ácidos nucleicos para una variedad de procesos posteriores. En la técnica se conocen muchos métodos para generar bibliotecas de ácidos nucleicos, y se apreciará fácilmente que todos estos métodos están dentro del alcance de la presente descripción. Los métodos adecuados incluyen, sin limitación, bibliotecas de ácidos nucleicos generadas mediante el uso de PCR en emulsión, PCR en puente, PCR, qPCR, RT-PCR y otras formas de amplificación de ácidos nucleicos que dependen de la polimerización. En algunas modalidades, los métodos pueden incluir amplificación de ácidos nucleicos dependiente de plantilla. En algunas modalidades, los métodos pueden incluir un dúplex de cebador: plantilla o una plantilla de ácido nucleico en la que la polimerasa modificada puede realizar la incorporación de nucleótidos. En algunas modalidades, el ácido nucleico puede incluir un ácido nucleico monocatenario con una estructura secundaria tal como una horquilla o un bucle que puede proporcionar una protuberancia monocatenaria al que la polimerasa modificada puede incorporar un nucleótido durante la polimerización. En algunas modalidades, los métodos para generar bibliotecas de ácidos nucleicos mediante el uso de una o más polimerasas modificadas de acuerdo con la descripción pueden incluir la generación de una biblioteca de ácidos nucleicos de 50, 100, 200, 300, 400, 500, 600 o más pares de bases de longitud. En algunas modalidades, la plantilla de ácido nucleico a la que la polimerasa modificada puede realizar la incorporación de nucleótidos se puede unir, enlazar o unir a un soporte, tal como un soporte sólido. En algunas modalidades, el soporte puede incluir un soporte plano tal como un portaobjetos. En algunas modalidades, el soporte puede incluir una partícula, tal como una partícula Ion Sphere™ (vendida por Life Technologies Corp, CA).
En algunas modalidades, la descripción se relaciona generalmente con un método para generar una biblioteca de ácidos nucleicos que comprende poner en contacto una plantilla de ácido nucleico con una polimerasa modificada y uno o más dNTP en condiciones de polimerización; incorporando de este modo uno o más dNTP en la plantilla de ácido nucleico para generar una biblioteca de ácido nucleico. En algunas modalidades, el método puede incluir además generar una biblioteca de ácidos nucleicos o secuenciar una biblioteca de ácidos nucleicos en presencia de una solución de alta fuerza iónica. En algunas modalidades, la descripción se refiere generalmente a una polimerasa modificada que retiene la actividad de polimerasa en presencia de una solución de alta fuerza iónica. En algunas modalidades, la solución de alta fuerza iónica puede ser 150 mM de sal. En algunas modalidades, la solución de alta fuerza iónica puede incluir 125 mM a 175 mM de sal. En algunas modalidades, la solución de alta fuerza iónica puede ser 130 mM de sal. En algunas modalidades, la solución de alta fuerza iónica puede ser de 125 mM a 175 mM de sal. En algunas modalidades, la sal puede incluir una sal de potasio y/o sodio. En algunas modalidades, la solución de fuerza iónica puede incluir además un sulfato. En algunas modalidades, una polimerasa modificada es capaz de amplificar (y/o secuenciar) una molécula de ácido nucleico en presencia de una solución de alta fuerza iónica a una mayor capacidad (por ejemplo, según lo medido por la precisión absoluta o la precisión del homopolímero) que una polimerasa de referencia que carece de una o más de las mismas mutaciones (o mutaciones homólogas) en condiciones idénticas. En algunas modalidades, una polimerasa modificada es capaz de amplificar (y/o secuenciar) una molécula de ácido nucleico en presencia de una solución de alta fuerza iónica a una mayor capacidad (por ejemplo, medida por la precisión absoluta de la precisión del homopolímero) que una
polimerasa de referencia que carece de una o más de las mutaciones (o mutaciones homólogas) en condiciones de fuerza iónica estándar (es decir, típicas) (es decir, inferior a la solución de alta fuerza iónica proporcionada en la presente descripción, por ejemplo 50 mM de sal).
Opcionalmente, el método incluye además repetir la adición de uno o más dNTP en condiciones de polimerización para incorporar una pluralidad de dNTP en la plantilla de ácido nucleico para generar la biblioteca de ácido nucleico. En algunas modalidades, el método incluye detectar la adición del uno o más dNTP en condiciones de polimerización. En alguna modalidad, el método incluye identificar la adición del uno o más dNTP en condiciones de polimerización (por ejemplo, flujo de nucleótidos A, G, C, T, A e incorporación de nucleótidos).
En algunas modalidades, el método puede incluir además la detección de un subproducto de incorporación de nucleótidos durante la polimerización. En algunas modalidades, el subproducto de incorporación de nucleótidos puede incluir un ion hidrógeno, pirofosfato o fosfato.
En algunas modalidades, el método incluye además determinar la identidad de los dNTP incorporados en la biblioteca de ácidos nucleicos. En algunas modalidades, el método incluye además determinar el número de nucleótidos incorporados en la biblioteca de ácidos nucleicos. En algunas modalidades, la detección puede incluir además la secuenciación de la biblioteca de ácidos nucleicos.
En algunas modalidades, las composiciones de polimerasa modificadas descritas (así como también los métodos, sistemas, aparatos y kits relacionados) pueden usarse para detectar la incorporación de nucleótidos a través de la generación de formación de subproductos durante el evento de incorporación de nucleótidos. En la técnica se conocen muchos métodos para detectar subproductos de la incorporación de nucleótidos, y se apreciará fácilmente que todos de tales métodos están dentro del alcance de la presente descripción. Los métodos adecuados de detección de subproductos de nucleótidos incluyen, sin limitación, la detección de iones de hidrógeno, fosfato inorgánico, pirofosfato inorgánico y similares. Varios de estos métodos de detección de subproductos típicamente implican la incorporación de nucleótidos dependientes de plantilla.
En algunas modalidades, las polimerasas modificadas pueden usarse para realizar la secuenciación de ácidos nucleicos sin marcador y, en particular, la secuenciación de ácidos nucleicos basada en iones. El concepto de secuenciación de ácidos nucleicos sin marcador, incluida la secuenciación de ácidos nucleicos basada en iones, se describe, por ejemplo, en las siguientes referencias: Rothberg y otros, publicación de patentes de los Estados Unidos núms. 2009/0026082, 2009/0127589, 2010/0301398, 2010/0300895, 2010/0300559, 2010/0197507 y 2010/0137143. Brevemente, en tales aplicaciones de secuenciación de ácidos nucleicos, las incorporaciones de nucleótidos se determinan detectando la presencia de subproductos naturales de reacciones de síntesis de ácidos nucleicos catalizadas por polimerasa, incluidos iones de hidrógeno, polifosfatos, PPi y Pi (por ejemplo, en presencia de pirofosfatasa).
En una modalidad típica de la secuenciación de ácidos nucleicos basada en iones, las incorporaciones de nucleótidos se detectan detectando la presencia y/o concentración de iones de hidrógeno generados por reacciones de síntesis de ácidos nucleicos catalizadas por polimerasa, incluidas, por ejemplo, reacciones de extensión del cebador. En una modalidad, las plantillas que están operativamente unidas a un cebador y una polimerasa y que están situadas dentro de las cámaras de reacción (tal como los micropocillos descritos en Rothberg y otros, citado anteriormente), se someten a ciclos repetidos de adición de nucleótidos catalizada por polimerasa al cebador ("etapa de adición") seguido de lavado ("etapa de lavado"). En algunas modalidades, tales plantillas pueden unirse como poblaciones clonales a un soporte sólido, tal como una micropartícula, una perla o similar, y dichas poblaciones clonales se cargan en cámaras de reacción. Tal como se usa en la presente descripción, "unido operativamente" significa que un cebador se hibrida con una plantilla de modo que el cebador pueda extenderse mediante una polimerasa y que una polimerasa se una a tal dúplex de cebador-plantilla, o muy cerca del mismo, de modo que la extensión del cebador tenga lugar siempre que se suministren nucleótidos.
En cada etapa de adición del ciclo, la polimerasa extiende el cebador incorporando el nucleótido añadido de manera dependiente de la plantilla, de modo que el nucleótido se incorpora solo si la siguiente base en la plantilla es el complemento del nucleótido añadido. Si hay una base complementaria, hay una incorporación, si hay dos, hay dos incorporaciones, si hay tres, hay tres incorporaciones, y así sucesivamente. Con cada incorporación de este tipo, se libera un ion de hidrógeno y, colectivamente, una población de plantillas que liberan iones de hidrógeno cambia el pH local de la cámara de reacción. En algunas modalidades, la producción de iones de hidrógeno es proporcional (por ejemplo, monótonamente relacionada) al número de bases complementarias contiguas en el plantilla (así como también al número total de moléculas plantilla con cebador y polimerasa que participan en una reacción de extensión). Por lo tanto, cuando hay una cantidad de bases complementarias idénticas contiguas en la plantilla (es decir, una región de homopolímero (HP)), la cantidad de iones de hidrógeno generados y, por lo tanto, la magnitud del cambio de pH local, es proporcional a la cantidad de bases complementarias idénticas contiguas. Si la siguiente base en la plantilla no es complementaria al nucleótido añadido, entonces no se produce la incorporación y no se liberan iones de hidrógeno. En algunas modalidades, después de cada etapa de adición de un nucleótido, se realiza una etapa de lavado, en el que se usa una solución de lavado no amortiguada a un pH predeterminado para eliminar el nucleótido de la etapa anterior para evitar incorporaciones erróneas en ciclos posteriores. En algunas
modalidades, después de cada etapa de añadir un nucleótido, puede realizarse una etapa adicional en donde las cámaras de reacción se tratan con un agente destructor de nucleótidos, tal como apirasa, para eliminar cualquier nucleótido residual que quede en la cámara, minimizando de este modo la probabilidad de extensiones espurias en ciclos posteriores. En algunas modalidades, el tratamiento puede incluirse como parte de la propia etapa de lavado. En una modalidad ilustrativa, se añaden secuencialmente diferentes clases (o "tipos") de nucleótidos a las cámaras de reacción, de modo que cada reacción se expone a los diferentes tipos de nucleótidos uno a la vez. Por ejemplo, los tipos de nucleótidos pueden añadirse en la siguiente secuencia: dATP, dCTP, dGTP, dTTP, dATP, dCTP, dGTP, dTTP, etc.; con cada exposición seguida de una etapa de lavado. Los ciclos pueden repetirse 50 veces, 100 veces, 200 veces, 300 veces, 400 veces, 500 veces, 750 veces o más, dependiendo de la longitud de la secuencia de información deseada. En algunas modalidades, el tiempo necesario para aplicar cada nucleótido secuencialmente a la cámara de reacción (es decir, el ciclo de flujo) puede variar dependiendo de la información de secuenciación deseada. Por ejemplo, el ciclo de flujo puede reducirse en algunos casos cuando se secuencian moléculas de ácido nucleico largas para reducir el tiempo total necesario para secuenciar la molécula de ácido nucleico completa. En algunas modalidades, el ciclo de flujo puede incrementarse, por ejemplo, cuando se secuencian ácidos nucleicos cortos o amplicones. En algunas modalidades, el ciclo de flujo puede ser de aproximadamente 0,3 segundos a aproximadamente 3 segundos, y más típicamente de aproximadamente 0,5 segundos a aproximadamente 1,5 segundos.
En una modalidad ilustrativa, la descripción se relaciona generalmente con un método para obtener información de secuencia a partir de un plantilla de ácido nucleico e incluye lo siguiente: (a) proporcionar una mezcla de reacción que incluye un ácido nucleico plantilla hibridado con un cebador de secuenciación y unido a una polimerasa modificada, en donde la polimerasa modificada comprende una polimerasa enlazada a un resto puente a través de uno o más sitios de unión dentro de la polimerasa; (b) poner en contacto el ácido nucleico plantilla con un nucleótido, en donde el contacto incluye incorporar el nucleótido en el cebador de secuenciación y generar un subproducto de secuenciación si el nucleótido es complementario a un nucleótido correspondiente en el ácido nucleico plantilla; y (c) detectar la presencia de subproducto de secuenciación en la mezcla de reacción, lo que determina de este modo si se ha producido la incorporación de nucleótidos.
En algunas modalidades, el método puede incluir además repetir las etapas de poner en contacto y detección al menos una vez. En algunas modalidades, estas etapas se repiten entre 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 250, 500 o 1000 veces en el extremo inferior del intervalo y 10, 15, 20, 25, 50, 100, 250, 500, 1000, 2500, 5000, 10000, 25000, 50000 o 100000 veces en el extremo superior del intervalo.
En algunas modalidades, la polimerasa de la polimerasa modificada incluye un único sitio de unión, y el resto puente se enlaza a la polimerasa a través del único sitio de unión, ya sea directamente o mediante un resto de enlace. En algunas modalidades, el único sitio de unión puede enlazarse a un resto de biotina y el resto puente puede incluir un resto de avidina. En algunas modalidades, la polimerasa modificada muestra un incremento de la longitud de lectura y/o capacidad de procesamiento en relación con una forma no modificada de la polimerasa en condiciones de reacción similares o idénticas.
En algunas modalidades, detectar la presencia del subproducto de secuenciación incluye poner en contacto la mezcla de reacción con un sensor que puede detectar la presencia del subproducto de secuenciación. El sensor puede incluir un transistor de efecto de campo, por ejemplo, un chemFET o un ISFET.
En algunas modalidades, el subproducto de secuenciación incluye un ion hidrógeno, un resto enlazado a colorante, un polifosfato, un pirofosfato o un resto fosfato, y detectar la presencia del subproducto de secuenciación incluye usar un ISFET para detectar el subproducto de secuenciación. En algunas modalidades, la detección del subproducto de secuenciación incluye la detección de un ion de hidrógeno mediante el uso del ISFET.
En una modalidad adicional, la descripción se relaciona generalmente con un método para detectar la incorporación de un nucleótido e incluye lo siguiente: (a) realizar una incorporación de nucleótido mediante el uso de una polimerasa mutada y típicamente recombinante proporcionada en la presente descripción, y generar uno o más subproductos de la incorporación de nucleótido; y (b) detectar la presencia de al menos uno del uno o más subproductos de la incorporación de nucleótidos, detectando de este modo la incorporación de nucleótidos.
En algunas modalidades, la polimerasa modificada incluye una polimerasa enlazada a un resto puente. El resto puente se enlaza opcionalmente a la polimerasa a través de uno o más sitios de unión dentro de la polimerasa modificada. En algunas modalidades, el resto puente se enlaza a la polimerasa a través de un resto de enlace. El resto de enlace puede enlazarse a al menos uno del uno o más sitios de unión de la polimerasa. En algunas modalidades, la polimerasa de la polimerasa modificada incluye un único sitio de unión, y el resto puente se enlaza a la polimerasa a través del único sitio de unión, ya sea directamente o mediante un resto de enlace. En algunas modalidades, el único sitio de unión puede enlazarse a un resto de biotina y el resto puente puede incluir un resto de avidina. En algunas modalidades, el resto puente se enlaza a la polimerasa a través de al menos una unión biotinaavidina. En algunas modalidades, la polimerasa modificada muestra incremento de la longitud de lectura y/o capacidad de procesamiento y/o precisión de lectura, incremento del rendimiento total, reducción del sesgo de
cadena, disminución del error sistemático, incremento en relación con una polimerasa de referencia en condiciones de reacción similares o idénticas.
En algunas modalidades, el método puede incluir además repetir las etapas de realización y detección al menos una vez. En algunas modalidades, estas etapas se repiten entre 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 250, 500 o 1000 veces en el extremo inferior del intervalo y 10, 15, 20, 25, 50, 100, 250, 500, 1000, 2500, 5000, 10000, 25000, 50000 o 100000 veces en el extremo superior del intervalo.
En algunas modalidades, la detección de la presencia de al menos un subproducto de la incorporación de nucleótidos incluye el uso de un sensor que puede detectar la presencia del subproducto. El sensor puede incluir un transistor de efecto de campo, por ejemplo, un chemFET o un ISFET.
En algunas modalidades, el al menos un subproducto de la incorporación de nucleótidos incluye un ion de hidrógeno, un resto enlazado a colorante, un polifosfato, un pirofosfato o un resto de fosfato, y la detección de la presencia del al menos un subproducto incluye el uso de un ISFET para detectar el al menos un subproducto. En algunas modalidades, el al menos un subproducto incluye un ion de hidrógeno, y detectar la presencia del subproducto de secuenciación incluye detectar el ion de hidrógeno mediante el uso de un ISFET.
En algunas modalidades, la descripción se refiere generalmente a un método para detectar un cambio en la concentración de iones durante una reacción de polimerización de nucleótidos e incluye lo siguiente: (a) realizar una reacción de polimerización de nucleótidos mediante el uso de una polimerasa mutada y típicamente recombinante que incluye una polimerasa enlazada a un resto puente, en donde la concentración de al menos un tipo de ion cambia durante el curso de la reacción de polimerización de nucleótidos; y (b) detectar una señal que indique el cambio en la concentración del al menos un tipo de ion.
En algunas modalidades, el resto puente se enlaza a la polimerasa a través de uno o más sitios de unión dentro de la polimerasa modificada. En algunas modalidades, el resto puente se enlaza a la polimerasa a través de un resto de enlace. El resto de enlace puede enlazarse a al menos uno del uno o más sitios de unión de la polimerasa. En algunas modalidades, la polimerasa de la polimerasa modificada incluye un único sitio de unión, y el resto puente se enlaza a la polimerasa a través del único sitio de unión, ya sea directamente o mediante un resto de enlace. En algunas modalidades, el único sitio de unión puede enlazarse a un resto de biotina y el resto puente puede incluir un resto de avidina. En algunas modalidades, el resto puente se enlaza a la polimerasa a través de al menos una unión biotina-avidina. En algunas modalidades, la polimerasa modificada muestra un incremento de la longitud de lectura y/o capacidad de procesamiento en relación con una forma de referencia de la polimerasa en condiciones de reacción similares o idénticas.
En algunas modalidades, el método puede incluir además repetir las etapas de realización y detección al menos una vez.
En algunas modalidades, la detección del cambio en la concentración del al menos un tipo de ion incluye el uso de un sensor que puede detectar la presencia del subproducto. El sensor puede incluir un transistor de efecto de campo, por ejemplo, un chemFET o un ISFET.
En algunas modalidades, el al menos tipo de ion incluye un ion de hidrógeno, un resto enlazado a colorante, un polifosfato, un pirofosfato o un resto de fosfato, y la detección del cambio en la concentración del al menos un tipo de ion incluye el uso de un ISFET para detectar el al menos un tipo de ion. En algunas modalidades, el al menos un tipo de ion incluye un ion de hidrógeno, y la detección de la presencia del al menos un tipo de ion incluye la detección del ion de hidrógeno mediante el uso de un ISFET.
En una modalidad ilustrativa, la descripción se refiere generalmente a un método para obtener información de secuencia de una plantilla de ácido nucleico e incluye lo siguiente: (a) proporcionar una mezcla de reacción que incluye un ácido nucleico plantilla hibridada con un cebador de secuenciación y unida a una polimerasa mutada y típicamente recombinante proporcionada en la presente descripción; (b) poner en contacto el ácido nucleico plantilla con un nucleótido, en donde el contacto incluye incorporar el nucleótido en el cebador de secuenciación y generar un producto de cebador extendido; y (c) detectar la presencia del producto de cebador extendido en la mezcla de reacción, lo que determina de este modo si se ha producido la incorporación de nucleótidos. En algunas modalidades, la polimerasa modificada comprende las SEQ ID NO: 2, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO:28, SEQ ID NO: 31, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO; 35, SEQ ID NO: 36 o SEQ ID NO: 37.
En una modalidad ilustrativa, la descripción se refiere generalmente a un método para amplificar un ácido nucleico plantilla e incluye lo siguiente: (a) proporcionar una mezcla de reacción que incluye un ácido nucleico plantilla hibridado con un cebador y unido a una polimerasa mutada y típicamente recombinante proporcionada en la presente descripción; (b) poner en contacto el ácido nucleico plantilla con un nucleótido, en donde el contacto incluye incorporar el nucleótido en el cebador y generar un producto de cebador extendido; y (c) detectar la presencia del producto de cebador extendido en la mezcla de reacción, lo que determina de este modo si se ha producido la incorporación de nucleótidos. En algunas modalidades, la polimerasa modificada incluye la SEQ ID NO:
119, SEQ ID NO: 121, SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 35, SEQ ID NO: 31, SEQ ID NO: 78, SEQ ID NO:120 y SEQ ID NO: 122 en donde: SEQ ID NO: 1, SEQ ID NO: 2 y SEQ ID NO: 35 incluyen una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K, G209Q, E220H, E220K o E220T, N234K o N234R, P236I o P236R, V241K, E245R, V251R, L252R, S260K, D264K o D264M, E267M o E267K o E267R, E277T, E294K, T324R, E325R, A344Y, E442R o E442Y, E456R, H473G, D480L o D480R, N485R, A492K, E493G o E493R, M495C, N517C o N517K, E522C y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o (b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473g y H528T, en donde la numeración es con relación a la SEQ ID NO: 1
Los siguientes ejemplos no limitantes se proporcionan únicamente a modo de ilustración de modalidades ilustrativas.
Ejemplos
Ejemplo 1: Purificación de polimerasas mutantes ilustrativas
Pueden introducirse varias mutaciones ilustrativas mediante mutagénesis dirigida al sitio en una polimerasa de referencia ilustrativa que tiene la secuencia de aminoácidos de la SEQ ID NO: 1, que es un fragmento de tipo silvestre de 581 aminoácidos de la ADN polimerasa Bst, SEQ ID NO: 2, que es un fragmento mutante de 581 aminoácidos de la ADN polimerasa Bst que tiene las mutaciones H46R, E446Q y H572R (numeración con relación a la SEQ ID NO: 1 y SEQ ID NO: 2) o SEQ ID NO: 35, que es un fragmento mutante de 581 aminoácidos de la ADN polimerasa Bst que tiene las mutaciones H46R, E446Q, H572R, H281M, D423K y N487R (numeración con relación a la SEQ ID NO: 1 y SEQ ID NO: 2). Además, pueden introducir mutaciones en una polimerasa de referencia ilustrativa que tiene la secuencia de aminoácidos de la SEQ ID NO: 16, que es la ADN polimerasa Bst de tipo silvestre de longitud completa, así como también polimerasas de ADN Bst mutantes de referencia, tal como aquellas con mutaciones en sitios correspondientes en la ADN polimerasa Bst de longitud completa como los sitios indicados anteriormente para el fragmento de ADN polimerasa Bst de 581 aminoácidos. Los constructos de expresión recombinantes que codifican polimerasas mutadas/más mutadas pueden transformarse en bacterias. Las colonias que contienen constructos de expresión pueden inocularse en medio BRM, crecer hasta OD=0,600 e inducirse añadiendo IPTG a una concentración final de 1 mM. A continuación, las células pueden cultivarse durante otras 3 horas a 37 °C.
Las células inducidas pueden centrifugarse durante 10 minutos a 6000 rpm, puede desecharse el sobrenadante y las células pueden resuspenderse en amortiguador de resuspensión (Tris 10 mM, pH 7,5, NaCl 100 mM). Las células resuspendidas pueden sonicarse en un ajuste de 60 (amplitud) durante un minuto y después colocarse en hielo durante 1 minuto. La sonicación puede repetirse de esta manera un total de 5 veces.
Las muestras pueden incubarse a 65 °C durante 10 minutos. Las muestras pueden centrifugarse a 9000 rpm durante 30 minutos. El sobrenadante puede recuperarse y purificarse adicionalmente en una columna de heparina.
Ejemplo 2: Comparación del rendimiento de polimerasas modificadas y de referencia en la secuenciación de ácidos nucleicos
Una polimerasa Bst de tipo silvestre o mutante que incluye cualquiera de las mutaciones descritas en la presente descripción puede purificarse esencialmente como se describe en el Ejemplo 1 y analizarse como o junto con una polimerasa de referencia (por ejemplo, que tiene la secuencia de aminoácidos de la SEQ ID NO: 2 o s Eq ID NO: 35) (reacción de control) y evaluarse el rendimiento en una reacción de secuenciación basada en iones mediante el uso del sistema de secuenciación Ion Torrent PGM™ (Ion Torrent Systems, núm. de pieza 4462917). Brevemente, el ADN genómico puede purificarse, ligarse al adaptador y seleccionarse según el tamaño como se describe en la Guía del usuario del kit de biblioteca de fragmentos con iones (Ion Torrent Systems, núm. de pieza 4466464; publicación núm. de pieza 4467320 Rev B). A continuación, los fragmentos de ADN pueden amplificarse en partículas Ion Sphere™ (Ion Torrent Systems, núm. de pieza 602-1075-01) esencialmente de acuerdo con los protocolos proporcionados en la Guía del usuario del kit de plantilla con iones Xpress™ v 2.0 (Ion Torrent Systems, núm. de pieza 4469004A) y mediante el uso de los reactivos proporcionados en el kit de preparación de plantilla con iones (Ion Torrent Systems/Life Technologies, núm. de pieza 4466461), el kit de reactivos de plantilla con iones (Ion Torrent Systems/Life Technologies, núm. de pieza 4466462) y el kit de soluciones de plantillas (Ion Torrent Systems/Life Technologies, núm. de pieza 4466463). El ADN amplificado puede cargarse a continuación en un chip de secuenciación PGM™ 314. El chip puede cargarse en un sistema de secuenciación Ion Torrent PGM™ (Ion Torrent Systems/Life Technologies, núm. de pieza 4462917) y secuenciarse esencialmente de acuerdo con los protocolos proporcionados en la Guía del usuario del kit de secuenciación con iones v2.0 (Ion Torrent Systems/Life Technologies, núm. de pieza 4469714 Rev A) y mediante el uso de los reactivos proporcionados en el kit de secuenciación con iones v2.0 (Ion Torrent Systems/Life Technologies, núm. de pieza 4466456) con una polimerasa de referencia o polimerasa mutante proporcionada en la presente descripción y el kit de chip con iones (Ion Torrent Systems/Life Technologies, núm. de pieza 4462923). Ion Torrent Systems es una subsidiaria de Life Technologies Corp., Carlsbad, California).
Los conjuntos resultantes de lecturas de secuenciación mediante el uso de polimerasas mutantes y de referencia pueden analizarse, por ejemplo, para medir la precisión de lectura sin procesar de las lecturas de secuenciación resultantes (según lo informado por el software estándar Ion Torrent proporcionado con el Sistema de secuenciación Ion Torrent), el número de lecturas de 50Q17, lecturas de 100Q17 y lecturas de 200Q17. Mediante el uso del software estándar suministrado con el sistema de secuenciación PGM™, puede medirse y compararse el número total de lecturas de 100Q17 o 200Q17 obtenidas en las reacciones de secuenciación mediante el uso de polimerasas de referencia y modificadas.
Ejemplo 3: Transferencia de mutaciones de una polimerasa modificada a otra polimerasa
Este ejemplo demuestra, como se ha publicado en el documento WO2015/048763, que las mutaciones de la polimerasa Bst con ciertas propiedades pueden "transferirse" a la polimerasa Taq mediante la creación de mutantes Taq, o mutantes del fragmento Klenow, de un(os) residuo(s) análogo(s). Se introdujeron varias mutaciones ilustrativas mediante mutagénesis dirigida al sitio en polimerasas de referencia ilustrativas que tenían las secuencias de aminoácidos de la SEQ ID NO: 2, SEQ ID NO: 16, SEQ ID NO: 15 y SEQ ID NO: 18 (ver la Tabla 1). Después de la verificación de la secuencia, las polimerasas modificadas que contenían las mutaciones de aminoácidos (por ejemplo, una ADN polimerasa Taq que tiene la mutación de aminoácidos D732R, en donde la numeración corresponde a la SEQ ID NO. 15; y una ADN polimerasa de fragmento Klenow que tiene la mutación de aminoácido D505R, en donde la numeración corresponde a la SEQ ID NO. 18) se transformaron en células bacterianas para su expresión. Las colonias que contenían el constructo de expresión se inocularon en medio BRM, se cultivaron hasta una DO=0,600 y se indujeron añadiendo IPTG hasta una concentración final de 1 mM. A continuación, las células se cultivaron durante 3 horas más a 37 °C.
A continuación, las células inducidas se centrifugaron durante 10 minutos a 6000 rpm, se descartó el sobrenadante y las células se resuspendieron en amortiguador de resuspensión (Tris 100 mM, pH 7,5, NaCl 100 mM). Las células resuspendidas se sonicaron en un ajuste de 60 (amplitud) durante un minuto y a continuación se colocaron en hielo durante 1 minuto. La sonicación se repitió de esta manera un total de 5 veces. Las muestras se incubaron a 65 °C durante 10 minutos y se centrifugaron a 9000 rpm. El sobrenadante se recuperó y se purificó más en una columna de heparina.
Columna de heparina de afinidad de ADN
Se observaron los siguientes resultados durante la purificación de las polimerasas modificadas en una columna de heparina. Todos los mutantes mostraron una unión más fuerte a una columna de heparina. Taq D732R salió de la columna a una conductividad de 43 mS/cm donde el tipo silvestre sale a 39 mS/cm. Klenow D505R salió de la columna a una conductividad de 47 mS/cm donde Klenow de tipo silvestre sale a 32 mS/cm.
Ensayo de afinidad / disociación de plantilla:
Se midió la tasa de disociación de cada polimerasa modificada y de referencia de una plantilla de ADN (oligo 221) en presencia de exceso de ADN competidor (oligo 173 en horquilla). La disminución de la fluorescencia se controla a lo largo del tiempo en un espectrofotómetro a medida que la polimerasa se disocia de la plantilla marcada con fluoresceína. La tasa de disociación se calcula ajustando los datos a una ecuación de decaimiento exponencial de una fase.
Resultados representativos de un ensayo donde la constante de tasa de disociación (también denominada "constante de tiempo de disociación") de varias polimerasas modificadas, así como también polimerasas de referencia que tienen la secuencia de aminoácidos de la SEQ ID NO: 2 o SEQ ID NO: 18, se midió a intervalos de tiempo (representados en la Figura 2). Las polimerasas incluidas en el ensayo se representan en la Figura 2 como sigue: Bst 1.0 = polimerasa de referencia que tiene la secuencia de aminoácidos de la SEQ ID NO: 2; BST D775R = polimerasa modificada que tiene la secuencia de aminoácidos de la SEQ ID NO: 2 e incluye además la mutación D775R; Klenow WT = polimerasa de referencia que tiene la secuencia de aminoácidos de la SEQ ID NO: 18; Klenow D505R = polimerasa modificada que tiene la secuencia de aminoácidos de la SEQ ID NO: 18 e incluye además la mutación D505R. Como se indica en la Figura 2, las polimerasas modificadas mostraron constantes de tiempo de disociación significativamente más altas en comparación con la polimerasa de referencia correspondiente.
Ejemplo 4: Construcción de polimerasas modificadas ilustrativas
Pueden introducirse varias mutaciones ilustrativas mediante mutagénesis dirigida al sitio en una polimerasa de referencia ilustrativa, tal como una polimerasa que tiene la secuencia de aminoácidos de la SEQ ID NO: 1 (fragmento de ADN polimerasa Bst de tipo silvestre de 581 aminoácidos), o mutantes de referencia de la misma tales como aquellos que tienen la secuencia de aminoácidos de la SEQ ID NO: 2 o SEQ ID NO: 35; o polimerasa de referencia ilustrativa que tiene la secuencia de aminoácidos de la SEQ ID NO: 16 (ADN polimerasa Bst de tipo silvestre de longitud completa), o mutantes de referencia de la misma tales como aquellos que tienen la secuencia de aminoácidos de la s Eq ID NO: 122 o SEQ ID NO: 120. Este ejemplo describe un método ilustrativo de alto rendimiento que puede usarse para generar una biblioteca de polimerasas mutantes o fragmentos activos biológicos
de las mismas. Los ejemplos de la presente descripción también describen los métodos para evaluar tales polimerasas mutadas o fragmentos biológicamente activos para la actividad de polimerasa, o varios aspectos de una reacción de secuenciación relacionada indirectamente con tal actividad de polimerasa.
En este ejemplo, puede prepararse una biblioteca mutagenizada de constructos que añade mutaciones a una polimerasa de referencia tal como cualquiera de las polimerasas de referencia discutidas inmediatamente antes, donde cada aminoácido en la polimerasa puede mutarse individualmente, o cualquiera de los mutantes descritos en estos ejemplos de la presente descripción, puede crearse. Además, en un ejemplo ilustrativo, los residuos de aminoácidos seleccionados pueden mutarse con cada combinación posible de aminoácidos en los residuos de aminoácidos seleccionados. La biblioteca resultante de constructos mutantes puede aplicarse a varias placas de 96 pocillos donde los constructos mutantes pueden cultivarse en medios BRM durante la noche a 30 °C. Los medios que contienen los constructos mutantes pueden inocularse en placas profundas de 96 pocillos y cultivarse durante 3 horas a 37 °C e inducirse añadiendo IPTG hasta una concentración final de 1 mM. A continuación, las células pueden cultivarse durante otras 3 horas a 37 °C. A continuación, las células inducidas pueden centrifugarse durante 10 minutos a 3700 rpm, puede desecharse el sobrenadante y las células pueden resuspenderse en 100 pl de amortiguador de resuspensión (Tris 10 mM, pH 7,5, NaCl 100 mM). Las células resuspendidas pueden sonicarse en un ajuste de 60 (amplitud) durante un minuto y a continuación colocarse a 80 °C durante la noche.
Las muestras anteriores pueden incubarse a 65 °C durante 10 minutos. A continuación, las muestras pueden centrifugarse a 3700 rpm durante 12 minutos. El sobrenadante se recuperó y se purificó adicionalmente con resina Affinity y perlas myOne mediante el uso de un oligonucleótido de captura biotinilado. Las polimerasas mutadas purificadas o los fragmentos biológicamente activos pueden eluirse en alto contenido de NaCl y cambiarse el amortiguador. Las polimerasas mutantes purificadas o los fragmentos biológicamente activos pueden analizarse para medir diversas actividades de polimerasa, tal como la relación de señal con respecto a ruido, error sistemático, longitud de lectura, precisión absoluta, sesgo de cadena y rendimiento total de secuenciación, como se describe en los ejemplos a continuación.
Ejemplo 5: Evaluación del error sistemático
Este ejemplo proporciona un método para evaluar el error generalmente asociado con la atenuación prematura en una o ambas cadenas, sesgo de cadena extremo, error de cadena sistemático y alto contenido de GC. Será evidente para el experto en la técnica que el método descrito en la presente descripción puede modificarse para evaluar otras métricas asociadas con el error sistemático, o puede modificarse para medir una o más métricas asociadas con la actividad de polimerasa, tal como la constante de disociación de plantilla.
Las polimerasas purificadas o sus fragmentos biológicamente activos pueden prepararse esencialmente de acuerdo con el Ejemplo 1 o el Ejemplo 4 y pueden usarse para evaluar el error sistemático mediante el uso de una máquina de genoma personal y chips Ion PGm 318, o un instrumento Ion Torrent Proton o S5 (Life Technologies Corp, CA).
Una polimerasa mutante, o un fragmento biológicamente activo de la misma, o una biblioteca de polimerasas mutantes o fragmentos biológicamente activos de las mismas pueden compararse directamente con una secuencia de referencia, tal como una polimerasa Bst mutante de base (es decir, referencia) que incluye algunas pero no todas las mutaciones del mutante en prueba (que actúa como control) para el rendimiento en un sistema de secuenciación basado en iones tal como el sistema de secuenciación por síntesis Ion Torrent. Las bibliotecas de ácidos nucleicos obtenidas de las reacciones de PCR en emulsión (emPCR) pueden aplicarse corriente abajo en una reacción de secuenciación basada en iones mediante el uso del sistema de secuenciación Ion Torrent PGM™ (Ion Torrent Systems, núm. de pieza 446462917). Brevemente, el ADN plantilla puede purificarse, enlazarse con adaptador y seleccionarse según el tamaño como se describe en la Guía del usuario para el kit de biblioteca de fragmentos con iones (Ion Torrent Systems, núm. de pieza 44646646464; publicación núm. de pieza 446467320 Rev B). El ADN plantilla puede amplificarse en partículas Ion Sphere™ en una reacción de PCR en emulsión como se describe a continuación. La biblioteca de ácidos nucleicos usada en las reacciones de PCR en emulsión de 96 pocillos puede incluir 24 plantillas de ácidos nucleicos que previamente se había demostrado que producían una atenuación prematura en una cadena en una reacción de secuenciación por síntesis basada en iones con la polimerasa Bst de referencia; 12 plantillas de ácido nucleico que previamente se había demostrado que daban como resultado una atenuación prematura en ambas cadenas cuando se usaron en una reacción de secuenciación por síntesis basada en iones con la polimerasa Bst de referencia; 12 plantillas de ácido nucleico que se había demostrado previamente que producían un sesgo de cadena extremo cuando se usaron en una reacción de secuenciación por síntesis basada en iones con la polimerasa Bst de referencia; 24 plantillas de ácido nucleico que previamente se había demostrado que producían un incremento del error sistemático de cadena cuando se usaron en una reacción de secuenciación por síntesis basada en iones con la polimerasa Bst de referencia; 12 plantillas de ácido nucleico que contenían un alto contenido de GC que puede reducir la precisión cuando se usaron en una reacción de secuenciación por síntesis basada en iones con la polimerasa Bst de referencia; y 12 plantillas de ácido nucleico que funcionaron bien de manera regular en las condiciones de secuenciación propuestas y probadas cuando se usaron en una reacción de secuenciación por síntesis basada en iones con la polimerasa Bst de referencia. La PCR en emulsión puede realizarse mediante el uso de la biblioteca de 96 plantillas anterior de acuerdo con las condiciones y
soluciones de PCR de emulsión estándar para la preparación de muestras de secuenciación Ion Torrent (Life Technologies, Carlsbad, CA) de acuerdo con las instrucciones del fabricante.
Las partículas Ion Sphere (ISP, 20-40 millones) de cada una de las 96 reacciones de PCR en emulsión con código de barras anteriores pueden añadirse por separado a los tubos de PCR individuales. Luego, los tubos pueden llenarse con amortiguador de hibridación y agitarse en vórtex. Los tubos pueden girarse a máxima velocidad (16500 rpm) durante 4 minutos en una centrífuga de mesa y puede eliminarse el sobrenadante. El cebador de secuenciación puede añadirse, mezclarse mediante pipeteo e hibridarse con las perlas mediante termociclado. Las ISP hibridadas con cebador resuspendidas pueden añadirse a cada pocillo de la placa de 96 pocillos para producir 400 000 perlas por pocillo. Pueden añadirse a cada pocillo polimerasas mutagenizadas de referencia o en prueba individuales o fragmentos biológicamente activos de las mismas, con solo 1 polimerasa mutante o de referencia o fragmento biológicamente activo añadido por pocillo. Las polimerasas mutantes (o fragmentos biológicamente activos de las mismas) y las ISP pueden incubarse a temperatura ambiente durante 40 min, seguido de la adición de una mezcla de a-tio dGTP/a-tio dTTP para permitir la unión de la polimerasa mutante de referencia o en prueba a la ISP. Los 96 pocillos pueden combinarse en un depósito, transferirse a un tubo de 2 ml y girar a máxima velocidad durante 3 minutos. El sobrenadante puede retirarse, el tubo se agita brevemente y a continuación se coloca el tubo en un bloque magnético. La muestra puede incubarse en el bloque magnético durante 30 segundos, el sobrenadante puede retirarse y la muestra completa puede cargarse en un chip Ion 318 (Life Technologies, CA, núm. de catálogo 4484354) mediante el uso del protocolo de carga estándar proporcionado por el fabricante. Una vez completada la carga, el chip puede lavarse pipeteando la solución de lavado a través del puerto de carga. La etapa de lavado puede repetirse dos veces, para un total de 3 lavados. Todo el líquido puede eliminarse del chip antes de cargarlo en el Ion PGM (Life Technologies, Carlsbad, CA, núm. de catálogo 446462921) y secuenciarse con el kit Sequencing 400 estándar (Life Technologies, Carlsbad, CA, núm. de catálogo 4482002) de acuerdo con las instrucciones del fabricante. En consecuencia, la polimerasa mutante de referencia o en prueba unida a la ISP es la polimerasa que realiza la reacción de secuenciación.
Los ciclos de secuenciación resultantes obtenidos de la biblioteca de polimerasas mutagenizadas o fragmentos biológicamente activos pueden evaluarse para detectar errores sistemáticos. En particular, métricas tales como recuento total de bases de AQ 20 (rendimiento de secuenciación total), AQ20 media, precisión de lectura sin procesar, sesgo de cadena (bases diana sin sesgo de cadena) y porcentaje de error sistemático (medido en los Ejemplos que se refieren a este Ejemplo, como porcentaje de errores estocásticos en motivos de secuencia que contienen homopolímeros de longitud 1-6, con deleción sistemática que se produce en la cadena con una frecuencia superior al 15 %, cuando se puede medir la cobertura (de la corrida de secuenciación) igual o superior a 20x. Opcionalmente, algunas de las polimerasas mutantes pueden evaluarse adicionalmente mediante el uso de las mismas métricas contra otras polimerasas conocidas, además de la comparación directa con una polimerasa de referencia que incluye algunas de las mismas mutaciones que la polimerasa mutante en prueba.
Ejemplo 6: Creación e identificación de ADN polimerasas Bst mutantes que tienen propiedades mejoradas en la secuenciación de ácidos nucleicos
Se usó una polimerasa de referencia (control) que consistía en la SEQ ID NO: 35 para generar una biblioteca mutagénica de polimerasas esencialmente como se describe en el Ejemplo 4. La biblioteca de polimerasas mutagénicas se tamizó de acuerdo con el Ejemplo 5 para evaluar diversas actividades de polimerasa, incluida la precisión y el error sistemático, medidas por la longitud de lectura AQ20 promedio, la precisión de lectura sin procesar promedio, la precisión para homopolímeros de 6 o 7 bases, el error sistemático promedio (SSE) y longitud de lectura media promedio (MRL).
A partir de la biblioteca mutagénica preparada (que contiene una pluralidad de sustituciones de residuos de aminoácidos individuales), se observó que varias mutaciones de aminoácidos superaban a la polimerasa de control en condiciones de secuenciación idénticas (según lo medido por la precisión y error sistemático). Como resultado, se prepararon polimerasas mutantes adicionales esencialmente como se describe en el Ejemplo 4, que contenían combinaciones de varias sustituciones de aminoácidos que superaron a la polimerasa de control en las reacciones de secuenciación para producir una pluralidad de polimerasas mutantes que tenían una, dos o tres sustituciones de aminoácidos en comparación con la SEQ ID NO: 35.
La SEQ ID NO: 35 es una polimerasa mutante (denominada en la presente descripción "PSP4") que tiene tres sustituciones de aminoácidos en comparación con la SEQ ID NO: 2. La polimerasa mutante de la s Eq ID NO: 35 consiste en las sustituciones de aminoácidos D423K, N487R y H281M en comparación con la SEQ ID NO: 2.
En el siguiente experimento, la polimerasa de referencia (control) usada para evaluar la precisión y el error sistemático en las reacciones de secuenciación de ácidos nucleicos (según lo medido por el error sistemático promedio (SSE prom) y la longitud de lectura media (MRL) promedio de AQ20) fue la SEQ ID NO. 35.
En este caso, se prepararon seis placas de 96 pocillos esencialmente de acuerdo con el Ejemplo 5 mediante el uso de la SEQ ID NO: 35 como polimerasa de referencia (control). Se evaluaron los datos de secuenciación de cada placa de 96 pocillos para identificar polimerasas de secuenciación mutantes mejoradas según lo medido por el error
sistemático promedio (SSE promedio) o la longitud de lectura media (MRL) promedio de AQ20 en comparación con la polimerasa de referencia (es decir, control) (SEQ ID NO: 35 (PSP4)).
Las Figuras 3A-3F proporcionan datos de secuenciación para cada una de las polimerasas mutantes, que mostraron un rendimiento de secuenciación mejorado en comparación con la polimerasa de control (PSP4), según se mide mediante el SSE promedio o MRL de AQ20 promedio. Cada una de las seis placas de 96 pocillos identificó una pluralidad de residuos de aminoácidos que, cuando mutaron, mostraron un rendimiento mejorado en una reacción de secuenciación por síntesis cuando se usaron como parte de un sistema de secuenciación por síntesis, tal como un sistema de secuenciación Ion Torrent, según lo medido por precisión mejorada y/o error sistemático reducido en comparación con la polimerasa de control (PSP4).
Además, algunos residuos de aminoácidos sometidos a mutagénesis dirigida crearon una pluralidad de polimerasas mejoradas en un único residuo de aminoácido de la SEQ ID NO: 35. Por ejemplo, la Placa 1 (Figura 3A) identificó que el residuo de aminoácido 234 de la SEQ ID NO: 35 tenía una función de secuenciación mejorada según lo medido tanto por SSE promedio como por MRL de AQ20 promedio cuando se sustituyeron los aminoácidos lisina (K) o arginina (R) por asparagina. La placa 2 (Figura 3B) identificó que el residuo de aminoácido 267 de la SEQ ID NO: 35 tenía una función de secuenciación mejorada según lo medido tanto por SSE promedio como por MRL de AQ20 promedio cuando los aminoácidos metionina (M), lisina (K) o arginina (R) se sustituyeron por ácido glutámico. La placa 3 (Figura 3C) identificó que el residuo de aminoácido 442 de la SEQ ID NO: 35 tenía una función de secuenciación mejorada según lo medido tanto por SSE promedio como por MRL de AQ20 promedio cuando los aminoácidos tirosina (Y) o arginina (R) se sustituyeron por ácido glutámico. La placa 4 (Figura 3D) identificó que el residuo de aminoácido 480 de la SEQ ID NO: 35 tenía una función de secuenciación mejorada según lo medido tanto por SSE promedio como por MRL de AQ20 promedio cuando los aminoácidos leucina (L) o arginina (R) se sustituyeron por ácido aspártico. La placa 5 (Figura 3E) identificó que el residuo de aminoácido 517 de la SEQ ID NO: 35 tenía una función de secuenciación mejorada según lo medido tanto por SSE promedio como por MRL de AQ20 promedio cuando se introdujeron los aminoácidos cisteína (C) o lisina (K) por asparagina. La placa 6 (Figura 3F) identificó que el residuo de aminoácido 264 de la SEQ ID NO: 35 tiene propiedades mejoradas en una reacción de secuenciación según lo medido tanto por SSE promedio como por MRL de AQ20 promedio cuando se introdujeron los aminoácidos metionina (M) o lisina (K) por ácido aspártico.
Ejemplo 7: Creación e identificación de ADN polimerasas Bst mutante que incluyen l252r
En este caso, una polimerasa de referencia (control) que consiste en la SEQ ID NO: 35 (PSP4) se comparó con dos polimerasas mutantes producidas esencialmente de acuerdo con el Ejemplo 4. La primera polimerasa mutante, denominada PSP4-252R, contenía una única sustitución de aminoácido en el residuo 252 de la SEQ ID NO: 35 (sustitución L252R). La segunda polimerasa mutante, denominada PSP4-252R++, contenía tres sustituciones de aminoácidos en relación con la SEQ ID NO: 35 (sustituciones L252R, H473G y H528T). Como tal, la polimerasa mutante PSP4-252R++ contiene dos mutaciones de histidina en comparación con la polimerasa mutante PSP4-252R. El mutante PSP4-252R++ es la SEQ ID NO: 119, y también se denomina en la presente descripción polimerasa recombinante mutante "Bst LRX".
Para determinar la señal clave, la secuencia de nucleótidos AGTC se hibridó con los extremos de las plantillas de ácido nucleico durante la preparación de la muestra. A continuación, se midió la intensidad de la señal en el sistema Ion Torrent cuando leyó la secuencia AGTC al comienzo de una reacción de secuenciación.
La Figura 4 muestra los resultados de los datos de secuenciación nucleica obtenidos en condiciones de secuenciación idénticas para la polimerasa de control (PSP4), la polimerasa mutante L252R (PSP4-252R) y el mutante que tiene una doble mutación de histidina (PSP4-252R++), donde las reacciones de secuenciación se realizaron como se describe esencialmente en el Ejemplo 5 de la presente descripción.
La presencia de dos mutaciones de histidina adicionales dio como resultado métricas de secuenciación significativamente mejoradas en comparación con la polimerasa de referencia (PSP4) o la polimerasa mutante PSP4-252R. Las métricas de secuenciación incluyeron la medición de la longitud media de lectura de AQ20, la clave (que es una medida de la señal), la longitud de lectura perfecta, la precisión de lectura sin procesar promedio y la precisión real para homopolímero ACGT de 6 pb o 7 pb.
Ejemplo 8: Influencia de mutaciones adicionales de histidina en el mutante l252r en la longitud de lectura y la precisión
En este caso, se evaluó adicionalmente el efecto de la doble mutación de histidina en el fondo de PSP4 (como se observa en el Ejemplo 7). La polimerasa mutante PSP4-L252R (del Ejemplo 7) que carecía de mutaciones de histidina se comparó con la polimerasa mutante PSP4-252R++ que tenía dos mutaciones de histidina en condiciones idénticas de secuenciación de ácidos nucleicos. Se preparó otra polimerasa mutante, esencialmente de acuerdo con el Ejemplo 4, que consistía en solo una mutación de histidina en el residuo H528T. Una vez que se purificó la polimerasa mutante de histidina única, las tres polimerasas (PSP4-252R; PSP4-252R H528T; y PSP4-L252R H528T H473G) se compararon en reacciones de secuenciación de ácidos nucleicos en condiciones idénticas,
realizadas esencialmente como se describe en el Ejemplo 3, excepto que la polimerasa de control (referencia) era la SEQ ID NO: 35 (PSP4).
La Figura 5 muestra los resultados de las reacciones de secuenciación. Tener dos mutaciones de histidina, una en la posición 473 y otra en la posición 528, mejoró significativamente las métricas de secuenciación de PSP4-L252R H528T H473G en comparación con la polimerasa mutante que carece de las dos mutaciones de histidina (PSP4-L252R). También se observó que la relación de señal con respecto a ruido (medida por la señal máxima) mejoraba sustancialmente cuando se introducía una mutación de histidina simple o doble en la polimerasa PSP4 (SEQ ID NO: 35). De manera similar, la longitud de lectura promedio de AQ20 también mejoró cuando se empleó una doble mutación de histidina.
A menos que se defina de cualquier otra manera, todos los términos técnicos y científicos usados en la presente descripción tienen el mismo significado que el comúnmente entendido por un experto en la técnica a la que pertenece esta invención. Si una definición y/o descripción se establece explícita o implícitamente en la presente descripción que es contraria o inconsistente de cualquier otra manera con cualquier definición expuesta en las patentes, solicitudes de patentes, solicitudes publicadas y otras publicaciones a las que se hace referencia en el presente descripción, la definición y/o descripción expuesta en la presente descripción prevalece sobre la definición que se describe en una referencia.
La práctica de la descripción empleará, a menos que se indique de cualquier otra manera, técnicas convencionales de biología molecular, microbiología y técnicas de ADN recombinante, que se encuentran dentro de la experiencia en la técnica. Tales técnicas se explican completamente en la bibliografía. Ver, por ejemplo, Sambrook, J., y Russell, D.W., 2001, Molecular Cloning: A Laboratory Manual, Tercera Edición; Ausubel, F.M., y otros, eds., 2002, Short Protocols In Molecular Biology, Quinta Edición.
Nótese que no se requieren todas las actividades descritas en la descripción general o en los ejemplos, que es posible que no se requiera una porción de una actividad específica y que pueden realizarse una o más actividades adicionales además de las descritas. Aún más, el orden en que se enumeran las actividades no es necesariamente el orden en que se realizan.
En algunos casos, se han descrito algunos conceptos con referencia a modalidades específicas. La descripción y las figuras deben considerarse en un sentido ilustrativo y no restrictivo.
Secuencias de ciertas polimerasas Bst de tipo silvestre descritas en la presente descripción
SEQ ID NO: 1
Fragmento de 581 aminoácidos de tipo silvestre de la ADN polimerasa Bst
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met 1 5 10 15 Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro lie Val Gly lie Ala Val Val Asn Glu His Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala 50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg 65 70 75 80 Ala Ala Val Ala Leu Lys Trp Lys Gly lie Glu Leu Cys Gly Val Ser 85 90 95 Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp 130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala lie Trp 145 150 155 160 Glu Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp 165 170 175 Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser lie Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Lys Glu Leu Ala Glu Gln Leu Gly Thr Val Glu Gln Arg lie Tyr 210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn lie Asn Ser Pro Lys Gln Leu Gly 225 230 235 240 Val lie Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys 245 250 255 Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu lie Val Glu Asn lie Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr lie Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr 290 295 300
Lys Lys Val His Thr lie Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320 Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn lie Pro lie Arg Leu Glu 325 330 335 Glu Gly Arg Lys lie Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu lie Phe Ala Ala Asp Tyr Ser Gln lie Glu Leu Arg Val Leu Ala
355 360 365
His lie Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu 370 375 380
Asp lie His Thr Lys Thr Ala Met Asp lie Phe Gln Val Ser Glu Asp 385 390 395 400 Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly 405 410 415 lie Val Tyr Gly lie Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn lie
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe lie Glu Arg Tyr Phe Glu Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn lie Val Gln Glu Ala Lys Gln 450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp 465 470 475 480 lie Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala 485 490 495 Met Asn Thr Pro lie Gln Gly Ser Ala Ala Asp lie lie Lys Lys Ala
500 505 510
Met lie Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala His
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu lie Leu Glu Ala Pro Lys Glu 530 535 540
Glu Met Glu Arg Leu Cys Arg Leu Val Pro Glu Val Met Glu Gln Ala 545 550 555 560 Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr 565 570 575 Trp Tyr Asp Ala Lys
580
SEQ ID NO: 16
ADN polimerasa Bst de longitud completa de tipo silvestre (876 aminoácidos)
Met Lys Lys Lys Leu Val Leu lie Asp Gly Ser Ser Val Ala Tyr Arg
Ala Phe Phe Ala Leu Pro Leu Leu His Asn Asp Lys Gly lie His Thr
20 25 30
Asn Ala Val Tyr Gly Phe Thr Met Met Leu Asn Lys lie Leu Ala Glu
35 40 45
Glu Glu Pro Thr His Met Leu Val Ala Phe Asp Ala Gly Lys Thr Thr 50 55 60
Phe Arg His Glu Ala Phe Gln Glu Tyr Lys Gly Gly Arg Gln Gln Thr 65 70 75 80 Pro Pro Glu Leu Ser Glu Gln Phe Pro Leu Leu Arg Glu Leu Leu Arg 85 90 95 Ala Tyr Arg lie Pro Ala Tyr Glu Leu Glu Asn Tyr Glu Ala Asp Asp
100 105 110
lie lie Gly Thr Leu Ala Ala Arg Ala Glu Gln Glu Gly Phe Glu Val
115 120 125
Lys Val lie Ser Gly Asp Arg Asp Leu Thr Gln Leu Ala Ser Pro His 130 135 140
Val Thr Val Asp lie Thr Lys Lys Gly lie Thr Asp lie Glu Pro Tyr 145 150 155 160 Thr Pro Glu Thr Val Arg Glu Lys Tyr Gly Leu Thr Pro Glu Gln lie 165 170 175 Val Asp Leu Lys Gly Leu Met Gly Asp Lys Ser Asp Asn lie Pro Gly
180 185 190
Val Pro Gly lie Gly Glu Lys Thr Ala Val Lys Leu Leu Arg Gln Phe
195 200 205
Gly Thr Val Glu Asn Val Leu Ala Ser lie Asp Glu lie Lys Gly Glu 210 215 220
Lys Leu Lys Glu Thr Leu Arg Gln His Arg Glu Met Ala Leu Leu Ser 225 230 235 240 Lys Lys Leu Ala Ala lie Arg Arg Asp Ala Pro Val Glu Leu Ser Leu 245 250 255 Asp Asp lie Ala Tyr Gln Gly Glu Asp Arg Glu Lys Val Val Ala Leu
260 265 270
Phe Lys Glu Leu Gly Phe Gln Ser Phe Leu Glu Lys Met Glu Ser Pro
275 280 285
Ser Ser Glu Glu Glu Lys Pro Leu Ala Lys Met Ala Phe Thr Leu Ala 290 295 300
Asp Arg Val Thr Glu Glu Met Leu Ala Asp Lys Ala Ala Leu Val Val 305 310 315 320 Glu Val Val Glu Glu Asn Tyr His Asp Ala Pro lie Val Gly lie Ala 325 330 335 Val Val Asn Glu His Gly Arg Phe Phe Leu Arg Pro Glu Thr Ala Leu
340 345 350
Ala Asp Pro Gln Phe Val Ala Trp Leu Gly Asp Glu Thr Lys Lys Lys
355 360 365
Ser Met Phe Asp Ser Lys Arg Ala Ala Val Ala Leu Lys Trp Lys Gly 370 375 380
lie Glu Leu Cys Gly Val Ser Phe Asp Leu Leu Leu Ala Ala Tyr Leu
385 390 395 400 Leu Asp Pro Ala Gln Gly Val Asp Asp Val Ala Ala Ala Ala Lys Met 405 410 415 Lys Gln Tyr Glu Ala Val Arg Pro Asp Glu Ala Val Tyr Gly Lys Gly
420 425 430
Ala Lys Arg Ala Val Pro Asp Glu Pro Val Leu Ala Glu His Leu Val
435 440 445
Arg Lys Ala Ala Ala lie Trp Glu Leu Glu Arg Pro Phe Leu Asp Glu 450 455 460
Leu Arg Arg Asn Glu Gln Asp Arg Leu Leu Val Glu Leu Glu Gln Pro 465 470 475 480 Leu Ser Ser lie Leu Ala Glu Met Glu Phe Ala Gly Val Lys Val Asp 485 490 495 Thr Lys Arg Leu Glu Gln Met Gly Lys Glu Leu Ala Glu Gln Leu Gly
500 505 510
Thr Val Glu Gln Arg lie Tyr Glu Leu Ala Gly Gln Glu Phe Asn lie
515 520 525
Asn Ser Pro Lys Gln Leu Gly Val lie Leu Phe Glu Lys Leu Gln Leu 530 535 540
Pro Val Leu Lys Lys Thr Lys Thr Gly Tyr Ser Thr Ser Ala Asp Val 545 550 555 560 Leu Glu Lys Leu Ala Pro Tyr His Glu lie Val Glu Asn lie Leu His 565 570 575 Tyr Arg Gln Leu Gly Lys Leu Gln Ser Thr Tyr lie Glu Gly Leu Leu
580 585 590
Lys Val Val Arg Pro Asp Thr Lys Lys Val His Thr lie Phe Asn Gln
595 600 605
Ala Leu Thr Gln Thr Gly Arg Leu Ser Ser Thr Glu Pro Asn Leu Gln 610 615 620
Asn lie Pro lie Arg Leu Glu Glu Gly Arg Lys lie Arg Gln Ala Phe 625 630 635 640 Val Pro Ser Glu Ser Asp Trp Leu lie Phe Ala Ala Asp Tyr Ser Gln 645 650 655 lie Glu Leu Arg Val Leu Ala His lie Ala Glu Asp Asp Asn Leu Met
660 665 670
Glu Ala Phe Arg Arg Asp Leu Asp lie His Thr Lys Thr Ala Met Asp
675 680 685
lie Phe Gln Val Ser Glu Asp Glu Val Thr Pro Asn Met Arg Arg Gln 690 695 700
Ala Lys Ala Val Asn Phe Gly lie Val Tyr Gly lie Ser Asp Tyr Gly 705 710 715 720 Leu Ala Gln Asn Leu Asn lie Ser Arg Lys Glu Ala Ala Glu Phe lie 725 730 735 Glu Arg Tyr Phe Glu Ser Phe Pro Gly Val Lys Arg Tyr Met Glu Asn
Claims (17)
1. Una composición que comprende una ADN polimerasa recombinante, en donde la ADN polimerasa recombinante comprende un segmento polipeptídico que tiene al menos 80 % de identidad con la SEQ ID NO: 16 o un fragmento de la misma, muestra actividad de polimerasa, incluye H341R, E741Q, H867R, H576M, D718K y N782R, e incluye además
(a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en Z E325K; G504Q; E515H, E515K o E515T; N529K o N529R; P531I o P531R; V536K; E540R; V546R; L547R; S555K; D559K o D559M; E562M, E562K o E562R; E572T; E589K; T619R; E620R; A639Y; E737R o E737Y; E751R; D775L o D775R; N780R; A787K; E788G o E788R; M790C; N812C o N812K; y E817C, en donde la numeración es con relación a la SEQ ID NO: 16; o
(b) una o más sustituciones de aminoácidos seleccionadas de L547R; L547R y H823T; L547R y H768G; o L547R, H823T y H768G, en donde la numeración es con relación a la SEQ ID NO: 16.
2. La composición de la reivindicación 1, en donde el segmento polipeptídico que tiene al menos 80 % de identidad con la SEQ IN NO: 16 o un fragmento de la misma es un segmento polipeptídico que tiene al menos 80 % de identidad con la SEQ ID NO: 1 o un fragmento de la misma e incluye H46R, E446Q, H572R, H281M, D423K y N487R, en donde la numeración es con relación a la SEQ ID NO: 1, e incluye además ya sea
(a) una o más sustituciones de aminoácidos seleccionadas del grupo que consiste en E30K; G209Q; E220H, E220K o E220T; N234K o N234R; P236I o P236R; V241K; E245R; V251R; L252R; S260K; D264K o D264M; E267M, E267K o E267R; E277T; E294K; T324R; E325R; A344Y; E442R o E442Y; E456R; H473G; D480L o D480R; N485R; A492K; E493G o E493R; M495C; N517C o N517K; E522C; y H528T, en donde la numeración es con relación a la SEQ ID NO: 1; o
(b) una o más sustituciones de aminoácidos seleccionadas de L252R; L252R y H473G; L252 y H528T; o L252R, H473G y H528T, en donde la numeración es con relación a la SEQ ID No : 1.
3. La composición de la reivindicación 1 o 2, en donde la ADN polimerasa recombinante produce una reducción de la tasa de error, una mejora de la precisión y/o un incremento de la señal, cuando se usa en una reacción de secuenciación por síntesis en donde se detectan iones de hidrógeno, en comparación con la tasa de error obtenida mediante el uso de la SEQ ID NO: 35.
4. La composición de cualquiera de las reivindicaciones 1, 2 o 3, en donde la ADN polimerasa recombinante tiene al menos 90 % de identidad de secuencia con la SEQ ID NO: 1, o un fragmento de la misma o con la SEQ ID NO: 16 o un fragmento de la misma.
5. La composición de cualquiera de las reivindicaciones 1 a 4, en donde la ADN polimerasa recombinante incluye L252R, H528T y H473G, en donde la numeración es con relación a la SEQ ID NO: 1, o L547R, H823T y H768G, en donde la numeración es con relación a la SEQ ID NO: 16.
6. La composición de cualquiera de las reivindicaciones 1 a 4, en donde la ADN polimerasa recombinante incluye L252R y H528T, en donde la numeración es con relación a la SEQ ID NO: 1, o L547R y H823T, en donde la numeración es con relación a la SEQ ID NO: 16.
7. La composición de cualquiera de las reivindicaciones 1 a 4, en donde la ADN polimerasa recombinante incluye L252R y H473G, en donde la numeración es con relación a la SEQ ID NO: 1, o L547R y H768G, en donde la numeración es con relación a la SEQ ID NO: 16.
8. La composición de cualquiera de las reivindicaciones 1 a 4, en donde la polimerasa recombinante incluye L252R, en donde la numeración es con relación a la SEQ ID NO: 1, o L547R, en donde la numeración es con relación a la SEQ ID NO: 16.
9. La composición de la reivindicación 4, en donde la ADN polimerasa recombinante incluye L252R en donde la numeración es con relación a la SEQ ID NO: 1, o L547R, en donde la numeración es con relación a la SEQ ID NO: 16 e incluye además una o más sustituciones de aminoácidos seleccionadas de la grupo que consiste en H473G y H528t , en donde la numeración es con relación a la SEQ ID NO: 1, o del grupo que consiste en H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16.
10. La composición de la reivindicación 4, en donde la ADN polimerasa recombinante incluye H473G y H528T, en donde la numeración es con relación a la SEQ ID NO: 1, o H768G y H823T, en donde la numeración es con relación a la SEQ ID NO: 16.
11. La composición de la reivindicación 4, en donde la ADN polimerasa recombinante incluye L252R, H528T y H473G, en donde la numeración es con relación a la SEQ ID NO: 1, o L547R, H823T y H768G, en donde la numeración es con relación a la SEQ ID NO: 16.
12. La composición de la reivindicación 4, en donde la ADN polimerasa recombinante tiene la secuencia de la SEQ ID NO: 119 o SEQ ID NO: 121.
13. Una composición de acuerdo con cualquiera de las reivindicaciones 1, 2 o 3, en donde el segmento polipeptídico comprende al menos el 75 % de la ADN polimerasa recombinante, y en donde la ADN polimerasa recombinante no comprende segmentos de la ADN polimerasa Bst de tipo silvestre que tienen actividad de exonucleasa 3' a 5' y/o actividad de exonucleasa 5' a 3'.
14. Un método para realizar una reacción de polimerización, que comprende
(a) poner en contacto una ADN polimerasa recombinante de una composición de cualquiera de las reivindicaciones 1-13 con una plantilla de ácido nucleico en presencia de uno o más nucleótidos, y, (b) polimerizar al menos uno del uno o más nucleótidos mediante el uso de la polimerasa recombinante.
15. El método de la reivindicación 14, en donde la ADN polimerasa se pone en contacto con la plantilla de ácido nucleico en presencia de uno o más nucleótidos y una sal, en donde la sal es KCl y/o NaCl, y en donde la concentración salina es de 125 mM a 175 mM.
16. El método de la reivindicación 14, en donde la polimerización de al menos uno del uno o más nucleótidos mediante el uso de la polimerasa recombinante se realiza en condiciones adecuadas para la amplificación de un ácido nucleico en presencia de un ácido nucleico en donde se amplifica el ácido nucleico.
17. Un método para obtener información de secuencia a partir de una plantilla de ácido nucleico, que comprende:
(a) proporcionar una mezcla de reacción que comprende un ácido nucleico plantilla, uno o más nucleótidos, un cebador de secuenciación y una polimerasa recombinante de una composición de cualquiera de las reivindicaciones 1 a 13
(b) poner en contacto el ácido nucleico plantilla con al menos un tipo de nucleótido, en donde el contacto incluye incorporar uno o más nucleótidos del al menos un tipo de nucleótido en el extremo 3' del cebador de secuenciación y generar un producto de cebador extendido; y
(c) detectar la presencia del producto de cebador extendido en la mezcla de reacción mediante la detección de una liberación de iones de hidrógeno, lo que determina de este modo si se ha producido la incorporación de nucleótidos.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201562235616P | 2015-10-01 | 2015-10-01 | |
| PCT/US2016/053994 WO2017058810A2 (en) | 2015-10-01 | 2016-09-27 | Polymerase compositions and kits, and methods of using and making the same |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2925905T3 true ES2925905T3 (es) | 2022-10-20 |
Family
ID=57256403
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES16794093T Active ES2925905T3 (es) | 2015-10-01 | 2016-09-27 | Composiciones y kits de polimerasa, y métodos de uso y fabricación de los mismos |
Country Status (5)
| Country | Link |
|---|---|
| US (4) | US10344268B2 (es) |
| EP (2) | EP4141126A1 (es) |
| CN (2) | CN116218815A (es) |
| ES (1) | ES2925905T3 (es) |
| WO (1) | WO2017058810A2 (es) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20130040365A1 (en) | 2011-08-10 | 2013-02-14 | Life Technologies Corporation | Polymerase compositions, methods of making and using same |
| US10344268B2 (en) | 2015-10-01 | 2019-07-09 | Life Technologies Corporation | Polymerase compositions and kits, and methods of using and making the same |
| GB201721053D0 (en) | 2017-12-15 | 2018-01-31 | Univ I Tromsø - Norges Arktiske Univ | DNA polymerases |
| CN111684064A (zh) | 2018-01-19 | 2020-09-18 | 生物辐射实验室股份有限公司 | 突变dna聚合酶 |
| JP7727628B2 (ja) | 2019-12-03 | 2025-08-21 | アラマー バイオサイエンシーズ, インク. | 核酸結合免疫サンドイッチアッセイ(nulisa) |
| CN113583996B (zh) * | 2021-09-29 | 2022-01-14 | 翌圣生物科技(上海)股份有限公司 | Bst DNA聚合酶重组突变体、其编码DNA及超快磁珠LAMP检测方法 |
| WO2023081653A1 (en) * | 2021-11-02 | 2023-05-11 | Ultima Genomics, Inc. | Nucleic acid polymerase for incorporating labeled nucleotides |
| CN119842661B (zh) * | 2025-03-21 | 2025-07-15 | 中国农业科学院生物技术研究所 | Bst DNA聚合酶突变体及其制备方法与应用 |
Family Cites Families (31)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US278107A (en) | 1883-05-22 | dowson | ||
| US5466591A (en) | 1986-08-22 | 1995-11-14 | Hoffmann-La Roche Inc. | 5' to 3' exonuclease mutations of thermostable DNA polymerases |
| EP0550687B1 (en) | 1990-09-28 | 1999-06-09 | F. Hoffmann-La Roche Ag | 5' to 3' exonuclease mutations of thermostable dna polymerases |
| DE69233253T2 (de) | 1991-06-03 | 2004-08-26 | Takara Bio Inc., Otsu | Verfahren zum Klonieren eines Pol-I-Typ DNS-Polymerase-Gens |
| WO1994016107A1 (en) | 1993-01-12 | 1994-07-21 | Thomas Jefferson University | DNA SEQUENCING WITH Bst POLYMERASE |
| SG86311A1 (en) | 1997-04-10 | 2002-02-19 | Univ Singapore | Bacillus stearothermophilus dna polymerase i (klenow) clones with reduced 3'-to-5' exonuclease activity |
| US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
| GB9918150D0 (en) | 1999-08-03 | 1999-10-06 | Univ Sheffield | Nuclease variant |
| US20070172866A1 (en) | 2000-07-07 | 2007-07-26 | Susan Hardin | Methods for sequence determination using depolymerizing agent |
| CN100462433C (zh) | 2000-07-07 | 2009-02-18 | 维西根生物技术公司 | 实时序列测定 |
| WO2002086088A2 (en) | 2001-04-24 | 2002-10-31 | Li-Cor, Inc. | Polymerases with charge-switch activity and methods of generating such polymerases |
| US20030180741A1 (en) | 2001-12-21 | 2003-09-25 | Holly Hogrefe | High fidelity DNA polymerase compositions and uses therefor |
| GB0208768D0 (en) | 2002-04-17 | 2002-05-29 | Univ Newcastle | DNA polymerases |
| US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
| US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
| WO2008076406A2 (en) | 2006-12-14 | 2008-06-26 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes using large scale fet arrays |
| US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
| US7932034B2 (en) | 2006-12-20 | 2011-04-26 | The Board Of Trustees Of The Leland Stanford Junior University | Heat and pH measurement for sequencing of DNA |
| US20100301398A1 (en) | 2009-05-29 | 2010-12-02 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
| US8546128B2 (en) | 2008-10-22 | 2013-10-01 | Life Technologies Corporation | Fluidics system for sequential delivery of reagents |
| US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
| WO2010111686A2 (en) | 2009-03-27 | 2010-09-30 | Life Technologies Corp | Labeled enzyme compositions, methods & systems |
| US8673627B2 (en) | 2009-05-29 | 2014-03-18 | Life Technologies Corporation | Apparatus and methods for performing electrochemical reactions |
| WO2011106629A2 (en) | 2010-02-26 | 2011-09-01 | Life Technologies Corporation | Modified proteins and methods of making and using same |
| US20110301041A1 (en) | 2010-02-26 | 2011-12-08 | Life Technologies Corporation | Modified Proteins and Methods of Making and Using Same |
| US20120202276A1 (en) | 2010-02-26 | 2012-08-09 | Life Technologies Corporation | Modified Proteins and Methods of Making and Using Same |
| US20130040365A1 (en) * | 2011-08-10 | 2013-02-14 | Life Technologies Corporation | Polymerase compositions, methods of making and using same |
| US9657281B2 (en) * | 2013-09-30 | 2017-05-23 | Life Technologies Corporation | Polymerase compositions, methods of making and using same |
| US20150280880A1 (en) | 2014-04-01 | 2015-10-01 | Qualcomm Incorporated | Managing hybrid automatic repeat request (harq) buffer |
| EP4461821A3 (en) | 2014-12-16 | 2025-04-09 | Life Technologies Corporation | Polymerase compositions and methods of making and using same |
| US10344268B2 (en) | 2015-10-01 | 2019-07-09 | Life Technologies Corporation | Polymerase compositions and kits, and methods of using and making the same |
-
2016
- 2016-09-27 US US15/277,834 patent/US10344268B2/en active Active
- 2016-09-27 ES ES16794093T patent/ES2925905T3/es active Active
- 2016-09-27 CN CN202310209408.9A patent/CN116218815A/zh active Pending
- 2016-09-27 EP EP22185494.6A patent/EP4141126A1/en active Pending
- 2016-09-27 CN CN201680064448.7A patent/CN108350496B/zh active Active
- 2016-09-27 WO PCT/US2016/053994 patent/WO2017058810A2/en not_active Ceased
- 2016-09-27 EP EP16794093.1A patent/EP3356557B1/en active Active
-
2019
- 2019-05-17 US US16/415,063 patent/US11001814B2/en active Active
-
2021
- 2021-05-07 US US17/302,621 patent/US11866740B2/en active Active
-
2023
- 2023-11-28 US US18/521,466 patent/US12391930B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US20210284976A1 (en) | 2021-09-16 |
| US12391930B2 (en) | 2025-08-19 |
| WO2017058810A2 (en) | 2017-04-06 |
| CN116218815A (zh) | 2023-06-06 |
| US20170096648A1 (en) | 2017-04-06 |
| CN108350496B (zh) | 2023-04-18 |
| US11866740B2 (en) | 2024-01-09 |
| US20240101980A1 (en) | 2024-03-28 |
| EP3356557A2 (en) | 2018-08-08 |
| US20190270974A1 (en) | 2019-09-05 |
| WO2017058810A3 (en) | 2017-06-22 |
| EP3356557B1 (en) | 2022-07-20 |
| EP4141126A1 (en) | 2023-03-01 |
| US11001814B2 (en) | 2021-05-11 |
| CN108350496A (zh) | 2018-07-31 |
| US10344268B2 (en) | 2019-07-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2938585T3 (es) | Composiciones de polimerasa, métodos de producción y uso de estas | |
| ES2925905T3 (es) | Composiciones y kits de polimerasa, y métodos de uso y fabricación de los mismos | |
| US12338465B2 (en) | Polymerase compositions, methods of making and using same | |
| US11208636B2 (en) | Polymerase compositions, methods of making and using same |