[go: up one dir, main page]

ES2846730T3 - Concatemerización en superficie de moldes - Google Patents

Concatemerización en superficie de moldes Download PDF

Info

Publication number
ES2846730T3
ES2846730T3 ES16715859T ES16715859T ES2846730T3 ES 2846730 T3 ES2846730 T3 ES 2846730T3 ES 16715859 T ES16715859 T ES 16715859T ES 16715859 T ES16715859 T ES 16715859T ES 2846730 T3 ES2846730 T3 ES 2846730T3
Authority
ES
Spain
Prior art keywords
region
immobilized
known sequence
nucleic acid
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16715859T
Other languages
English (en)
Inventor
Jonathan Boutell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Original Assignee
Illumina Cambridge Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd filed Critical Illumina Cambridge Ltd
Application granted granted Critical
Publication of ES2846730T3 publication Critical patent/ES2846730T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método para preparar moldes inmovilizados para una reacción de secuenciación de ácidos nucleicos que comprende: (a) proporcionar un soporte sólido que tiene un cebador de amplificación directo e inverso inmovilizado sobre el mismo; (b) proporcionar un ácido nucleico diana, en donde el ácido nucleico diana comprende: (i) una primera región de secuencia conocida complementaria del cebador de amplificación directo; (ii) una primera región molde; (iii) una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región molde está entre la primera región de secuencia conocida y la segunda región de secuencia conocida; y (iv) una tercera región de secuencia conocida complementaria del cebador de amplificación directo, en donde la primera región molde y la segunda región de secuencia conocida están entre la primera región de secuencia conocida y la tercera región de secuencia conocida; (c) aplicar el ácido nucleico diana al soporte sólido en condiciones adecuadas para la hibridación de modo que la primera región de secuencia conocida se hibrida con el cebador de amplificación directo; (d) extender el cebador de amplificación directo hibridado para generar un primer molde inmovilizado que comprende una copia complementaria del ácido nucleico diana; (e) desnaturalizar el ácido nucleico diana del primer molde inmovilizado; (f) hibridar el primer molde inmovilizado con el cebador de amplificación inverso, de modo que una copia complementaria de la segunda región de secuencia conocida se hibrida con el cebador de amplificación inverso; y (g) extender el cebador de amplificación inverso hibridado para generar una segunda cadena inmovilizada que comprende la primera región molde colocada entre la primera región de secuencia conocida y la segunda región de secuencia conocida; (h) desnaturalizar la segunda cadena inmovilizada del primer molde inmovilizado; (i) hibridar la segunda cadena inmovilizada con el primer molde inmovilizado, de modo que la primera región de secuencia conocida de la segunda cadena inmovilizada se hibrida con una copia complementaria de la tercera región de secuencia conocida en el molde inmovilizado; (j) extender un 3' OH de la primera región de secuencia conocida para generar un concatémero de la segunda cadena inmovilizada; y (k) extender un 3' OH de la copia complementaria de la tercera región de secuencia conocida para generar un concatémero del primer molde inmovilizado; en donde el método comprende además secuenciar el ácido nucleico diana y la secuenciación comprende: hibridar uno o más cebadores de secuenciación con el primer molde inmovilizado o la segunda cadena inmovilizada; extender los cebadores de secuenciación incorporando uno o más nucleótidos marcados en la cadena naciente; y detectar los nucleótidos marcados, obteniendo así información de secuencia sobre el ácido nucleico diana.

Description

DESCRIPCIÓN
Concatemerización en superficie de moldes
Antecedentes
La tarea de catalogar la variación genética humana y correlacionar esta variación con la susceptibilidad a enfermedades es abrumadora y costosa. Es indispensable una reducción drástica de este coste para avanzar en la comprensión de la salud y la enfermedad. Una reducción en los costes de secuenciación requerirá una serie de avances técnicos en el campo. Los avances técnicos que podrían reducir el coste del análisis genómico incluyen: (1) generación de bibliotecas; (2) análisis y amplificación clonal altamente paralelos; (3) desarrollo de una bioquímica robusta de secuenciación de ciclos; (4) desarrollo de tecnología de imágenes ultrarrápida; y (5) desarrollo de algoritmos para el ensamblaje de secuencias a partir de lecturas cortas.
La creación de amplificaciones clonales de una manera altamente paralela es importante para una secuenciación rentable. La secuenciación se realiza generalmente en poblaciones clonales de moléculas de ADN preparadas de manera tradicional a partir de plásmidos cultivados a partir de la recolección de colonias bacterianas individuales. En el proyecto del genoma humano, cada clon se seleccionaba individualmente, se cultivaba y el ADN se extraía o amplificaba fuera del clon. En los últimos años, ha habido una serie de innovaciones para permitir el análisis altamente en paralelo de clones de ADN, particularmente utilizando enfoques basados en matrices. En el enfoque más simple, la biblioteca puede analizarse a nivel de molécula individual que, por su propia naturaleza, es clonal. La principal ventaja de la secuenciación de una sola molécula es que la secuenciación cíclica puede ocurrir de forma asincrónica, ya que cada molécula se lee individualmente. Por el contrario, el análisis de las amplificaciones clonales requiere una finalización casi cuantitativa de cada ciclo de secuenciación; de lo contrario, el ruido de fondo crece progresivamente con cada ciclo subsiguiente, lo que limita gravemente la longitud de lectura. Como tal, el análisis clonal impone una carga mayor a la solidez de la bioquímica de secuenciación y puede potencialmente limitar las longitudes de lectura.
Las publicaciones internacionales WO98/44151 y WO2010/038042 describen la amplificación por PCR en puente en una superficie para su posterior secuenciación. El documento US5928905 describe la amplificación por círculo rodante para generar concatémeros de ácidos nucleicos.
Por tanto, existe la necesidad de desarrollar métodos para mejorar el análisis genómico y proporcionar métodos más rentables para el análisis de secuencias. La presente invención satisface esta necesidad y también proporciona ventajas relacionadas.
Breve resumen
Los métodos y composiciones proporcionados en el presente documento permiten la amplificación de superficie con densidades mejoradas. En el presente documento se describen métodos para concatenar cadenas de molde durante el proceso de amplificación en puente, de modo que cada cebador de la superficie de la celda de flujo puede terminar con múltiples copias de la cadena molde extendidas sobre el mismo. Los métodos y composiciones proporcionados en el presente documento permiten la creación de clústeres que son más brillantes, pero con las mismas densidades que se logran actualmente usando amplificación de clúster estándar. Los clústeres más brillantes pueden tener una serie de ventajas, por ejemplo, mejor calidad de lecturas, soporte para longitudes de lectura más largas, tiempos de barrido más rápidos para la secuenciación y mayor robustez del sistema.
En el presente documento se presenta un método para preparar moldes inmovilizados para una reacción de secuenciación de ácidos nucleicos que comprende: (a) proporcionar un soporte sólido que tiene un cebador de amplificación directo e inverso inmovilizado sobre el mismo; (b) proporcionar un ácido nucleico diana, en donde el ácido nucleico diana comprende: (i) una primera región de secuencia conocida complementaria al cebador de amplificación directo; (ii) una primera región molde; (iii) una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región molde está entre la primera región de secuencia conocida y la segunda región de secuencia conocida; y (iv) una tercera región de secuencia conocida complementaria al cebador de amplificación directo, en donde la primera región de molde y la segunda región de secuencia conocida están entre la primera región de secuencia conocida y la tercera región de secuencia conocida; (c) aplicar el ácido nucleico diana al soporte sólido en condiciones adecuadas para la hibridación de modo que la primera región de secuencia conocida se hibride con el cebador de amplificación directo; y (d) extender el cebador de amplificación directo hibridado para generar un molde inmovilizado que comprende una copia complementaria del ácido nucleico diana.
En algunas realizaciones, el método puede comprender además: (e) desnaturalizar el ácido nucleico diana del molde inmovilizado; (f) hibridar el molde inmovilizado con el cebador de amplificación inverso, de modo que una copia complementaria de la segunda secuencia flanqueadora se hibrida con el cebador de amplificación inverso; y (g) extender el cebador de amplificación inverso hibridado para generar una segunda cadena inmovilizada que comprende la primera región molde situada entre la primera región de secuencia conocida y la segunda región de secuencia conocida.
En algunas realizaciones, el método puede comprender además: (h) desnaturalizar la segunda cadena inmovilizada del primer molde inmovilizado; (i) hibridar la segunda cadena inmovilizada con el primer molde inmovilizado, de modo que la primera región de secuencia conocida de la segunda cadena inmovilizada se híbrida con una copia complementaria de la primera región de secuencia conocida en el molde inmovilizado; (j) extender un 3' OH de la primera región de secuencia conocida para generar un concatémero de la segunda cadena inmovilizada; y (k) extender un 3' OH de la copia complementaria de la primera región de secuencia conocida para generar un concatémero del primer molde inmovilizado.
En algunas realizaciones, el método puede comprender, además: (1) desnaturalizar los concatémeros y repetir las etapas (i), (j) y (k) para generar más concatémeros de cada cadena.
En algunos aspectos de las realizaciones anteriores, el cebador de amplificación directo puede comprender una región de complementariedad directa, teniendo dicha región de complementariedad directa complementariedad con una región de complementariedad inversa del cebador de amplificación inverso.
En algunos aspectos, la primera región de complementariedad está situada directamente en 5' de una región que tiene complementariedad con la primera región de secuencia conocida del ácido nucleico diana.
En algunos aspectos, la región de complementariedad inversa está situada directamente en 5' de una región que tiene una secuencia sustancialmente idéntica a la segunda región de la secuencia conocida del ácido nucleico diana.
En algunos aspectos, la región de complementariedad directa y la segunda región de complementariedad están configuradas de modo que los ciclos repetidos de hibridación y extensión producen un concatémero de la primera cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad directa.
En algunos aspectos, la región de complementariedad directa y la segunda región de complementariedad están configuradas de manera que ciclos repetidos de hibridación y extensión produzcan un concatémero de la segunda cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad inversa.
En algunos aspectos, los concatémeros comprenden múltiples copias de dicha molécula de ácido nucleico diana de al menos 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o al menos 10.000 copias.
En algunos aspectos, el soporte sólido es plano. En algunos aspectos, el soporte sólido comprende micropocillos.
En algunos aspectos, el ácido nucleico diana tiene una longitud de al menos 10, 20, 50, 100, 200 o al menos 500 nucleótidos.
En algunos aspectos, el ácido nucleico diana comprende además una cuarta región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región de secuencia conocida, la primera región molde y la segunda región de secuencia conocida están entre la tercera región de secuencia conocida y la cuarta región de secuencia conocida.
En algunos aspectos, el cebador de amplificación directo comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que esté en 5' del resto conector químico no nucleotídico. En algunos aspectos, el cebador de amplificación inverso comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que se encuentre en 5' del resto conector químico no nucleotídico. En aspectos de cualquiera de las realizaciones descritas anteriormente, el resto conector químico no nucleotídico puede comprender un resto diol. En algunos aspectos, el resto conector químico no nucleotídico comprende un conector no nucleotídico que une el cebador al soporte sólido.
En algunas realizaciones, el método puede comprender además secuenciar el ácido nucleico diana. Por ejemplo, en algunos aspectos, secuenciar el ácido nucleico diana comprende: hibridar uno o más cebadores de secuenciación con el primer molde inmovilizado o la segunda cadena inmovilizada; extender los cebadores de secuenciación incorporando uno o más nucleótidos marcados en la cadena naciente; y detectar los nucleótidos marcados, obteniendo así información de secuencia sobre el ácido nucleico diana.
En algunas realizaciones, el ácido nucleico diana se prepara amplificando con un par de cebadores configurados con un resto de unión de modo que una cadena de un producto de amplificación generado usando el par de cebadores puede separarse de la cadena opuesta. En algunos aspectos, el resto de unión comprende biotina y puede separarse uniéndose a un soporte sólido que comprende estreptavidina.
Los detalles de una o más realizaciones se establecen en los dibujos adjuntos y la descripción a continuación. Otras características, objetos y ventajas resultarán evidentes a partir de la descripción y los dibujos, y de las reivindicaciones.
Breve descripción de los dibujos
La fig. 1 es un esquema que muestra la amplificación en fase sólida según una realización.
La fig. 2 es un esquema que muestra construcciones de bibliotecas alternativas para usar en amplificación en fase sólida.
La fig. 3 es un esquema que muestra la amplificación en fase sólida según una realización.
La fig. 4A es una imagen de microscopio de fluorescencia de clústeres de amplificación de acuerdo con protocolos convencionales en comparación con una realización presentada en el presente documento.
La fig. 4B es un gráfico del número de clústeres frente a la intensidad de la señal SYBR de las celdas de flujo descritas en la figura 4A.
La fig. 5 es un conjunto de imágenes de fluorescencia de nucleótidos fluorescentes C, T y G incorporados en clústeres amplificados de acuerdo con protocolos convencionales o de acuerdo una realización presentada en el presente documento.
La fig. 6 muestra imágenes de fluorescencia (arriba) e histogramas (abajo) de clústeres amplificados de acuerdo con protocolos convencionales o de acuerdo con una realización presentada en el presente documento.
La fig. 7 muestra una comparación de la intensidad y el tamaño del clúster para varios protocolos de amplificación.
La figura 8 muestra una comparación de la intensidad de la señal a lo largo de 100 ciclos en clústeres que contienen concatémeros en la superficie frente a clústeres estándar.
Descripción detallada
La tecnología convencional para la amplificación en superficie de moldes de ácido nucleico ("formación de clústeres") ha permitido densidades muy altas (500-600 k/mm2) en una celda de flujo típica. Sin embargo, siguen siendo necesarias metodologías mejoradas para la amplificación en superficie de moldes de ácidos nucleicos. Los métodos y composiciones proporcionados en el presente documento permiten la amplificación en superficie con mejores densidades. En el presente documento se describen métodos para concatenar cadenas de molde durante el proceso de amplificación en puente, de modo que cada cebador de la superficie de la celda de flujo puede terminar con múltiples copias de la cadena molde extendidas sobre el mismo. Los métodos y composiciones proporcionados en el presente documento permiten la creación de clústeres que son más brillantes, pero con las mismas densidades que se logran actualmente usando amplificación de clúster estándar. Los clústeres más brillantes pueden tener una serie de ventajas, por ejemplo, mejor calidad de lecturas, soporte para longitudes de lectura más largas, tiempos de barrido más rápidos para la secuenciación y mayor robustez del sistema.
En la figura 1 se ilustra una realización, que expone un método para formar concatémeros de un ácido nucleico diana. Como se muestra en la parte recuadrada de la Fig. 1, se proporciona un soporte sólido que tiene inmovilizados sobre el mismo una pluralidad de cebadores de amplificación directos e inversos, designados P5 y P7 en la figura. También se proporciona un ácido nucleico diana, que tiene una primera región de secuencia conocida (P5'), complementaria del cebador P5, una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso (P7) y una tercera región de secuencia conocida (P5'), complementaria del cebador P5. Se coloca una primera región molde entre la primera (P5') y la segunda (P7) regiones de secuencia conocida. El ácido nucleico diana se aplica al soporte sólido en condiciones adecuadas para la hibridación de modo que la secuencia P5' se hibrida con la secuencia P5 del cebador inmovilizado. El cebador se extiende en condiciones favorables para la extensión, por ejemplo, en presencia de una ADN polimerasa y dNTP. El producto de extensión resultante es un molde inmovilizado que comprende una copia complementaria del ácido nucleico diana, como se ilustra en la Fig.1 después de la 1a extensión.
Otras rondas de amplificación en puente pueden incluir desnaturalizar el ácido nucleico diana del molde inmovilizado y permitir que el molde inmovilizado se hibride con el cebador de amplificación inverso. En el ejemplo mostrado en la Fig. 1, la copia complementaria de la segunda secuencia conocida (P7') se hibrida con el cebador inverso (P7) y se extiende en las condiciones de extensión descritas anteriormente. El producto de extensión resultante es una segunda cadena inmovilizada que comprende la primera región molde colocada entre la primera región de secuencia conocida y la segunda región de secuencia conocida, como se ilustra en la Fig.1 después de la 2a extensión. Los ciclos posteriores de desnaturalización, hibridación y extensión permiten que el proceso continúe de manera que la segunda cadena inmovilizada pueda hibridar con el primer molde inmovilizado y uno o ambos 3' OH de la segunda cadena inmovilizada y/o el primer molde inmovilizado se extiendan para generar más productos de extensión. Los productos de extensión adicionales que resultan de estos ciclos adicionales son concatémeros de una o ambas de la segunda cadena inmovilizada y/o el primer molde inmovilizado, como se ilustra en la Fig. 1 después de los siguientes ciclos. Los concatémeros pueden incluir 2 o más copias de la región molde (o complemento de la misma) colocadas entre las secuencias conocidas. En algunas realizaciones, los concatémeros pueden incluir 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o más de 10.000 copias de la región molde (o complemento de la misma) colocadas entre las secuencias conocidas. Después de rondas de amplificación, un cebador de secuenciación en solución se puede hibridar con una región de secuencia conocida y extender. El cebador de secuenciación se hibridará con múltiples ubicaciones en la misma cadena inmovilizada y/o molde inmovilizado. Por lo tanto, pueden tener lugar múltiples reacciones de secuenciación en la misma cadena, lo que da como resultado una señal que está muy amplificada con respecto a los métodos anteriores, donde solo se genera una señal por cadena.
Como se usa en el presente documento, el término "concatémero" se refiere a una molécula de ácido nucleico continua larga que contiene múltiples copias de las mismas secuencias unidas en serie. Las copias múltiples pueden estar separadas por otra secuencia, por ejemplo, por una secuencia conocida que flanquea la secuencia concatemerizada en el extremo 3' y/o 5'. Se puede intercalar cualquier número de copias de la secuencia flanqueadora intercalada en la secuencia concatemerizada. En algunas realizaciones, los concatémeros pueden incluir 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o más de 10.000 copias de una región molde (o su complemento) en un solo concatémero. En algunas realizaciones, los concatémeros pueden comprender 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o más de 10.000 copias de secuencia conocida, situadas de una manera repetida entre copias de las secuencias conocidas. En el ejemplo 1 a continuación se expone una mayor ilustración de esta realización.
La Fig. 2 ilustra una realización alternativa, donde se proporciona una cadena complementaria del ácido nucleico diana. Esto naturalmente puede dar como resultado realizaciones donde el ácido nucleico diana se proporciona en forma bicatenaria. Como se muestra en la Fig. 2, la cadena opuesta se hibrida con el cebador de amplificación inverso y se extiende. Sin embargo, a diferencia de la realización ilustrada en la Fig. 1, se genera una única copia del ácido nucleico diana. Los ciclos posteriores de amplificación no generarán concatémeros, como se muestra en la Fig. 2. Para evitar este resultado, se pueden generar construcciones de bibliotecas alternativas que comprendan tanto la primera como la segunda regiones conocidas tanto en el extremo 3' como el extremo 5' de la construcción bicatenaria, como se ilustra en la Fig. 2. La amplificación de la cadena superior o la cadena inferior generará concatémeros, de una manera similar a la que se muestra en la Fig. 1.
La Fig. 3 ilustra otra realización, en donde los cebadores de amplificación directos e inversos comprenden una secuencia adicional situada en 5' de la secuencia que se hibrida con la secuencia conocida. En algunas realizaciones, la secuencia adicional del cebador directo es complementaria a la secuencia adicional del cebador inverso. Por ejemplo, como se ilustra en la Fig. 3, los cebadores de la superficie comprenden una secuencia de oligo-dA y oligodT situadas en 5' de las secuencias P5 y P7 (denominadas 20T-P7 y 20A-P5). Así, después de un 1er ciclo de extensión, el molde inmovilizado comprende la secuencia de complementariedad (20-mero de A) inmovilizada en el extremo 5' del molde, como se muestra en la Fig.1 después de la 1a extensión. Después de una extensión posterior, la copia resultante comprende el complemento de la secuencia de complementariedad (20-mero de T) inmovilizada en el extremo 5' de la cadena copiada y nuevamente en el extremo 3' del producto de extensión. A medida que tienen lugar más rondas de amplificación, las secuencias de complementariedad se incorporan en tándem, flanqueando las secuencias conocidas, por ejemplo P5 y P7, como se ilustra en la Fig. 3. En el Ejemplo 2 a continuación se expone una ilustración adicional de esta realización.
Amplificación de clústeres
En el presente documento se describen métodos para concatenar cadenas de molde durante el procedimiento de amplificación en puente. La amplificación en puente también se denomina en el presente documento "amplificación de clúster". En algunas realizaciones, los fragmentos de ADN inmovilizados se amplifican usando metodologías de amplificación de clústeres como se ilustra en las descripciones de las patentes de EE.UU. n° 7.985.565 y 7.115.400. Estos documentos describen métodos de amplificación de ácidos nucleicos en fase sólida que permiten inmovilizar productos de amplificación sobre un soporte sólido con el fin de formar matrices compuestas por clústeres o "colonias" de moléculas de ácido nucleico inmovilizadas. Cada clúster o colonia en dicha matriz se forma a partir de una pluralidad de cadenas polinucleotídicas inmovilizadas idénticas y una pluralidad de cadenas polinucleotídicas complementarias inmovilizadas idénticas. Las matrices así formadas se denominan generalmente en el presente documento "matrices de clústeres". Los productos de reacciones de amplificación en fase sólida tales como los descritos en las patentes de EE.UU. n° 7.985.565 y 7.115.400 son las denominadas estructuras "puenteadas" formadas por reasociación de parejas de cadenas polinucleotídicas inmovilizadas y cadenas complementarias inmovilizadas, estando ambas cadenas inmovilizadas sobre el soporte sólido en el extremo 5', preferiblemente mediante una unión covalente. Las metodologías de amplificación de clústeres son ejemplos de métodos en los que se usa un molde de ácido nucleico inmovilizado para producir amplicones inmovilizados. También pueden usarse otras metodologías adecuadas para producir amplicones inmovilizados a partir de fragmentos de ADN inmovilizados producidos de acuerdo con los métodos proporcionados en el presente documento. Por ejemplo, se pueden formar uno o más clústeres o colonias mediante PCR en fase sólida, ya sea que uno o ambos cebadores de cada par de cebadores de amplificación estén inmovilizados.
En otras realizaciones, los fragmentos de ADN inmovilizados se amplifican en solución. Por ejemplo, en algunas realizaciones, los fragmentos de ADN inmovilizados se escinden o se liberan de otro modo del soporte sólido y después los cebadores de amplificación se hibridan en solución con las moléculas liberadas. En otras realizaciones, los cebadores de amplificación se hibridan con los fragmentos de ADN inmovilizados durante una o más etapas de amplificación iniciales, seguidas de las etapas de amplificación posteriores en solución. Por tanto, en algunas realizaciones se puede usar un molde de ácido nucleico inmovilizado para producir amplicones en fase de solución.
Se apreciará que se puede usar cualquiera de las metodologías de amplificación descritas en el presente documento o generalmente conocidas en la técnica con cebadores universales o específicos de la diana para amplificar fragmentos de ADN inmovilizados. Los métodos adecuados para la amplificación incluyen, pero no se limitan a la reacción en cadena de la polimerasa (PCR), amplificación por desplazamiento de cadena (SDA), amplificación mediada por transcripción (TMA) y amplificación basada en secuencias de ácidos nucleicos (NASBA), como se describe en la patente de EE.UU. n° 8.003.354. Los métodos de amplificación anteriores se pueden emplear para amplificar uno o más ácidos nucleicos de interés. Por ejemplo, la PCR, incluida la PCR multiplex, SDA, TMA, NASBA y similares, se puede utilizar para amplificar fragmentos de ADN inmovilizados. En algunas realizaciones, se incluyen cebadores dirigidos específicamente al ácido nucleico de interés en la reacción de amplificación.
Otros métodos adecuados para la amplificación de ácidos nucleicos pueden incluir tecnologías de extensión y ligadura de oligonucleótidos, amplificación por círculo rodante (RCA) (Lizardi et al., Nat. Genet. 19: 225-232 (1998)) y ensayo de ligación de oligonucleótidos (OLA) (véase en general las patentes de Ee .UU. n° 7.582.420, 5.185.243, 5.679.524 y 5.573.907; EP 0320308 B1; EP 0336 731 B1; EP 0439 182 B1; WO 90/01069; WO 89/12696; y WO 89/09835). Se apreciará que estas metodologías de amplificación pueden diseñarse para amplificar fragmentos de ADN inmovilizados. Por ejemplo, en algunas realizaciones, el método de amplificación puede incluir reacciones de amplificación con sonda de ligación o ensayo de ligación de oligonucleótidos (OLA) que contienen cebadores dirigidos específicamente al ácido nucleico de interés. En algunas realizaciones, el método de amplificación puede incluir una reacción de extensión de cebador-ligación que contiene cebadores dirigidos específicamente al ácido nucleico de interés. Como un ejemplo no limitante de extensión de cebadores y ligación de cebadores que puedeY diseñarse específicamente para amplificar un ácido nucleico de interés, la amplificación puede incluir cebadores usados para el ensayo GoldenGate (Illumina, Inc., San Diego, CA) como se ilustra en las patentes de EE.UU. n° 7.582.420 y 7.611.869.
Los métodos de amplificación isotérmica de ejemplo que se pueden usar en un método de la presente descripción incluyen, pero no se limitan a, amplificación de desplazamiento múltiple (MDA) como ilustran, por ejemplo, Dean et al., Proc. Natl. Acad. Sci. USA 99: 5261-66 (2002) o amplificación de ácido nucleico por desplazamiento de cadena isotérmica ilustrada por, por ejemplo en la patente de EE.UU. n° 6.214.587. Otros métodos no basados en PCR que se pueden utilizar en la presente descripción incluyen, por ejemplo, amplificación por desplazamiento de cadena (SDA) que se describe, por ejemplo, en Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995; patentes de EE.UU. n25.455.166 y 5.130.238 y Walker et al., Nucí. Acids Res. 20: 1691 - 96 (1992) o amplificación por desplazamiento de cadena hiperramificada que se describe, por ejemplo, en Lage et al., Genome Research 13: 294-307 (2003).
Los métodos de amplificación isotérmica se pueden utilizar con la polimerasa Phi29 de desplazamiento de cadena o el fragmento grande de la ADN polimerasa Bst, 5'-> 3' exo- para la amplificación de cebadores aleatorios de ADN genómico. El uso de estas polimerasas aprovecha su alta procesividad y actividad de desplazamiento de cadena. La alta procesividad permite que las polimerasas produzcan fragmentos de 10-20 kb de longitud. Como se ha expuesto anteriormente, se pueden producir fragmentos más pequeños en condiciones isotérmicas usando polimerasas que tienen baja procesividad y actividad de desplazamiento de cadena tales como la polimerasa Klenow. La descripción adicional de las reacciones de amplificación, las condiciones y los componentes se establecen en detalle en la descripción de la patente de EE.UU. n° 7.670.810.
Otro método de amplificación de ácidos nucleicos que es útil en la presente descripción es la PCR marcada que usa una población de cebadores de dos dominios que tienen una región 5' constante seguida de una región 3' aleatoria como se describe, por ejemplo, en Grothues et al. Nucleic Acids Res. 21 (5): 1321-2 (1993).
Las primeras rondas de amplificación se llevan a cabo para permitir una multitud de iniciaciones en ADN desnaturalizado por calor basadas en la hibridación individual de la región 3' sintetizada aleatoriamente. Debido a la naturaleza de la región 3', se contempla que los sitios de iniciación sean aleatorios en todo el genoma. Después, los cebadores no unidos pueden eliminarse y puede tener lugar una replicación adicional utilizando cebadores complementarios de la región 5' constante.
Métodos de secuenciación
Los métodos descritos en el presente documento pueden usarse junto con una variedad de técnicas de secuenciación de ácidos nucleicos. Las técnicas particularmente aplicables son aquellas en donde los ácidos nucleicos se unen en ubicaciones fijas en una matriz de modo que sus posiciones relativas no cambian y en donde se generan imágenes de la matriz repetidamente. Son particularmente aplicables las realizaciones en las que las imágenes se obtienen en diferentes canales de color, por ejemplo, coincidiendo con diferentes marcadores utilizados para distinguir un tipo de base de nucleótidos de otro. En algunas realizaciones, el procedimiento para determinar la secuencia de nucleótidos de un ácido nucleico diana puede ser un proceso automatizado. Las realizaciones preferidas incluyen técnicas de secuenciación por síntesis ("SBS").
Las técnicas de SBS generalmente implican la extensión enzimática de una cadena de ácido nucleico naciente mediante la adición iterativa de nucleótidos frente a una cadena molde. En los métodos tradicionales de SBS, se puede proporcionar un monómero de un solo nucleótido a un nucleótido diana en presencia de una polimerasa en cada suministro. Sin embargo, en los métodos descritos en el presente documento, se puede proporcionar más de un tipo de monómero de nucleótido a un ácido nucleico diana en presencia de una polimerasa en un suministro.
La SBS puede utilizar monómeros de nucleótidos que tienen un resto terminador o aquellos que carecen de restos terminadores. Los métodos que utilizan monómeros de nucleótidos que carecen de terminadores incluyen, por ejemplo, pirosecuenciación y secuenciación utilizando nucleótidos marcados con Y-fosfato, como se expone con más detalle a continuación. En los métodos que utilizan monómeros de nucleótidos que carecen de terminadores, el número de nucleótidos añadidos en cada ciclo es generalmente variable y depende de la secuencia del molde y del modo de suministro de nucleótidos. Para las técnicas de SBS que utilizan monómeros de nucleótidos que tienen un resto terminador, el terminador puede ser efectivamente irreversible en las condiciones de secuenciación utilizadas como es el caso de la secuenciación tradicional de Sanger que utiliza didesoxinucleótidos, o el terminador puede ser reversible como es el caso de los métodos de secuenciación desarrollados por Solexa (ahora Illumina, Inc.).
Las técnicas de SBS pueden utilizar monómeros de nucleótidos que tienen un resto marcador o aquellos que carecen de un resto marcador. Por consiguiente, los sucesos de incorporación pueden detectarse basándose en una característica del marcador, tal como la fluorescencia del marcador; una característica del monómero nucleotídico, tal como el peso molecular o la carga; un subproducto de la incorporación del nucleótido, tal como la liberación de pirofosfato; o similar. En realizaciones, donde están presentes dos o más nucleótidos diferentes en un reactivo de secuenciación, los diferentes nucleótidos pueden distinguirse entre sí, o alternativamente, los dos o más marcadores diferentes pueden ser indistinguibles según las técnicas de detección que se utilizan. Por ejemplo, los diferentes nucleótidos presentes en un reactivo de secuenciación pueden tener diferentes marcadores y pueden distinguirse usando ópticas apropiadas como se ilustra por los métodos de secuenciación desarrollados por Solexa (ahora Illumina, Inc.).
Las realizaciones preferidas incluyen técnicas de pirosecuenciación. La pirosecuenciación detecta la liberación de pirofosfato inorgánico (PPi) a medida que se incorporan nucleótidos particulares en la cadena naciente (Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. y Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242 (1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing". Genome Res. 11 (1), 3-11; Ronaghi, M., Uhlen, M. y Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281 (5375), 363; patente de e E.UU. n° 6.210.891; patente de EE.UU. n° 6.258.568 y patente de EE.UU. n° 6.274.320). En la pirosecuenciación, el PPi liberado se puede detectar convirtiéndolo inmediatamente en trifosfato de adenosina (ATP) por la ATP sulfurilasa, y el nivel de ATP generado se detecta mediante fotones producidos por luciferasa. Los ácidos nucleicos que se van a secuenciar se pueden unir a sitios característicos en una matriz y se pueden generar imágenes de la matriz para capturar las señales quimioluminiscentes que se producen debido a la incorporación de nucleótidos en los sitios característicos de la matriz. Se puede obtener una imagen después de que la matriz se trate con un tipo de nucleótido particular (p. ej., A, T, C o G). Las imágenes obtenidas después de la adición de cada tipo de nucleótido diferirán con respecto a los sitios característicos de la matriz que se detecten. Estas diferencias en la imagen reflejan el contenido de secuencia diferente de los sitios característicos en la matriz. Sin embargo, las ubicaciones relativas de cada sitio característico permanecerán sin cambios en las imágenes. Las imágenes se pueden almacenar, procesar y analizar utilizando los métodos expuestos en el presente documento. Por ejemplo, las imágenes obtenidas después del tratamiento de la matriz con cada tipo de nucleótido diferente se pueden manejar de la misma manera que se ilustra en el presente documento para imágenes obtenidas de diferentes canales de detección para métodos de secuenciación basados en terminadores reversibles.
En otro tipo de ejemplo de SBS, la secuenciación en ciclo se logra mediante la adición escalonada de nucleótidos terminadores reversibles que contienen, por ejemplo, un marcador de colorante escindible o fotoblanqueable como se describe, por ejemplo, en la publicación internacional WO 04/018497 y patente de EE.UU. n° 7.057.026. Este enfoque está siendo comercializado por Solexa (ahora Illumina Inc.), y también se describe en las publicaciones internacionales WO 91/06678 y WO 07/123.744. La disponibilidad de terminadores marcados con fluorescencia en los que se puede tanto invertir la terminación como escindir el colorante fluorescente, facilita la secuenciación por terminación reversible cíclica (CRT) eficiente. Las polimerasas también se pueden diseñar conjuntamente para la incorporación y extensión de manera eficiente de estos nucleótidos modificados.
Preferiblemente, en realizaciones de secuenciación basadas en terminadores reversibles, los marcadores no inhiben sustancialmente la extensión en condiciones de reacción de SBS. Sin embargo, los marcadores de detección pueden ser eliminables, por ejemplo, por escisión o degradación. Se pueden capturar imágenes tras la incorporación de marcadores en sitios característicos de ácidos nucleicos en matriz. En realizaciones particulares, cada ciclo implica el suministro simultáneo de cuatro tipos de nucleótidos diferentes a la matriz y cada tipo de nucleótido tiene un marcador espectralmente distinto. A continuación, se pueden obtener cuatro imágenes, cada una de las cuales utiliza un canal de detección que es selectivo para uno de los cuatro marcadores diferentes. Alternativamente, se pueden añadir diferentes tipos de nucleótidos secuencialmente y se puede obtener una imagen de la matriz entre cada etapa de adición. En tales realizaciones, cada imagen mostrará sitios característicos de ácidos nucleicos que han incorporado nucleótidos de un tipo particular. Diferentes sitios característicos estarán presentes o ausentes en las diferentes imágenes debido al contenido de secuencia diferente de cada sitio característico. Sin embargo, la posición relativa de los sitios característicos permanecerá sin cambios en las imágenes. Las imágenes obtenidas de dichos métodos de SBS-terminador reversible pueden almacenarse, procesarse y analizarse como se expone en el presente documento. Después de la etapa de captura de la imagen, se pueden eliminar los marcadores y se pueden eliminar los motivos de terminador reversible para los ciclos posteriores de adición y detección de nucleótidos. La eliminación de los marcadores después de que se hayan detectado en un ciclo particular y antes de un ciclo posterior puede proporcionar la ventaja de reducir la señal de fondo y la interferencia entre ciclos. A continuación, se exponen ejemplos de marcadores útiles y métodos de eliminación.
En realizaciones particulares, algunos o todos los monómeros de nucleótidos pueden incluir terminadores reversibles. En tales realizaciones, los terminadores reversibles/flúores escindibles pueden incluir flúor unido al resto de ribosa a través de un enlace éster 3' (Metzker, Genome Res. 15: 1767-1776. Otros enfoques han separado la química del terminador de la escisión del marcador de fluorescencia (Ruparel et al., Proc Natl Acad Sci USA 102: 5932-7 (2005)). Ruparel et al. describieron el desarrollo de terminadores reversibles que usaban un pequeño grupo alilo en 3' para bloquear la extensión, pero que podían desbloquearse fácilmente por un tratamiento corto con un catalizador de paladio. El fluoróforo se unía a la base mediante un conector fotoescindible que se podía escindir fácilmente por una exposición de 30 segundos a luz UV de longitud de onda larga. Por tanto, se puede utilizar la reducción con disulfuro o la fotoescisión como un conector escindible. Otro enfoque para la terminación reversible es el uso de terminación natural que se produce después de la colocación de un colorante voluminoso en un dNTP. La presencia de un colorante voluminoso cargado en el dNTP puede actuar como un terminador eficaz a través de impedimento estérico y/o electrostático. La presencia de un suceso de incorporación evita otras incorporaciones a menos que se elimine el colorante. La escisión del colorante elimina el flúor e invierte eficazmente la terminación. También se describen ejemplos de nucleótidos modificados en la patente de EE.UU. n° 7.427.673 y patente de EE.UU. n° 7.057.026.
Los sistemas y métodos de SBS de ejemplo adicionales que se pueden utilizar con los métodos y sistemas descritos en el presente documento se describen en la publicación de solicitud de patente de EE.UU. n° 2007/0166705, U.S. publicación de solicitud de patente de EE.UU. n° 2006/0188901, patente de EE.UU. n° 7.057.026, publicación de solicitud de patente de EE.Uu . n° 2006/0240439, publicación de solicitud de patente de EE.UU. n° 2006/0281109, publicación PCT n° WO 05/065814, publicación de solicitud de patente de EE.UU. n° 2005/0100900, publicación PCT n° WO 06/064199, publicación PCT n° WO 07/010,251, publicación de solicitud de patente de EE.UU. n° 2012/0270305 y publicación de solicitud de patente de EE.UU. n° 2013/0260372,
Algunas realizaciones pueden utilizar la detección de cuatro nucleótidos diferentes usando menos de cuatro marcadores diferentes. Por ejemplo, la SBS se puede realizar utilizando métodos y sistemas descritos en la publicación de solicitud de patente de EE.UU. n° 2013/0079232. Como primer ejemplo, se puede detectar un par de tipos de nucleótidos a la misma longitud de onda, pero distinguirse en función de la diferencia de intensidad para un miembro del par en comparación con el otro, o en función de un cambio en un miembro del par (p. ej. por modificación química, modificación fotoquímica o modificación física) que hace que la señal aparente aparezca o desaparezca en comparación con la señal detectada para el otro miembro del par. Como segundo ejemplo, se pueden detectar tres de cuatro tipos de nucleótidos diferentes en condiciones particulares, mientras que un cuarto tipo de nucleótido carece de un marcador que sea detectable en esas condiciones, o se detecta mínimamente en esas condiciones (p. ej., detección mínima debido a la fluorescencia de fondo, etc.). La incorporación de los tres primeros tipos de nucleótidos en un ácido nucleico se puede determinar basándose en la presencia de sus respectivas señales y la incorporación del cuarto tipo de nucleótido en el ácido nucleico se puede determinar basándose en la ausencia o la detección mínima de cualquier señal. Como tercer ejemplo, un tipo de nucleótido puede incluir marcador(es) que se detectan en dos canales diferentes, mientras que otros tipos de nucleótidos se detectan en no más de uno de los canales. Las tres configuraciones de ejemplo antes mencionadas no se consideran mutuamente excluyentes y pueden usarse en varias combinaciones. Una realización de ejemplo que combina los tres ejemplos es un método de SBS basado en fluorescencia que usa un primer tipo de nucleótido que se detecta en un primer canal (p. ej., dATP que tiene un marcador que se detecta en el primer canal cuando se excita con una primera longitud de onda de excitación), un segundo tipo de nucleótido que se detecta en un segundo canal (p. ej., dCTP que tiene un marcador que se detecta en el segundo canal cuando se excita con una segunda longitud de onda de excitación), un tercer tipo de nucleótido que se detecta tanto en el primer como en el segundo canal (p. ej., dTTP que tiene al menos un marcador que se detecta en ambos canales cuando se excita por la primera y/o segunda longitud de onda de excitación) y un cuarto tipo de nucleótido que carece de un marcador que no se detecta, o mínimamente, en ninguno de los canales (p. ej., dGTP que no tiene marcador).
Además, como se describe en la publicación de solicitud de patente de EE.UU. n° 2013/0079232, se pueden obtener datos de secuenciación utilizando un solo canal. En los llamados enfoques de secuenciación de un colorante, el primer tipo de nucleótido está marcado pero el marcador se elimina después de que se genera la primera imagen, y el segundo tipo de nucleótido se marca solo después de que se genera una primera imagen. El tercer tipo de nucleótido conserva su marcador tanto en la primera como en la segunda imagen, y el cuarto tipo de nucleótido permanece sin marcar en ambas imágenes.
Algunas realizaciones pueden utilizar secuenciación por técnicas de ligación. Dichas técnicas utilizan ADN ligasa para incorporar oligonucleótidos e identificar la incorporación de dichos oligonucleótidos. Los oligonucleótidos típicamente tienen diferentes marcadores que se correlacionan con la identidad de un nucleótido particular en una secuencia con la que se hibridan los oligonucleótidos. Al igual que con otros métodos de SBS, se pueden obtener imágenes tras el tratamiento de una matriz de sitios característicos de ácidos nucleicos con los reactivos de secuenciación marcados. Cada imagen mostrará sitios característicos de ácidos nucleicos que han incorporado marcadores de un tipo particular. Diferentes sitios característicos estarán presentes o ausentes en las diferentes imágenes debido al contenido de secuencia diferente de cada sitio característico, pero la posición relativa de los sitios característicos permanecerá sin cambios en las imágenes. Las imágenes obtenidas a partir de métodos de secuenciación basados en ligación se pueden almacenar, procesar y analizar como se expone en el presente documento. Los sistemas y métodos de SBS de ejemplo que se pueden utilizar con los métodos y sistemas descritos en el presente documento se describen en la patente de EE.UU. n° 6.969.488, patente de EE.UU. n° 6.172.218 y patente de EE.UU. n° 6.306.597.
Algunas realizaciones pueden utilizar secuenciación por nanoporos (Deamer, D. W. y Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. y D. Branton, "Characterization of nucleic acids by nanopore analysis". Acc. Chem. Res. 35: 817-825 (2002)); Li, J., M. Gershow, D. Stein, E. Brandin y J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2: 611-615 (2003)). En tales realizaciones, el ácido nucleico diana pasa a través de un nanoporo. El nanoporo puede ser un poro sintético o una proteína de membrana biológica, tal como la a-hemolisina. A medida que el ácido nucleico diana pasa a través del nanoporo, se puede identificar cada par de bases midiendo las fluctuaciones en la conductancia eléctrica del poro. (patente de EE.UU. n° 7.001.792; Soni, G. V. y Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Análisis de ADN de molécula única basado en nanoporos". Nanomed. 2, 459 a 481 (2007); Cockroft, S. L., Chu, J., Amorin, M. y Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc.
130, 818-820 (2008)). Los datos obtenidos de la secuenciación de nanoporos se pueden almacenar, procesar y analizar como se expone en el presente documento. En particular, los datos pueden tratarse como una imagen de acuerdo con el tratamiento de ejemplo de imágenes ópticas y otras imágenes que se expone en el presente documento.
Algunas realizaciones pueden utilizar métodos que implican el seguimiento en tiempo real de la actividad de la ADN polimerasa. Las incorporaciones de nucleótidos se pueden detectar a través de interacciones de transferencia de energía por resonancia de fluorescencia (FRET) entre una polimerasa que lleva fluoróforo y nucleótidos marcados con Y-fosfato como se describe, por ejemplo, en la patente de EE.UU. n° 7.329.492 y patente de EE.UU. n° 7.211.414, o las incorporaciones de nucleótidos se pueden detectar con guías de onda de modo cero como se describe, por ejemplo, en la patente de EE.UU. n° 7.315.019 y usando análogos de nucleótidos fluorescentes y polimerasas diseñadas como se describe, por ejemplo, en la patente de EE.UU. n° 7.405.281 y publicación de solicitud de patente de EE.UU. n° 2008/0108082. La iluminación se puede restringir a un volumen de escala de zeptolitros alrededor de una polimerasa unida a la superficie de modo que se pueda observar la incorporación de nucleótidos marcados con fluorescencia con un fondo bajo (Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time". Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)). Las imágenes obtenidas de tales métodos se pueden almacenar, procesar y analizar como se expone en el presente documento.
Algunas realizaciones de SBS incluyen la detección de un protón liberado tras la incorporación de un nucleótido en un producto de extensión. Por ejemplo, la secuenciación basada en la detección de protones liberados puede utilizar un detector eléctrico y técnicas asociadas que están disponibles comercialmente en Ion Torrent (Guilford, CT, una subsidiaria de Life Technologies) o métodos y sistemas de secuenciación descritos en los documentos US 2009/0026082 A1; US 2009/0127589 A1; US 2010/0137143 A1; o US 2010/0282617 A1. Los métodos expuestos en el presente documento para amplificar ácidos nucleicos diana usando exclusión cinética pueden aplicarse fácilmente a sustratos usados para detectar protones. Más específicamente, los métodos expuestos en el presente documento pueden usarse para producir poblaciones clonales de amplicones que se usan para detectar protones.
Los métodos de SBS anteriores se pueden llevar a cabo ventajosamente en formatos de multiplex de modo que se manipulen simultáneamente múltiples ácidos nucleicos diana diferentes. En realizaciones particulares, se pueden tratar diferentes ácidos nucleicos diana en un recipiente de reacción común o en una superficie de un sustrato particular. Esto permite el suministro conveniente de reactivos de secuenciación, la eliminación de reactivos que no han reaccionado y la detección de sucesos de incorporación de una manera multiplexada. En realizaciones que usan ácidos nucleicos diana unidos a la superficie, los ácidos nucleicos diana pueden estar en un formato de matriz. En un formato de matriz, los ácidos nucleicos diana se pueden unir típicamente a una superficie de una manera espacialmente distinguible. Los ácidos nucleicos diana pueden unirse por unión covalente directa, unión a una perla u otra partícula o unión a una polimerasa u otra molécula que esté unida a la superficie. La matriz puede incluir una única copia de un ácido nucleico diana en cada sitio (también denominado sitio característico) o pueden estar presentes múltiples copias que tienen la misma secuencia en cada sitio o sitio característico. Pueden producirse múltiples copias por métodos de amplificación tales como amplificación en puente o PCR en emulsión como se describe con más detalle a continuación.
Los métodos expuestos en el presente documento pueden usar matrices que tienen sitios característicos en cualquiera de una variedad de densidades que incluyen, por ejemplo, al menos aproximadamente 10 sitios característicos/cm2, 100 sitios característicos/cm2, 500 sitios característicos/cm2, 1.000 sitios característicos/cm2, 5.000 sitios característicos/cm2, 10.000 sitios característicos/cm2, 50.000 sitios característicos/cm2, 100.000 sitios característicos/cm2, 1.000.000 sitios característicos/cm2, 5.000.000 sitios característicos/cm2, o mayores.
Una ventaja de los métodos expuestos en el presente documento es que proporcionan una detección rápida y eficaz de una pluralidad de ácidos nucleicos diana en paralelo. Por consiguiente, la presente descripción proporciona sistemas integrados capaces de preparar y detectar ácidos nucleicos usando técnicas conocidas en la técnica tales como las ilustradas anteriormente. Por tanto, un sistema integrado de la presente descripción puede incluir componentes fluídicos capaces de suministrar reactivos de amplificación y/o reactivos de secuenciación a uno o más fragmentos de ADN inmovilizados, comprendiendo el sistema componentes tales como bombas, válvulas, depósitos, conductos fluídicos y similares. Una celda de flujo se puede configurar y/o usar en un sistema integrado para la detección de ácidos nucleicos diana. Se describen celdas de flujo de ejemplo, por ejemplo, en los documento US 2010/0111768 A1 y US 2012/0270305 A1. Como se ilustra para las celdas de flujo, uno o más de los componentes fluídicos de un sistema integrado se pueden usar para un método de amplificación y para un método de detección. Considerando una realización de secuenciación de ácidos nucleicos como ejemplo, se pueden usar uno o más de los componentes fluídicos de un sistema integrado para un método de amplificación expuesto en el presente documento y para el suministro de reactivos de secuenciación en un método de secuenciación tal como los ilustrados anteriormente. Alternativamente, un sistema integrado puede incluir sistemas fluídicos separados para llevar a cabo métodos de amplificación y para llevar a cabo métodos de detección. Ejemplos de sistemas de secuenciación integrados que son capaces de crear ácidos nucleicos amplificados y también determinar la secuencia de los ácidos nucleicos incluyen, sin limitación, la plataforma MiSeq™ (Illumina, Inc., San Diego, CA) y los dispositivos descritos en el documento US 2012/0270305 A1.
En los métodos y composiciones presentados en el presente documento, los polinucleótidos se inmovilizan en el soporte sólido. En algunas realizaciones, los polinucleótidos se inmovilizan covalentemente en el soporte. Cuando se hace referencia a la inmovilización de moléculas (p. ej., ácidos nucleicos) en un soporte sólido, los términos "inmovilizado" y "unido" se usan indistintamente en el presente documento y ambos términos pretenden abarcar la unión directa o indirecta, covalente o no covalente, a menos que se indique lo contrario, ya sea explícitamente o por el contexto. En ciertas realizaciones de la invención, se puede preferir la unión covalente, pero generalmente todo lo que se requiere es que las moléculas (p. ej. ácidos nucleicos) permanezcan inmovilizadas o unidas al soporte en las condiciones en las que se pretende usar el soporte, por ejemplo en aplicaciones que requieren amplificación y/o secuenciación de ácidos nucleicos.
Ciertas realizaciones de la invención pueden hacer uso de soportes sólidos compuestos de un sustrato o matriz inerte (p. ej., portaobjetos de vidrio, perlas de polímero, etc.) que se ha funcionalizado, por ejemplo, por aplicación de una capa o revestimiento de un material intermedio que comprende grupos reactivos que permiten la unión covalente a biomoléculas, tales como polinucleótidos. Los ejemplos de dichos soportes incluyen, pero no se limitan a, hidrogeles de poliacrilamida soportados sobre un sustrato inerte tal como vidrio, particularmente hidrogeles de poliacrilamida como se describe en los documentos WO 2005/065814 y US 2008/0280773. En tales realizaciones, las biomoléculas (p. ej., polinucleótidos) pueden estar unidas covalentemente directamente al material intermedio (p. ej., el hidrogel) pero el propio material intermedio puede estar unido de forma no covalente al sustrato o matriz (p. ej., el sustrato de vidrio). La expresión "unión covalente a un soporte sólido" debe interpretarse en consecuencia como que abarca este tipo de disposición.
Los enlaces covalentes de ejemplo incluyen, por ejemplo, los que resultan del uso de técnicas de química de click. Los enlaces no covalentes de ejemplo incluyen, pero no se limitan a interacciones no específicas (p. ej., enlaces de hidrógeno, enlaces iónicos, interacciones de van der Waals, etc.) o interacciones específicas (p. ej., interacciones de afinidad, interacciones de receptor-ligando, interacciones de anticuerpo-epítopo, interacciones de avidina-biotina, interacciones de estreptavidina-biotina, interacciones de lectina-carbohidrato, etc.). Los enlaces de ejemplo se exponen en las patentes de EE.UU. n° 6.737.236; 7.259.258; 7.375.234 y 7.427.678; y publicación de patente de EE.UU. n22011/0059865 A1.
Las expresiones "ácido nucleico diana", "molécula de ácido nucleico diana", "especie de ácido nucleico diana" y cualquier equivalente gramatical de las mismas, se refieren a moléculas de ácido nucleico que se desean detectar, secuenciar o analizar de otro modo. Puede utilizarse cualquiera de una variedad de moléculas de ácido nucleico diana deseadas, incluyendo, pero no limitadas a exones, o moléculas de ácido nucleico complementarias a las mismas; moléculas de ADNc, o moléculas de ácido nucleico complementarias a las mismas; regiones no traducidas (UTR) o ácidos nucleicos complementarios a las mismas; regiones promotoras y/o potenciadoras, o moléculas de ácido nucleico complementarias a las mismas; regiones conservadas evolutivamente (ECR), o moléculas de ácido nucleico complementarias a las mismas; regiones genómicas transcritas, o moléculas de ácido nucleico complementarias a las mismas. Puede usarse cualquiera de una variedad de métodos para obtener moléculas de ácido nucleico dirigidas, como se describe en el presente documento. Dichos métodos incluyen, pero no se limitan a, obtener una molécula de ácido nucleico diana usando enriquecimiento por captura por hibridación-extensión; usando sitios de restricción dirigidos, por ejemplo, usando un oligonucleótido diseñado con una horquilla que tiene un sitio de enzima de restricción de Tipo IIS tal como un sitio de enzima de restricción Fokl y una región específica de locus; usando amplificación por círculo rodante hiperramificado específico de locus; usando amplificación de cebadores específicos de locus aleatorios; usando PCR en emulsión multiplex; usando PCR en puente multiplex; usando amplificación de sonda de candado; y usando minibibliotecas de bibliotecas dirigidas, como se describe en el presente documento.
Como se usa en el presente documento, las expresiones "secuencia de ácido nucleico diana", "secuencia de ácido nucleico de muestra" y expresiones similares se refieren a secuencias de ácido nucleico obtenidas de muestras que se desean analizar.
Una muestra de ácido nucleico que se amplifica, secuencia o manipula de otro modo en un método descrito en el presente documento puede ser, por ejemplo, ADN o ARN. Las especies de ADN de ejemplo incluyen, pero no se limitan a ADN genómico (ADNg), ADN mitocondrial, ADN de cloroplasto, ADN episomal, ADN viral y ADN copia (ADNc). Un ejemplo no limitante de un subconjunto de ADN genómico es un cromosoma particular o una región de un cromosoma particular. Las especies de ARN de ejemplo incluyen, sin limitación, ARN codificante, tal como ARN mensajero (ARNm), y ARN no codificante (ARNnc), tal como ARN de transferencia (ARNt), microARN (miARN), ARN nuclear pequeño (ARNnp) y ARN ribosómico (ARNr). Otras especies de ADN o ARN incluyen fragmentos o porciones de las especies citadas anteriormente o productos amplificados derivados de estas especies, fragmentos de las mismas o porciones de las mismas. Los métodos descritos en el presente documento son aplicables a las especies anteriores que abarcan todo o parte del complemento presente en una célula. Por ejemplo, utilizando los métodos descritos en el presente documento, se puede determinar la secuencia de un genoma sustancialmente completo o se puede determinar la secuencia de secuencias de ácido nucleico diana sustancialmente completas tales como ARNm o ADNc complemento de una célula.
Pueden prepararse moléculas de ADN diana de secuencia diferente mezclando un número mayor de uno de moléculas de ADN individuales. En el procedimiento preferido, el ADN genómico se fragmenta en moléculas pequeñas, preferiblemente de menos de 1000 pares de bases de longitud. La fragmentación del ADN se puede lograr por una serie de métodos que incluyen: digestión enzimática, escisión química, sonicación, nebulización o hidrocizalla, preferiblemente nebulización.
Pueden añadirse secuencias conocidas a los extremos 3' y 5' de las secuencias de ácido nucleico diana usando cualquiera de las diversas metodologías conocidas en la técnica, como se ilustra, por ejemplo, por las expuestas en las patentes de EE.UU. n° 7.741.463, 7.985.565 y 7.115.400, Por ejemplo, en algunas realizaciones, se añaden secuencias conocidas ligando adaptadores a fragmentos de ácido nucleico. En algunas realizaciones, las secuencias conocidas se añaden por amplificación utilizando cebadores que tienen una secuencia conocida adicional en sus extremos 5'. En algunas realizaciones, las secuencias conocidas pueden comprender secuencias que son idénticas o complementarias a los cebadores de amplificación inmovilizados sobre un soporte sólido. Por ejemplo, en determinadas realizaciones, la secuencia conocida puede incluir una de dos regiones de captura universales, tales como las regiones P5 o P7. Una región P5 incluye la secuencia de nucleótidos 5'-AATGATACGGCGACCACCGA-3'. Una región P7 incluye la secuencia de nucleótidos 5'-CAAGCAGAAGACGGCATACGA-3'. En ciertas realizaciones, la secuencia conocida es el complemento inverso de la secuencia de la región P5 ("anti-P5": 5'-TCGGTGGTCGCCGTATCATT-3') o la secuencia de la región P7 ("anti-P7": 5'-TCGTATGCCGTCTTCTGCTTG-3') del cebador de amplificación. En determinadas realizaciones, el oligonucleótido se puede hibridar con los cebadores de amplificación p5 de Illumina® (extremo emparejado) (5'-AATGATACGCGACCACCGAGAUCTACAC-3') o P7 (extremo emparejado) (5'-CAAGCAGAAGACGGCATACGA(8-oxo-G)AT-3'). En determinadas realizaciones, el oligonucleótido se puede hibridar con el complemento inverso del cebador de captura P5 de Illumina® (extremo emparejado) ("anti-P5 (extremo emparejado)": 5'-GTGTAGATCTCGGTGGTCGCCGTATCATT-3') o P7 (extremo emparejado) ("anti-P7 (extremo emparejado) ": 5'-ATCTCGTATGCCGTCTTCTGCTTG-3').
Las expresiones "superficie sólida", "soporte sólido" y otros equivalentes gramaticales en el presente documento se refieren a cualquier material que sea apropiado o pueda modificarse para que sea apropiado para la unión de los complejos de transposomas. Como apreciarán los expertos en la técnica, el número de posibles sustratos es muy grande. Los posibles sustratos incluyen, pero no se limitan a vidrio y vidrio modificado o funcionalizado, plásticos (incluidos acrílicos, poliestireno y copolímeros de estireno y otros materiales, polipropileno, polietileno, polibutileno, poliuretanos, Teflon™, etc.), polisacáridos, nailon o nitrocelulosa, materiales cerámicos, resinas, sílice o materiales basados en sílice que incluyen silicio y silicio modificado, carbono, metales, vidrios inorgánicos, plásticos, haces de fibras ópticas y una variedad de otros polímeros. Los soportes sólidos y las superficies sólidas particularmente útiles para algunas realizaciones se encuentran dentro de un aparato de celda de flujo. Las celdas de flujo de ejemplo se exponen con más detalle a continuación.
En algunas realizaciones, el soporte sólido comprende una superficie con patrón adecuada para la inmovilización de complejos de transposomas en un patrón ordenado. Una "superficie con patrón" se refiere a una disposición de diferentes regiones en o sobre una capa expuesta de un soporte sólido. Por ejemplo, una o más de las regiones pueden ser sitios característicos donde están presentes uno o más complejos de transposomas. Los sitios característicos pueden estar separados por regiones intersticiales donde no están presentes complejos de transposomas. En algunas realizaciones, el patrón puede ser un formato x-y de sitios característicos que están en filas y columnas. En algunas realizaciones, el patrón puede ser una disposición que se repite de sitios característicos y/o regiones intersticiales. En algunas realizaciones, el patrón puede ser una disposición aleatoria de sitios característicos y/o regiones intersticiales. En algunas realizaciones, los complejos de transposomas se distribuyen aleatoriamente sobre el soporte sólido. En algunas realizaciones, los complejos de transposomas se distribuyen sobre una superficie con patrón. Superficies con patrón de ejemplo que se pueden usar en los métodos y composiciones expuestos en el presente documento se describen en los documentos US 2013/0116153 A1 o publicación de solicitud de patente de EE.UU. 2012/0316086 A1.
En algunas realizaciones, el soporte sólido comprende una matriz de pocillos o depresiones en una superficie. Esto se puede fabricar como se conoce generalmente en la técnica usando una variedad de técnicas, que incluyen, pero no se limitan a, fotolitografía, técnicas de estampación, técnicas de moldeo y técnicas de micrograbado. Como apreciarán los expertos en la técnica, la técnica utilizada dependerá de la composición y forma del sustrato de la matriz.
La composición y geometría del soporte sólido puede variar con su uso. En algunas realizaciones, el soporte sólido es una estructura plana, tal como un portaobjetos, chip, microchip y/o matriz. Así pues, la superficie de un sustrato puede tener la forma de una capa plana. En algunas realizaciones, el soporte sólido comprende una o más superficies de una celda de flujo. La expresión "celda de flujo", como se usa en el presente documento, se refiere a una cámara que comprende una superficie sólida a través de la cual pueden fluir uno o más reactivos fluidos. Ejemplos de celdas de flujo y sistemas fluídicos relacionados y plataformas de detección que se pueden usar fácilmente en los métodos de la presente descripción se describen, por ejemplo, en Bentley et al., Nature 456:53-59 (2008), documentos WO 04/018497; US 7.057.026; WO 91/06678; WO 07/123744; US 7.329.492; US 7.211.414; US 7.315.019; US 7.405.281 y US 2008/0108082.
En algunas realizaciones, el soporte sólido o su superficie no es plana, tal como la superficie interior o exterior de un tubo o recipiente. En algunas realizaciones, el soporte sólido comprende microesferas o perlas. Por "microesferas" o "perlas" o "partículas" o equivalentes gramaticales en el presente documento se entiende pequeñas partículas discretas. Las composiciones de perlas adecuadas incluyen, pero no se limitan a plásticos, materiales cerámicos, vidrio, poliestireno, metilestireno, polímeros acrílicos, materiales paramagnéticos, sol Thoria, grafito de carbono, dióxido de titanio, látex o dextranos reticulados tales como sefarosa, celulosa, nailon, micelas reticuladas y teflón, así como se puede usar cualquier otro material descrito en el presente documento para soportes sólidos. La "Microsphere Detection Guide" de Bangs Laboratories, Fishers Ind. Es una guía útil. En determinadas realizaciones, las microesferas son microesferas o perlas magnéticas.
No es necesario que las perlas sean esféricas; se pueden utilizar partículas irregulares. Alternativa o adicionalmente, las perlas pueden ser porosas. Los tamaños de las perlas varían desde nanómetros, es decir, 100 nm, hasta milímetros, es decir, 1 mm, prefiriéndose perlas de aproximadamente 0,2 micrómetros a aproximadamente 200 micrómetros, y siendo particularmente preferidos de aproximadamente 0,5 a aproximadamente 5 micrómetros, aunque en algunas realizaciones se pueden utilizar perlas más pequeñas o más grandes.
Ejemplo 1
Este ejemplo describe la amplificación en fase sólida según una realización, como se ilustra en la Fig. 1. Se usó una biblioteca estándar universal PhiX o CT418 que contiene las regiones P5 y P7' para unir el P5' adicional en el extremo 5' de la biblioteca ya preparada. Esto se logró realizando 18 ciclos de PCR adicionales. Las bibliotecas se diluyeron hasta 200 pM final y se amplificaron usando cebador estándar o cebador P7-P5'. Cada reacción de PCR de 50 pl contenía 22 pl de H2O, 25 pl de 2X Phusion Mastermix (NEB), 1 pl de cada uno del cebador y ADN adecuados. Después de la PCR, las concentraciones de la biblioteca resultante se determinaron mediante Nanodrop (Thermo Scientific) y se diluyeron a 10 nM en tampón EB (QIAGEN) Tween20 al 0,05%. Se preparó una celda de flujo injertando cebadores HEG (carriles 1 - 4) o cebadores PE estándar (carriles 5 - 8) utilizando el protocolo descrito en las patentes de EE.UU. n° 8.536.477, 8.715.966 y publicación de solicitud de patente de EE.UU. 2008/0280773. Las bibliotecas generadas anteriormente se utilizaron para generar clústeres en la celda de flujo injertada.
Los clústeres se amplificaron utilizando el kit de generación de clúster TruSeq para Genome Analyzer (Illumina) según el protocolo recomendado por el fabricante durante 35 ciclos. La celda de flujo se tiñó con verde SYBR (Molecular Probes) y se generaron imágenes en un microscopio de fluorescencia. Como se muestra en el panel superior de la Fig. 4A, los clústeres generados con cebadores estándar dieron como resultado clústeres normales, mientras que se mostró que lo mismo con cebadores modificados con P5 adicional daba como resultado una mezcla de clústeres grandes y normales (panel inferior de la Fig. 4A). Los gráficos del número de clústeres frente a la intensidad de la señal SYBR de las celdas de flujo descritas en la Fig. 4A se muestran en la Fig. 4B. Los clústeres de cebadores estándar dieron como resultado una baja intensidad de SYBR (gráfico superior) mientras que los del cebador modificado con P5 añadido dieron como resultado una intensidad 10 veces mayor (gráfico inferior).
A continuación, se preparó la celda de flujo para realizar un primer ciclo de incorporación de secuenciación, utilizando un conjunto de fluoróforo de luz blanca. Las imágenes del primer ciclo de C, T y G con la escala de grises de la imagen ajustada al brillo de la imagen de T en el carril de cebador modificado mostraron que los clústeres que usan los cebadores modificados son más brillantes que los clústeres hechos con cebadores estándar. (Fig. 5)
Ejemplo 2
Este ejemplo describe la amplificación en fase sólida de acuerdo con una realización, como se ilustra en la Fig. 3. Los experimentos descritos en la Figura 6 muestran los resultados de la concatemerización de conectores 20T / A en los cebadores de injerto P5/P7 (referidos como 20T-P7/20A-P5) en lugar de unir los cebadores que facilitan el concatémero en la biblioteca durante el proceso de PCR. En este experimento, la celda de flujo se injertó con cebadores P5 / P7 de extremos emparejados con 20A/T junto con cebadores estándar. Se siguió el protocolo de injerto estándar como se describe en las patentes de EE.UU. n° 8.536.477, 8.715.966 y publicación de solicitud de patente 2008/0280773 y esta celda de flujo injertada se usó para la amplificación de clústeres en un sistema de amplificación clonal cBOT (Illumina n° de cat. SY-301-2002) usando el kit de generación de clúster TruSeq para Genome Analyzer (Illumina) según el protocolo recomendado por el fabricante. Se utilizaron bibliotecas CT418 como molde; se amplificaron 105 ciclos a 60°C. La celda de flujo se tiñó con verde SYBR y se obtuvieron imágenes como se describe en la Fig. 4. Las gráficas del número de clústeres frente a la intensidad de la señal SYBR mostraba que usando los cebadores de superficie 20T-P7/20A-P5 (6A) el brillo del clúster aumentaba en comparación con los cebadores de superficie estándar (6B). Sin embargo, se observaron menos clústeres con mayor intensidad en comparación con el ejemplo dado en las Figs. 4 y 5.
Efecto de la temperatura en la intensidad del clúster: Se probaron intervalos de temperatura de 50° a 60°C y ciclos de amplificación que variaban de 25 a 45 para la generación de clústeres. El injerto de la celda de flujo y el procedimiento del experimento eran como se ha descrito anteriormente para la Fig. 6, excepto que se probaron temperaturas de 50 y 55°C para la amplificación de clústeres durante 35 o 45 ciclos. Como se muestra en la Fig. 7, los cebadores de superficie 20T / 20A amplificados a 50°C y teñidos con verde SYBR mostraron que los clústeres de 20T/20A son 3-5 veces más brillantes que aquellos con cebadores de superficie estándar (7A). El diámetro del clúster siguió siendo el mismo para los cebadores de superficie 20T/20A y los cebadores estándar (7B). Las bibliotecas utilizadas fueron PhiX 1,9 y 18 pM y CT418 1 pM. Los autores de la invención encontraron que a temperaturas iguales o inferiores a 55°C y amplificación de 45 ciclos daban como resultado clústeres más brillantes utilizando cebadores 20T/20A en comparación con los cebadores estándar. El aumento de la concentración de polimerasa Bst junto con el aumento de los tiempos de extensión a 72 s desde el estándar de 36 s utilizado durante la amplificación en puente, también daba como resultado clústeres más brillantes cuando se usaban los cebadores 20T/20A en comparación con los clústeres estándar (datos no mostrados).
La Figura 8 es una comparación en paralelo de la intensidad del clúster frente al número de ciclos durante una secuenciación estándar de 100 ciclos realizada en un GA, que muestra que la intensidad de los clústeres de cebadores 20T-P7/20A-P5 al final de un experimento de 100 ciclos es similar a la intensidad de los clústeres con cebadores estándar al comienzo del experimento.
A lo largo de esta solicitud se ha hecho referencia a diversas publicaciones, patentes y/o solicitudes de patente.
En el presente documento, se pretende que el término comprender sea abierto, incluyendo no solo los elementos citados, sino que además abarca cualquier elemento adicional.
Se han descrito varias realizaciones. No obstante, se entenderá que pueden realizarse varias modificaciones. Por consiguiente, otras realizaciones están dentro del alcance de las siguientes reivindicaciones.

Claims (13)

REIVINDICACIONES
1. Un método para preparar moldes inmovilizados para una reacción de secuenciación de ácidos nucleicos que comprende:
(a) proporcionar un soporte sólido que tiene un cebador de amplificación directo e inverso inmovilizado sobre el mismo; (b) proporcionar un ácido nucleico diana, en donde el ácido nucleico diana comprende:
(i) una primera región de secuencia conocida complementaria del cebador de amplificación directo;
(ii) una primera región molde;
(iii) una segunda región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región molde está entre la primera región de secuencia conocida y la segunda región de secuencia conocida; y
(iv) una tercera región de secuencia conocida complementaria del cebador de amplificación directo, en donde la primera región molde y la segunda región de secuencia conocida están entre la primera región de secuencia conocida y la tercera región de secuencia conocida;
(c) aplicar el ácido nucleico diana al soporte sólido en condiciones adecuadas para la hibridación de modo que la primera región de secuencia conocida se hibrida con el cebador de amplificación directo;
(d) extender el cebador de amplificación directo hibridado para generar un primer molde inmovilizado que comprende una copia complementaria del ácido nucleico diana;
(e) desnaturalizar el ácido nucleico diana del primer molde inmovilizado;
(f) hibridar el primer molde inmovilizado con el cebador de amplificación inverso, de modo que una copia complementaria de la segunda región de secuencia conocida se hibrida con el cebador de amplificación inverso; y (g) extender el cebador de amplificación inverso hibridado para generar una segunda cadena inmovilizada que comprende la primera región molde colocada entre la primera región de secuencia conocida y la segunda región de secuencia conocida;
(h) desnaturalizar la segunda cadena inmovilizada del primer molde inmovilizado;
(i) hibridar la segunda cadena inmovilizada con el primer molde inmovilizado, de modo que la primera región de secuencia conocida de la segunda cadena inmovilizada se hibrida con una copia complementaria de la tercera región de secuencia conocida en el molde inmovilizado;
(j) extender un 3' OH de la primera región de secuencia conocida para generar un concatémero de la segunda cadena inmovilizada; y
(k) extender un 3' OH de la copia complementaria de la tercera región de secuencia conocida para generar un concatémero del primer molde inmovilizado;
en donde el método comprende además secuenciar el ácido nucleico diana y la secuenciación comprende: hibridar uno o más cebadores de secuenciación con el primer molde inmovilizado o la segunda cadena inmovilizada; extender los cebadores de secuenciación incorporando uno o más nucleótidos marcados en la cadena naciente; y detectar los nucleótidos marcados, obteniendo así información de secuencia sobre el ácido nucleico diana.
2. El método de la reivindicación 1, que además comprende:
( l) desnaturalizar los concatémeros y repetir las etapas (i), (j) y (k) para generar concatémeros adicionales de cada cadena.
3. El método de cualquiera de las reivindicaciones 1-2, en donde el cebador de amplificación directo comprende una región de complementariedad directa, teniendo dicha región de complementariedad directa complementariedad con una región de complementariedad inversa del cebador de amplificación inverso.
4. El método de la reivindicación 3, en donde la región de complementariedad directa está situada directamente en 5' de una región que tiene complementariedad con la primera región de secuencia conocida del ácido nucleico diana; y/o en donde la región de complementariedad inversa está situada directamente en 5' de una región que tiene secuencia sustancialmente idéntica a la segunda región de secuencia conocida del ácido nucleico diana; y/o
en donde la región de complementariedad directa y la región de complementariedad inversa están configuradas de modo que ciclos repetidos de hibridación y extensión producen un concatémero de la primera cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad directa y/o en donde la región de complementariedad directa y la región de complementariedad inversa están configuradas de manera que ciclos repetidos de hibridación y extensión producen un concatémero de la segunda cadena inmovilizada, cada copia en el concatémero separada de la siguiente por la secuencia de la región de complementariedad inversa.
5. El método de cualquiera de las reivindicaciones 1-2, en donde dichos concatémeros comprenden múltiples copias de dicha molécula de ácido nucleico diana de al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 o al menos 10.000 copias.
6. El método de cualquiera de las reivindicaciones 1-5, en donde dicho soporte sólido es plano; o en donde dicho soporte sólido comprende micropocillos o perlas.
7. El método de cualquiera de las reivindicaciones 1-6, en donde dicho ácido nucleico diana tiene una longitud de al menos 10, 20, 50, 100, 200 o al menos 500 nucleótidos.
8. El método de la reivindicación 1, en donde dicho ácido nucleico diana comprende además una cuarta región de secuencia conocida sustancialmente idéntica al cebador de amplificación inverso, en donde la primera región de secuencia conocida, la primera región molde y la segunda región de secuencia conocida están entre la tercera región de secuencia conocida y la cuarta región de secuencia conocida.
9. El método de cualquiera de las reivindicaciones 1-8, en donde el cebador de amplificación directo comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que esté en 5' del resto conector químico no nucleotídico.
10. El método de cualquiera de las reivindicaciones 1-9, en donde el cebador de amplificación inverso comprende un resto conector químico no nucleotídico situado para evitar la copia de cualquier nucleótido que esté en 5' del resto conector químico no nucleotídico.
11. El método de cualquiera de las reivindicaciones 9-10, en donde el resto conector químico no nucleotídico comprende un diol o, en donde el resto conector químico no nucleotídico comprende un conector no nucleotídico que une el cebador al soporte sólido.
12. El método de cualquiera de las reivindicaciones 1-11, en donde el ácido nucleico diana se prepara amplificando con un par de cebadores configurados con un resto de unión de modo que una cadena de un producto de amplificación generado usando el par de cebadores puede separarse de la cadena opuesta.
13. El método de la reivindicación 12, en donde el resto de unión comprende biotina.
ES16715859T 2015-03-31 2016-03-30 Concatemerización en superficie de moldes Active ES2846730T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562141165P 2015-03-31 2015-03-31
PCT/GB2016/050898 WO2016156845A1 (en) 2015-03-31 2016-03-30 Surface concatamerization of templates

Publications (1)

Publication Number Publication Date
ES2846730T3 true ES2846730T3 (es) 2021-07-29

Family

ID=55745782

Family Applications (2)

Application Number Title Priority Date Filing Date
ES16715859T Active ES2846730T3 (es) 2015-03-31 2016-03-30 Concatemerización en superficie de moldes
ES20200077T Active ES2984193T3 (es) 2015-03-31 2016-03-30 Concatemerización de moldes en la superficie

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES20200077T Active ES2984193T3 (es) 2015-03-31 2016-03-30 Concatemerización de moldes en la superficie

Country Status (5)

Country Link
US (2) US20180100192A1 (es)
EP (2) EP3277839B1 (es)
CN (1) CN107532205B (es)
ES (2) ES2846730T3 (es)
WO (1) WO2016156845A1 (es)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10829816B2 (en) 2012-11-19 2020-11-10 Apton Biosystems, Inc. Methods of analyte detection
HUE058723T2 (hu) 2012-11-19 2022-09-28 Apton Biosystems Inc Molekuláris analitok digitális elemzése egyetlen molekula kimutatásával
EP4306650A3 (en) 2013-08-22 2024-03-27 Pacific Biosciences of California, Inc. Digital analysis of molecular analytes using electrical methods
CA3056765C (en) 2017-03-17 2024-04-02 Apton Biosystems, Inc. Sequencing and high resolution imaging
JP2022501026A (ja) 2018-09-19 2022-01-06 アプトン バイオシステムズ インコーポレイテッド 高密度に詰め込まれた分析物の層および検出方法
EP3891305A1 (en) * 2018-12-05 2021-10-13 Illumina Cambridge Limited Methods and compositions for cluster generation by bridge amplification
WO2020243073A1 (en) * 2019-05-31 2020-12-03 Illumina, Inc. Systems and methods for information storage and retrieval using flow cells
US12448648B2 (en) * 2019-12-23 2025-10-21 Mgi Tech Co., Ltd. Controlled strand-displacement for paired end sequencing
WO2021163621A2 (en) * 2020-02-14 2021-08-19 Genapsys, Inc. Methods and systems for nucleic acid amplification and sequencing
WO2021178467A1 (en) * 2020-03-03 2021-09-10 Omniome, Inc. Methods and compositions for sequencing double stranded nucleic acids
EP4150126A4 (en) * 2020-05-12 2024-06-19 Singular Genomics Systems, Inc. NUCLEIC ACID AMPLIFICATION PROCESSES
WO2022015600A2 (en) * 2020-07-13 2022-01-20 Singular Genomics Systems, Inc. Methods of sequencing complementary polynucleotides
AU2022245985A1 (en) * 2021-03-22 2023-09-21 Illumina Cambridge Limited Methods for improving nucleic acid cluster clonality
US20220356519A1 (en) * 2021-05-10 2022-11-10 Pacific Biosciences Of California, Inc. Single-molecule seeding and amplification on a surface
WO2024119413A1 (zh) * 2022-12-07 2024-06-13 深圳华大智造科技股份有限公司 基于一步法的双核酸纳米球制备方法

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
EP0379559B1 (en) 1988-06-24 1996-10-23 Amgen Inc. Method and reagents for detecting nucleic acid sequences
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
JP2955759B2 (ja) 1988-07-20 1999-10-04 セゲブ・ダイアグノスティックス・インコーポレイテッド 核酸配列を増幅及び検出する方法
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
EP0439182B1 (en) 1990-01-26 1996-04-24 Abbott Laboratories Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
EP0754240B1 (en) 1994-02-07 2003-08-20 Beckman Coulter, Inc. Ligase/polymerase-mediated genetic bit analysis of single nucleotide polymorphisms and its use in genetic analysis
US5928905A (en) * 1995-04-18 1999-07-27 Glaxo Group Limited End-complementary polymerase reaction
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
AU747242B2 (en) 1997-01-08 2002-05-09 Proligo Llc Bioconjugation of macromolecules
JP2002503954A (ja) * 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US7427678B2 (en) 1998-01-08 2008-09-23 Sigma-Aldrich Co. Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
CN101525660A (zh) 2000-07-07 2009-09-09 维西根生物技术公司 实时序列测定
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
WO2003101972A1 (en) 2002-05-30 2003-12-11 The Scripps Research Institute Copper-catalysed ligation of azides and acetylenes
EP3795577A1 (en) 2002-08-23 2021-03-24 Illumina Cambridge Limited Modified nucleotides
US20050053980A1 (en) 2003-06-20 2005-03-10 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
US7259258B2 (en) 2003-12-17 2007-08-21 Illumina, Inc. Methods of attaching biological compounds to solid supports using triazine
EP3175914A1 (en) 2004-01-07 2017-06-07 Illumina Cambridge Limited Improvements in or relating to molecular arrays
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
GB0427236D0 (en) 2004-12-13 2005-01-12 Solexa Ltd Improved method of nucleotide detection
EP1828412B2 (en) 2004-12-13 2019-01-09 Illumina Cambridge Limited Improved method of nucleotide detection
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP3722409A1 (en) 2006-03-31 2020-10-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP4134667B1 (en) 2006-12-14 2025-11-12 Life Technologies Corporation Apparatus for measuring analytes using fet arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
WO2010038042A1 (en) * 2008-10-02 2010-04-08 Illumina Cambridge Ltd. Nucleic acid sample enrichment for sequencing applications
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9029103B2 (en) * 2010-08-27 2015-05-12 Illumina Cambridge Limited Methods for sequencing polynucleotides
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
CN102609077A (zh) 2011-01-20 2012-07-25 深圳富泰宏精密工业有限公司 锁屏装置
US8778848B2 (en) 2011-06-09 2014-07-15 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
CA2859660C (en) 2011-09-23 2021-02-09 Illumina, Inc. Methods and compositions for nucleic acid sequencing
CA3003082C (en) 2011-10-28 2020-12-15 Illumina, Inc. Microarray fabrication system and method
JP6159391B2 (ja) 2012-04-03 2017-07-05 イラミーナ インコーポレーテッド 核酸シークエンシングに有用な統合化した読取りヘッド及び流体カートリッジ

Also Published As

Publication number Publication date
EP3277839B1 (en) 2020-12-02
CN107532205A (zh) 2018-01-02
CN107532205B (zh) 2021-06-08
US20210155985A1 (en) 2021-05-27
EP3783109A1 (en) 2021-02-24
EP3277839A1 (en) 2018-02-07
EP3783109B1 (en) 2024-05-29
US20180100192A1 (en) 2018-04-12
US12123056B2 (en) 2024-10-22
WO2016156845A1 (en) 2016-10-06
HK1244846A1 (en) 2018-08-17
ES2984193T3 (es) 2024-10-29

Similar Documents

Publication Publication Date Title
ES2846730T3 (es) Concatemerización en superficie de moldes
ES2802405T3 (es) Métodos y matrices para producir y secuenciar agrupaciones monoclonales de ácido nucleico
ES2699262T3 (es) Métodos y soportes sólidos para la preparación de muestras utilizando transposomas
ES2898250T3 (es) Bibliotecas de genoma completo de células individuales para secuenciación de la metilación
ES2789349T3 (es) Utilización mejorada de cebadores de superficie en grupos
ES2889875T3 (es) Secuenciación a partir de cebadores múltiples para incrementar la velocidad y la densidad de los datos
ES2877205T3 (es) Preparación de muestras para la amplificación de ácido nucleico
HK40046037B (en) Surface concatamerization of templates
HK40046037A (en) Surface concatamerization of templates
HK1244846B (en) Surface concatamerization of templates
HK1246366B (en) Enhanced utilization of surface primers in clusters
HK1216776B (en) Methods and solid supports for sample preparation using transposomes