[go: up one dir, main page]

ES2882608T3 - Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados - Google Patents

Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados Download PDF

Info

Publication number
ES2882608T3
ES2882608T3 ES18723275T ES18723275T ES2882608T3 ES 2882608 T3 ES2882608 T3 ES 2882608T3 ES 18723275 T ES18723275 T ES 18723275T ES 18723275 T ES18723275 T ES 18723275T ES 2882608 T3 ES2882608 T3 ES 2882608T3
Authority
ES
Spain
Prior art keywords
adapter
polynucleotides
library
target
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18723275T
Other languages
English (en)
Inventor
Eric Vermaas
Mahdieh Khosroheidari
Claire Bevis-Mott
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Illumina Inc
Original Assignee
Illumina Cambridge Ltd
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd, Illumina Inc filed Critical Illumina Cambridge Ltd
Application granted granted Critical
Publication of ES2882608T3 publication Critical patent/ES2882608T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • C40B50/16Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support involving encoding steps
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • C40B50/18Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support using a particular method of attachment to the solid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B80/00Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método que comprende: proporcionar una primera biblioteca que comprende una primera pluralidad de polinucleótidos que tienen una secuencia de primer adaptador-diana-primer adaptador, en la que los polinucleótidos de la primera pluralidad de polinucleótidos son bicatenarios en una región que comprende la diana y al menos una parte del primer adaptador en ambos extremos de la diana; proporcionar un primer oligonucleótido cebador configurado para hibridar con una parte del primer adaptador en la proximidad de un extremo 3' de una cadena del primer adaptador, en el que el extremo 5' del primer oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5'; proporcionar un segundo oligonucleótido cebador configurado para hibridar con un complemento de una parte del primer adaptador en la proximidad de un extremo 3' de una cadena del complemento del primer adaptador, en el que el extremo 5' del segundo oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5'; incubar la primera biblioteca con el primer y segundo oligonucleótidos cebadores en una solución en condiciones adecuadas para amplificar los polinucleótidos que tienen una secuencia de primer adaptador-diana-primer adaptador para producir una primera biblioteca amplificada de polinucleótidos que tienen los extremos 5' modificados para evitar la digestión por una enzima que tiene actividad exonucleasa 5', en donde los polinucleótidos amplificados tienen una secuencia primer adaptador amplificado-diana-primer adaptador amplificado, y en donde la secuencia del primer adaptador amplificado comprende una primera secuencia específica de biblioteca; modificar los extremos 3' de los polinucleótidos de la primera biblioteca amplificada para evitar uno o ambos de (i) la digestión por una enzima que tiene actividad exonucleasa 3', o (ii) la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa, generando así una primera biblioteca protegida de polinucleótidos que tiene los extremos 5' y 3' modificados.

Description

DESCRIPCIÓN
Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
Campo de la invención
La presente divulgación se refiere, entre otras cosas, a la secuenciación de polinucleótidos de múltiples bibliotecas; y más particularmente al aumento de la probabilidad de que la secuenciación identifique adecuadamente la biblioteca a partir de la cual se originaron los polinucleótidos.
Antecedentes
Las mejoras en las metodologías de secuenciación han permitido la secuenciación de ácidos polinucleicos agrupados o multiplexados a partir de diferentes bibliotecas en un único protocolo de secuenciación. Puede añadirse una secuencia específica de biblioteca (una "etiqueta de índice") a los ácidos polinucleicos de cada biblioteca de modo que el origen de cada ácido polinucleico secuenciado pueda identificarse adecuadamente. La secuencia de la etiqueta de índice se puede añadir a los ácidos polinucleicos de una biblioteca mediante, por ejemplo, adaptadores de ligadura que comprenden la secuencia de la etiqueta de índice a los extremos de los ácidos polinucleicos.
Los adaptadores pueden contener secuencias además de la secuencia de la etiqueta de índice, tal como una secuencia de cebador de extensión universal y una secuencia de cebador de secuenciación universal. La secuencia del cebador de extensión universal puede, entre otras cosas, hibridar a un primer oligonucleótido acoplado a una superficie sólida. El primer oligonucleótido puede tener un extremo 3' libre desde el cual una polimerasa puede añadir nucleótidos para extender la secuencia usando el polinucleótido de biblioteca hibridado como una plantilla, dando como resultado una cadena inversa del polinucleótido de biblioteca acoplada a la superficie sólida. Se pueden acoplar copias adicionales de cadenas directas e inversas a la superficie sólida a través de la amplificación de grupos. Un ejemplo de amplificación de grupos es la amplificación de puente en la que el extremo 3' de los polinucleótidos previamente amplificados que están unidos a la superficie sólida hibridan a segundos oligonucleótidos unidos a la superficie sólida. El segundo oligonucleótido puede tener un extremo 3' libre a partir del cual una polimerasa puede añadir nucleótidos para extender la secuencia usando el polinucleótido de cadena inversa acoplado como una plantilla, dando como resultado una cadena directa del polinucleótido de la biblioteca que se acopla a la superficie sólida a través del segundo oligonucleótido. El proceso puede repetirse para producir grupos de cadenas directas e inversas acopladas a la superficie sólida. Las cadenas directas o las cadenas inversas pueden eliminarse, por ejemplo, mediante escisión, antes de la secuenciación.
Un cebador de secuenciación puede hibridar a una porción de una cadena de polinucleótido acoplada al soporte sólido. Por ejemplo, el cebador de secuenciación puede hibridar a una secuencia del cebador de secuenciación universal, si está presente. La secuenciación puede ocurrir mediante múltiples ciclos de adición de nucleótidos al cebador de secuenciación utilizando el polinucleótido acoplado como una plantilla y detectando la identidad de los nucleótidos añadidos. La hibridación del cebador de secuenciación puede ocurrir en una localización en la cadena de polinucleótidos acoplada para permitir la identificación de la secuencia de la etiqueta de índice, así como una secuencia diana del polinucleótido acoplado a la superficie sólida o se pueden emplear cebadores de secuenciación separados para secuenciar por separado la secuencia de la etiqueta de índice y la secuencia diana. Por consiguiente, la secuencia diana puede indexarse a una biblioteca de origen particular basada en la secuencia de la etiqueta de índice asociada con la secuencia diana.
Los documentos de Patente WO 2013/177220, WO 2015/069374, Rahul Sinha et al: "Index Switching Causes “Spreading-Of-Signal” Among Multiplexed Samples In Illumina HiSeq 4000 DNA Sequencing'', bioRxiv, 9 April 2017, XP055483189, y Kircher M et al: "Double indexing overcomes inaccuracies in multiplex sequencing on the Illumina platform", NUCLEIC ACIDS RESEARCH, OXFORD UNIVERSITY PRESS, GB vol 40, no.1, 1 January 2012, pages e3-1, ISSN 1362-4962, XP002751968, son útiles para comprender la presente invención.
A pesar de la inclusión de una secuencia de la etiqueta de índice específica de la biblioteca para cada ácido polinucleico que se va a secuenciar, pueden producirse errores en la identificación del origen de la biblioteca de un ácido polinucleico secuenciado debido a un fenómeno conocido como salto de índice. El salto de índice se produce cuando las secuencias de las etiquetas de índice a partir de una biblioteca se añaden inadvertidamente a un ácido polinucleico de una biblioteca diferente. El salto de índice puede ocurrir durante la preparación de la biblioteca o la amplificación de grupos de los polinucleótidos en una celda de flujo u otro soporte sólido adecuado para la secuenciación. El salto de índice puede confundir los resultados de la secuenciación, tal como, por ejemplo, dar como resultado una asignación incorrecta del origen de la biblioteca de un polinucleótido secuenciado o descartar los resultados de la secuenciación.
Breve resumen
Uno o más aspectos según se reivindica abordan al menos un mecanismo potencial asociado con el salto de índice mediante el bloqueo de los extremos 3' de los ácidos polinucleicos, incluyendo los adaptadores no incorporados, durante la preparación de la muestra de la biblioteca. Sin pretender ceñirse a la teoría, se cree que el salto de índice puede producirse cuando un adaptador no incorporado que comprende una secuencia de la etiqueta de índice para una biblioteca híbrida a una parte de un adaptador de otra biblioteca, y el adaptador no incorporado sirve como un cebador durante la amplificación del grupo. Por tanto, una secuencia diana de una biblioteca puede etiquetarse con una etiqueta de índice de un adaptador de otra biblioteca. Durante los ciclos posteriores de amplificación de grupos, se pueden amplificar copias adicionales de la diana mal etiquetada antes de la secuenciación. Dicho salto de índice puede confundir los resultados de la secuenciación posterior. Al bloquear los extremos 3' de los polinucleótidos en una biblioteca, incluyendo los adaptadores no incorporados, durante la preparación de la muestra de la biblioteca, se bloqueará la capacidad de los adaptadores no incorporados para servir como cebadores durante la amplificación de grupos.
Además, o alternativamente, los aspectos de las realizaciones de la presente divulgación se refieren a la protección de los extremos 5' y 3' exonucleasas de polinucleótidos plantilla para inmovilizarlos en una superficie para secuenciar, y degradar los polinucleótidos no protegidos residuales para inhibir la capacidad de los polinucleótidos desprotegidos de participar en el salto de índice.
En algunos aspectos descritos en la presente memoria, un método incluye proporcionar una primera biblioteca que comprende una primera pluralidad de polinucleótidos que tienen una secuencia de primer adaptador-diana-primer adaptador. Los polinucleótidos de la primera pluralidad de polinucleótidos son bicatenarios en una región que comprende la diana y al menos una parte del primer adaptador en ambos extremos de la diana. El método incluye además proporcionar un primer oligonucleótido cebador configurado para hibridar con una parte del primer adaptador en la proximidad a un extremo 3' de una cadena del primer adaptador. El extremo 5' del primer oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5'. El método incluye además proporcionar un segundo oligonucleótido cebador configurado para hibridar con un complemento de una parte del primer adaptador en la proximidad a un extremo 3' de una cadena del complemento del primer adaptador. El extremo 5' del segundo oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5'. El método incluye además incubar la primera biblioteca con el primer y segundo oligonucleótido cebador en una solución en condiciones adecuadas para amplificar los polinucleótidos que tienen una secuencia de primer adaptador-diana-primer adaptador para producir una primera biblioteca amplificada de polinucleótidos que tienen los extremos 5’ modificados para evitar digestión por una enzima que tiene actividad exonucleasa 5'. Los polinucleótidos amplificados tienen una secuencia de primer adaptador amplificado-diana-primer adaptador amplificado. La primera secuencia de adaptador amplificada comprende una primera secuencia específica de biblioteca. El método incluye además modificar los extremos 3' de los polinucleótidos de la primera biblioteca amplificados para evitar uno o ambos de (i) la digestión por una enzima que tiene actividad exonucleasa 3', o (ii) la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa, generando así una primera biblioteca protegida de polinucleótidos que tienen los extremos 5' y 3' modificados. Preferiblemente, los extremos 3' se modifican para inhibir la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa.
La primera biblioteca protegida de polinucleótidos que tienen los extremos 5' y 3' modificados puede agruparse con polinucleótidos similares de otras bibliotecas e inmovilizarse por una superficie para secuenciación. Cuando se modificaron los extremos 3' para incluir didesoxinucleótidos, se observó una disminución en el salto de índice de casi 100 veces.
En algunos aspectos descritos en la presente memoria, un polinucleótido preparado para inmovilizar para secuenciar tiene una secuencia adaptador-diana-adaptador. La secuencia del adaptador comprende una secuencia específica de la biblioteca. El polinucleótido es bicatenario en una región que comprende la diana y al menos una parte del adaptador en ambos extremos de la diana. Los extremos 5' y 3' del polinucleótido en una región de la secuencia del adaptador son monocatenarios. Los extremos 5' se modifican para evitar la digestión por una enzima que tiene actividad exonucleasa 5'. Los extremos 3' se modifican para evitar uno o ambos de (i) la digestión por una enzima que tiene actividad exonucleasa 3', o (ii) la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa. Preferiblemente, los extremos 3' se modifican para evitar la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa.
En algunas realizaciones, las composiciones comprenden el polinucleótido y una exonucleasa.
Los métodos, polinucleótidos y composiciones descritos en la presente memoria pueden ser útiles para mitigar el salto de índice, por ejemplo, bloqueando los extremos 3' de los polinucleótidos, incluyendo los adaptadores no incorporados, o degradando los polinucleótidos no bloqueados, incluyendo los adaptadores no incorporados, durante la preparación de la muestra de la biblioteca. Al bloquear los extremos 3' de los adaptadores no incorporados, los adaptadores no incorporados no pueden extenderse durante la amplificación del grupo si los adaptadores hibridan a una secuencia de polinucleótido adaptador-diana-adaptador durante la amplificación del grupo. Además, o alternativamente, aquellos polinucleótidos que no están bloqueados en el extremo 3' pueden ser degradados por una exonucleasa para mitigar el salto de índice.
Las características y ventajas adicionales del tema en cuestión de la presente divulgación se establecerán en la descripción detallada que sigue, y en parte serán fácilmente evidentes para los expertos en la técnica a partir de esa descripción o se reconocerán practicando el tema en cuestión de la presente divulgación como se describe en la presente memoria, incluyendo la descripción detallada que sigue, las reivindicaciones, así como los dibujos adjuntos.
Debe entenderse que tanto la descripción general anterior como la siguiente descripción detallada presentan realizaciones del tema en cuestión de la presente divulgación, y están destinadas a proporcionar una descripción general o marco de trabajo para comprender la naturaleza y el carácter del tema en cuestión de la presente divulgación tal como se reivindica. Los dibujos adjuntos se incluyen para proporcionar una mayor comprensión del tema en cuestión de la presente divulgación, y se incorporan y constituyen una parte de esta especificación. Los dibujos ilustran varias realizaciones del tema en cuestión de la presente divulgación y, junto con la descripción, sirven para explicar los principios y operaciones del tema en cuestión de la presente divulgación. Además, los dibujos y descripciones están destinados a ser meramente ilustrativos y no están destinados a limitar el alcance de las reivindicaciones de ninguna manera.
Breve descripción de los dibujos
La siguiente descripción detallada de realizaciones específicas de la presente divulgación puede entenderse mejor cuando se lee junto con los siguientes dibujos.
La Figura 1 es un dibujo esquemático que ilustra una realización de un proceso para producir polinucleótidos plantilla 5' modificados y 3' bloqueados.
La Figura 2 es un dibujo esquemático de una realización de un adaptador según varios aspectos de la divulgación presentada en la presente memoria.
La Figura 3 es un dibujo esquemático de una realización de un polinucleótido plantilla que tiene una secuencia adaptador-diana-adaptador (que puede incluir un adaptador generalmente como se muestra en la Figura 2) según varios aspectos de la divulgación presentada en la presente memoria.
La Figura 4 es un dibujo esquemático que ilustra una realización de un proceso para la amplificación de grupos que emplea una realización de un polinucleótido plantilla (que puede ser el polinucleótido plantilla representado en la Figura 3) según varios aspectos de la divulgación presentada en la presente memoria.
La Figura 5 es un dibujo esquemático que ilustra una realización de cómo el bloqueo del extremo 3' puede mitigar el salto de índice.
La Figura 6 es un dibujo esquemático que ilustra una realización de cómo el tratamiento con exonucleasa puede mitigar el salto de índice según varias realizaciones descritas en la presente memoria.
las Figuras 7A y 7B ilustran la naturaleza del fenómeno de salto de índice. La Figura 7A muestra cómo las lecturas de una muestra dada se demultiplexan incorrectamente y se mezclan con una muestra diferente después de la demultiplexación. La Figura 7B demuestra el salto de índice en un sistema de índice dual, donde conduce a combinaciones inesperadas de secuencias de las etiquetas de índice.
Las Figuras 8A y 8B ilustran el enfoque general para medir la tasa de salto de índice en un sistema dado. La Figura 8A muestra un diseño ejemplar de una placa de adaptador dual, en la que cada pocillo individual de una placa de 96 pocillos contiene un par único de secuencias de las etiquetas de índice. La Figura 8B muestra una configuración experimental destinada a medir la tasa de salto de índice, en la que solo se utilizan combinaciones únicas de etiquetas de índice dual.
Las Figuras 9A y 9B ilustran el efecto de los adaptadores no unidos sobre la tasa de salto de índice. La Figura 9A muestra un aumento de 6 veces en el índice de salto asociado con un aumento del 50% de adaptadores libres. La Figura 9B muestra un efecto aproximadamente lineal del adaptador bifurcado libre sobre la tasa de salto de índice dentro del intervalo probado.
La Figura 10 muestra el efecto de la exonucleasa combinada y el tratamiento de bloqueo de 3' sobre las tasas de salto de índice en el flujo de trabajo de preparación de la biblioteca Illumina TruSeq® Nano (PCR), comparando el rendimiento de adaptadores estándar y adaptadores protegidos por PCR según la presente invención.
Los dibujos esquemáticos no están necesariamente a escala. Los números similares utilizados en las figuras se refieren a componentes, etapas y similares iguales. Sin embargo, se entenderá que el uso de un número para referirse a un componente en una figura dada no pretende limitar el componente en otra figura etiquetada con el mismo número. Además, el uso de diferentes números para referirse a componentes no pretende indicar que los diferentes componentes numerados no pueden ser iguales o similares a otros componentes numerados.
Descripción detallada
Ahora se hará referencia con mayor detalle a varias realizaciones del tema en cuestión de la presente divulgación, algunas realizaciones de las cuales se ilustran en los dibujos adjuntos.
Definiciones
Todos los términos científicos y técnicos usados en la presente memoria tienen significados comúnmente usados en la técnica a menos que se especifique lo contrario. Las definiciones proporcionadas en la presente memoria son para facilitar la comprensión de ciertos términos utilizados con frecuencia en la presente memoria y no pretenden limitar el alcance de la presente divulgación.
Como se usa en la presente memoria, las formas singulares "un", "una" y "el" incluyen referentes plurales a menos que el contexto indique claramente lo contrario. Así, por ejemplo, la referencia a una "secuencia de las etiquetas de índice" incluye ejemplos que tienen dos o más de dichas "secuencias de las etiquetas de índice" a menos que el contexto indique claramente lo contrario.
Como se usa en esta especificación y en las reivindicaciones adjuntas, el término "o" se emplea generalmente en su sentido que incluye "y / o" a menos que el contenido indique claramente lo contrario. El término "y / o" significa uno o todos de los elementos enumerados o una combinación de cualquiera dos o más de los elementos enumerados. El uso de "y / o" en algunos casos no implica que el uso de "o" en otros casos no signifique "y / o".
Como se usa en la presente memoria, "tienen", "tiene", “que tiene", "incluyen", "incluye", "que incluye", "comprenden", "comprende", "que comprende" o similares se usan en su sentido inclusivo de final abierto, y generalmente significa "incluyen, pero no se limitan a", "incluye, pero no se limita a", o "que incluye, pero no se limita a".
"Opcional" u "opcionalmente" significa que el suceso, circunstancia o componente descrito posteriormente puede o no puede ocurrir, y que la descripción incluye casos en los que el suceso, circunstancia o componente ocurre y casos en los que no.
Las palabras "preferido" y "preferiblemente" se refieren a realizaciones de la divulgación que pueden proporcionar ciertos beneficios, bajo ciertas circunstancias. Sin embargo, también se pueden preferir otras realizaciones, en las mismas u otras circunstancias. Además, la enumeración de una o más realizaciones preferidas no implica que otras realizaciones no sean útiles y no pretende excluir otras realizaciones del alcance de la tecnología de la invención.
También en la presente memoria, las enumeración de intervalos numéricos por puntos finales incluyen todos los números incluidos dentro de ese intervalo (por ejemplo, 1 a 5 incluye 1, 1,5, 2, 2,75, 3, 3,80, 4, 5, etc.). Cuando un intervalo de valores es "mayor que", "menor que", etc., un valor particular, ese valor se incluye dentro del intervalo.
A menos que se indique expresamente lo contrario, no se pretende de ninguna manera que cualquier método establecido en la presente memoria se interprete como que requiera que sus etapas se realicen en un orden específico. En consecuencia, cuando una reivindicación de método no enumera realmente un orden a seguir para sus etapas o no se establece específicamente de otra manera en las reivindicaciones o descripciones que las etapas deben limitarse a un orden específico, no se pretende de ninguna manera que se infiera un orden en particular. Cualquier característica o aspecto único o múltiple enumerado en cualquier reivindicación puede combinarse o permutarse con cualquier otra característica o aspecto enumerado en cualquier otra reivindicación o reivindicaciones.
Si bien se pueden describir varias características, elementos o etapas de realizaciones particulares usando la frase de transición "que comprende", se debe entender que realizaciones alternativas, que incluyen aquellas que pueden describirse usando las frases de transición "que consiste" o "que consiste esencialmente en", están implícitas. Así, por ejemplo, las realizaciones alternativas implícitas a un polinucleótido que comprende una secuencia de adaptador-dianaadaptador incluyen realizaciones en las que el polinucleótido consiste en la secuencia de adaptador-diana-adaptador y realizaciones en las que el polinucleótido consiste esencialmente en la secuencia de adaptador-diana-adaptador.
Como se usa en la presente memoria, "proporcionar" en el contexto de un polinucleótido, composición o artículo significa preparar el polinucleótido, composición o artículo, adquirir el polinucleótido, composición o artículo, u obtener de otro modo el compuesto, composición o artículo.
Como se usa en la presente memoria, "amplificar", "que amplifica" o "reacción de amplificación" y sus derivados, se refieren generalmente a cualquier acción o proceso mediante el cual al menos una parte de un polinucleótido (por ejemplo, polinucleótido plantilla) se replica o copia en al menos uno polinucleótido adicional. El polinucleótido adicional incluye opcionalmente una secuencia que es sustancialmente idéntica o sustancialmente complementaria a al menos alguna parte del polinucleótido plantilla. El polinucleótido plantilla puede ser monocatenario o bicatenario y el polinucleótido adicional puede ser independientemente monocatenario o bicatenario. La amplificación incluye opcionalmente la replicación lineal o exponencial de un polinucleótido. En algunas realizaciones, dicha amplificación se puede realizar usando condiciones isotérmicas; en otras realizaciones, dicha amplificación puede incluir termociclaje. En algunas realizaciones, la amplificación es una amplificación múltiple que incluye la amplificación simultánea de una pluralidad de secuencias diana en una única reacción de amplificación. En algunas realizaciones, "amplificación" incluye la amplificación de al menos alguna parte de ácidos nucleicos basados en DNA y RNA solos o en combinación. La reacción de amplificación puede incluir cualquiera de los procesos de amplificación conocidos por un experto en la técnica. En algunas realizaciones, la reacción de amplificación incluye la reacción en cadena de la polimerasa (PCR).
Como se usa en la presente memoria, el término "polimerasa" pretende ser coherente con su uso en la técnica e incluye, por ejemplo, una enzima que produce una réplica complementaria de un polinucleótido usando el polinucleótido como una cadena plantilla. Normalmente, las DNA polimerasas se unen a la cadena plantilla y después se mueven por la cadena plantilla añadiendo secuencialmente nucleótidos al grupo hidroxilo libre en el extremo 3' de una cadena en crecimiento de ácido nucleico. Las DNA polimerasas normalmente sintetizan moléculas de DNA complementarias a partir de plantillas de DNA y las RNA polimerasas normalmente sintetizan moléculas de RNA a partir de plantillas de DNA (transcripción). Las polimerasas pueden usar una cadena corta de RNA o DNA, llamada cebador, para comenzar el crecimiento de la cadena. Algunas polimerasas pueden desplazar la cadena antes del sitio donde están añadiendo bases a una cadena. Se dice que dichas polimerasas desplazan la cadena, lo que significa que tienen una actividad que elimina una cadena complementaria de una cadena plantilla que está siendo leída por la polimerasa. Las polimerasas ejemplares que tienen actividad de desplazamiento de cadena incluyen, sin limitación, el fragmento grande de polimerasa Bst (Bacillus stearothermophilus), exo-Klenow polimerasa o exo-polimerasa de T7 de grado de secuenciación. Algunas polimerasas degradan la cadena delante de ellas, reemplazándola efectivamente con la cadena en crecimiento detrás (actividad de exonucleasa 5'). Algunas polimerasas tienen una actividad que degrada la cadena detrás de ellas (actividad exonucleasa 3'). Algunas polimerasas útiles se han modificado, ya sea por mutación o de otro modo, para reducir o eliminar la actividad exonucleasa 3' y / o 5'.
Como se define en la presente memoria, "amplificación múltiple" se refiere a la amplificación selectiva y no aleatoria de dos o más secuencias diana dentro de una muestra usando al menos un cebador específico de diana. En algunas realizaciones, la amplificación múltiple se realiza de manera que algunas o todas las secuencias diana se amplifican dentro de un único recipiente de reacción. El "plexo" o "complejo" de una amplificación múltiple dada se refiere generalmente al número de diferentes secuencias específicas de la diana que se amplifican durante esa amplificación múltiple única. En algunas realizaciones, el plexo puede ser de aproximadamente 12-plex, 24-plex, 48-plex, 96-plex, 192-plex, 384-plex, 768-plex, 1536-plex, 3072-plex, 6144-plex o superior. También es posible detectar las secuencias diana amplificadas mediante varias metodologías diferentes (por ejemplo, electroforesis en gel seguida de densitometría, cuantificación con un bioanalizador o PCR cuantitativa, hibridación con una sonda marcada; incorporación de cebadores biotinilados seguida de detección de conjugado de avidina-enzima; incorporación de trifosfatos de desoxinucleótido marcados con 32P en la secuencia diana amplificada).
Como se usa en la presente memoria, el término "cebador" y sus derivados se refieren generalmente a cualquier polinucleótido que pueda hibridar a una secuencia diana de interés. Normalmente, el cebador funciona como un sustrato sobre el que se pueden polimerizar nucleótidos mediante una polimerasa; en algunas realizaciones, sin embargo, el cebador puede incorporarse en la cadena de ácido nucleico sintetizada y proporcionar un sitio en el que otro cebador puede hibridar para preparar la síntesis de una nueva cadena que es complementaria a la molécula de ácido nucleico sintetizada. El cebador puede comprender cualquier combinación de nucleótidos o análogos de los mismos. En algunas realizaciones, el cebador es un oligonucleótido o polinucleótido monocatenario. Los términos "polinucleótido" y "oligonucleótido" se usan indistintamente en la presente memoria para referirse a una forma polimérica de nucleótidos de cualquier longitud y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Este término se refiere solo a la estructura primaria de la molécula. Por tanto, el término incluye ácido desoxirribonucleico ("DNA") de cadena triple, doble y simple, así como ácido ribonucleico ("RNA") de cadena triple, doble y simple. Como se usa en la presente memoria, "secuencias diana amplificadas" y sus derivados, se refiere generalmente a una secuencia de polinucleótidos producida por la amplificación de las secuencias diana usando cebadores específicos de diana y los métodos proporcionados en la presente memoria. Las secuencias diana amplificadas pueden ser del mismo sentido (es decir, la cadena positiva) o antisentido (es decir, la cadena negativa) con respecto a las secuencias diana.
Como se usa en presente memoria, los términos "que liga", "ligadura" y sus derivados se refieren generalmente al proceso para unir covalentemente dos o más moléculas juntas, por ejemplo, unir covalentemente dos o más polinucleótidos entre sí. En algunas realizaciones, la ligadura incluye cortes de unión entre nucleótidos adyacentes de polinucleótidos. En algunas realizaciones, la ligadura incluye formar un enlace covalente entre un extremo de un primer y un extremo de un segundo polinucleótido. En algunas realizaciones, la ligadura puede incluir la formación de un enlace covalente entre un grupo fosfato en 5' de un ácido nucleico y un grupo hidroxilo en 3' de un segundo ácido nucleico formando así un polinucleótido ligado. Generalmente, para los propósitos de esta divulgación, una secuencia diana amplificada se puede ligar a un adaptador para generar una secuencia adaptador-diana amplificada ligada.
Como se usa en la presente memoria, "ligasa" y sus derivados, se refiere generalmente a cualquier agente capaz de catalizar la unión de dos moléculas de sustrato. En algunas realizaciones, la ligasa incluye una enzima capaz de catalizar la unión de cortes entre nucleótidos adyacentes de un ácido nucleico. En algunas realizaciones, la ligasa incluye una enzima capaz de catalizar la formación de un enlace covalente entre un fosfato en 5' de una molécula de ácido nucleico y un hidroxilo en 3' de otra molécula de ácido nucleico formando así una molécula de ácido nucleico ligada. Las ligasas adecuadas pueden incluir, pero no se limitan a, T4 DNA ligasa, T4 RNA ligasa y DNA ligasa de E. coli.
Como se usa en la presente memoria, "condiciones de unión" y sus derivados, generalmente se refiere a condiciones adecuadas para unir dos moléculas entre sí. En algunas realizaciones, las condiciones de unión son adecuadas para sellar cortes o huecos entre ácidos nucleicos. Como se usa en la presente memoria, el término corte o hueco es consistente con el uso del término en la técnica. Normalmente, se puede unir un corte o un hueco en presencia de una enzima, tal como la ligasa, a una temperatura y un pH apropiados. En algunas realizaciones, la T4 DNA ligasa puede unirse a un corte entre ácidos nucleicos a una temperatura de aproximadamente 70-72°C.
Como se usa en la presente memoria, el término "secuencia universal" se refiere a una región de la secuencia que es común a dos o más moléculas de ácido nucleico donde las moléculas también tienen regiones de secuencia que difieren entre sí. Una secuencia universal que está presente en diferentes miembros de una colección de moléculas puede permitir la captura de múltiples ácidos nucleicos diferentes utilizando una población de ácidos nucleicos de captura universal que son complementarios a la secuencia universal. De manera similar, una secuencia universal presente en diferentes miembros de una colección de moléculas puede permitir la replicación o amplificación de múltiples ácidos nucleicos diferentes usando una población de cebadores universales que son complementarios a la secuencia universal. Por tanto, un polinucleótido de captura universal o un cebador universal incluye una secuencia que puede hibridar específicamente a una secuencia universal. Los polinucleótidos pueden modificarse para unir adaptadores universales, por ejemplo, en uno o ambos extremos de las diferentes secuencias.
Salto de índice
Esta divulgación se refiere, entre otras cosas, a la secuenciación de ácidos nucleicos de múltiples bibliotecas indexadas; y más particularmente para aumentar la probabilidad de que la secuenciación identifique adecuadamente la biblioteca a partir de la cual se originaron los ácidos nucleicos.
Cuando se combinan o multiplexan polinucleótidos de diferentes bibliotecas para la secuenciación, los polinucleótidos de cada biblioteca pueden modificarse para incluir una secuencia de la etiqueta de índice específica de la biblioteca. Durante la secuenciación, la etiqueta de índice se secuencia junto con las secuencias de polinucleótidos diana de las bibliotecas. Por consiguiente, la secuencia de la etiqueta de índice puede asociarse con la secuencia de polinucleótidos diana de modo que pueda identificarse la biblioteca a partir de la cual se originó la secuencia diana.
Sin embargo, un fenómeno conocido como salto de índice puede ocurrir en un pequeño porcentaje de resultados de secuencia (típicamente 0,5% a 2%). El salto de índice se refiere a una secuencia de la etiqueta de índice de una biblioteca asociada con el polinucleótido diana de otra biblioteca (véanse las Figuras 7A y 7B). Si bien los mecanismos por los cuales pueden ocurrir los saltos de índice no se comprenden completamente, la tasa de salto de índice se puede reducir efectivamente bloqueando el extremo 3' de los adaptadores no incorporados después de que los adaptadores se unen a los polinucleótidos diana de una biblioteca a, entre otras cosas, unir la secuencia de la etiqueta de índice al polinucleótido.
Preparación inicial de la muestra de la biblioteca
Las bibliotecas que comprenden polinucleótidos se pueden preparar de cualquier manera adecuada para unir adaptadores de oligonucleótidos a polinucleótidos diana. Como se usa en la presente memoria, una "biblioteca" es una población de polinucleótidos de una fuente o muestra determinada. Una biblioteca comprende una pluralidad de polinucleótidos diana. Como se usa en la presente memoria, un "polinucleótido diana" es un polinucleótido que se desea secuenciar. El polinucleótido diana puede ser esencialmente cualquier polinucleótido de secuencia conocida o desconocida. Puede ser, por ejemplo, un fragmento de DNA genómico o cDNA. La secuenciación puede dar como resultado la determinación de la secuencia de la totalidad o una parte de los polinucleótidos diana. Los polinucleótidos diana pueden derivarse de una muestra de polinucleótidos primaria que se ha fragmentado aleatoriamente. Los polinucleótidos diana se pueden procesar en plantillas adecuadas para la amplificación mediante la colocación de secuencias de cebadores universales en los extremos de cada fragmento diana. Los polinucleótidos diana también pueden obtenerse a partir de una muestra de RNA primario mediante transcripción inversa en cDNA.
Los términos "polinucleótido" y "oligonucleótido" se usan indistintamente en la presente memoria para referirse a una forma polimérica de nucleótidos de cualquier longitud y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Este término se refiere solo a la estructura primaria de la molécula. Por tanto, el término incluye ácido desoxirribonucleico ("DNA") de cadena triple, doble y simple, así como ácido ribonucleico ("RNA") de cadena triple, doble y simple. Los términos polinucleótido y oligonucleótido usados en la presente memoria también abarcan cDNA, que es DNA complementario o de copia producido a partir de una plantilla de RNA, por ejemplo, mediante la acción de la transcriptasa inversa.
Las moléculas de polinucleótidos primarios pueden originarse en forma de DNA bicatenario (dsDNA) (por ejemplo, fragmentos de DNA genómico, productos de amplificación y PCR y similares) o pueden haberse originado en forma monocatenaria, como DNA o RNA, y convertirse en forma de dsDNA. A modo de ejemplo, las moléculas de mRNA se pueden copiar en cDNAs bicatenario usando técnicas estándar bien conocidas en la técnica. La secuencia precisa de polinucleótidos primarios generalmente no es importante para la divulgación presentada en la presente memoria y puede ser conocida o desconocida.
En algunas realizaciones, los polinucleótidos diana primarios son moléculas de RNA. En un aspecto de dichas realizaciones, el RNA aislado de muestras específicas se convierte primero en DNA bicatenario usando técnicas conocidas en la técnica. A continuación, el DNA bicatenario se puede marcar con un índice con una etiqueta específica de la biblioteca. Se pueden generar diferentes preparaciones de dicho DNA bicatenario que comprenden etiquetas de índice específicas de biblioteca, en paralelo, a partir de RNA aislado de diferentes fuentes o muestras. Posteriormente, se pueden mezclar diferentes preparaciones de DNA bicatenario que comprenden diferentes etiquetas de índice específicas de biblioteca, secuenciar en masa y determinar la identidad de cada fragmento secuenciado con respecto a la biblioteca de la que se aisló / derivó en virtud de la presencia de una secuencia de las etiquetas de índice específica de la biblioteca.
En algunas realizaciones, los polinucleótidos diana primarios son moléculas de DNA. Por ejemplo, los polinucleótidos primarios pueden representar el complemento genético completo de un organismo y son moléculas de DNA genómico, tal como moléculas de DNA humano, que incluyen tanto secuencias de intrones como de exones (secuencia codificante), así como secuencias reguladoras no codificantes tal como secuencias promotoras y potenciadoras. Aunque podría contemplarse que también podrían usarse subconjuntos particulares de secuencias de polinucleótidos o DNA genómico, tal como, por ejemplo, cromosomas particulares o una parte de los mismos. En muchas realizaciones, no se conoce la secuencia de los polinucleótidos primarios. Los polinucleótidos diana de DNA pueden tratarse química o enzimáticamente antes o después de un proceso de fragmentación, tal como un proceso de fragmentación aleatoria, y antes, durante o después de la unión de los oligonucleótidos del adaptador.
Preferiblemente, los polinucleótidos diana primarios se fragmentan en longitudes apropiadas adecuadas para la secuenciación. Los polinucleótidos diana se pueden fragmentar de cualquier manera adecuada. Preferiblemente, los polinucleótidos diana se fragmentan aleatoriamente. La fragmentación aleatoria se refiere a la fragmentación de un polinucleótido de forma no ordenada por, por ejemplo, medios enzimáticos, químicos o mecánicos. Dichos métodos de fragmentación son conocidos en la técnica y utilizan métodos estándar (Sambrook and Russell, Molecular Cloning, A Laboratory Manual, third edition). En aras de la claridad, generar fragmentos más pequeños de una pieza más grande de polinucleótido a través de la amplificación por PCR específica de dichos fragmentos más pequeños no es equivalente a fragmentar la pieza más grande de polinucleótido porque la pieza más grande de polinucleótido permanece intacta (es decir, no se fragmenta mediante amplificación por PCR). Además, la fragmentación aleatoria se diseña para producir fragmentos independientemente de la identidad de secuencia o la posición de los nucleótidos que comprenden y / o rodean la ruptura.
En algunas realizaciones, la fragmentación aleatoria es por medios mecánicos tales como nebulización o sonicación para producir fragmentos de aproximadamente 50 pares de bases de longitud a aproximadamente 1500 pares de bases de longitud, tales como 50-700 pares de bases de longitud o 50-500 pares de bases de longitud.
La fragmentación de moléculas de polinucleótidos por medios mecánicos (nebulización, sonicación e Hydroshear, por ejemplo) puede dar como resultado fragmentos con una mezcla heterogénea de extremos romos y salientes 3' y 5'. Los extremos de los fragmentos se pueden reparar usando métodos o kits (tales como el kit Lucigen DNA terminator End Repair Kit) conocidos en la técnica por generar extremos que son óptimos para la inserción, por ejemplo, en sitios romos de vectores de clonación. En algunas realizaciones, los extremos de los fragmentos de la población de ácidos nucleicos tienen extremos romos. Los extremos de los fragmentos pueden tener extremos romos y fosforilarse. El resto de fosfato puede introducirse mediante tratamiento enzimático, por ejemplo, usando polinucleótido quinasa.
En algunas realizaciones, las secuencias de polinucleótidos diana se preparan con nucleótidos sobresalientes únicos mediante, por ejemplo, la actividad de ciertos tipos de DNA polimerasa tal como la Taq polimerasa o la exo-minus Klenow polimerasa que tienen una actividad de transferasa terminal no dependiente de la plantilla que añade un solo desoxinucleótido, por ejemplo, desoxiadenosina (A) en los extremos 3' de, por ejemplo, productos de PCR. Dichas enzimas se pueden utilizar para añadir un solo nucleótido 'A' al extremo 3' terminal de cada cadena de los dúplex polinucleotídicos diana. Por lo tanto, se podría añadir una 'A' al extremo 3' de cada cadena dúplex reparada en el extremo del dúplex de polinucleótidos diana por reacción con Taq o exo-minus Klenow polimerasa, mientras que el constructo del polinucleótido adaptador podría ser un constructo T con sobresaliente T presente en el extremo 3' de cada región dúplex del constructo del adaptador. Esta modificación del extremo también evita la auto-unión de los polinucleótidos diana de manera que existe un sesgo hacia la formación de los polinucleótidos adaptadores-diana combinados unidos.
En algunas realizaciones, la fragmentación se logra mediante el etiquetado como se describe, por ejemplo, en la Publicación de Solicitud de Patente Internacional WO 2016/130704. En dichos métodos, se emplean transposasas para fragmentar un polinucleótido bicatenario y unir una secuencia de cebador universal en una cadena del polinucleótido bicatenario. La molécula resultante puede rellenarse con huecos y someterse a extensión, por ejemplo, mediante amplificación por PCR, utilizando cebadores que comprenden un extremo 3' que hibrida a la secuencia del cebador universal unida y un extremo 5' que contiene otras secuencias de un adaptador o que utiliza cebadores que comprenden un extremo 3' que hibrida a un complemento de la secuencia del cebador universal unida y un extremo 5' que contiene otras secuencias de un adaptador.
Los adaptadores o partes de los adaptadores pueden unirse al polinucleótido diana de cualquier otra manera adecuada. En algunas realizaciones, los adaptadores se introducen en un proceso de múltiples etapas, tal como un proceso de dos etapas, que implica la unión de una parte del adaptador al polinucleótido diana que tiene una secuencia de cebador universal. La segunda etapa comprende la extensión, por ejemplo, mediante amplificación por PCR, utilizando cebadores que comprenden un extremo 3' que hibrida a la secuencia del cebador universal unida (o que hibrida a un complemento de la secuencia del cebador universal) y un extremo 5' que contiene otras secuencias de un adaptador. A modo de ejemplo, dicha extensión se puede realizar como se describe en el documento de Patente U.S. Patent No. 8,053,192. Pueden realizarse extensiones adicionales para proporcionar secuencias adicionales al extremo 5' del polinucleótido resultante previamente extendido.
En algunas realizaciones, todo el adaptador se une al polinucleótido diana fragmentado. El adaptador unido comprende una región bicatenaria que está unida a un polinucleótido diana bicatenario. Preferiblemente, la región bicatenaria es tan corta como sea posible sin pérdida de función. En este contexto, "función" se refiere a la capacidad de la región bicatenaria para formar un dúplex estable en condiciones de reacción estándar. En algunas realizaciones, las condiciones de reacción estándar se refieren a las condiciones de reacción para una reacción de ligación de polinucleótidos catalizada por enzima, que será bien conocida por el lector experto (por ejemplo, incubación a una temperatura en el intervalo de 4°C a 25°C en un tampón de ligación apropiado para la enzima), de modo que las dos cadenas que forman el adaptador permanezcan parcialmente hibridadas durante la unión del adaptador a una molécula diana. Los métodos de ligadura son conocidos en la técnica y pueden utilizar métodos estándar (Sambrook and Russell, Molecular Cloning, A Laboratory Manual, third edition). Dichos métodos utilizan enzimas ligasa tales como DNA ligasa para efectuar o catalizar la unión de los extremos de las dos cadenas de polinucleótidos de, en este caso, el oligonucleótido dúplex del adaptador y los dúplex de polinucleótidos diana, de modo que se forman enlaces covalentes. El oligonucleótido dúplex del adaptador puede contener un resto 5'-fosfato para facilitar la unión a un polinucleótido diana 3'-OH. El polinucleótido diana puede contener un resto 5'-fosfato, ya sea residual del proceso de cizallamiento, o añadido usando una etapa de tratamiento enzimático, y ha sido reparado en el extremo y opcionalmente extendido mediante una base o bases sobresalientes, para dar un 3'-OH adecuado para la unión. En este contexto, unir significa un enlace covalente de las cadenas de polinucleótidos que no estaban previamente unidas covalentemente. En un aspecto particular de la invención, dicha unión tiene lugar mediante la formación de un enlace fosfodiéster entre las dos cadenas de polinucleótidos, pero pueden usarse otros medios de enlace covalente (por ejemplo, enlaces de cadena principal no fosfodiéster). La unión de adaptadores a polinucleótidos diana se describe con más detalle en, por ejemplo, el documento de Patente U.S. Patent No. 8,053,192.
Ya sea que todo el adaptador o una parte del adaptador esté unido al fragmento diana bicatenario, el adaptador o la parte comprende una región bicatenaria y una región que comprende dos cadenas simples no complementarias. La región bicatenaria del adaptador puede tener cualquier número adecuado de pares de bases. Preferiblemente, la región bicatenaria es una región bicatenaria corta, que comprende típicamente 5 o más pares de bases consecutivos, formada por hibridación de dos cadenas polinucleotídicas parcialmente complementarias. Esta "región bicatenaria" del adaptador se refiere a una región en la que las dos cadenas se hibridan y no implica ninguna conformación estructural particular. En algunas realizaciones, la región bicatenaria comprende 20 o menos pares de bases consecutivos, tales como 10 o menos o 5 o menos pares de bases consecutivos.
La estabilidad de la región bicatenaria puede incrementarse y, por tanto, su longitud reducirse potencialmente, mediante la inclusión de nucleótidos no naturales que presentan un apareamiento de bases más fuerte que los pares de bases estándar de Watson-Crick. Preferiblemente, las dos cadenas del adaptador son 100% complementarias en la región bicatenaria.
Cuando el adaptador se une al polinucleótido diana, la región monocatenaria no complementaria puede formar los extremos 5' y 3' del polinucleótido que se va a secuenciar. El término "región monocatenaria no complementaria" se refiere a una región del adaptador donde las secuencias de las dos cadenas de polinucleótidos que forman el adaptador muestran un grado de no complementariedad tal que las dos cadenas no son capaces de hibridarse completamente entre sí bajo condiciones de hibridación estándar para una reacción de PCR.
La región monocatenaria no complementaria es proporcionada por diferentes partes de las mismas dos cadenas de polinucleótidos que forman la región bicatenaria. El límite inferior de la longitud de la parte monocatenaria se determinará típicamente en función de, por ejemplo, proporcionar una secuencia adecuada para la unión de un cebador para la extensión del cebador, PCR y / o secuenciación. Teóricamente, no existe un límite superior en la longitud de la región no emparejada, excepto que, en general, es ventajoso minimizar la longitud total del adaptador, por ejemplo, para facilitar la separación de los adaptadores no unidos de los constructos adaptador-diana después de la etapa o etapas de unión. Por lo tanto, generalmente se prefiere que la región monocatenaria no complementaria del adaptador tenga 50 o menos nucleótidos consecutivos de longitud, tal como 40 o menos, 30 o menos, o 25 o menos nucleótidos consecutivos de longitud.
Después de que los adaptadores o partes de los adaptadores se unen a los polinucleótidos diana, los polinucleótidos resultantes pueden someterse a un proceso de limpieza para mejorar la pureza de los polinucleótidos adaptadordiana-adaptador eliminando al menos una parte de los adaptadores no incorporados. Puede usarse cualquier proceso de limpieza adecuado, tal como electroforesis, cromatografía de exclusión por tamaño o similares. En algunas realizaciones, pueden emplearse esferas paramagnéticas de inmovilización reversible en fase sólida (SPRI) para separar los polinucleótidos adaptador-diana-adaptador de los adaptadores no unidos. Si bien dichos procesos pueden mejorar la pureza de los polinucleótidos adaptador-diana-adaptador resultantes, es probable que queden algunos oligonucleótidos adaptadores no unidos.
Como se usa en la presente memoria, "adjunto" o "unido" se usan indistintamente en el contexto de un adaptador con respecto a una secuencia diana. Como se describió anteriormente, se puede usar cualquier proceso adecuado para unir un adaptador a un polinucleótido diana. Por ejemplo, el adaptador se puede unir a la diana mediante unión con una ligasa; mediante una combinación de la unión de una parte de un adaptador y la adición de partes adicionales o restantes del adaptador mediante extensión, tal como PCR, con cebadores que contienen las partes adicionales o restantes de los adaptadores; mediante la transposición para incorporar una parte de un adaptador y la adición de partes adicionales o restantes del adaptador mediante extensión, tal como PCR, con cebadores que contienen las partes adicionales o restantes de los adaptadores; o similares. Preferiblemente, el oligonucleótido del adaptador unido se une covalentemente al polinucleótido diana.
Amplificación
El polinucleótido resultante de unir el adaptador o parte del adaptador a la diana bicatenaria se somete después a amplificación con cebadores que tienen extremos 5' que se modifican para evitar la digestión por una enzima que tiene actividad exonucleasa 5'.
Los extremos 5' de los cebadores pueden modificarse de cualquier manera adecuada para evitar la digestión por una enzima que tiene actividad exonucleasa 5'. Para los propósitos de la presente divulgación, una modificación que "evite" la digestión por una exonucleasa inhibe la actividad de la exonucleasa en relación con su acción en un extremo no modificado. Preferiblemente, una modificación que evite la digestión de la exonucleasa elimina la capacidad de la exonucleasa para digerir la cadena de polinucleótido. En algunas realizaciones, los extremos 5' de los cebadores comprenden un enlace fosforotioato. Preferiblemente, los enlaces entre el terminal de tres nucleótidos de los extremos 5' de los cebadores comprenden enlaces fosforotioato. Para los fines de la presente divulgación, un extremo de un polinucleótido cuyos enlaces entre el terminal de tres nucleótidos comprenden enlaces fosforotioato puede denominarse como un extremo que comprende tres enlaces fosforotioato. Pueden introducirse enlaces de fosforotioato en un extremo 5' de un polinucleótido de cualquier manera adecuada, como es bien conocido en la técnica. Los oligonucleótidos que comprenden enlaces fosforotioato terminales pueden adquirirse de varios proveedores comerciales que incluyen, por ejemplo, Integrated DNA Technologies y Sigma-Aldrich.
Si el adaptador unido a la diana antes de la amplificación es solo una parte del adaptador, el resto del adaptador puede ser proporcionado por los extremos 5' de los cebadores.
En cualquier caso, un primer oligonucleótido cebador para la amplificación que tiene un extremo 5' modificado se configura para hibridar con una parte del adaptador o la parte del adaptador en la proximidad de un extremo 3' de una cadena del adaptador o parte. Un segundo oligonucleótido cebador para la amplificación que tiene un extremo 5' modificado se configura para hibridar con un complemento de una parte del adaptador o parte de adaptador en la proximidad de un extremo 3' de una cadena del complemento del adaptador o parte. Un complemento del adaptador puede resultar de la extensión del primer cebador usando el adaptador-diana-adaptador como plantilla. Una vez que se forma el complemento, el segundo adaptador puede hibridar al complemento.
El primer y segundo cebadores pueden incubarse con el polinucleótido resultante de unir el adaptador o parte del adaptador a la diana bicatenaria (un polinucleótido "adaptador-diana-adaptador") en condiciones adecuadas para amplificar los polinucleótidos adaptador-diana-adaptador para producir polinucleótidos que tienen una secuencia adaptador amplificado-diana-adaptador amplificado con los extremos 5' modificados. Si los polinucleótidos adaptadorobjetivo-adaptador comprenden todo el adaptador, los polinucleótidos adaptador-diana-adaptador pueden tener la misma secuencia que la secuencia adaptador amplificado-diana-adaptador amplificado. Si los polinucleótidos adaptador-diana-adaptador contienen solo una parte del adaptador, la secuencia adaptador amplificado-dianaadaptador amplificado tendrá nucleótidos adicionales en los extremos monocatenarios de la secuencia de adaptador amplificado debido a la adición del resto de la secuencia de adaptador de los cebadores.
Como se usa en la presente memoria, "condiciones adecuadas para la amplificación" y sus derivados, generalmente se refiere a condiciones adecuadas para amplificar una o más secuencias de polinucleótidos. Dicha amplificación puede ser lineal o exponencial. En algunas realizaciones, las condiciones de amplificación pueden incluir condiciones isotérmicas o, alternativamente, pueden incluir condiciones de termociclaje, o una combinación de condiciones isotérmicas y de termociclaje. En algunas realizaciones, las condiciones adecuadas para amplificar una o más secuencias de polinucleótidos incluyen condiciones de la reacción en cadena de la polimerasa (PCR). Normalmente, las condiciones de amplificación se refieren a una mezcla de reacción que es suficiente para amplificar polinucleótidos tales como una o más secuencias diana, o para amplificar una secuencia diana amplificada unida a uno o más adaptadores, por ejemplo, una secuencia diana amplificada unida a adaptador. Generalmente, las condiciones de amplificación incluyen un catalizador para la amplificación o para la síntesis de polinucleótidos, por ejemplo, una polimerasa; un cebador que posee algún grado de complementariedad con el ácido nucleico a amplificar; y nucleótidos, tales como desoxirribonucleótidos trifosfatos (dNTPs) para promover la extensión del cebador una vez que se hibrida al ácido nucleico. Las condiciones de amplificación pueden requerir hibridación o fortalecimiento de un cebador a un ácido nucleico, extensión del cebador y una etapa de desnaturalización en la que el cebador extendido se separa de la secuencia de polinucleótido que experimenta amplificación. Normalmente, pero no necesariamente, las condiciones de amplificación pueden incluir termociclaje; en algunas realizaciones, las condiciones de amplificación incluyen una pluralidad de ciclos en los que se repiten las etapas de hibridación, extensión y separación. Normalmente, las condiciones de amplificación incluyen cationes tales como Mg++ o Mn++ y también pueden incluir varios modificadores de fuerza iónica.
Como se usa en la presente memoria, el término "reacción en cadena de la polimerasa" ("PCR") se refiere al método de K. B. Mullis de los documentos de Patente U.S. Pat. Nos. 4,683,195 y 4,683,202, que describen un método para aumentar la concentración de un segmento de un polinucleótido de interés en una mezcla de DNA genómico sin clonación ni purificación. Este proceso de amplificación del polinucleótido de interés consiste en introducir un gran exceso de dos cebadores de oligonucleótidos en la mezcla de DNA que contiene el polinucleótido de interés deseado, seguido de una serie de ciclos térmicos en presencia de una DNA polimerasa. Los dos cebadores son complementarios a sus respectivas cadenas del polinucleótido bicatenario de interés. La mezcla se desnaturaliza primero a una temperatura más alta y después los cebadores se hibridan a las secuencias complementarias dentro de la molécula de polinucleótido de interés. Después de la hibridación, los cebadores se extienden con una polimerasa para formar un nuevo par de cadenas complementarias. Las etapas de desnaturalización, hibridación de cebadores y extensión de polimerasa pueden repetirse muchas veces (denominado como termociclaje) para obtener una alta concentración de un segmento amplificado del polinucleótido de interés deseado. La longitud del segmento amplificado del polinucleótido de interés deseado (amplicón) se determina por las posiciones relativas de los cebadores entre sí y, por lo tanto, esta longitud es un parámetro controlable. En virtud de la repetición del proceso, el método se denomina "reacción en cadena de la polimerasa" (en adelante, "PCR"). Debido a que los segmentos amplificados deseados del polinucleótido de interés se convierten en las secuencias de ácido nucleico predominantes (en términos de concentración) en la mezcla, se dice que están "amplificados por PCR". En una modificación del método discutido anteriormente, los polinucleótidos pueden amplificarse por PCR usando una pluralidad de pares de cebadores diferentes, en algunos casos, uno o más pares de cebadores por polinucleótido de interés, formando así una reacción de PCR múltiple.
La amplificación de los polinucleótidos adaptador-diana-adaptador con los cebadores modificados en 5' da como resultado un polinucleótido que tiene secuencias de adaptador amplificado-diana-adaptador amplificado con los extremos 5' modificados.
El adaptador amplificado resultante incluye una secuencia de la etiqueta de índice específica de la biblioteca. Por consiguiente, la etiqueta de índice no está formada en sí misma por parte del polinucleótido diana, sino que se convierte en parte de la plantilla para la amplificación sobre una superficie sólida para la secuenciación.
Preferiblemente, la secuencia de la etiqueta de índice tiene 20 nucleótidos o menos de longitud. Por ejemplo, la secuencia de la etiqueta de índice puede tener una longitud de 1 a 10 nucleótidos o de 4 a 6 nucleótidos. Una etiqueta de índice de cuatro nucleótidos ofrece la posibilidad de multiplexar 256 muestras en la misma matriz, una etiqueta de índice de seis bases permite procesar 4096 muestras en la misma matriz.
Los adaptadores amplificados pueden contener más de una etiqueta de índice de modo que se puedan incrementar las posibilidades de multiplexación.
La secuencia de la etiqueta de índice específica de la biblioteca puede estar localizada en una región monocatenaria, bicatenaria, o abarcar las regiones monocatenarias y bicatenarias del adaptador. Preferiblemente, la secuencia de la etiqueta de índice está en una región monocatenaria del adaptador.
La secuencia de la etiqueta de índice específica de la biblioteca puede incluirse en uno o ambos de los cebadores modificados en 5' o puede incluirse en una parte del adaptador que se une al fragmento de plantilla. Si la secuencia de la etiqueta de índice específica de la biblioteca no está incluida en los cebadores, pero está incluida en la parte del adaptador que se une al fragmento de plantilla (y los cebadores añaden la parte restante del adaptador), polinucleótidos adaptador-diana-adaptador de diferentes bibliotecas pueden agruparse para realizar la amplificación a los polinucleótidos adaptador amplificado-diana-adaptador amplificado. Si los cebadores incluyen la secuencia de la etiqueta de índice específica de la biblioteca, entonces cada biblioteca debe amplificarse por separado antes de la agrupación.
En cualquier caso, los adaptadores amplificados pueden incluir cualquier otra secuencia adecuada además de la secuencia de la etiqueta de índice. Por ejemplo, los adaptadores amplificados pueden comprender secuencias de cebadores de extensión universal, que normalmente se encuentran localizados en el extremo 5' o 3' del adaptador amplificado y el polinucleótido plantilla resultante para la secuenciación. Las secuencias del cebador de extensión universal pueden hibridar a cebadores complementarios unidos a una superficie de un sustrato sólido. Los cebadores complementarios comprenden un extremo 3' libre a partir del cual una polimerasa u otra enzima adecuada puede añadir nucleótidos para extender la secuencia usando el polinucleótido de biblioteca hibridado como plantilla, dando como resultado una cadena inversa del polinucleótido de biblioteca acoplada a la superficie sólida. Dicha extensión puede ser parte de una ejecución de secuenciación o amplificación de grupos.
En algunas realizaciones, los adaptadores amplificados comprenden una o más secuencias de cebadores de secuenciación universal. Las secuencias de cebadores de secuenciación universal pueden unirse a cebadores de secuenciación para permitir la secuenciación de una secuencia de la etiqueta de índice, una secuencia diana o una secuencia de la etiqueta índice y una secuencia diana.
La secuencia de nucleótidos precisa de los adaptadores amplificados generalmente no es material para la invención y puede ser seleccionada por el usuario de manera que los elementos de secuencia deseados se incluyan finalmente en las secuencias comunes de la biblioteca de plantillas derivadas de los adaptadores amplificados para, por ejemplo, proporcionar sitios de unión para conjuntos particulares de cebadores de extensión universales y / o cebadores de secuenciación.
Se entenderá que una "secuencia adaptador-diana-adaptador" o sus equivalentes se refiere a la orientación de los adaptadores en relación uno con otro y a la diana y no significa necesariamente que la secuencia no pueda incluir secuencias adicionales, tales como secuencias enlazadoras, por ejemplo.
Se pueden preparar otras bibliotecas de una manera similar, incluyendo cada una al menos una secuencia de la etiqueta de índice específica de biblioteca o combinaciones de secuencias de la etiqueta de índice diferentes de una secuencia de la etiqueta de índice o combinación de secuencias de la etiqueta de índice de las otras bibliotecas.
Se puede realizar un proceso de limpieza, tal como el descrito anteriormente, en los polinucleótidos plantilla resultantes que tienen las secuencias adaptador amplificado-diana-adaptador amplificado.
Los polinucleótidos adaptador-diana-adaptador resultantes, ya sea que se hayan sometido primero a limpieza o no, junto con cualquier oligonucleótido de cebador no incorporado o especies de polinucleótidos restantes, se someten a bloqueo en 3'.
Bloqueo en 3’
El bloqueo en 3’ se puede realizar en cada biblioteca por separado o en bibliotecas agrupadas. Preferiblemente, el bloqueo en 3' se realiza en bibliotecas agrupadas.
Bloqueo en 3’ significa que los polinucleótidos se modifican para evitar la incorporación de nucleótidos en el extremo 3' para extender el polinucleótido desde el extremo 3' o para evitar la digestión por una enzima que tiene actividad exonucleasa 3'. Preferiblemente, los extremos 3' están bloqueados para evitar la incorporación de nucleótidos en el extremo 3' para extender el polinucleótido desde el extremo 3'. Más preferiblemente, los extremos 3' se bloquean para evitar la incorporación de nucleótidos en el extremo 3' para extender el polinucleótido desde el extremo 3' y para evitar la digestión por una enzima que tiene actividad exonucleasa 3'.
En algunas realizaciones, el grupo de bloqueo 3'-OH puede ser extraíble, de modo que el átomo de carbono 3' se haya unido a un grupo de estructura -O-Z, en donde Z es uno cualquiera de -C(R')2-O-R", -C(R')2-N(R")2 , -C(R')2-N(H)R", -C(R')2-S-R" y -C(R')2-F, en donde cada R" es o es parte de un grupo protector extraíble; cada R' es independientemente un átomo de hidrógeno, un grupo alquilo, alquilo sustituido, arilalquilo, alquenilo, alquinilo, arilo, heteroarilo, heterocíclico, acilo, ciano, alcoxi, ariloxi, heteroariloxi o amido, o una etiqueta detectable unida a través de un grupo de enlace; o (R')2 representa un grupo alquilideno de fórmula =C(R’’’)2 en donde cada R'" puede ser igual o diferente y se selecciona del grupo que comprende átomos de hidrógeno y halógeno y grupos alquilo; y en donde dicha molécula puede reaccionar para producir un intermedio en el que cada R" se intercambia por H o, donde Z es -C(R')2-F, el F se intercambia por OH, SH o NH2 , preferiblemente OH, que se disocia en condiciones acuosas para producir una molécula con un 3'OH libre; con la condición de que cuando Z sea -C(R')2-S-R ", ambos grupos R' no sean H. Donde el grupo de bloqueo es uno cualquiera de -C(R')2-O-R", -C(R')2-N(R")2, -C(R')2-N(H)R", -C(R')2-S-R" y -C(R')2-F, es decir, de fórmula Z, cada R' puede ser independientemente H o un alquilo. Preferiblemente, Z es de fórmula -C(R')2-O-R", -C(R')2-N(R")2 , -C(R')2-N(H) R" y -C(R')2-SR". Particularmente preferible, Z es de la fórmula -C(R')2-O-R", -C(R')2-N(R")2 y -C(R')2-SR". R" puede ser un grupo bencilo o un grupo bencilo sustituido. Un ejemplo de grupos de estructura -O-Z en donde Z es-C(R')2-N(R")2 son aquellos en los que -N(R")2 es azido (-N3). Un ejemplo de este tipo es azidometilo en el que cada R' es H. Alternativamente, R' en los grupos Z de fórmula -C(R')2-N3 y otros grupos Z pueden ser cualquiera de los otros grupos discutidos en la presente memoria. Ejemplos de grupos R' típicos incluyen alquilos de C1-6, particularmente metilo y etilo. Otros ejemplos no limitantes de grupos de bloqueo de 3' adecuados se proporcionan en Greene et al., "Protective Groupos in Organic Synthesis", John Wiley & Sons, Nueva York (1991), los documentos de Patente U.S.Pat.Nos.
5,990,300, 5,872,244, 6,232,465, 6,214,987, 5,808,045, 5,763,594, 7,057,026, 7,566,537, 7,785,796, 8,148,064, 8,3 94,586, 9,388,463, 9,410,200, 7,427,673, 7,772,384, 8,158,346, 9,121,062, 7,541,444, 7,771,973, 8,071,739, 8,597, 881,9,121,060, 9,388,464, 8,399,188, 8,808,988, 9,051,612, 9,469,873, y las publicaciones de Patente U.S. Pub. Nos. 2016/0002721 y 2016/0060692.
El bloqueo de 3’ se puede realizar de cualquier manera adecuada. Por ejemplo, un resto de bloqueo puede unirse covalentemente a un grupo hidroxilo 3' en el extremo 3' para evitar la extensión desde el extremo 3'. Preferiblemente, el grupo de bloqueo permanece unido covalentemente durante los procesos posteriores asociados con la inmovilización de polinucleótidos adaptador-diana-adaptador a una superficie sólida y la secuenciación.
En algunas realizaciones, se incorpora un didesoxinucleótido (ddNTP) en el extremo 3' de un polinucleótido para bloquear el extremo 3'. El ddNTP puede incorporarse de cualquier manera adecuada. En algunas realizaciones, se incorpora un ddNTP mediante una desoxinucleotidil transferasa terminal (TdT). Las TdTs pueden incorporar nucleótidos en un extremo 3' del DNA monocatenario o bicatenario sin una plantilla. En algunas realizaciones, se incorpora un ddNTP en un extremo 3' mediante una TdT en presencia de una DNA polimerasa, tal como, por ejemplo, Pol19, Pol812 o Pol963 polimerasa. Se proporcionan ejemplos no limitantes de otras polimerasas adecuadas en los documentos de Patente U.S. Pat. Nos. 8,460,910, 8,852,910, 8,623,628, 9,273,352, 9,447,389, y las publicaciones de Patente U.S. Pub. Nos. 2015/0376582, 2016/0032377, 2016/0090579, 2016/0115461.
En algunas realizaciones, se añade un trifosfato de didesoxiuridina marcado con digoxigenina al extremo 3' usando transferasa terminal para bloquear el extremo 3'. Los kits para añadir trifosfato de didesoxiuridina marcado con digoxigenina a un extremo 3' de un polinucleótido están disponibles, por ejemplo, en Sigma-Aldrich.
También se puede emplear cualquier otro proceso adecuado para modificar los extremos 3' de los polinucleótidos.
Durante o después del bloqueo de 3' pueden resultar varios compuestos y composiciones. Por ejemplo, puede resultar un polinucleótido que tiene una secuencia de nucleótidos de primer adaptador-diana-segundo adaptador en la que los extremos 5' de los polinucleótidos están bloqueados y los extremos 3' del polinucleótido están bloqueados. Pueden resultar composiciones o bibliotecas que comprenden los polinucleótidos 5' modificados y 3' bloqueados. Pueden resultar bibliotecas y composiciones agrupadas que comprenden bibliotecas agrupadas de dichos polinucleótidos.
A modo de ejemplo adicional, puede resultar una composición que comprende dichos polinucleótidos y una enzima y reactivo para bloquear los extremos 3' del polinucleótido. De manera similar, puede resultar una composición que comprende una biblioteca de polinucleótidos y la enzima y el reactivo. Pueden resultar composiciones que comprenden bibliotecas agrupadas de dichos polinucleótidos y la enzima y el reactivo. En algunas realizaciones, las composiciones comprenden un ddNTP. Las composiciones pueden comprender además una TdT. Las composiciones pueden comprender además una DNA polimerasa, tal como, por ejemplo, Pol19, Pol812 o Pol963 polimerasa.
Se puede realizar un proceso de limpieza, como el descrito anteriormente, después del bloqueo.
Tratamiento con exonucleasa
Después (o durante) el bloqueo de las soluciones o composiciones resultantes que comprenden los polinucleótidos resultantes, ya sea que se sometan o no primero a limpieza, opcionalmente, se pueden someter a tratamiento con una exonucleasa. Preferiblemente, el tratamiento con exonucleasa tiene actividad exonucleasa 3' para degradar cualquier polinucleótido que quede que no esté bloqueado en 3'. Debido a que los extremos 5' son resistentes a la exonucleasa, la exonucleasa puede tener tanto actividad exonucleasa 5' como actividad exonucleasa 3'.
Una exonucleasa que tiene "actividad exonucleasa 5'" es una exonucleasa que digiere el DNA en una dirección 5' a 3'. Una exonucleasa que tiene "actividad exonucleasa 3'" es una exonucleasa que digiere el DNA en una dirección 3' a 5'.
Un ejemplo de una exonucleasa adecuada que tiene tanto actividad exonucleasa 5' como 3' es la exonucleasa V, que es un complejo RecBCD de E. coIí y está disponible, por ejemplo, en New England Biolabs. La exonucleasa V también tiene actividad para el DNA bicatenario sin cortes.
El tratamiento con exonucleasa se puede realizar en cada biblioteca por separado o en bibliotecas agrupadas. Después del tratamiento con exonucleasa, se puede realizar una etapa de limpieza, tal como la descrita anteriormente, antes de inmovilizar los polinucleótidos en una superficie sólida para la secuenciación.
Si las bibliotecas no se han agrupado, pueden agruparse antes de inmovilizarlas sobre una superficie de secuenciación.
Preparación de muestras inmovilizadas para secuenciación
Las preparaciones agrupadas de bibliotecas modificadas en 5' y bloqueadas en 3' pueden inmovilizarse después sobre una superficie sólida como preparación para la secuenciación. La secuenciación se puede realizar como una matriz de moléculas individuales o se puede amplificar antes de la secuenciación. La amplificación se puede llevar a cabo usando uno o más cebadores inmovilizados. El o los cebadores inmovilizados pueden ser un pasto sobre una superficie plana, agrupaciones sobre una superficie plana, en pocillos de una estructura de múltiples pocillos, en un grupo de esferas o similares. El conjunto de esferas se puede aislar en una emulsión con una sola esfera en cada "compartimento" de la emulsión. A una concentración de sólo una plantilla por "compartimento", sólo se amplifica una única plantilla en cada esfera.
El término "amplificación en fase sólida" como se usa en la presente memoria se refiere a cualquier reacción de amplificación de polinucleótidos llevada a cabo sobre o en asociación con un soporte sólido de manera que todos o una parte de los productos amplificados se inmovilizan sobre el soporte sólido a medida que se forman. En particular, el término abarca la reacción en cadena de la polimerasa en fase sólida (PCR en fase sólida) y la amplificación isotérmica en fase sólida, que son reacciones análogas a la amplificación en fase de solución estándar, excepto que uno o ambos cebadores de amplificación directa e inversa están inmovilizados en el soporte sólido. La PCR en fase sólida cubre sistemas tales como las emulsiones, en las que un cebador está anclado a una esfera y el otro está en solución libre, y la formación de colonias en matrices de gel en fase sólida en las que un cebador está anclado a la superficie y el otro en solución libre.
Aunque la divulgación abarca métodos de amplificación en "fase sólida" en los que solo se inmoviliza un cebador de amplificación (el otro cebador normalmente está presente en solución libre), se prefiere que el soporte sólido se proporcione con los cebadores tanto directo como inverso inmovilizados. En la práctica, habrá una "pluralidad" de cebadores directos idénticos y / o una "pluralidad" de cebadores inversos idénticos inmovilizados sobre el soporte sólido, ya que el proceso de amplificación requiere un exceso de cebadores para mantener la amplificación. Las referencias en la presente memoria a cebadores directos e inversos deben interpretarse en consecuencia como que abarcan una "pluralidad" de dichos cebadores a menos que el contexto indique lo contrario.
Como apreciará el lector experto, cualquier reacción de amplificación dada requiere al menos un tipo de cebador directo y al menos un tipo de cebador inverso específico para la plantilla que se va a amplificar. Sin embargo, en ciertas realizaciones, los cebadores directo e inverso pueden comprender partes específicas de la plantilla de secuencia idéntica, y pueden tener una secuencia y estructura de nucleótidos completamente idéntica (incluyendo cualquier modificación que no sea de nucleótido). En otras palabras, es posible llevar a cabo la amplificación en fase sólida usando solo un tipo de cebador, y dichos métodos de cebador único están incluidos dentro del alcance de la invención. Otras realizaciones pueden usar cebadores directos e inversos que contienen secuencias específicas de la plantilla idénticas pero que difieren en algunas otras características estructurales. Por ejemplo, un tipo de cebador puede contener una modificación no nucleotídica que no está presente en el otro.
A lo largo de esta divulgación, los términos "P5" y "P7" se utilizan cuando se hace referencia a adaptadores y / o cebadores de amplificación. Se entenderá que se puede usar cualquier cebador de amplificación adecuado en los métodos presentados en la presente memoria, y que el uso de P5 y P7 son realizaciones ejemplares únicamente. Los usos de cebadores de amplificación tales como P5 y P7 en celdas de flujo se conocen en la técnica, como se ejemplifica en las descripciones de los documentos de Patente WO 2007/010251, WO 2006/064199, WO 2005/065814, WO 2015/106941, WO 1998/044151, y WO 2000/018957. Por ejemplo, cualquier cebador de amplificación directa adecuado, ya sea inmovilizado o en solución, puede ser útil en los métodos presentados en la presente memoria para la hibridación a una secuencia complementaria y la amplificación de una secuencia. De manera similar, cualquier cebador de amplificación inversa adecuado, ya sea inmovilizado o en solución, puede ser útil en los métodos presentados en la presente memoria para la hibridación a una secuencia complementaria y la amplificación de una secuencia. Un experto en la técnica comprenderá cómo diseñar y usar secuencias de cebadores que sean adecuadas para la captura y amplificación de ácidos nucleicos como se presenta en la presente memoria.
Los cebadores para la amplificación en fase sólida se inmovilizan preferiblemente mediante unión covalente de un solo punto al soporte sólido en o cerca del extremo 5' del cebador, dejando la parte específica de la plantilla del cebador libre para hibridar a su plantilla afín y el grupo hidroxilo 3' libre para la extensión del cebador. Cualquier medio de unión covalente adecuado conocido en la técnica puede usarse para este propósito. La química de unión elegida dependerá de la naturaleza del soporte sólido y de cualquier derivatización o funcionalización que se le aplique. El cebador en sí mismo puede incluir un resto, que puede ser una modificación química no nucleotídica, para facilitar la unión. En algunas realizaciones, el cebador incluye un nucleófilo que contiene azufre, tal como fosforotioato o tiofosfato, en el extremo 5'. La superficie del soporte sólido puede incluir o modificarse para incluir un resto al que se puede unir el nucleófilo que contiene azufre. Por ejemplo, un nucleófilo que contiene azufre puede unirse a un grupo bromoacetamida. En algunas realizaciones, un hidrogel de poliacrilamida con soporte sólido comprende un grupo bromoacetamida para unirse a un nucleófilo que contiene azufre. Un medio más particular de unir cebadores y plantillas a un soporte sólido es mediante la unión de fosforotioato 5' a un hidrogel compuesto de acrilamida polimerizada y N-(5-bromoacetamidilpentil) acrilamida (BRAPA), como se describe completamente en el documento de Patente WO 2005/065814.
Los soportes sólidos compuestos por un sustrato o una matriz inerte (por ejemplo, portaobjetos de vidrio, esferas de polímero, etc.) se pueden "funcionalizar", por ejemplo, mediante la aplicación de una capa o recubrimiento de un material intermedio que comprende grupos reactivos que permiten la unión covalente a biomoléculas, tales como polinucleótidos. Los ejemplos de tales soportes incluyen, pero no se limitan a, hidrogeles de poliacrilamida soportados sobre un sustrato inerte tal como vidrio. En dichas realizaciones, las biomoléculas (por ejemplo, polinucleótidos) se pueden unir covalentemente directamente al material intermedio (por ejemplo, el hidrogel), pero el material intermedio en sí mismo puede estar unido de forma no covalente al sustrato o matriz (por ejemplo, el sustrato de vidrio). El término "unión covalente a un soporte sólido" debe interpretarse en consecuencia como que abarca este tipo de disposición.
Las muestras de la biblioteca agrupadas se pueden amplificar sobre una superficie sólida que contiene un cebador de amplificación directa e inversa. En algunas realizaciones, las bibliotecas agrupadas de polinucleótidos se utilizan para preparar matrices agrupadas de colonias de ácido polinucleico, análogas a las descritas en las publicaciones de Patente U.S. Pat. Pub. No. 2005/0100900, U.S. Pat. No. 7,115,400, WO 00/18957 y WO 98/44151, mediante amplificación en fase sólida y más particularmente amplificación isotérmica en fase sólida. Los términos "grupo" y "colonia" se usan indistintamente en la presente memoria para referirse a un sitio discreto en un soporte sólido compuesto por una pluralidad de cadenas de ácido nucleico inmovilizadas idénticas y una pluralidad de cadenas de ácido nucleico complementarias inmovilizadas idénticas. El término "matriz agrupada" se refiere a una matriz formada a partir de dichas agrupaciones o colonias. En este contexto, el término "matriz" no debe entenderse como que requiera una disposición ordenada de grupos.
El término fase sólida, o superficie, se usa para significar una matriz plana en la que los cebadores se unen a una superficie plana, por ejemplo, portaobjetos de microscopio de vidrio, sílice o plástico o dispositivos de celda de flujo similares; esferas, en las que uno o dos cebadores se unen a las esferas y las esferas se amplifican; una matriz de esferas en una superficie después de que las esferas se hayan amplificado; o similares.
Los términos "superficie sólida", "soporte sólido" y otros equivalentes gramaticales en la presente memoria se refieren a cualquier material que sea apropiado o pueda modificarse para que sea apropiado para la unión de los polinucleótidos plantilla. Como apreciarán los expertos en la técnica, el número de posibles sustratos es muy grande. Los posibles sustratos incluyen, pero no se limitan a, vidrio y vidrio modificado o funcionalizado, plásticos (incluyendo acrílicos, poliestireno y copolímeros de estireno y otros materiales, polipropileno, polietileno, polibutileno, poliuretanos, Teflon®, etc.), polisacáridos, nailon o nitrocelulosa, cerámica, resinas, sílice o materiales basados en sílice que incluyen silicio y silicio modificado, carbono, metales, vidrios inorgánicos, plásticos, haces de fibras ópticas y una variedad de otros polímeros. Los soportes sólidos y las superficies sólidas particularmente útiles para algunas realizaciones se encuentran dentro de un aparato de celda de flujo. Las celdas de flujo ejemplares se exponen con más detalle a continuación.
En algunas realizaciones, el soporte sólido comprende una superficie modelada. Una "superficie modelada" se refiere a una disposición de diferentes regiones en o sobre una capa expuesta de un soporte sólido. Por ejemplo, una o más de las regiones pueden ser características en las que están presentes uno o más cebadores de amplificación. Las características pueden estar separadas por regiones intersticiales donde los cebadores de amplificación no están presentes. En algunas realizaciones, el patrón puede ser un formato x-y de características que están en filas y columnas. En algunas realizaciones, el patrón puede ser una disposición repetida de características y / o regiones intersticiales. En algunas realizaciones, el patrón puede ser una disposición aleatoria de características y / o regiones intersticiales. Superficies modeladas ejemplares que pueden usarse en los métodos y composiciones establecidos en la presente memoria se describen en los documentos de Patente U.S. Pat. Nos. 8,778,848, 8,778,849, 9,079,148, y U.S. Pub. No. 2014/0243224.
En algunas realizaciones, el soporte sólido comprende una matriz de pocillos o depresiones en una superficie. Esto se puede fabricar como se conoce generalmente en la técnica usando una variedad de técnicas, que incluyen, pero no se limitan a, fotolitografía, técnicas de estampación, técnicas de moldeo y técnicas de micrograbado. Como apreciarán los expertos en la técnica, la técnica utilizada dependerá de la composición y forma del sustrato de la matriz.
Las características en una superficie moldeada pueden ser pocillos en una matriz de pocillos (por ejemplo, micropocillos o nanopocillos) sobre vidrio, silicio, plástico u otros soportes sólidos adecuados con un gel modelado, unido covalentemente, tal como poli(N-(5-azidoacetamidilpentil) acrilamida-co-acrilamida) (PAZAM, véase, por ejemplo, las publicaciónes de Patente U.S. Pub. No. 2013/184796, WO 2016/066586, y WO 2015/002813). El proceso crea almohadillas de gel que se utilizan para la secuenciación que pueden ser estables durante las ejecuciones de secuenciación con una gran cantidad de ciclos. La unión covalente del polímero a los pocillos es útil para mantener el gel en las características estructuradas a lo largo de la vida útil del sustrato estructurado durante una variedad de usos. Sin embargo, en muchas realizaciones, no es necesario que el gel esté unido covalentemente a los pocillos. Por ejemplo, en algunas condiciones de acrilamida sin silano (SFA, véase, por ejemplo, el documento de Patente U.S. Pat. No. 8,563,477) que no está unido covalentemente a ninguna parte del sustrato estructurado, puede usarse como material de gel.
En realizaciones particulares, se puede preparar un sustrato estructurado modelando un material de soporte sólido con pocillos (por ejemplo, micropocillos o nanopozos), recubriendo el soporte modelado con un material de gel (por ejemplo, PAZAM, SFA o variantes modificadas químicamente de los mismos, tal como la versión azidolizada de SFA (azido-SFA)) y puliendo el soporte recubierto de gel, por ejemplo mediante pulido químico o mecánico, reteniendo así el gel en los pocillos pero eliminando o inactivando sustancialmente todo el gel de las regiones intersticiales en la superficie del sustrato estructurado entre los pocillos. Los ácidos nucleicos de cebadores pueden unirse al material de gel. Una solución de ácidos nucleicos diana (por ejemplo, un genoma humano fragmentado) puede entonces ponerse en contacto con el sustrato pulido de manera que los ácidos nucleicos diana individuales sembrarán pocillos individuales mediante interacciones con cebadores unidos al material de gel; sin embargo, los ácidos nucleicos diana no ocuparán las regiones intersticiales debido a la ausencia o inactividad del material de gel. La amplificación de los ácidos nucleicos diana se limitará a los pocillos ya que la ausencia o inactividad de gel en las regiones intersticiales evita la migración hacia el exterior de la colonia de ácidos nucleicos en crecimiento. El proceso se puede fabricar convenientemente, es escalable y utiliza métodos convencionales de micro o nanofabricación.
El término "celda de flujo", como se usa en la presente memoria, se refiere a una cámara que comprende una superficie sólida a través de la cual pueden fluir uno o más reactivos fluidos. Ejemplos de celdas de flujo y sistemas fluídicos y plataformas de detección relacionadas que pueden usarse fácilmente en los métodos de la presente divulgación se describen, por ejemplo, en Bentley et al., Nature 456: 53-59 (2008), los documentos de Patente WO 04/018497; US 7,057,026; WO 91/06678; WO 07/123744; US 7,329,492; US 7,211,414; US 7,315,019; US 7,405,281, y US 2008/0108082.
En algunas realizaciones, el soporte sólido o su superficie no es plana, tal como la superficie interior o exterior de un tubo o recipiente. En algunas realizaciones, el soporte sólido comprende microesferas o esferas. Por "microesferas" o "esferas" o "partículas" o equivalentes gramaticales en la presente memoria se entiende pequeñas partículas discretas. Las composiciones de las esferas adecuadas incluyen, pero no se limitan a, plásticos, cerámica, vidrio, poliestireno, metilestireno, polímeros acrílicos, materiales paramagnéticos, thoria sol, grafito de carbono, dióxido de titanio, látex o dextranos reticulados tales como sefarosa, celulosa, nailon, micelas reticuladas y Teflon®, así como cualquier otro material descrito en la presente memoria para soportes sólidos se pueden usar. La "Microsphere Detection Guide" de Bangs Laboratories, Fishers Ind. es una guía útil. En determinadas realizaciones, las microesferas son microesferas o esferas magnéticas.
Las esferas no necesitan ser esféricas; se pueden utilizar partículas irregulares. Alternativa o adicionalmente, las esferas pueden ser porosas. Los tamaños de las esferas varían de nanómetros, es decir, 100 nm, a milímetros, es decir, 1 mm, prefiriéndose esferas de aproximadamente 0,2 micrones a aproximadamente 200 micrones, y siendo particularmente preferidos de aproximadamente 0,5 a aproximadamente 5 micrones, aunque en algunas realizaciones se pueden utilizar esferas más pequeñas o más grandes.
Las matrices agrupadas se pueden preparar utilizando tanto un proceso de termociclaje, como se describe en el documento de Patente WO/9844151, como un proceso mediante el cual la temperatura se mantiene constante, y los ciclos de extensión y desnaturalización se realizan utilizando cambios de reactivos. Dichos métodos de amplificación isotérmica se describen en las solicitudes de Patentes Nos. WO/0246456 y US 2008/0009420. Debido a las temperaturas más bajas requeridas en el proceso isotérmico, este es particularmente preferido.
Se apreciará que cualquiera de las metodologías de amplificación descritas en la presente memoria o generalmente conocidas en la técnica se puede utilizar con cebadores universales o específicos de la diana para amplificar fragmentos de DNA inmovilizados. Los métodos adecuados para la amplificación incluyen, pero no se limitan a, la reacción en cadena de la polimerasa (PCR), la amplificación por desplazamiento de cadena (SDA), la amplificación mediada por transcripción (TMA) y la amplificación basada en la secuencia de ácidos nucleicos (NASBA), como se describe en el documento de Patente U.S. Patent No. 8,003,354. Los métodos de amplificación anteriores se pueden emplear para amplificar uno o más ácidos nucleicos de interés. Por ejemplo, se puede utilizar PCR, que incluye PCR múltiple, SDA, TMA, NASBA y similares para amplificar fragmentos de DNA inmovilizados. En algunas realizaciones, los cebadores dirigidos específicamente al polinucleótido de interés se incluyen en la reacción de amplificación.
Otros métodos adecuados para la amplificación de polinucleótidos pueden incluir las tecnologías de extensión y ligación de oligonucleótidos, amplificación por círculo rodante (RCA) (Lizardi et al., Nat. Genet. 19: 225-232 (1998)) y ensayo de ligación de oligonucleótidos (OLA) (Véase, en general, los documentos de Patente U.S. Pat. Nos.
7,582,420, 5,185,243, 5,679,524 y 5,573,907; EP 0 320 308 B1; EP 0 336 731 B1; EP 0 439 182 B1; WO 90/01069; WO 89/12696; y Wo 89/09835). Se apreciará que estas metodologías de amplificación pueden diseñarse para amplificar fragmentos de DNA inmovilizados. Por ejemplo, en algunas realizaciones, el método de amplificación puede incluir reacciones de amplificación con sonda de ligación o ensayo de ligación de oligonucleótidos (OLA) que contienen cebadores dirigidos específicamente al ácido nucleico de interés. En algunas realizaciones, el método de amplificación puede incluir una reacción de ligación-extensión de cebadores que contiene cebadores dirigidos específicamente al ácido nucleico de interés. Como un ejemplo no limitante de extensión y ligación de cebadores, los cebadores que pueden diseñarse específicamente para amplificar un ácido nucleico de interés, la amplificación puede incluir cebadores usados para el ensayo GoldenGate (Illumina, Inc., San Diego, CA) como se ejemplifica por los documentos de Patente U.S. Pat. No. 7,582,420 y 7,611,869.
Los métodos de amplificación isotérmica ejemplares que pueden usarse en un método de la presente divulgación incluyen, pero no se limitan a, Amplificación de desplazamiento múltiple (MDA) como se ejemplifica, por ejemplo, en Dean et al., Proc. Natl. Acad. Sci. USA 99: 5261-66 (2002) o amplificación de ácido nucleico por desplazamiento de cadena isotérmica ejemplificada en, por ejemplo, el documento de Patente U.S. Pat. No. 6,214,587. Otros métodos no basados en PCR que pueden usarse en la presente divulgación incluyen, por ejemplo, amplificación por desplazamiento de cadena (SDA) que se describe, por ejemplo, en Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995; los documentos de Patente U.S. Pat. Nos. 5,455,166, y 5,130,238, y Walker et al., Nucl. Acids Res. 20: 1691-96 (1992)) o amplificación por desplazamiento de cadena hiper-ramificada que se describe, por ejemplo, en Lage et al., Genome Res. 13: 294-307 (2003)). Pueden usarse métodos de amplificación isotérmica con la polimerasa Phi 29 de desplazamiento de cadena o el fragmento grande de la Bst DNA polimerasa, 5' -> 3' exo- para la amplificación de cebadores aleatoria de DNA genómico. El uso de estas polimerasas aprovecha su alta procesividad y actividad de desplazamiento de cadena. La alta procesividad permite que las polimerasas produzcan fragmentos de 10 a 20 kb de longitud. Como se ha expuesto anteriormente, se pueden producir fragmentos más pequeños en condiciones isotérmicas usando polimerasas que tienen baja procesividad y actividad de desplazamiento de cadena, como la Klenow polimerasa. La descripción adicional de las reacciones, condiciones y componentes de amplificación se establece en detalle en la divulgación del documento de Patente U.S. Patent No. 7,670,810.
Otro método de amplificación de polinucleótidos que es útil en la presente divulgación es la PCR etiquetada que usa una población de cebadores de dos dominios que tienen una región 5' constante seguida de una región 3' aleatoria como se describe, por ejemplo, en Grothues et al. Nucleic Acids Res. 21 (5): 1321-2 (1993)). Los primeros ciclos de amplificación se llevan a cabo para permitir una multitud de iniciaciones en el DNA desnaturalizado por calor basado en la hibridación individual de la región 3' sintetizada aleatoriamente. Debido a la naturaleza de la región 3', se contempla que los sitios de iniciación sean aleatorios en todo el genoma. A partir de entonces, los cebadores no unidos pueden eliminarse y puede tener lugar una replicación adicional utilizando cebadores complementarios a la región 5' constante.
En algunas realizaciones, la amplificación isotérmica se puede realizar usando amplificación de exclusión cinética (KEA), también denominada amplificación de exclusión (ExAmp). Se puede hacer una biblioteca de ácidos nucleicos de la presente divulgación usando un método que incluye una etapa de hacer reaccionar un reactivo de amplificación para producir una pluralidad de sitios de amplificación que cada uno incluye una población sustancialmente clonal de amplicones de un ácido nucleico diana individual que ha sembrado el sitio. En algunas realizaciones, la reacción de amplificación prosigue hasta que se genera un número suficiente de amplicones para llenar la capacidad del sitio de amplificación respectivo. Llenar un sitio ya sembrado hasta su capacidad de esta manera inhibe que los ácidos nucleicos diana se posen y amplifiquen en el sitio, produciendo así una población clonal de amplicones en el sitio. En algunas realizaciones, se puede lograr una clonalidad aparente incluso si un sitio de amplificación no está lleno hasta su capacidad antes de que llegue un segundo ácido nucleico diana al sitio. En algunas condiciones, la amplificación de un primer ácido nucleico diana puede llevarse a cabo hasta un punto en el que se haga un número suficiente de copias para competir eficazmente o abrumar la producción de copias de un segundo ácido nucleico diana que se transporta al sitio. Por ejemplo, en una realización que usa un proceso de amplificación puente en una característica circular que es menor de 500 nm de diámetro, se ha determinado que después de 14 ciclos de amplificación exponencial para un primer ácido nucleico diana, la contaminación de un segundo ácido nucleico diana en el mismo sitio producirá un número insuficiente de amplicones contaminantes como para afectar negativamente al análisis de secuenciación por síntesis en una plataforma de secuenciación de Illumina.
Como se demuestra por el ejemplo anterior, los sitios de amplificación en una matriz pueden ser, pero no necesitan ser, completamente clonales en realizaciones particulares. Más bien, para algunas aplicaciones, un sitio de amplificación individual puede estar poblado predominantemente con amplicones de un primer ácido nucleico diana y también puede tener un nivel bajo de amplicones contaminantes de un segundo ácido nucleico diana. Una matriz puede tener uno o más sitios de amplificación que tengan un nivel bajo de amplicones contaminantes siempre que el nivel de contaminación no tenga un impacto inaceptable en un uso posterior de la matriz. Por ejemplo, cuando la matriz se va a utilizar en una aplicación de detección, un nivel aceptable de contaminación sería un nivel que no afecta la señal al ruido o la resolución de la técnica de detección de una manera inaceptable. Por consiguiente, la clonalidad aparente será generalmente relevante para un uso o aplicación particular de una matriz preparada mediante los métodos expuestos en la presente memoria. Los niveles de contaminación ejemplares que pueden ser aceptables en un sitio de amplificación individual para aplicaciones particulares incluyen, pero no se limitan a, como máximo 0,1%, 0,5%, 1%, 5%, 10% o 25% de amplicones contaminantes. Una matriz puede incluir uno o más sitios de amplificación que tengan estos niveles ejemplares de amplicones contaminantes. Por ejemplo, hasta el 5%, 10%, 25%, 50%, 75% o incluso 100% de los sitios de amplificación en una matriz pueden tener algunos amplicones contaminantes. Se entenderá que, en una matriz u otra colección de sitios, al menos el 50%, 75%, 80%, 85%, 90%, 95% o 99% o más de los sitios pueden ser clonales o aparentemente clonales.
En algunas realizaciones, la exclusión cinética puede ocurrir cuando un proceso ocurre a una velocidad suficientemente rápida para excluir de manera efectiva que ocurra otro suceso o proceso. Tomemos, por ejemplo, la preparación de una matriz de ácidos nucleicos donde los sitios de la matriz se siembran aleatoriamente con ácidos nucleicos diana de una solución y se generan copias del ácido nucleico diana en un proceso de amplificación para llenar cada uno de los sitios sembrados hasta su capacidad. Según los métodos de exclusión cinética de la presente divulgación, los procesos de siembra y amplificación pueden proceder simultáneamente en condiciones en las que la velocidad de amplificación excede la velocidad de siembra. Como tal, la velocidad relativamente rápida a la que se hacen las copias en un sitio que ha sido sembrado por un primer ácido nucleico diana excluirá de manera eficaz un segundo ácido nucleico de la siembra del sitio para la amplificación. Los métodos de amplificación por exclusión cinética se pueden realizar como se describe en detalle en la divulgación de la publicación de Patente U.S. Pub. No. 2013/0338042.
La exclusión cinética puede aprovechar una velocidad relativamente lenta para iniciar la amplificación (por ejemplo, una velocidad lenta para hacer una primera copia de un ácido nucleico diana) frente a una velocidad relativamente rápida para hacer copias posteriores del ácido nucleico diana (o de la primera copia del ácido nucleico diana). En el ejemplo del párrafo anterior, la exclusión cinética se produce debido a la velocidad relativamente lenta de siembra del ácido nucleico diana (por ejemplo, difusión o transporte relativamente lento) frente a la velocidad relativamente rápida a la que se produce la amplificación para llenar el sitio con copias de la siembra del ácido nucleico. En otra realización ejemplar, la exclusión cinética puede ocurrir debido a un retraso en la formación de una primera copia de un ácido nucleico diana que se ha sembrado en un sitio (por ejemplo, activación retardada o lenta) frente a la velocidad relativamente rápida a la que se hacen copias posteriores para llenar el sitio. En este ejemplo, un sitio individual puede haber sido sembrado con varios ácidos nucleicos diana diferentes (por ejemplo, varios ácidos nucleicos diana pueden estar presentes en cada sitio antes de la amplificación). Sin embargo, la formación de la primera copia para cualquier ácido nucleico diana dado se puede activar aleatoriamente de modo que la velocidad media de formación de la primera copia sea relativamente lenta en comparación con la velocidad a la que se generan las copias posteriores. En este caso, aunque un sitio individual puede haber sido sembrado con varios ácidos nucleicos diana diferentes, la exclusión cinética permitirá que solo uno de esos ácidos nucleicos diana sea amplificado. Más específicamente, una vez que se ha activado un primer ácido nucleico diana para la amplificación, el sitio se llenará rápidamente hasta su capacidad con sus copias, evitando así que se produzcan copias de un segundo ácido nucleico diana en el sitio.
Un reactivo de amplificación puede incluir componentes adicionales que faciliten la formación de amplicones y, en algunos casos, aumenten la velocidad de formación de amplicones. Un ejemplo es una recombinasa. La recombinasa puede facilitar la formación de amplicones al permitir la invasión / extensión repetidas. Más específicamente, la recombinasa puede facilitar la invasión de un ácido nucleico diana por la polimerasa y la extensión de un cebador por la polimerasa usando el ácido nucleico diana como una plantilla para la formación de amplicones. Este proceso se puede repetir como una reacción en cadena en la que los amplicones producidos en cada ciclo de invasión / extensión sirven como plantillas en un ciclo posterior. El proceso puede ocurrir más rápidamente que la PCR estándar ya que no se requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química). Como tal, la amplificación facilitada por recombinasa se puede llevar a cabo de forma isotérmica. Generalmente es deseable incluir ATP, u otros nucleótidos (o en algunos casos análogos no hidrolizables del mismo) en un reactivo de amplificación facilitado por recombinasa para facilitar la amplificación. Una mezcla de recombinasa y una proteína de unión monocatenaria (SSB) es particularmente útil ya que la SSB puede facilitar aún más la amplificación. Las formulaciones ejemplares para la amplificación facilitada por recombinasa incluyen las vendidas comercialmente como los kits TwistAmp por TwistDx (Cambridge, UK). Los componentes útiles del reactivo de amplificación facilitado por recombinasa y las condiciones de reacción se establecen en los documentos de Patente U.S. Patent Nos. 5,223,414 y 7,399,590.
Otro ejemplo de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y en algunos casos para aumentar la velocidad de formación de amplicones es una helicasa. La helicasa puede facilitar la formación de amplicones al permitir una reacción en cadena de formación de amplicones. El proceso puede ocurrir más rápidamente que la PCR estándar ya que no se requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química). Como tal, la amplificación facilitada por helicasa se puede llevar a cabo de forma isotérmica. Una mezcla de helicasa y una proteína de unión monocatenaria (SSB) es particularmente útil ya que SSB puede facilitar aún más la amplificación. Las formulaciones ejemplares para la amplificación facilitada por helicasa incluyen las que se venden comercialmente como kits IsoAmp de Biohelix (Beverly, MA). Además, se describen ejemplos de formulaciones útiles que incluyen una proteína helicasa en los documentos de Patente US 7,399,590 y US 7,829,284.
Otro ejemplo más de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y, en algunos casos, aumentar la velocidad de formación de amplicones es una proteína de unión al origen.
Uso en secuenciación / métodos de secuenciación
Los polinucleótidos inmovilizados de las bibliotecas agrupadas se pueden secuenciar de cualquier manera adecuada. Preferiblemente, la secuenciación se realiza mediante secuenciación por síntesis en la que se añaden nucleótidos sucesivamente a un grupo hidroxilo 3' libre de un cebador de secuenciación utilizando los polinucleótidos inmovilizados como plantilla, dando como resultado la síntesis de una cadena de polinucleótidos en la dirección 5' a 3'. La naturaleza del nucleótido añadido se determina preferiblemente después de cada adición de nucleótido. Las técnicas de secuenciación que utilizan secuenciación por ligación, en las que no se secuencian todas las bases contiguas, y técnicas tales como la secuenciación paralela masiva de la firma (MPSS), en las que las bases se eliminan de, en lugar de añadirlas a las cadenas en la superficie, también están dentro del alcance de la divulgación, al igual que las técnicas que utilizan la detección de la liberación de pirofosfato (pirosecuenciación). Dichas técnicas basadas en la pirosecuenciación son particularmente aplicables a las matrices de secuenciación de esferas en las que las esferas se han amplificado en una emulsión de manera que se amplifica una única plantilla de la molécula de biblioteca en cada esfera.
El punto de inicio de la reacción de secuenciación puede proporcionarse por hibridación de un cebador de secuenciación con un producto de la reacción de amplificación en fase sólida. A este respecto, uno o ambos adaptadores añadidos durante la formación de la biblioteca plantilla pueden incluir una secuencia de nucleótidos que permite la hibridación de un cebador de secuenciación a polinucleótidos inmovilizados, tales como los polinucleótidos adaptador-diana-adaptador.
La secuencia de la etiqueta de índice y la secuencia diana se pueden determinar en una sola lectura de un solo cebador de secuenciación, o en múltiples lecturas de más de un cebador de secuenciación. En el caso de dos lecturas de dos cebadores de secuenciación, la "lectura de la etiqueta de índice" y la "lectura de la diana" se pueden realizar en cualquier orden, con una etapa de desnaturalización adecuada para eliminar el cebador hibridado después de que se complete la primera lectura de secuenciación. Las etapas de desnaturalización adecuadas pueden incluir formamida, hidróxido o calor como se conoce generalmente en la técnica.
Los productos de las reacciones de amplificación en fase sólida en las que los cebadores de amplificación tanto directa como inversa se inmovilizan covalentemente sobre la superficie sólida pueden ser las denominadas estructuras "puenteadas" formadas por hibridación de pares de cadenas de polinucleótidos inmovilizados y cadenas complementarias inmovilizadas, estando ambas cadenas unidas al soporte sólido en el extremo 5'. Las matrices compuestas por dichas estructuras puente proporcionan plantillas ineficaces para la secuenciación de ácidos nucleicos, ya que la hibridación de un cebador de secuenciación convencional a una de las cadenas inmovilizadas no se favorece en comparación con la hibridación de esta cadena a su cadena complementaria inmovilizada en condiciones estándar para la hibridación. Se describen ejemplos de amplificación en puente o en grupo en, por ejemplo, los documentos de Patente US Patent Nos. 7,985,565 y 7,115,400.
Con el fin de proporcionar plantillas más adecuadas para la secuenciación de ácidos nucleicos, se prefiere eliminar sustancialmente todo o eliminar o desplazar al menos una parte de una de las cadenas inmovilizadas en la estructura "puenteada" para generar una plantilla que sea al menos parcialmente monocatenaria. La parte de la plantilla que es monocatenaria estará así disponible para la hibridación a un cebador de secuenciación. El proceso de eliminación de toda o una parte de una cadena inmovilizada en una estructura de ácido nucleico bicatenario "puenteada" puede denominarse en la presente memoria "linealización", y se describe con más detalle en los documentos de Patente WO 2007/010251, WO 2006/064199, WO 2005/065814, WO 2015/106941, WO 1998/044151, y WO 2000/018957.
Las estructuras plantilla puenteadas se pueden linealizar mediante la escisión de una o ambas cadenas con una endonucleasa de restricción o mediante la escisión de una cadena con una endonucleasa de corte. Se pueden usar otros métodos de escisión como una alternativa a las enzimas de restricción o enzimas de corte, que incluyen, entre otros, escisión química (por ejemplo, escisión de un enlace diol con peryodato), escisión de sitios abásicos mediante escisión con endonucleasa (por ejemplo, 'USER', suministrado por NEB, Cat # M5505S), o por exposición a calor o álcali, escisión de ribonucleótidos incorporados en productos de amplificación compuestos de otro modo por desoxirribonucleótidos, escisión fotoquímica o escisión de un enlazador peptídico.
Se apreciará que una etapa de linealización puede no ser esencial si la reacción de amplificación en fase sólida se realiza con solo un cebador inmovilizado covalentemente y el otro en solución libre.
Después de la etapa de escisión, independientemente del método utilizado para la escisión, el producto de la reacción de escisión puede someterse a condiciones de desnaturalización para eliminar las partes de las cadenas escindidas que no están unidas al soporte sólido. Las condiciones de desnaturalización adecuadas, por ejemplo, solución de hidróxido de sodio, solución de formamida o calor, serán evidentes para el lector experto con referencia a los protocolos estándar de biología molecular (Sambrook et al., 2001, Molecular Cloning, A Laboratory Manual, 3rd edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor Laboratory Press, NY; Current Protocols, eds. Ausubel et al.). La desnaturalización da como resultado la producción de una plantilla de secuenciación que es parcial o sustancialmente monocatenaria. Después, puede iniciarse una reacción de secuenciación mediante la hibridación de un cebador de secuenciación a la parte monocatenaria de la plantilla.
Por tanto, en algunas realizaciones, una reacción de secuenciación comprende hibridar un cebador de secuenciación a una región monocatenaria de un producto de amplificación linealizado, que incorpora secuencialmente uno o más nucleótidos en una cadena de polinucleótidos complementaria a la región de la cadena plantilla amplificada que se va a secuenciar, identificando la base presente en uno o más de los nucleótidos incorporados y determinando así la secuencia de una región de la cadena plantilla.
Un método de secuenciación preferido que puede usarse se basa en el uso de nucleótidos modificados que tienen bloques 3' extraíbles, por ejemplo, como se describe en los documentos de Patente WO 2004/018497 y U.S. Pat. No.
7,057,026. Una vez que el nucleótido modificado se ha incorporado a la cadena de polinucleótido en crecimiento complementaria a la región de la plantilla que se está secuenciando, no hay ningún grupo 3'-OH libre disponible para dirigir la extensión de secuencia adicional y, por lo tanto, la polimerasa no puede añadir más nucleótidos. Una vez que se ha determinado la naturaleza de la base incorporada en la cadena en crecimiento, el bloque de 3' puede eliminarse para permitir la adición del siguiente nucleótido sucesivo. Al ordenar los productos derivados usando estos nucleótidos modificados, es posible deducir la secuencia de DNA de la plantilla de DNA. Dichas reacciones pueden realizarse en un solo experimento si cada uno de los nucleótidos modificados tiene una etiqueta diferente unida al mismo, que se sabe que corresponde a la base particular, para facilitar la discriminación entre las bases añadidas durante cada etapa de incorporación. Alternativamente, se puede llevar a cabo una reacción separada que contenga cada uno de los nucleótidos modificados por separado.
Los nucleótidos modificados pueden llevar una etiqueta para facilitar su detección. Una etiqueta fluorescente, por ejemplo, puede usarse para la detección de nucleótidos modificados. Por tanto, cada tipo de nucleótido puede llevar una etiqueta fluorescente diferente, por ejemplo, como se describe en el documento de Patente WO 2007/135368. Sin embargo, no es necesario que la etiqueta detectable sea una etiqueta fluorescente. Puede usarse cualquier etiqueta que permita la detección de un nucleótido incorporado.
Un método para detectar nucleótidos marcados con fluorescencia comprende el uso de luz láser de una longitud de onda específica para los nucleótidos marcados, o el uso de otras fuentes de iluminación adecuadas. La fluorescencia del marcador en el nucleótido puede detectarse mediante una cámara CCD u otros medios de detección adecuados. La instrumentación adecuada para grabar imágenes de matrices agrupadas se describe en el documento de Patente WO 2007/123744.
Por supuesto, se puede emplear cualquier otro método de secuenciación adecuado. Preferiblemente, el método de secuenciación se basa en la incorporación sucesiva de nucleótidos en una cadena de polinucleótidos. Las técnicas alternativas adecuadas incluyen, por ejemplo, pirosecuenciación, FISSEQ (secuenciación fluorescente in situ), MPSS y secuenciación mediante métodos basados en ligación, por ejemplo, como se describe en el documento de Patente U.S. Pat. No. 6,306,597.
La muestra de ácido nucleico se puede analizar adicionalmente para obtener una segunda lectura desde el extremo opuesto del fragmento. La metodología para secuenciar ambos extremos de un grupo se describe en los documentos de Patente WO 2007/010252 y WO 2008/041002. En un ejemplo, las series de etapas se puede realizar como sigue; generar agrupaciones, linealizar, hibridar el primer cebador de secuenciación y obtener la primera lectura de secuenciación. Se puede eliminar el primer cebador de secuenciación, se puede hibridar un segundo cebador y secuenciar la etiqueta de índice. La cadena de polinucleótidos puede después "invertirse" en la superficie sintetizando una copia complementaria de los cebadores inmovilizados restantes usados en la amplificación de grupos. Este proceso de re-sintetización de cadenas regenera el grupo bicatenario. La cadena plantilla original se puede eliminar para linealizar la cadena resintetizada que después se puede hibridar a un cebador de secuenciación y secuenciar en un tercer ciclo de secuenciación.
En los casos en los que se emplea la resíntesis de la cadena, ambas cadenas pueden inmovilizarse en la superficie de una manera que permita la posterior liberación de una parte de la cadena inmovilizada. Esto se puede lograr a través de varios mecanismos como se describe en el documento de Patente WO 2007/010251. Por ejemplo, un cebador puede contener un nucleótido de uracilo, lo que significa que la cadena se puede escindir en la base de uracilo usando las enzimas uracilglucosilasa (UDG) que elimina la base de nucleósido y la endonucleasa VIII que escinde el nucleótido abásico. Esta combinación de enzimas está disponible como la enzima USER™ de New England Biolabs (Cat # M5505). El segundo cebador puede comprender un nucleótido de 8-oxoguanina, que es escindido después por la enzima FPG (NEB Cat # M0240). Este diseño de cebadores proporciona el control de qué cebador se escinde en qué punto del proceso, y también en qué parte del grupo se produce la escisión. Los cebadores también pueden modificarse químicamente, por ejemplo, con una modificación de disulfuro o diol que permite la escisión química en localizaciones específicas.
Refiriéndonos ahora a la Figura 1, se muestra un dibujo esquemático que ilustra una realización de un proceso para producir polinucleótidos plantilla 5' modificados y 3' bloqueados para inmovilizar sobre una superficie sólida para secuenciación. En la Figura 1A, se muestra un fragmento de polinucleótido diana bicatenario. Las partes iniciales de adaptadores se pueden unir a los extremos de la diana mediante ligación (véase la Figura 1B) o etiquetado. Las partes de los adaptadores (ab) comprenden una parte bicatenaria unida a la diana bicatenaria y partes monocatenarias que se extienden desde la diana hasta los extremos 5' y 3'. Un cebador modificado en 5' (B') se configura para hibridar a una parte monocatenaria del adaptador (b) en las proximidades del extremo de 3' (Figura 1C). Se puede usar una polimerasa para extender el cebador B' usando las partes del adaptador y la diana como una plantilla para producir un complemento de las partes del adaptador (a') y la diana (Figura 1D, cadenas de la Figura 1C eliminadas por razones de conveniencia y claridad). Un cebador modificado en 5' (A ) se configura para hibridar a una parte monocatenaria del complemento de la parte del adaptador (a') en las proximidades del extremo de 3' (Figura 1E). Se puede usar una polimerasa para extender el cebador A utilizando las partes del complemento de los adaptadores y la diana como plantilla para producir partes del adaptador (b) y la diana (Figura 1F, cadenas de la Figura 1E eliminada por razones de conveniencia y claridad).
Si la parte del adaptador que se añade mediante, por ejemplo, ligación o etiquetación incluye la secuencia de la etiqueta de índice específica de la biblioteca en una localización entre la secuencia para la hibridación de los cebadores (A, B') y la diana (cuando la parte del adaptador se une a la diana), la amplificación (Figuras 1C-F) con los cebadores (A, B') puede realizarse en fragmentos diana agrupados de diferentes bibliotecas, siempre que cada fragmento de cada biblioteca incluya una parte de un adaptador que tenga una secuencia de la etiqueta de índice específica de biblioteca en una localización similar y cada parte del adaptador de cada biblioteca tenga una secuencia (o complemento) a la qué cebadores (A, B') puedan hibridar. De lo contrario, cada biblioteca debe amplificarse por separado.
La plantilla 5’ protegida resultante (adaptador amplificado-diana-adaptador amplificado) puede someterse a bloqueo en 3' para producir un polinucleótido plantilla protegido 5' y 3' (Figura 1G) para inmovilizar sobre una superficie sólida para secuenciar. El bloqueo en 3' puede afectar a cualquier polinucleótido presente en solución con la plantilla protegida en 5', incluyendo cualquier otro fragmento de amplificación o polinucleótido residual (no mostrado). En consecuencia, si las partes del adaptador (ab) se amplifican con cebadores (A, B), los adaptadores amplificados que no están unidos a la plantilla (no mostrados) también deben bloquearse en 3 '.
El tratamiento con exonucleasa se puede aplicar opcionalmente a la mezcla resultante. Los polinucleótidos restantes no bloqueados o desprotegidos pueden degradarse antes de inmovilizar los polinucleótidos plantillla sobre una superficie sólida.
Refiriéndonos ahora a la Figura 2 se muestra un dibujo esquemático de un adaptador (adaptador amplificado) 100 que puede usarse o resultar durante la amplificación de las bibliotecas en preparación para la secuenciación. El adaptador representado 100 comprende una región bicatenaria 110 y una región monocatenaria no complementaria 120. Los extremos 5' se modifican (indicados por el "*") para evitar la degradación por una exonucleasa, y los extremos 3' se bloquean (indicados por la "X"). Una cadena representada del adaptador 100 comprende una secuencia del cebador de extensión universal 130, una secuencia de la etiqueta de índice 132, y una secuencia del cebador de secuenciación 134. La otra cadena representada del adaptador 100 comprende una secuencia del cebador de extensión universal 140, una secuencia de las etiquetas de índice 142, y una secuencia del cebador de secuenciación 144.
Las secuencias de los cebadores de extensión universal 130, 140 puede hibridar a oligonucleótidos de cebadores de extensión unidos a una superficie sólida con fines de amplificación o secuenciación (si el adaptador 100 se uniera a un polinucleótido diana). La secuencia del cebador de extensión universal 140, o una parte de la misma, también puede hibridar a un cebador de secuenciación para secuenciar la secuencia de la etiqueta de índice 142. Alternativamente, la cadena puede comprender una secuencia de cebador de secuenciación adicional (no mostrada).
La secuencia del cebador de secuenciación 134 puede hibridar a un cebador de secuenciación para permitir la secuenciación de la secuencia de la etiqueta de índice 132. La secuencia de las etiquetas de índice 142 y la secuencia de las etiquetas de índice 132 pueden ser iguales o diferentes.
La secuencia del cebador de secuenciación 144 puede hibridar a un cebador de secuenciación para permitir la secuenciación de una secuencia de polinucleótidos diana (si se une al adaptador 100).
La secuenciación de secuencias de los cebadores 134, 144 puede hibridar a, por ejemplo, cebadores de PCR si los adaptadores están unidos a una diana en un proceso de múltiples etapas como se describe anteriormente.
Se entenderá que un adaptador adecuado para su uso en varias realizaciones descritas en la presente memoria puede tener más o menos características de secuencia, u otras características de secuencia, que las descritas con respecto a la Figura 2.
Refiriéndonos ahora a la Figura 3, se muestra un dibujo esquemático de un polinucleótido plantilla 200 de una biblioteca que tiene una secuencia de adaptador 100-plantilla 210-adaptador 100. El polinucleótido plantilla 210 es bicatenario y está unido a una parte bicatenaria de los adaptadores primero 100 y segundo 101. Los extremos 3' del polinucleótido plantilla 200 están bloqueados y los extremos 5' se modifican, por ejemplo, como se describió anteriormente.
Refiriéndonos ahora a la Figura 4, se muestra una ilustración esquemática de un proceso para la amplificación de grupos de un polinucleótido plantilla 200 de una biblioteca a una superficie sólida 300 para preparar la secuenciación. En el primer panel, el polinucleótido plantilla 200 que tiene un extremo 5' modificado y un extremo 3' bloqueado se hibrida a un primer cebador de extensión 310 unido a la superficie sólida 300. Por ejemplo, secuencia del cebador de extensión universal 140 representada en la Figura 2 de la parte del adaptador puede hibridar al primer cebador de extensión 310.
El primer cebador de extensión 310 comprende un extremo 3' libre, y por lo tanto se pueden añadir nucleótidos al extremo 3' utilizando el polinucleótido plantilla 200 como una plantilla para producir una cadena plantilla de copia 201 (véase segundo panel) unida a la superficie sólida 300 en presencia de una polimerasa adecuada. La cadena plantilla 200 puede eliminarse y la cadena de copia 201 puede hibridar con un segundo cebador de extensión 320 unido a la superficie sólida 300 (véase tercer panel). Por ejemplo, la secuencia del cebador de extensión universal 130 representado en la Figura 2 de la parte del adaptador puede hibridar al segundo cebador de extensión 320.
El segundo cebador de extensión 320 comprende un extremo 3' libre y, por lo tanto, se pueden añadir nucleótidos al extremo 3' utilizando el polinucleótido plantilla de copia 201 como una plantilla para producir una cadena plantilla amplificada 202 (véase el cuarto panel) unida a la superficie sólida 300 en presencia de una polimerasa adecuada. Se pueden realizar ciclos adicionales de amplificación para producir un grupo de cadenas plantilla de copia 201 y cadenas plantilla amplificadas 202.
Con fines ilustrativos, el quinto panel de la Figura 4 representa las cadenas plantilla de copia 201 y amplificada 202 en forma lineal.
Refiriéndonos ahora a la Figura 5, se muestra un dibujo esquemático que ilustra cómo el bloqueo de los extremos 3' (para evitar la extensión desde el extremo 3' bloqueado) puede mitigar el salto de índice. Los dos primeros paneles de la Figura 5 son los mismos que los dos primeros paneles de la Figura 4. Como se muestra en el tercer panel de la Figura 5, una cadena del adaptador residual no incorporada (no unida a un polinucleótido objetivo) 104 puede hibridar a una parte del adaptador de la cadena plantilla de copia 201 (por ejemplo, la hibridación puede ocurrir en la región bicatenaria del adaptador y la parte del adaptador del polinucleótido plantilla). La cadena del adaptador 104 puede ser de una biblioteca diferente a la biblioteca de la que la cadena plantilla de copia 201 se deriva. En consecuencia, el adaptador 104 puede tener una secuencia de la etiqueta de índice que es diferente a la secuencia de la etiqueta de índice asociada con la cadena plantilla de copia 201. Debido a que el extremo de 3' del adaptador está bloqueado (indicado por la "X"), el adaptador 104 no puede servir como un cebador eficaz para extender y copiar la cadena plantilla de copia 201. Sin embargo, si se permitiera la extensión (y el extremo de 3' del adaptador no incorporado 104 no estuviera bloqueado), se produciría una copia en la que una etiqueta de índice incorrecta (etiqueta de índice del adaptador 104 de una segunda biblioteca) se asociaría con un polinucleótido diana de otra biblioteca (polinucleótido diana del polinucleótido plantilla 201 de una primera biblioteca). En un ciclo posterior de amplificación, un polinucleótido etiquetado incorrectamente podría unirse a la superficie. 300.
Refiriéndonos ahora a la Figura 6, se muestra un dibujo esquemático que ilustra cómo el tratamiento con exonucleasas para eliminar adaptadores o cadenas de adaptadores no bloqueados y no incorporados puede mitigar el salto de índice. Los dos primeros paneles de la Figura 6 son los mismos que los dos primeros paneles de la Figura 4. Como se muestra en el panel inferior izquierdo de la Figura 6, una cadena del adaptador 104 que puede resultar de la amplificación (por ejemplo, como se describe con respecto a las Figuras 1B-F) que no fue bloqueada durante una etapa de bloqueo de 3' (por ejemplo, como se describe con respecto a la Figura 1G) puede hibridar a una parte del adaptador de la cadena plantilla de copia 201 (por ejemplo, la hibridación puede ocurrir en la región bicatenaria del adaptador y la parte del adaptador del polinucleótido plantilla). La cadena del adaptador 104 puede ser de una biblioteca diferente a la biblioteca de la que la cadena plantilla de copia 201 se deriva. En consecuencia, la cadena del adaptador 104 puede tener una secuencia de la etiqueta de índice que es diferente a la secuencia de la etiqueta de índice asociada con la cadena plantilla de copia 201. La cadena del adaptador 104 puede servir como un cebador eficaz para extender y copiar la cadena plantilla de copia 201. Se produciría una cadena amplificada en la que una etiqueta de índice incorrecta (etiqueta de índice de la cadena del adaptador 104 de una segunda biblioteca) se asociaría con un polinucleótido diana de otra biblioteca (polinucleótido diana del polinucleótido plantilla 201 de una primera biblioteca). En un ciclo posterior de amplificación, un polinucleótido etiquetado incorrectamente podría unirse a la superficie 300. Sin embargo y como se ilustra en el panel inferior derecho de la Figura 6, si los adaptadores o las cadenas del adaptador no bloqueadas que pueden resultar son digeridas por el tratamiento con exonucleasa, la cadena del adaptador no está disponible para servir como cebador de extensión y se mitiga el salto de índice.
Refiriéndonos ahora a las Figuras 7A y 7B, se ilustra la naturaleza del fenómeno de salto de índice. La Figura 7A muestra cómo las lecturas de una muestra determinada se demultiplexan incorrectamente y se mezclan con una muestra diferente después de la demultiplexación. La Figura 7B demuestra el salto de índice en un sistema de índice dual, donde conduce a combinaciones inesperadas de secuencias de las etiquetas de índice.
Refiriéndonos ahora a las Figuras 8A y 8B, se ilustra el enfoque general para medir la tasa de salto de índice en un sistema dado. La Figura 8A muestra un diseño ejemplar de una placa adaptadora dual, en la que cada pocillo individual de una placa de 96 pocillos contiene un par único de secuencias de las etiquetas de índice (12 índices P7 diferentes combinados con 8 índices P5 diferentes). La Figura 8B muestra una configuración experimental destinada a medir la tasa de salto de índice, en la que se utilizan 8 combinaciones únicas de etiquetas de índice dual (es decir, no se espera que ningún índice P5 se empareje con más de un índice P7 y viceversa). Las combinaciones inesperadas de las etiquetas de índice (por ejemplo, D505-D703) se identifican fácilmente como ejemplos de salto de índice.
Refiriéndonos ahora a las Figuras 9A y 9B, se ilustra el efecto de los adaptadores no ligados sobre la tasa de salto de índice. La Figura 9A muestra un aumento de 6 veces en el salto de índice asociado con un aumento del 50% de aumento de adaptadores libres. La Figura 9B muestra un efecto aproximadamente lineal del adaptador bifurcado libre sobre la tasa de salto de índice dentro del intervalo probado. Los inventores también observaron un efecto más pronunciado de los adaptadores P7 monocatenarios libres sobre la tasa de salto de índice en comparación con los adaptadores P5 monocatenarios libres (datos no mostrados).
Ejemplos
Ejemplo 1: Protocolo de muestra para el bloqueo en 3'de bibliotecas indexadas protegidas en 5’
Este protocolo explica cómo realizar un tratamiento de bloqueo de 3' de bibliotecas de DNA protegidas en 5', para reducir el salto de índice. Este método está diseñado para realizarse en grupos de bibliotecas de DNA antes de la etapa de desnaturalización y la posterior generación de grupos utilizando Illumina HiSeq® 4000 y plataformas de secuenciación similares que utilizan celdas de flujo con patrones y agrupaciones basadas en ExAmp (por ejemplo, HiSeq® X y NovaSeq®).
Se ha observado que el salto de índice se produce cuando se asignan secuencias de índice incorrectas a la secuencia de inserción, lo que resulta en una asignación incorrecta de la muestra. La realización de este tratamiento en grupos de muestras de DNA antes de ejecutar en HiSeq® 4000 debería reducir los niveles de salto de índice en algún nivel que no se puede predecir de manera consistente en esta etapa.
Se puede considerar que el flujo de trabajo del tratamiento implica cuatro etapas: (i) producir un conjunto de muestras de DNA; (ii) realizar el tratamiento, (iii) limpiar la muestra y cuantificar; y (iv) agrupar y secuenciar el grupo de muestras.
Consumibles / Equipo: Los consumibles y el equipo pueden ser suministrados por un usuario o fabricante de secuenciación. Los consumibles suministrados por el usuario pueden incluir un conjunto de muestras de la biblioteca de DNA: 30 pl a una concentración que se utilizará para la desnaturalización durante la agrupación. El usuario también puede suministrar etanol al 80% (EtOH) recién preparado.
La Tabla 1 a continuación muestra algunos consumibles y equipos que pueden utilizarse.
Tabla 1: Consumibles y equipo
Figure imgf000022_0001
Un fabricante de secuenciación puede suministrar BMX (Mezcla de bloqueo), EMX (Mezcla de exonucleasa), RSB (Tampón de resuspensión) y SPB (Esferas de purificación de muestras).
La EMX puede incluir un tampón de exonucleasa (Glicina-KOH 67 mM, MgCl2 2,5 mM, BSA 50 pg / ml) y Lambda Exonucleasa (New England Biolabs, Cat # M0262S / L).
La BMX puede incluir una premezcla de secuenciación (tampón T ris, cloruro de sodio, sacarosa, sulfato de magnesio, EDTA y Tween 20), una mezcla de ddNTP, DNA polimerasa Poli 9 y transferasa terminal TDT.
El RSB puede incluir un tampón Tris, pH 8,5.
La SPB puede incluir esferas AgenCourt® AMPure® XP (Beckman Coulter, Cat # A63880). La SPB debe agitarse en un vórtex antes de cada uso. La SPB debe agitarse en vórtex con frecuencia para asegurarse de que las esferas se distribuyan uniformemente. La SPB debe aspirarse y dispensarse lentamente debido a la viscosidad de la solución.
Algunos de los consumibles deben almacenarse y prepararse como se indica en Tabla 2 a continuación.
Tabla 2: Almacenamiento y preparación de consumibles
Figure imgf000023_0001
El siguiente programa EMX se puede guardar en el termociclador: (i) elegir la opción de precalentamiento de la tapa y ajustarla a 100°C; (ii) 37°C durante 30 minutos; (iii) 75°C durante 10 minutos; y (iv) mantener a 4°C.
El siguiente programa BMX se puede guardar en el termociclador: (i) elegir la opción de precalentamiento de la tapa y configurarlo en 100°C; (ii) 38°C durante 20 minutos; (iii) 60°C durante 20 minutos; y (iv) mantener a 4°C.
Para el tratamiento de bloqueo de 3', las muestras pueden tratarse como sigue: (i) centrifugar BMX a 600 x g durante 5 segundos; (ii) añadir 30 gl del conjunto de muestras de la biblioteca de DNA protegidas en 5' al tubo de PCR; (iii) añadir 30 gl de BMX a cada muestra en cada tubo de PCR y después mezclar bien pipeteando hacia arriba y hacia abajo; (iv) incubar colocando en el termociclador y ejecutando el programa BMX. Cada tubo contiene 60 gl.
Para el tratamiento de bloqueo de 3' más exonucleasa, las muestras pueden tratarse como sigue: (i) centrifugar EMX a 600 x g durante 5 segundos; (ii) añadir 27 gl del conjunto de muestras de la biblioteca de DNA protegidas en 5' al tubo de PCR; (iii) añadir 5 gl de EMX a cada muestra en cada tubo de PCR y después mezclar bien pipeteando hacia arriba y hacia abajo; (iv) incubar colocando en el termociclador y ejecutando el programa EMX; (v) centrifugar BMX a 600 x g durante 5 segundos; (vi) añadir 32 gl de BMX directamente a cada reacción de exonucleasa en cada tubo de PCR y luego mezclar bien pipeteando hacia arriba y hacia abajo; e (vii) incubar colocando el termociclador y ejecutando el programa BMX. Cada tubo contiene 64 gl.
La muestra agrupada tratada se puede limpiar de la siguiente manera: (1) agitar con vórtex el SPB hasta que esté bien disperso; (2) añadir 60 gl de SPB a cada tubo de tratamiento de muestra y mezlar bien pipeteando hacia arriba y hacia abajo; (3) incubar a temperatura ambiente durante 5 minutos; (4) colocarlo en un soporte magnético y esperar hasta que el líquido esté claro (2-5 minutos); (5) retirar y desechar todo el sobrenadante de cada tubo; (6) lavar 2 veces como sigue: (a) añadir 200 gl de EtOH al 80% recién preparado a cada tubo, (b) incubar en el soporte magnético durante 30 segundos, y (c) retirar y desechar todo el sobrenadante de cada tubo; (7) usar una pipeta de 20 gl para eliminar el EtOH residual de cada tubo; (8) secar al aire sobre el soporte magnético durante 5 minutos; (9) añadir 22,5 gl de RSB a cada tubo; (10) retirarlo del soporte magnético y mezclar después bien pipeteando hacia arriba y hacia abajo; (11) incubar a temperatura ambiente durante 2 minutos; (12) colocarlo en un soporte magnético y esperar hasta que el líquido esté claro (2-5 minutos); (13) transferir 20 gl de sobrenadante a un tubo nuevo; (14) cuantificar las bibliotecas si es necesario y proceder a la agrupación estándar para la plataforma HiSeq® 4000 comenzando con la etapa de desnaturalización con NaOH; y (15) almacenar entre -25°C y -15°C si no se agrupa inmediatamente.
Ejemplo 2: Reducción del salto de índice mediante el bloqueo de 3' de bibliotecas indexadas protegidas en 5'
El protocolo de tratamiento expuesto anteriormente en el Ejemplo 1 se aplicó en combinación con los siguientes materiales, equipos y métodos para agrupar y secuenciar en la plataforma Illumina.
Condiciones experimentales: (1) Biblioteca TrueSeq® Nano de 450 bp humano NA12878 (Instituto Coriell) generada usando cebadores P5 y P7 protegidos en 5' cargados a 300 pM; (2) el instrumento HiSeq® X y la química Illumina de SBS según las instrucciones del fabricante; (3) celda de flujo ILS v3 550 nm; (4) Amplificación ExAmp como se describió anteriormente; y (5) 50% de aumento del adaptador: adaptador bifurcado libre de la placa del adaptador dual (DAP) de Illumina añadido a la biblioteca de plantillas antes de la desnaturalización, neutralización, adición de mezcla ExAmp y agrupamiento.
Los resultados de este experimento se resumen en la Tabla 3 a continuación y en la Figura 10.
Tabla 3: Reducción del salto de índice mediante protección con PCR con bloqueo de 3'
Figure imgf000024_0001
Como se ilustró anteriormente, el salto de índice se redujo significativamente en relación con los adaptadores estándar empleando adaptadores protegidos en 5' y bloqueados en 3' como se describe en la presente memoria. El tratamiento con exonucleasa opcional puede reducir aún más el índice de salto.

Claims (15)

REIVINDICACIONES
1. Un método que comprende:
proporcionar una primera biblioteca que comprende una primera pluralidad de polinucleótidos que tienen una secuencia de primer adaptador-diana-primer adaptador, en la que los polinucleótidos de la primera pluralidad de polinucleótidos son bicatenarios en una región que comprende la diana y al menos una parte del primer adaptador en ambos extremos de la diana;
proporcionar un primer oligonucleótido cebador configurado para hibridar con una parte del primer adaptador en la proximidad de un extremo 3' de una cadena del primer adaptador, en el que el extremo 5' del primer oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5’;
proporcionar un segundo oligonucleótido cebador configurado para hibridar con un complemento de una parte del primer adaptador en la proximidad de un extremo 3' de una cadena del complemento del primer adaptador, en el que el extremo 5' del segundo oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5';
incubar la primera biblioteca con el primer y segundo oligonucleótidos cebadores en una solución en condiciones adecuadas para amplificar los polinucleótidos que tienen una secuencia de primer adaptador-diana-primer adaptador para producir una primera biblioteca amplificada de polinucleótidos que tienen los extremos 5' modificados para evitar la digestión por una enzima que tiene actividad exonucleasa 5', en donde los polinucleótidos amplificados tienen una secuencia primer adaptador amplificado-diana-primer adaptador amplificado, y en donde la secuencia del primer adaptador amplificado comprende una primera secuencia específica de biblioteca;
modificar los extremos 3' de los polinucleótidos de la primera biblioteca amplificada para evitar uno o ambos de (i) la digestión por una enzima que tiene actividad exonucleasa 3', o (ii) la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa, generando así una primera biblioteca protegida de polinucleótidos que tiene los extremos 5' y 3' modificados.
2. Un método según la reivindicación 1, en el que la modificación de los extremos 3' de la primera biblioteca amplificada de polinucleótidos comprende incorporar un didesoxinucleótido en los extremos 3' de los polinucleótidos.
3. Un método según la reivindicación 1 o la reivindicación 2, en el que:
a. los extremos 5' de la primera biblioteca amplificada de polinucleótidos comprenden un enlace fosforotioato, o;
b. los extremos 5' de la primera biblioteca amplificada de polinucleótidos comprenden tres enlaces fosforotioato.
4. Un método según una cualquiera de las reivindicaciones 1 a 3, que comprende además incubar la primera biblioteca protegida de polinucleótidos que tienen los extremos 3' modificados con una o más enzimas que tienen actividad exonucleasa 5' y actividad exonucleasa 3'.
5. Un método según una cualquiera de las reivindicaciones 1 a 4, que comprende, además
proporcionar un sustrato que tiene una superficie que comprende una pluralidad de oligonucleótidos unidos que tienen los extremos 3’ libres; y
poner en contacto la superficie del sustrato con una composición que comprende la primera biblioteca protegida de polinucleótidos que tiene los extremos 3' modificados en condiciones que permiten la hibridación de una parte de una cadena del primer adaptador de la primera biblioteca protegida de polinucleótidos a al menos una parte de los oligonucleótidos unidos a la superficie del sustrato y opcionalmente;
en donde el método comprende además extender los oligonucleótidos unidos a la superficie del sustrato desde el extremo 3' libre incorporando nucleótidos complementarios a una secuencia de la primera biblioteca protegida de polinucleótidos que tienen los extremos 3' modificados que se hibridan a los oligonucleótidos unidos para producir una copia del polinucleótido hibridado de modo que la copia se una a la superficie del sustrato, y además opcionalmente;
en donde el método comprende además amplificar la copia unida a la superficie del sustrato.
6. Un método según una cualquiera de las reivindicaciones 1 a 5, que comprende, además:
proporcionar una segunda biblioteca que comprende una pluralidad de polinucleótidos que tienen una secuencia de segundo adaptador-diana-segundo adaptador, en la que los polinucleótidos de la segunda pluralidad de polinucleótidos son bicatenarios en una región que comprende la diana y al menos una parte del segundo adaptador en ambos extremos de la diana;
proporcionar un tercer oligonucleótido cebador configurado para hibridar con una parte del primer adaptador en la proximidad de un extremo 3' de una cadena del segundo adaptador, en el que el extremo 5' del tercer oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5’;
proporcionar un cuarto oligonucleótido cebador configurado para hibridar con un complemento de una parte del segundo adaptador en la proximidad de un extremo 3' de una cadena del complemento del segundo adaptador, en el que el extremo 5' del cuarto oligonucleótido cebador se modifica para evitar la digestión por una enzima que tiene actividad exonucleasa 5';
incubar la segunda biblioteca con los tercer y cuarto oligonucleótidos cebadores en una solución en condiciones adecuadas para amplificar los polinucleótidos que tienen una secuencia de segundo adaptador-diana-segundo adaptador para producir una segunda biblioteca de polinucleótidos amplificados que tienen extremos 5' modificados para evitar la digestión por una enzima que tiene actividad exonucleasa 5’, en la que los polinucleótidos amplificados tienen una secuencia segundo adaptador amplificado-diana-segundo adaptador amplificado, y en la que la secuencia del segundo adaptador amplificado comprende una segunda secuencia específica de biblioteca;
modificar los extremos 3' de los polinucleótidos de la segunda biblioteca amplificada para evitar uno o ambos de (i) la digestión por una enzima que tiene actividad exonucleasa 3', o (ii) la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa, generando así una segunda biblioteca de polinucleótidos protegidos que tiene los extremos 5' y 3' modificados.
7. Un método según la reivindicación 6, en el que la modificación de los extremos 3' de los polinucleótidos de la segunda biblioteca amplificados comprende incorporar un didesoxinucleótido en los extremos 3' de los polinucleótidos.
8. Un método según la reivindicación 6 o la reivindicación 7, en el que:
a. los extremos 5' de los polinucleótidos de la segunda biblioteca amplificados comprenden un enlace fosforotioato, o;
b. los extremos 5' de los polinucleótidos de la segunda biblioteca amplificados comprenden tres enlaces fosforotioato.
9. Un método según una cualquiera de las reivindicaciones 6 a 8, que comprende además incubar la segunda biblioteca de polinucleótidos protegidos que tienen los extremos 3' modificados con una o más enzimas que tienen actividad exonucleasa 5' y actividad exonucleasa 3'.
10. Un método según una cualquiera de las reivindicaciones 6 a 9, que comprende además poner en contacto la superficie del sustrato con una composición que comprende la segunda biblioteca de polinucleótidos protegidos que tiene los extremos 3' modificados en condiciones que permiten la hibridación de una parte de una cadena del segundo adaptador de la segunda biblioteca de polinucleótidos protegidos a al menos una parte de los oligonucleótidos unidos a la superficie del sustrato, y opcionalmente;
en donde el método comprende además extender los oligonucleótidos unidos a la superficie del sustrato desde el extremo 3' libre mediante la incorporación de nucleótidos complementarios a una secuencia de la segunda biblioteca de polinucleótidos protegidos que tienen los extremos 3' modificados que se hibridan a los oligonucleótidos unidos para producir una copia del polinucleótido hibridado de modo que la copia se una a la superficie del sustrato, y además opcionalmente;
en el que el método comprende además amplificar la copia unida a la superficie del sustrato.
11. Un método según la reivindicación 1, en el que la secuencia del primer adaptador comprende la secuencia específica de la primera biblioteca.
12. Un método según la reivindicación 11, que comprende, además:
proporcionar una segunda biblioteca que comprende una pluralidad de polinucleótidos que tienen una secuencia segundo adaptador-diana-segundo adaptador, en la que los polinucleótidos de la segunda pluralidad son bicatenarios en una región que comprende la diana y al menos una parte del segundo adaptador en cualquier extremo de la diana, en el que el segundo adaptador comprende una secuencia específica de la segunda biblioteca,
en el que el primer oligonucleótido cebador se configura para hibridar con una parte del segundo adaptador en la proximidad de un extremo 3' de una cadena del segundo adaptador, y
en el que el segundo oligonucleótido cebador se configura para hibridar con un complemento de una parte del segundo adaptador en la proximidad de un extremo 3' de una cadena del complemento del segundo adaptador; e
incubar la segunda biblioteca en la solución con la primera biblioteca con el primer y segundo oligonucleótidos cebadores para amplificar los polinucleótidos que tienen la secuencia segundo adaptador-diana-segundo adaptador para producir una segunda biblioteca de polinucleótidos amplificados que tienen los extremos 5' modificados para evitar la digestión por una enzima que tiene actividad exonucleasa 5',
en el que la modificación de los extremos 3' de los polinucleótidos de la primera biblioteca amplificados comprende además modificar los polinucleótidos de la segunda biblioteca amplificados para evitar uno o ambos de (i) la digestión por una enzima que tiene actividad exonucleasa 3', o (ii) la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa, generando así una segunda biblioteca de polinucleótidos protegidos que tienen los extremos 5' y 3' modificados.
13. Un método según una cualquiera de las reivindicaciones 1 a 12, que comprende además incubar una composición de la primera biblioteca protegida que tiene los extremos 5' y 3' modificados con una exonucleasa.
14. Un polinucleótido producido por el método de la reivindicación 1 para secuenciación, que comprende una secuencia adaptador-diana-adaptador,
en donde la secuencia del adaptador comprende una secuencia específica de la biblioteca,
en donde el polinucleótido es bicatenario en una región que comprende la diana y al menos una parte del adaptador en ambos extremos de la diana, y
en donde los extremos 5' y 3' del polinucleótido en una región de la secuencia del adaptador son monocatenarios, en donde los extremos 5' se modifican para evitar la digestión por una enzima que tiene actividad exonucleasa 5', y en donde los extremos 3' se modifican para inhibir uno o ambos de (i) la digestión por una enzima que tiene actividad exonucleasa 3', o (ii) la adición de nucleótidos al extremo 3' mediante una enzima que tiene actividad polimerasa.
15. Una composición que comprende un polinucleótido según la reivindicación 14 y una exonucleasa.
ES18723275T 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados Active ES2882608T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762488833P 2017-04-23 2017-04-23
PCT/US2018/028881 WO2018200386A1 (en) 2017-04-23 2018-04-23 Compositions and methods for improving sample identification in indexed nucleic acid libraries

Publications (1)

Publication Number Publication Date
ES2882608T3 true ES2882608T3 (es) 2021-12-02

Family

ID=62117118

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18723275T Active ES2882608T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES21157377T Active ES2937929T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES21157377T Active ES2937929T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas

Country Status (10)

Country Link
US (3) US10934584B2 (es)
EP (2) EP3615691B1 (es)
CN (1) CN110770353B (es)
AU (3) AU2018260633C1 (es)
CA (1) CA3059952C (es)
DK (1) DK3615691T3 (es)
ES (2) ES2882608T3 (es)
FI (1) FI3842545T3 (es)
SG (1) SG11201909394PA (es)
WO (1) WO2018200386A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018259202B2 (en) 2017-04-23 2022-03-24 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CN111094584B (zh) 2017-04-23 2024-11-26 伊鲁米那股份有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
DK3615691T3 (da) 2017-04-23 2021-07-26 Illumina Inc Sammensætninger og fremgangsmåder til forbedring af prøveidentifikation i indekserede nukleinsyrebiblioteker
US10975430B2 (en) 2017-04-23 2021-04-13 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
US10081829B1 (en) 2017-06-13 2018-09-25 Genetics Research, Llc Detection of targeted sequence regions
EP3638813A4 (en) * 2017-06-13 2021-06-02 Genetics Research, LLC, D/B/A ZS Genetics, Inc. ISOLATION OF TARGET NUCLEIC ACIDS
EP3891305A1 (en) 2018-12-05 2021-10-13 Illumina Cambridge Limited Methods and compositions for cluster generation by bridge amplification
SG11202012807YA (en) 2018-12-18 2021-01-28 Illumina Cambridge Ltd Methods and compositions for paired end sequencing using a single surface primer
CN113728100A (zh) * 2019-02-25 2021-11-30 特韦斯特生物科学公司 用于下一代测序的组合物和方法
CN111961711A (zh) * 2020-08-31 2020-11-20 伯科生物科技有限公司 用于靶向测序的通用杂交增强剂及方法
WO2022125939A1 (en) * 2020-12-10 2022-06-16 The United States Government Methods for detecting homogenous targets in a population with next generation sequencing
CN113293205B (zh) * 2021-05-24 2024-11-26 深圳市真迈生物科技有限公司 测序方法
CN113981056B (zh) * 2021-11-26 2024-09-20 广州达安基因股份有限公司 基于已知标签的内参进行高通量测序的方法
AU2022424380A1 (en) 2021-12-29 2024-01-18 Illumina, Inc. Methods of nucleic acid sequencing using surface-bound primers
CN118006735B (zh) * 2023-05-30 2025-07-04 深圳赛陆医疗科技有限公司 一种snp芯片及其制备方法和应用
WO2024249591A1 (en) 2023-05-31 2024-12-05 Illumina, Inc. Methods for double-stranded sequencing by synthesis

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
EP0379559B1 (en) 1988-06-24 1996-10-23 Amgen Inc. Method and reagents for detecting nucleic acid sequences
JP2955759B2 (ja) 1988-07-20 1999-10-04 セゲブ・ダイアグノスティックス・インコーポレイテッド 核酸配列を増幅及び検出する方法
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
EP0439182B1 (en) 1990-01-26 1996-04-24 Abbott Laboratories Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
EP0754240B1 (en) 1994-02-07 2003-08-20 Beckman Coulter, Inc. Ligase/polymerase-mediated genetic bit analysis of single nucleotide polymorphisms and its use in genetic analysis
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US6232465B1 (en) 1994-09-02 2001-05-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5872244A (en) 1994-09-02 1999-02-16 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US6214987B1 (en) 1994-09-02 2001-04-10 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent formation of phosphodiester bonds using protected nucleotides
US5990300A (en) 1994-09-02 1999-11-23 Andrew C. Hiatt Enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
JP2002503954A (ja) 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6479007B1 (en) 1999-09-16 2002-11-12 University Technology Corporation Apparatus and method for controlling pore size in polymeric membranes and thin films
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7582420B2 (en) * 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
CN101525660A (zh) 2000-07-07 2009-09-09 维西根生物技术公司 实时序列测定
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
CA2344599C (en) 2001-05-07 2011-07-12 Bioneer Corporation Selective polymerase chain reaction of dna of which base sequence is completely unknown
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
EP3795577A1 (en) 2002-08-23 2021-03-24 Illumina Cambridge Limited Modified nucleotides
EP1539979B1 (en) 2002-09-20 2008-11-19 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
WO2004081183A2 (en) 2003-03-07 2004-09-23 Rubicon Genomics, Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US20050053980A1 (en) 2003-06-20 2005-03-10 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
WO2005002006A2 (en) 2003-06-30 2005-01-06 University Of Cincinnati Impurity-based electroluminescent waveguide amplifier and methods for amplifying optical data signals
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP3175914A1 (en) 2004-01-07 2017-06-07 Illumina Cambridge Limited Improvements in or relating to molecular arrays
US8209145B2 (en) 2004-06-30 2012-06-26 Georgetown Rail Equipment Company Methods for GPS to milepost mapping
KR100704641B1 (ko) 2004-07-21 2007-04-06 주식회사유한양행 고순도의 레보플록사신 제조방법
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
EP1828412B2 (en) 2004-12-13 2019-01-09 Illumina Cambridge Limited Improved method of nucleotide detection
US8623628B2 (en) 2005-05-10 2014-01-07 Illumina, Inc. Polymerases
US20090233291A1 (en) 2005-06-06 2009-09-17 454 Life Sciences Corporation Paired end sequencing
CA2615323A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
GB0514910D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Method for sequencing a polynucleotide template
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20080009420A1 (en) 2006-03-17 2008-01-10 Schroth Gary P Isothermal methods for creating clonal single molecule arrays
EP3722409A1 (en) 2006-03-31 2020-10-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2007135368A2 (en) 2006-05-18 2007-11-29 Solexa Limited Dye compounds and the use of their labelled conjugates
US7833716B2 (en) 2006-06-06 2010-11-16 Gen-Probe Incorporated Tagged oligonucleotides and their use in nucleic acid amplification methods
WO2008042067A2 (en) 2006-09-28 2008-04-10 Illumina, Inc. Compositions and methods for nucleotide sequencing
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
EP2242855A1 (en) 2008-02-05 2010-10-27 Roche Diagnostics GmbH Paired end sequencing
US8198028B2 (en) 2008-07-02 2012-06-12 Illumina Cambridge Limited Using populations of beads for the fabrication of arrays on surfaces
US20100062494A1 (en) 2008-08-08 2010-03-11 President And Fellows Of Harvard College Enzymatic oligonucleotide pre-adenylation
US8623603B2 (en) 2010-03-08 2014-01-07 Dana-Farber Cancer Institute, Inc. Full cold-PCR enrichment with reference blocking sequence
US8778848B2 (en) 2011-06-09 2014-07-15 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
DE102011084083A1 (de) 2011-06-29 2013-01-03 Robert Bosch Gmbh Rotorläufer für einen Elektromotor
CA3003082C (en) 2011-10-28 2020-12-15 Illumina, Inc. Microarray fabrication system and method
EP3366348B1 (en) 2012-01-16 2023-08-23 Greatbatch Ltd. Emi filtered co-connected hermetic feedthrough, feedthrough capacitor and leadwire assembly for an active implantable medical device
SG10201504490QA (en) 2012-01-26 2015-07-30 Nugen Technologies Inc Compositions And Methods For Targeted Nucleic Acid Sequence Enrichment And High Efficiency Library Generation
EP4148142B1 (en) * 2012-05-21 2025-08-13 The Scripps Research Institute Methods of sample preparation
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
CA2905144C (en) 2013-03-14 2023-08-22 Lyle J. Arnold Methods for amplification of nucleic acids on solid support
CA2898459C (en) 2013-03-14 2021-02-02 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
BR112015022448B1 (pt) 2013-03-15 2020-12-08 Illumina Cambridge Limited molécula de nucleotídeo ou nucleosídeo modificado, métodos para preparar o crescimento de polinucleotídeo complementar a polinucleotídeo alvo de fita simples em reação de sequenciação e para determinar a sequência de polinucleotídeo alvo de fita simples e kit
CN105431554B (zh) 2013-07-01 2019-02-15 Illumina公司 无催化剂的表面官能化和聚合物接枝
ES2764096T3 (es) 2013-08-19 2020-06-02 Abbott Molecular Inc Bibliotecas de secuenciación de próxima generación
JP6626830B2 (ja) * 2013-11-07 2019-12-25 アジレント・テクノロジーズ・インクAgilent Technologies, Inc. Dna操作のための複数のトランスポザーゼアダプター
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
ES2788949T3 (es) 2014-06-27 2020-10-23 Illumina Inc Polimerasas modificadas para la incorporación mejorada de análogos de nucleótidos
WO2016054096A1 (en) 2014-09-30 2016-04-07 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
EP3207169B1 (en) 2014-10-14 2020-07-01 MGI Tech Co., Ltd. Mate pair library construction
DK3212684T3 (da) 2014-10-31 2020-03-02 Illumina Cambridge Ltd Polymerer og DNA-copolymer-belægninger
KR20240091073A (ko) 2015-02-10 2024-06-21 일루미나, 인코포레이티드 세포 성분을 분석하기 위한 방법 및 조성물
WO2017007220A1 (ko) 2015-07-06 2017-01-12 삼성전자 주식회사 전자 장치 및 전자 장치에서의 디스플레이 제어 방법
US9850484B2 (en) 2015-09-30 2017-12-26 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (Circle-seq)
GB201615486D0 (en) 2016-09-13 2016-10-26 Inivata Ltd Methods for labelling nucleic acids
US10968447B2 (en) 2017-01-31 2021-04-06 Myriad Women's Health, Inc. Methods and compositions for enrichment of target polynucleotides
DK3615691T3 (da) 2017-04-23 2021-07-26 Illumina Inc Sammensætninger og fremgangsmåder til forbedring af prøveidentifikation i indekserede nukleinsyrebiblioteker
CN111094584B (zh) 2017-04-23 2024-11-26 伊鲁米那股份有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
US10975430B2 (en) 2017-04-23 2021-04-13 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
AU2018259202B2 (en) 2017-04-23 2022-03-24 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
WO2019007945A1 (en) 2017-07-07 2019-01-10 Unilever N.V. Water-soluble package
WO2020000380A1 (zh) 2018-06-29 2020-01-02 长江存储科技有限责任公司 半导体结构及其形成方法

Also Published As

Publication number Publication date
AU2024202607A1 (en) 2024-05-09
WO2018200386A1 (en) 2018-11-01
US20250243538A1 (en) 2025-07-31
CN110770353B (zh) 2024-11-26
CN110770353A (zh) 2020-02-07
US12247254B2 (en) 2025-03-11
EP3842545B1 (en) 2022-11-30
CA3059952A1 (en) 2018-11-01
US20210172014A1 (en) 2021-06-10
CA3059952C (en) 2023-04-18
EP3615691A1 (en) 2020-03-04
FI3842545T3 (fi) 2023-01-31
US20180305752A1 (en) 2018-10-25
US10934584B2 (en) 2021-03-02
AU2018260633C1 (en) 2024-08-15
DK3615691T3 (da) 2021-07-26
EP3615691B1 (en) 2021-05-26
AU2021203361A1 (en) 2021-06-24
WO2018200386A8 (en) 2019-02-14
ES2937929T3 (es) 2023-04-03
EP3842545A1 (en) 2021-06-30
AU2021203361B2 (en) 2024-05-16
AU2018260633A1 (en) 2019-10-31
AU2018260633B2 (en) 2021-04-15
SG11201909394PA (en) 2019-11-28

Similar Documents

Publication Publication Date Title
ES2882608T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES2929837T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES2889585T3 (es) Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
US10975430B2 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
US20210230689A1 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40043984B (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40043984A (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40014781B (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40014781A (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40049316A (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40049316B (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40015459A (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
HK40015459B (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries