[go: up one dir, main page]

ES2987423T3 - Procedimientos y composición para un análisis genómico dirigido - Google Patents

Procedimientos y composición para un análisis genómico dirigido Download PDF

Info

Publication number
ES2987423T3
ES2987423T3 ES19840255T ES19840255T ES2987423T3 ES 2987423 T3 ES2987423 T3 ES 2987423T3 ES 19840255 T ES19840255 T ES 19840255T ES 19840255 T ES19840255 T ES 19840255T ES 2987423 T3 ES2987423 T3 ES 2987423T3
Authority
ES
Spain
Prior art keywords
oligonucleotide
dna
probe
duplex
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19840255T
Other languages
English (en)
Inventor
Christopher Raymond
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Salish Bioscience Inc
Original Assignee
Salish Bioscience Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Salish Bioscience Inc filed Critical Salish Bioscience Inc
Application granted granted Critical
Publication of ES2987423T3 publication Critical patent/ES2987423T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La divulgación proporciona métodos y reactivos para preparar bibliotecas de ADN a partir de materiales biológicos para secuenciación dirigida. El enfoque puede mejorar la eficiencia y la sensibilidad de las aplicaciones de secuenciación dirigida, como los análisis de biopsia líquida para evaluar condiciones impulsadas genéticamente. En una realización, el método divulgado comprende unir el extremo 5' de un adaptador de oligonucleótidos al extremo 3' de un fragmento de ADN bicatenario para producir una molécula quimérica de adaptador/fragmento; producir al menos una cadena complementaria de la molécula quimérica de adaptador/fragmento mediante amplificación lineal; hibridar la al menos una cadena complementaria con una sonda de oligonucleótidos, en donde la sonda de oligonucleótidos comprende un dominio de hibridación con una secuencia que se hibrida con una secuencia diana en la cadena complementaria para producir un dúplex de cadena complementaria/sonda dirigido; purificar el dúplex de cadena complementaria/sonda dirigido; y extender la sonda en el dúplex de cadena complementaria/sonda dirigido purificado y amplificar con PCR para producir una pluralidad de moléculas de plantilla de secuenciación. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Procedimientos y composición para un análisis genómico dirigido
REFERENCIA CRUZADA A LA SOLICITUD RELACIONADA
[0001] La presente solicitud reivindica el beneficio de la Solicitud Provisional No.62/702824, presentada el 25 de julio de 2018.
DECLARACIÓN SOBRE LA LISTA DE SECUENCIAS
[0002] La lista de secuencias asociada con esta solicitud se proporciona en formato de texto en lugar de una copia en papel y por la presente se incorpora como referencia en la memoria descriptiva. El nombre del archivo de texto que contiene la lista de secuencias es 68524_Seq_2019-07-22.txt. El archivo de texto tiene 49 KB; fue creado el 22 de julio de 2019; y se envía a través de EFS-Web junto con la presentación de la memoria descriptiva.
CAMPO DE INVENCIÓN
[0003] La presente divulgación se refiere al análisis dirigido de material genómico a partir de muestras biológicas. Por ejemplo, la divulgación aborda las composiciones y procedimientos para generar bibliotecas de secuenciación para la secuenciación dirigida de ADN, tal como el obtenido en muestras ambientales o biológicas.
ANTECEDENTES
[0004] Con la llegada de las tecnologías de secuenciación de próxima generación, se pueden producir rápidamente cantidades masivas de datos de secuenciación de ADN a partir de muestras iniciales. Estos datos han mejorado la capacidad de caracterizar rápidamente la muestra fuente de la que se derivaron las plantillas genómicas.
[0005] Por ejemplo, en el contexto del diagnóstico de enfermedades, los cánceres son enfermedades en las que se han producido cambios genómicos perjudiciales. Las mutaciones que causan enfermedades en muchos cánceres se pueden discernir mediante la secuenciación del ADN, siempre que se pueda obtener el ADN fuente y dicha caracterización genómica pueda facilitar terapias de precisión. En este contexto, el análisis genómico del cáncer implica a menudo la caracterización del tejido neoplásico obtenido mediante una biopsia. Sin embargo, muchos cánceres de tipo líquido y sólido liberan fragmentos de ADN tumoral circulantes ("ADNtc", en inglés“ctDNA”)en líquidos corporales, tales como el torrente sanguíneo. Tanto en individuos sanos sin cáncer como en pacientes con cáncer, se encuentra una cantidad apreciable de ADN fragmentado con secuencias de ADN normales en la fracción de plasma libre de células de la sangre entera. Los fragmentos de ADN normal de un individuo a menudo se describen como fragmentos de "ADN de la línea germinal", y la totalidad del ADN presente en el plasma sanguíneo a menudo se denomina ADN libre de células circulante ("ADNlc", en inglés“IcDNA”).En sujetos con cáncer, una cantidad variable de ADNtc está presente dentro del ADNlc general. El ADN libre de células también se encuentra en otros fluidos corporales, tales como la orina, el líquido cefalorraquídeo, la saliva y similares. La apreciación de que los fluidos corporales fácilmente accesibles podrían servir como fuente de ADN tumoral, junto con la aparición de plataformas de secuenciación de ADN masivamente paralelo (también conocidas como secuenciación de próxima generación o "NGS"), ha impulsado el desarrollo de tecnologías para diagnósticos relativamente no invasivos y monitorización de cánceres mediante la detección de ADNtc a partir de muestras de ADNlc. Esto se conoce como "biopsia líquida". Por lo tanto, con el poder cada vez mayor de los enfoques sensibles de NGS, existe un reconocimiento cada vez mayor de la utilidad de la secuenciación de ADNlc en varias áreas de la oncología medicinal.
[0006] Los cánceres pueden identificarse mediante diversas lesiones de ADN ("mutaciones") diferentes que se producen dentro del ADN de células de tejido enfermo. Estas incluyen, pero sin limitarse a las mismas, mutaciones puntuales del ADN, a menudo denominadas variantes de un solo nucleótido (SNV,single nucleotide variants),que alteran la función o expresión de genes específicos que suprimen la aparición de tumores ("supresores de tumores") o que estimulan la proliferación incontrolada de tejido neoplásico ("oncogenes"). De manera similar, las inserciones o eliminaciones de secuencias de ADN ("indeles") que alteran la función génica también se asocian habitualmente con ciertos cánceres. Los reordenamientos genómicos en los que se fusionan segmentos cromosómicos normalmente separados también pueden generar fusiones entre genes cuyo producto quimérico impulsa la tumorigénesis ("fusiones"). Los reordenamientos cromosómicos a gran escala también son comunes en el cáncer y dichos reordenamientos pueden aumentar el número de copias de genes ("amplificaciones") o disminuir el número de copias ("deleciones"). Ambos tipos de lesiones pueden alterar los patrones de expresión de los genes afectados y promover así el crecimiento tumoral. Finalmente, ciertos tipos de cáncer crean firmas genómicas globales que incluyen pérdida de heterocigosidad (LOH, loss-of-heteozygosity), lo que significa que el genotipo parental normalmente diploide se convierte en un estado uniparental con o sin pérdida cromosómica acompañante. Las firmas adicionales en las células tumorales incluyen la inestabilidad de microsatélites en la que el número de copias de secuencias repetidas dentro de elementos repetitivos del ADN se expanden o contraen y/o cambios globales en la ploidía cromosómica que alteran el número total de cromosomas y las relaciones del número de copias entre los cromosomas. Los tumores con estos últimos tipos de lesiones son buenos candidatos para la respuesta a las terapias de puntos de control inmunológico y, por lo tanto, son elementos esenciales del análisis genómico de la biopsia líquida.
[0007] Las biopsias líquidas tienen potencialmente ventajas considerables sobre el análisis genómico convencional basado en tejidos. A modo de ejemplo, a un paciente hipotético se le puede diagnosticar cáncer de pulmón de células no pequeñas (NSCLC,non-small cell lung cáncer)que es del subtipo adenocarcinoma mediante una biopsia con aguja fina. Sin embargo, la técnica no proporciona tejido adecuado para el análisis genómico del tumor. Una biopsia líquida de este paciente podría proporcionar un diagnóstico definitivo de que las mutaciones causales que impulsan el crecimiento del tumor son uno de varios tipos potenciales que se pueden tratar con terapia dirigida. La ventaja de este procedimiento de diagnóstico es que no requiere una biopsia de tejido invasiva que requiere mucho tiempo y supone un riesgo adicional significativo para la salud del paciente. Los resultados de la biopsia líquida están disponibles en unos días, en lugar de semanas para una biopsia de tejido. Teniendo en cuenta que en muchos tratamientos contra el cáncer el tiempo es esencial, la eficiencia del diagnóstico puede proporcionar una ventaja fundamental en las terapias adecuadas. Finalmente, la biopsia líquida es considerablemente menos costosa que la escisión quirúrgica del tejido profundo de un órgano corporal. Esto es especialmente cierto cuando se tiene en cuenta el hecho de que no todas las muestras de biopsia de tejido proporcionan resultados definitivos. En conjunto, la biopsia líquida es, por lo tanto, menos costosa, más rápida y más confiable, todo lo cual sugiere que este procedimiento de diagnóstico probablemente se convertirá en la atención médica estándar para ciertos tipos de cánceres.
[0008] Si bien se puede argumentar que las biopsias líquidas deberían ser la atención médica estándar de primera línea en el diagnóstico genómico del cáncer recién detectado, es probable también que haya una mayor utilidad de las biopsias líquidas en la monitorización de la recaída de la enfermedad, la monitorización de la proliferación de tumores irresecables y la monitorización de la eficacia del tratamiento. Con respecto a la recaída de la enfermedad, es probable que algunos cánceres recaigan con mutaciones de resistencia a la terapia dirigida inicial. Es posible mantener la calidad de vida cambiando a terapias que superen el mecanismo de resistencia a las enfermedades. En este escenario, las biopsias líquidas pueden tener dos aplicaciones, la primera es la monitorización de la recaída de la enfermedad y la segunda el diagnóstico de la resistencia al tratamiento. Con respecto a los tumores irresecables (por ejemplo, metastásicos), las imágenes radiológicas son actualmente la atención médica estándar para monitorizar la carga tumoral. A menudo hay poca diferencia entre las imágenes de un tumor tratado con éxito que se ha convertido en tejido cicatricial necrótico y un tumor resistente al tratamiento. Se están acumulando pruebas de que la cantidad de ADNtc es profundamente diferente entre estos dos escenarios, siendo el ADNtc esencialmente indetectable con un tratamiento exitoso en lugar de aumentar los niveles de ADNtc en pacientes con tumores resistentes. Este escenario emergente, donde los tumores sensibles dejan de eliminar ADNtc mientras que los tumores recalcitrantes continúan liberando fragmentos de ADN tumoral, puede tener un profundo impacto en el tratamiento del paciente y el coste de la atención médica oncológica. El beneficio de la monitorización temprana del tratamiento utilizando niveles de ADNtc medidos mediante biopsias líquidas es que los pacientes que responden deben continuar el tratamiento, mientras que los que no responden pueden cambiar a diferentes terapias antes de que la enfermedad progrese más. Con respecto a la contención de costes, muchas terapias dirigidas son exorbitantemente caras, aunque la eficacia del tratamiento rara vez es del 100 %. Dada la posibilidad de que sea posible monitorizar la eficacia del tratamiento utilizando niveles de ADNtc detectados mediante biopsia líquida dentro de los días o semanas posteriores al inicio del tratamiento, estas pruebas inmediatas de la eficacia del tratamiento podrían usarse para identificar a los pacientes que se benefician de una terapia costosa frente a aquellos que no lo hacen y es necesario considerar enfoques alternativos. En todos estos escenarios, la tecnología de biopsia líquida debe poseer la capacidad de medir cuantitativamente los niveles de ADNtc en comparación con la referencia del ADNlc circulante normal. Además, esta capacidad de evaluación cuantitativa debe persistir en el contexto donde los niveles relativos de ADNtc diana son cada vez más pequeños en comparación con el ADNlc de referencia.
[0009] Sin embargo, las metodologías actuales de obtención y procesamiento de muestras fuente no logran aprovechar completamente la potencia y la sensibilidad de las plataformas NGS para detectar con precisión secuencias raras. Nuevamente, en el contexto del diagnóstico de cáncer, los donantes humanos sanos tienen aproximadamente 5 ng de ADNlc por 1 ml de plasma. Ciertas condiciones aumentan este nivel, incluido el ejercicio extenuante, el embarazo, la quimioterapia, el cáncer y las enfermedades autoinmunes. Un genoma humano haploide tiene una masa de 3,3 pg, por lo que hay aproximadamente 1500 genomas haploides/ml de plasma en un donante sano. En el caso del cáncer, la fracción de ADNlc que es ADNtc derivado de un tumor puede ser muy baja, es decir, menos del 1 %, menos del 0,1 % y, a menudo, incluso más baja. Esto corresponde a 15 genomas derivados de tumores/ml de plasma con una "fracción alélica" del 1% y 1,5 genomas derivados de tumores/ml de plasma con una fracción alélica del 0,1 %, definida como la proporción de secuencias relacionadas con el cáncer en relación con el número total de secuencias recuperadas de la muestra. Además, la sensibilidad de los procedimientos basados en secuencias para detectar variantes raras es directamente proporcional al número de fragmentos de ADNlc que se "convierten" en moléculas de ADN analizables. En el contexto de NGS, "conversión" significa la unión de oligonucleótidos adaptadores adicionales al ADNlc, de manera que sea susceptible de secuenciación del ADN. Sin embargo, las entidades que ofrecen servicios o kits de análisis de ADNlc rara vez miden rigurosamente estas eficiencias de conversión. Dado el número inicial potencialmente bajo de fragmentos indicativos de enfermedad en el ADNlc, las bajas tasas de conversión actuales representan una debilidad importante en el estado actual de la técnica. El documento US2018/142234A1 se relaciona con procedimientos para el análisis genómico dirigido.
[0010] Los procedimientos de clonación de ADN convencionales se basan en la unión de moléculas adaptadoras a ambos extremos de un fragmento de ADN fuente seguido de un esquema de amplificación de ADN (es decir, PCR). Si falla la unión del adaptador a un extremo del fragmento de ADN, entonces el fragmento se pierde en el análisis posterior. Además, la mayoría de los esquemas de clonación se basan en el pulido y la modificación (por ejemplo, la cola A y/o la fosforilación del extremo 5') de los extremos de los fragmentos de ADNlc y, tal como se describió anteriormente, el fallo en la cola A y/o la fosforilación de los extremos 5' conduce a un fallo de la unión del adaptador y, por lo tanto, pérdida del fragmento del análisis posterior. Además, la formación de intermedios de ADN adenililado que se disocian de la enzima ligasa antes de la formación del enlace fosfodiéster son subproductos relativamente comunes en las reacciones de ligadura de ADN, y estos intermedios son bloqueados para que no se unan más a los adaptadores. Estas deficiencias provocan un sesgo de la señal y la pérdida de información de la secuencia, lo que, dada la rareza de algunas dianas, tales como los marcadores de enfermedades, puede dar lugar a una caracterización y un diagnóstico erróneos críticos.
[0011] Por tanto, a pesar de los avances en la técnica de las plataformas de secuenciación de próxima generación y la comprensión de la genética de las enfermedades, siguen existiendo deficiencias críticas en la técnica a la hora de proporcionar estrategias rápidas, sensibles y económicas para examinar muestras biológicas en busca de secuencias diana conocidas. La presente divulgación aborda estas y otras necesidades relacionadas.
DESCRIPCIÓN RESUMIDA
[0012] La presente invención se define en las reivindicaciones adjuntas.
[0013] Esta descripción resumida se proporciona para presentar una selección de conceptos en una forma simplificada que se describen con más detalle a continuación en la Descripción Detallada. Esta descripción resumida no pretende identificar características clave de la materia reivindicada, ni pretende ser utilizada como ayuda para determinar el alcance de la materia reivindicada.
[0014] En un aspecto, la divulgación da a conocer un procedimiento para generar una biblioteca de ADN para secuenciación dirigida. El procedimiento comprende:
a) unir el extremo 5' de un adaptador de oligonucleótido al extremo 3' de un fragmento de ADN bicatenario para producir una molécula quimérica adaptador/fragmento;
b) producir al menos una cadena complementaria de la molécula quimérica adaptador/fragmento mediante amplificación lineal;
c) hibridar dicha al menos una cadena complementaria con una sonda de oligonucleótidos, en el que la sonda de oligonucleótidos comprende un dominio de hibridación con una secuencia que se hibrida con una secuencia diana en la cadena del complemento para producir un dúplex de cadena de complemento dirigida/sonda;
d) purificar el dúplex de cadena de complemento dirigida/sonda; y
e) extender la sonda en el dúplex de cadena de complemento dirigida/sonda purificado y amplificarla con PCR para producir una pluralidad de moléculas plantilla de secuenciación.
[0015] El procedimiento puede seguirse realizando la secuenciación del ADN de la pluralidad de moléculas de secuenciación utilizando una plataforma de secuenciación de próxima generación apropiada.
[0016] En otro aspecto, la divulgación da a conocer un kit, que no forma parte de la invención reivindicada. El kit puede comprender: un adaptador de oligonucleótido, una ADN polimerasa con actividad exonucleasa de 3' a 5' capaz de crear extremos romos en ADN de doble cadena, una pluralidad de enzimas que median en la reparación del ADN, una enzima de ligadura de ADN e indicaciones escritas que dan instrucciones para la realización del procedimiento descrito en el presente documento. En algunas realizaciones, el kit también comprende sondas de oligonucleótidos de ADN para la recuperación de loci genómicos específicos de la diana.
DESCRIPCIÓN DE LOS DIBUJOS
[0017] Los aspectos anteriores y muchas de las ventajas inherentes de la presente invención se entenderán más fácilmente a medida que se comprendan mejor con referencia a la siguiente descripción detallada, cuando se toma en conjunto con los dibujos adjuntos, en los que:
Las FIGURAS 1A-1F proporcionan una descripción general esquemática de una realización de ejemplo del proceso divulgado para el análisis de secuencia dirigida de ADN genómico. Se ilustra un esquema en dibujos que muestra un proceso ilustrativo de cuatro etapas para generar bibliotecas de secuenciación a partir de a Dn libre de células purificado según una realización de esta divulgación. Si bien este esquema ilustra las etapas de modificación para una sola molécula, se entenderá que este proceso se puede ampliar para abordar uno o múltiples lotes de una pluralidad de fragmentos de ADNbc (por ejemplo, ADNlc aislado de una o más muestras biológicas). La FIGURA 1A ilustra que el material de entrada es ADNbc aislado o purificado (10) (por ejemplo, ADNlc). La FIGURA 1B ilustra la Etapa 1, en la que la unión de un adaptador de oligonucleótido multifuncional (20; también denominado "oligonucleótido LINDA") a los extremos 3' del ADNbc (10) para producir una molécula quimérica adaptador/fragmento (30). Los puntos negros en la Figura 1B representan el enlace fosfodiéster entre el adaptador LINDA (20) y el fragmento de ADN de muestra que se crea mediante ligadura de ADN. La FIGURA 1C ilustra la Etapa 2, en el que una amplificación lineal genera una o más cadenas plantilla diana (50) que son cadenas complementarias de la molécula quimérica adaptador/fragmento (30) usando un primer cebador (40). La FIGURA 1D ilustra la Etapa 3, en la que una sonda de oligonucleótidos de reconocimiento (70; también denominada "sonda de oligonucleótidos Fetcher") se hibrida con la cadena plantilla complementaria (50). A esto le sigue la purificación térmica y física del dúplex de la cadena de complemento dirigida/sonda de oligonucleótido (60) y la extensión con cebador de la sonda de oligonucleótido (Fetcher) (50) utilizando la cadena de complemento diana (50) como plantilla. La FIGURA 1E ilustra la Etapa 4, en la que la amplificación por PCR se realiza en la plantilla extendida (80) usando cebadores de PCR directos e inversos específicos de la plataforma (90 y 100, respectivamente) para generar moléculas plantilla de secuenciación (no mostradas) y de ese modo completar el proceso de construcción de la biblioteca de secuenciación de ADNbc reconocido. La FIGURA 1F ilustra la aplicación posterior de la secuenciación de ADN de extremos emparejados de las moléculas plantilla de secuenciación (110) usando cebadores directos e inversos de secuenciación apropiados de la plataforma (120 y 130, respectivamente), que se pueden usar para obtener la información de secuencia requerida para análisis posteriores.
Las FIGURAS 2A y 2B son ilustraciones de dibujos de dos diseños ilustrativos de un adaptador de oligonucleótido multifuncional de ~45 nucleótidos (amplificación lineal de ADN u oligonucleótido "LINDA") según dos realizaciones de esta divulgación. La FIGURA 2A ilustra un concepto de diseño donde la cadena ligada a la "cadena de ligadura" de ADN bicatenario tiene un dominio de hibridación (22) para amplificación en el extremo 3', con un dominio de etiqueta de clones interno (24) y un dominio de etiqueta de muestras (26) en el extremo 5'. En la realización ilustrada, hay un oligonucleótido dúplex complementario (140) hibridado sobre el extremo 3' que sirve como "cadena asociada" para proporcionar un dúplex adaptador (145). El oligonucleótido dúplex complementario (140) tiene un espaciador C3 en su extremo 3'. La FIGURA 2B ilustra otra realización en la que el diseño se invierte y que se demostró que proporciona un mayor rendimiento de clones con etiquetas de muestra intactas. Específicamente, la "cadena asociada" tiene dominios correspondientes al dominio de hibridación (22) para la amplificación en el extremo 5', con un dominio de etiqueta de clones interno (24), y un dominio de etiqueta de muestras (26) en el extremo 3', con un espaciador C3 en el extremo 3'. El garabato representa un espaciador C3 interno (144) insertado dentro del oligonucleótido cerca del extremo 5'. La "cadena de ligadura" se extiende mediante una ADN polimerasa durante el proceso de unión (ligadura) del adaptador copiando del oligonucleótido dúplex complementario hibridado (142) del dúplex adaptador (146) usando la "cadena asociada" como plantilla. Como en la FIGURA 1D, el diagrama indica la dirección de extensión con el cebador con una flecha para crear la "cadena de ligadura" de longitud completa. En última instancia, la "cadena de ligadura" de cualquier realización (por ejemplo, en las FIGURAS 2A y 2B) se muestra en la FIGURA 1B como elemento (20).
Las FIGURAS 3A y 3B son ilustraciones de dibujos de características de diseño ilustrativas de sondas de oligonucleótidos de ~85 nucleótidos ("sondas de oligonucleótidos Fetcher") según una realización de esta divulgación. La FIGURA 3A ilustra una realización en la que la sonda de oligonucleótidos comprende un dominio de hibridación (70) en el extremo 3'. El dominio de hibridación de ~40 nt comprende una secuencia que se hibrida con una secuencia diana (por ejemplo, en un fragmento de ADNbc diana (10)) que aparecerá en la cadena complementaria amplificada linealmente (50; ver FIGURAS 1C y 1D) y una sección de cola de ~45 nt que es común al conjunto de sondas de oligonucleótidos Fetcher con un dominio de hibridación de cebador (74) en el extremo 5'. El dominio de hibridación del cebador (74) facilita la purificación de los dúplex de cadena de complemento dirigida/sonda (60) y la posterior amplificación de las moléculas plantilla de secuenciación (110). La FIGURA 3B ilustra una realización adicional del diseño de sondas de oligonucleótidos utilizadas en estudios preliminares. Se añadió un oligonucleótido duplexante de ~45 nt (147) complementario a la secuencia de la cola. El oligonucleótido dúplex complementario (147), que se hibrida con la secuencia de la cola de Fetcher (por ejemplo, 70), incluye una modificación terminal que contiene biotina [150; "B"] para la purificación con microesferas magnéticas recubiertas de estreptavidina y una o más bases internas de didesoxiuracilo (148) para la escisión de los dúplex de cadena de complemento dirigida/sonda de las microesferas después de la purificación.
La FIGURA 4 muestra un gel de ADN de agarosa al 2 % de las fracciones de la biblioteca de secuenciación total (T) y purificada (P) descritas en el EJEMPLO 3. El tamaño en pb de los marcadores de peso molecular flanqueantes se indica a la izquierda.
La FIGURA 5 ilustra gráficamente el porcentaje de lecturas de dianas específicas para los oligonucleótidos de la sonda de 127 oligonucleótidos ("Fetcher") utilizados en los experimentos preliminares.
La FIGURA 6 ilustra gráficamente el perfil de distribución del tamaño de inserción para clones secuenciados de ADNlc reconocidos.
La FIGURA 7 muestra el número de lecturas únicas observadas para cada uno de los oligonucleótidos de las sondas de 62 oligonucleótidos ("Fetcher") en el conjunto de hibridación "A". Los datos de la sonda SRY no se muestran para esta muestra femenina.
DESCRIPCIÓN DETALLADA
[0018] La presente divulgación aborda el análisis de secuencias reconocidas de ADN en muestras que abordan y superan muchas de las deficiencias de la técnica disponible. La estrategia divulgada se puede aplicar a cualquier muestra, por ejemplo, biológica o ambiental, donde se conoce la secuencia genómica de referencia para el ADN diana que se va a detectar y secuenciar. Esta descripción se presenta dentro del contexto de una aplicación particularmente relevante y útil, a saber, la detección dirigida de marcadores genéticos conocidos presentados en ADNlc a partir de muestras de biopsia líquida de sujetos que potencialmente tienen cáncer. Sin embargo, las personas con conocimientos habituales en la técnica entenderán que los reactivos y metodologías divulgados se pueden aplicar igual y fácilmente a la detección de ADN heterólogo (tal como en infecciones) de una muestra de huésped. De manera alternativa, la divulgación también abarca el análisis de muestras ambientales para detectar la presencia de una secuencia genómica conocida para identificar si un organismo particular (con un perfil genético único) está presente.
[0019] De acuerdo con lo anterior, en un aspecto, la divulgación da a conocer un procedimiento para generar una biblioteca de ADN para secuenciación dirigida. El procedimiento comprende las siguientes etapas:
a) unir el extremo 5' de un adaptador de oligonucleótido al extremo 3' de un fragmento de ADN bicatenario para producir una molécula quimérica adaptador/fragmento;
b) producir al menos una cadena complementaria de la molécula quimérica adaptador/fragmento mediante amplificación lineal;
c) hibridar dicha al menos una cadena complementaria con una sonda de oligonucleótidos, en el que la sonda de oligonucleótidos comprende un dominio de hibridación con una secuencia que se hibrida con una secuencia diana en la cadena del complemento para producir un dúplex de cadena de complemento dirigida/sonda;
d) purificar el dúplex de cadena de complemento dirigida/sonda; y
e) extender la sonda en el dúplex de cadena de complemento dirigida/sonda purificado y amplificarla con PCR para producir una pluralidad de moléculas plantilla de secuenciación.
[0020] Una representación esquemática de una realización de ejemplo del procedimiento se proporciona en las FIGURAS 1A-1F.
Unión de un adaptador de oligonucleótido
[0021] Tal como se indicó anteriormente, la biblioteca de secuenciación típica se construye amplificando inicialmente el plantilla, incluidas moléculas plantilla raras, mediante la unión de moléculas adaptadoras en ambas cadenas de ADNbc para facilitar la amplificación basada en PCR. Sin embargo, estos enfoques sufren la pérdida de moléculas plantilla de entrada, especialmente moléculas plantilla raras, de la biblioteca debido a una unión inadecuada o incompleta de uno de los adaptadores del extremo necesarios para la amplificación inicial de la plantilla. Una ventaja clave de la presente divulgación es que la unión de solo un adaptador individual a un extremo del ADN es suficiente para apoyar la generación posterior y el análisis del fragmento de ADN.
[0022] El procedimiento divulgado proporciona la unión del extremo 5' de un adaptador de oligonucleótido (20; también denominado "oligonucleótido LINDA") a los extremos 3' de ADNbc (10) para producir una molécula quimérica adaptador/fragmento (30). Ver la FIGURA 1B. Las realizaciones del adaptador de oligonucleótido pueden comprender varios dominios y características definidos que confieren múltiples funcionalidades. En algunas realizaciones, el adaptador de oligonucleótido comprende un grupo fosfato en el extremo 5'. En esta configuración, es el adaptador el que proporciona el fosfato necesario para unir el adaptador al extremo 3' de una cadena de la molécula de ADNbc. En consecuencia, la unión de la molécula adaptadora no depende del estado de la molécula de ADNbc. Si, por casualidad, una molécula adaptadora careciera de dicho fosfato 5', no podría participar en la ligadura de fragmentos. Sin embargo, cuando se realiza prácticamente a escala con múltiples moléculas, otra molécula adaptadora que tiene un fosfato 5' ocupa su lugar y se adhiere con éxito. De manera similar, si un dúplex adaptador se disocia de la ligasa como un intermedio de ADN adenililado, este proceso abortivo no disminuirá la eficiencia de conversión del proceso. Los fragmentos de ADNbc tienen el requisito más simple de que deben tener extremos romos con un grupo hidroxilo 3' libre para apoyar la unión del adaptador, y las observaciones empíricas sugieren que la eficiencia de la unión del adaptador en el presente esquema se aproxima al 100 % de eficiencia.
[0023] En algunas realizaciones, el adaptador de oligonucleótido (20) comprende un dominio de hibridación de cebador (22) con una secuencia de nucleótidos que permite la amplificación por PCR lineal o exponencial tras la hibridación de un cebador. Ver las FIGURAS 1B, 2A y 2b . El dominio de hibridación del cebador (22) se puede configurar para que tenga cualquier longitud que permita la hibridación de un cebador con fines de amplificación lineal o exponencial (tal como en metodologías de PCR típicas). Las longitudes de ejemplo están entre aproximadamente 15 y aproximadamente 45 nucleótidos, tales como aproximadamente 20, aproximadamente 25, aproximadamente 30, aproximadamente 35, aproximadamente 45 nucleótidos o más. Si bien la secuencia no se limita a una secuencia o conjunto de secuencias particulares, se debe conocera prioride manera que se puedan utilizar cebadores apropiados más adelante en el procedimiento para hibridar y extender a partir de los dúplex creados. El dominio de hibridación del cebador (22) suele estar en el extremo 3' del adaptador de oligonucleótido (20) con respecto a otro dominio que se analiza a continuación.
[0024] En algunas realizaciones, el adaptador de oligonucleótido comprende un dominio de etiqueta de clones (24) con una secuencia de nucleótidos que marca de forma única cada molécula plantilla de secuenciación que comprende una secuencia derivada del adaptador de oligonucleótido inicial (20). El dominio de etiqueta de clones (24) normalmente comprende una serie corta (por ejemplo, 5, 6, 7, 8, 9, 10, o así) que es una secuencia aleatoria de bases, por ejemplo, donde A, C, G o T se representan aleatoriamente. Cuando se considera en conjunto (es decir, en una población de una pluralidad de adaptadores de oligonucleótidos), la secuencia es degenerada. Por lo tanto, no es necesario conocera priorila secuencia de ningún adaptador de oligonucleótido individual (20). En teoría, hay un total de 65.536 posibles etiquetas de clon generadas por este esquema de nucleótidos aleatorios para un dominio de etiqueta de clones de 8 nucleótidos (24). Después de la secuenciación, la secuencia de ADN de una etiqueta de clones generada aleatoriamente se combina con las coordenadas de mapeo de los fragmentos de ADNbc y este proceso genera un identificador único para cada secuencia de ADNbc. Las frases "mapa" y "mapeo" se utilizan a menudo como una referencia abreviada al hecho de que una secuencia de ADN (es decir, una lectura de secuencia NGS) tiene la misma secuencia de nucleótidos o similar que un segmento particular del genoma de referencia diana (por ejemplo, el genoma humano). Esta coincidencia también se denomina "alineación" y las frases mapa, mapeable, mapear y alinear están relacionadas. Las alineaciones del ADN se descubren mediante algoritmos informáticos de coincidencia de secuencias (por ejemplo, BLAST, BLAT, BOWTIE, etc.).
[0025] En algunas realizaciones, el adaptador de oligonucleótido comprende un dominio de etiqueta de muestras (26) con una secuencia de ácido nucleico que marca muestras independientes de fragmentos de ADN bicatenario y, por lo tanto, permite el análisis multiplex de múltiples muestras a la vez. Al igual que el dominio de etiqueta de clones (24), el dominio de etiqueta de muestras (26) normalmente comprende una serie corta (por ejemplo, 5, 6, 7, 8, 9, 10 o así) de nucleótidos. Sin embargo, en lugar de una secuencia aleatoria, el dominio de etiqueta de muestras (26) tiene una secuencia predeterminada que identifica de forma única un lote o muestra. Por ejemplo, en una realización múltiple del procedimiento, una primera muestra comprende ADN obtenido de una primera fuente, y una segunda muestra comprende ADN obtenido de una segunda fuente (por ejemplo, un sujeto diferente o una muestra biológica diferente). Estas fuentes pueden ser rastreadas por el dominio de etiqueta de muestras que se incorpora a la biblioteca de secuenciación incluso si los componentes finalmente se combinan después de que las etapas iniciales de unión se realicen en paralelo. Dicho de otra manera, esta característica permite la multiplexación de muestras durante la secuenciación del ADN. Las secuencias que pertenecen a muestras específicas se pueden identificar mediante su marcador de muestra específica en el análisis posterior a NGS. Se pueden usar muchos oligonucleótidos adaptadores diferentes en las etapas iniciales para multiplexar y, a continuación, diferenciar entre muchas muestras que se pueden combinar en una única reacción NGS. Por supuesto, también es posible que se puedan unir muchos oligonucleótidos adaptadores diferentes a la misma muestra de ADNbc, y esto a veces es necesario para promover la llamada de bases adecuadas en algunas plataformas NGS.
[0026] En algunas realizaciones, el adaptador de oligonucleótido (20) comprende un dominio de hibridación (22), un dominio de etiqueta de clones (24) y un dominio de etiqueta de muestras (26). Normalmente, el dominio de hibridación (22) está dispuesto en el extremo 3' del adaptador de oligonucleótido (20) con respecto al dominio de etiqueta de clones (24) y al dominio de etiqueta de muestras (26). En algunas realizaciones, el dominio de etiqueta de clones (24) es interno, es decir, está dispuesto entre el dominio de hibridación (22) y el dominio de etiqueta de muestras (26). Ver, por ejemplo, la FIGURA 1B.
[0027] En algunas realizaciones, el adaptador de oligonucleótido comprende una modificación en el enlace fosfato 3' terminal. Dicha modificación puede servir para prevenir o inhibir la degradación por acción enzimática (por ejemplo, degradación por enzimas con actividad exonucleasa 3' a 5') que puede usarse en etapas posteriores del procedimiento. En algunas realizaciones, la modificación del enlace fosfato 3' terminal comprende una modificación de fosforotioato. Otras modificaciones que inhiben la actividad exonucleasa 3' a 5' son conocidas y están abarcadas por esta divulgación. Si bien es preferible que dicha modificación se implemente en el enlace final (es decir, el enlace fosfato terminal), esta divulgación abarca modificaciones internas, por ejemplo, cerca del extremo 3' terminal, que sirve para este propósito y conserva la integridad de la secuencia restante que está 5' con respecto a la modificación.
[0028] Para facilitar aún más la unión del oligonucleótido adaptador (20) a la molécula de ADNbc (10) mediante ADN ligasa, en algunas realizaciones, el adaptador de oligonucleótido (20) comprende un oligonucleótido dúplex complementario (140 y 142) hibridado con al menos su extremo 5'. Ver las FIGURAS 2A y 2B, respectivamente. El oligonucleótido dúplex complementario comprende (140 y 142) una modificación en su extremo 3' evitando así la ligadura del fragmento de ADN bicatenario a un dúplex complementario, tal como otro dúplex adaptador y facilitando la unión del extremo 5' del adaptador de oligonucleótido al fragmento de ADN bicatenario. La FIGURA 2A ilustra un concepto de diseño en el que el oligonucleótido dúplex complementario (140) se hibrida sobre el extremo 3' que sirve como "cadena asociada" para proporcionar un dúplex adaptador (145). El oligonucleótido dúplex complementario (140) tiene un espaciador C3 en su extremo 3'. El espaciador C3 es una modificación de ejemplo que tiene tres grupos metilo contiguos y un hidroxilo en 3'. Este espaciador impide la ligadura a la cadena asociada ilustrada pero no interfiere con la unión (por ejemplo, ligadura) de la cadena de ligadura opuesta al fragmento de ADNbc diana.
[0029] La FIGURA 2B ilustra otra realización en la que el diseño se invierte y que se demostró que proporciona un mayor rendimiento de clones con etiquetas de muestra intactas. De manera específica, la "cadena asociada" tiene dominios correspondientes al dominio de hibridación (22) para la amplificación en el extremo 5', con un dominio etiqueta de clones interno (24), y un dominio etiqueta de muestras (26) en el extremo 3', con un espaciador C3 en el extremo 3'. El garabato representa una modificación (por ejemplo, espaciador C3 interno) (144) insertada dentro del oligonucleótido cerca del extremo 5' de la cadena asociada. Este espaciador C3 interno (144) es una estructura de ejemplo con tres grupos metilo contiguos (3' ribosa-CH2-CH2-CH2-5' fosfato) que sirve como una unión muy flexible para unir las secuencias en ambos lados. La información sobre la "cadena asociada" complementaria del dúplex se transfiere a la "cadena de ligadura" durante la reacción de ligadura mediante la extensión con el cebador del oligonucleótido dúplex complementario (142) en el dúplex adaptador (146), y el espaciador C3 interno bloquea la extensión mediante ADN polimerasas y, por tanto, impide la replicación completa de la "cadena asociada". Por lo tanto, esta modificación evita la generación de extremos romos del adaptador que son en sí mismos susceptibles a ligaduras de extremos romos, que de otro modo podrían disminuir la calidad de la biblioteca de secuenciación. Después de la extensión, la "cadena de ligadura" que incorpora el oligonucleótido dúplex complementario extendido (142) sirve como el oligonucleótido adaptador funcional (20) que está físicamente unido en su extremo 5' a los extremos 3' del ADNbc (10) (Ver la FIGURA 1B). El espaciador del extremo 3' preexistente en la cadena asociada evita su unión permanente a cualquier extremo 3' de la molécula de ADNbc (10).
[0030] La unión del adaptador de oligonucleótido al extremo 3' del fragmento de ADNbc comprende poner en contacto el adaptador de oligonucleótido (20) y el fragmento de ADNbc (10) con una o más enzimas de ligadura de ADN. Entre las enzimas de ligadura de ADN de ejemplo y no limitantes se incluyen ADN ligasa T4 y ADN ligasa T3. Se conocen otras ligasas apropiadas y están abarcadas por esta divulgación. Tal como se entenderá, la actividad de la ADN ligasa apropiada puede respaldarse mediante la inclusión de los nucleótidos trifosfato apropiados y otros componentes del tampón de reacción conocidos en la técnica.
[0031] Una vez que el adaptador de oligonucleótido (20) se une en su extremo 5' al extremo 3' de una molécula de ADNbc (10), la estructura resultante se denomina molécula quimérica adaptador/fragmento (30). Tal como se muestra en la FIGURA 1B, ambos extremos del ADNbc (10) pueden tener una cadena de ligadura extendida unida. Cualquiera de las cadenas de estas moléculas quiméricas adaptador/fragmento (30) puede servir entonces como plantilla para la amplificación lineal en la siguiente etapa, que se analiza a continuación.
Procesamiento inicial de ADNbc
[0032] La unión del oligonucleótido adaptador, descrito anteriormente, puede estar precedida opcionalmente por etapas para obtener extremos que se puedan ligar en el ADNbc de entrada y/o para mejorar la calidad de las moléculas de ADNbc de entrada (10). El material de entrada inicial comprende material genómico obtenido de una muestra biológica (por ejemplo, una biopsia o fluido corporal) o una muestra ambiental. El procedimiento puede comprender, además, una etapa o etapas activas para obtener la muestra biológica y/o extraer o aislar ácidos nucleicos de la muestra de acuerdo con técnicas familiares para los expertos en la técnica. Las muestras biológicas de ejemplo son muestras de tejido, incluidas muestras fijadas (por ejemplo, muestras embebidas en parafina o fijadas con formalina). Otras muestras biológicas son fluidos obtenidos de un sujeto, tales como sangre (o componentes de la misma), plasma, suero, saliva, líquido cefalorraquídeo, líquido amniótico, orina, heces, semen y similares. En algunas realizaciones, el ADNbc de entrada es ADNlc. En algunas realizaciones, el ADNbc de entrada (por ejemplo, ADNlc) proviene de un sujeto del que se sospecha que tiene una enfermedad (por ejemplo, cáncer) o infección. El sujeto puede ser, por ejemplo, un ser humano, un primate no humano, un ratón, una rata, una cobaya, un perro, un gato, un caballo, una vaca u otro animal de interés veterinario o de utilidad como modelo de enfermedad.
[0033] Independientemente de la fuente, el material de entrada es ADNbc (10) aislado o purificado (por ejemplo, ADNlc), tal como se ilustra en la FIGURA 1A. En el contexto de muestras biológicas líquidas, el ADNlc de individuos (sanos y con cáncer) suele tener una longitud de aproximadamente 165 pb. Este tamaño de fragmento corresponde a la longitud del ADN que está enrollado alrededor de una única subunidad de histona y se sabe que se genera mediante escisión por endonucleasa entre subunidades de histona adyacentes. También hay fragmentos de 330, 500 y más pb que probablemente sean el ADN enrollado alrededor de dos histonas, tres histonas, etc., donde no se produjo la escisión por endonucleasa entre histonas adyacentes. Los extremos del ADNlc suelen ser "irregulares", lo que significa que el ADNlc es una colección de fragmentos de ADN con extensiones cortas en 3', extremos romos y extensiones en 5'. La evidencia de esto proviene del hecho de que la clonación de extremos romos de ADNlc se mejora en gran medida mediante una etapa inicial de "reparación de extremos" en la que los extremos de las moléculas de ADNlc se tratan con enzimas que "pulen" los extremos de los fragmentos hasta obtener extremos romos uniformes. También parece haber "daños en el ADN" en muchas moléculas de ADNlc, tales como, pero sin limitarse a las mismas, muescas o espacios, bases modificadas y sitios abásicos que impiden la clonación de ADN convencional. La evidencia de esto proviene de la observación de que el tratamiento previo del ADNlc con cócteles de enzimas que pueden reparar los tipos de daño del ADN descritos anteriormente también mejoran la eficiencia de la clonación del ADNlc. Por consiguiente, en algunas realizaciones, el procedimiento comprende reparar tanto los extremos (también denominado "pulir" los extremos romos) como el daño interno que puede estar presente en el ADNbc de entrada.
[0034] En algunas realizaciones, el procedimiento puede comprender desfosforilar los extremos 5' del fragmento de ADNbc de entrada antes de la unión de la etapa (a). Esta etapa evita ligaciones espurias de una molécula de ADNbc a otra molécula de ADNbc o a otras moléculas de ácido nucleico que pueden estar presentes en la reacción de unión. Los compañeros de unión previstos, es decir, los adaptadores de oligonucleótidos, suministran el grupo fosfato requerido para garantizar que las reacciones se limiten a las uniones previstas únicamente. En algunas realizaciones, desfosforilar los extremos 5' del fragmento de ADN bicatenario comprende tratar el fragmento de ADN con fosfatasa alcalina. Para ilustrar, en un ejemplo específico, la desfosforilación se puede lograr mediante una simple incubación de 30 minutos con fosfatasa alcalina de gamba recombinante (rSAP) a 37 °C, seguida de inactivación térmica de la enzima a 65 °C durante 5 minutos.
[0035] En algunas realizaciones, el procedimiento comprende además poner en contacto el fragmento de ADNbc de entrada con una o más ADN polimerasas con actividad exonucleasa 3' a 5' para crear extremos romos en el fragmento de ADN bicatenario antes de la unión de la etapa (a). Dicha actividad proporciona ADNbc de entrada con extremos pulidos que son más susceptibles a la unión prevista de los oligonucleótidos adaptadores. Las ADN polimerasas de ejemplo y no limitantes abarcadas por la divulgación incluyen la ADN polimerasa T4 y el fragmento Klenow de ADN polimerasa I deE. co li. Se conocen otras ADN polimerasas apropiadas y están abarcadas por esta divulgación. Tal como se entenderá, la actividad de las ADN polimerasas apropiadas puede respaldarse mediante la inclusión de los desoxinucleótidos trifosfato apropiados y otros componentes del tampón de reacción conocidos en la técnica.
[0036] En algunas realizaciones, el procedimiento comprende además poner en contacto el fragmento de ADN con una o más enzimas que median en la reparación del ADN antes de la unión de la etapa (a). Se puede emplear cualquier enzima reparadora de ADN apropiada, dependiendo de la condición o calidad del ADNbc de entrada inicial. La una o más enzimas reparadoras pueden individualmente o en conjunto proporcionar funcionalidad para reparar el daño interno al ADNbc circulante fisiológicamente expuesto, incluida la reparación de sitios abásicos, muescas y espacios. En algunas realizaciones de ejemplo, las enzimas reparadoras de ADN comprenden ADN polimerasa Bst de longitud completa, ADN ligasa Taq, endonucleasa IV o cualquier homólogo o combinación de las mismas, muchos de los cuales están disponibles comercialmente. La endonucleasa IV, por ejemplo, elimina residuos abásicos creando espacios de 1 nt con 3' OH y 5' fosfatos. La Bst polimerasa de longitud completa, por ejemplo, reconoce y rellena muescas y espacios. La Bst polimerasa de longitud completa también proporciona actividad exonucleasa 5'-3', que es fundamental para generar muescas de ADN que se puedan ligar. La ADN ligasa Taq es una ligasa impulsada por NAD+ específica de muesca. La acción concertada de estas enzimas puede reparar una fracción sustancial del daño de ADN interno en el ADNbc, tal como se observa especialmente en el ADNlc. Se conocen otras enzimas reparadoras de ADN apropiadas y están abarcadas por esta divulgación. Tal como se entenderá, la actividad de las enzimas reparadoras del ADN apropiadas puede respaldarse mediante la inclusión de los nucleótidos trifosfato apropiados y otros componentes tampón de reacción conocidos en la técnica.
[0037] En algunas realizaciones, el tampón de reacción que contiene la ADN polimerasa y/o una o más enzimas reparadoras de ADN de las etapas preliminares se mantiene cuando se combina el ADNbc de entrada reparado con el adaptador de oligonucleótido y la enzima de ligadura de ADN. Las enzimas que catalizan estas actividades son mutuamente compatibles y óptimamente activas en las mismas condiciones de reacción. De manera específica, la mezcla de reacción puede contener una ADN polimerasa mesófila con una actividad exonucleasa de 3' a 5', tal como el fragmento Klenow de la ADN polimerasa I deE. colio la ADN polimerasa T4. En algunas realizaciones, la mezcla también puede contener las enzimas reparadoras representadas por la endonucleasa IV, la ADN polimerasa de longitud completa Bst y la ADN ligasa Taq, tal como se describió anteriormente. La mezcla también puede contener una ADN ligasa, tal como ADN ligasa T4 o ADN ligasa T3. De manera opcional, la entrada de ADNbc se puede desfosforilar con fosfatasa termosensible, tal como fosfatasa alcalina, antes de la etapa simultánea de reparación terminal y ligadura del adaptador. La mezcla también puede contener una mezcla de trifosfatos de desoxinucleótidos (requeridos para la polimerización del ADN) y nucleótidos trifosfato, tales como ATP (requeridos por la ADN ligasa T4). En presencia de estas actividades enzimáticas, la unión del adaptador y la extensión con el cebador de la cadena de ligadura del adaptador se pueden catalizar en una única reacción.
Amplificación lineal
[0038] Tal como se indica, la molécula quimérica de adaptador/fragmento (30) sirve como cadena plantilla para la "amplificación lineal" dirigida por cebador. Ver, por ejemplo, la FIGURA 1C. Tal como se usa aquí, el término "amplificación lineal" significa un procedimiento de copia de ADN dirigido por extensión con cebador (40) y ciclo de temperatura que emplea los mismos principios básicos que la PCR. La principal diferencia es que la molécula quimérica de adaptador/fragmento (30) tiene un único sitio de unión al cebador en su extremo 3' que facilita la producción de una copia de ADN monocatenario (50) que es complementaria a la molécula quimérica de adaptador/fragmento (30) plantilla. A diferencia de la PCR, la cadena complementaria copiada no es en sí misma una cadena plantilla capaz de realizar copias adicionales. Además, sólo se produce una de estas cadenas complementarias (50) por ciclo térmico, por lo que la amplificación es lineal en lugar de exponencial, como es el caso de la PCR, donde los sitios de unión del cebador aparecen en ambos extremos de la molécula plantilla y las copias de la cadena recién producidas son ellas mismas plantillas para realizar copias adicionales. La producción de cadenas de ADN que son el complemento de los fragmentos de ADN iniciales es crítica para el éxito general del procedimiento divulgado porque el cambio en la polaridad del fragmento de 3'adaptador/fragmento 5' a 5' adaptador/fragmento 3' es necesario para la siguiente etapa en el procedimiento divulgado, que es la hibridación y hibridización de oligonucleótidos específicos de la diana. Como mínimo, solo se requiere un único ciclo de amplificación lineal; sin embargo, la divulgación abarca más ciclos. A menudo, se experimentan subproductos de amplificación espurios después de aproximadamente 20 ciclos, lo que reduce la utilidad de aún más ciclos.
[0039] La amplificación lineal se facilita mediante el uso de un primer cebador (40) que se hibrida con el dominio de hibridación del cebador (22) del adaptador de oligonucleótido (20) que se unió previamente al fragmento de ADNbc (10) y ahora es el extremo 3' de la plantilla de molécula quimérica de adaptador/fragmento (30). Ver la FIGURA 2C. El primer cebador (40) puede estar presente inicialmente en la reacción, por ejemplo, en una concentración de aproximadamente 100 nM a aproximadamente 800 nM, de aproximadamente 200 nM a 600 nM, de aproximadamente 300 a aproximadamente 500 nM. En algunas realizaciones, el primer cebador (40) está presente inicialmente a aproximadamente 400 nM en la amplificación lineal. La longitud y composición del primer cebador (40) se pueden ajustar según la práctica habitual para facilitar la hibridación y extensión eficientes para la amplificación lineal. Las longitudes típicas pueden ser > aproximadamente 30 nt, > aproximadamente 40 nt, > aproximadamente 50 nt o > aproximadamente 60 nt. En algunas realizaciones, es preferible una longitud de aproximadamente 45 a 65 nt.
[0040] El proceso de extensión está mediado por una ADN polimerasa termoestable. Un ejemplo ilustrativo, no limitante, de una ADN polimerasa termoestable abarcada por la divulgación es la ADN polimerasa Q5, una enzima recombinante disponible en el kit de preparación ULTRA ™ lI NGS de New England Biolabs. Se conocen otras enzimas ADN polimerasa termoestables apropiadas y están abarcadas por esta divulgación. Tal como se entenderá, la actividad de la ADN polimerasa termoestable apropiada puede respaldarse mediante la inclusión de los desoxinucleótidos trifosfato apropiados y otros componentes del tampón de reacción conocidos en la técnica.
[0041] En algunas realizaciones, la amplificación lineal comprende una o más rondas de un procedimiento de ciclado térmico de dos etapas. Por ejemplo, la primera etapa es una etapa de fusión para separar cualquier molécula hibridada o hibridizada entre sí. Por ejemplo, esto se puede realizar a aproximadamente 98 °C durante aproximadamente 10 segundos. La segunda etapa tiene una temperatura más baja para permitir la hibridación y la extensión del cebador. Esto se puede realizar, por ejemplo, a 65 °C durante aproximadamente 30 segundos. Los expertos en la técnica pueden optimizar estas condiciones de ejemplo según sea necesario para adaptarse a diferentes condiciones y diseños de cebadores.
[0042] Las cadenas complementarias (50) amplificadas linealmente se pueden purificar opcionalmente según técnicas típicas. Esto elimina de las cadenas complementarias (50) las enzimas, oligos y otros reactivos utilizados hasta ahora en el procesamiento de la biblioteca. Una etapa de purificación de ejemplo es el uso de reactivo de purificación de microesferas de ADN (por ejemplo, microesferas de purificación de<a>D<n>Ampure XP vendidas por Beckman-Coulter). Estas microesferas de inmovilización reversible en fase sólida (SPRI,solid phase reversible immobilization)se funcionalizan con recubrimientos de carboxilo y se formulan en soluciones con alto contenido de sal (por ejemplo, NaCl 1-2 M) que contienen ~20 % de polietilenglicol y agentes tampón. El ADN de un rango de tamaño decreciente se unirá a las microesferas con la adición de esta solución de purificación de ADN a soluciones que contienen ADN en proporciones de 0,5 a 1, 1 a 1, 2 a 1 o 4 a 1, respectivamente. La microesfera con el ADN unido puede entonces separarse de la solución en masa con un imán, lavarse con reactivos apropiados y eluir el ADN de las microesferas con una solución baja en sal (por ejemplo, Tris 10 mM, pH 8,0 y EDTA 1 mM), produciendo así ADN purificado. En una realización ilustrativa, la solución de microesferas se añade a los productos de amplificación lineal en una proporción de aproximadamente 2 volúmenes de solución de purificación de ADN por 1 volumen de ADN amplificado.
Reconocimiento específico con una sonda de oligonucleótidos
[0043] Después de producir cantidades suficientes de cadena complementaria (50) de las moléculas quiméricas de adaptador/fragmento, se capturan y aíslan cadenas complementarias diana específicas para su posterior procesamiento y secuenciación. La especificidad de la recuperación la confiere una sonda de oligonucleótido (70; también denominada en el presente documento "oligonucleótido Fetcher"). Tal como se ilustra en las FIGURAS 1D, 3A y 3B, la sonda de oligonucleótidos (70) comprende un dominio de hibridación (72) con una secuencia que se hibrida con una secuencia diana en la cadena complementaria (50) para producir un dúplex de cadena complementaria dirigida/sonda (60). En algunas realizaciones, el dominio de hibridación es > 20 nt, > 25 nt, > 30 nt, > 35 nt, > 40 nt, > 50 nt, > 60 nt. En algunas realizaciones, el dominio de hibridación (72) tiene entre aproximadamente 25 y aproximadamente 50 nt. En algunas realizaciones, el dominio de hibridación tiene una longitud de aproximadamente 30-50 nt, tal como aproximadamente 30 nt, aproximadamente 35 nt, aproximadamente 40 nt, aproximadamente 45 nt, aproximadamente 50 nt, aproximadamente 55 nt. El dominio de hibridación termina en el extremo 3' de la sonda de oligonucleótidos (70) para permitir una extensión final de la sonda a lo largo de la cadena complementaria (50), que sirve como plantilla.
[0044] Se entenderá que el dominio de hibridación (72) puede diseñarse y optimizarse basándose en las secuencias conocidas en dirección 5' y/o en dirección 3' que son inmediatamente adyacentes a las secuencias diana deseadas en el ADNbc de entrada. La frase "inmediatamente adyacente", tal como se aplica en el presente documento, significa una secuencia de hibridación que está dentro de aproximadamente 1 -100 bases de la región de la secuencia diana, tal como dentro de aproximadamente 1 - 50 bases, tal como dentro de aproximadamente 1 - 20 bases, dentro de aproximadamente 1 - 10 bases, y dentro de aproximadamente 1 - 5 bases de la región de secuencia diana. En una realización preferida, el dominio de hibridación (72) puede diseñarse para hibridar junto a, es decir, dentro de 1 base, de la secuencia diana. Además, estas secuencias deberían reconocer preferentemente segmentos genómicos que se encuentran sólo una vez en el genoma diana. Por ejemplo, hay muchas secuencias repetitivas en el genoma humano y las sondas de oligonucleótidos que recuperan dichas secuencias redundantes capturarán una gran cantidad de clones de secuencias no relacionadas que se distribuyen por todo el genoma. En raras ocasiones, puede ser necesario reconocer secuencias que se encuentran dos o más veces en el genoma de referencia humano. Estos casos son más aceptables siempre que se reconozca que ciertas sondas de oligonucleótidos recuperarán loci genómicos redundantes y esto se tenga en cuenta en el análisis que sigue a la secuenciación del ADN. A menudo es posible eliminar la ambigüedad de dichos datos en el proceso de análisis posterior a la generación de la secuencia.
[0045] La sonda de oligonucleótidos (70) también comprende un dominio de hibridación de cebador (74) con una secuencia de nucleótidos que permite la hibridación de un cebador y, por tanto, la posterior amplificación por PCR en las condiciones de reacción correctas (descritas a continuación). El dominio de hibridación del cebador (74) normalmente puede comprender entre aproximadamente 15 y aproximadamente 60 nucleótidos, tales como aproximadamente 15 nt, aproximadamente 20 nt, aproximadamente 25 nt, aproximadamente 30 nt, aproximadamente 35 nt, aproximadamente 40 nt, aproximadamente 45 nt, aproximadamente 50 nt, aproximadamente 55 nt o aproximadamente 60 nt.
[0046] En algunas realizaciones, la sonda de oligonucleótidos (70) comprende un oligonucleótido dúplex complementario (147) hibridado con el extremo 5' de la sonda de oligonucleótidos (70). En algunas realizaciones, el oligonucleótido dúplex complementario (147) se hibrida con parte o la totalidad del dominio de hibridación del cebador (74) de la sonda de oligonucleótidos. Ver, por ejemplo, la FIGURA 3B. En algunas realizaciones, el oligonucleótido dúplex complementario (147) puede comprender un resto de biotina terminal 3' (150). En algunas realizaciones, el oligonucleótido dúplex complementario (147) puede comprender al menos una sustitución de una base T por una base didesoxi U (148). En algunas realizaciones, el oligonucleótido dúplex complementario (147) comprende tanto un resto de biotina terminal 3' (150) como una base T con base didesoxi U (148). El resto de biotina terminal 3' (150) permite una funcionalidad de captura y purificación opcional con compañeros de unión de biotina inmovilizados (por ejemplo, avidina o estreptavidina unida a microesferas). La base didesoxi U (148) permite la escisión del resto de biotina del oligonucleótido dúplex complementario (147) y la liberación del dúplex aislado del oligonucleótido complementario (147), la sonda de oligonucleótido (70) y la cadena complementaria (50) (es decir, el dúplex de cadena complementaria dirigida/sonda (60)). Esto se describe con más detalle a continuación.
[0047] El procedimiento divulgado se ha descrito, en general, hasta ahora en el contexto de procesar un único ADNbc de entrada (10), por ejemplo, uniendo un único adaptador de oligonucleótido (20), etc. Sin embargo, será evidente para las personas con conocimientos habituales en la técnica que el procedimiento se amplía a la práctica para procesar una pluralidad de moléculas de ADNbc de entrada (10), por ejemplo, de la misma (o múltiples) muestras biológicas de origen en un único lote de muestras o múltiples lotes de muestras en paralelo. En un único lote de muestras, la pluralidad de adaptadores de oligonucleótidos tendrá la secuencia del dominio etiqueta de muestras (26). En el procesamiento de múltiples lotes, la etapa inicial de unir los adaptadores de oligonucleótidos (20) se realiza en paralelo, de manera que cada lote de muestras mantenga su propia secuencia única de dominio de etiqueta de muestras (26). Sin embargo, las cadenas complementarias resultantes (50) se pueden combinar y poner en contacto con la sonda de oligonucleótidos (70). Las sondas de oligonucleótidos (70) pueden ser idénticas (por ejemplo, con secuencias idénticas del dominio de hibridación (74) que reconocen la misma secuencia). Alternativamente, se puede poner en contacto una pluralidad de sondas de oligonucleótidos diferentes (70) con una pluralidad de cadenas complementarias (50) producidas en la etapa (b) en una única etapa de hibridación (c), en donde la pluralidad de sondas de oligonucleótidos diferentes comprende cada una un dominio de hibridación. (74) con una secuencia diferente que se hibrida con una secuencia diana diferente. Esto es útil cuando existe una pluralidad de fragmentos de ADN bicatenario diferentes en la muestra de ADNbc de entrada (o si hay múltiples lotes de muestras iniciales) y se analizan múltiples secuencias diana en un análisis múltiple.
[0048] En algunas realizaciones, la etapa de hibridación (c) y/o la etapa de purificación (d) (descritas con más detalle a continuación) se realizan en una solución salina isoestabilizante. Con el fin de hibridar la sonda de oligonucleótidos (70) con la cadena complementaria (50) para formar un dúplex estable de cadena de complemento dirigida/sonda de oligonucleótidos (60), esta solución salina isoestabilizante añade flexibilidad al diseño del dominio de hibridación y a la elección de secuencias diana. En muchos sistemas de captura de híbridos dirigidos, es importante tener en cuenta un diseño de oligonucleótidos que equilibre la temperatura de fusión ("Tf") de las sondas de reconocimiento medida en tampones de hibridación estándar. El uso de compuestos isoestabilizantees en la reacción de hibridación del ADN alivia esta limitación y permite secuencias de dominios de hibridación de longitud uniforme que pueden tener temperaturas de fusión significativamente diferentes en tampones convencionales. En el contexto de la presente divulgación, un "compuesto isoestabilizante" es una molécula que se ha demostrado, cuando está presente en molaridades específicas en soluciones acuosas, que desplaza las temperaturas de fusión de ADN genómicos con un contenido de G:C ampliamente variable a una Tf uniforme. Una solución salina isoestabilizante de ejemplo, no limitante, comprende cloruro de tetrametilamonio. En algunas realizaciones, la solución salina isoestabilizante comprende de aproximadamente 2 M a 4 M (por ejemplo, aproximadamente 2,5 M, aproximadamente 3,0 M, aproximadamente 3,5 M) de cloruro de tetrametilamonio.
[0049] Una característica clave de los compuestos isoestabilizantees en el contexto de la presente divulgación es que la temperatura de fusión de los dúplex de ADN pasa a depender de la longitud de la secuencia dúplex. Para ilustrar, y sin estar ligado a ninguna teoría o explicación particular, esto significa que los dúplex formados entre las cadenas complementarias (50) y la sonda de oligonucleótidos (70) en los que 40 de 40 bases están perfectamente apareadas tendrán una temperatura de fusión más alta que los dúplex que tienen menos de 40 pb de longitud. Esta discriminación basada en la longitud puede ser una ventaja importante para la presente divulgación porque el genoma humano tiene 3 mil millones de pb y es probable que sean habituales los dúplex espurios de menos de 40 pb, y en particular los de menos de 30 pb. Esto es especialmente cierto en los casos en los que se toleran desapareamientos y espacios internos dentro del dúplex de la cadena del complemento dirigida/sonda de oligonucleótidos (60), y estos dúplex parciales inevitablemente aparecen con una frecuencia significativa. Esta característica de Tf dependiente de la longitud que se manifiesta en soluciones de compuestos isoestables es particularmente crítica después de la fase de hibridación, donde la temperatura de la reacción de hibridación puede elevarse brevemente hasta una temperatura cercana a la Tf (es decir, entre 2 °C y 8 °C) de un perfecto dúplex de 40 unidades. Esto fundirá la mayoría de los dúplex no deseados que tengan menos de 40 pb y al mismo tiempo conservará la mayoría de los dúplex deseados que tengan 40 pb.
[0050] Las frases "diana específica"(on-target)y "diana inespecífica"(off-target)se utilizan a menudo en el contexto de NGS dirigidas. El objetivo durante la optimización de los procedimientos de captura híbridos dirigidos es maximizar las lecturas de dianas específicas y minimizar las lecturas de dianas inespecíficas. "Diana específica" significa que la secuencia de ADN del fragmento genómico recuperado se mapea dentro de las coordenadas genómicas previstas de la secuencia diana. En el caso de la presente divulgación, esto significa que la secuencia genómica recuperada, determinada mediante secuenciación, se asigna al lado 3' de la sonda de oligonucleótidos (70) y la base más 5' de la secuencia genómica se alinea con el genoma dentro de 300 nt., y más a menudo dentro de 125 nt de la secuencia de ADN de la sonda de oligonucleótidos afín (70). El objetivo de la tecnología de secuenciación dirigida es optimizar la cantidad de secuencias de diana específica. "Diana inespecífica" significa que la secuencia genómica recuperada se mapea dentro de una ubicación en el genoma de referencia que está muy alejada de la secuencia de alineación de la secuencia del dominio de hibridación (72). Para fines prácticos, "muy alejada" es cualquier alineación >1000 nt de distancia del extremo 3' de la sonda de oligonucleótidos (70) si la alineación es hacia el lado 3' de la sonda de oligonucleótidos (70), cualquier alineación que está hacia el lado 5' de la sonda de oligonucleótidos (70) independientemente de su ubicación con respecto a la secuencia del dominio de hibridación (72), y cualquier alineación que se produzca en un cromosoma diferente al de la secuencia del dominio de hibridación (72). La especificidad de un sistema de captura híbrido dirigido se mide como la suma de las secuencias diana específicas dividida por la suma del total de secuencias que se pueden alinear con el genoma humano que se recuperaron. Cabe indicar que la frase "alineable" se utiliza a menudo como designación abreviada para referirse a "secuencias que pueden alinearse con el genoma humano". La relación molar de cadenas complementarias (50) con respecto a sonda de oligonucleótidos (70) puede ser una consideración importante en la optimización del rendimiento de los procedimientos aquí divulgados. Se pueden añadir sondas de oligonucleótidos (70) a soluciones de ADN plantilla a una concentración entre aproximadamente 1 pM y 10 nM. En algunas realizaciones, las sondas de oligonucleótidos (70) se añaden de manera que su concentración final sea de aproximadamente 20 pM a aproximadamente 80 pM, tal como aproximadamente 20 pM, aproximadamente 25 pM, aproximadamente 30 pM, aproximadamente 35 pM, aproximadamente 40 pM, aproximadamente 45 pM, aproximadamente 50 pM, aproximadamente 55 pM, aproximadamente 60 pM, aproximadamente 65 pM, aproximadamente 70 pM, aproximadamente 70 pM u 80 pM. En algunas realizaciones, las sondas de oligonucleótidos (70) se añaden a una concentración de aproximadamente 67 pM.
[0051] En el contexto de la recuperación dirigida aquí descrita mediante sondas de oligonucleótidos (70) y la aplicación de NGS, el uso de compuestos isoestabilizantes también aumenta la "sensibilidad" y la "uniformidad" de la captura de secuencias dirigidas. "Sensibilidad" se define, para cualquier experimento dado, como la suma de las regiones realmente recuperadas por un conjunto de sondas de oligonucleótidos dirigidas dividido por la suma total de las dianas cubiertas (es decir, que se pretende recuperar) por la sonda de oligonucleótidos. A modo de ejemplo, es habitual encontrar afirmaciones en la literatura sobre captura de híbridos dirigidos que indican tasas de captura particulares, lo que indica que se encontraron lecturas de secuenciación de ADN que corresponden a un porcentaje particular de las regiones reconocidas por las sondas de captura y, a la inversa, que el porcentaje restante de las regiones reconocidas no pudieron ser capturadas ni secuenciadas. Otra medición crítica utilizada para evaluar procedimientos de NGS híbridos dirigidos es la "uniformidad". En el contexto actual, la uniformidad es una medida de la profundidad de cobertura, es decir, el número de secuencias de ADN independientes en cada sitio de hibridación de la sonda de oligonucleótidos en relación con la profundidad promedio general en todas las sondas. En consecuencia, se define que una "secuencia de ADN independiente" tiene un conjunto único de coordenadas de mapeo genómico y un marcador de clon único. La uniformidad se calcula determinando primero el número medio de lecturas independientes que están en la diana específica en toda la colección de sondas de oligonucleótidos presentes en un experimento determinado. A continuación, se compara la proporción de lecturas independientes en cada sonda de oligonucleótidos con el promedio global. A continuación, se informa del porcentaje de sitios de sonda de oligonucleótidos con profundidades de lectura independientes que están dentro de un "rango" determinado de la media. Un rango que se describe típico puede ser sondas con profundidades de lectura dentro del 50 % de la media. Otro procedimiento para transmitir uniformidad es mediante una visualización gráfica. Ver por ejemplo la FIGURA 7.
[0052] De forma resumida, se pueden usar agentes isoestabilizantes, tales como solución de cloruro de tetrametilamonio 3 M, durante la hibridación de la sonda de oligonucleótidos:cadena complementaria. El uso de soluciones isoestabilizantes relaja las limitaciones en los diseños de sondas de oligonucleótidos al transformar las secuencias de 40 unidades, independientemente de la composición de bases A:T frente a G:C, en moléculas de ADN con las mismas temperaturas de fusión. Además, la propiedad de que la estabilidad de dúplex se convierte en una función simple de la longitud en soluciones isoestables se puede utilizar para aumentar la especificidad de la captura de híbridos dirigidos una vez completada la reacción de hibridación. Esto se puede lograr elevando la temperatura de las moléculas hibridadas a una temperatura cercana a la Tf de 40 unidades durante un período de aproximadamente 5 minutos, tal como se describe a continuación, para la purificación usando el procedimiento descrito. En conjunto, estas propiedades de los compuestos isoestabilizantes contribuyen significativamente a la sensibilidad y uniformidad de la recuperación de la secuencia diana.
Purificación del dúplex de cadena complementaria dirigida/sonda
[0053] Después de que la sonda de oligonucleótidos (70) se híbrida con la cadena complementaria (50) para formar un dúplex de cadena complementaria dirigida/sonda (60), la mezcla de reacción también incluirá cadenas complementarias de diana inespecífica no hibridadas y sondas de oligonucleótidos no hibridadas. La divulgación abarca realizaciones en las que se utilizan etapas adicionales para aislar el dúplex de cadena complementaria dirigida/sonda (60) de la mezcla de reacción de hibridación, eliminando significativamente las sondas y las cadenas complementarias no hibridadas, así como cualquier otro componente de reacción que quede. Esto se denomina "purificación", aunque no se pretende que requiera el aislamiento completo y total del dúplex de cadena complementaria/sonda (60).
[0054] En algunas realizaciones, el dúplex de cadena complementaria dirigida/sonda (60) se purifica mediante selección de tamaño. Esto puede ser eficaz para eliminar sondas de oligonucleótidos no hibridadas. Varios medios de purificación de ADN (por ejemplo, matrices de sílice, tamices moleculares, microesferas magnéticas recubiertas de carboxilo suspendidas en soluciones con alto contenido de sal, polietilenglicol y similares) pueden purificar preferentemente el ADN en función del tamaño. Ver, por ejemplo, Hawkins T.L., et al. Nucleic Acids Res. 25 de octubre de 1994; 22 (21): 4543-40; Lundin S., et al. PLoS One. 6 de abril de 2010; 5(4); Borgstrom E., et al. PLoS One. 27 de abril de 2011; 6(4),).
[0055] En un ejemplo ilustrativo, no limitante, la selección de tamaño se realiza usando reactivo de purificación de microesferas de ADN, tal como se describió anteriormente. En el presente ejemplo no limitante, se añade una proporción de 1,2 partes de reactivo de purificación a 1,0 partes de solución de ADN. Otros procedimientos, en particular la unión a microesferas de sílice utilizando soluciones ajustadas para una purificación de tamaño específico, pueden ser igualmente eficaces.
[0056] En otras realizaciones, en las que la sonda de oligonucleótidos comprende un oligonucleótido dúplex complementario (147) con un resto de biotina terminal 3' (150) y una o más bases T sustituidas por bases didesoxi U (148), la purificación del dúplex de cadena complementaria dirigida/sonda comprende la unión del resto de biotina terminal 3' (150) de la sonda de oligonucleótidos en el dúplex de cadena complementaria dirigida/sonda a una microesfera paramagnética recubierta de estreptavidina. A continuación, se inmovilizan las microesferas paramagnéticas, por ejemplo con un imán, y se puede aplicar un lavado. En algunas realizaciones, se aplica un lavado de alta rigurosidad del dúplex de sonda/cadena de complemento diana unido a microesferas para eliminar la estructura de hibridación espuria o no diana. Una etapa de lavado de alta rigurosidad de ejemplo, no limitante, puede comprender incubar los dúplex de cadena complementaria dirigida/sonda unidos a microesferas en una solución que comprende cloruro de tetrametilamonio aproximadamente 3 M a aproximadamente 75 °C durante aproximadamente 5 minutos.
[0057] Se sabe que las microesferas paramagnéticas inhiben las reacciones de amplificación por PCR y, por lo tanto, deben extraerse antes de la amplificación por PCR de las moléculas plantilla de secuenciación. En el ejemplo divulgado, el enlace covalente que une el dúplex de cadena diana/sonda (60) al resto de biotina se escinde en las bases de desoxiuracilo mediante la acción combinada de la uracilo ADN glicosilasa y una endonucleasa específica para residuos abásicos. Esta combinación de enzimas se encuentra en el reactivo comercial vendido como mezcla de enzimas USER II por New England Biolabs. Los dúplex de cadena diana/sonda purificados se liberan de las microesferas mediante escisión con USER II, las microesferas se separan del sobrenadante que contiene ADN usando un imán y el sobrenadante clarificado se transfiere a un recipiente nuevo para las etapas de generación de plantilla de secuencia que se describen a continuación.
Generación de moléculas plantilla de secuenciación
[0058] Una vez que se aísla el dúplex de cadena complementaria/sonda (60) de la mezcla de reacción de hibridación con la rigurosidad deseada, las sondas de oligonucleótidos hibridadas con las cadenas complementarias se extienden desde el extremo 3' de la sonda hibridada para proporcionar una plantilla extendida (80). Ver la FIGURA 1D. La plantilla extendida (80) es una cadena de ADN quimérica que posee, tal como se lee en la dirección 5' a 3', la secuencia de la cola de la sonda de oligonucleótidos, la sonda de oligonucleótidos, la secuencia genómica de la cadena complementaria diana correspondiente a la secuencia diana en el ADNbc de entrada, el dominio de etiqueta de muestras (24), el dominio de etiqueta de clones (26) y el dominio de hibridación del cebador del adaptador de oligonucleótido (22).
[0059] La extensión de la sonda de oligonucleótidos se realiza como una etapa inicial en la amplificación por PCR de la plantilla extendida (80).
[0060] En algunas realizaciones, la extensión de la sonda en la etapa (e) comprende aplicar una ADN polimerasa termoestable a > aproximadamente 55 °C, > aproximadamente 57 °C o > aproximadamente 60 °C. En algunas realizaciones, la ADN polimerasa termoestable es la ADN polimerasa Taq. En otra realización ilustrativa, no limitante, la etapa de extensión puede ser catalizada por la ADN polimerasa termoestable Q5 (New England Biolabs). La extensión de la sonda puede comprender una mezcla típica de amplificación por PCR que contiene la enzima termoestable, los dNTP y el dúplex de cadena complementaria/sonda purificado (60) en una solución tampón apropiada que se eleva hasta aproximadamente 72 °C (entre 50 °C y 80 °C) durante 30 o más segundos antes de la amplificación por PCR.
[0061] La amplificación en la etapa (e) se puede realizar en la misma reacción o en una reacción diferente que la actividad de extensión. La etapa de amplificación comprende el uso de un cebador de PCR directo (90) que se hibrida selectivamente con un dominio de hibridación de cebador en la cadena complementaria dirigida del dúplex y un cebador de PCR inverso (100) que se hibrida selectivamente con un dominio de hibridación de cebador en la cadena de sonda extendida. Ver la FIGURA 1E. Cada uno de los primero y segundo cebadores de PCR (90 y 100, respectivamente) comprende dos dominios: un dominio de hibridación de plantilla (94 y 104, respectivamente) que se hibrida con el dominio de hibridación de cebador integrado en la plantilla extendida (80), y un dominio específico de NGS (92 y 102, respectivamente) que tiene secuencias específicas para la plataforma NGS deseada utilizada para la secuenciación posterior. La presencia de los dominios específicos de NGS (92 y 102) convierte a estos cebadores de PCR en "cebadores de PCR con cola". En algunas realizaciones, los dominios de hibridación de plantilla (94 y 104) tienen entre 15 y 40 nt, tales como aproximadamente 20 nt, aproximadamente 25 nt o aproximadamente 30 nt, con secuencias complementarias a las secuencias de hibridación de cebadores específicas de esta divulgación en sus extremos 3'.
[0062] El número de ciclos de amplificación por PCR necesarios para generar una cantidad medible de clones dirigidos amplificados y listos para la secuenciación (es decir, moléculas plantilla de secuenciación (110) en la FIGURA 1F) puede depender en gran medida del número de sondas de oligonucleótidos diferentes (70) incluidas en la reacción de hibridación previa. Como guía general, una mayor cantidad de sondas de oligonucleótidos distintas (70) generará una mayor cantidad de plantillas extendidas (80) que, por lo tanto, requerirán menos ciclos de PCR para generar cantidades detectables y cuantificables de moléculas plantilla de secuenciación (110). La amplificación por PCR en la etapa (e) puede estar mediada por una polimerasa termoestable de alta fidelidad. Un ejemplo no limitante es la polimerasa Q5.
[0063] Después de la amplificación por PCR, las moléculas plantilla de secuenciación amplificadas (110) se pueden purificar según cualquier técnica apropiada conocida en el sector para proporcionar la biblioteca de secuenciación. Por ejemplo, la purificación se puede realizar mediante procedimientos automatizables basados en microesferas idénticos a los descritos anteriormente. El material purificado se puede cuantificar utilizando procedimientos de fluorescencia, tales como el instrumento Qubit y kits específicos de doble cadena proporcionados por Thermo Fisher (Waltham, MA).
[0064] En algunas realizaciones, el procedimiento también comprende secuenciar las moléculas plantilla (110). La biblioteca de moléculas plantilla de secuenciación (110) resultante de las etapas anteriores es susceptible de secuenciación mediante cualquier plataforma NGS deseada, siempre que el primer y segundo cebadores de PCR consideren adecuadamente los requisitos para la plataforma NGS particular. En los ejemplos que se describen a continuación, la plataforma de secuenciación utilizada para estudios preliminares/reducción a la práctica fue un instrumento de análisis del genoma MiSeq de Illumina (San Diego, CA). Por lo tanto, los dominios específicos de NGS (92 y 102) eran específicos de esa plataforma. Sin embargo, una estrategia similar podría adaptarse fácilmente a cualquier número de plataformas NGS existentes o futuras, por lo que este ejemplo específico no debe considerarse limitante.
[0065] En algunas realizaciones, el procedimiento se realiza para una pluralidad de fragmentos de ADN de doble cadena que dan como resultado una pluralidad de moléculas de secuenciación diferentes, y la secuenciación de ADN se realiza en una plataforma de secuenciación de próxima generación masivamente paralela. A modo de ejemplo, la plataforma Illumina MiSeq es susceptible de secuenciación de extremos emparejados donde se generan lecturas opuestas de la misma cadena (FIGURA 1F). Tal como se describió anteriormente, en algunas realizaciones, el adaptador de oligonucleótido comprende un dominio de etiqueta de clones con una secuencia de nucleótidos que marca cada clon genómico resultante y un dominio de etiqueta de muestras con una secuencia de ácido nucleico que marca muestras independientes y por lo tanto permite el análisis múltiple de múltiples muestras a la vez. El procedimiento puede comprender además la aplicación de análisis bioinformático que integre las coordenadas de alineación de la secuencia obtenida del fragmento de ADN bicatenario, la secuencia del dominio de etiqueta de clones y la secuencia del dominio de etiqueta de muestras.
[0066] La presente divulgación está configurada para permitir la identificación y caracterización de clones de ADN independientes. En el contexto específico de las biopsias líquidas realizadas en sujetos humanos, los procedimientos divulgados permiten la secuenciación dirigida de fragmentos individuales de ADNlc y el análisis de datos post-NGS. Como se define aquí, los términos "clon único" o "fragmento único" o "lectura única" o "molécula única" o "secuencia única" se refieren todos a un fragmento de ADN secuenciado que es fácilmente diferenciable de todas las demás secuencias de ADN obtenidas de una muestra. Es importante destacar que el mismo "fragmento único" puede secuenciarse varias veces, ya que la amplificación en dirección 5' de la secuenciación del ADN puede producir moléculas idénticas (clones) del mismo fragmento. Cuando múltiples secuencias del mismo fragmento único están presentes en un conjunto de datos NGS, cada miembro de esta "familia clonal", lo que significa un conjunto de secuencias correspondientes todas al mismo fragmento de ADNlc original, se agrupa en un "clon/fragmento/lectura/secuencia única" de consenso individual. La capacidad de reconocer fragmentos únicos se ve facilitada por las etiquetas que se fijan a los fragmentos de ADN (por ejemplo, ADNlc) primero mediante ligadura de adaptador y, a continuación, mediante hibridación con sondas de oligonucleótidos con extensión de cebador. El marcador de muestra permite la multiplexación de muestras en NGS y el análisis de secuencias en muestras específicas en el análisis posterior a la secuencia. Las coordenadas de alineación de la secuencia de ADN recuperada (por ejemplo, ADNlf), la secuencia de ADN del marcador del clon y la identidad de la sonda de oligonucleótidos contribuyen a la clasificación de una secuencia como única o miembro de una familia clonal.
[0067] La capacidad de condensar datos de NGS primero en muestras específicas y, a continuación, en lecturas únicas dentro de una muestra es un aspecto fundamental de la presente divulgación tanto para la identificación basada en secuenciación de SNV, indeles o fusiones como para la detección basada en recuento de cambios en el número de copias en las regiones diana. Es bien sabido por los expertos en la técnica que la plataforma NGS es propensa a errores, y esto crea un desafío en el análisis posterior a la secuencia de diferenciar entre "ruido de máquina", es decir, errores esporádicos y/o a veces sistemáticos intrínsecos a la plataforma NGS, y mutaciones raras albergadas dentro de fragmentos de ADNtc que pueden encontrarse en la colección general de fragmentos de ADNlc y que son relevantes para el cáncer. Se han descrito varios enfoques para la corrección de errores del ruido de las máquinas. Sin embargo, las técnicas de corrección de errores, tales como Safe-SeqS y la secuenciación dúplex, pueden suponer un gasto considerable porque requieren que cada fragmento de ADN se secuencie varias veces.
[0068] La presente divulgación da a conocer un enfoque diferente y menos costoso para la corrección de errores que Safe-SeqS o la secuenciación dúplex. Específicamente, cualquier mutación candidata debe encontrarse en varios clones diferentes, independientes y únicos para ser considerada una mutación verdadera. En lugar de depender de la secuenciación repetitiva del mismo fragmento de ADN inicial de muchos clones replicados para la identificación de mutaciones potenciales, el enfoque descrito se basa en la observación de varios (que significa más de tres o cuatro) fragmentos únicos, todos los cuales tienen la misma mutación rara. En este contexto, los procedimientos que proporcionan una alta tasa de conversión de fragmentos de ADNbc en clones analizables descritos aquí son necesarios para revelar estos múltiples clones mutantes independientes con una sensibilidad clínicamente útil (por ejemplo, <1,0 % de frecuencia de alelo mutante, preferiblemente <0,1 % de frecuencia de alelo mutante). Este es un enfoque diferente del análisis intensivo de todas y cada una de las mutaciones incorporadas en los enfoques Safe-SeqS o de secuenciación de dúplex que solo pueden respaldarse mediante secuenciación redundante. Este enfoque es menos costoso que los enfoques Safe-SeqS o de secuenciación de dúplex porque no requiere que cada fragmento de una muestra de ADN se secuencie varias veces. En cambio, el enfoque descrito simplemente exige una cobertura de secuencia suficiente para producir un conjunto de clones únicos que posean todas las mismas lesiones potencialmente raras. Un ejemplo de llamada de variante mediante este enfoque esta incorporado en los datos de genotipado que se muestran en la Tabla 5.
[0069] Tal como se analizó anteriormente, un aspecto de la tecnología de biopsia líquida es la detección de lesiones genéticas que son terapéuticamente procesables. En este contexto, las biopsias líquidas pueden proporcionar el "diagnóstico" necesario para dirigir las opciones de tratamiento terapéutico en la práctica emergente de la medicina de precisión. Un segundo aspecto de las biopsias líquidas es la "monitorización" de los niveles de ADNtc como indicador de la carga de enfermedad. Una aplicación de la monitorización es la vigilancia de la recaída de la enfermedad en pacientes cuya enfermedad está en remisión. Una segunda aplicación es la evaluación temprana de la eficacia del tratamiento. La literatura científica reciente sugiere que los niveles de ADNtc disminuyen en pacientes cuyos tumores responden a la terapia, lo que sugiere que la monitorización del ADNtc puede ser generalmente útil como marcador de la eficacia del tratamiento. (Almodóvar K. J Thorac Oncol. enero de 2018; 13(1): 112-123; Merker J.D. J Clin Oncol. 1 de junio de 2018; 36(16): 1631-1641).
[0070] Las aplicaciones de monitorización aprovechan las diferencias específicas de los tumores entre el genoma del tumor frente al tejido normal. Estas mutaciones específicas de tumores, o "marcadores tumorales", pueden ser causales o no de la enfermedad; su utilidad es que pueden usarse para diferenciar fragmentos de ADNtc derivados de tumores de fragmentos de ADN normales de la línea germinal. Es importante destacar que las aplicaciones de monitorización de biopsias líquidas implican un análisis cuantitativo de la proporción de fragmentos de ADNtc en relación con los fragmentos de la línea germinal dentro de una muestra. Esta proporción a menudo se denomina "frecuencia de alelo menor (MAF,minor alíele frequency)"o "frecuencia de alelo variante (VAF,variant alíele frequency)"de una mutación específica de un tumor. La determinación precisa del marcador tumoral MAF/VAF depende de la capacidad de contar fragmentos únicos, un punto de énfasis en la presente divulgación.
[0071] A efectos de monitorización, determinados genes están frecuentemente mutados en casi todos los cánceres, siendo el más notable el TP53, gen supresor de tumores. Si bien no existen terapias dirigidas a los cánceres que albergan mutaciones de TP53, sin embargo, sigue siendo un marcador tumoral útil para monitorizar los niveles de ADNtc. Por lo tanto, se anticipa que en la práctica de los procedimientos aquí divulgados, a menudo se secuenciará TP53 en su totalidad. Además, muchos tipos de cáncer específicos albergan mutaciones frecuentes en genes específicos del subtipo de cáncer. Los procedimientos y composiciones divulgados pretenden proporcionar una herramienta genérica para el análisis dirigido de ADN genómico; es "programable" en virtud de las secuencias del dominio de hibridación de las sondas de oligonucleótidos, que se utilizan en el ensayo y para recuperar las regiones genómicas correspondientes deseadas. Cuando la aplicación de esta tecnología requiera la monitorización de enfermedades de subtipos de cáncer particulares, se anticipa que el "panel" de sondas de oligonucleótidos, es decir, las dianas previstas de la constelación de sondas de oligonucleótidos utilizadas en un ensayo específico, incluirá sondas para interrogar a estos genes frecuentemente mutados específicos de enfermedades con el fin de monitorizar la carga de la enfermedad.
[0072] Los procedimientos y composiciones aquí divulgados también están diseñados para adaptarse a la detección de la variación del número de copias entre genes diana. Esto es importante porque los expertos en la técnica entienden que el cáncer puede resultar de, y ser impulsado por, la amplificación de oncogenes y la pérdida de genes necesarios para la supresión de tumores. El análisis de copias se basa en el recuento de secuencias únicas que se recuperan mediante cualquier sonda de oligonucleótidos particular. En muchos casos, la región diana de los procedimientos descritos serán las regiones codificantes de un gen completo, y en humanos (eucariotas multicelulares en general), esto a menudo significa secuenciar múltiples exones que están dispersos entre regiones intrónicas. Además, el requisito de secuenciar ambas cadenas de un gen diana implica que se pueden elegir sondas de oligonucleótidos para hibridar ambas cadenas de un exón diana y, en general, en múltiples posiciones dentro de las regiones reconocidas. Por lo tanto, la profundidad genómica de un gen o región diana se puede calcular a partir del perfil agregado de recuentos de lectura únicos (a menudo denominados "profundidad de cobertura" o simplemente "cobertura") para cada sonda de oligonucleótidos en una región diana. En algunos casos, puede ser deseable aumentar el análisis preciso de profundidad genómica para los loci diana incluyendo sondas de oligonucleótidos adicionales que se hibridan con regiones genómicas únicas (por ejemplo, segmentos intrónicos) que están dentro o cerca de la región diana de interés. La motivación para estas sondas de oligonucleótidos adicionales es que el recuento tiene un ruido estadístico inherente y, por lo tanto, los datos adicionales pueden aumentar la precisión de las mediciones de recuento genómico al aumentar la relación señal-ruido. Esta divulgación no pretende enseñar procedimientos bioinformáticos, sin embargo, los recuentos agregados en cada loci diana dentro de una muestra de prueba se pueden comparar con un perfil similar generado a partir de muestras de control conocidas. De esta manera, la variación intrínseca en las mediciones de profundidad genómica de una diana a otra se elimina mediante la "normalización" a los estándares de referencia establecidos.
Kits
[0073] En otro aspecto, la divulgación da a conocer un kit (que no forma parte de la invención reivindicada), que comprende uno o más reactivos, tal como se ha descrito anteriormente, e indicaciones escritas que instruyen la realización de los procedimientos descritos anteriormente. El kit puede comprender un adaptador de oligonucleótido, una ADN polimerasa con actividad exonucleasa de 3' a 5' capaz de crear extremos romos en ADN de doble cadena, una pluralidad de enzimas que median en la reparación del ADN, una enzima de ligadura de ADN e indicaciones escritas que instruyen la realización del procedimiento descrito anteriormente.
[0074] En algunas realizaciones, el kit comprende además una fosfatasa alcalina.
[0075] En algunas realizaciones, el kit comprende ADN polimerasa T4, el fragmento Klenow de la ADN polimerasa I deE. colio una combinación de los mismos. En algunas realizaciones, el kit comprende ADN polimerasa Bst de longitud completa, ADN ligasa Taq, endonucleasa IV o cualquier combinación de las mismas. En algunas realizaciones, el kit comprende además un tampón configurado para soportar la desfosforilación y/o la reparación del ADN. En algunas realizaciones, el kit comprende ADN ligasa<t>4, ADN ligasa T3 o una combinación de las mismas. En algunas realizaciones, el kit comprende tampón de ligadura.
[0076] El adaptador de oligonucleótido del kit puede contener los elementos del adaptador de oligonucleótido, tal como se ha descrito anteriormente. Por ejemplo, en algunas realizaciones, el adaptador de oligonucleótido comprende un dominio de hibridación de cebador con una secuencia de nucleótidos que permite la amplificación por PCR lineal o exponencial tras la hibridación de un cebador. En algunas realizaciones, el adaptador de oligonucleótido comprende un dominio de etiqueta de clones y/o un dominio de etiqueta de muestras.
[0077] En algunas realizaciones, el kit comprende además un primer cebador que se hibrida con el dominio de hibridación del adaptador de oligonucleótido.
[0078] En algunas realizaciones, el kit comprende además nucleótidos trifosfato que soportan tanto la reparación del ADN, como la polimerización del ADN y/o la ligadura del ADN. En algunas realizaciones, los nucleótidos trifosfato comprenden dNTP y ATP.
[0079] En algunas realizaciones, el kit comprende además una sonda de oligonucleótidos, tal como se ha descrito anteriormente. En algunas realizaciones, la sonda de oligonucleótidos comprende un dominio de hibridación con una secuencia que se hibrida con una secuencia genómica diana. El dominio de hibridación puede ser > 20 nt, > 25 nt, > 30 nt, > 35 nt o > 40 nt. La sonda de oligonucleótidos puede comprender un dominio de hibridación de cebador con una secuencia de nucleótidos que permite la amplificación por PCR tras la hibridación de un cebador. En algunas realizaciones, la sonda de oligonucleótidos comprende un oligonucleótido dúplex complementario hibridado con el extremo 5' de la sonda de oligonucleótidos. El oligonucleótido dúplex complementario puede comprender un resto de biotina terminal 3' y al menos una sustitución de una base T por una base didesoxi U.
[0080] En algunas realizaciones, el kit comprende además polimerasa Taq y/o polimerasa Q5.
[0081] En algunas realizaciones, el kit comprende además microesferas magnéticas configuradas para unirse a moléculas de ácido nucleico. En algunas realizaciones, las microesferas magnéticas pueden ser microesferas recubiertas de carboxilo. En algunas realizaciones, las microesferas magnéticas pueden ser microesferas recubiertas de estreptavidina. En algunas realizaciones, el kit comprende tanto microesferas recubiertas de carboxilo como microesferas recubiertas de estreptavidina.
[0082] En algunas realizaciones, el kit comprende además una sal isoestabilizante, o una solución de la misma. En algunas realizaciones, el kit comprende además una solución de lavado de alta rigurosidad.
[0083] En algunas realizaciones, el kit comprende además cebadores de PCR, tal como se ha descrito anteriormente. En algunas realizaciones, el kit comprende además cebadores de secuenciación específicos de plataforma, tal como se ha descrito anteriormente.
Definiciones generales
[0084] A menos que se definan específicamente en el presente documento, todos los términos utilizados en el presente documento tienen el mismo significado que tendrían para un experto en la técnica de la presente divulgación. Los profesionales deben dirigirse especialmente a Ausubel, FM, et al. (eds.), Current Protocols in Molécular Biology, John Wiley & Sons, Nueva York (2010).
[0085] Por conveniencia, en el presente documento se proporcionan ciertos términos, en la memoria descriptiva, ejemplos y reivindicaciones adjuntas. Las definiciones se proporcionan para ayudar a describir realizaciones particulares y no pretenden limitar la invención reivindicada porque el alcance de la invención está limitado únicamente por las reivindicaciones.
[0086] El uso del término "o" en las reivindicaciones se utiliza para significar "y/o", a menos que se indique explícitamente que se refiere solo a alternativas o que las alternativas sean mutuamente excluyentes, aunque la divulgación respalda una definición que se refiere solo a alternativas y "y/o".
[0087] Las palabras "un" y "una", cuando se usan junto con la palabra "que comprende" en las reivindicaciones o la memoria descriptiva, indican uno o más, a menos que se indique específicamente.
[0088] A menos que el contexto requiera claramente lo contrario, a lo largo de la descripción y las reivindicaciones, las palabras "comprende", "que comprende" y similares, deben interpretarse en un sentido inclusivo en contraposición a un sentido exclusivo o exhaustivo, que es para indicar, en el sentido de "que incluye, pero sin limitación". Las palabras que usan el número singular o plural también incluyen el número plural y singular, respectivamente. La palabra "aproximadamente" indica un número dentro del intervalo de variación menor por encima o por debajo del número de referencia indicado. Por ejemplo, "aproximadamente" puede referirse a un número dentro de un intervalo del 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 % o 1 % por encima o por debajo del número de referencia indicado.
[0089] Se divulgan materiales, composiciones y componentes que se pueden usar para, se pueden usar junto con, se pueden usar en preparación para, o son productos de los procedimientos y composiciones divulgados. Se entiende que, cuando se divulgan combinaciones, subconjuntos, interacciones, grupos, etc., de estos materiales, se contempla específicamente cada una de las diversas combinaciones individuales y colectivas, aunque no se haya divulgado de manera explícita la referencia específica a todas y cada una de las combinaciones y permutaciones de estos compuestos. Este concepto se aplica a todos los aspectos de esta divulgación, que incluye, pero sin limitación, las etapas de los procedimientos descritos. Por tanto, elementos específicos de cualquiera de las realizaciones anteriores se pueden combinar o sustituir por elementos de otras realizaciones. Por ejemplo, si hay una variedad de etapas adicionales que se pueden realizar, se entiende que cada una de estas etapas adicionales se puede realizar con cualquier etapa de procedimiento específico o combinación de etapas de procedimiento de los procedimientos divulgados, y que cada una de dicha combinación o subconjunto de combinaciones se contempla específicamente y debe considerarse divulgada. Además, se entiende que las realizaciones descritas en el presente documento se pueden implementar usando cualquier material adecuado, tales como los descritos en otra parte del presente documento o como se conoce en la técnica.
EJEMPLOS
[0090] Los siguientes ejemplos se proporcionan con el propósito de ilustrar, no limitar, la divulgación.
Ejemplo 1
[0091] Este ejemplo describe una realización de ejemplo de unión de adaptadores de tipo adaptador de oligonucleótido multifuncional ("LINDA") a ADNlc reparado y pulido.
[0092] Se purificó ADN libre de células (ADNlc) a partir del plasma de donantes sanos usando el kit de ácido nucleico circulante QlAamp tal como lo describe el fabricante (Qiagen, Hilden, Alemania). Los rendimientos de ADN de doble cadena se cuantificaron utilizando un fluorómetro Qubit (ThermoFisher, Waltham, MA) y reactivos para la cuantificación de ADN de doble cadena (Biotium, Fremont, CA). Las muestras de plasma utilizadas en estos ejemplos proporcionaron 10 -15 ng/ml de plasma. Se desfosforilaron alícuotas de cuarenta microlitros de ADNlc con una concentración de 1,14 ng/ul usando fosfatasa alcalina de gamba recombinante (New England Biolabs, Ipswich, MA) a 37 °C durante 30 min, seguido de reparación del ADN y creación de extremos romos (pulido) con un cóctel de enzimas que contiene ADN polimerasa T4, ADN polimerasa Bst de longitud completa, ADN ligasa Taq y endonucleasa IV (NEB) en una reacción de 50 ul que contiene 100 nM de cada dNTP a 20 °C durante 5 minutos. El ADN reparado y pulido se añadió a una reacción de ligadura de 100 ul que contenía 1 x tampón de ligadura de ADN (NEB), adaptadores LINDA 2 uM (FIGURA 2B, TABLA 1), y 10 ul de ADN ligasa. Todos los oligonucleótidos utilizados en estos experimentos fueron sintetizados por Integrated DNA Technologies (Coralville, IA). Después de una incubación a 20 °C durante 60 minutos, el ADN ligado se purificó con microesferas de purificación de ADN SPRI usando dos rondas en una proporción de 0,85 volumen de microesferas por 1,0 volumen de ADN. Los productos de ligadura se eluyeron en 42 ul de tampón TE.
TABLA 1: n i ADN li r li LINDA li n l i l ni i
[0093] La eficacia de la ligadura se controló usando qPCR con cebadores (5'-3') AATGATACGGCACCACCGAGATCTACACTCTTTCCCTACACGACGTCTTCCGA TCT (SEQ ID NO: 33) y GAGGCTGAGGCAGGAGAATCG (SEQ ID NO:34). El primer cebador de qPCR se hibrida con la secuencia del adaptador LINDA y el último cebador se hibrida con una región del elementoAluSINE humano. La cantidad de ADNlc ligado en la muestra desconocida se calculó aplicando un conjunto de muestras de calibración de concentración conocida e interpolando muestras usando esta curva estándar. Las mediciones típicas del rendimiento de la biblioteca fueron de 6 a 8 ng de LINDA/ADNlc ligado para entradas de ADNlc de 25 a 40 ng. Dado que un genoma humano tiene una masa aproximada de 3,3 pg, esto se traduce en un intervalo de profundidad genómica de 1800 a 2400 genomas clonados.
[0094] Las mediciones para el experimento incluido en este informe se establecen en la TABLA 2.
Ejemplo 2
[0095] Este ejemplo describe la amplificación lineal de plantillas quiméricas de adaptador LINDA/fragmento de ADNlc.
[0096] Las muestras de 40 ul de la biblioteca del EJEMPLO 1 se amplificaron en una reacción de 100 ul que contenía 50 ul de mezcla madre NEBNext® Ultra™ II Q5®y 10 ul de cebador 4 uM (5'-3') AATGATACGCGACCACCGAGATCTACACTCTTTCCCTACACGACGTCTCTTCCGA TCT (SEQ ID NO:35) usando un programa de ciclado térmico de 98 °C durante 30 segundos y 20 ciclos de una amplificación de 2 etapas de 98 °C durante 10 segundos y 65 °C durante 60 segundos. El producto amplificado se purificó con microesferas magnéticas de purificación de ADN de inmovilización reversible en fase sólida (SPRI,solid pase reversible immobilization)en una proporción de 2,0 volúmenes de microesferas por 1,0 volumen de ADN amplificado. Ver, por ejemplo, Rohland N, Reich D., Cost-effective, high-throughput DNA sequencing libraries for multiplexed target capture. Genoma Research 22: 939-946.
[0097] El ADN monocatenario purificado se eluyó en un volumen de 10 ul de tampón TE (Tris 10 mM, pH 8,0, EDTA 1 mM).
[0098] El ADN monocatenario generado mediante este procedimiento lineal se cuantificó utilizando qPCR de loci únicos en el genoma humano. Ensayos de dos pares de cebadores monitorizan regiones en el gen e Gf R humano (EGFR-4: GTCGCAGAGCACTTGCAGACTTTTT (SEQ ID NO:36) AATGTGGTTTCGTTGGAAGCAAATG (SEQ ID NO:37) y EGFR-5: TTCTGCTTAACCATTGTGGGCATCT (SEQ ID NO:38) CAATCAAGATGGTTTTGCCAAGGAA (SEQ ID NO:39)) y dos pares monitorizan regiones únicas en el gen TP53 (TP53-2: CGTATCCCCCTGCATTTCTTTTGTT (SEQ ID NO:40) CAAAGGGTGAAGAGGAATCCCAAAG (SEQ ID NO:41) y TP53-3: TTTATCCATCCCATCACACCCTCAG (SEQ ID NO:42) AAAGAAAAGTTCTGCATCCCCAGGA (SEQ ID NO: 43)). En relación con el material de entrada no amplificado, los cuatro ensayos revelaron un aumento de 10 a 15 veces en la cantidad de estas regiones genómicas únicas. Los valores reales para el experimento indicado en este ejemplo se establecen en la TABLA 3.
TABLA 3: Medición de la unión del ada tador LINDA
Ejemplo 3
[0099] Este ejemplo describe una realización de ejemplo de hibridación de la cadena complementaria de la molécula quimérica adaptador/fragmento producida en el EJEMPLO 2 con sondas de oligonucleótidos ("oligonucleótidos de Fetcher") y procesamiento posterior a la hibridación en una biblioteca de secuenciación NGS.
[0100] Se agrupó un conjunto de cuatro bibliotecas de ADNlc amplificadas hasta un volumen final de 40 ul y, a continuación, se dividieron en dos reacciones de hibridación separadas denominadas "A" y "B". Cada reacción de hibridación contenía 20 ul de ADN y 4 ul de oligonucleótidos de Fetcher combinados "A" o "B" (sondas de oligonucleótidos; véase la FIGURA 3B y la TABLA 4). El grupo "A" contenía 64 secuencias de Fetcher diferentes y el grupo "B" contenía 63 secuencias de Fetcher diferentes. Cada oligonucleótido de Fetcher individual estaba presente a una concentración final de 50 pM en la reacción de hibridación. La mezcla de ADN y oligonucleótido de Fetcher se desnaturalizó a 98 °C durante 2 min y se añadieron 36 ul de tampón de hibridación que contenía cloruro de tetrametilamonio 5 M, Tris 10 mM, pH 8,0, EDTA 1 mM y Tween-20 al 0,1 %. Estas reacciones de hibridación se calentaron a continuación a 98 °C durante 10 segundos y se incubaron a 65 °C durante 4 horas.
TABLA 4: Secuencias de ADN de oligonucleótidos de Fletcher
(Continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
(continuación)
[0101] Después de la hibridación, los dúplex de cadena complementaria dirigida/sonda de Fetcher se purificaron usando microesferas de purificación de ADN SPRI (ver arriba) en una proporción de 1,2 volumen de microesferas por 1,0 volumen de ADN. El ADN purificado se eluyó en 10 ul de TE, las hibridaciones "A" y "B" se agruparon en 20 ul y se combinaron con 20 ul de MyOne Streptavidin C1 Dynabeads (Thermofisher) en una solución final de 40 ul que contenía NaCl 2 M, 10 mM. Tris pH 8,0, EDTA 1 mM y se incubaron a temperatura ambiente durante 15 min. El ADN unido a estas microesferas paramagnéticas se separó de la solución utilizando un imán de laboratorio, se lavó una vez con 200 ul de tampón<t>E que contenía Tween 20 al 0,5 % y se resuspendió en 40 ul de TE. Se añadieron sesenta microlitros de tampón de hibridación y la solución se calentó hasta 75 °C durante 5 min. Las microesferas se separaron, se lavaron con 200 ul de tampón TE y se resuspendieron en 50 ul de tampón de extensión con cebador/escisión de uracilo que contenía polimerasa OneTaq HOT START y enzima de escisión User II (ambas de NEB) en 1X tampón Taq con dNTP 200 nM. La escisión se realizó a 37 °C durante 15 min. Las microesferas se separaron de la solución y se descartaron. La extensión con el cebador se realizó incubando la solución a 60 °C durante 30 segundos, 68 °C durante 30 segundos y 98 °C durante 30 segundos.
[0102] Los 50 ul de ADN de captura escindido y extendido con cebador se transfirieron a una mezcla de amplificación por PCR de 250 ul que contenía una mezcla madre de NEBNext® Utra™ II Q5® y cebadores de PCR específicos de la plataforma de secuenciación Illumina AATGATACGCGACCACCGAGATCTACACTCTTTCCTACA (SEQ ID NO: 172) y CAAGCAGAAGACGGCATACGAGATGTGACTGGAGTTCAGACGTG (SEQ ID NO: 173). Se monitorizaron veinticinco ul de la mezcla de amplificación mediante qPCR (98 °C - 10 segundos y 65 °C - 60 segundos) para determinar el último ciclo en el que se observó amplificación exponencial; este resultó ser el ciclo número 23 en todos los experimentos reportados aquí. Los 225 ul restantes se amplificaron usando un ciclador térmico convencional durante 23 ciclos de PCR. Se purificaron veinticinco microlitros como "fracción total de la biblioteca" con 2,0 volúmenes de microesferas por 1,0 volumen de muestra de ADN y se resuspendieron en un volumen final de 20 ul. Los 200 ul restantes se purificaron con microesferas de purificación de ADN SPRI usando tres rondas en una proporción de 0,80 volumen de microesferas por 1,0 volumen de ADN. La biblioteca de secuenciación purificada se resuspendió en un volumen de 40 ul de TE. Antes de la secuenciación, la cantidad de biblioteca de post-hibridación amplificada y purificada se midió usando el fluorómetro Qubit y las distribuciones de tamaño de las fracciones totales y purificadas se determinaron usando electroforesis en gel de ADN (FIGURA 4). Para el experimento aquí presentado, el rendimiento de la fracción total fue de 12,7 ng/ul y el rendimiento de la fracción purificada fue de 43,4 ng/ul. Cuando se ajusta por volúmenes, esto corresponde a una recuperación del 85 % de ADN en la fracción purificada.
Ejemplo 4
[0103] Este ejemplo describe una realización de ejemplo de secuenciación de ADN y análisis posterior a la secuencia de las moléculas plantilla de secuenciación en la biblioteca de secuenciación NGS producida en los EJEMPLOS 1-3.
[0104] El conjunto de cuatro bibliotecas iniciales que se marcaron con diferentes etiquetas de muestra y se combinaron se secuenciaron usando el instrumento de análisis genómico MySeq y un kit de microsecuenciación de 300 ciclos V2 (Illumina, San Diego, CA). Se cargó en el instrumento una dilución a una concentración final de 8 pM = 1,3 pg/ul, según lo recomendado por el fabricante. Esta conversión de molaridad a masa por ul supone un tamaño de clon total promedio de 250 pb; el rendimiento observado de 798 grupos/mm2 concordaba con la densidad recomendada de 800 grupos/mm2. La secuenciación se realizó en modo de extremos emparejados con un READ1 directo de 151 pb y un READ2 inverso de 151 pb. Una parte del resultado del archivo FASTQ resultante se cargó en Excel (Microsoft, Redmond, WA) y se analizó.
[0105] Se utilizó el análisis de secuencia de ADN para extraer mediciones importantes de los datos. Éstas fueron: El 92,8% de las secuencias READ1 tenían una coincidieron con las etiquetas de muestra de entrada en la posición correcta dentro de la secuencia. Esto representa un alto rendimiento de datos analizables.
El 84,2% de las secuencias READ2 tenían una coincidencia con una de las 127 posibles secuencias de Fetcher. El 79,9% de los pares de lectura tenían una coincidencia perfecta con una etiqueta de muestras y una secuencia de Fetcher en READ1 y READ2, respectivamente.
El 91,0% de los pares leídos con una secuencia de Fetcher completa estaban en la "diana específica", lo que significa que las primeras cinco bases de la secuencia capturada coincidían con la secuencia genómica diana esperada. En la figura 5 se muestra un gráfico de las tasas de diana específicas para cada oligonucleótido de Fetcher independiente.
[0106] La distribución de tamaños de inserciones en la biblioteca de clones, que se muestra en la FIGURA 6, refleja fielmente la expectativa de que la mayoría de las inserciones deberían oscilar entre 60 pb y 220 pb.
[0107] Las mediciones de la profundidad genómica de cada biblioteca, definida como el número de fragmentos genómicos únicos encontrados para cada oligonucleótido de Fetcher, se muestran para el grupo híbrido "A" en cuatro bibliotecas independientes en la FIGURA 7. La profundidad promedio en todas las bibliotecas y en todas las posiciones de Fetcher del grupo "A" fue de 1327 genomas únicos. Cabe indicar que la profundidad observada a partir de las mediciones de qPCR indicadas en el EJEMPLO 1 y la profundidad máxima cuantificada del análisis de secuencia de ADN concuerdan bien. Si bien existe una variación en el número de lecturas únicas (profundidad) para diferentes oligonucleótidos de Fetcher, existe una excelente reproducibilidad entre bibliotecas. Esta última característica es importante para medir la variación del número de copias.
[0108] Muchos de los oligonucleótidos de Fetcher utilizados en estos experimentos reconocieron polimorfismos de un solo nucleótido (SNP) humanos que comúnmente varían entre diferentes individuos. Un conjunto adicional de oligonucleótidos de Fetcher reconocen el gen SRY que se encuentra en el cromosoma Y específico de los hombres, y se puede usar una señal positiva o negativa de estas regiones reconocidas para determinar si el género es masculino o femenino, respectivamente. Los datos de genotipado de bibliotecas de ADNlc de varios individuos se muestran en la TABLA 5.
�� c
<Cc>o
[0109] Estos resultados demuestran que la estrategia para generar bibliotecas de secuenciación de próxima generación para secuenciación dirigida, tal como se representa en las FIGURAS 1B-E, dan lugar a lecturas reproducibles, profundas y precisas del ADNbc libre de células obtenido de muestras biológicas.

Claims (15)

REIVINDICACIONES
1. Procedimiento para generar una biblioteca de ADN para secuenciación dirigida, que comprende:
a) unir el extremo 5' de un adaptador de oligonucleótido al extremo 3' de un fragmento de ADN bicatenario para producir una molécula quimérica adaptador/fragmento;
b) producir al menos una cadena complementaria de la molécula quimérica adaptador/fragmento mediante amplificación lineal;
c) hibridar dicha al menos una cadena complementaria con una sonda de oligonucleótidos, en el que la sonda de oligonucleótidos comprende un dominio de hibridación con una secuencia que se hibrida con una secuencia diana en la cadena del complemento para producir un dúplex de cadena de complemento dirigida/sonda;
d) purificar el dúplex de cadena de complemento dirigida/sonda; y
e) extender la sonda en el dúplex de cadena de complemento dirigida/sonda purificado y amplificar con PCR para producir una pluralidad de moléculas plantilla de secuenciación.
2. Procedimiento, según la Reivindicación 1, que comprende además realizar la secuenciación de ADN de la pluralidad de moléculas de secuenciación.
3. Procedimiento, según la Reivindicación 1 o la Reivindicación 2, en el que el adaptador de oligonucleótido comprende:
(i) un dominio de hibridación de cebador con una secuencia de nucleótidos que permite la amplificación por PCR lineal o exponencial tras la hibridación de un cebador;
(ii) un dominio de etiqueta de clones con una secuencia de nucleótidos que marca de forma única cada molécula plantilla de secuenciación que comprende una secuencia derivada del adaptador de oligonucleótido;
(iii) un dominio de etiqueta de muestras con una secuencia de ácido nucleico que marca muestras independientes de fragmentos de ADN bicatenario y, por lo tanto, permite el análisis múltiple de múltiples muestras a la vez;
(iv) un grupo fosfato en el extremo 5';
(v) una modificación en el enlace fosfato 3' terminal; opcionalmente, en el que la modificación del enlace fosfato 3' terminal comprende una modificación de fosforotioato; y/o
(vi) un espaciador C3 en el extremo 3'.
4. Procedimiento, según cualquier reivindicación anterior, en el que el adaptador de oligonucleótido comprende un grupo fosfato en el extremo 5' y es un componente de un dúplex adaptador, en el que el dúplex adaptador comprende: (i) un oligonucleótido dúplex complementario hibridado al extremo 5' extremo del adaptador de oligonucleótido, en el que el oligonucleótido dúplex complementario comprende una modificación en su extremo 3' evitando así la ligadura del fragmento de ADN bicatenario al oligonucleótido dúplex complementario y facilitando la unión del extremo 5' del adaptador de oligonucleótido al fragmento de ADN bicatenario; opcionalmente, en el que la modificación en el extremo 3' es un espaciador C3 en 3'; o
(ii) un oligonucleótido asociado complementario, en el que el adaptador de oligonucleótido está hibridado con el extremo 3' del oligonucleótido asociado complementario, en el que el oligonucleótido asociado complementario está configurado para servir como plantilla para la extensión en 3' del adaptador de oligonucleótido, pero en el que el oligonucleótido asociado el oligonucleótido comprende un espaciador C3 interno para bloquear la replicación completa del oligonucleótido asociado en el adaptador de oligonucleótido y evitar la formación de un extremo romo después de la extensión del adaptador de oligonucleótido; opcionalmente, en el que la cadena asociada complementaria comprende uno o más de:
(a) un dominio de hibridación de cebador;
(b) un dominio de etiqueta de clones interno;
(c) un dominio de etiqueta de muestras; y
(d) una modificación en el extremo 3'; opcionalmente, en el que la modificación comprende un espaciador C3 en 3'.
5. Procedimiento, según cualquier reivindicación anterior, que comprende además:
(i) desfosforilar los extremos 5' del fragmento de ADN bicatenario antes de la etapa (a); opcionalmente, en el que desfosforilar los extremos 5' del fragmento de ADN bicatenario comprende tratar el fragmento de ADN con fosfatasa alcalina;
(ii) poner en contacto el fragmento de ADN con una ADN polimerasa con actividad exonucleasa 3' a 5' para crear extremos romos en el fragmento de ADN bicatenario antes de la etapa (a); opcionalmente, en el que la ADN polimerasa es ADN polimerasa T4, el fragmento Klenow de la ADN polimerasa Ide E. coli,o una combinación de los mismos; o (iii) poner en contacto el fragmento de ADN con una pluralidad de enzimas que median en la reparación del ADN antes de la etapa (a); opcionalmente, en el que las enzimas reparadoras de ADN comprenden ADN polimerasa Bst de longitud completa, ADN ligasa Taq, endonucleasa IV o cualquier combinación de las mismas.
6. Procedimiento, según cualquier reivindicación anterior, en el que unir el adaptador de oligonucleótido al extremo 3' del fragmento de ADN bicatenario comprende poner en contacto el adaptador de oligonucleótido y el fragmento de ADN bicatenario con una enzima de ligadura de ADN; opcionalmente, en el que la enzima de ligadura de ADN es ADN ligasa T4, ADN ligasa T3 o una combinación de las mismas.
7. Procedimiento, según cualquier reivindicación anterior, en el que el fragmento de ADN bicatenario:
(i) es ADN libre de células (a Dn Ic);
(ii) se obtiene de una muestra biológica obtenida de un sujeto; opcionalmente, en el que el procedimiento comprende además aislar el fragmento de ADN bicatenario de la muestra biológica; y/o
(iii) es ADN humano.
8. Procedimiento, según cualquier reivindicación anterior, en el que la amplificación lineal:
(i) está mediada por una ADN polimerasa termoestable;
(ii) comprende una o más rondas de un procedimiento de ciclado térmico de dos etapas, en el que la primera etapa se realiza a aproximadamente 98 °C durante aproximadamente 10 segundos y la segundo etapa para la hibridación y extensión del cebador se realiza a 65 °C durante aproximadamente 30 segundos; y/o
(iii) está mediado por un primer cebador que se hibrida con el dominio de hibridación del cebador y está presente en aproximadamente 100 nM a aproximadamente 800 nM; opcionalmente, en el que el primer cebador es preferiblemente > aproximadamente 40 nt o > aproximadamente 60 nt.
9. Procedimiento, según cualquier reivindicación anterior, en el que la sonda de oligonucleótidos comprende:
(i) un oligonucleótido dúplex complementario que también es un dominio de hibridación de cebador en el extremo 5' con una secuencia de nucleótidos que permite la amplificación por PCR tras la hibridación de un cebador; opcionalmente, en el que el oligonucleótido dúplex complementario y el dominio de hibridación de cebador son mayores o iguales a 30 nt o superior o iguales a 40 nt;
(ii) un oligonucleótido dúplex complementario hibridado con el extremo 5' de la sonda de oligonucleótidos; opcionalmente, en el que el oligonucleótido dúplex complementario comprende un resto de biotina 3' terminal y al menos una sustitución de una base T por una base didesoxi U; y/o
(iii) el dominio de hibridación es > 20 nt, > 25 nt, > 30 nt, > 35 nt o > 40 nt.
10. Procedimiento, según cualquier reivindicación anterior, en el que el procedimiento se realiza para una pluralidad de fragmentos de ADN bicatenario diferentes, en el que una pluralidad de sondas de oligonucleótidos diferentes se ponen en contacto con una pluralidad de cadenas complementarias producidas en la etapa (b), y en el que la pluralidad de sondas de oligonucleótidos diferentes comprende cada una un dominio de hibridación con una secuencia diferente que se hibrida con una secuencia diana diferente.
11. Procedimiento, según cualquier reivindicación anterior, en el que la etapa de hibridación (c) y/o la etapa de purificación (d) se realizan en una solución salina isoestabilizante; opcionalmente, en el que la sal isoestabilizante es cloruro de tetrametilamonio.
12. Procedimiento, según cualquier reivindicación anterior, en el que la purificación del dúplex de cadena de complemento dirigida/sonda comprende la unión de una cola modificada con biotina de la sonda de oligonucleótidos en el dúplex de cadena de complemento dirigida/sonda a una microesfera paramagnética recubierta de estreptavidina; opcionalmente, en el que el procedimiento comprende además aplicar un lavado de alta rigurosidad al dúplex de cadena de complemento dirigida/sonda unido a microesferas; opcionalmente, en el que la etapa de lavado de alta rigurosidad comprende incubar los dúplex de cadena de complemento dirigida/sonda unidos a microesferas en una solución que comprende cloruro de tetrametilamonio aproximadamente 3 M a aproximadamente 75 °C durante al menos aproximadamente 5 min.
13. Procedimiento, según la reivindicación 12, en el que los dúplex de cadena de complemento/sonda se separan de las microesferas paramagnéticas después de la escisión con una enzima que escinde de manera específica el esqueleto de fosfato en las bases de desoxiuracilo.
14. Procedimiento, según cualquier reivindicación anterior, en el que la extensión de la sonda en la etapa (e) comprende aplicar una ADN polimerasa termoestable a > aproximadamente 55 °C, > aproximadamente 57 °C o > aproximadamente 60 °C, y amplificar en la etapa (e) comprende usar un primer cebador de PCR que se hibrida selectivamente con un dominio de hibridación de cebador en la cadena de complemento dirigida del dúplex y un segundo cebador de PCR que se hibrida selectivamente con un dominio de hibridación de cebador en la cadena de sonda extendida; opcionalmente en el que:
(i) la ADN polimerasa termoestable en la etapa (e) es ADN polimerasa Taq; y/o
(ii) la amplificación por PCR en la etapa (e) está mediada por una polimerasa termoestable de alta fidelidad, tal como la polimerasa Q5.
15. Procedimiento, según cualquier reivindicación anterior, en el que el adaptador de oligonucleótido comprende un dominio de etiqueta de clones con una secuencia de nucleótidos que marca cada clon genómico resultante y un dominio de etiqueta de muestras con una secuencia de ácido nucleico que marca muestras independientes y de ese modo permite el análisis múltiple de múltiples muestras a la vez, y en el que el procedimiento comprende además aplicar un análisis bioinformático que integra coordenadas de alineación de fragmentos de ADN bicatenario secuenciados, la secuencia del dominio de etiqueta de clones y la secuencia del dominio de etiqueta de muestras.
ES19840255T 2018-07-24 2019-07-23 Procedimientos y composición para un análisis genómico dirigido Active ES2987423T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862702824P 2018-07-24 2018-07-24
PCT/US2019/043005 WO2020023493A1 (en) 2018-07-24 2019-07-23 Methods and composition for targeted genomic analysis

Publications (1)

Publication Number Publication Date
ES2987423T3 true ES2987423T3 (es) 2024-11-14

Family

ID=69182399

Family Applications (1)

Application Number Title Priority Date Filing Date
ES19840255T Active ES2987423T3 (es) 2018-07-24 2019-07-23 Procedimientos y composición para un análisis genómico dirigido

Country Status (10)

Country Link
US (1) US12195731B2 (es)
EP (1) EP3827011B1 (es)
AU (1) AU2019311015B2 (es)
CA (1) CA3107052A1 (es)
DK (1) DK3827011T3 (es)
ES (1) ES2987423T3 (es)
FI (1) FI3827011T3 (es)
PL (1) PL3827011T3 (es)
PT (1) PT3827011T (es)
WO (1) WO2020023493A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2025072689A1 (en) * 2023-09-28 2025-04-03 The Regents Of The University Of California Methods and compositions for producing sequencing libraries
WO2025228840A1 (en) * 2024-05-02 2025-11-06 Medicover Biotech Ltd. Method for somatic mutation detection

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL148091A0 (en) * 1999-09-13 2002-09-12 Nugen Technologies Inc Methods and compositions for linear isothermal amplification of polynucleotide sequences
WO2005054435A2 (en) 2003-11-26 2005-06-16 Eppendorf Ag Methods and compositions for in vitro amplification of extrachromosomal nucleic acid
EP1924704B1 (en) * 2005-08-02 2011-05-25 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
EP2038429B1 (en) * 2006-06-30 2013-08-21 Nugen Technologies, Inc. Methods for fragmentation and labeling of nucleic acids
CN107267596A (zh) * 2009-06-15 2017-10-20 考利达基因组股份有限公司 用于长片段阅读测序的方法和组合物
WO2011133695A2 (en) * 2010-04-20 2011-10-27 Swift Biosciences, Inc. Materials and methods for nucleic acid fractionation by solid phase entrapment and enzyme-mediated detachment
US20120196279A1 (en) * 2011-02-02 2012-08-02 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
WO2012151560A2 (en) * 2011-05-04 2012-11-08 Biocept, Inc. Methods for detecting nucleic acid sequence variants
US20150011396A1 (en) * 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
EP3561072A1 (en) * 2012-12-10 2019-10-30 Resolution Bioscience, Inc. Methods for targeted genomic analysis
EP4039811B1 (en) * 2014-01-31 2023-09-20 Integrated DNA Technologies, Inc. Improved methods for processing dna substrates
US10233490B2 (en) * 2014-11-21 2019-03-19 Metabiotech Corporation Methods for assembling and reading nucleic acid sequences from mixed populations
WO2016170147A1 (en) * 2015-04-22 2016-10-27 Qiagen Gmbh Efficiency improving ligation methods
EP3889257A1 (en) 2015-11-11 2021-10-06 Resolution Bioscience, Inc. High efficiency construction of dna libraries
EP3485032B1 (en) * 2016-07-12 2021-02-17 Life Technologies Corporation Compositions and methods for detecting nucleic acid regions

Also Published As

Publication number Publication date
WO2020023493A1 (en) 2020-01-30
AU2019311015B2 (en) 2025-04-24
EP3827011B1 (en) 2024-06-19
US20210292750A1 (en) 2021-09-23
PL3827011T3 (pl) 2024-10-14
FI3827011T3 (fi) 2024-09-09
EP3827011A4 (en) 2022-06-22
DK3827011T3 (da) 2024-07-08
PT3827011T (pt) 2024-08-07
EP3827011A1 (en) 2021-06-02
CA3107052A1 (en) 2020-01-30
AU2019311015A1 (en) 2021-02-18
US12195731B2 (en) 2025-01-14

Similar Documents

Publication Publication Date Title
ES2925014T3 (es) Identificación y uso de ácidos nucleicos circulantes
US20220348998A1 (en) Methods for labelling nucleic acids
ES3002715T3 (en) Methods for early detection of cancer
ES2831148T3 (es) Identificación y uso de marcadores tumorales de ácido nucleico circulante
US20200048697A1 (en) Compositions and methods for detection of genomic variance and DNA methylation status
US20150126376A1 (en) Compositions and methods for sensitive mutation detection in nucleic acid molecules
EP4528275A2 (en) Methods of preparing dual-indexed dna libraries for bisulfite conversion sequencing
TW202012638A (zh) 用於癌症及贅瘤之評估的組合物及方法
CN110719957B (zh) 用于核酸靶向富集的方法和试剂盒
CN115667507A (zh) 用于长读出测序的多核苷酸条形码
US12371744B2 (en) Method of sequencing a nucleic acid of interest
WO2019062614A1 (en) METHOD FOR AMPLIFYING TARGET NUCLEIC ACID
ES2987423T3 (es) Procedimientos y composición para un análisis genómico dirigido
JP2023505398A (ja) 対立遺伝子の区分性を高めるpcr方法及びpcrキット
US12163187B2 (en) Methods of sequencing nucleic acids and error correction of sequence reads
CN105506101A (zh) As-pcr引物设计方法、基因多态性检测方法及试剂盒
US11447832B2 (en) Compositions and methods for oncology precision assays
US20220307077A1 (en) Conservative concurrent evaluation of dna modifications
US20250109446A1 (en) Compositions and methods for oncology assays