[go: up one dir, main page]

ES2984361T3 - Método de análisis de los lugares de inserción - Google Patents

Método de análisis de los lugares de inserción Download PDF

Info

Publication number
ES2984361T3
ES2984361T3 ES20718654T ES20718654T ES2984361T3 ES 2984361 T3 ES2984361 T3 ES 2984361T3 ES 20718654 T ES20718654 T ES 20718654T ES 20718654 T ES20718654 T ES 20718654T ES 2984361 T3 ES2984361 T3 ES 2984361T3
Authority
ES
Spain
Prior art keywords
pcr
sample
polynucleotides
subject
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20718654T
Other languages
English (en)
Inventor
Eugenio Montini
Daniela Cesana
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fondazione Telethon
Ospedale San Raffaele SRL
Original Assignee
Fondazione Telethon
Ospedale San Raffaele SRL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fondazione Telethon, Ospedale San Raffaele SRL filed Critical Fondazione Telethon
Application granted granted Critical
Publication of ES2984361T3 publication Critical patent/ES2984361T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

Un método para analizar sitios de inserción de una secuencia de nucleótidos exógena en el genoma de un sujeto, en donde el método comprende: (a) proporcionar una muestra del sujeto que comprende polinucleótidos de ADN bicatenario libre de células; (b) embotar los extremos de los polinucleótidos; (c) ligar un oligonucleótido a ambos extremos de los polinucleótidos; (d) amplificar polinucleótidos que comprenden un sitio de inserción; y (e) secuenciar el producto del paso (d). (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método de análisis de los lugares de inserción
Campo de la invención
La presente invención se refiere a métodos para analizar los sitios de inserción en el genoma de un sujeto. En particular, la invención se refiere a la identificación y/o cuantificación de los sitios de inserción de una secuencia de nucleótidos exógena, tal como un vector viral de terapia génica, en el genoma de un sujeto.
Antecedentes de la invención
La terapia génica consiste en la incorporación de material genético a una célula para tratar o prevenir una enfermedad. El material genético puede complementar los genes defectuosos con copias funcionales de esos genes, inactivar genes que funcionen incorrectamente o introducir genes para instruir nuevas funciones a una célula.
El suministro de material genético a una célula puede lograrse mediante el uso de vectores que faciliten la transferencia de ácidos nucleicos. Los virus pueden diseñarse para administrar un nucleótido de interés (NOI, por sus siglas en inglés) a una célula objetivo y se emplean habitualmente como vectores en terapia génica. Los virus que se han utilizado en la terapia génica hasta la fecha incluyen retrovirus, lentivirus, adenovirus (AdV) y virus adenoasociados (AAV).
En las aplicaciones de terapia génica que utilizan vectores integradores, tales como retrovirus (RV), lentivirus (LV) y transposones, el análisis del sitio de inserción (SI) suele realizarse en células recolectadas de sujetos. Por ejemplo, en el caso de los enfoques de terapia génica basados en células madre y progenitoras hematopoyéticas (CMPH), el análisis se realiza generalmente en células de la sangre o de la médula ósea (MO).
Los estudios de perfiles de inserción permiten comprender varios aspectos de la seguridad y la eficacia de la transferencia genética, así como la biología de la hematopoyesis. De hecho, el análisis de IS de los niveles de marcaje y actividad de las HSPC después del trasplante y de la diversidad clonal durante la reconstitución hematopoyética puede proporcionar lecturas de eficacia útiles para los enfoques de terapia génica.
Laufs S. et al. Mol Ther. 2004 Nov;10(5):874-81 se refiere a la inserción de vectores retrovirales en células progenitoras de sangre periférica humana repobladoras de NOD/SCID.
Además, la identificación de los IS en puntos temporales seriados tras una intervención (por ejemplo, un trasplante) puede revelar la aparición de efectos adversos, tales como la selección y expansiónin vivode clones celulares que albergan mutantes insercionales de ganancia de funcionalidad que pueden dar lugar a neoplasias. Tales enfoques aplicados sobre biopsias celulares permitieron la detección de clones celulares mielodisplásicos en expansión en dos ensayos clínicos basados en vectores gamma retrovirales (yRV). En estos dos ensayos, los clones en expansión se caracterizaron por la presencia de inserciones activadoras dentro del protooncogén MECOM bien conocido.
Sin embargo, estos estudios de IS como parte de los procedimientos de terapia génica sólo proporcionan una instantánea molecular del comportamiento y la dinámica de las células circulantes, y no transmiten ninguna información sobre los clones celulares marcados por el vector que se expanden en órganos sólidos, a menos que se realicen biopsias invasivas. Estas limitaciones se demostraron en un ensayo clínico para el tratamiento basado en<y>RV de las Inmunodeficiencias Combinadas Severas ligadas al cromosoma X (SCID-X1), en donde los estudios de integración previos no lograron detectar eventos de leucemia de células T inducidos por inserciones activadoras de LMO2, que se expandieron en el timo, hasta que se produjo una transformación celular completa y se liberaron clones leucémicos a la circulación.
En consecuencia, sigue existiendo una importante necesidad de métodos que permitan caracterizar los sitios de inserción, en particular las consecuencias negativas que puedan originar, en una fase temprana y de una manera que no se limite al análisis de una muestra celular, que puede no tener en cuenta los diferentes sitios de inserción que pueden estar presentes en otras partes de un organismo. Además, se necesitan métodos que no requieran biopsias de tejido invasivas y arriesgadas.
WO2015058079 se refiere al biomarcador circulante del cáncer y a su uso.
Breve descripción de la invención
Para mejorar el poder predictivo de los estudios de IS, por ejemplo para caracterizar los lugares de inserción vírica, por ejemplo, como parte de un protocolo de terapia génica, los inventores han desarrollado un método que permite la identificación de IS a partir de ADN libre de células que puede estar presente de forma natural en muestras de un sujeto (por ejemplo, plasma sanguíneo).
En particular, los inventores han desarrollado un método (denominado secuenciación de sitios de inserción en biopsia líquida (LiBIS-seq, por sus siglas en inglés), que permite identificar y cuantificar los sitios de inserción de virus y vectores en el ADN genómico (como los sitios de inserción de retrovirus, AAV y transposones, y los sitios de inserción de casete de expresión insertados con tecnologías de edición génica) utilizando ADN libre de células. El ADN libre de células puede obtenerse y/o purificarse a partir de plasma sanguíneo y otros fluidos corporales (por ejemplo, líquido cefalorraquídeo, LCR). Entre los sujetos adecuados se incluyen seres humanos y modelos animales tratados mediante procedimientos de terapia génicain vivooex vivo,y/o infectados por un virus integrador y competente en la replicación (por ejemplo, VIH o VHB).
Los inventores han demostrado que el método representa un procedimiento válido para los estudios de IS en aplicaciones de terapia génicain vivoyex vivo.En comparación con los análisis de IS mediante biopsias de tejido, la recuperación de IS a partir de ADN libre de células es menos arriesgada, no invasiva y puede realizarse fácilmente varias veces tras el tratamiento, lo que proporciona una imagen más completa del repertorio clonal de los órganos transducidos, así como un seguimiento longitudinal de la población transducida.
Los IS identificados en el ADN libre de células aislado del plasma o de otros fluidos corporales podrían ampliar el panorama de la diversidad clonal de las células marcadas por vectores, por ejemplo, en sujetos tratados con terapia génica de células madre y/o progenitoras hematopoyéticas (HSPC), ya que podría revelar mediante una biopsia líquida sencilla y no invasiva la presencia de clones marcados por vectores incrustados en órganos sólidos, tal como el hígado. Además, puede permitir el seguimiento y el estudio del repertorio clonal de las células transducidas en procedimientos de terapia génicain vivo.En un aspecto, la invención proporciona un método para analizar los sitios de inserción de una secuencia de nucleótidos exógena en el genoma de un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada del sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto;
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción; y
(e) secuenciar el producto del paso (d),
en donde la secuencia de nucleótidos exógena es un vector viral, transposón o casete de expresión.
En algunas realizaciones, el análisis comprende la identificación de la localización de uno o más sitios de inserción en el genoma del sujeto. En algunas realizaciones, el análisis comprende la cuantificación de la abundancia de uno o más sitios de inserción. En algunas realizaciones, el análisis comprende la identificación de la ubicación de uno o más sitios de inserción en el genoma del sujeto y la cuantificación de la abundancia de cada uno de los uno o más sitios de inserción. En algunas realizaciones, el análisis comprende la determinación del riesgo de mutagénesis insercional.
En realizaciones preferidas, el análisis comprende la identificación y cuantificación de uno o más sitios de inserción, y la determinación del riesgo de mutagénesis insercional.
En algunas realizaciones, al sujeto se le ha administrado terapia génica. En algunas realizaciones, el sujeto está a punto de recibir una terapia génica.
En algunas realizaciones, la terapia génica es una terapia génicain vivo.En algunas realizaciones, la terapia génica es una terapia génicaex vivo.
En algunas realizaciones, la terapia génica es una terapia génica con células madre y/o progenitoras hematopoyéticas (HSPC).
En algunas realizaciones, la secuencia de nucleótidos exógena es un vector de terapia génica. En algunas realizaciones, la secuencia de nucleótidos exógena es una secuencia genómica viral.
En algunas realizaciones, el sujeto está infectado con un virus, opcionalmente un virus integrador. En algunas realizaciones, el sujeto está en riesgo de infección por un virus, opcionalmente un virus integrador. En algunas realizaciones, el virus integrador es un retrovirus, lentivirus o AAV. En algunas realizaciones, el virus es VIH o virus de la hepatitis B.
En realizaciones preferidas, la secuencia exógena de nucleótidos es un vector viral.
En algunas realizaciones, el casete de expresión se integra mediante edición génica.
En algunas realizaciones, el vector viral es un vector viral de terapia génica. En algunas realizaciones, el vector viral de terapia génica comprende un nucleótido de interés (NOI), preferiblemente un transgén terapéutico.
En algunas realizaciones, el vector viral es un vector retroviral, lentiviral o AAV.
En algunas realizaciones, la muestra es una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR). En realizaciones preferidas, la muestra es una muestra de plasma.
En algunas realizaciones, el paso (a) comprende además un paso de purificación de los polinucleótidos.
En algunas realizaciones, el paso (b) comprende la reparación de los extremos. En algunas realizaciones, el paso (b) comprende la digestión de los salientes monocatenarios.
En algunas realizaciones, el paso (b) comprende además fosforilación en 5' y/o adenilación en 3'.
En realizaciones preferidas, los oligonucleótidos son parcialmente bicatenarios.
En realizaciones preferidas, los oligonucleótidos que se unen a ambos extremos de los polinucleótidos son los mismos. En algunas realizaciones, cada oligonucleótido comprende:
(i) una primera porción que comprende una secuencia de nucleótidos aleatoria;
(ii) una segunda porción que comprende una secuencia de nucleótidos de código de barras; y/o
(iii) una tercera porción que comprende un sitio de unión para un cebador destinado a la secuenciación del paso (e), por ejemplo, el cebador de secuenciación P7 o P5 de Illumina.
En algunas realizaciones, la amplificación del paso (d) es por PCR. En algunas realizaciones, la PCR es una PCR anidada. En algunas realizaciones, la PCR comprende amplificar el producto del paso (c) utilizando un cebador que se une a una porción de la secuencia de nucleótidos exógena y un cebador que se une a una porción del oligonucleótido.
En realizaciones preferidas, la porción de la secuencia de nucleótidos exógena unida por el cebador es una secuencia LTR viral.
En algunas realizaciones, la PCR comprende:
(i) amplificar el producto del paso (c) mediante un primer paso de RCP utilizando un par de cebadores externos para obtener un primer producto de PCR; y
(ii) amplificar el primer producto PCR mediante un segundo paso de PCR utilizando un par de cebadores internos para obtener un segundo producto de PCR.
En algunas realizaciones, un cebador del par de cebadores externos se une a una primera porción de la secuencia de nucleótidos exógena y un cebador del par de cebadores internos se une a una segunda porción de la secuencia de nucleótidos exógena.
En algunas realizaciones, un cebador del par de cebadores externos se une a una primera porción del oligonucleótido y un cebador del par de cebadores internos se une a una segunda porción del oligonucleótido.
En algunas realizaciones, la primera y la segunda porción de la secuencia de nucleótidos exógena son la misma. En algunas realizaciones, la primera y la segunda porciones de la secuencia de nucleótidos exógena son diferentes.
En algunas realizaciones, la primera y la segunda porción del oligonucleótido son iguales. En algunas realizaciones, la primera y la segunda porción del oligonucleótido son diferentes.
En algunas realizaciones, la PCR anidada comprende:
(i) amplificar el producto del paso (c) mediante un primer paso de PCR utilizando un primer cebador que se una a una primera porción de la secuencia de nucleótidos exógena y un segundo cebador que se una a una primera porción de un oligonucleótido para obtener un primer producto de PCR; y
(ii) amplificar el primer producto de PCR mediante un segundo paso de PCR utilizando un tercer cebador que se une a una segunda porción de la secuencia de nucleótidos exógena y un cuarto cebador que se une a una segunda porción del oligonucleótido para obtener un segundo producto de PCR.
En algunas realizaciones, un cebador utilizado para la amplificación PCR comprende:
(i) una primera porción que comprende una secuencia de nucleótidos aleatoria;
(ii) una segunda porción que comprende una secuencia de nucleótidos de código de barras; y/o
(iii) una tercera porción que comprende un sitio de unión para un cebador destinado a la secuenciación del paso (e), por ejemplo, el cebador de secuenciación P7 o P5 de Illumina.
El cebador unido por la tercera porción puede ser diferente del cebador unido por la tercera porción del oligonucleótido ligado al polinucleótido.
En otro aspecto, la invención proporciona un método para determinar la seguridad y/o eficacia de una terapia génica, en donde el método comprende:
(a) utilizar una muestra proporcionada de un sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto, preferiblemente una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR);
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción del vector de terapia génica; y
(e) secuenciar el producto del paso (d) para identificar la ubicación de uno o más sitios de inserción en el genoma del sujeto y/o cuantificar la abundancia de cada uno de los uno o más sitios de inserción.
En otro aspecto, la invención proporciona un método para analizar los sitios de inserción de vectores en el genoma de un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada del sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto, preferiblemente una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR);
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción del vector; y
(e) secuenciar el producto del paso (d) para identificar la ubicación de uno o más sitios de inserción en el genoma del sujeto y/o cuantificar la abundancia de cada uno de los uno o más sitios de inserción.
En otro aspecto, la invención proporciona un método para identificar células cancerosas inducidas por terapia génica en un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada de un sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto, preferiblemente una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR);
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción de una secuencia de nucleótidos exógena; y (e) secuenciar el producto del paso (d) para identificar la ubicación de uno o más sitios de inserción en el genoma del sujeto y/o cuantificar la abundancia de cada uno de los uno o más sitios de inserción,
en donde la secuencia de nucleótidos exógena es un vector viral, transposón o casete de expresión.
Descripción de los dibujos
Figura 1
Esquema de la secuenciación de sitios de inserción de biopsia líquida (LiBIS-seq). Se lleva a cabo una LiBIS-seq en ADN libre de células (ADNcirc), por ejemplo, purificado a partir de plasma sanguíneo u otros fluidos corporales obtenidos de pacientes tratados con terapia génica (GT, por sus siglas en inglés) y de sujetos infectados por un vector/virus integrador. El ADNcirc purificado de los pacientes de terapia génica puede incluir, por ejemplo, ADN fragmentado procedente del genoma celular (fragmentos grises), del virus/vector integrado (fragmentos rosas) y fragmentos híbridos que contienen la unión virus/genoma que se amplificará en el procedimiento de PCR. En el ejemplo mostrado, tras la purificación (PASO 1), el ADNcirc fragmentado se somete a reparación de extremos y adenilación en 3' (PASO 2), y después se liga a casetes enlazadores parcialmente bicatenarios (representados en negro) que contienen un código de barras de secuencia utilizado para la identificación de la muestra y una secuencia aleatoria (Identificador Molecular Único, UMI, por sus siglas en inglés) utilizada para la estimación de la abundancia (PASO 3). En el ejemplo mostrado, el producto de la ligadura se somete primero a 35 ciclos de PCR exponencial utilizando cebadores específicos para el vector LTR y el casete enlazador (PASO 4). A continuación, el producto amplificado se vuelve a amplificar con otros 10 ciclos de PCR utilizando cebadores específicos para el vector LTR y el casete enlazador, pero situados dentro del producto ya amplificado. Por último, los productos de PCR LiBIS-seq generados se ensamblan en bibliotecas y se secuencian. Se procesan las lecturas de secuenciación y se mapean los sitios de inserción del virus/vector en el genoma de referencia.
Figura 2
Identificación de los sitios de inserción en el ADNcirc (circlS) de pacientes con leucodistrofia metacromática (MLD) tratados con terapia génica de células madre hematopoyéticas basada en vectores lentivirales (VL). (A) Tabla resumen que muestra el número total de sitios de inserción (IS) recuperados de cada paciente entre las distintas fuentes. (B) Distribución genómica de circlS (línea roja) e IS determinados a partir del ADN celular (celllS; línea azul) en la región genómica HLA del cromosoma 6 obtenida del paciente MLD01. Se indica el símbolo de algunos de los genes objetivo dentro de la región. (C) Los análisis de ontología génica realizados con el software Great muestran una sobrerrepresentación similar para las clases de genes en el sistema de componentes celulares de ontología génica para circlS (línea roja) y celllS (línea azul) recolectados del paciente MLD01. (D) Seguimiento de IS del circlS extraído del plasma sanguíneo del paciente MLD06 a través de diferentes tipos de células y del tiempo. Cada fila representa un circlS único, las barras de color indican cuándo y dónde se identificó el circlS en los diferentes linajes celulares y el punto temporal después de la terapia génica (columnas). La falta de una barra indica que la integración no se recuperó en el punto temporal y la fuente indicados. B: Células B; T: Células T; My: Células mieloides. (E) Porcentaje de IS compartidos (eje y) entre las células CD34+ derivadas de BM y circlS, y linajes mieloides y linfoides de sangre periférica y médula ósea. Cada columna representa el nivel medio de compartición observado entre los 7 pacientes sometidos a prueba para cada linaje celular. (F, G) Gráficos de barras apiladas que muestran la abundancia del sitio de inserción de lentivirus (LV IS) recuperada a lo largo del tiempo (meses, eje x) a partir de PBMC (F) y plasma sanguíneo (G) del paciente MLD01. Los LV IS con un nivel de abundancia superior al 1% están representados por regiones de diferentes colores cuya altura es proporcional al número de fragmentos (plasma) o células (PMBC) recuperados para ese IS sobre el total y para ese punto temporal específico (% de abundancia de IS, eje y). Las cintas conectan el LV IS rastreado entre puntos temporales consecutivos. Los LV IS con un nivel de abundancia inferior al 1 % se colapsan en la zona gris. El número de IS únicos recuperados de cada punto temporal específico se indica encima de cada columna.
Figura 3
circIS recuperados de primates no humanos (NHP) tratados mediante terapia génica dirigida al hígado mediada por LV. (A) Tabla que muestra el número total de IS recuperados en cada NHP tratado a partir de plasma y tejido. (B-I) Gráficos de barras apiladas que muestran la abundancia de LV IS recuperados del plasma sanguíneo (B-G), el hígado (H) y el bazo (I) de NHP tratados con LV de control o CD47hi-LV. Cada LV IS recuperado del plasma sanguíneo del NHP tratado se representa con un color diferente, con la altura en proporción relativa al número de fragmentos recuperados sobre el total (% de abundancia de IS). Las cintas conectan el LV IS rastreado entre puntos temporales consecutivos (Días tras la inyección, eje x). (H, I) Cada LV IS recuperado del hígado (H) y del bazo (I) de los NHP tratados se representa con un color diferente, con la altura en proporción relativa al número de células recuperadas sobre el total (% de abundancia de IS).
Figura 4
circIS recuperados de perros tratados mediante terapia génica dirigida al hígado mediada por LV. (A) Tabla que muestra el tipo y la dosis de LV inyectados en 3 perros tratados y el número de IS recuperados del ADNcirc. (B-D) Gráficos de barras apiladas que muestran la abundancia de LV IS extraído del plasma sanguíneo de perros tratados con los diferentes LV. Cada LV IS se representa con un color diferente, con la altura en proporción relativa al número de fragmentos recuperados sobre el total (% de abundancia de IS). Las cintas conectan el LV IS rastreado entre puntos temporales consecutivos (Días tras la inyección, eje x).
Figura 5
circIS recuperado de un paciente con SCID-X1 tratado mediante terapia génica de células madre hematopoyéticas basada en gamma-retrovirales (gRV), y que desarrolló una leucemia linfoblástica aguda de células T (T-ALL, por sus siglas en inglés) como consecuencia de eventos de mutagénesis insercional. Gráficos de barras apiladas que muestran la abundancia de los gRV IS recuperados a lo largo del tiempo (meses, eje x) a partir de PBMC (A) y plasma sanguíneo (B) de pacientes que se sometieron a terapia génica con células madre hematopoyéticas para SCID-X1 (A, B). Los gRV IS con un nivel de abundancia superior al 1 % se representan con colores diferentes, cuya altura es proporcional al número de fragmentos recuperados para ese IS sobre el total y para ese punto temporal específico (% de abundancia de IS, eje y). El punto temporal en el que se diagnosticó la T-ALL inducida por LMO2 en cada paciente se resalta en rojo. Las cintas conectan los gRV IS rastreados entre puntos temporales consecutivos. Los gRV IS con un nivel de abundancia inferior al 1 % están colapsados en la zona gris. (A) y (B) se refieren a gRV IS recolectados de PBMC (A) y plasma sanguíneo (B) del paciente P9 del ensayo clínico de terapia génica con células madre hematopoyéticas SCID-X1.
Figura 6
Recuperación de IS a partir de ADNlc purificado del plasma de pacientes con MLD tratados mediante HSC-GT basada en LV. A) ADNlc recuperado a lo largo del tiempo por ml de plasma sanguíneo (meses, eje x) de los 7 pacientes con MLD; la zona gris se refiere a los niveles de concentración de ADNlc en sujetos sanos; B) gráficos de barras apilados que muestran la abundancia de LV IS recuperada a lo largo del tiempo (meses, eje x) a partir del ADNlc de 7 pacientes con MLD. En cada columna, cada LV IS está representado por diferentes colores, cuya altura es proporcional al número de fragmentos (plasma) recuperados para ese IS sobre el total y para cada punto temporal específico (% de abundancia de IS, eje y). Las cintas conectan el LV IS rastreado entre puntos temporales consecutivos. El número de IS únicos recuperados de cada punto temporal específico se indica en rojo encima de cada columna. C) IS recuperado a lo largo del tiempo a partir del ADNlc y normalizado para los ng utilizados para todos los pacientes con MLD (meses, eje x); D) VCN medida a lo largo del tiempo (meses, eje x) a partir de PBMC de los 7 pacientes con MLD; E) Mapa de clasificación que muestra todos los LV IS (parte izquierda del gráfico) recuperados del ADNlc a lo largo del tiempo a partir del plasma sanguíneo del paciente MLD06. Cada fila representa un único LV IS, la barra coloreada indica cuándo y dónde se identificó el IS en los diferentes linajes celulares y punto temporal después de la terapia génica (columnas). La falta de color indica que la integración no se recuperó en el punto temporal y la fuente indicados. F,G) Frecuencia de los IS derivados del ADNlc (eje y) compartidos con los diferentes linajes hematopoyéticos de BM (F) y sangre periférica (G). H,I) Frecuencia relativa de los diferentes linajes hematopoyéticos (eje y) en<b>M (H) y en sangre periférica (I). Wh.: células enteras de la sangre o de la médula ósea; MNC: Células mononucleares; PBMC: Células mononucleares de sangre periférica; CD34: HSPC; CD13, CD14, CD15: (células mieloides); CD19: Células B; CD3: células T. * Prueba t no pareada de valores lod-odd transformados.
Figura 7
Recuperación de IS a partir de ADNlc purificado del plasma sanguíneo de pacientes con MLD tratados mediante HSC-GT basada en LV. A) ADNlc por ml de plasma sanguíneo de los 6 pacientes con MLD y recolectado antes de la terapia génica (GT), en los 3 primeros meses posteriores a la GT (primeros 1-3 meses) y en los 72 meses (últimos 6-72 meses) posteriores a GT; los valores p se han determinado mediante la prueba t de Mann-Whitney no apareada bilateral, *** significa p<0,001; MLD04 se excluyó de los análisis; la zona gris se refiere a los niveles de concentración de ADNlc en sujetos sanos; B) Ejemplos representativos del perfil de tamaño de los fragmentos de ADNlc purificados a partir del plasma sanguíneo de los pacientes con MLD indicados; C,D) Distribución de los tamaños de los fragmentos tras la amplificación por PCR y la secuenciación a partir de ADN genómico sonicado purificado de PBMC (C) y ADNlc (D). La distribución de los tamaños de los fragmentos tras la amplificación por PCR y la secuenciación a partir del ADNlc, a excepción de un pico en torno a 167 pb, fue similar a la distribución de tamaños de los productos de PCR generados a partir del ADN derivado de células sonicadas.
Figura 8
Recuperación de IS a partir de ADNlc purificado del plasma sanguíneo de pacientes con MLD tratados mediante HSC-GT basada en LV. A) ADNlc recuperado por ml de plasma sanguíneo de los 7 pacientes con MLD; B) número de LV IS recuperados a partir del ADNlc purificado del plasma sanguíneo de los 7 pacientes con MLD. C) Distribución de frecuencias a lo largo de los cromosomas (los números de cr y el intervalo se muestran en la parte superior) de los genes refSeq humanos (pista negra) y las integraciones de LV recuperadas del ADN genómico derivado de células (pista azul) y del ADNlc (pista roja). D) Distribuciones de frecuencias de LV IS recolectadas de los 7 pacientes con MLD y recuperadas del ADNlc (línea roja) y del ADN genómico derivado de células (línea azul) en 4 regiones cromosómicas seleccionadas como objetivo de alta frecuencia. Distribución del % de IS (eje y) en las coordenadas cromosómicas seleccionadas (eje x). Se indican los símbolos de algunos genes altamente objetivados dentro de la región; E, F) Distribución de frecuencias de las integraciones de LV alrededor de los sitios de inicio transcripcional de los genes en el ADNlc (E) y en el ADN genómico derivado de células (F) de los 7 pacientes con MLD. Los análisis se realizaron con el software Great (http://great.stanford.edu/); G) Análisis de ontología génica (GO) de los SI recuperados del ADNc de 7 pacientes con MLD y realizados con el software GREAT. Las clases de la ontología génica sobrerrepresentadas de forma significativa en el sistema de componentes celulares, procesos biológicos y funciones moleculares se muestran si tienen un puntaje de enriquecimiento de plegamiento superior a 2. Las líneas rojas indican el nivel umbral de significación.
Figura 9
Distribución del nivel de abundancia de IS recuperado del ADNlc de pacientes con MLD tratados con HSC-GT. A) Frecuencia de IS (eje y) representada por el número indicado de genomas (eje x, intervalo de genoma) en IS derivados de ADNlc de los 7 pacientes con MLD tratados mediante HSC-GT; (B) Gráficos de barras apiladas que muestran la frecuencia de LV IS representada por el número indicado de fragmentos.
Figura 10
Recuperación de IS a partir de ADN genómico purificado de células sanguíneas de pacientes con MLD tratados mediante HSC-GT basada en LV. Gráficos de barras apiladas que muestran la abundancia de LV IS recuperada a lo largo del tiempo (meses, eje x) a partir de ADN genómico purificado de PBMC (A) y células de sangre total (B) de 7 pacientes con MLD.
En cada columna, cada LV IS está representado por diferentes colores, cuya altura es proporcional al número de fragmentos (plasma) recuperados para ese IS sobre el total y para cada punto temporal específico (% de abundancia de IS, eje y). Las cintas conectan el LV IS rastreado entre puntos temporales consecutivos. El número de IS únicos recuperados de cada punto temporal específico se indica en rojo encima de cada columna. PBMC: Células mononucleares de sangre periférica.
Figura 11
Seguimiento de los LV IS recuperados del ADNlc entre los IS derivados de células. A-F) Mapa de clasificación que muestra todos los LV IS (parte izquierda del gráfico) recuperados a lo largo del tiempo a partir del ADNlc purificado del plasma sanguíneo de los pacientes indicados. Cada fila representa un único LV IS, y para cada IS las barras coloreadas indican cuándo y dónde se identificó el IS en los diferentes linajes celulares y puntos temporales tras la terapia génica (columnas). La falta de color indica que la integración no se recuperó en el punto temporal y la fuente indicados. Enteras: población de células de sangre total o de médula ósea; MNC: Células mononucleares; PBMC: Células mononucleares de sangre periférica; CD34: HSPC; CD13, CD14, CD15: Células mieloides; CD19: Células B; CD3: células T
Figura 12
LV IS recuperado a partir de ADNlc purificado del suero de perros tratados mediante GT dirigida al hígado in vivo. A) ADNlc por ml (ng/ml) de suero purificado en diferentes puntos temporales en cada perro; B) número total de IS recuperados en cada punto temporal; C-E) gráficos de barras apiladas que muestran la abundancia y el seguimiento en el tiempo de LV IS recuperados del ADNlc purificado del suero de los perros tratados. En cada columna, cada LV IS está representado por un color diferente, con la altura en proporción relativa con el número total de fragmentos recuperados (% de abundancia de IS). Las cintas conectan el LV IS rastreado entre puntos temporales consecutivos (eje x: días tras la inyección,). El número de IS únicos recuperados para cada punto temporal se indica encima de cada columna. F) Gráficos de barras apiladas que muestran la abundancia de LV IS recuperado del ADN genómico aislado de necropsias hepáticas de perros tratados. El número de IS únicos recuperados en cada animal se indica encima de la columna específica. G) Número de IS recuperados por cada ng de ADNlc utilizado; H) Frecuencia de IS (eje y) representada por el número indicado de genomas (eje x, intervalos del genoma) en IS derivados de ADNlc purificado de pacientes con HSPC-GT MLD (línea azul) o perros sometidos a GT dirigida al hígadoin vivo;los IS derivados de pacientes con MLD estaban representadas por un número significativamente mayor de genomas en comparación con los IS de perros, según se determinó mediante la prueba t no apareada.y el método Holm-Sidak para la corrección de comparaciones múltiples. I, L) Gráfico de mapa de calor que muestra los LV IS que se identificaron en el ADNlc y en el ADN genómico hepático del perro indicado (I, se refiere a m 57; L, a 059). Cada fila representa un LV IS único, la barra de color indica cuándo y dónde se identificó el IS en los diferentes puntos temporales o fuentes de ADN (columnas). La falta de color indica que la integración no se recuperó en el momento y la fuente indicados; M) Estimación del tamaño de la población de clones de células marcadas que contribuyen al IS compartido a lo largo del tiempo para el perro M57 y 059. ****Se refiere a un valor p < 0,0001.
Figura 13
El IS recuperado del ADNlc permite identificar los tumores marcados por el vector que se expanden en órganos sólidos. A) Distribución genómica de los gRV IS dirigidos a LMO2 y TAL1 en WAS P7. En el esquema se indican las coordenadas genómicas y la escala. Los recuadros y las barras azules indican los exones, las flechas negras indican la orientación de la transcripción del gen; los triángulos rojos indican la posición y la orientación del sitio gRV IS de integración. El gRV IS se indica en rojo. B, C) Diagramas de barras apilados que muestran la abundancia y el seguimiento a lo largo del tiempo (meses, eje x) de los gRV IS recuperados del ADN genómico derivado de PBMC (B) y del ADNlc obtenido de la recolección de plasma sanguíneo emparejado (C) de WAS P7. Los gRV IS con un nivel de abundancia superior al 1% están representados por colores diferentes, cuya altura es proporcional al número de fragmentos recuperados para ese IS sobre el total (% de abundancia de IS, eje y). Los IS con un nivel de abundancia inferior al 1 % aparecen colapsadas en la zona gris. Las cintas conectan los gRV IS rastreados entre puntos temporales consecutivos. En el eje x se indica en rojo el punto temporal en el que se diagnosticaron los trastornos leucémicos. El número de IS únicos recuperados en cada punto temporal se indica encima de la columna. D) ADNlc recuperado a lo largo del tiempo por ml de plasma sanguíneo (meses, eje x) para los pacientes P5 y P7 WAS; E) IS recuperado a lo largo del tiempo y normalizado para los ng de ADNlc utilizados para los pacientes WAS P5 y P7 (meses, eje x);. F) Estrategia experimental del modelo de ratón de linfoma linfoblástico de células T Brevemente, se transplantan ratones X-SCID no condicionados con células WT CD45.1 derivadas de BM lin- transducidas con SIN.LV y se recolecta sangre mensualmente. Los tejidos se recolectan en el momento de la eutanasia; G) Curva de supervivencia de los ratones X-SCID trasplantados; H) Mapa de calor que muestra el seguimiento en el tiempo de los IS compartidos entre las fuentes de ADN en el ratón A3. Se indica la edad en el momento de la eutanasia. Cada fila representa un único LV IS cuyo color es proporcional al nivel relativo de abundancia (rojo: alto; azul: bajo nivel de abundancia). La falta de color indica que el IS no se recuperó en el punto temporal y la fuente indicados. El número de IS únicos recuperados en cada punto temporal se indica encima de la columna; I) Nivel relativo de abundancia a lo largo del tiempo y entre las diferentes fuentes de ADN de los 3 IS LV más abundantes recuperados en el timo del ratón A3. Estos LV IS están mapeados cerca del gen RefSeq Cdk19, Asf1a y Man2a1, respectivamente.
Figura 14
El IS recuperado del ADNlc permite identificar los tumores marcados por el vector que se expanden en órganos sólidos. A) Distribución genómica de los gRV IS dirigidos a LMO2 y recuperados del ADN genómico purificado de PBMC totales y ADNlc de P9 X-SCID. En el esquema se indican las coordenadas genómicas y la escala. Los recuadros y las barras azules indican los exones, la flecha negra indica la orientación de la transcripción del gen; el triángulo rojo indica la posición y la orientación del sitio de integración del gRV IS. B, C) Gráficos de barras apiladas que muestran la abundancia y el seguimiento a lo largo del tiempo (meses, eje x) de los gRV IS recuperados de P9-SCIDX1. Los IS se obtuvieron a partir de ADN genómico derivado de PBMC (B) y ADNlc obtenido de la recolección de plasma sanguíneo compatible (C). Leyenda como en la Figura 13B, 13C. A) ADNlc recuperado a lo largo del tiempo por ml de plasma sanguíneo (meses, eje x) para el paciente P9 SCID-X1; B) IS recuperado a lo largo del tiempo y normalizado para los ng de ADNlc utilizados para el paciente P9 SCID-X1 (meses, eje x).
Figura 15
Índice de diversidad de Shannon (eje y) por intervalos de ng de ADNlc (eje x y color distinto). Cada punto representa una muestra, y la forma de cada punto se refiere a un estudio diferente. Los resultados estadísticos de las pruebas se presentan con los valores p encima de cada par de intervalos conectados por un bigote, o anotados en la parte superior considerando todos los intervalos.
Figura 16
Gráficos de dispersión de la abundancia de fragmentos por número de fragmentos distintos (eje x) y número de fragmentos estimados con el paquete “SonicLength” (eje y). Cada recuadro hace referencia a un estudio diferente. Cada punto representa un sitio de integración identificado para cada punto temporal disponible. La forma de cada punto indica si esa integración pertenece o no a clones malignos.
Figura 17
Recuperación de AAV-IS en ratones inmunodeficientes tratados con un AAV que expresa ZAP-70. A) Mapa del AAV que expresa ZAP-70 y de los oligonucleótidos utilizados para la SLiM-PCR (flechas moradas). El constructo AAV está rodeado por las repeticiones terminales invertidas izquierda y derecha (L- y R-ITR, flechas verdes). El promotor de la fosfoglicerato cinasa murina (mPGK, flecha azul) impulsa la expresión del transgén ZAP70 (flecha amarilla), seguido de la señal de poliadenilación (PoliA, recuadro rojo); B) Número de AAV-IS (N°IS) recuperados de muestras de ganglios linfáticos (LN), hígado y plasma; tejido.
Figura 18
Distribución y abundancia de AAV IS recuperados en tejidos y ADNlc. A) Frecuencia de IS recuperadas por diferentes conjuntos de cebadores PCR dentro de cada conjunto de datos indicado. B) Gráficos de barras apiladas que muestran la frecuencia de AAV IS representados por el número indicado de fragmentos (cuando se utiliza ADNlc) o genomas (cuando se adopta ADN genómico sonicado); C) Gráficos de barras apiladas que muestran la abundancia de AAV IS recuperados de ADNlc, LN y tejido del HÍGADO. En cada columna, cada IS está representado por diferentes colores, cuya altura es proporcional al número de fragmentos (plasma) o genomas (para LN e Hígado) recuperados para ese IS sobre el total (% de abundancia de IS, eje y). El número de IS únicos recuperados de cada punto temporal específico se indica en rojo encima de cada columna. D) Distribución de AAV-IS en Tcr-a de ratón. Cada inserción de AAV se indica con una línea vertical negra. E) Frecuencia de AAV IS dirigidos a los genes Tcr-a, Tcr-b y Tcr-g para los diferentes conjuntos de datos de AAV. F) Distribución del número de fragmentos o genomas asociados a cada integración AAV dirigida al gen Tcr-a dentro del conjunto de datos indicado.
Descripción detallada de la invención
Los términos “comprender”, “comprende” y “comprendido por”, como se utilizan en la presente, son sinónimos de “ incluir” o “ incluye”; o “contener” o “contiene”, y son inclusivos o abiertos y no excluyen miembros, elementos o pasos adicionales no repetidos. Los términos “comprender”, “comprende” y “comprendido por” también incluyen el término “consiste en”.
Secuencia de nucleótidos exógena
El término “secuencia de nucleótidos exógena”, como se utiliza en la presente, puede referirse a una secuencia de nucleótidos que no forma parte del material genético endógeno de un sujeto. Por ejemplo, la secuencia de nucleótidos exógena puede proceder de una fuente exógena, tal como un vector de terapia génica, un transposón o un casete de expresión (por ejemplo, que se haya insertado utilizando métodos de edición génica).
En algunas realizaciones, la secuencia de nucleótidos exógena es un vector de terapia génica. En algunas realizaciones, la secuencia de nucleótidos exógena es una secuencia genómica viral. En algunas realizaciones, la secuencia exógena de nucleótidos es una secuencia viral natural, opcionalmente un virus integrador. En algunas realizaciones, el virus integrador es un retrovirus, lentivirus o AAV. En algunas realizaciones, el virus es VIH o virus de la hepatitis B.
Vector
Un vector es una herramienta que permite o facilita la transferencia de una entidad de un entorno a otro. De acuerdo con la presente invención, y a modo de ejemplo, algunos vectores utilizados en técnicas de ácido nucleico recombinante permiten transferir entidades, tal como un segmento de ácido nucleico (por ejemplo, un segmento de ADN heterólogo, tal como un segmento de ADNc heterólogo), a una célula objetivo. El vector puede servir para mantener el ácido nucleico heterólogo (ADN o ARN) dentro de la célula, facilitar la replicación del vector que comprende un segmento de ácido nucleico o facilitar la expresión de la proteína codificada por un segmento de ácido nucleico.
Los vectores pueden ser no virales o virales. Los ejemplos de vectores utilizados en las técnicas de ácidos nucleicos recombinantes incluyen, pero no se limitan a, plásmidos y virus. El vector puede ser monocatenario o bicatenario. Puede ser lineal y, opcionalmente, el vector comprende uno o más brazos de homología. El vector también puede ser, por ejemplo, un ácido nucleico desnudo (por ejemplo, ADN). En su forma más simple, el vector puede ser en sí mismo un nucleótido de interés.
Los vectores utilizados en la invención pueden ser, por ejemplo, vectores plasmídicos o virales y pueden incluir un promotor para la expresión de un polinucleótido y, opcionalmente, un regulador del promotor.
Los vectores pueden introducirse en las células mediante diversas técnicas conocidas en el arte, tales como la transformación, la transfección y la transducción. Varias técnicas son conocidas en la técnica, por ejemplo la transducción con vectores virales recombinantes, tales como los retrovirales, lentivirales, adenovirales, virales adenoasociados, baculovirales y vectores virales del herpes simple, los vectores de la Bella Durmiente; la inyección directa de ácidos nucleicos y la transformación biolística.
Los sistemas de administración no virales incluyen, pero no se limitan a, métodos de transfección de ADN. Aquí, la transfección incluye un proceso que usa un vector no viral para administrar un gen a una célula diana. Los métodos de transfección habituales incluyen electroporación, biolística de ADN, transfección mediada por lípidos, transfección mediada por ADN compactado, liposomas, inmunoliposomas, lipofectina, transfección mediada por agentes catiónicos, anfífilos faciales catiónicos (CFA) (Nature Biotechnology (1996) 14: 556) y combinaciones de los mismos.
El término “vector” incluye un vector de expresión, es decir, un constructo capaz de expresiónin vivooin vitro/ex vivo.La expresión puede estar controlada por una secuencia del vector o, por ejemplo, en el caso de la inserción en un lugar objetivo, la expresión puede estar controlada por una secuencia objetivo.
Las secuencias exógenas de nucleótidos analizadas en la presente invención, que pueden ser un vector, se integran en el genoma de un sujeto. En realizaciones preferidas, el vector es un vector integrador.
En algunas realizaciones, el vector es un vector retroviral, lentiviral o AAV.
Vectores retrovirales y lentivirales
Un vector retroviral puede derivarse o ser derivable de cualquier retrovirus adecuado. Se ha identificado un gran número de retrovirus diferentes. Algunos ejemplos son el virus de la leucemia murina (MLV, por sus siglas en inglés), el virus de la leucemia humana de células T (HTLV, por sus siglas en inglés), el virus del tumor mamario de ratón (MMTV, por sus siglas en inglés), el virus del sarcoma de Rous (RSV, por sus siglas en inglés), el virus del sarcoma de Fujinami (FuSV, por sus siglas en inglés), el virus de la leucemia murina de Moloney (Mo-MLV, por sus siglas en inglés), virus del osteosarcoma murino FBR (FBR MS, por sus siglas en inglésV), virus del sarcoma murino Moloney (Mo-MSV, por sus siglas en inglés), virus de la leucemia murina Abelson (A-MLV, por sus siglas en inglés), virus de la mielocitomatosis aviar-29 (MC29) y virus de la eritroblastosis aviar (AEV, por sus siglas en inglés). Encontrará una lista detallada de retrovirus en Coffin, J.M. et al. (1997) Retroviruses, Cold Spring Harbour Laboratory Press, 758-63.
Los retrovirus pueden dividirse a grandes rasgos en dos categorías, “simples” y “complejos”. Los retrovirus pueden dividirse aún más en siete grupos. Cinco de estos grupos representan retrovirus con potencial oncogénico. Los dos grupos restantes son los lentivirus y los espumavirus. Una revisión de estos retrovirus se presenta en Coffin, J.M. et al. (1997) Retroviruses, Cold Spring Harbour Laboratory Press, 758-63.
La estructura básica de los genomas de retrovirus y lentivirus comparten muchas características comunes, tal como un LTR 5' y un LTR 3'. Entre ellas o dentro de ellas se localizan una señal de empaquetamiento para permitir el empaquetamiento del genoma, un sitio de unión del cebador, sitios de integración para permitir la integración en el genoma de una célula hospedera, y los genes gag, pol y env que codifican los componentes de empaquetamiento, se trata de polipéptidos necesarios para el ensamblaje de las partículas virales. Los lentivirus tienen características adicionales, tales como las secuencias rev y RRE en el VIH, que permiten la exportación eficaz de los transcritos de ARN del provirus integrado desde el núcleo al citoplasma de una célula objetivo infectada.
En el provirus, estos genes están flanqueados en ambos extremos por regiones denominadas repeticiones terminales largas (LTR, por sus siglas en inglés). Las LTR son responsables de la integración y la transcripción proviral. Las LTR también sirven como secuencias potenciadoras-promotoras y pueden controlar la expresión de los genes virales.
Las propias LTR son secuencias idénticas que pueden dividirse en tres elementos: U3, R y U5. U3 se deriva de la secuencia exclusiva del extremo 3' del ARN. R se deriva de una secuencia repetida en ambos extremos del ARN. U5 se deriva de la secuencia exclusiva del extremo 5' del ARN. Los tamaños de los tres elementos pueden variar considerablemente entre los diferentes retrovirus.
En un genoma de vector retroviral defectuoso, gag, pol y env pueden estar ausentes o no ser funcionales.
En un vector retroviral típico, al menos parte de una o más regiones codificadoras de proteínas esenciales para la replicación pueden eliminarse del virus. Esto hace que el vector viral sea defectuoso en la replicación.
También pueden sustituirse porciones del genoma viral por una biblioteca que codifique moléculas moduladoras candidatas enlazadas operativamente a una región de control reguladora y a una molécula informadora del genoma del vector, con el fin de generar un vector que comprenda moléculas moduladoras candidatas capaces de transducir una célula hospedera objetivo y/o de integrar su genoma en un genoma hospedero.
Los vectores lentivirus forman parte del grupo más amplio de los vectores retrovirales. Encontrará una lista detallada de lentivirus en Coffin, J.M. et al. (1997) Retroviruses, Cold Spring Harbour Laboratory Press, 758-63. En resumen, los lentivirus pueden dividirse en grupos primates y no primates. Los ejemplos de lentivirus de primates incluyen, pero no se limitan a, el virus de la inmunodeficiencia humana (VIH), el agente causante del síndrome de inmunodeficiencia humana adquirida (SIDA); y el virus de la inmunodeficiencia simia (VIS). Algunos ejemplos de lentivirus de no primates son el prototipo de “virus lento” visna/maedi virus (VMV), así como el virus de la artritis-encefalitis caprina (CAEV, por sus siglas en inglés), el virus de la anemia infecciosa equina (EIAV, por sus siglas en inglés) y los virus de la inmunodeficiencia felina (VIF) y de la inmunodeficiencia bovina (VIB), descritos más recientemente.
La familia de los lentivirus difiere de la de los retrovirus en que éstos tienen la capacidad de infectar tanto a las células en división como a las que no lo están (Lewis, P et al. (1992) Em BO J. 11: 3053-8; Lewis, P.F. et al. (1994) J. Virol. 68: 510 6). Por el contrario, otros retrovirus, tal como el MLV, son incapaces de infectar células que no se dividen o que se dividen lentamente, tales como las que componen, por ejemplo, el tejido muscular, cerebral, pulmonar y hepático.
Un vector lentiviral, como se utiliza en la presente, es un vector que comprende al menos una parte componente derivable de un lentivirus. Preferiblemente, esa parte componente está implicada en los mecanismos biológicos por los que el vector infecta células, expresa genes o se replica.
El vector lentiviral puede ser un vector “primate”. El vector lentiviral puede ser un vector “no primate” (es decir, derivado de un virus que no infecta principalmente a los primates, especialmente a los humanos). Ejemplos de lentivirus no primates pueden ser cualquier miembro de la familia de los lentiviridae que no infecte de forma natural a un primate.
Como ejemplos de vectores basados en lentivirus, a continuación se describen los vectores basados en el VIH-1 y en el VIH-2.
El vector del VIH-1 contiene elementos de acción cis que también se encuentran en los retrovirus simples. Se ha demostrado que las secuencias que se extienden en el marco abierto de lectura de gag son importantes para el empaquetamiento del VIH-1. Por lo tanto, los vectores del VIH-1 suelen contener la porción relevante de gag en la que el codón de iniciación de la traducción ha mutado. Además, la mayoría de los vectores del VIH-1 también contienen una porción del gen env que incluye el RRE. Rev se une a RRE, lo que permite el transporte de ARNm de longitud completa o empalmados individualmente desde el núcleo al citoplasma. En ausencia de Rev y/o RRE, los ARN de VIH-1 de longitud completa se acumulan en el núcleo. Alternativamente, se puede utilizar un elemento de transporte constitutivo de ciertos retrovirus simples, tales como el virus del mono Mason-Pfizer para aliviar el requisito de Rev y RRE. La transcripción eficiente desde el promotor LTR de VIH-1 requiere la proteína viral Tat.
La mayoría de los vectores basados en el VIH-2 son estructuralmente muy similares a los vectores del VIH-1. De forma similar a los vectores basados en VIH-1, los vectores de VIH-2 también requieren RRE para el transporte eficaz de los ARN virales de longitud completa o empalmados individualmente.
El vector viral puede tener un genoma viral mínimo.
Por “genoma viral mínimo” debe entenderse que el vector viral ha sido manipulado para eliminar los elementos no esenciales y conservar los elementos esenciales con el fin de proporcionar la funcionalidad necesaria para infectar, transducir y suministrar una secuencia de nucleótidos de interés a una célula hospedera objetivo. Encontrará más detalles sobre esta estrategia en WO 1998/017815.
Preferiblemente, el vector plasmídico utilizado para producir el genoma viral dentro de una célula hospedera/de empaquetamiento tendrá suficiente información genética lentiviral para permitir el empaquetamiento de un genoma de ARN, en presencia de componentes de empaquetamiento, en una partícula viral capaz de infectar una célula objetivo, pero incapaz de replicación independiente para producir partículas virales infecciosas dentro de la célula objetivo final. Preferiblemente, el vector carece de un gen gag-pol y/o env funcional y/o de otros genes esenciales para la replicación.
Sin embargo, el vector plasmídico utilizado para producir el genoma viral dentro de una célula hospedera/de empaquetamiento también incluirá secuencias de control regulador de la transcripción ligadas operativamente al genoma lentiviral para dirigir la transcripción del genoma en una célula hospedera/de empaquetamiento. Estas secuencias reguladoras pueden ser las secuencias naturales asociadas a la secuencia viral transcrita (es decir, la región 5' U3), o pueden ser un promotor heterólogo, tal como otro promotor viral (por ejemplo, el promotor de CMV).
Vectores virales adenoasociados (AAV)
El virus adenoasociado (AAV) tiene una alta frecuencia de integración y puede infectar células que no se dividen. Esto lo hace útil para el suministro de genes en células de mamíferos en cultivo tisular.
El AAV tiene un amplio rango de hospederos para la infectividad. Los detalles relativos a la generación y el uso de vectores AAV se describen en Patente de EE. UU. No. 5139941 y en Patente de EE. UU. No. 4797368.
Los vectores AAV recombinantes se han utilizado con éxito para la transducciónin vitroein vivode genes marcadores y genes implicados en enfermedades humanas.
Nucleótido de interés
La secuencia de nucleótidos exógena de la invención comprende preferentemente un nucleótido de interés (NOI).
Preferiblemente, el nucleótido de interés da lugar a un efecto terapéutico.
Los NOI adecuados incluyen, entre otros, secuencias que codifican enzimas, citocinas, quimiocinas, hormonas, anticuerpos, moléculas antioxidantes, moléculas tipo inmunoglobulina modificadas genéticamente, anticuerpos de cadena única, proteínas de fusión, moléculas inmunoestimuladoras, moléculas inmunomoduladoras, ARN antisentido, microARN, ARNhc, ARNip, ribozimas, secuencias de direccionamiento de miARN, un mutante transdominio negativo de una proteína objetivo, toxinas, toxinas condicionales, antígenos, proteínas supresoras de tumores, factores de crecimiento, factores de transcripción, proteínas de membrana, receptores de superficie, moléculas anticancerígenas, proteínas y péptidos vasoactivos, proteínas antivirales y ribozimas, y derivados de los mismos (tales como derivados con un grupo informador asociado). Los NOI también pueden codificar enzimas activadoras de profármacos.
Un ejemplo de NOI es la cadena de beta-globina que puede utilizarse para la terapia génica de la talasemia/enfermedad de células falciformes.
Los NOI también incluyen los que son útiles para el tratamiento de otras enfermedades que requieren una corrección genética no urgente/electiva en el linaje mieloide, tales como: la enfermedad granulomatosa crónica (EGC, por ejemplo, el transgén gp91phox), los defectos de adhesión leucocitaria, otros trastornos fagocíticos en pacientes sin infecciones graves en curso y los síndromes hereditarios de insuficiencia de la médula ósea (por ejemplo, la anemia de Fanconi), así como las inmunodeficiencias primarias (SCID).
Los NOI también incluyen los que son útiles en el tratamiento de los trastornos por almacenamiento lisosómico y las inmunodeficiencias.
Casetes de expresión y transposones
El término “casete de expresión”, tal como se utiliza en la presente, puede referirse a una secuencia de nucleótidos que comprende un marco abierto de lectura ligado operativamente a una o más secuencias reguladoras, tal como un promotor y/o una región no traducible 3' (3'-UTR).
Un transposón (elemento transponible) es una secuencia de ADN que puede cambiar de posición dentro de un genoma, lo que puede tener el efecto de crear o invertir mutaciones, alterando la identidad genética de una célula y el tamaño de su genoma. La transposición puede dar lugar a la duplicación del material genético.
Los elementos transponibles son vehículos no virales de suministro de genes que se encuentran de forma ubicua en la naturaleza. Los vectores basados en transposones tienen capacidad de integración genómica estable y de expresión duradera de constructos transgénicos en las células.
Los transposones de ADN se translocan mediante un mecanismo no replicativo de “cortar y pegar”. Esto requiere el reconocimiento de las dos repeticiones invertidas terminales (TIR) por parte de una transposasa de ADN que escinde su objetivo y, en consecuencia, libera el transposón de ADN de su molde donante. Tras la escisión, los transposones de ADN se integran posteriormente en el ADN aceptor que es escindido por la misma transposasa. Normalmente, esto da lugar a duplicaciones del sitio objetivo (TSD, por sus siglas en inglés) en los sitios de inserción. Existen restos evolutivos de ADN transposón en el genoma humano, pero se han vuelto silenciosos durante la evolución y, en principio, son incapaces de sufrir transposición.
Para las aplicaciones de transferencia genética con transposones de ADN, se ha desarrollado un sistema binario basado en dos plásmidos distintos en los que la secuencia que codifica la transposasa está separada físicamente del ADN del transposón que contiene el gen de interés flanqueado por las TIR. El suministro conjunto de los plásmidos del transposón y la transposasa en las células objetivo permite la transposición mediante un mecanismo convencional de cortar y pegar.
Lo ideal es que la transposasa se exprese sólo durante un corto periodo de tiempo y es preferible evitar la expresión sostenida, ya que esto puede conducir a una movilización e integración continuas del transposón. Puede ser beneficioso minimizar el número de copias del vector por célula, ya que esto aumenta el riesgo de oncogénesis por inserción. Normalmente, el plásmido de expresión que codifica la transposasa debería desaparecer gradualmente de las células transfectadas debido a la degradación del ADN y/o a la dilución al producirse la división celular. Como alternativa más segura, también es posible entregar la transposasa como un ARNm que da lugar a su expresión transitoria suficiente para permitir la transposición al tiempo que se minimiza el riesgo de oncogénesis por inserción.
En las aplicaciones de terapia génica se utilizan diferentes tipos de transposones, incluyendo: (i) Bella Durmiente (SB); (ii) piggyBac (PB); y (iii) transposones Tol2. Éstas difieren en función de la especie de origen, la clasificación, la estructura molecular, la capacidad de carga y el perfil de integración del ADN.
Edición génica
El término “edición génica”, tal y como se utiliza en la presente, hace referencia a un tipo de modificación genética en la que se inserta, deleciona o sustituye un ácido nucleico en una célula, normalmente de forma selectiva. La edición génica puede lograrse utilizando nucleasas modificadas genéticamente, que pueden dirigirse a un sitio deseado en un polinucleótido (por ejemplo, un genoma). Estas nucleasas pueden crear roturas de doble cadena en lugares específicos, que pueden repararse mediante la unión de extremos no homólogos (NHEJ, por sus siglas en inglés) o la recombinación homóloga (HR, por sus siglas en inglés), dando lugar a mutaciones objetivo.
Dichas nucleasas pueden administrarse a una célula objetivo utilizando vectores, tales como los vectores virales.
Ejemplos de nucleasas adecuadas conocidas en la técnica incluyen las nucleasas de dedos de zinc (ZFN), las nucleasas efectoras similares a activadores de la transcripción (TALEN) y el sistema de repeticiones palindrómicas cortas agrupadas y regularmente interespaciadas (CRISPR)/Cas (Gaj, T et al. (2013) Trends Biotechnol. 31: 397-405; Sander, J.D. et al. (2014) Nat. Biotechnol. 32: 347-55).
Meganucleases (Silve, G. et al. (2011) Cur. Gene Ther. 11: 11-27) también pueden emplearse como nucleasas adecuadas para la edición génica.
El sistema CRISPR/Cas es un sistema de unión de ADN guiado por ARN (van der Oost et al. (2014) Nat. Rev. Microbiol.
12: 479-92), en donde el ARN guía (ARNg) puede seleccionarse para permitir que un dominio Cas9 se dirija a una secuencia específica. Los métodos para el diseño de ARNg son conocidos en la técnica. Además, recientemente se han desarrollado proteínas Cas9 totalmente ortogonales, así como complejos ribonucleoproteicos Cas9/ARNg y modificaciones de la estructura/composición del ARNg para unir diferentes proteínas, con el fin de dirigir simultánea y direccionalmente diferentes dominios efectores a los lugares genómicos deseados de las células (Esvelt et al. (2013) Nat. Methods 10: 1116-21; Zetsche, B. et al. (2015) Cell pii: S0092-8674(15)01200-3; Dahlman, J.E. et al. (2015) Nat. Biotechnol. 5 de octubre de 2015. doi: 10.1038/nbt.3390. [publicación electrónica antes de impresión]; Zalatan, J.G. et al. (2015) Cell 160: 339-50; Paix, A. et al. (2015) Genetics 201: 47-54).
Sitio de inserción
El término “sitio de inserción”, tal y como se utiliza en la presente, puede referirse a la localización en un genoma en la que se inserta una secuencia exógena de nucleótidos. Por ejemplo, en el contexto de un vector de terapia génica viral integrador, el sitio de inserción es el lugar del genoma en el que se integra el material genético derivado del virus.
Una secuencia exógena de nucleótidos que se integra en un genoma en un sitio de inserción puede derivarse, por ejemplo, de un genoma viral o de un vector que se integra utilizando métodos de edición génica. Ciertos tipos de vectores pueden mostrar preferencias por la inserción en sitios genómicos particulares, tales como regiones codificadoras de genes, islas CpG o sitios de inicio transcripcional.
La inserción de una secuencia de nucleótidos exógena crea uniones, que pueden denominarse uniones de inserción, entre la secuencia de nucleótidos exógena y el genoma hospedero en los extremos de la secuencia de nucleótidos exógena.
Un riesgo potencial que se asocia a la integración de una secuencia exógena de nucleótidos en un genoma es la mutagénesis por inserción, es decir, las mutaciones que surgen como consecuencia de la introducción de una secuencia de nucleótidos.
Dicha mutagénesis insercional conlleva riesgos que incluyen la alteración de la información genética dentro de una célula y la activación accidental de oncogenes, que pueden causar la transformación maligna de la célula.
Las ubicaciones de los sitios de inserción en el genoma hospedero constituyen marcadores moleculares que pueden utilizarse en el seguimiento del destino de las células afectadas.
Métodos
En un aspecto, la invención proporciona un método para analizar los sitios de inserción de una secuencia de nucleótidos exógena en el genoma de un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada del sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto;
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción; y
(e) secuenciar el producto del paso (d),
en donde la secuencia de nucleótidos exógena es un vector viral, transposón o casete de expresión.
Los métodos de análisis pueden utilizarse para determinar la seguridad y/o la eficacia de una terapia génica.
Por ejemplo, los métodos de análisis pueden comprender identificar la ubicación de uno o más sitios de inserción en el genoma del sujeto y/o cuantificar la abundancia de cada uno de los uno o más sitios de inserción.
El análisis puede informar sobre la seguridad de una terapia génica al determinar si un lugar de inserción puede tener consecuencias potencialmente deletéreas, por ejemplo, la desactivación o mutación de un rasgo genético beneficioso o la activación de un oncogén.
En algunas realizaciones, el análisis comprende la determinación del riesgo de mutagénesis insercional.
Además, o como alternativa, el análisis puede informar sobre la eficacia de una terapia génica caracterizando los sitios de inserción y permitiendo también un seguimiento longitudinal de la población transducida.
En el contexto de la infección de un sujeto por un virus, el análisis puede informar del estado de salud del sujeto. Por ejemplo, el análisis al permitir determinar si una integración viral puede dar lugar a una mutagénesis insercional y/o a la activación de un oncogén.
Muestra
La posibilidad de utilizar muestras de fluidos en los métodos de la invención es ventajosa porque las muestras de fluidos pueden tomarse de un sujeto de forma menos invasiva y con riesgos reducidos en comparación con la toma de biopsias de tejido sólido.
En algunas realizaciones, la muestra es una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR).
Tales muestras pueden obtenerse fácilmente de un sujeto por el experto en la técnica utilizando métodos conocidos en la técnica.
En realizaciones preferidas, la muestra es una muestra de plasma.
ADN libre de células
El término “ADN libre de células”, como se utiliza en la presente, se refiere al ADN bicatenario que está presente en los fluidos corporales de un sujeto, tal como el plasma. Las células apoptóticas y necróticas del organismo pueden liberar fragmentos de ADN libres de células en los fluidos corporales.
El ADN libre de células puede proceder de un fluido corporal, tal como plasma, suero, orina o líquido cefalorraquídeo (LCR). En realizaciones preferidas, el ADN libre de células procede del plasma. El ADN libre de células puede ser ADN libre de células circulantes.
El ADN libre de células es detectable en el plasma de individuos sanos, sin embargo, se observan mayores niveles en condiciones patológicas como el cáncer, la inflamación y las enfermedades autoinmunes.
Polinucleótidos y oligonucleótidos
El término “oligonucleótido”, como se utiliza en la presente, puede referirse a polímeros cortos de ácido nucleico, por ejemplo, polímeros de nucleótidos de ADN. Aunque la longitud exacta de un oligonucleótido no está particularmente limitada, un oligonucleótido puede tener, por ejemplo, aproximadamente 4-200 nucleótidos de longitud.
El término “polinucleótido”, como se utiliza en la presente, puede referirse a polímeros de ácido nucleico más largos, por ejemplo, polímeros de nucleótidos de ADN.
El término “hibridación”, como se utiliza en la presente, se refiere a la unión de hidrógeno de cadenas opuestas de ácido nucleico, preferiblemente la unión de hidrógeno Watson-Crick entre bases complementarias de nucleósidos o nucleótidos. Los nucleótidos comprenden cada uno una nucleobase. El término “nucleobase”, como se utiliza en la presente, se refiere a bases nitrogenadas, incluyendo las purinas y las pirimidinas, como las nucleobases A, T, G y C del ADN, las nucleobases A, U, C y G del ARN, así como las nucleobases distintas del ADN/ARN, tales como la 5-metilcitosina (MeC), isocitosina, pseudoisocitosina, 5-bromouracilo, 5-propiniluracilo, 5-propin-6-fluorouracilo, 5-metiltiazoleuracilo, 6-aminopurina, 2-aminopurina, inosina, 2,6-diaminopurina, 7-propino-7-deazaadenina, 7-propin-7-deazaguanina y 2-cloro-6-aminopurina. Los ácidos nucleicos pueden ser, por ejemplo, monocatenarios o bicatenarios.
La cadena “sentido” (cadena “positiva”) tiene la misma secuencia que el ARN mensajero en el que se transcribe el polinucleótido bicatenario (con la excepción de las diferencias típicas entre nucleobases, por ejemplo, entre ADN y ARN, T se sustituye por U). La cadena opuesta, “antisentido” (cadena “negativa”) se utiliza como molde para el ARN mensajero durante la transcripción. Por lo tanto, la cadena antisentido es responsable del ARN que puede, por ejemplo, traducirse en proteína, mientras que la cadena sentido posee una composición casi idéntica a la del ARN mensajero.
La complementariedad es el principio que afecta a la unión de dos ácidos nucleicos monocatenarios para formar un ácido nucleico bicatenario. Es una propiedad compartida entre dos secuencias de ácido nucleico, de tal forma que, cuando se alinean antiparalelamente entre sí, los nucleótidos opuestos en las dos secuencias serán todos complementarios para una unión óptima. A nivel molecular, la complementariedad viene determinada por la óptima unión de hidrógeno entre pares de bases específicas. Por ejemplo, en el ADN, la adenina es complementaria de la timina y la guanina de la citosina; y en el ARN, la adenina es complementaria del uracilo y la guanina de la citosina. El emparejamiento complementario de bases permite que la información se copie de una molécula a otra y, en la naturaleza, de una generación de células a otra. Un ácido nucleico bicatenario puede estar compuesto por dos cadenas de la misma longitud, en cuyo caso ambos extremos del ácido nucleico bicatenario pueden tener extremos romos.
Alternativamente, uno o ambos extremos de un ácido nucleico bicatenario pueden presentar un saliente de ácido nucleico monocatenario (es decir, el ácido nucleico es parcialmente bicatenario), por ejemplo si una cadena es más larga que la otra o si las dos cadenas están desplazadas entre sí. Dichos salientes pueden permitir que un ácido nucleico monocatenario se una a dos o más ácidos nucleicos complementarios, y así, por la misma razón, el ácido nucleico bicatenario puede unirse a uno o más ácidos nucleicos monocatenarios adicionales en virtud del apareamiento de bases con el saliente, creando así regiones de solapamiento entre ácidos nucleicos monocatenarios opuestos.
Casete enlazador
El oligonucleótido que se liga a los extremos del polinucleótido también puede denominarse en la presente “casete enlazador” u “oligonucleótido enlazador”.
En algunas realizaciones, el oligonucleótido comprende una secuencia a la que se unen los cebadores utilizados en el paso de amplificación.
En realizaciones preferidas, los oligonucleótidos son parcialmente bicatenarios.
En realizaciones preferidas, los oligonucleótidos que se unen a ambos extremos de los polinucleótidos son los mismos. En algunas realizaciones, cada oligonucleótido comprende:
(i) una primera porción que comprende una secuencia aleatoria de nucleótidos, preferiblemente capaz de distinguir el polinucleótido al que se liga;
(ii) una segunda porción que comprende una secuencia de nucleótidos de código de barras; y/o
(iii) una tercera porción que comprende un sitio de unión para un cebador destinado a la secuenciación del paso (e). La secuencia aleatoria de nucleótidos puede ser única para cada oligonucleótido individual y puede permitir distinguir polinucleótidos individuales dentro de una muestra.
El código de barras puede utilizarse para permitir la secuenciación multiplex. La secuenciación multiplex permite agrupar un gran número de bibliotecas y secuenciarlas simultáneamente durante un único ciclo de secuenciación. Con los oligonucleótidos divulgados en la presente, pueden añadirse secuencias de nucleótidos de código de barras a cada polinucleótido de ADN, de modo que cada lectura de secuenciación pueda identificarse y clasificarse antes del análisis final de los datos. Agrupar las muestras de este modo aumenta exponencialmente el número de muestras que pueden analizarse en una sola ejecución.
Purificación
El método de la invención puede comprender un paso de purificación de los polinucleótidos de ADN bicatenario libre de células.
La purificación del ADN puede aislar o enriquecer el ADN de una muestra que comprende otros componentes, tales como proteínas y restos celulares. El ADN purificado puede estar libre o sustancialmente libre de esos otros componentes. La purificación del ADN puede ser realizada fácilmente por el experto en la técnica utilizando métodos conocidos en la técnica. Los métodos adecuados se describen en la presente en los Ejemplos.
Por ejemplo, pueden utilizarse kits comerciales de purificación de ADN, tal como el kit QIAamp de ácido nucleico circulante (55114, QIAGEN) y el kit Maxell RSC ccfDNA Plasma (AS1480, Promega).
Embotamiento
El ADN bicatenario libre de células aislado de un sujeto puede ser parcialmente bicatenario, por ejemplo, teniendo una porción de ADN monocatenario sobresaliente en uno o ambos extremos.
El debilitamiento de ese ADN parcialmente bicatenario puede lograrse mediante la digestión del ADN monocatenario, por ejemplo, utilizando una nucleasa (por ejemplo, una exonucleasa), y/o rellenando la secuencia de nucleótidos faltante mediante la adición de nucleótidos en la cadena complementaria utilizando el saliente como molde para la polimerización, por ejemplo, utilizando una polimerasa. Este proceso puede denominarse reparación de extremos.
En algunas realizaciones, el embotamiento comprende la digestión del ADN monocatenario. En algunas realizaciones, el embotamiento comprende el relleno de la secuencia de nucleótidos faltante. En algunas realizaciones, el embotamiento comprende la digestión del ADN monocatenario y el relleno de la secuencia de nucleótidos faltante, por ejemplo, se pueden limar los extremos de ADN 5'-protruidos (por ejemplo, utilizando una polimerasa 5’^-3 ’) y eliminar los salientes 3' (por ejemplo, utilizando una exonucleasa 3’^ 5 ’).
El embotamiento del ADN puede ser realizado fácilmente por el experto en la técnica utilizando métodos conocidos en la técnica. Los métodos adecuados se describen en la presente en los Ejemplos.
Por ejemplo, las ADN polimerasas, tal como el fragmento Klenow de la ADN polimerasa I y la ADN polimerasa T4 pueden utilizarse para rellenar (5’^ 3 ’) y digerir (3’^ 5 ’). La eliminación de un saliente 5’ puede lograrse, por ejemplo, con una nucleasa, tal como la nucleasa de judía mungo.
En realizaciones preferidas, los polinucleótidos de ADN están 5’-fosforilados, por ejemplo, después del paso de embotamiento. La 5’-fosforilación añade 5’-fosfatos a los extremos del ADN no fosforilado.
La 5’-fosforilación puede llevarse a cabo fácilmente por el experto en al técnica utilizando métodos conocidos en la técnica. Los métodos adecuados se describen en la presente en los Ejemplos.
Por ejemplo, la polinucleótido cinasa T4 (PNK) puede utilizarse para 5’-fosforilar el ADN.
Ligadura
La ligadura une las cadenas de ADN mediante la formación de enlaces fosfodiéster. Por lo tanto, la ligadura del oligonucleótido y el polinucleótido tal como se divulga en la presente une el oligonucleótido y el polinucleótido mediante enlaces fosfodiéster.
La ligadura del ADN puede ser realizada fácilmente por el experto en la técnica utilizando métodos conocidos en la técnica. Los métodos adecuados se describen en la presente en los Ejemplos.
Por ejemplo, puede utilizarse la ligasa de ADN T4 para ligar el ADN. Por ejemplo, pueden utilizarse kits comerciales de ligación de<a>D<n>, tal como el kit de ligación de DNA Technologies.
Amplificación
La amplificación del ADN puede llevarse a cabo fácilmente por el experto utilizando métodos conocidos en la técnica, en particular mediante la reacción en cadena de la polimerasa (PCR, por sus siglas en inglés).
Los métodos de la invención comprenden la amplificación de polinucleótidos que comprenden un sitio de inserción. Un polinucleótido que comprende un sitio de inserción puede comprender una o más uniones de inserción, típicamente una unión de inserción. Preferiblemente, los polinucleótidos que comprenden un sitio de inserción se amplifican de forma selectiva (es decir, los polinucleótidos que comprenden un sitio de inserción y que están comprendidos en una población de polinucleótidos, algunos de los cuales sí comprenden un sitio de inserción y otros no, se amplificarán, mientras que los polinucleótidos que carecen de sitio de inserción no se amplificarán).
La amplificación de polinucleótidos que comprenden un sitio de inserción puede lograrse mediante PCR utilizando dos cebadores que se unen a secuencias en el polinucleótido que están en lados opuestos de un sitio de inserción.
En algunas realizaciones, la PCR comprende amplificar el producto del paso (c) utilizando un cebador que se une a una porción de la secuencia de nucleótidos exógena y un cebador que se une a una porción del oligonucleótido.
La porción de la secuencia de nucleótidos exógena puede ser, por ejemplo, una porción de un nucleótido de interés o una porción de una secuencia viral, tal como una secuencia LTR viral.
En realizaciones preferidas, la porción de la secuencia de nucleótidos exógena unida por el cebador es una secuencia LTR viral.
En algunas realizaciones, la PCR es una PCR anidada.
La PCR anidada puede ser realizada fácilmente por el experto en la técnica utilizando métodos conocidos en la técnica. Los métodos adecuados se describen en la presente en los Ejemplos.
La PCR anidada puede lograr una mayor especificidad en la amplificación de polinucleótidos que comprenden un sitio de inserción en comparación con la PCR estándar.
En algunas realizaciones, la PCR comprende:
(i) amplificar el producto del paso (c) mediante un primer paso de RCP utilizando un par de cebadores externos para obtener un primer producto de PCR; y
(ii) amplificar el primer producto PCR mediante un segundo paso de PCR utilizando un par de cebadores internos para obtener un segundo producto de PCR.
En algunas realizaciones, un cebador del par de cebadores externos se une a una primera porción de la secuencia de nucleótidos exógena y un cebador del par de cebadores internos se une a una segunda porción de la secuencia de nucleótidos exógena. En algunas realizaciones, un cebador del par de cebadores externos se une a una primera porción del oligonucleótido y un cebador del par de cebadores internos se une a una segunda porción del oligonucleótido. En algunas realizaciones, la primera y la segunda porción de la secuencia de nucleótidos exógena son la misma. En algunas realizaciones, la primera y la segunda porciones de la secuencia de nucleótidos exógena son diferentes. En algunas realizaciones, la primera y la segunda porción del oligonucleótido son iguales. En algunas realizaciones, la primera y la segunda porción del oligonucleótido son diferentes.
En algunas realizaciones, la PCR anidada comprende:
(i) amplificar el producto del paso (c) mediante un primer paso de PCR utilizando un primer cebador que se una a una primera porción de la secuencia de nucleótidos exógena y un segundo cebador que se una a una primera porción de un oligonucleótido para obtener un primer producto de PCR; y
(ii) amplificar el primer producto de PCR mediante un segundo paso de PCR utilizando un tercer cebador que se une a una segunda porción de la secuencia de nucleótidos exógena y un cuarto cebador que se une a una segunda porción del oligonucleótido para obtener un segundo producto de PCR.
Secuenciación
La secuenciación, por ejemplo, la secuenciación de última generación puede ser realizada fácilmente por el experto utilizando métodos conocidos en la técnica. Los métodos adecuados se describen en la presente en los Ejemplos. En realizaciones preferidas, la secuenciación es una secuenciación de última generación.
La secuenciación de última generación (NGS, por sus siglas en inglés; también denominada secuenciación de alto rendimiento) hace referencia a las tecnologías de secuenciación que se han desarrollado desde la anterior secuenciación Sanger, tal como la secuenciación Illumina (Solexa), la secuenciación Roche 454, Torrente de iones: Secuenciación de protones / PGM y secuenciación SOLiD.
Por ejemplo, la secuenciación puede llevarse a cabo utilizando la plataforma Illumina Myseq/HiSeq (Illumina, San Diego, CA.).
Los datos de secuenciación pueden ser procesados por un experto en la técnica utilizando métodos bioinformáticos conocidos en la técnica, por ejemplo como los divulgados en Spinozzi, G. et al. (2017) BMC Bioinformatics 18: 520. Por ejemplo, las lecturas de secuencias pareadas pueden filtrarse en función de los estándares de calidad. Los códigos de barras (por ejemplo, comprendidos en el oligonucleótido) pueden identificarse entonces para el demultiplexado de muestras de las lecturas de secuencias.
La ubicación de los sitios de inserción puede determinarse, por ejemplo, mediante el mapeo en un genoma de referencia (por ejemplo, una secuencia del genoma humano). Las ubicaciones pueden caracterizarse, por ejemplo, mediante la asignación de cada sitio de inserción al gen RefSeq más cercano.
La cuantificación de los sitios de inserción puede llevarse a cabo, por ejemplo, mediante un método en el que el número de genomas con el mismo sitio de inserción se calcula contando el diferente número de fragmentos identificados dentro del ADN libre de células; a continuación, la abundancia relativa de cada sitio de inserción puede calcularse como el porcentaje de ADN libre de células con un sitio de inserción específico dividido por el número total de fragmentos que albergan diferentes sitios de inserción identificados (Firouzi, S. et al. (2014) Genome Medicine 6: 46; Gillet, N.A. et al. (2011) Blood 117: 3113-3122).
Otros métodos
El método de la invención puede utilizarse en combinación con otro método para analizar los lugares de inserción de una secuencia de nucleótidos exógena utilizando ADN celular.
En algunas realizaciones, el método adicional comprende:
(a) proporcionar una muestra de células del sujeto;
(b) aislar el ADN de las células, comprendiendo opcionalmente la disrupción de las células y/o la purificación del ADN; (c) fragmentar el ADN, opcionalmente por sonicación; y
(d) (i) embotar los extremos de los polinucleótidos; (ii) ligar un oligonucleótido a ambos extremos de los polinucleótidos; (iii) amplificar los polinucleótidos que comprenden un sitio de inserción; y (iv) secuenciar el producto del paso (iii).
Se prevén otros métodos para analizar los lugares de inserción de una secuencia de nucleótidos exógena.
En otro aspecto, la invención proporciona un método para analizar los sitios de inserción de una secuencia de nucleótidos exógena en el genoma de un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada del sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto;
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) purificar los polinucleótidos que comprenden un sitio de inserción; y
(e) secuenciar el producto del paso (d)
en donde la secuencia de nucleótidos exógena es un vector viral, transposón o casete de expresión.
La purificación de los polinucleótidos que comprenden un sitio de inserción puede lograrse, por ejemplo, utilizando una sonda que se una a una porción de la secuencia de nucleótidos exógena, por ejemplo, una secuencia de nucleótidos monocatenaria que sea complementaria a una porción de la secuencia de nucleótidos exógena. La sonda puede estar vinculada a un agente que permita la purificación del complejo polinucleótido: sonda, por ejemplo, una perla.
Sujeto
El término “sujeto”, como se utiliza en la presente, hace referencia a un animal humano o no humano.
Ejemplos de animales no humanos son los vertebrados, por ejemplo, los mamíferos, tales como los primates no humanos (en particular los primates superiores), perros, roedores (por ejemplo, ratones, ratas o cobayas), cerdos y gatos. El animal no humano puede ser un animal de compañía.
En realizaciones preferidas, el sujeto es un humano.
El experto en la técnica comprenderá que puede combinar todas las características de la invención divulgadas en la presente sin apartarse del alcance de la invención divulgada.
A continuación se describirán, a modo de ejemplos no limitativos, características y realizaciones preferentes de la invención.
La práctica de la presente invención empleará, a menos que se indique de otro modo, técnicas convencionales de química, bioquímica, biología molecular, microbiología e inmunología, que están dentro de las capacidades de un experto en la técnica. Estas técnicas se explican en la literatura. Véase, por ejemplo, Sambrook, J., Fritsch, E.F. Y Maniatis, T (1989) Molecular Cloning: A Laboratory Manual, 2a edición, Cold Spring Harbor Laboratory Press; Ausubel, F.M. et al. (1995 y complementos periódicos) Current Protocols in Molecular Biology, Capítulo 9, 13 y 16, John Wiley & Sons; Roe, B., Crabtree, J. y Kahn, A. (1996) DNA Isolation and Sequencing: Essential Techniques, John Wiley & Sons; Polak, J.M. and McGee, J.O'D. (1990) In Situ Hybridization: Principles and Practice, Oxford University Press; Gait, M.J. (1984) Oligonucleotide Synthesis: A Practical Approach, IRL Press; and Lilley, D.M. y Dahlberg, J.E. (1992) Methods in Enzymology: DNA Structures Part A: Synthesis and Physical Analysis of DNA, Academic Press.
Ejemplos
Ejemplo 1
Los inventores han desarrollado un método, denominado secuenciación de sitios de inserción en biopsia líquida (LiBIS-seq), que permite identificar y cuantificar los sitios de inserción de virus y vectores (tales como los sitios de inserción de retrovirus, AAV y transposones, y los sitios de inserción de casetes de expresión insertados con tecnologías de edición génica) en el ADN genómico utilizando ADN circulante libre de células (ADNcirc). El ADN circulante libre de células puede obtenerse del plasma sanguíneo y de otros fluidos corporales (por ejemplo, líquido cefalorraquídeo, LCR). Entre los sujetos adecuados se incluyen seres humanos y modelos animales tratados mediante procedimientos de terapia génicain vivooex vivo,y/o infectados por un virus integrador y competente en la replicación (por ejemplo, VIH o VHB).
En la Figura 1 se muestra un resumen de un método de ejemplo, que incluye los siguientes pasos:
1. Purificación de ADNcirc a partir de plasma sanguíneo u otro fluido corporal adecuado;
2. Reparación de los extremos del ADN bicatenario total y fragmentado, fosforilación de los extremos primarios 5' y cola A de los extremos 3';
3. Ligadura de casetes enlazadores de ADN (LC) que contienen códigos de barras de secuencias e identificadores moleculares únicos (UMI);
4. Una primera amplificación por PCR utilizando cebadores complementarios al extremo del genoma del LC y del vector; 5. Una segunda amplificación por PCR utilizando cebadores que se unen al fragmento de ADN amplificado previamente. Este paso puede aumentar la especificidad del fragmento amplificado que contiene la unión del vector integrado y el genoma celular; y
6. Secuenciación. Los resultados de las secuencias pueden ser posteriormente desmultiplexados, y las uniones vector/genoma identificadas y mapeadas en un genoma de referencia utilizando enfoques bioinformáticos (Biffi, A. et al. (2013) Science 341: 1233158; Spinozzi, G. et al. (2017) BMC Bioinformatics 18: 520).
Resultados
Recuperación de sitios de inserción (IS) del ADNcirc del plasma sanguíneo de pacientes con leucodistrofia metacromática tratados con terapia génica de células madre hematopoyéticas basada en vectores lentivirales
El enfoque LiBIS-seq se aplicó sobre ADNcirc purificado del plasma sanguíneo de 7 pacientes con leucodistrofia metacromática (MLD) sometidos a terapia génica con células madre hematopoyéticas basada en vectores lentivirales (LV). Para cada paciente, se recolectaron 1-2 mL de plasma sanguíneo en 7-8 puntos temporales diferentes tras el trasplante (intervalo de 1-72 meses, Figura 2A). Se aisló el ADNcirc y se realizó el enfoque LiBIS-seq.
Los productos de PCR se secuenciaron utilizando diferentes plataformas Illumina y se mapearon con una línea de bioinformática específica (Biffi, A. et al. (2013) Science 341: 1233158; Spinozzi, G. et al. (2017) BMC Bioinformatics 18: 520). En total, recuperamos >10900 IS únicos de ADNcirc (circIS, rango de 338 a 3709 por paciente).
Los IS recuperados del circADN de MLD mostraban las características típicas de los LV IS recolectados del ADN genómico de células sanguíneas transducidas que se han descrito previamente: integración preferente dentro de la unidad transcripcional de genes celulares; objetivo con alta frecuencia de cinco regiones genómicas del cromosoma; y enriquecimiento dentro de las mismas clases de la Ontología Genética (Figura 2B, 2C). Al comparar los circIS identificados en cada paciente con los IS extraídos del ADN genómico aislado de células mononucleares de sangre periférica (CMSP, ceIIIS) y linajes celulares recolectados de la sangre y la médula ósea (MO) del mismo paciente, se observó que, por término medio, sólo el 40 % de los circIS eran compartidos con ceIIIS (Figura 2D). Las células mieloides de la sangre y de la médula ósea fueron las que mostraron un mayor nivel de compartición con el circIS (en torno al 20 %, Figura 2E), posiblemente porque esas células son de vida corta con un recambio rápido.
Por último, al analizar la clonalidad y la dinámica del circIS, se observó un patrón altamente policlonal con ausencia de clon dominante que se expandiera y/o persistiera en el tiempo (Figura 1D, 1E), que se asemejaba al cuadro observado con el circIS recolectado de PBMC de los mismos pacientes durante el mismo periodo de tiempo de seguimiento (Figura 2F, 2G).
En general, estos resultados recapitulan los datos de seguridad comunicados anteriormente para este ensayo (Biffi, A. et al. (2013) Science 341: 1233158), y dado que sólo el 40 % de los circIS se compartieron con cellIS, es posible que una fracción de tales IS pudiera derivar de clones marcados con vectores incrustados en órganos sólidos.
Recuperación de IS del ADNcirc del plasma sanguíneo de modelos animales tratados con terapia génica dirigida al hígado mediada por LV
Para confirmar que el circIS podía revelar el IS de clones celulares marcados con vectores incrustados en órganos sólidos, se realizó un análisis de la terapia génica dirigida al hígado mediada por LV en modelos de primates no humanos (PNH) y en un modelo canino de hemofilia.
En los primeros modelos animales, se trató a los NHP con dos lotes diferentes de LV, un LV de control y un LV blindado contra la fagocitosis (3 para cada tipo de LV) caracterizado por un alto contenido en la superficie de CD47 que potencia la transferencia génica al hepatocito en comparación con el L<v>parental (CD47hi LV). Ambos LV expresan el antígeno del factor IX humano bajo el control de un casete de expresión específico de los hepatocitos (Cantore, A. et al. (2012) Blood 120: 4517-4520).
Se recolectó plasma sanguíneo a los 15, 28, 60 y 90 días tras la inyección en ambos grupos de animales tratados, y se recuperaron los LV IS del ADNcirc purificado en cada punto temporal.
En total, se recuperaron 165, 88 y 415 LV IS de los NHP tratados con el CD47hi LV, y 1074, 705 y 2747 LV IS de los NHP inyectados con el LV de control (Figura 3A). Los análisis de IS mostraron un patrón altamente policlonal en casi todos los puntos temporales analizados, y la ausencia de clones marcados que se expandieran y persistieran en el tiempo (Figura 3B-3G). Estos perfiles moleculares descritos por circIS se asemejan mucho a los resultados de IS obtenidos al analizar el ADN genómico del hígado y el bazo a los 3 meses tras la inyección (Figura 3H, I, respectivamente). De hecho, el perfil de integración genómica revelado en estos tejidos y para todos los NHP exhibió un patrón policlonal notable (23457 Lv IS en el hígado, 11314 LV IS en el tejido del bazo), en el que casi todos los IS únicos estaban representados por 1-4 genomas. Estos resultados son coherentes con el estado mayoritariamente en reposo que se espera para el hígado de los NHP tratados, y que también refleja el circIS. Además, una media del ~2 % de los circIS eran compartidos con IS encontrados en el hígado y el bazo, lo que confirma el origen tisular de estos LV IS.
Para seguir estudiando el uso de estos métodos como parte de los procedimientos de terapia génicain vivo,se extrajeron circis de 3 perros macho hemofílicos B que recibieron una única inyección de LV mediante administración por vena porta y tuvieron un periodo de seguimiento más largo (hasta 522 días tras la inyección). Los LV utilizados para el tratamiento expresaban los transgenes de ADNc para el factor IX canino (cFIX) bajo el control de un casete de expresión específico de hepatocitos (Cantore, A. et al. (2012) Blood 120: 4517-4520). A cada perro se le inyectó un transgén cFIX diferente: de tipo silvestre (cFIX, perro M57), optimizado para codones (co-cFIX, perro O21) o hiperfuncional cFIX optimizado para el codón portador de la mutación de Padua asociada a la trombofilia humana (co-cFIXR338L, perro O59) (Figura 4A). Para cada perro, el cADNirc se purificó a partir de 7-8 colecciones de plasma diferentes recolectadas entre 30 y 532 días después de la inyección. Se recuperaron 154 circIS para O21, 1057 circIS para M57 y 9796 circIS para O59. Al igual que en el caso de los NHP, todos los perros analizados se caracterizaban por un patrón policlonal con muchos IS diferentes con bajos niveles de abundancia, y ausencia de clones dominantes que se expandieran y persistieran en el tiempo (Figura 4B-4C). A pesar de la gran variabilidad en la cantidad global de circIS recuperados de los distintos animales, el número de circIS obtenidos entre los distintos puntos temporales para cada perro fue coherente, lo que sugiere una correlación con el nivel de clonalidad/transducción de los órganos objetivo.
Por lo tanto, los datos demuestran que LiBIS-seq representa un procedimiento válido para los estudios de IS en aplicaciones de terapia génicain vivo.En comparación con los análisis de IS mediante biopsias de tejido, la recuperación de IS a partir de ADNcirc es menos arriesgada, no invasiva y puede realizarse fácilmente varias veces tras el tratamiento, lo que proporciona una imagen más completa del repertorio clonal de los órganos transducidos, así como un seguimiento longitudinal de la población transducida.
Recuperación de IS del plasma sanguíneo de pacientes de terapia génica que desarrollaron leucemia linfoblástica aguda de células T (T-ALL) inducida por vector tras terapia génica con células madre hematopoyéticas
Se valoró el uso de LiBIS-Seq para permitir la identificación temprana de clones marcados en expansión residentes en tejido sólido.
Este estudio utilizó los ensayos clínicos para el tratamiento con células madre hematopoyéticas basado en Y-retrovirales (RV) de la inmunodeficiencia combinada grave ligada al cromosoma X1 (SCID-X1). Este ensayo se caracterizó por una alta incidencia de eventos adversos secundarios (SAE, por sus siglas en inglés) provocados por el vector, ya que 5 de cada 10 pacientes del ensayo X-SCID desarrollaron T-ALL como consecuencia de la mutagénesis insercional. En todos estos casos de T-ALL, la inserción de<y>RV provocó la activación/desregulación de protooncogenes conocidos, tales como LMO2 (P4, P5, P9, P10 para SCID-X1) yCCND2 (P10 para SCID-X1), proporcionando una ventaja proliferativa a la célula y favoreciendo el proceso de transformación neoplásica.
Los estudios convencionales de IS realizados con ADN aislado de PBMC o células T purificadas de la sangre de esos pacientes no lograron detectar signos tempranos de leucemia de células T. Debido a que los clones LMO2, CCND2 y TAL1 asociados a la T-ALL se expanden repentinamente en las células sanguíneas de los pacientes, en el último punto temporal anterior a la leucemia no eran detectables o lo eran con una contribución baja de < 5%. Estos resultados se explicaron por la presencia de un clon preleucémico que creció en el nicho del timo y que fue liberado a la circulación sólo tras la adquisición de la mutación secundaria que condujo a la transformación celular completa.
En el presente estudio, se planteó si la recuperación de yRV IS a partir de ADNcirc permitiría la detección precoz de clones leucémicos que se están expandiendo en órganos periféricos, tal como el timo.
Para el ensayo de terapia génica SCID-X1, los<y>RV IS se recuperaron del plasma y PBMCs del paciente P9, que desarrolló T-ALL inducida por LMO2 a los 178 meses después de la terapia génica. Se recuperaron un total de 2635 células IS de PBMC recolectadas 4 meses antes de la aparición del SAE, en el momento del diagnóstico y 2 meses después de la quimioterapia (Figura 5A). La inserción<y>RV del clon blástico cerca del protooncogén LMO2 se identificó en todos los puntos temporales analizados, sin embargo, el nivel de abundancia de este<y>RV IS fue muy bajo, con un pico máximo del 1,4 % en el momento del diagnóstico (178 meses). Por otra parte, se recuperaron 66 yRV circIS del ADNcirc obtenido del plasma sanguíneo recolectado 4 meses antes de la aparición del SAE, en el momento del diagnóstico y 2 y 4 meses después de la quimioterapia (Figura 5B). Dentro de este conjunto de datos, el SI leucémico<y>RV fue el más abundante en el momento del diagnóstico (95 %) e incluso 4 meses antes del desenlace de la T-ALL (91 %), mientras que se volvió indetectable tras la quimioterapia (Figura 5B).
En conjunto, estos datos demuestran que LiBIS-Seq puede identificar y cuantificar los clones leucémicos marcados por vectores que crecen en órganos periféricos (como el timo) mejor que los estudios de IS convencionales realizados en ADN genómico.
Conclusiones
El enfoque LiBIS-seq divulgado en la presente permite una comprensión más completa del repertorio clonal a nivel de todo el organismo en pacientes de terapia génica, revelando incluso la presencia de clones marcados por el vector incrustados en órganos sólidos, tal como el hígado. Además, permite la detección precoz y sensible de clones premalignos no circulantes desencadenados por mutagénesis insercional que puedan estar residiendo en órganos sólidos. En algunos casos son apenas detectables por el análisis convencional de IS. Por lo tanto, el método divulgado en la presente puede adoptarse como una estrategia para estudiar los IS en el ADN genómico para la supervisión de la seguridad de los pacientes de terapia génica, ya que transmite información sobre los clones de células transducidas que viven en órganos sólidos y podría predecir si se está produciendo el crecimiento clonal de una célula transducida en órganos periféricos (por ejemplo, T-ALL inducida por LMO2 desarrollada en los pacientes SCIDX1).
La LiBIS-seq es muy informativa en los procedimientos de terapia génicain vivoporque, por primera vez, esta tecnología abre la puerta a los estudios de seguimiento clonal longitudinal en las aplicaciones de terapia génicain vivo.De hecho, los estudios del lugar de integración son normalmente inviables en los procedimientos de terapia génicain vivoporque la recuperación de los SI dependía antes estrictamente de la recolectada de ADN con biopsias tisulares invasivas del órgano objetivo. Sin embargo, incluso cuando se realizan estos procedimientos quirúrgicos, la cantidad de información genómica recuperada se limita a la única y pequeña porción de tejido analizada. En cambio, LiBIS-seq representa una alternativa no invasiva a estos procedimientos quirúrgicos porque el ADNcirc puede muestrearse fácilmente, incluso en múltiples ocasiones, a partir de fluidos, tal como el plasma sanguíneo, superando así las limitaciones del análisis de biopsias únicas y proporcionando una imagen global más completa del órgano transducido.
Materiales y métodos
Purificación del ADNcirc a partir del plasma sanguíneo
Dependiendo de la cantidad de plasma sanguíneo disponible, se utilizaron diferentes kits para la purificación del ADN circulante: cuando se disponía de 2 a 5 mL de plasma o suero, se utilizó el kit de ácido nucleico circulante QIAamp (55114, QIAGEN); y cuando se disponía de menos de 2 mL de plasma, se utilizó el kit Maxell RSC ccfDNA Plasma (AS1480, Promega). En ambos casos, la purificación se realizó siguiendo las instrucciones del fabricante. Tras la purificación, el ADN libre de células se cuantificó inmediatamente y se sometió al procedimiento LiBIS-seq.
LiBIS-seq: Recuperación de IS circulantes a partir de ADN libre de células
Tras la purificación, el ADN circulante libre de células se dividió en 2 réplicas técnicas, se sometió a reparación de extremos y adenilación en 3' mediante el kit NEBNext® Ultra™ DNA Library Prep Kit para Illumina® (New England Biolabs, Ipswich, MA.),y, a continuación, se ligó (kit de ligación de DNA Technologies, Skokie, IL.) a casetes enlazadores (LC) que contenían:
(i) un código de barras de secuencia de 8 nucleótidos, utilizado para la identificación de la muestra;
(ii) una secuencia aleatoria de 12 nucleótidos, utilizada con fines de cuantificación, y
(iii) todas las secuencias necesarias para la secuenciación de extremo pareado Lectura 2 Illumina, rastreadas en la gestión de la información de nuestro laboratorio (Spinozzi, G. et al. (2017) BMC Bioinformatics 18: 520).
A continuación, los productos de ligación se sometieron a 35 ciclos de PCR exponencial con cebadores complementarios a la secuencia LTR del vector lentiviral o retroviral, y a la LC. Posteriormente, se realizaron diez ciclos de PCR adicionales, que añadieron las secuencias necesarias para la secuenciación.
Por último, los productos de amplificación se secuenciaron utilizando la plataforma Illumina Myseq/HiSeq (Illumina, San Diego, CA.). A continuación, las lecturas de secuenciación se procesaron como se describió previamente (Spinozzi, G. et al. (2017) BMC Bioinformatics 18: 520). Brevemente, se filtraron las lecturas de secuencias emparejadas para los estándares de calidad, se identificaron los códigos de barras para el demultiplexado de la muestra de las lecturas de secuencias, se mapeó la secuencia genómica celular en el genoma de referencia (Humano o macaco cangrejero (Genoma Humano_GRCh37/hg19 Feb. 2019, Macaca_fascicularis_5.0/macFas5, Jun. 2013)) y se asignó el gen RefSeq más cercano a cada sitio de integración (IS) mapeado sin ambigüedades.
La abundancia de cada IS se estimó mediante un método en el que el número de genomas con el mismo IS se calcula contando el diferente número de fragmentos identificados dentro del material de ADN libre de células. A continuación, la abundancia relativa de cada IS se calcula como el porcentaje de ADN libre de células con un IS específico sobre el número total de fragmentos que albergan diferentes IS identificados (Firouzi, S. et al. (2014) Genome Medicine 6: 46; Gillet, N.A. et al. (2011) Blood 117: 3113-3122).
Recuperación del IS circulante a partir del ADN genómico celular
Para la recuperación del IS del vector a partir del ADN genómico, se utilizó un método de PCR mediada por enlazador (LM) basado en la sonicación, tal y como se describió previamente (Firouzi, S. et al. (2014) Genome Medicine 6: 46; Gillet, N.A. et al. (2011) Blood 117: 3113-3122). Brevemente, el ADN genómico se cizalló utilizando un ultrasonicador Covaris E220 (Covaris Inc., Woburn (MA), generando fragmentos con un tamaño medio de 1000 pb. A continuación, el ADN fragmentado se dividió en 3 réplicas técnicas y se sometió a reparación de extremos y adenilación en 3' utilizando el kit NEBNext® Ultra™ DNA Library Prep Kit para Illumina® (New England Biolabs, Ipswich, MA.), y después se ligó (kit de ligación de DNA Technologies, Skokie, IL.) a los mismos casetes enlazadores (LC) como se ha descrito anteriormente. Posteriormente, se aplicaron de nuevo procedimientos de PCR para la recuperación y el mapeo de los IS.
Casetes enlazadores
Los casetes enlazadores (LC) tienen una estructura parcialmente bicatenaria, que se genera mediante el apareaiento de dos oligonucleótidos:
Un oligonucleótido corto (de 5' a 3': GGATTGACGACACGGTGAC; SEQ ID NO: 1) está 5'-fosforilado y en el extremo 3' contiene un espaciador de glicol de seis carbonos (hexanediol) capaz de bloquear la extensión por las ADN polimerasas.
Un oligonucleótido largo (descrito en la Tabla 1) tiene una única T saliente 3', que permite la ligadura a los fragmentos adenilados. El saliente en T está unido a la primera base del oligonucleótido mediante una unión de fosforotioato, que hace que el enlace internucleotídico sea resistente a la degradación por nucleasas.
La porción monocatenaria contiene: (i) una secuencia aleatoria de 12 nucleótidos, que actúa como identificador molecular único (UMI) para los fragmentos; (ii) un código de barras de 8 nucleótidos para el código de barras de la muestra; y (iii) una secuencia con el cebador de secuenciación de Illumina, P7.
Tabla 1.Secuencias lar as de oli onucleótidos LC indicadas de 5’ a 3’.
Cebadores PCR
Los cebadores utilizados en la primera amplificación por PCR fueron:
Fw1: se une al vector LTR: AGCTTGCCTTGAGTGCTTCA (SEQ ID NO: 50)
Rw1: se une a la secuencia P7 del vector: GACGTGTGCTCTTCCGATC (SEQ ID NO: 51)
La segunda amplificación por PCR se realizó con Rw1 y un oligonucleótido de unión a LTR (Tabla 2), que contenía: (i) una porción común en el extremo 3’ que se aparea a la LTR del vector; (ii) un código de barras de 8 nucleótidos para el código de barras de la muestra; (iii) una secuencia aleatoria de 12 nucleótidos; y (iv) una secuencia con el cebador de secuenciación Illumina, P5.
Tabla 2.Oli onucleótidos de unión a LTR indicados de 5’ a 3’.
Ejemplo 2
Los inventores investigaron más a fondo la secuenciación del sitio de inserción de la biopsia líquida (LiBIS-seq), como se describe a continuación.
LiBIS-Seq permite la recuperación de sitios de inserción (SI) a partir de ADN libre de células (ADNlc) de pacientes con leucodistrofia metacromática (MLD) tratados mediante terapia génica con células madre hematopoyéticas (HSC-GT) basada en vectores lentivirales (LV)
Los inventores utilizaron un protocolo de PCR para la recuperación del IS con el fin de amplificar el LV IS presente en el ADNlc purificado a partir de 1-2 ml de plasma sanguíneo recolectado en 4-8 momentos diferentes tras la infusión de células CD34+ autólogas transducidas por el LV (rango 1-72 meses) de 7 pacientes con leucodistrofia metacromática (MLD) HSC-GT (Biffi, A. et al. (2013) Science 1233158; Sessa, M. et al. (2016) Lancet 388: 476-487). La cantidad de ADNlc recuperada por cada ml de plasma varió (entre 3 y ~600 ng/ml) en función del momento de la extracción de sangre y del estado de la enfermedad de cada paciente (Figura 6A). Al representar gráficamente los ng de ADNlc/ml a lo largo del tiempo observamos que antes de la condición la concentración de ADNlc estaba por encima del umbral patológico de 10 ng/ml en 5 de 6 pacientes, mientras que en todos los pacientes (7/7) siempre alcanzó niveles patológicos en los primeros 3 meses post-TGH y luego disminuyó progresivamente con el tiempo hasta alcanzar el rango normal en la mayoría de los pacientes (Figura 7A). La única excepción a esta tendencia la representó el MLD04, que mostró concentraciones plasmáticas muy elevadas de ADNlc que oscilaron entre 46 ng/ml y 648 ng/ml. MLD04 fue el único paciente de esta cohorte afectado por la forma juvenil precoz de la enfermedad y para el que el procedimiento de GT fue poco eficaz, ya que se le trató cuando ya era sintomático y experimentó una progresión de la enfermedad. En general, estos datos sugieren que la cantidad de ADNlc recuperada de los pacientes con MLD puede correlacionarse con el estado de la enfermedad (Figura 6A).
El ADNlc purificado mostró una distribución del tamaño de los fragmentos que iba de 100 pb a 220 pb con un pico a 167 pb, correspondiente a la fracción mononuclesomal protegida y seguido de un pico débil entre 300 y 370 pb correspondiente a los fragmentos dinucleosómicos (Figura 7B).
Tras la purificación, el ADNlc se sometió a reparación de extremos, fosforilación, cola A, ligación a un adaptador sintético de ADN con código de barras y a dos rondas de amplificación por PCR con oligonucleótidos anidados complementarios a la LV LTR y al adaptador de ADN y se secuenció utilizando una plataforma Illumina. A continuación, se analizaron los datos de secuenciación con la línea de bioinformática VISPA228 para mapear los IS en el genoma, identificar el gen más cercano y cuantificar la abundancia relativa de cada IS (). La distribución de los tamaños de los fragmentos tras la amplificación por PCR y la secuenciación fue similar (Figura 7C) a la distribución de los fragmentos por PCR obtenidos cuando se recuperó el LV IS del ADN genómico derivado de células sonicadas, con cierta sobrerrepresentación superviviente del tamaño de 100-220 pb. A partir de 38 muestras de ADNlc de los 7 pacientes con MLD, recuperamos un total de >10.900 IS únicos, con un promedio de 265 ± 163 IS para cada punto temporal analizado (Tabla 3). El número de IS recuperados en cada punto temporal para ng de ADNlc, aumentó con el tiempo en 5 de 7 pacientes (Figura 6B). El aumento progresivo de IS recuperado por LiBIS-seq siguió el aumento de VCN medido en PBMC tras el trasplante (Figura 6C).
Tabla 3.Sitios de integración recuperados de pacientes con MLD tratados mediante terapia génica con HSPC basadas en LV a partir de ADN genómico o ADNlc.
(a) ID del paciente: identificador del paciente con MLD tratado con HSC-GT
(b) FU: periodo de seguimiento de la recolección de muestras de células(b)/ADNlc(c) en meses
(c) IS tot: número total de IS únicos recolectados a partir de ADN genómico celular purificado de células circulantes® o ADNlc(c), en b, las otras columnas se refieren al número total de IS únicos recolectados en el linaje indicado de BM y PB
(d) IS compartidos: porcentaje relativo de IS recolectados en ADNlc por LiBIS-seq que se identificaron en el conjunto de datos de ID derivado de células
El perfil de integración genómica de IS derivado del ADNlc fue muy similar al perfil de integración clásico de LV descrito en estudios previos de IS en HSPC y al conjunto de datos de IS obtenidos específicamente a partir de ADN genómico derivado de células recolectadas de diferentes linajes de BM y PBMC de los mismos 7 pacientes con MLD durante un periodo de seguimiento similar mediante enfoques de PCR establecidos (Tabla 3). Los inventores demostraron lo siguiente: A) Marcada tendencia de los IS a mapearse dentro de los genes a lo largo de toda la unidad de transcripción (Figura 8A, 8B); B) Preferencia por los puntos calientes genómicos megabásicos encontrados en regiones densas en genes (Figura 8C, 8D) y sin sitios de inserción comunes significativos; C) Enriquecimiento de los IS dirigidos a clases de genes implicados en la remodelación de la cromatina, HLA, interacciones virus-hospedero y otras clases ontológicas de genes similares (Figura 8E). La abundancia de cada IS recuperada por LiBIS-seq se estimó utilizando “SonicLength”, un modelo matemático que cuantifica cada IS considerando el diferente número de fragmentos de ADN en función de la posición del sitio de cizallamiento genómico y teniendo en cuenta los eventos de saturación. Por lo tanto, el número de sitios de cizallamiento diferentes asignados a un IS será proporcional al número inicial de células contribuyentes, lo que permitirá estimar la abundancia clonal en la muestra de partida evitando los sesgos introducidos por la amplificación por PCR. Aplicando este enfoque observamos que alrededor del 85,6 % ± 1,15 de las SI derivadas del ADNlc estaban representadas por 1 a 4 genomas, el 12,8 % ± 1,04 por 5 a 9 genomas y el 1,6 % ± 0,43 restante por 10 a 40 genomas (Figura 9). La abundancia relativa promedio de cada IS con respecto al conjunto global de datos de IS del ADNlc fue baja (0,82 % ± 0,12) y no se observaron IS dominantes que se expandieran y/o persistieran en el tiempo en ningún paciente (Figura 6B). Los IS recuperados del ADNlc aparecieron y desaparecieron con el tiempo y sus fluctuaciones en los niveles de abundancia fueron similares a las evaluaciones de abundancia clonal realizadas en células sanguíneas con análisis anteriores (Figura 10A, 10B) 20,26. Al comparar el conjunto de datos de IS de ADNlc con el que engloba IS recuperados de células mononucleares (CMN) y linajes celulares individuales purificados de PB o BM, descubrimos que, en promedio, el 33± 0,5 % de los IS derivados de ADNlc eran compartidos entre los dos conjuntos de datos. Teniendo en cuenta la limitación impuesta por el muestreo disperso de cada fuente de IS, estos datos indican que los IS recuperados por LiBIS-seq procedían efectivamente de células marcadas con LV (Figuras 6E-6G, Figura 11 y Tabla 3). Al medir el nivel de compartición entre los IS derivados del ADNlc y los IS obtenidos a partir de HSPC purificadas de BM (CD34+), células mieloides (CD13 y CD15), B (CD19) y T (CD3), observamos que los IS derivados del ADNlc estaban significativamente enriquecidos para los IS de las células CD15 en comparación con los de las células CD34+, T y B (Figura 6F). Este mayor reparto podría explicarse por la mayor representación y rotación de las células mieloides en comparación con otros linajes<b>M. Curiosamente, mientras que en PB las células T eran la población más abundante, los IS derivados del ADNlc no mostraron un mayor reparto con los IS obtenidos de células T en comparación con las células mieloides CD14+ o CD15+, lo que probablemente refleja una mayor contribución al ADNlc de las células mieloides de vida corta (Figura 6G, 6I).
Recuperación de IS a partir de ADNlc de perros tratados mediante GT dirigida al hígado mediada por LV
Tras demostrar que LiBIS-seq permite recuperar el IS del ADNlc de pacientes con HSC-GT, los inventores comprobaron la capacidad de esta técnica para revelar el IS de clones celulares marcados con vectores e incrustados en órganos sólidos. Con este fin, los inventores analizaron muestras de suero sanguíneo y de tejido hepático de un estudio preclínico en perros sometidos a una GT dirigida al hígado con LV para el tratamiento de la hemofilia B. En el estudio, tres perros hemofílicos adultos (O21, M57 y O59) recibieron una única inyección en la vena porta de dosis bajas de LV que expresaban diferentes versiones del factor IX de coagulación canino (cFIX). Para cada perro, el ADNlc se purificó a partir del suero sanguíneo recolectado en 7-8 puntos temporales diferentes, comenzando entre 30 y 532 días tras la inyección, mientras que el ADN hepático se purificó a partir del tejido recolectado en la necropsia a los 3107 días (M57), 2185 días (O21) y 1848 días (O59) desde la administración del LV. La cantidad de ADNlc obtenida en cada punto temporal fue muy variable y, en general, baja (de 2 ng a un máximo de 23 ng) (Figura 12A). Por lo tanto, se utilizó todo el ADNIc disponible para el protocolo de amplificación LiBIS-seq. El ADN genómico hepático se extrajo de una mezcla de tejido hepático muestreado de múltiples lóbulos y se utilizó un total de ~1 pg de ADN para la recuperación del IS. Tras la amplificación por PCR y la secuenciación, los IS se mapearon en el genoma del perro y se identificó el gen más cercano mediante minería de datos utilizando las anotaciones disponibles de genes ortólogos humanos en las coordenadas genómicas del perro (Tabla xenoRefGene de la UCSC). Hemos recuperado: 154 IS del ADNlc y 588 IS del ADN hepático del perro O21, 1057 IS del ADNlc y 4516 IS del ADN hepático del perro M57, 9796 IS del ADNlc y 311 IS del ADN hepático del perro O59 (Figura 12B-12F). El número de inserciones extraídas del hígado y/o del ADNlc indica que todos los animales tenían un repertorio policlonal de células modificadas genéticamente. El número de IS derivados de ADNlc recuperados en diferentes puntos temporales del mismo perro fueron similares y no se correlacionaron con la cantidad de ADNlc analizado (Figura 12G). A diferencia de lo observado en los pacientes ex-vivo de HSC-GT, los IS identificados en el ADN del hígado de perro o en el ADNlc del suero fueron significativamente menos abundantes, estando representados en su mayoría por 1 a 4 genomas (98,2 %± 0,4) y alcanzando un máximo de 20 genomas (Figura 12H, Figura 10A, 10B), en consonancia con la baja tasa de proliferación esperada en el hígado adulto. No se observaron clones dominantes que se expandieran y persistieran en el tiempo en ningún perro (Figura 12C-12E). Los genes más objetivo fueron NDGR4 y SMIM21 en el ADNlc, mientras que no se encontró un enriquecimiento significativo para ningún gen objetivo en el conjunto de datos de IS del hígado. El análisis de sobrerrepresentación de las clases de genes más objetivo mostró una tendencia significativa a dirigirse a clases de genes implicados en la actividad de canales iónicos, fosfatasas y factores de intercambio RHO (Figura 10C). En los dos perros con mayor número de IS derivados del ADNlc, el 10,8 % y el 23,3 % respectivamente, de los IS fueron compartidos entre al menos dos puntos temporales y el 5 % y el 0,2 % respectivamente, con IS del tejido hepático muestreado (Figura 12I, 12L). Aplicando estadísticas de captura y recaptura sobre los SI compartidos presentes en puntos temporales consecutivos y a lo largo de todo el tiempo de seguimiento, estimamos el tamaño medio de la población de clones de células marcadas que aportaron IS a lo largo del tiempo. A partir de este análisis estimamos en el perro M57 una población persistente de 4183±547 células, que se mantuvo de forma estable durante todo el tiempo de seguimiento (de 60 a 532 días) y en el perro O59 una población de 12963±1466 células en los primeros puntos temporales (de 30 a 294 días) que disminuyó a 10726±558 células en el tiempo posterior (de 120 a 240 días) (Figura 12M).
LiBIS-seq permite la detección precoz de expansiones clonales aberrantes en tejidos sólidos
Los inventores investigaron además si LiBIS-seq permite la detección y cuantificación de expansiones clonales premalignas o malignas desencadenadas por mutagénesis insercional y si, en comparación con los métodos convencionales basados en la interrogación del IS derivado de células, permite la detección más temprana de clones en expansión aberrante residentes en tejidos sólidos.
Para ello, los inventores analizaron muestras de PBMC y plasma recolectadas de pacientes que desarrollaron leucemia o linfoma como resultado de la mutagénesis insercional yRV en dos ensayos de HSC-GT de síndrome de Wiskott-Aldrich (WAS) e inmunodeficiencia combinada severa ligada al cromosoma X (X-SCID). Los inventores también analizaron un modelo experimental de trasplante de CEH en ratones X-SCID, en donde el 50 % de los ratones trasplantados desarrollan espontáneamente linfomas tímicos.
A los pacientes WAS P5 y P7 de se les diagnosticó leucemia linfocítica aguda T (T-ALL) 36 y 37 meses, respectivamente, después de HSC GT. Los análisis previos de IS llevados a cabo mediante PCR mediada por amplificación lineal (LAM) y otras técnicas han mostrado que para P7 el clon leucémico estaba marcado por dos inserciones dirigidas a LMO2 y TAL1 (Figura 13A), mientras que para P5 el clon leucémico estaba marcado por nueve inserciones dirigidas a LMO2, TAL1, C11orf74, TMEM217, UBB, ST8SIA6, CPSF6, CD46 y RIN3 (Figura 11A). Para el WAS P7, los inventores analizaron el ADN genómico de las PBMC y el ADNlc recolectados 7 y 3 meses antes y en el momento del diagnóstico de leucemia. Los inventores recuperaron 24650 IS de PBMC y 2885 IS de ADNlc. Las inserciones yRV del clon leucémico se identificaron en PBMC y ADNlc con un bajo nivel de abundancia (<2 %) antes de la aparición de la leucemia, mientras que su abundancia alcanzó el 85 % y el 75 % respectivamente en el momento del diagnóstico (Figura 13B, 13C). Para el WAS P5 los inventores analizaron la PBMC y el plasma recolectados 10 meses antes y en el momento del diagnóstico de leucemia y una muestra adicional de plasma recolectada 6 meses antes de la aparición de la leucemia. De las PBMC de este paciente los inventores recuperaron >13000 IS, mientras que el ADNlc produjo >20000 IS (Figura 11B, 11C). Los IS del clon maligno se detectaron en muestras de PBMC y ADNlc. A los 10 meses de la aparición de la leucemia, el clon leucémico mostraba niveles bajos de abundancia (0,45 % en PBMC y 0,38 % en ADNlc), mientras que en el momento del diagnóstico de la leucemia la abundancia relativa del clon maligno alcanzó el 85 % en PBMC (de acuerdo con informes anteriores) y el -50 % en ADNlc (Figura 11B, 11C). Además, los inventores observaron que en ambos pacientes con WAS las cantidades de ADNlc por ml de plasma aumentaron progresivamente hasta alcanzar un máximo de 1200 ng/ml en P5 y 150 ng/ml en P7 en el momento del diagnóstico de leucemia (Figura 13D). Curiosamente, el aumento de las cantidades de ADNlc fue paralelo a una disminución del número de IS recuperadas por ng de ADNlc, lo que sugiere una reducción de la complejidad clonal de la población debida probablemente al crecimiento del clon maligno (Figura 13E).
Para investigar más a fondo el potencial de LiBIS-seq para detectar clones que se expanden en tejidos sólidos, los inventores aprovecharon un modelo de trasplante de HSC en ratones X-SCID, en donde ratones no condicionados infundidos con células linaje negativas (lin-) derivadas de BM de tipo silvestre (WT) desarrollan linfoma linfoblástico de células T a partir de las 20 semanas tras el trasplante y con una incidencia del 50 %. En este modelo, los progenitores de células T desarrollan espontáneamente mutaciones probablemente debido al estrés de replicación al que están sometidos en el nicho tímico vacío; los tumores se desarrollan dentro del timo y, en momentos posteriores, pueden infiltrarse en el hígado, la médula ósea, el bazo y la sangre periférica. Por lo tanto, los inventores investigaron si el seguimiento longitudinal de IS en el ADNlc plasmático de ratones X-SCID trasplantados con células Lin- marcadas con vectores permitiría detectar antes las expansiones linfomatosas en comparación con los estudios convencionales de IS derivados de células basados en PBMC. Un total de 10 ratones X-SCID fueron transplantados con 400000 células lin- derivadas de BM del grupo de diferenciación 45.1+ (CD45.1) transducidas con un SIN LV que expresaba GFP bajo el control del promotor PGK en posición interna (Figura 13F). Las inserciones de este LV no genotóxico no están implicadas en la transformación celular y actúan como marcador sustituto de la identidad y abundancia clonal. Tras el trasplante, se controló el estado de salud de los ratones y se les practicó la eutanasia si mostraban signos de enfermedad o a los 367 días, el final del experimento. De acuerdo con los resultados anteriores, seis ratones desarrollaron linfoma de células T a partir de los 200 a 250 días tras el trasplante (Figura 13G). Los análisis fenotípicos mostraron unos niveles de injerto de células CD45.1 que oscilaban entre el 20 y el 40 %, asociados a unos niveles de marcaje génico generalmente elevados (medidos como un 80-90 % de células GFP+) y prácticamente representados en su totalidad por células T Los análisis de IS se realizaron en ADN aislado de PBMC y ADNlc recolectado en diferentes momentos tras el trasplante, y de timo, BM y bazo recolectados en el momento de la eutanasia de 5 ratones, 3 de los cuales desarrollaron linfoma de células T A partir de los análisis de IS, observamos que en el timo de tres ratones que desarrollaron linfoma de células T (ID de ratón: A3, A4 y B1) de 2 a 6 IS tenían niveles de abundancia más elevados en comparación con otros IS, mientras que en los ratones que no desarrollaron linfoma de células T la abundancia de IS estaba distribuida de forma mucho más homogénea. En los 3 ratones que desarrollaron linfoma de células T, los IS con el mayor nivel de abundancia en el timo también se identificaron como los IS más abundantes en el ADNlc recolectado en los últimos puntos temporales a los 183/203 días, 27-45 días antes de que los síntomas se hicieran evidentes y llevaran a la eutanasia (Figura 13H, 13I). Por otro lado, los análisis de IS en PBMC no revelaron en su mayoría tales expansiones aberrantes, lo que demuestra que LiBIS-seq puede detectar de forma única clones que se expanden en tejidos sólidos. Los inventores investigaron además a un paciente X-SCID (P9) a quien se le diagnosticó un linfoma de células T de aparición tardía 178 meses después de la HSC-GT, cuando se detectaron nódulos subcutáneos y una masa mediastínica. Los IS recuperados de células blásticas leucémicas en los ganglios linfáticos y PBMC en el momento del diagnóstico habían mostrado previamente que el clon celular maligno estaba marcado por una única inserción yRV 30 kb cadena arriba de LMO2 (figura 14A) que alcanzaba una abundancia relativa del 96 % en los ganglios linfáticos y del 4 % en PBMC. Los inventores extrajeron el ADN celular y ADNlc de muestras de PBMC y plasma recolectadas 4 meses antes del diagnóstico de linfoma de células T, en el momento del diagnóstico y 2 meses después de la quimioterapia (180 meses después del trasplante). También se analizaron dos muestras de plasma no emparejadas recolectadas a los 185 y 195 meses después de la terapia. Se recuperaron IS de PBMC y se mapearon en el genoma humano dando lugar a 3136, 4132 y 1276 IS para cada punto temporal (Figura 14B, 14C). El yRV IS dirigido a LMO2 del clon maligno descrito anteriormente también se identificó mediante el método de recuperación de IS de los inventores en todos los puntos temporales analizados. De acuerdo con mediciones independientes anteriores, el nivel de abundancia del clon maligno en PBMC fue siempre bajo, con un pico máximo del 1,4 % en el momento del diagnóstico (178 meses). Por otro lado, los IS recuperados por LiBIS-seq en el ADNlc plasmático fueron de un mínimo de 261 a un máximo de 1129 para todos los puntos temporales analizados. El clon maligno yRV IS se recuperó del ADNlc con una abundancia relativa del 72 % y el 75 % 4 meses antes y en el momento del diagnóstico, respectivamente, y se volvió indetectable tras la quimioterapia (Figura 14B, 14C). El aumento de las cantidades de ADNlc que se observó antes del diagnóstico de leucemia se correspondió con una disminución de la cantidad de IS recuperada para ng de ADNlc, probablemente debido al crecimiento del clon maligno, y se recuperó después de la quimioterapia (Figura 14D, 14E). Del mismo modo, la cantidad de ADNlc disminuyó hasta niveles casi normales en el último punto temporal disponible y correspondiente a los 17 meses posteriores al diagnóstico.
Discusión
Los inventores han demostrado que el ADNlc derivado del plasma sanguíneo recolectado de pacientes con TG HSC y de modelos preclínicos de TG dirigidos al hígadoex vivoein vivocon LV o yRV puede explotarse eficazmente para recuperar el IS genómico del vector, un marcador genético específico para cada célula transducida y su progenie que se utiliza habitualmente para el seguimiento clonal y las evaluaciones de seguridad de la GT. Dado que en la tecnología LiBIS-seq los fragmentos de ADNlc sometidos a cizallamiento de forma natural que contienen las uniones vector-genoma celular se etiquetan molecularmente antes de la amplificación por PCR, el método garantiza una recuperación sensible y cuantitativa del IS del ADNlc evitando los sesgos derivados de la amplificación exponencial.
La ventaja prevista al utilizar LiBIS-seq es que, en comparación con otros enfoques basados en el ADN genómico obtenido a partir de células circulantes o de pequeñas biopsias de tejidos, el ADNlc producido por células moribundas que residen en diferentes tejidos proporciona información sobre los clones marcados por vectores que residen en órganos sólidos. Mediante este enfoque se puede ampliar el repertorio de células transducidas interrogado en la GT de CMHex vivoy realizar estudios de seguimiento clonal longitudinal también en aplicaciones de GTin vivo,evitando la necesidad de biopsias invasivas en serie y obteniendo una imagen más completa del órgano transducido. De hecho, la estrategia LiBIS-seq aplicada sobre ADNlc de 7 pacientes con HSC GT MLD permitió la recuperación de varios miles de vectores IS a partir de un solo ml de plasma sanguíneo, números comparables o incluso superiores a los recuperados mediante LAM-PCR realizada sobre muestras de ADN de poblaciones de células sanguíneas enteras o clasificadas por linaje. Las preferencias de integración genómica y los análisis de abundancia clonal del IS derivado del ADNlc recapitularon la elevada policlonalidad y el perfil de seguridad positivo de las células modificadas genéticamente por el LV observados en este estudio y en otros anteriores en los que se utilizó ADN de células sanguíneas circulantes. Aproximadamente el 30% de los IS derivados del ADNIc se compartieron con los identificados en el ADN de células sanguíneas de pacientes con MLD, lo que indica que el enfoque de PCR de los inventores capturó al menos en parte los mismos IS obtenidos con otros métodos, incluyendo la PCR<l>A<m>y las técnicas basadas en la sonicación para la recuperación de IS. Mientras que los IS restantes podrían no haber sido captados previamente en células sanguíneas debido a la escasez de muestreo, los inventores también plantean la hipótesis de que una fracción de ellos podría derivar de clones de células marcadas con vectores incrustados en lugares extravasculares y órganos sólidos. Esta hipótesis se ve respaldada por el seguimiento satisfactorio de la LV IS en el ADNlc derivado del suero de tres perros tratados mediante GT dirigida al hígado. De cada perro, a pesar del bajo nivel de marcaje vectorial registrado en el tejido hepático muestreado, pudimos recuperar un número de IS que oscilaba entre 147 y 9.730 IS en 7-8 puntos temporales repartidos a lo largo de 500 días de seguimiento. La diferente cantidad global de IS recuperada de cada perro podría estar relacionada con los diferentes niveles de transducción del tejido original, ya que el número medio de SI recuperados a lo largo de los puntos temporales y dentro del mismo animal fueron comparables y no se correlacionaron con la cantidad de ADNlc producida por cada perro, la cantidad de ADNlc utilizada para la amplificación por PCR ni con el nivel de IS recolectado de la muestra de tejido hepático. En comparación con los IS recolectados a partir de ADNlc de pacientes con MLD HSC-GT, cada IS derivado de ADNlc de perros estaba representado por un número mucho menor de genomas, reflejando así la transducción original de un elevado número de células residentes hepáticas que se regeneran lentamente en los individuos adultos en comparación con las células hematopoyéticas. Curiosamente, una fracción del ADNlc IS (-10-20% IS total) se capturó repetidamente a lo largo de diferentes puntos temporales, lo que indica la existencia de una población celular longeva y de rotación lenta que oscila entre 5.000 y 10.000 clones celulares marcados por vectores. Basándose en estudios previos de distribución de LV, se espera que los hepatocitos, las células endoteliales sinusoidales hepáticas y las células de Kupffer sean todos contribuyentes potenciales al IS de ADNlc, ya que estos tipos celulares representan poblaciones celulares abundantes en el hígado, son transducidas por LV pseudotipados de proteína G del virus de la estomatitis vesicular (VSV-G) administrados por vía intravenosa, son de larga vida y están dotados de cierta capacidad de autorrenovación en condiciones homeostáticas y patológicas, como en caso de daño hepático en el que se requieren tasas de proliferación elevadas para apoyar el proceso de regeneración. El enfoque molecular de los inventores puede ayudar a descubrir la dinámica de las células hepáticas en individuos tratados con GT al proporcionar un muestreo más exhaustivo del órgano transducido en comparación con los análisis de IS realizados en biopsias sólidas que sólo representan una porción pequeña y local del órgano.
La LiBIS-seq también puede detectar la aparición y medir la abundancia relativa de clones malignos desencadenados por mutagénesis insercional. De hecho, los inventores demostraron que en el ADNlc de dos pacientes con WAS que experimentaron tales acontecimientos adversos la abundancia clonal de IS específicos para clones pre- y leucémicos estaba en consonancia con las estimaciones realizadas en el ADN genómico de células sanguíneas con múltiples métodos de última generación para la recuperación cuantitativa o semicuantitativa de IS, incluyendo la PCR de amplificación lineal mediada (LAM) no restrictiva y la secuenciación de enriquecimiento dirigida. Es importante destacar que LiBIS-seq permitió una detección y cuantificación más sensibles de células malignas marcadas que se expandían en el timo y que, en cambio, eran apenas detectables por los análisis de IS convencionales realizados en células circulantes. Por ejemplo, en el paciente P9 del ensayo clínico X-SCID GT el análisis de IS en PBMC mostró que un clon premaligno portador de un IS LMO2 estuvo por debajo del 2 % de abundancia durante 15 años, e incluso en el momento del diagnóstico el clon linfomatoso apenas circulaba y sólo representaba el 4 % de las células T corregidas genéticamente. En cambio, la cuantificación del clon maligno en el ADNlc cuatro meses antes del diagnóstico ya mostraba un nivel muy elevado (72 %) en comparación con el medido en el ADN de las PBMC (0,4 %). Esta discrepancia puede explicarse por la biología de la enfermedad de la paciente, un linfoma localizado en el timo que no circulaba. Mediante LiBIS-seq los inventores también pudieron apreciar una fuerte reducción del clon maligno IS tras la quimioterapia, lo que indica que el análisis del ADNlc reflejaba fielmente la respuesta terapéutica al tratamiento. Utilizando este enfoque, los inventores también pudieron predecir la aparición de linfomas en un modelo de ratón de X-SCID GT. Por lo tanto, LiBIS-seq aumenta el potencial predictivo de los estudios de IS realizados en células sanguíneas circulantes que, en algunos casos, no fueron capaces de predecir la aparición de proliferaciones malignas que finalmente aparecieron de forma abrupta pero que probablemente tardaron años en desarrollarse. Sin embargo, es importante señalar que la identificación de IS dominantes, incluso cuando se mantiene a lo largo del tiempo, no representaper seuna prueba clínica de cáncer, ni justifica una intervención terapéutica. No obstante, la detección precoz de estos clones potencialmente peligrosos puede repercutir positivamente en la práctica clínica al propiciar una investigación clínica más profunda dirigida a la detección precoz de células malignas o masas tumorales, y un seguimiento sensible de la eficacia del tratamiento o la recaída. Dado que en el diagnóstico del cáncer la secuenciación del ADNlc ha permitido identificar variantes de riesgo del ADN procedentes de células pre- o malignas residentes en diversos tejidos sólidos, tales como el hígado, el tracto gastrointestinal, la mama, el pulmón, LiBIS-seq podría revelar potencialmente expansiones clonales aberrantes que se producen en órganos distintos del timo.
Además de la recuperación del IS, los inventores descubrieron que en muchos pacientes con MLD la cantidad de ADNlc por ml de plasma sanguíneo estaba por encima de los niveles patológicos de 10 ng/ml antes de HSC-GT y en las primeras fases tras el trasplante, mientras que disminuía significativamente tras la repoblación hematopoyética estable. La única excepción fue MLD04, para quien el procedimiento de GT no fue eficaz/curativo y se caracterizó constantemente por niveles patológicos de concentraciones de ADNlc. Se han descrito niveles elevados de ADNlc en el cáncer, el envejecimiento y las infecciones, así como en varias otras condiciones de enfermedad asociadas a la inflamación. Es posible que los altos niveles de ADNlc observados antes del trasplante se debieran al trastorno neurodegenerativo emergente por almacenamiento lisosómico, que puede repercutir en las rutas celulares asociadas al control de la muerte y la proliferación celular. Tras el TCH-G, los efectos residuales del tratamiento mieloablativo y el rápido recambio de células progenitoras que se produce en las primeras fases de la reconstitución hematopoyética podrían contribuir al aumento de los niveles de ADNlc. La reducción progresiva de la concentración de ADNlc en puntos temporales posteriores puede reflejar, por el contrario, el resultado terapéutico positivo logrado en los distintos tejidos por la HSC-GT. Por lo tanto, estos datos preliminares sugieren que los niveles de ADNlc podrían utilizarse como biomarcador sustituto de la eficacia del tratamiento con GT en este trastorno por almacenamiento lisosómico, ya que refleja la cantidad de células que mueren en un momento dado como resultado de la acumulación de compuestos lisosómicos tóxicos. La cantidad de ADNlc en el plasma sanguíneo estaba por encima de los niveles patológicos también en los pacientes WAS y X-SCID que desarrollaron leucemia y linfoma respectivamente, y disminuyó tras la quimioterapia en el paciente X-SCID reflejando lo ya descrito en pacientes con cáncer. Es importante señalar que, en todos estos casos, la cantidad de ADNlc no influyó en el número de IS recuperados ni en el nivel de abundancia clonal. De hecho, se observó una reducción de la cantidad de IS recuperados por ng de ADNlc con el crecimiento del clon maligno y sólo los IS de los clones de células en expansión estaban representados por un mayor número de genomas (rango: 250-2.000) en comparación con el resto de eventos de inserción “neutros”.
En conclusión, el análisis del ADNlc mediante LiBIS-seq permite estudiar el repertorio clonal, el recambio y la persistencia de miles de clones, cada uno caracterizado por un IS específico, en modelos animales y pacientes sometidos a GTin vivooex vivosuperando las limitaciones del análisis de IS realizado en biopsias sólidas. Más allá de los aspectos de seguridad, la posibilidad de rastrear y cuantificar simultáneamente en el ADNlc de cientos a miles de clones que residen en los órganos del cuerpo desde las fases tempranas a las tardías tras la terapia génica permite explorar las propiedades biológicas básicas del recambio tisular durante la regeneración, la homeostasis y los diferentes resultados de la terapia.
Materiales y métodos
Diseño y pacientes del estudio
Este estudio se realizó utilizando muestras (PBMC y plasma) obtenidas de 7 pacientes diagnosticados con MLD y que se sometieron a una HSC-GT por LV (Biffi, A. et al. (2013) Science 1233158; Sessa, M. et al. (2016) Lancet 388: 476-487). El ensayo HSC-GT basado en LV para MLD está registrado (NCT01560182) y aprobado por el Istituto Superiore di Sanita, el Comité Ético del San Raffaele y por la Agenzia Italiana del Farmaco. El medicamento recibió la designación de medicamento huérfano (EMEA/OD/102/06) por parte de la Agencia Europea del Medicamento (EMA, por sus siglas en inglés) para el tratamiento de MLD.
Se obtuvieron muestras de PBMC y plasma de 2 pacientes diagnosticados con WAS y que se sometieron a una HSC-GT basada en<y>RV (Braun, C. J. et al. (2014) Sci Transl Med 6: 227ra233; Braun, C. J. et al. (2014) Rare Dis 2: e947749). El ensayo está inscrito en el Registro Alemán de Ensayos Clínicos (DRKS00000330), y el protocolo de GT clínico fue revisado y aprobado por los Comités Éticos de la Facultad de Medicina de Hannover y de la Universidad Ludwig Maximilian de Múnich.
Las muestras de PBMC y plasma se obtuvieron del paciente P9 inscrito en el ensayo de terapia génica SCID-X1 basado en yRV inducido por LTR realizado entre 1999 y 2002 en el Hospital francés Necker-Enfants Malades, París. El ensayo de terapia génica<yc>en el Hopital Necker-Enfants Malades, París (Hacein-Bey-Abina, S. et al. (2010) N Engl J Med 363: 355-364). Este paciente P9 fue informado previamente como P8 en nuestras publicaciones (Hacein-Bey-Abina, S. et al. NEJM (2010) y Wang, G.P. et al. Blood (2010)). El protocolo se registró con la referencia local P971001, aprobada por la autoridad competente francesa (AFSSAPS) y el Comité de Ética local (Comité de protection des personnes de Hopital Cochin,París, Francia).
Para cada paciente, se obtuvo el consentimiento informado por escrito de los padres o tutores de los pacientes.
Experimentos con perros
Los perros con hemofilia B se mantuvieron en el Laboratorio de Investigación Sanguínea Francis Owen, que se encarga de la cría, el parto, el alojamiento, el tratamiento y la realización de los experimentos con los perrosin situ.Todos los procedimientos con animales se realizaron según protocolos específicos descritos (Cantore, A. et al. (2015) Sci Transl Med 7: 277ra228).
Purificación del ADNlc de BP
Dependiendo de la cantidad inicial de plasma o suero disponible, se han adoptado diferentes kits para la purificación del ADN circulante: cuando se dispone de 2 a 5 ml de plasma o suero, se adopta el kit QIAamp de ácido nucleico circulante (55114, QIAGEN), cuando se disponía de menos de 2 ml de plasma o suero se utiliza el kit Maxwell RSC ccfDNA Plasma (AS1480, Promega). En ambos casos, la purificación se realiza siguiendo las instrucciones del fabricante. Tras la purificación, el ADN libre de células se cuantifica inmediatamente y se somete al procedimiento de LiBIS-seq.
LiBIS-seq: Recuperación de IS circulantes a partir de ADN libre de células
Tras la purificación, el ADN libre de células se dividió en 2 réplicas técnicas, se sometió a reparación de extremos y 3'adenilación utilizando el kit NEBNext® Ultra™ DNA Library Prep Kit para Illumina® (New England Biolabs, Ipswich, MA.) y, a continuación, se ligó (kit de ligación de DNA Technologies, Skokie, IL.) a casetes enlazadores (LC) que contenían: i) un código de barras de secuencia de 8 nucleótidos, utilizado para la identificación de la muestra, ii) una secuencia de 12 nucleótidos aleatorios, utilizada con fines de cuantificación, y iii) todas las secuencias necesarias para la secuenciación de extremo pareado Lectura 2 Illumina, rastreadas dentro de la gestión de la información de nuestro laboratorio. A continuación, los productos de ligación se sometieron a 35 ciclos de PCR exponencial con cebadores complementarios de LV LTR o RV<l>T<r>y el LC, después se realizaron diez ciclos de PCR adicionales para añadir las secuencias necesarias para la secuenciación y un segundo código de barras de ADN de 8 nucleótidos. Por último, los productos de amplificación se secuenciaron utilizando la plataforma Illumina Myseq/HiSeq (Illumina, San Diego, CA.).
Recuperación de IS del ADN celular
Para la recuperación del IS del vector a partir del ADN genómico, adoptamos un método de PCR mediada por enlazador (LM) basado en la sonicación descrito previamente (Firouzi, S. et al. (2014) Genome Med 6: 46; Gillet, N. A. et al. (20110 Blood 117: 3113-3122). Brevemente, el ADN genómico se cizalló utilizando un ultrasonicador Covaris E220 (Covaris Inc., Woburn (MA), generando fragmentos con un tamaño medio de 1000 pb. A continuación, el ADN fragmentado se dividió en 3 réplicas técnicas y se sometió a reparación de extremos y adenilación en 3' utilizando el kit NEBNext® Ultra™ DNA Library Prep Kit para Illumina® (New England Biolabs, Ipswich, MA.), y después se ligó (kit de ligación de DNA Technologies, Skokie, IL.) a los mismos casetes enlazadores (LC) descritos anteriormente. El procedimiento PCR aplicado para la recuperación y el mapeo del IS es igual al descrito anteriormente.
Análisis bioinformático
A continuación, las lecturas de secuenciación se procesaron mediante una línea de bioinformática específica (VISPA2), como se ha descrito previamente (Spinozzi, G. et al. (2017) BMC Bioinformatics 18: 520). Brevemente, se filtraron las lecturas de secuencias emparejadas para los estándares de calidad, se identificaron los códigos de barras para el demultiplexado de la muestra de las lecturas de secuencias, se mapeó la secuencia genómica celular en el genoma de referencia humano (Human Genome_GRCh37/hg19 Feb. 2019), de perro (Broad CanFam3.1/canFam3) o de ratón (Mouse Genome_mm9)y se asignó el gen RefSeq más cercano a cada sitio de integración (IS) mapeado sin ambigüedades. Para la cuantificación de la abundancia de cada clon adoptamos un método de estimación descrito previamente (Firouzi, S. et al. (2014) Genome Med 6: 46; Gillet, N. A. et al. (2011) Blood 117: 3113-3122; Berry, C. C. et al. (2012) Bioinformatics 28: 755-762), en donde la abundancia viene determinada por el número de fragmentos de ADN diferentes que contienen las mismas uniones vector/genoma celular flanqueadas por un segmento genómico de tamaño variable en función de la posición del sitio de cizallamiento y que será único para cada genoma celular diferente presente en la población celular de partida. Por lo tanto, el número de sitios de cizallamiento diferentes asignados a un IS será proporcional al número inicial de células contribuyentes, lo que permite estimar la abundancia clonal en la muestra de partida evitando los sesgos introducidos por la amplificación por PCR.
A continuación se proporcionan más detalles.
Caracterización molecular de los productos de PCR obtenidos por LiBIS-seq
Como se ha descrito anteriormente, los productos PCR obtenidos por LiBIS-seq se secuenciaron utilizando una plataforma Illumina. A continuación, las lecturas de secuenciación se procesaron con VISPA2 (Spinozzi, G., et al. (2017) BMC Bioinformatics 18: 520), una canalización bioinformática específica desarrollada para identificar correctamente los IS a partir de una biblioteca de secuenciación de fragmentos de PCR que contienen uniones de genomas de vectores. VISPA2 aísla las secuencias genómicas que flanquean las secuencias<l>T<r>del vector y las mapea en el genoma de referencia, conservando sólo los alineamientos con un puntaje de coincidencia del 98 %. Para cuantificar los artefactos de PCR quiméricos dentro de nuestras bibliotecas de secuenciación de fragmentos IS, analizamos las secuencias descartadas por VISPA2 contabilizando el nivel global de fragmentos quiméricos cuyos extremos se mapeaban en cromosomas distintos, no estaban correctamente emparejados (orientación incorrecta) o se mapeaban demasiado lejos uno del otro (>1200 pb). Mediante este análisis, descubrimos que el número medio de artefactos quiméricos es del 1,28 % en los conjuntos de datos derivados de células y del 1,56 % en los conjuntos de datos de ADNlc (véase la Tabla 4).
Tabla 4.Tabla detallada de lecturas de secuenciación por pares mapeadas y abundancia de fragmentos quiméricos. Cada fila de la tabla contiene detalles de una muestra<p>C<r>diferente relacionada con un ensayo clínico (columna “Proyecto”), recolectada en una fuente (columna “Fuente”, Plasma o Células), con un identificador personalizado (columna “ID”), y muestra la cantidad de fragmentos PCR identificados y mapeados LTR (columna “Fragmentos ma eados” la cantidad de “Fra mentos uiméricos” como número o lecturas orcentae.
Aunque estos artefactos PCR quiméricos son eliminados completamente por VISPA2 a lo largo del proceso de identificación de IS, no puede excluirse que otro conjunto de artefactos PCR escape a los estrictos filtros aplicados. Sin embargo, el bajo porcentaje de artefactos PCR quiméricos observado en ambos tipos de conjunto de datos IS permite concluir que los artefactos PCR no tuvieron impacto en el análisis.
Además, teniendo en cuenta que la cantidad de ADNlc obtenida de los diferentes modelos animales y de los pacientes era muy variable, desde unos pocos ng/ml hasta >1ug/ml en los pacientes que desarrollaron cáncer, los inventores evaluaron si la diferente cantidad de ADNlc utilizada para la recuperación del IS podría haber influido en la diversidad de la distribución y la abundancia del tamaño de los fragmentos. El índice de diversidad de Shannon (índice H) se ha utilizado como medida matemática de la diversidad de las longitudes de los fragmentos amplificados por PCR, equilibrando el número de fragmentos diferentes en cada muestra y su abundancia (Haegeman, B. et al. (2013) ISME J 71092-101). De hecho, el índice H se ha calculado para cada muestra y se ha agrupado por intervalos en función de las cantidades de ADNlc utilizadas para la recuperación del IS (0-20; 20-50; 50-100; 100-500 ng). No se ha observado ninguna diferencia estadísticamente significativa entre las muestras (entre todas las muestras se utilizó la prueba no paramétrica de Kruskal-Wallis; entre cada par de muestras los inventores utilizaron la prueba no paramétrica de Mann-Withney), por lo que sus resultados mostraron que la cantidad de ADNlc no influía en la diversidad de tamaños de los fragmentos (Figura 15).
Cuantificación de la abundancia mediante SonicLength
Para estimar la abundancia de cada IS recuperado por genoma o ADNlc, los inventores adoptaron el enfoque de estimación de fragmentos presentado por Berry et al. (Berry, C.C. (2012) Bioinformatics 28: 755-62) e implementado en el paquete R “SonicLength”. "SonicLength” implementa un modelo matemático que estima el número de genomas/fragmentos por IS a partir de la distribución de las longitudes de fragmento observadas. Este método permite corregir la saturación del sitio de cizallamiento, evento que puede tener un gran impacto en la cuantificación de clones muy abundantes (tales como los clones en expansión), ya que en estos casos múltiples fragmentos de ADN fuente independientes pueden compartir el mismo sitio de cizallamiento por IS. Basándose en lo anterior, “SonicLength” devuelve la estimación de los clones observados y esta estimación podría ser mucho mayor que el número de sitios de cizallamiento distintos observados. Por esta razón, la abundancia de ISs de los clones malignos de los pacientes WAS y X-SCID estaba representada por menos de 300 fragmentos observados cuya abundancia estimada aumentó a >2000 fragmentos en algunos casos (Figura 16). En todos los demás casos, el número de fragmentos observados para cada IS fue inferior a 100 con un número muy similar de fragmentos estimados, lo que refleja la diferente tasa de recambio del clon celular parental.
La precisión y el límite de detección de LiBIS-Seq se comparan bien con los resultados obtenidos por nuestros métodos de vanguardia y los de otros para la recuperación de IS basados en ADN extraído de células sanguíneas. De hecho, para P5 y P7 del ensayo WAS analizado en este estudio, las abundancias estimadas de IS derivadas de clones pre- y leucémicos en el ADNlc antes y después del diagnóstico coincidieron con las abundancias calculadas por nuestro método de recuperación de IS basado en ADN genómico purificado a partir de células sanguíneas y con las obtenidas por otros con múltiples métodos de vanguardia para la recuperación cuantitativa o semicuantitativa de IS, incluyendo la amplificación lineal mediada (LAM) - PCR no restrictiva (nr) LAM-PCR y la secuenciación de enriquecimiento dirigida (Braun, C.J. et al. (2014) Science Translational Medicine 6: 227ra33). En la misma línea, para P9 del ensayo clínico X-SCID GT, la cuantificación LiBIS-seq del IS que albergaba la inserción yRV cerca de LMO2 en el momento previo al diagnóstico fue sorprendentemente alta en comparación con los otros métodos basados en ADN genómico purificado a partir de células sanguíneas. Esta discrepancia puede explicarse por la biología de la enfermedad de la paciente, ya que en este caso el linfoma se localizó en el timo y no circula, lo que limita su identificación mediante análisis convencionales de IS en células sanguíneas. Sin embargo, demostramos que su nivel de abundancia en la sangre en el momento del diagnóstico y cuantificado mediante nuestros enfoques de PCR basados en la sonicación sobre ADN derivado de células encajaba perfectamente con los niveles medidos por otros mediante el enfoque de PCR en tiempo real. Por último, LiBIS-seq permite detectar la fuerte reducción de la abundancia del clon maligno tras la quimioterapia, lo que indica que nuestros métodos de cuantificación reflejan una respuesta terapéutica al tratamiento.
Linfoma linfoblástico de células T en ratones X-SCID no condicionados trasplantados con células WT lin-
Todos los procedimientos con animales se realizaron de acuerdo con protocolos aprobados por el Comité de Cuidado y Uso de Animales del Instituto San Raffaele (IACUC 817) y comunicados al Ministerio de Sanidad y a las autoridades locales de acuerdo con la legislación italiana. Todos los ratones fueron criados y mantenidos en una instalación dedicada a animales libres de patógenos, y se les aplicó la eutanasia cuando mostraron signos de enfermedad grave. El modeloin vivoque permite el desarrollo de linfoma linfoblástico de células T en ratones X-SCID no condicionados trasplantados con células Wt lin- se describe en Schiroli, G. et al. (2017) La modelización preclínica pone de relieve el potencial terapéutico de la edición génica de células madre hematopoyéticas para la corrección de SCID-X1 Sci Transl Med 9. Brevemente, a los ratones donantes C57BL/6-Ly5.1 de entre 6 y 10 semanas de edad se les practicó la eutanasia con CO<2>y se extrajeron células BM de fémures, tibias y húmeros. Las HSPC se purificaron mediante selección de Lin utilizando el kit de agotamiento de células de linaje de ratón (Miltenyi Biotec) de acuerdo con las instrucciones del fabricante. A continuación, las células se cultivaron en medio StemSpan sin suero (StemCell Technologies) que contenía penicilina, estreptomicina, glutamina y una combinación de citoquinas de ratón (20 ng/ml de IL-3, 100 ng/ml de SCF, 100 ng/ml de Flt-3L, 50 ng/ml de TPO, todas ellas de Peprotech), a una concentración de106 células/ml. Las células lin- se preestimularon durante 2-3 horas y después se infectaron con el SINLV.PGK.GFP a una MOI de 50/100 (Cesana, D. et al. (2014) Mol Ther 22: 774 785). 16 horas después de la infección se lavaron las células y se inyectaron 400000 células Lin- derivadas de BM CD45.1 en ratones X-SCID receptores no condicionados. Tras el trasplante, se controló el estado de salud de los ratones y se les practicó la eutanasia si mostraban signos de enfermedad o a los 367 días, el final de los experimentos. Se recolectaron PBMC y BP en diferentes momentos tras el trasplante, mientras que los tejidos del timo BM y del bazo se recolectaron en el momento de la eutanasia para realizar análisis fenotípicos y de rastreo clonal. El análisis FACS se realizó utilizando anticuerpos específicos de linaje contra CD45.1 (clon A20 Biolegend), CD45.2 (clon 104 Biolegend), CD19 (clon 6D5 Biolegend), CD3e (clon 145-2C11 BD), CD4 (clon RM4-5 BD) and CD8a (clon 53-6.7 eBioscience) de acuerdo con las instrucciones del fabricante.
Análisis estadístico
Los análisis estadísticos se realizaron como se indica y utilizando el software GraphPad Prism 8.0. La significación estadística para cada CIS se estableció utilizando la prueba de Grubbs para valores atípicos, como se describió anteriormente (Aiuti, A. et al. (2013) Science 1233151; Biffi, A. et al. (2013) Science 1233158; Biffi, A. et al. (2011) Blood 117: 5332-5339). Los análisis de enriquecimiento de la ontología génica se realizaron utilizando el software Great (http://great.stanford.edu/public/html) f para el conjunto de datos IS de MLD y el software DAVID EASE (https://david.ncifcrf.gov/) para el conjunto de datos IS de perros. En general, sólo se consideraron significativas las clases de la ontología génica del sistema de componentes celulares, procesos biológicos y funciones moleculares que tuvieran un puntaje de enriquecimiento de plegamiento superior a 2. Se han utilizado PRISM y R como software estadístico (paquete Vegan y R-capture para los modelos Mark-recapture).
Estimadores del tamaño de la población
Los estimadores del tamaño de la población se han desarrollado en ecología para resolver el problema de estimar el número de especies de una población en un entorno específico dado el muestreo repetido de animales sin observar todos los animales diferentes existentes (Chao, A. et al. (2001) Stat Med 20: 3123-57; Chao, A. (1987) Biometrics 43: 783-91). En terapia génica, los estimadores del tamaño de la población, tales como los modelos Chao o Petersen-Schnabel (Schnabel, Z.E. (1938) The American Mathematical Monthly 45: 348-352), se han utilizado ampliamente para estimar el número de HSC repobladoras activas como estimación del límite inferior del tamaño de la población. Los modelos citados se basan en métodos de captura-recaptura, que son capaces de estimar el tamaño global de la población aprovechando el muestreo repetido (a lo largo del tiempo y/o en diferentes lugares) de elementos marcados (animales o células) y contabilizando el número de elementos compartidos entre los muéstreos.
Además, para tener en cuenta cualquier sesgo potencial en el tamaño clonal (heterogeneidad) que pudiera afectar a la probabilidad de capturar elementos, a la dinámica clonal y a la variabilidad temporal, utilizamos el modelo Chao para la corrección de sesgos. Todas las estimaciones se han realizado en R utilizando el paquete Rcapture (http://cran.rproject.org/web/packages/Rcapture).
Ejemplo 3
Los vectores AAV son capaces de introducir con eficacia transgenes terapéuticos en millones de células somáticas directamente dentro de los órganos de los pacientes y, por este motivo, se han explotado con éxito en la Terapia Génica (GT) clínica para tratar trastornos de la coagulación, ceguera hereditaria y enfermedades neurodegenerativas. Los genomas de los AAV pueden permanecer en estado episomal dentro del núcleo de las células transducidas durante largo tiempo y someterse a eventos de recombinación intramolecular e intermolecular que dan lugar a la generación de círculos monoméricos o moléculas concatenadas con estructuras diferentes o incluso integrarse en el genoma de la célula hospedera, aunque con baja frecuencia. Varios estudios preclínicos y clínicos destinados a abordar la seguridad de las integraciones de AAV han mostrado un buen perfil de seguridad. A pesar de los resultados positivos en materia de seguridad, el hallazgo de que el AAV es capaz de integrarse en el genoma de la célula hospedera plantea problemas de seguridad, ya que una sola administración sistémica intravenosa de AAV puede dar lugar fácilmente a la transducción de cientos de millones de células hepáticas, por lo que, aunque la frecuencia de integración sea baja, un número relevante de células albergará inserciones de AAV. Estas inserciones pueden ser genotóxicas, como demuestran varios estudios preclínicos de seguridad, en donde animales tratados con dosis elevadas de AAV desarrollaron carcinoma hepatocelular como resultado de la mutagénesis insercional, que también dependía del diseño de la cadena principal y de la sensibilidad del modelo de enfermedad.
Por lo tanto, las preocupaciones de mutagénesis insercional en ensayos clínicos de GT basados en células madre hematopoyéticas retrovirales podrían representar también una preocupación para las aplicaciones de GT con AAV.
Los eventos adversos graves observados en ensayos previos de GT con<y>RV, han impulsado la adopción de tecnologías moleculares que permiten la detección y cuantificación de clones celulares con inserciones vectoriales presentes en los órganos/tejidos transducidos de sujetos procedentes de aplicaciones preclínicas y clínicas de GT. Para ello, se han ideado protocolos de PCR especializados para amplificar porciones genómicas celulares que flanquean el vector integrado y que, tras la secuenciación, se mapean en el genoma celular. Dado que los IS de los vectores son distintivos específicos de la identidad clonal, el análisis de los sitios de integración permite: A) Evaluar la clonalidad del injerto y la dinámica de la reconstitución hematopoyética; B) Cuantificar la abundancia de cada clon para detectar o excluir expansiones clonales sostenidas; C) Identificar los genes objetivo de las integraciones vectoriales.
Se han desarrollado métodos actuales de PCR para la recuperación de AAV IS, aunque el uso de enzimas de restricción como método de fragmentación del ADN genómico induce sesgos y dificulta la detección y cuantificación correcta de AAV IS. Además, dado que la integración del genoma AAV en el genoma de la célula hospedera también puede producirse a partir de fragmentos internos del vector, es necesario “escanear” todo el genoma del vector para recuperar los sitios de inserción, lo que aumenta la complejidad de los procedimientos y análisis y reduce el poder predictivo de los análisis de IS para este vector. Existe un límite más relevante de los análisis IS cuando se aplican para predicciones de seguridad en aplicaciones GTin vivo.De hecho, cuando se transducen tejidos sólidos, tales como el hígado o el músculo cerebral, la determinación del nivel de marcaje del órgano objetivo o la recuperación del vector IS deben realizarse a partir de ADN purificado de biopsias de tejido, que son arriesgadas, invasivas y sólo proporcionan información para una porción pequeña y espacialmente limitada del órgano transducido. Además, los riesgos asociados al procedimiento de extracción de tejidos limitan la posibilidad de realizar biopsias repetidas en el tiempo para estudios longitudinales.
Resultados
Para probar la capacidad de LiBIS-seq de recuperar AAV IS a partir de ADNlc, los inventores aprovecharon un modelo de terapia génicain vivoen ratones, en el que se inyectó intratímicamente a ratones inmunodeficientes ZAP70 inactivados un vector AAV8 que expresaba el transgén terapéutico bajo el control de un promotor PGK (Pouzolles, M., et al. (2019) La transferencia intratímica de genes AAV restaura rápidamente la función tímica y la persistencia a largo plazo de las células T corregidas genéticamente. The Journal of Allergy and Clinical Immunology). Para explorar el genoma del vector en busca de eventos de recombinación, los inventores multiplexaron el protocolo de PCR para amplificar diferentes porciones flanqueantes del genoma AAV (Figura 17A). La eficacia de los diferentes sistemas de oligo PCR en la recuperación de AAV IS se evaluó en primer lugar en muestras de ADN genómico obtenidas de células T maduras derivadas de ganglios linfáticos y de tejido hepático mediante el protocolo PCR mediado por sonicación y enlazador (SLiM) (Marktel, S. et al. (2019) Nat Med 25234-241; Sessa, M. et al. (2016) Lancet 388: 476-487; Firouzi, S. et al. (2014) Genome medicine 6: 46; Gillet, N.A. et al. (2011) Blood 117: 3113-22). El protocolo SLiM PCR “adaptado a AAV” permitió la recuperación de 829 y 546 AAV IS a partir de ADN de ganglios linfáticos y de hígado, respectivamente, recolectados de 8 ratones inyectados diferentes (Figura 17B). Dados estos resultados, los inventores purificaron el ADNlc de muestras de plasma recolectadas en dos puntos temporales consecutivos de 9 ratones diferentes y realizamos la LiBIS-seq utilizando el mismo oligo-sistema de PCR adoptado anteriormente. En 5 casos, el ADNlc se amplificó antes del procedimiento de LiBIS-seq para aumentar la cantidad de material disponible (indicado posteriormente como ADNIc-RG). Mediante LiBIS-seq, pudimos recolectar 207 AAV IS de ADNlc y 16055 A<a>V IS de ADNlc-RG (Figura 17B). Curiosamente, el 16 % (rango: del 2 al 38 %) de los AAV IS recuperados de diferentes fuentes fueron identificados por múltiples sistemas de PCR, y 9 AAV IS fueron compartidos entre los AAV IS recuperados en el ganglio linfático y el hígado del mismo ratón 104, lo que pone de manifiesto la fiabilidad del enfoque de PCR adoptado y el tráfico de células T corregidas entre diferentes tejidos. Además, el 20 % de los AAV IS observados en el conjunto de datos de LN y ADNlc estaban representados por un elevado número de genomas (>10 genomas/fragmentos, Figura 18B), en consonancia con la elevada capacidad proliferativa de la célula objetivo. No se observaron clones dominantes en ningún ratón entre los diferentes tejidos (Figura 18C). Por último, observamos que los AAV IS recuperados de células T maduras derivadas de ganglios linfáticos mostraban un fuerte sesgo hacia genes de receptores de células T objetivo, potencialmente en regiones sometidas a reordenamientos de genes TCR mediados por recombinasas RAG. Este enriquecimiento puede explicarse por el atrapamiento del genoma del vector AAV en las roturas naturales de doble cadena que se forman en el timo por la enzima RAG durante el proceso de maduración de las células T De hecho, Tcra es el gen Tcr más objetivo en todo el conjunto de datos de AAV diferentes (Figura 18D, 18E), confirmando así la especificidad de nuestro protocolo de PCR y la capacidad de LiBIS-seq para recuperar eficientemente AAV IS en un contexto de terapia génicain vivo.Además, varios<a>A<v>IS dirigidos a los genes Tcra estaban representados por múltiples genomas, lo que indica que los AAV IS se heredan de forma estable tras la replicación celular y excluye así que la inserción pudiera haberse producido exclusivamente en los círculos de escisión del receptor de células T (TREC, por sus siglas en inglés), subproductos episomales de la recombinación TCR que no tienen propiedades de autorreplicación (Figura 18F).
Por lo tanto, la tecnología de los inventores permite superar las limitaciones impuestas por el estudio de biopsias sólidas necesarias para los análisis de IS y las predicciones de seguridad en aplicaciones de GTin vivo.La seguridad y la persistencia del vector en pacientes con GT tratados con vectores AAV pueden ahora monitorizarse longitudinalmente mediante LiBIS-seq en biopsias líquidas en lugar de sólidas, evitando el uso de biopsias arriesgadas e invasivas, proporcionando una imagen más completa del órgano transducido y abriendo la puerta a estudios longitudinales de seguimiento clonal también para aplicaciones de GTin vivo.

Claims (15)

REIVINDICACIONES
1. Un método para analizar los sitios de inserción de una secuencia de nucleótidos exógena en el genoma de un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada del sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto;
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción; y
(e) secuenciar el producto del paso (d),
en donde la secuencia de nucleótidos exógena es un vector viral, transposón o casete de expresión.
2. El método de la reivindicación 1, en donde el análisis comprende la identificación de la ubicación de uno o más sitios de inserción en el genoma del sujeto y la cuantificación de la abundancia de cada uno de los uno o más sitios de inserción.
3. El método de la reivindicación 1 o 2, en donde el análisis comprende la determinación del riesgo de mutagénesis insercional.
4. El método de cualquier reivindicación anterior, en donde al sujeto se le ha administrado terapia génica o se le va a administrar terapia génica.
5. El método de cualquier reivindicación anterior, en donde el vector viral es un vector viral de terapia génica; y/o en donde el vector viral es un vector retroviral, lentiviral o AAV.
6. El método de cualquier reivindicación anterior, en donde la muestra es una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR), preferiblemente una muestra de plasma.
7. El método de cualquier reivindicación anterior, en donde el paso (a) comprende además un paso de purificación de los polinucleótidos; el paso (b) comprende la reparación de extremos o la digestión de salientes monocatenarios, preferentemente la reparación de extremos; y/o el paso (b) comprende además la fosforilación en 5' y/o la adenilación en 3'.
8. El método de cualquier reivindicación anterior, en donde los oligonucleótidos son parcialmente bicatenarios.
9. El método de cualquier reivindicación anterior, en donde cada oligonucleótido comprende:
(i) una primera porción que comprende una secuencia de nucleótidos aleatoria;
(ii) una segunda porción que comprende una secuencia de nucleótidos de código de barras; y/o
(iii) una tercera porción que comprende un sitio de unión para un cebador destinado a la secuenciación del paso (e).
10. El método de cualquier reivindicación anterior, en donde la amplificación del paso (d) es mediante PCR, preferiblemente PCR anidada, opcionalmente en donde la PCR comprende amplificar el producto del paso (c) utilizando un cebador que se une a una porción de la secuencia nucleotídica exógena y un cebador que se une a una porción del oligonucleótido.
11. El método de conformidad con la reivindicación 10, caracterizado porque la PCR comprende:
(i) amplificar el producto del paso (c) mediante un primer paso de RCP utilizando un par de cebadores externos para obtener un primer producto de PCR; y
(ii) amplificar el primer producto de PCR mediante un segundo paso de PCR utilizando un par de cebadores internos para obtener un segundo producto de PCR,
opcionalmente, en donde un cebador del par de cebadores externos se une a una primera porción de la secuencia de nucleótidos exógena y un cebador del par de cebadores internos se une a una segunda porción de la secuencia de nucleótidos exógena; y/o en donde un cebador del par de cebadores externos se une a una primera porción del oligonucleótido y un cebador del par de cebadores internos se une a una segunda porción del oligonucleótido.
12. El método de conformidad con la reivindicación 11, caracterizado porque la PCR anidada comprende:
(i) amplificar el producto del paso (c) mediante un primer paso de PCR utilizando un primer cebador que se una a una primera porción de la secuencia de nucleótidos exógena y un segundo cebador que se una a una primera porción de un oligonucleótido para obtener un primer producto de PCR; y
(ii) amplificar el primer producto de PCR mediante un segundo paso de PCR utilizando un tercer cebador que se une a una segunda porción de la secuencia de nucleótidos exógena y un cuarto cebador que se une a una segunda porción del oligonucleótido para obtener un segundo producto de PCR.
13. Un método para determinar la seguridad y/o eficacia de una terapia génica, en donde el método comprende:
(a) utilizar una muestra proporcionada de un sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto, preferiblemente una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR);
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción del vector de terapia génica; y
(e) secuenciar el producto del paso (d) para identificar la ubicación de uno o más sitios de inserción en el genoma del sujeto y/o cuantificar la abundancia de cada uno de los uno o más sitios de inserción.
14. Un método para analizar los sitios de inserción de vectores en el genoma de un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada del sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto, preferiblemente una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR);
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción del vector; y
(e) secuenciar el producto del paso (d) para identificar la ubicación de uno o más sitios de inserción en el genoma del sujeto y/o cuantificar la abundancia de cada uno de los uno o más sitios de inserción.
15. Un método para identificar células cancerosas inducidas por terapia génica en un sujeto, en donde el método comprende:
(a) utilizar una muestra proporcionada de un sujeto que comprende polinucleótidos de ADN bicatenario libres de células, en donde la muestra es una muestra de fluido corporal del sujeto, preferiblemente una muestra de plasma, suero, orina o líquido cefalorraquídeo (LCR);
(b) embotar los extremos de los polinucleótidos;
(c) ligar un oligonucleótido a ambos extremos de los polinucleótidos;
(d) amplificar los polinucleótidos que comprendan un sitio de inserción de una secuencia de nucleótidos exógena; y (e) secuenciar el producto del paso (d) para identificar la ubicación de uno o más sitios de inserción en el genoma del sujeto y/o cuantificar la abundancia de cada uno de los uno o más sitios de inserción,
en donde la secuencia de nucleótidos exógena es un vector viral, transposón o casete de expresión.
ES20718654T 2019-04-12 2020-04-09 Método de análisis de los lugares de inserción Active ES2984361T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB1905244.8A GB201905244D0 (en) 2019-04-12 2019-04-12 Method for analysisng insertion sites
PCT/EP2020/060285 WO2020208206A1 (en) 2019-04-12 2020-04-09 Method for analysing insertion sites

Publications (1)

Publication Number Publication Date
ES2984361T3 true ES2984361T3 (es) 2024-10-29

Family

ID=66286526

Family Applications (1)

Application Number Title Priority Date Filing Date
ES20718654T Active ES2984361T3 (es) 2019-04-12 2020-04-09 Método de análisis de los lugares de inserción

Country Status (6)

Country Link
US (1) US20230159985A1 (es)
EP (1) EP3953490B1 (es)
CA (1) CA3136532A1 (es)
ES (1) ES2984361T3 (es)
GB (1) GB201905244D0 (es)
WO (1) WO2020208206A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116814752A (zh) * 2023-01-17 2023-09-29 宁波熙宁检测技术有限公司 一种慢病毒整合位点的检测方法及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
DE69703974T2 (de) 1996-10-17 2001-07-19 Oxford Biomedica (Uk) Ltd., Oxford Retrovirale vektoren
US20180113137A1 (en) * 2013-10-18 2018-04-26 Tcm Biotech International Corp. Method for detecting the quantity of biomarker and identifying disease status
US20150119260A1 (en) * 2013-10-18 2015-04-30 National Taiwan University Circulating cancer biomarker and its use

Also Published As

Publication number Publication date
WO2020208206A1 (en) 2020-10-15
EP3953490B1 (en) 2024-03-20
US20230159985A1 (en) 2023-05-25
GB201905244D0 (en) 2019-05-29
CA3136532A1 (en) 2020-10-15
EP3953490A1 (en) 2022-02-16

Similar Documents

Publication Publication Date Title
Bak et al. Multiplexed genetic engineering of human hematopoietic stem and progenitor cells using CRISPR/Cas9 and AAV6
Tao et al. Frequency and mechanisms of LINE-1 retrotransposon insertions at CRISPR/Cas9 sites
Rothe et al. Biosafety challenges for use of lentiviral vectors in gene therapy
Kim et al. Rapid generation of somatic mouse mosaics with locus-specific, stably integrated transgenic elements
Montini et al. The genotoxic potential of retroviral vectors is strongly modulated by vector design and integration site selection in a mouse model of HSC gene therapy
US20220162574A1 (en) Modulating Human Cas9-Specific Host Immune Response
JP7403461B2 (ja) ピルビン酸キナーゼ欠損症を治療するためのpklr送達用レンチウイルスベクター
US20220304286A1 (en) SYSTEMS AND METHODS FOR IN VIVO DUAL RECOMBINASE-MEDIATED CASSETTE EXCHANGE (dRMCE) AND DISEASE MODELS THEREOF
Von Kalle et al. Vector integration and tumorigenesis
Rothe et al. Safety of gene therapy: new insights to a puzzling case
Hogan et al. Molecular analyses support the safety and activity of retroviral replicating vector Toca 511 in patients
ES2885833T3 (es) Composición y métodos para potenciar la expresión génica de PKLR
Cesana et al. A case of T-cell acute lymphoblastic leukemia in retroviral gene therapy for ADA-SCID
Trobridge Genotoxicity of retroviral hematopoietic stem cell gene therapy
Biasco et al. Integrating vectors for gene therapy and clonal tracking of engineered hematopoiesis
Loyola et al. Disrupting MLV integrase: BET protein interaction biases integration into quiescent chromatin and delays but does not eliminate tumor activation in a MYC/Runx2 mouse model
CA3199079A1 (en) Synthetic introns for targeted gene expression
ES2984361T3 (es) Método de análisis de los lugares de inserción
Bhoopalan et al. Preclinical development of lentiviral vector gene therapy for Diamond-Blackfan anemia syndrome
US20250136973A1 (en) Single-cell lineage tracking, temporal recording, and crispr screening platform
Nesic et al. Generation of a PARPi-sensitive homozygous BRCA1-methylated OVCAR8 cell line using targeted CRISPR gene editing
Gardner Towards an engineered autologous cellular therapy for RAG2 deficiency
Montini et al. Genotoxicity assay for gene therapy vectors in tumor prone Cdkn2a−/− mice
Langley et al. Compound Delivery of eVLPs Enhances Prime Editing for Targeted Genome Engineering and High-Throughput Screening
Villiger In vivo application and engineering of CRISPR-Cas9 base editors