ES3043187T3 - Nucleic acid modification and identification method - Google Patents
Nucleic acid modification and identification methodInfo
- Publication number
- ES3043187T3 ES3043187T3 ES20179604T ES20179604T ES3043187T3 ES 3043187 T3 ES3043187 T3 ES 3043187T3 ES 20179604 T ES20179604 T ES 20179604T ES 20179604 T ES20179604 T ES 20179604T ES 3043187 T3 ES3043187 T3 ES 3043187T3
- Authority
- ES
- Spain
- Prior art keywords
- cells
- rna
- cell
- polynucleic acid
- modified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/107—Modifications characterised by incorporating a peptide nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/117—Modifications characterised by incorporating modified base
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
La invención proporciona un método para identificar un ácido polinucleico (PNA) que comprende los pasos de proporcionar un PNA; modificar una o más nucleobases del PNA mediante la adición o eliminación de un enlace de hidrógeno, alterando así la capacidad de apareamiento de bases de una o más nucleobases; aparear bases de un ácido nucleico complementario al PNA, incluyendo el apareamiento de bases con al menos una nucleobase modificada; identificar la secuencia del ácido nucleico complementario al menos en la posición que es complementaria a al menos una nucleobase modificada. (Traducción automática con Google Translate, sin valor legal)
Description
[0001] DESCRIPCIÓN
[0003] Modificación y procedimiento de identificación de ácidos nucleicos
[0005] Antecedentes de la invención
[0007] Los análogos de nucleótidos, tales como la 4-tiouridina (s4U) y la 6-tioguanosina (s6G), se incorporan fácilmente a los ARN nacientes, por ejemplo, por medio de enzimas naturales (Taniet al.,Genome Res., 22, 947-956 (2012)). Entre los análogos más populares se encuentran la 5-bromouridina (5BrU), la 5-etiniluridina (5-EU), la 6-tioguanosina (s6G) y la 4-tiouridina (s4U), que son fácilmente incorporadas por las células y, además, proporcionan propiedades fisicoquímicas únicas para la detección de anticuerpos, las reacciones de cicloadición y la reactividad y afinidad específicas de tiol, respectivamente (Eidinoffet al.,Science, 129, 1550-1551 (1959); Jaoet al.,PNAS, 105, 15779 15784 (2008); Melvinet al.,Eur. J. Biochem., 92, 373-379 (1978); Woodfordet al.,Anal. Biochem., 171, 166-172 (1988); Dolkenet al.,RNA, 14, 1959-1972 (2008); Rabaniet al.,Nat. Biotechnol., 29, 436-442 (2011)). La 4-tiouridina (s4U) es el análogo de nucleótido más utilizado para estudiar la dinámica de la expresión del ARN. Al igual que otros nucleótidos, la s4U es absorbida rápidamente por las células sin necesidad de electroporación ni lipofección. En las células, la fosforilación por las uridina cinasas celulares genera una reserva acumulada de s4U fosforilada que se incorpora eficientemente al ARN recién sintetizado en una amplia gama de tipos celulares, incluidas las células de mosca, murinas y humanas (Dolken, 2008,supra).Además, el marcaje de transcritosin vivoen moscas y ratones específico para cada tipo celular puede conseguirse empleando 4-tiouracilo junto con la expresión específica para cada tipo celular de la uracilo fosforribosiltransferasa (UPRT) deToxoplasma gondii,que acopla ribosa-5-fosfato al nitrógeno N1 del uracilo (o 4-tiouracilo) para producir (4-tio)uridina monofosfato que se incorpora al ARN (Clearyet al.,Nat. Biotechnol., 23, 232-237 (2005)). Los protocolos actuales que emplean el marcaje metabólico del ARN con 4-tiouridina (s4U) para caracterizar la biogénesis, el procesamiento y la cinética de recambio del ARN intracelular emplean la separación bioquímica por medio de la biotinilación reversible del grupo tiol en s4U [por ejemplo, por medio de N-[6-(biotinamido)hexil]-3-(2-piridilditio)propionamida (HPDP-biotina) o metanosulfonatos acoplados a biotina (MTS-biotina)] (Clearyet al.,2005,supra).Sin embargo, como cualquier procedimiento de separación bioquímica, los protocolos subyacentes llevan mucho tiempo y suelen encontrarse con el problema de la baja relación señal/ruido debido a las limitaciones en la eficacia de la biotinilación (sobre todo cuando se aplica a especies de ARN cortas) y la reactividad inespecífica (Duffyet al.,Mol Cell., 59, 858-866 (2015); Neymotinet al.,RNA, 20:1645-1652 (2014)).
[0008] El documento WO 2006/125808 A1 describe un procedimiento basado en micromatrices para analizar ARN transcritode novoque contiene ARN tiolado.
[0010] Los documentos WO 2004/101825 A1 y WO 2016/154040 A2 se refieren a procedimientos de marcaje biosintético y separación de ARN.
[0012] Milleret al.,Nature Methods, 6(6), 2009: 439-441, describen el marcaje de ARN mediante una fuente de alimento de 4-tiouracilo enDrosophila melanogaster.
[0014] Schwalbet al.,Science, 352(6290), 2016: 1225-1228, se refiere a un procedimiento de secuenciación transitoria del transcriptoma capaz de estimar la síntesis y degradación del ARNm total.
[0016] Hartmannet al.,Handbook of RNA Biochemistry, vol. 2, 2014, capítulo 8.3.3, págs. 164-166, se refieren al marcaje postsintético de ARN modificado con 4-tiouridina mediante la modificación de residuos de 4-tiouridina con yodoacetamidas o compuestos basados en azufre.
[0018] Testaet al.,Biochemistry, 38(50), 1999: 16655-16662, divulgan una alteración en la fuerza de apareamiento de bases del tiouracilo (s2U y s4U) en comparación con el uracilo.
[0020] Haraet al.,Biochemical and Biophysical Research Communications, 38(2), 1970: 305-311, divulgan el marcaje por espín específico de 4-tiouridina del ARNt.
[0022] Fuchset al.,Genome Biology, 15(5), 2014: 1465-6906, se refieren a una determinación de tasas de alargamiento transcripcional en todo el genoma mediante la determinación de marcadores de 4-tiouridina en el ARN. El procedimiento requiere la biotinilación y purificación de dicho ARN marcado.
[0024] Además, en las estrategias de biotinilación reversible, el ARN marcado sólo puede analizarse aislado, es decir, no en el contexto del ARN total. Por lo tanto, las mediciones precisas de la cinética del ARN intracelular mediante secuenciación de alto rendimiento requieren el análisis de tres subconjuntos de ARN por punto temporal (ARN marcado, ARN total y ARN no marcado), lo que hace que estos enfoques sean caros y los análisis posteriores poco prácticos.
[0026] Por lo tanto, un objetivo de la presente invención consiste en simplificar los procedimientos de detección de ácidos nucleicos modificados, preferentemente hasta el punto de permitir la detección automatizada.
[0028] Sumario de la invención
[0029] La presente invención se basa en la química de derivatización de análogos de nucleótidos que permite detectar modificaciones en especies de polinucleótidos (APN) con una resolución de un solo nucleótido. El procedimiento inventivo proporciona un procedimiento escalable, altamente cuantitativo, rentable y eficaz en el tiempo para el análisis rápido y en todo el transcriptoma de la modificación del APN.
[0031] En un primer aspecto, la invención proporciona un procedimiento de identificación de un ácido polinucleico (APN), que comprende las etapas de proporcionar un ácido polinucleico; modificar una o más nucleobases del ácido polinucleico mediante la incorporación de una nucleobase modificada con tiol en el APN a través de biosíntesis en una célula y que comprende además la alquilación de dicha nucleobase modificada con tiol con un agente alquilante que comprende un compañero de enlace de hidrógeno, alterando así la capacidad de apareamiento de bases de dichas una o más nucleobases; llevar a cabo el apareamiento de bases de un ácido nucleico complementario con el ácido polinucleico, incluido el apareamiento de bases con al menos una nucleobase modificada; identificar la secuencia del ácido nucleico complementario al menos en la posición que es complementaria con al menos una nucleobase modificada.
[0033] En realizaciones preferidas, el ácido polinucleico se sintetiza en una célula, en particular que ya contiene una modificación que, por sí misma, altera la capacidad de apareamiento de bases o puede modificarse posteriormente para alterar la capacidad de apareamiento de bases. Se divulga un procedimiento de identificación de un ácido polinucleico (APN) que comprende las etapas de expresar un APN en una célula; aislar el APN de la célula; modificar una o más nucleobases del APN en la célula y/o después del aislamiento; en el que la modificación o modificaciones en la célula o después del aislamiento o ambas juntas añaden o eliminan un compañero de enlace de hidrógeno de una o más nucleobases, alterando así la capacidad de apareamiento de bases de dichas una o más nucleobases; llevar a cabo el apareamiento de bases de un ácido nucleico complementario con el APN, incluido el apareamiento de bases con al menos una nucleobase modificada; identificar la secuencia del ácido nucleico complementario al menos en la posición que es complementaria con dicha al menos una nucleobase modificada.
[0035] Se divulga un kit para llevar a cabo el procedimiento inventivo, en particular un kit que comprende una nucleobase modificada con tiol y un agente alquilante adecuado para la alquilación de la nucleobase modificada con tiol en el grupo tiol, en el que el agente alquilante comprende un donante o aceptor del enlace de hidrógeno.
[0037] Todas las realizaciones de la divulgación se describen conjuntamente en la siguiente descripción detallada y todas las realizaciones preferidas se refieren a todas las realizaciones, aspectos, procedimientos y kits por igual. Por ejemplo, los kits o sus componentes pueden utilizarse en los procedimientos inventivos o ser adecuados para los mismos. El kit puede contener cualquier componente utilizado en los procedimientos descritos. Las descripciones preferidas y detalladas de los procedimientos inventivos se aplican igualmente a los componentes del kit o su idoneidad o combinación de componentes del kit para una etapa determinada del procedimiento. Todas las realizaciones pueden combinarse entre sí, salvo que se indique lo contrario.
[0039] Descripción detallada de la invención
[0041] La presente invención se refiere a un procedimiento, en el que un ácido polinucleico (abreviado APN) se modifica para crear un APN sintético (también denominado APN modificado). Puede descubrirse la presencia del APN sintético en una muestra de APN en la lectura de secuenciación de APN de dicha muestra, identificando así el APN modificado. Una ventaja de la invención es que esta identificación puede realizarse sin purificación/separación del APN no modificado.
[0043] En detalle, el procedimiento inventivo comprende las etapas de modificar una o más nucleobases de un APN mediante la adición o eliminación de un compañero de enlace de hidrógeno, alterando así la capacidad (o comportamiento) de apareamiento de bases de dichas una o más nucleobases; llevar a cabo el apareamiento de bases de un ácido nucleico complementario con el APN, incluido el apareamiento de bases con al menos una nucleobase modificada. La adición o eliminación de un compañero de enlace de hidrógeno se realiza mediante la incorporación de una nucleobase modificada con tiol en el APN a través de biosíntesis en una célula y comprende además la alquilación de dicha nucleobase modificada con tiol con un agente alquilante que comprende un compañero de enlace de hidrógeno.
[0044] Las nucleobases naturales son A (adenina), G (guanina), C (citosina) y T (timina)/U (uracilo). La modificación inventiva da lugar a una nucleobase que no es natural en comparación con los nucleótidos A, G, C, U en el caso del ARN o los nucleótidos A, G, C, T en el caso del ADN. La modificación conduce a un comportamiento alterado del apareamiento de bases, alterando así el apareamiento preferente de bases (unión por enlaces de hidrógeno) entre A y T/U y entre C y G. Esto significa que el apareamiento de bases a una nucleobase natural como ácido nucleico complementario cambia de un ácido nucleico natural a otro ácido nucleico natural. Preferentemente, el ácido nucleico complementario es ADN y se utiliza T en lugar de U. Una A alterada puede unirse a C o G; una T o un U alterados pueden unirse a C o G; una C alterada puede unirse a A o T/U; una G alterada puede unirse a A o T/U. Tales modificaciones son conocidas en la técnica. Las modificaciones suelen ser pocas y se reducen al mínimo para que sólo cambie el comportamiento de apareamiento de bases. Por ejemplo, A y G mantienen cada una su sistema de anillos de purina, y C y T/U mantienen su anillo de pirimidina. Por ejemplo, Harcourtet al.(Nature, 2017, 541: 339-346) ofrecen un análisis y un resumen de dichas modificaciones. Algunos ejemplos de modificaciones son las modificaciones de A a m6A, a m1A, a inosina, a 2-aminoadenina; modificaciones de C a m5C (5-metilcitosina), a hm5C (5-hidroximetilcitosina), a pseudouridina, a 2-tiocitosina, a 5-halocitosina, a 5-propinil (-C=C-CH3) citosina, a 5-alquilcitosina; modificaciones de
T o de U a 2-tiouracilo, a s4U (4-tiouracilo), a 2-tiotimina, a 4-pirimidinona, a pseudouracilo, a 5-halouracilo, por ejemplo, 5-bromouracilo (también denominado 5-bromouridina (5BrU)), a 5-propinil (-C=C-CH3) uracilo, a 5-alquiniluracilo, por ejemplo, 5-etiniluracilo; modificaciones de G a hipoxantina, a xantina, a isoguanina; modificaciones de A o de G a 6-metilo y otros derivados de 6-alquilo de la adenina y la guanina; a 2-propilo y otros derivados de 2-alquilo de la adenina y la guanina. Otras modificaciones son a 6-azo-uracilo, -citosina y -timina, a 8-halo-, 8-amino-, 8-tiol-, 8-tioalquil-, 8-hidroxil- y otras adeninas y guaninas 8-sustituidas, a 5-halo, especialmente a 5-bromo, a 5-trifluorometil- y otros uracilos y citosinas 5-sustituidos, a 7-metilguanina y a 7-metiladenina, a 2-F-adenina, a 2-aminoadenina, a 8-azaguanina y a 8-azaadenina, a 7-desazaguanina y a 7-desazaadenina y a 3-desazaguanina y a 3-desazaadenina. Aunque la nucleobase natural se modifica preferentemente a su nucleobase modificada más cercana como se ha indicado anteriormente, en principio la nucleobase puede modificarse a cualquier nucleobase modificada como se ha mencionado anteriormente. El factor importante es el cambio en el patrón de generación del enlace de hidrógeno, de modo que otro compañero de apareamiento de bases se unirá a la nucleobase modificada en comparación con la nucleobase no modificada. El cambio en los compañeros de unión no requiere una certeza absoluta, basta con que se modifique una certeza de unión con un socio de unión natural, tal como, por ejemplo, en al menos un 10%, al menos un 20 %, al menos un 30 %, al menos un 40 %, al menos un 50 %, al menos un 60 %, al menos un 70 %, al menos un 80 %, al menos un 90 % o un 100 %. Una nucleobase concreta puede unirse a más de una nucleobase complementaria (especialmente bases de titubeo). Las condiciones de referencia para determinar los cambios son, en condiciones convencionales para la transcriptasa inversa, preferentemente la presión atmosférica y 37 °C, en una solución acuosa isotónica fisiológica. Un ejemplo de las condiciones son Tris-HCl 50 mM, KCl 75 mM, MgCh 3 mM, DTT 10 mM a pH 7,5-8,5. Cualquier cambio de este tipo puede controlarse mediante medios de detección actuales, tales como la secuenciación y la comparación de secuencias. Además, se puede incluir más de una modificación en una molécula de APN y sólo es necesario detectar una por molécula o por pluralidad de moléculas. Por supuesto, cuanto mayor sea la proporción de cambio en la generación del enlace de hidrógeno de una nucleobase natural a otra nucleobase natural (en el ácido nucleico complementario), mayor será la certeza de la detección. Por lo tanto, se prefieren los cambios de proporción de apareamiento de bases más altos, tal como por lo menos un 50 % o un 80 %.
[0045] "Halo" significa halógeno, en particular F, Cl, Br o I; se prefiere especialmente Br, tal como en 5BrU. "Alquilo" significa un residuo de alquilo, preferentemente un residuo de alquilo de C1-C12 de longitud, ramificado o no ramificado, sustituido o no sustituido. Se prefieren los residuos de alquilo de longitud C1-C4 con un sustituyente O opcional y/o un sustituyente N opcional, tal como en la acetamida o cualquier otro alquilcarbonilo, ácido carbónico o amida.
[0047] Las nucleobases modificadas del APN divulgadas son de 5-bromouridina (5BrU), 5-etiniluridina (5-EU), 6-tioguanosina (s6G), 4-tiouridina (s4U), 5-viniluridina, 5-azidometiluridina y N6-aliladenosina (a6A).
[0049] Los comportamientos de apareamiento de bases son conocidos en la técnica o pueden deducirse de los cambios en los donantes o aceptores del enlace de hidrógeno, incluida su obstrucción para impedir su apareamiento. Por ejemplo, la 4-pirimidinona (U o T modificada) se aparea por bases preferentemente con G, en lugar de A (Sochackaet al.,Nucleic Acids Res., 11 de marzo de 2015, 43(5): 2499-2512).
[0051] La modificación de las nucleobases del APN puede ser una sustitución de un hidrógeno (H) en un átomo de oxígeno (O) o en un átomo de nitrógeno (N) por un sustituyente, tal como un carbono (por ejemplo, como en un grupo metilo u otro grupo alquilo), eliminando así el H como donante del enlace de hidrógeno. La modificación puede consistir en la sustitución de un par de electrones libres del átomo de oxígeno (O) o de nitrógeno (N) por un sustituyente, tal como un carbono (por ejemplo, como en un grupo metilo u otro grupo alquilo), eliminando así el par de electrones como aceptor del enlace de hidrógeno. La modificación puede comprender la sustitución de un O por azufre (S) o SH y, a continuación, la realización de una de las modificaciones anteriores, especialmente la alquilación del S o SH. Un procedimiento preferido de sustitución de O por S o SH es por biosíntesis y suministro de una enzima, por ejemplo, una transcriptasa con nucleótidos modificados con S o SH, tal como s4U. La transcriptasa puede estar en una célula.
[0052] La modificación inventiva puede ser una modificación en una sola etapa o una modificación con más de una etapa, tal como dos, tres o más etapas. Por ejemplo, una primera parte de la modificación se realiza en un entorno de reacción, tal como una célula, y una segunda modificación se realiza en otro entorno de reacción, por ejemplo, tras aislar el APN de la célula. Preferentemente, dicha segunda o posterior modificación depende de la primera modificación, por ejemplo, se realiza sobre los átomos cambiados por la primera modificación. En particular, se prefiere una modificación en varios pasos, en la que la primera modificación es una modificación enzimática, tal como mediante la incorporación de nucleótidos/nucleobases modificados por una enzima, tal como una ARN o ADN polimerasa, en el APN. En esta etapa, para la procesabilidad enzimática, sólo se incluyen pequeñas modificaciones para no perjudicar o perjudicar moderadamente la actividad enzimática. Las pequeñas modificaciones son, por ejemplo, un cambio en sólo 1 o 2 átomos (sin contar el hidrógeno) en comparación con una nucleobase natural correspondiente. En una etapa posterior, la nucleobase modificada incorporada puede modificarse aún más por cualquier medio, por ejemplo, para obtener las nucleobases modificadas descritas en el presente documento, tal como por procedimientos de química en húmedo, incluida la alquilación. Dicha modificación adicional puede ser externa a la célula, enzimática o no enzimática. Se centra preferentemente en las modificaciones introducidas en la primera etapa. Una (primera) modificación en una célula puede ser una modificación inducida o potenciada, por ejemplo, suministrando a la célula nucleobases modificadas (por ejemplo, tal como nucleótidos modificados), que la célula incorpora después en el APN biosintetizado. "Potenciado" significa más allá de las modificaciones naturales.
[0053] También es posible que una (primera) modificación sea un proceso natural dentro de una célula sin proporcionar a la célula una nucleobase modificada. Un proceso natural de este tipo es, por ejemplo, la tiolación del ARNt (Thomaset al.,Eur. J. Biochem., 1980, 113(1):67-74; Emilssonet al.,Nucleic Acids Res., 1992, 20(17): 4499-4505; Krameret al.,J. Bacteriol., 1988, 170(5): 2344-2351). Estas modificaciones naturales también pueden detectarse mediante el procedimiento inventivo, por ejemplo, detectando apareamientos incorrectos de bases con estas nucleobases modificadas, o un comportamiento alterado de apareamiento de bases, directamente o mediante una modificación adicional (segunda) de estas nucleobases modificadas de forma natural. Algunas modificaciones naturales pueden ser el resultado de una respuesta al estrés o de otras influencias ambientales. De este modo, el procedimiento inventivo puede utilizarse para detectar tales respuestas de una célula e influencias en una célula. Un ejemplo es la modificación de s4U, especialmente en el ARNt, en respuesta a la luz ultravioleta, especialmente a la irradiación con UV cercano (Krameret al., supra).La modificación de s4U, especialmente en el ARNt, también puede utilizarse para medir la velocidad de crecimiento de las células (Emilssonet al., supra).Esta modificación, que se utilizará como indicador de crecimiento, puede detectarse según el procedimiento inventivo. Preferentemente, se utilizan eubacterias o arqueas para dicha modificación natural.
[0055] Según la invención, la etapa de modificación se lleva a cabo mediante la incorporación de una nucleobase modificada con tiol en el APN (primera parte de la modificación) y la alquilación de dicha nucleobase con tiol con un agente alquilante (segunda parte de la modificación). Los agentes alquilantes reactivos con tiol incluyen yodoacetamidas, maleimidas, haluros bencílicos y bromometilcetonas. Los agentes alquilantes pueden comprender un grupo alquilo, tal como los mencionados anteriormente, y un grupo saliente, tal como un halogenuro, por ejemplo, Br o Cl. Los agentes reaccionan por S-alquilación de los tioles para generar productos de tioéter estables. Los reactivos arilantes, tales como los haluros de NBD (4-nitrobenzo-2-oxa-1,3-diazol) reaccionan con tioles o aminas mediante una sustitución similar del haluro aromático por el nucleófilo. También se dispone de tiosulfatos para la modificación con tioles reversible. Los tiosulfatos reaccionan estequiométricamente con los tioles para formar disulfuros mixtos. Los tioles también reaccionan con isotiocianatos y ésteres de succinimidilo. También pueden utilizarse isotiocianatos y ésteres de succinimidilo para reaccionar con aminas.
[0057] Las modificaciones de un tiol también pueden comprender una etapa de conversión del tiol en una tiocetona. A continuación, el grupo tiocetona puede modificarse mediante la adición o eliminación de un compañero de enlace de hidrógeno. La conversión a una tiocetona puede comprender la eliminación de un hidrógeno, tal como en un conglomerado de metal de transición como catalizador, tal como se describe en Kohleret al.(Angew. Chem. Int. Ed. Engl., 1996, 35(9): 993-995). La conversión a una tiocetona permite opciones adicionales de la química de la reacción para realizar la modificación inventiva. Kohleret al.también describen la introducción de un tiol o tiocetona en un arilo, que también es una opción para la presente invención, para crear una tiomodificación (tiol, tiocetona) en la nucleobase modificada inventiva.
[0059] La alquilación del tiol también se denomina alquilación ligada a tiol (SH). La ventaja de la alquilación del tiol es su selectividad para el tiol "blando", mientras que las nucleobases no tioladas pueden permanecer inalteradas (teoría HSAB, "hard and soft (Lewis) acids and bases", ácidos y bases (de Lewis) duras y blandas, Pearsonet al.,JACS, 1963, 85(22): 3533-3539). Las yodoacetamidas reaccionan fácilmente con todos los tioles para formar tioéteres; son algo más reactivas que las bromoacetamidas, que también pueden utilizarse. Las maleimidas son excelentes reactivos para la modificación selectiva, la cuantificación y el análisis de tioles. En esta reacción, el tiol se añade a través del doble enlace de la maleimida para producir un tioéter. También es posible una alquilación mediante la tiocetona antes mencionada.
[0061] Preferentemente, la modificación comprende la alquilación en la posición 4 de una uridina. En esta posición se produce una interferencia muy eficaz con el comportamiento natural del enlace de hidrógeno de la uridina. Dicha modificación puede ser con un agente alquilante, por ejemplo, un agente alquilante que comprenda el compañero de enlace de hidrógeno, preferentemente un aceptor del enlace de hidrógeno, o un agente alquilante que no comprenda un compañero de enlace de hidrógeno, y así se bloquea el tipo de enlace de hidrógeno que normalmente aparecería en la posición 4 de la uridina. Dicha alquilación puede realizarse con una modificación en dos etapas mediante una 4-tiouridina como se ha mencionado anteriormente.
[0063] Otra alquilación preferida es en la posición 6 de una guanosina. Tal alquilación aumenta la tasa de apareamientos incorrectos del par GC convencional a un par G*A de titubeo con sólo 2 enlaces de hidrógeno eficaces (en lugar de 3 en GC). En realizaciones especialmente preferidas, la introducción de la alquilación en la posición 6 de la guanidina comprende la modificación de la guanidina a 6-tioguanosina (s6G) y la alquilación de la posición tio. Por lo tanto, este es otro ejemplo preferido de este tipo de alquilación con una modificación en dos etapas a través de una 6-tioguanosina como se ha mencionado anteriormente. La 6-tioguanosina puede incorporarse a un APN por biosíntesis en presencia de nucleótidos de 6-tioguanosina.
[0065] Los agentes alquilantes preferidos tienen la fórmula Hal-(C)xOyNz (no se muestran los hidrógenos), en la que Hal significa halógeno, C cadena de carbono de x átomos de C, ramificada o no ramificada, siendo x de 1 a 8, O significa y sustituyentes de oxígeno en un átomo de C, siendo y de 0 a 3, N significa z sustituyentes de nitrógeno en un átomo de C, siendo z de 0 a 3. N es preferentemente al menos un -NH2 o =NH con doble enlace, siendo el O preferentemente un -OH o =O con doble enlace. Hal se selecciona preferentemente entre Br o I.
[0066] En especial preferentemente, el APN comprende una o más 4-tiouridina o 6-tioguanosina, preferentemente 2, 3, 4, 5, 6, 7, 8, 9, 10 o más 4-tiouridina o 6-tioguanosina. La modificación de una o más nucleobases puede comprender la unión de un compañero de enlace de hidrógeno, como un aceptor o donante del enlace de hidrógeno, a la nucleobase modificada con tiol. Dicha unión puede realizarse mediante cualquier modificación química, siendo preferible la alquilación, tal como, por ejemplo, mediante un agente alquilante que contenga un haluro, como se ha mencionado anteriormente.
[0068] Una alternativa divulgada a la alquilación es la modificación por oxidación. Dicha modificación se describe, por ejemplo, en Burton, Biochem. J., 204 (1967): 686; y Rimlet al.,Angew. Chem. Int. Ed. Engl., 2017, 56(43):13479-13483. Por ejemplo, una nucleobase, especialmente una nucleobase tiolada, puede modificarse por oxidación para alterar un donante o aceptor del enlace de hidrógeno. En el caso de un procedimiento en dos etapas por medio de una nucleobase tiolada como se describió anteriormente, el azufre del grupo tiol puede oxidarse, por ejemplo, mediante OsO4, NaIO3, NaIO4 o un peróxido, tal como el ácido cloroperoxibenzoico o H2O2. Por ejemplo, un s4U puede oxidarse a un C (Schofieldet al.,Nature Methods, doi:10.1038/nMeth.4582), lo que altera el comportamiento de hibridación/apareamiento de bases de U-A a C-G. Como demuestra Burton(supra),dicha oxidación no requiere el intermedio de tiol, aunque se prefiere dicho intermedio de tiol, especialmente en caso de modificación de la biosíntesis (véase más adelante). Tales análogos de C son, por ejemplo, la citidina trifluoroetilada (por ejemplo, producto de la oxidación en presencia de 2,2,2-trifluoroetilamina). Los análogos de C pueden conservar el comportamiento de apareamiento de bases de la citosina y/o el anillo depirimidin-2-ona. La posición 4 en el anillo de pirimidin-2-ona puede estar sustituida, por ejemplo, con un grupo amino (como en C) o comprender otros sustituyentes, tales como un grupo R-NH, seleccionándose R entre un grupo alquilo, un grupo aromático, un grupo alcano, NH2, trifluoroetileno, MeO, etc. (véase Schofieldet al., supra,especialmente la figura suplementaria 1).
[0070] Preferentemente, una nucleobase modificada, por ejemplo, una base modificada con tiol, se incorpora al APN a través de biosíntesis en una célula o por enzimas celulares (por ejemplo, por transcripciónin vitro).También es posible una introducción química de la nucleobase modificada, por ejemplo, mediante síntesis química (no biológica) de APN, tal como una síntesis orgánica o semisintética. La biosíntesis es la síntesis de un APN basada en una plantilla de APN (normalmente ADN, en particular ADN genómico) y una síntesis dependiente de la plantilla (transcripción, transcripción inversa). Las enzimas adecuadas para dicha transcripción son las ARN polimerasas, las ADN polimerasas y las transcriptasas inversas. La enzima puede incorporar nucleótidos naturales y modificados (con la nucleobase modificada) a la molécula de APN biosintetizada. Las unidades monoméricas de nucleótidos se conectan al formar el APN. Dichos monómeros pueden suministrarse en forma modificada e incorporarse al APN. Preferentemente, sólo se modifica un tipo de nucleótido natural (A, G, C, T/U), es decir, tiene homólogos modificados (no naturales) que se incorporan al APN. También se prefiere que estén presentes todos los tipos de nucleótidos naturales y que la nucleobase o nucleobases modificadas sean menos numerosas que las nucleobases naturales correspondientes (no modificadas). "Correspondiente" significa la nucleobase natural con el menor número de cambios de átomos (sin contar el hidrógeno) necesarios para restablecer la nucleobase natural. Por ejemplo, se proporcionan A, G, C, T/U además de U modificado (o cualquier otro tipo de nucleótido modificado seleccionado entre A, G, C, T). Preferentemente, la proporción de nucleótidos modificados con respecto a los nucleótidos no modificados (naturales) de un tipo determinado es del 20 % o menos, por ejemplo, del 15 % o menos, del 10 % o menos o incluso del 5 % o menos (todos los porcentajes molares). El nucleótido modificado se incorporará en lugar del nucleótido natural correspondiente, pero posteriormente, en el procedimiento inventivo, provocará un apareamiento de bases atípico (comportamiento de apareamiento de bases modificado como se ha detallado anteriormente), que a su vez dará lugar a otro apareamiento de bases del nucleótido complementario con el nucleótido modificado, diferente del que se produciría con el nucleótido homólogo natural. Por lo tanto, se producirá un cambio en la secuencia de una hebra complementaria hibridada, por ejemplo, una hebra complementaria recién sintetizada. Así, el apareamiento de bases con al menos una nucleobase modificada puede conducir al apareamiento de bases con otro nucleótido que el apareamiento de bases con una nucleobase que no haya sido modificada, siendo dichas nucleobases por lo demás iguales.
[0072] Se divulga incorporar nucleobases alquiladas en el APN mediante biosíntesis, por ejemplo, nucleobases alquiladas como se ha descrito anteriormente, pero sin utilizar un intermedio de tiol. Por ejemplo, los nucleótidos alquilados pueden incorporarse a las células y ser utilizados por dichas células durante la síntesis de APN. Tales procedimientos han sido descritos por Jaoet al.,Proc. Nat. Acad. Sci. USA, 105 (41), 2008:15779; y Darzynkiewiczet al.Cytometry A, 79A, 2011:328. En particular, un nucleótido modificado eficaz para ser utilizado según la invención es la 5-etiniluridina (5-EU). La uridina marcada con etinilo es permeable a las células y se incorpora al ARN naciente en lugar de su análogo natural, la uridina. En realizaciones preferidas, el APN funcionalizado con etinilo resultante se modifica posteriormente, tal como mediante la química de clic catalizada por Cu(I) (por ejemplo, como se describe en Presolskiet al.,Current Protocols in Chemical Biology, 3, 2011:153; o Honget al.,Angew. Chem. Int. Ed., 48, 2011:9879) para introducir grupos funcionalizados adicionales a través de moléculas funcionalizadas con azida, por ejemplo, éster NHS, maleimidas, azidoácidos, azidoaminas, para influir en la capacidad de la cetona para establecer un enlace de hidrógeno en posición orto con respecto al grupo etinilo.
[0074] En otras divulgaciones, tales moléculas funcionalizadas con azida pueden introducirse en las propias células para ser biosintetizadas en moléculas de APN como nucleobases modificadas. El APN funcionalizado con azida resultante puede detectarse posteriormente mediante la química de clic catalizada por Cu(I) (CuAAC) o promovida por tensión
sin Cu(I) (SPAAC) para introducir un grupo funcional que altera las capacidades de generación de un enlace de hidrógeno de la nucleobase en comparación con la nucleobase no modificada (C, T/U, A, G).
[0076] Otro ejemplo divulgado de modificación de una o más nucleobases del APN incluye la incorporación de nucleobases funcionalizadas con vinilo en el APN, tal como 5-viniluridina. Los grupos vinilo pueden modificarse aún más para alterar las capacidades de generación de un enlace de hidrógeno de la nucleobase no modificada (véase Riederet al.,Angew. Chem. Int. Ed., 53, 2014:9168).
[0078] En otras divulgaciones, la modificación de una o más nucleobases del APN comprende la ciclación de un grupo alilo y/o comprende la halogenización, especialmente la yodación, de una nucleobase del APN. La nucleobase modificada es preferentemente una nucleobase alílica, tal como la N6-aliladenosina ("a6A"), que puede modificarse aún más por ciclación en la que interviene el grupo alilo. Dicha nucleobase alílica puede incorporarse al APN durante la síntesis del APN, especialmente en una célula, como se describe para otras realizaciones del presente documento. La halogenización y/o la ciclación pueden seguir los principios descritos en Shuet al.,J. Am. Chem. Soc., 2017, 139 (48): 17213-17216. Preferentemente, el procedimiento comprende la incorporación de N6-aliladenosina en una célula, seguida de una yodación con yodo elemental (I2), por ejemplo, que conduce a la ciclación del grupo alilo anteriormente yodado, por ejemplo, con un nitrógeno en el grupo purina (en caso de A o G modificadas) o pirimidina (en caso de C o T/U modificados) de la nucleobase. Dicha modificación da lugar a un apareamiento de bases alterado, que puede leerse durante la secuenciación o la hibridación. Por ejemplo, a6A se comporta como A y puede incorporarse metabólicamente a ARN recién sintetizados dentro de células de mamíferos. La yodación del grupo W®-alilo de a6Aen condiciones suaves de tampón induce espontáneamente la formación de adenosina N1,^-c ic lada y crea mutaciones en su sitio opuesto durante la síntesis del ADN complementario de la transcripción inversa.
[0080] En otra divulgación, la modificación de una o más nucleobases del APN comprende la introducción de una nucleobase de 5-bromouridina (5-BrU) en el APN. La 5-BrU es un mutágeno que está presente en forma de tautómero, lo que significa que está presente en sus formas ceto y enol, que realiza el apareamiento de bases con adenina o guanina (véase la figura 37a), lo que a su vez conduce a un aumento de las conversiones T>C (en comparación con el U no modificado) en una reacción de amplificación similar a la PCR. Así, en esta divulgación, la modificación de una o más nucleobases del APN introduce una nucleobase tautomérica, cuyas formas tautoméricas pueden realizar el apareamiento de bases con ambas bases de purina (A y G) en el caso de T/U modificados y C modificada, o pueden realizar el apareamiento de bases con ambas bases de pirimidina (T y C) en el caso de A y G modificadas. El apareamiento de bases con ambas bases de purina/pirimidina significa, en este caso, un comportamiento de apareamiento de bases más igualado (pero no necesariamente igual) que en el caso de A, G, U/T, C no modificados (que raramente se aparean con la base no complementaria). En otras palabras, la base tautomérica tiene mayor apareamiento de bases con la base no complementaria de la misma estructura central de la base (purina o pirimidina) que la base no modificada (comportamiento de titubeo). Dicho aumento se produce en condiciones convencionales, especialmente para la PCR.
[0082] Tal comportamiento de titubeo puede determinarse por un resultado aumentado de bases mixtas en una posición concreta correspondiente a la nucleobase modificada. La detección de bases de titubeo es una lectura preferida del procedimiento inventivo en cualquier realización (compárense las figuras 5B, 24B, 37C).
[0084] En otras divulgaciones relacionadas, la 5-BrU o cualquier otra nucleobase halogenada puede modificarse posteriormente mediante la sustitución del halógeno por un grupo amino. Por ejemplo, la 5-BrU puede calentarse con amoníaco para convertirla en 5-aminouridina. Dicha nucleobase modificada con amino cambia el apareamiento de bases durante la transcripción inversa y/o introducirá un comportamiento de titubeo adicional.
[0086] El APN (con la nucleobase modificada) puede comprender o consistir en ARN o ADN. Algunos ejemplos de ARN son ARNm, microARN (miARN o miR), a Rn de horquilla corta (ARNhc), ARN interferente pequeño (ARNip), ARN que interactúa con PIWI (piARN), ARN ribosómico (ARNr), ARN pequeño derivado de ARNt (ARNpt), ARN de transferencia (ARNt), ARN nucleolar pequeño (ARNnop), ARN nuclear pequeño (ARNnp), ARN no codificante largo (ARNncl) o moléculas de ARN precursoras de los mismos. El ADN es, por ejemplo, ADN genómico, ADNc, ADN plasmídico o un vector de ADN. El APN puede estar en forma de dúplex o ser monocatenario.
[0088] "Comprende" se refiere a un término abierto y también puede permitir que las moléculas contengan otros miembros, por ejemplo, otros tipos de nucleótidos (pueden existir ARN o ADN, incluidos nucleótidos modificados artificialmente, tales como LNA). "Consiste n" se considera una definición cerrada que exige que los miembros cumplan el requisito, es decir, ARN completo o ADN completo.
[0090] Preferentemente, para cada tipo de nucleótido seleccionado de A, G, C, U o T, el APN modificado comprende más nucleótidos naturales que nucleótidos modificados. En este caso, APN se refiere al APN final con todas las modificaciones según la invención. El APN comprende preferentemente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más y hasta 30 nucleótidos modificados. Preferentemente, se modifican pocas nucleobases, tal como un 20 % o menos, por ejemplo, un 15 % o menos o un 10 % o menos o incluso un 5 % o menos (todos son proporciones molares) de nucleobases en la molécula de APN están modificadas.
[0092] La molécula de APN puede tener cualquier longitud. Preferentemente, tiene una longitud de al menos 10 nt (nucleótidos). Se prefiere especialmente una longitud de 10 nt, 20 nt, 30 nt, 40 nt, 50 nt, 75 nt, 100 nt, 250 nt, 500 nt,
1000 nt, 2500 nt, 5000 nt, 10000 nt, 25000 nt, 50000 nt, 100000 nt o más nt de longitud o cualquier intervalo entre estos valores. Los intervalos preferidos son de 10 nt a 100000 nt o de 50 nt a 50000 nt de longitud.
[0094] Preferentemente, el APN procede de una fracción celular concreta de nucleótidos, tal como una fracción de ARN total, una fracción de ARNm o una fracción de ADN, tal como ADN plasmídico o ADN genómico. Las fracciones pueden seleccionarse aislando el APN con una característica común, tal como la longitud, el tipo de nucleótido o las secuencias, tal como una cola de poli(A) o un casquete de 5' en el ARNm.
[0096] El procedimiento inventivo contiene la etapa de apareamiento de bases del APN con un ácido nucleico complementario. En dicho apareamiento de bases, al menos una de las nucleobases modificadas debe estar apareada (normalmente mediante el apareamiento de bases de varias nucleobases del APN). El apareamiento de bases con el ácido nucleico complementario puede facilitarse hibridando el APN con una hebra de ácido nucleico. Esto también puede ocurrir durante la reacción de extensión, por ejemplo, PCR, o por hibridación de ácidos nucleicos de sonda. El ácido nucleico complementario puede tener cualquier longitud, por ejemplo, las longitudes descritas anteriormente para el APN.
[0098] La secuencia del ácido nucleico complementario se identifica al menos en la posición que es complementaria con al menos una nucleobase modificada. La determinación de la secuencia puede realizarse mediante cualquier procedimiento habitual conocido en la técnica. Dichos procedimientos incluyen procedimientos basados en la generación de hebras complementarias, por ejemplo, mediante PCR, totales o parciales, como en la secuenciación de última generación ("next generation sequencing", NGS), un procedimiento de secuenciación basado en fragmentos. Si se desea, las lecturas de fragmentos pueden ensamblarse en una secuencia combinada. Sin embargo, para los usos inventivos, esto no es necesario, siempre que se identifique la nucleobase complementaria con la nucleobase modificada, en particular con su secuencia vecina (tales como vecinos en /-5 nt, /-10 nt, /-15 nt o /-20 nt). Otros procedimientos para determinar una secuencia incluyen la unión a una sonda, mediante la cual, a través de la secuencia de la sonda de hibridación conocida, se determina la secuencia del APN como secuencia complementaria.
[0099] Otra opción es la secuenciación de ácidos nucleicos pequeños, especialmente si el ácido nucleico complementario es pequeño, como en el caso de ácidos nucleicos complementarios con miARN, ARNhc, ARNip. Los ácidos nucleicos pequeños pueden tener una longitud, por ejemplo, de 10 nt a 200 nt, preferentemente de 12 nt a 100 nt o de 14 nt a 50 nt. También son posibles longitudes superiores a 200 nt o inferiores a 10 nt. Los fragmentos de los ácidos nucleicos complementarios pueden tener dicha longitud promedio. Los fragmentos pueden generarse por medios físicos o químicos, como se conoce en la técnica de la NGS. En el caso de ácidos nucleicos pequeños, incluidos fragmentos como los obtenidos durante la NGS, se prefiere ligar adaptadores a los ácidos nucleicos que pueden utilizarse como secuencias de hibridación para cebadores o sondas. Dichos adaptadores también pueden contener secuencias características, tales como códigos de barras, para identificar el ácido nucleico pequeño mediante un marcador. Los códigos de barras pueden proporcionar un marcador para el origen de la muestra de la que se obtuvo el APN o de la molécula de APN o su ácido nucleico complementario que era un fragmento (origen del fragmento). Tales códigos de barras pueden ser útiles en la secuenciación multiplexada, en la que se secuencian muchos ácidos nucleicos de secuencia diferente, tal como una pluralidad de ácidos nucleicos complementarios diferentes y/o una pluralidad de fragmentos de uno o más ácidos nucleicos complementarios. Dicha pluralidad puede ser, por ejemplo, de 2 a 1000 ácidos nucleicos o más. Otra posibilidad, que no requiere necesariamente adaptadores, consiste en hibridar cebadores o sondas con la secuencia complementaria de ácido nucleico que corresponde al APN. Dichos cebadores o sondas pueden hibridarse con secuencias conocidas o hibridarse al azar, por ejemplo, utilizando cebadores aleatorios. Los cebadores aleatorios se describen más adelante en relación con el kit inventivo, y cualquier cebador aleatorio de este tipo puede utilizarse en el procedimiento inventivo.
[0101] En una realización preferida de la invención, el APN de una célula individual se identifica según la invención. En consecuencia, el APN de una célula se aísla y se mantiene separado del APN de otras células. "Mantener separado el APN" significa que el APN de la célula investigada permanece identificable sin mezclar la información de secuenciación del APN de la célula investigada con la información de secuenciación de otras células. Esto puede conseguirse separando físicamente el APN o mediante marcaje, especialmente marcando el APN o los ácidos nucleicos complementarios con un marcador, por ejemplo, mediante un código de barras, que identifique la célula de interés. Esto permite el análisis del metabolismo del APN de células individuales. El análisis de células individuales puede realizarse mediante procedimientos de secuenciación de células individuales (Eberwineet al.,Nat. Methods, 11 (1): 25-27). Como alternativa a la secuenciación, también es posible preparar los ácidos nucleicos complementarios o sus fragmentos, preferente pero no necesariamente con adaptadores, en un banco. A continuación, el banco puede secuenciarse de forma independiente o destinarse a otros usos.
[0103] La modificación inventiva, tal como la alquilación específica de tiol, provoca la incorporación "errónea" cuantitativa de nucleótidos complementarios, que ahora forman patrones de enlace de hidrógeno diferentes como se ha descrito anteriormente. Por ejemplo, puede incorporarse guanosina en lugar de adenosina a través de la unión del ácido nucleico complementario de la nucleobase modificada (por ejemplo, 4-tiouridina alquilada), tal como durante la transcripción o la transcripción inversa. Pese a ello, la procesabilidad de la transcriptasa (inversa) no suele verse afectada, ya que el nucleótido con un apareamiento de bases alternativo puede amplificarse junto con su APN sin más obstáculos. Se prefieren las combinaciones con una segunda modificación tras una primera modificación enzimática
(por ejemplo, mediante la incorporación de nucleobases modificadas). Tal combinación se realiza con protocolos de mareaje metabólico con s4U bien establecidos y no tóxicos como los mencionados anteriormente.
[0105] El procedimiento de secuenciación inventivo que conduce a un cambio de secuencia en el ácido nucleico complementario debido a la nucleobase modificada puede acoplarse a procedimientos de secuenciación de alto rendimiento disponibles, tales como NGS. Los cambios en la secuencia, en particular si son incompletos o parciales, que difieren entre distintas moléculas individuales de APN/ácidos nucleicos complementarios pueden identificarse mediante procedimientos computacionales disponibles. Por ejemplo, las conversiones T>C (debidas a modificaciones de U que conducen a un mayor apareamiento de bases G) pueden rastrearse en conjuntos de datos de secuenciación de última generación. Tales procedimientos altamente automatizados, en combinación con el análisis informatizado, permiten a la invención proporcionar un acceso rápido a la cinética de procesamiento del ARN intracelular, una aplicación preferida de la invención. La invención puede describir con precisión la producción transcripcional dependiente de la ARN polimerasa II debido al apareamiento de bases complementarias. Conocer la cinética intracelular de la biogénesis, el procesamiento y el recambio del ARN es fundamental para desentrañar las bases moleculares de los cambios en los patrones de expresión génica que afectan a prácticamente todos los procesos biológicos de la vida.
[0107] En consecuencia, en una realización preferida, el procedimiento inventivo puede usarse para determinar modificaciones o alteraciones fácilmente modificables de APN en células. Dichas "alteraciones fácilmente modificables" se refieren, por ejemplo, al procedimiento en varias etapas descrito anteriormente, en el que una primera modificación (también denominada alteración) se realiza en una célula y una modificación posterior se lleva a cabo en un segundo o ulterior paso, normalmente fuera de una célula tras el aislamiento del APN.
[0109] Preferentemente, el procedimiento inventivo se utiliza para modificar ARN (en forma de APN) con al menos una primera modificación/alteración realizada en una célula, en particular en célula viva. Esto permite rastrear los cambios de expresión del ARN, ya que el ARN expresado se modifica.
[0111] La expresión regulada de la información genética es fundamental para mantener la homeostasis celular, proporciona flexibilidad celular para responder a la alteración de las condiciones ambientales y, si está desregulada, contribuye a enfermedades humanas, tales como el cáncer. Estos procesos biológicos fundamentales se basan en acontecimientos moleculares estrechamente regulados que controlan la cinética relativa de la transcripción, el procesamiento y la degradación del ARN de forma específica para cada transcrito.
[0113] El conjunto del ARN celular, que abarca una miríada de especies de ARN (incluidos ARNm o ARN no codificantes, tales como los microARN), se define por la transcripción de loci seleccionados en el genoma, y puede evaluarse cualitativa y cuantitativamente mediante técnicas de perfilado de ARN, tales como la secuenciación de alto rendimiento. Sin embargo, la medición de la abundancia de los niveles de ARN en estado estacionario no refleja con exactitud la actividad transcripcionalper se.De hecho, la estabilidad del ARN desempeña un papel fundamental en la determinación de la abundancia relativa de cualquier molécula de ARN. Por tanto, los procedimientos para medir las tasas de transcripción y de descomposición del ARN a escala genómica son útiles para desentrañar la dinámica de la expresión del ARN y sus mecanismos reguladores subyacentes. Según la invención, es posible determinar la cinética intracelular de la biogénesis y el recambio del ARN.
[0115] El ARN puede ser alterado o modificado por el propio metabolismo de una célula, por ejemplo, mediante la incorporación de nucleótidos alterados o modificados en ARN procesado de forma natural. Tales alteraciones pueden utilizarse para introducir selectivamente las modificaciones inventivas que (solas o después de otra modificación) cambian el comportamiento de generación del enlace de hidrógeno. Debido a la influencia metabólica, este procedimiento se denomina "secuenciación metabólica", en caso de que el nucleótido modificado se secuencie a continuación. La etapa de secuenciación o, en general, cualquier etapa de apareamiento de bases con un (poli)nucleótido complementario puede automatizarse y procesarse en un procedimiento de secuenciación de alto rendimiento como el mencionado anteriormente. La invención proporciona un protocolo de marcaje metabólico compatible con la secuenciación de alto rendimiento que es adecuado para determinar la cinética intracelular de la biogénesis y el recambio del ARN. Mide con precisión la producción transcripcional poliadenilada dependiente de la ARN polimerasa II y recapitula las firmas globales de regulación génica postranscripcional, resolviendo así el problema de proporcionar cinéticas de expresión de ARN (incluida la biogénesis y el recambio) en una célula con alta resolución temporal.
[0117] La célula puede ser cualquier célula, tal como una célula bacteriana, incluidas células eucariotas y procariotas, células gramnegativas y grampositivas, células fúngicas, células de algas, células vegetales, células animales, células de mamíferos, tales como células de roedores, células de primates, células humanas, células no humanas, células arqueobacterianas, células aviares, células de anfibios, tales como células de ranas, células de reptiles, células de marsupiales.
[0119] Es posible seguir los cambios mediante el control temporal de la modificación, por ejemplo, una fase de expresión de ARN celular sin modificación se compara con la fase de expresión de ARN celular con modificación. Dichas fases se comparan preferentemente en la misma célula o cultivo celular. Por ejemplo, a una fase con modificación le sigue una fase sin modificación o viceversa. Por consiguiente, en una realización preferida de la invención, una o más células se cultivan en al menos dos fases de cultivo, en las que una fase de cultivo comprende la incorporación de un nucleótido
modificado en el ARN biosintetizado, que se modifica por adición o eliminación de un compañero de enlace de hidrógeno; y otra fase de cultivo que carece de dicha incorporación del nucleótido modificado en el ARN biosintetizado. También es posible que la "otra fase de cultivo" comprenda la incorporación de un nucleótido modificado en el ARN biosintetizado, pero a una concentración diferente, por ejemplo, menor, que en la otra fase de cultivo. La concentración diferente o inferior a la de la otra fase debería ser suficiente para observar una diferencia (en particular, una concentración diferente) en la incorporación de nucleótidos modificados en el ARN biosintetizado. En consecuencia, el procedimiento inventivo puede definirse como un procedimiento de identificación de un ácido polinucleico (APN) que comprende las etapas de expresar un APN en una célula; modificar una o más nucleobases del APN; aislar el APN de la célula; opcionalmente modificar aún más el APN; en el que la modificación o modificaciones antes o después del aislamiento o ambas añaden o eliminan un compañero de enlace de hidrógeno de una o más nucleobases, alterando así la capacidad de apareamiento de bases de dichas una o más nucleobases; llevar a cabo el apareamiento de bases de un ácido nucleico complementario con el APN, incluido el apareamiento de bases al menos a una nucleobase modificada; identificar la secuencia del ácido nucleico complementario al menos en la posición que es complementaria con al menos una nucleobase modificada. En particular, se prefiere el marcaje metabólico (es decir, la modificación por el metabolismo de una célula, por ejemplo, a través de sus enzimas, tales como las ARN polimerasas) mediante acontecimientos de incorporación de 4-tiouridina. Esto se puede utilizar para cambiar el comportamiento de apareamiento de bases de U.
[0121] En particular se prefiere el procedimiento en al menos dos fases de cultivo de células, en el que, en al menos dos fases de cultivo, se facilitan diferentes niveles de modificación del APN, en particular la modificación del ARN. Esto puede lograrse proporcionando a la célula diferentes concentraciones de la nucleobase modificada, permitiendo así que la célula incorpore la nucleobase modificada a diferentes niveles o concentraciones en el APN, especialmente en el ARN. Como en el caso anterior, preferentemente la nucleobase modificada es una nucleobase modificada con tiol. El nivel de modificación del APN en una fase puede ser nulo. Las fases, especialmente las de modificación del APN, deben tener un periodo de tiempo preestablecido para dicha modificación del APN. Comparando la incorporación entre las distintas fases, es posible calcular un índice de recambio en el periodo de tiempo preestablecido. En una realización preferida particular, se calcula un índice de recambio o degradación basado en la incorporación de la nucleobase modificada en el APN en al menos una fase en comparación con la otra fase. Preferentemente, las fases son fases de cultivo consecutivas.
[0123] Otra comparación puede ser entre fases de cultivo de diferentes células. Dicha comparación permite estimar la expresión diferencial y el recambio de APN entre estas células. Una de las células o grupo de células puede ser un control y otra célula u otro grupo de células puede ser la célula candidata o el grupo de células objeto de investigación. Ambas células o grupo de células pueden tener una fase de incorporación de nucleobases modificadas al APN, que se compara. Preferentemente, dicha fase de incorporación se controla proporcionando a las células nucleobases modificadas para su incorporación al APN. Preferentemente, se suministran las mismas cantidades de nucleobases modificadas a cada célula o a cada grupo de células, lo que permite comparar el metabolismo celular. Preferentemente, a una fase de incorporación le sigue una fase de no incorporación, por ejemplo, dejando de suministrar a la célula o grupo de células más nucleobases modificadas. También es posible que a una fase de incorporación le siga otra de incorporación reducida o de incorporación a distintos niveles. Cualquier cambio en los niveles de incorporación de las nucleobases modificadas en el APN va seguido de una adaptación del metabolismo de la célula, que puede seguirse mediante el procedimiento inventivo. Por ejemplo, si a una fase de incorporación le sigue una fase de menor incorporación o de nula incorporación, entonces es posible seguir la degradación del APN modificado. Si a una fase de incorporación nula o limitada le sigue una fase de incorporación o una incorporación superior a la incorporación limitada, entonces es posible seguir la formación del APN modificado.
[0125] Por consiguiente, un uso del procedimiento inventivo consiste en comparar secuencias identificadas del ácido nucleico complementario al menos en la posición que es complementaria con al menos una nucleobase modificada (como se ha descrito anteriormente) en al menos dos células o en al menos dos fases de crecimiento diferentes en una célula, en donde dichas al menos dos células o fases de crecimiento presentan expresión diferencial (generalmente expresión génica, incluidos ARNm o expresión de ARN regulador) entre dichas al menos dos células o dichas fases de crecimiento. Dicha expresión diferencial (génica) puede ser causada por la inhibición o estimulación de al menos un gen en una célula. Este procedimiento puede utilizarse para detectar los efectos de la expresión diferencial de una determinada perturbación en el metabolismo celular. Dicha expresión diferencial puede ser de un gen desconocido, tal como en un procedimiento de cribado, en el que se investigan inhibidores o activadores reguladores o cualquier otra sustancia con un efecto fenotípico para detectar efectos genéticos concretos en una célula. En otras realizaciones de este procedimiento, el gen diana puede ser conocido y se investigan otros efectos secundarios sobre la expresión génica de otros genes. Por ejemplo, el gen conocido puede ser un gen regulador conocido, tal como un oncogén o un gen supresor de tumores.
[0127] La célula o grupo de células puede estar en un cultivoin vitroo en un organismo vivo, tal como una planta, una célula bacteriana, una célula fúngica, una célula de alga, un animal no humano o humano,in vivo.En el caso de célulasin vivo, las nucleobases modificadas pueden suministrarse a la célula administrando las nucleobases modificadas al organismo, por ejemplo, sistémicamente, tal como a un sistema vascular, o tópicamente a un órgano de interés del organismo. En consecuencia, es posible seguir el metabolismo del APNin vivo,o en un órgano concreto de interés. A continuación, el APN puede aislarse del organismo, por ejemplo, mediante una biopsia o, en el caso del APN secretado, a partir de una muestra de líquido corporal, o sacrificando a un organismo no humano. Preferentemente, el
APN de células individuales del organismo se aísla y analiza de acuerdo con el procedimiento inventivo, por ejemplo, mediante el marcaje y/o la generación de bancos y/o la secuenciación de células individuales como se ha mencionado anteriormente. Cualquier descripción de las fases de cultivo se aplica también al tratamientoin vivoy se denomina "fase de crecimiento". Las "fases de crecimiento" no requieren el crecimiento de las células ni su multiplicación, sino que se refieren al metabolismo o "crecimiento" del APN que se identifica y analiza.
[0129] La comparación de diferentes niveles de APN y recambio de APN es importante para dilucidar las diferencias en el metabolismo celular entre los diferentes estados en los que se encuentran las células durante el desarrollo y la enfermedad de un organismo. Poder medir una tasa de recambio excesiva de los APN puede ayudar a dilucidar qué vías están activas y cuáles son menos activas o inactivas. A este respecto, la tasa de recambio proporciona una medida adicional a la medición de la concentración en estado estacionario del APN, en particular ARN, midiendo sólo la concentración del APN, tal como ARNm presente en una célula o tejido u órgano.
[0131] Preferentemente, el APN biosintetizado, preferentemente ARN, de las dos fases de cultivo se recoge de dichas células, preferentemente también se mezclan, y el apareamiento de bases de un ácido nucleico complementario con el APN comprende la generación de hebras de ácido polinucleico complementarias, preferentemente hebras de ADN, por transcripción, tal como transcripción inversa en el caso de ARN, como APN.
[0133] Una ventaja concreta de la invención es que el APN creado con modificación y el APN comparable sin modificación o con menos modificación, o los respectivos ácidos nucleicos complementarios, no necesitan separación. El apareamiento de bases del APN con los ácidos nucleicos complementarios puede realizarse en una mezcla de APN modificado y APN no modificado. La secuencia del APN/ácidos nucleicos complementarios puede entonces determinarse de modo combinado, porque la secuencia/identidad de los ácidos nucleicos complementarios puede determinarse en ambos casos (con y sin modificación) y, por comparación, pueden inferirse los acontecimientos de modificación. Dicha comparación es preferentemente una comparación de secuencias informatizada. El procedimiento inventivo, especialmente preferido según su realización de apareamiento de bases con al menos una nucleobase modificada que conduce al apareamiento de bases con otro nucleótido que el apareamiento de bases con una nucleobase que no ha sido modificada, comprende además determinar la secuencia de las hebras del ácido polinucleico complementario y comparar las secuencias de las hebras, en las que un ácido nucleico complementario alterado como resultado de la modificación por adición o eliminación de un compañero de enlace de hidrógeno puede identificarse por comparación con el ácido nucleico complementario sin modificación. Preferentemente, las secuencias de nucleótidos se determinan como fragmentos, como los utilizados en NGS y la secuenciación de alto rendimiento. Las secuencias que se van a determinar (que muchas portan la posición complementaria con dicha al menos una nucleobase modificada) pueden tener una longitud de 10 nt a 500 nt, preferentemente de 12 nt a 250 nt o de 15 nt a 100 nt.
[0135] La identificación informatizada de la secuencia del ácido nucleico complementario al menos en la posición que es complementaria con al menos una nucleobase modificada puede comprender una comparación con una secuencia de un APN no modificado. Dichas secuencias comparativas pueden obtenerse de bases de datos de secuencias, tales como en EBI o en NCBI, o determinarse por generación de APN sin introducir una modificación, tal como por apareamiento de bases naturales con bases complementarias naturales. En el kit inventivo puede incluirse un producto de programa informático para dicha comparación o un medio legible por ordenador para el procedimiento.
[0137] La divulgación proporciona un kit adecuado para realizar un procedimiento de la invención que comprende una nucleobase modificada con tiol y un agente alquilante adecuado para la alquilación de la nucleobase modificada con tiol en el grupo tiol, en el que el agente alquilante comprende un donante o aceptor del enlace de hidrógeno, preferentemente en el que el agente alquilante es cualquiera de los mencionados anteriormente, y se prefiere especialmente la yodoacetamida. Sin embargo, cualquiera de los agentes alquilantes descritos anteriormente, y agentes adecuados para cualquiera de las modificaciones anteriores, en particular nucleótidos modificados con la base modificada, tales como los nucleótidos modificados con tiol, pueden incluirse en el kit inventivo.
[0139] El kit comprende preferentemente además cebadores, nucleótidos seleccionados entre A, G, C y T, una transcriptasa inversa o una combinación de los mismos, preferentemente todos estos componentes. Algunos ejemplos de cebadores son los cebadores aleatorios, que son mezclas de cebadores seleccionados al azar. Dicha mezcla de cebadores aleatorios puede tener al menos 50 o al menos 100, al menos 500 cebadores diferentes. Los cebadores aleatorios pueden contener hexámeros aleatorios, pentámeros aleatorios, octámeros aleatorios, etc.
[0141] El kit puede comprender además una APN polimerasa y preferentemente además un tampón para la polimerización de la polimerasa. La polimerasa puede ser ADN o ARN polimerasa.
[0143] El kit inventivo también puede comprender ácidos nucleicos adaptadores. Dichos adaptadores pueden ligarse a ácidos nucleicos para generar ácidos nucleicos complementarios unidos al adaptador, tal como se ha descrito anteriormente. Los adaptadores pueden incluir uno o varios códigos de barras como los descritos anteriormente. El kit también puede incluir una ligasa, tal como una ADN ligasa.
[0145] Los componentes del kit pueden proporcionarse en recipientes adecuados, tales como viales o matraces.
[0147] El kit también puede comprender instrucciones o un manual para realizar cualquiera de los procedimientos inventivos.
[0148] La presente invención se describe además mediante las siguientes figuras y ejemplos, sin estar necesariamente limitada a estos aspectos de la invención.
[0150] Figuras:
[0152] Figura 1. Esquema de la alquilación ligada a tiol (SH) para la secuenciación metabólica del ARN.Las células se tratan con 4-tiouridina (s4U), que al ser captada por las células se incorpora al ARN recién transcrito. Tras la preparación del ARN total en determinados momentos, los residuos de s4U presentes en las nuevas especies de ARN generadas se carboxiamidometilan mediante un tratamiento con yodoacetamida (IAA), lo que da lugar a un grupo voluminoso en la interfaz de apareamiento de bases. Cuando se combina con protocolos de preparación de bancos de ARN bien establecidos, la presencia del grupo voluminoso en los sitios de incorporación de s4U conduce a la incorporación errónea cuantitativa y específica de G a través de s4U alquilada durante la transcripción inversa ("reverse transcription", RT). Los sitios que contienen s4U pueden identificarse bioinformáticamente en bancos de secuenciación de alto rendimiento con resolución de un nucleótido individual llamando a las transiciones de T a C.
[0154] Figura 2. Derivatización con 4-tiouracilo por alquilación ligada a tiol. (A)El 4-tiouracilo (s4U) reacciona con el compuesto reactivo con tioles yodoacetamida (IAA), uniendo un grupo carboxiamidometilo al grupo tiol en s4U como resultado de una reacción de sustitución nucleofílica (S<n>2). Se indican los máximos de absorción del educto (4-tiouracilo; S4U; Amáx “ 335 nm) y del producto (4-tiouracilo carboxiamidometilado; *s4U; Amáx “ 297 nm).(B)Espectros de absorción de 4-tiouracilo (s4U) en ausencia y presencia de la concentración indicada de yodoacetamida (IAA). Se incubó s4U 1 mM con la concentración indicada de IAA durante 1 h a 37 °C en presencia de tampón fosfato de sodio 50 mM (pH 8,0) y DMSO al 10 %. Los datos representan la media ± De de al menos tres réplicas independientes.(C)Cuantificación de la absorción a 335 nm como se muestra en (B). Se indican los valores dep(prueba de latde Student).(D)Espectros de absorción de 4-tiouracilo 1 mM (s4U) en ausencia y presencia de yodoacetamida 10 mM (IAA) tras una incubación a la temperatura indicada durante 5 min en presencia de tampón fosfato de sodio 50 mM (pH 8,0) y DMSO al 10 %. Los datos representan la media ± DE de al menos tres réplicas independientes.(E)Cuantificación de la absorción a 335 nm como se muestra en (D). Se indican los valores dep(prueba de latde Student).(F)Espectros de absorción de 4-tiouracilo 1 mM (s4U) en ausencia y presencia de yodoacetamida 10 mM (IAA) tras una incubación a 37 °C durante el tiempo indicado en presencia de tampón fosfato de sodio 50 mM (pH 8,0) y DMSO al 10%. Los datos representan la media ± DE de al menos tres réplicas independientes.(G)Cuantificación de la absorción a 335 nm como se muestra en (F). Se indican los valores dep(prueba de latde Student).(H)Espectros de absorción de 4-tiouracilo 1 mM (s4U) en ausencia y presencia de yodoacetamida 10 mM (IAA) tras una incubación a 50 °C durante 2 min en presencia de tampón fosfato de sodio 50 mM (pH 8,0) y la cantidad indicada de DMSO. Los datos representan la media ± DE de al menos tres réplicas independientes.(I)Cuantificación de la absorción a 335 nm como se muestra en (H). Se indican los valores dep(prueba de latde Student).(J)Espectros de absorción de 4-tiouracilo 1 mM (s4U) en ausencia y presencia de yodoacetamida 10 mM (IAA) tras una incubación a 50 °C durante 5 min en presencia de tampón fosfato de sodio 50 mM con el pH indicado y DMSO al 10 %. Los datos representan la media ± DE de al menos tres réplicas independientes.(K)Cuantificación de la absorción a 335 nm como se muestra en (J). Se indican los valores dep(prueba de latde Student).(L)Espectros de absorción de 4-tiouracilo 1 mM (s4U) en ausencia y presencia de yodoacetamida 10 mM (IAA) tras una incubación a 50 °C durante 15 min en presencia de tampón fosfato de sodio 50 mM (pH 8,0) y DMSO al 50 % (condiciones óptimas de reacción [rxn]). Los datos representan la media ± DE de al menos tres réplicas independientes.(M)Cuantificación de la absorción a 335 nm como se muestra en (J). Se indican los valores dep(prueba de latde Student).
[0155] Figura 3. Derivatización con 4-tiouridina por alquilación ligada a tiol. (A)La 4-tiouridina (s4U) reacciona con el compuesto reactivo con tioles yodoacetamida (IAA), uniendo un grupo carboxiamidometilo al grupo tiol en s4U como resultado de una reacción de sustitución nucleofílica (S<n>2).(B)Análisis de la alquilación de s4U por espectrometría de masas. Se incubaron 40 nmoles de 4-tiouridina con la concentración indicada de yodoacetamida en tampón de reacción convencional (NaPO450 mM (pH 8), DMSO al 50 %) a 50 °C durante 15 min. La reacción se detuvo con ácido acético al 1 %. Las muestras acidificadas se separaron en un sistema HPLC Ulitimate U300 BioRSLC (Dionex; Thermo Fisher Scientific), empleando una columna de pentafluorofenilo Kinetex F5 (150 mm x 2,1 mm; 2,6 pm, 100 A; Phenomenex) con un caudal de 100 pl/min. Los nucleósidos se analizaron en línea utilizando un espectrómetro de masas TSQ Quantiva (Thermo Fisher Scientific) tras ionización por electronebulización con los siguientes SRM: 4-Tiouridina m/z 260 ^ 129, 4-Tiouridina alquilada m/z 318 ^ 186. Los datos se interpretaron utilizando el paquete de software Trace Finder (Thermo Fisher Scientific) y se validaron manualmente.(C)Cuantificación de dos experimentos independientes en dos réplicas técnicas mostradas en (B). La fracción de s4U alquilada a las concentraciones de IAA indicadas representa las intensidades de señal normalizadas relativas en los tiempos de retención de los picos de s4U y s4U alquilada. Los datos representan la media ± DE.
[0157] Figura 4. La alquilación del ARN que contiene 4-tiouridina no afecta a la procesabilidad de la transcripción inversa. (A)Para determinar el efecto de la alquilación de s4U sobre la procesabilidad de la transcriptasa inversa, se empleó un ARN sintético de 76 nt de longitud que contenía una incorporación de 4-tiouridina (s4U) en una única posición (p9) dentro de la secuencia del ARN pequeñodme-let-7deDrosophila,flanqueada por secuencias adaptadoras 5' y 3'. La transcripción inversa se ensayó antes y después del tratamiento con yodoacetamida (IAA) utilizando transcriptasas inversas disponibles en el mercado siguiendo la extensión de un oligonucleótido de ADN marcado con 32P 5', inverso y complementario en secuencia a la secuencia adaptadora 3'.(B)Las reacciones preparadas en (A) se analizaron mediante electroforesis en gel de poliacrilamida seguida de imágenes de fósforo. Se muestran los resultados de la extensión con cebadores de ARN con y sin s4U en presencia y ausencia de tratamiento con IAA, realizada con las transcriptasas inversas Superscript II (SSII), Superscript III (SSIII) o Quant-seq RT (QS). Se muestra la secuencia del componente de ARN excluyendo las secuencias adaptadoras; la posición del residuo s4U se indica en rojo. La secuenciación del ARN se realizó añadiendo los ddNTP indicados a la reacción de transcripción inversa. PR, cebador de ADN marcado con 32P 5'; bg, señal de parada de fondo; *p9, señal de terminación en la posición 9; FL, producto de longitud completa.(C)Cuantificación de tres réplicas independientes del experimento mostrado en (B). La relación entre la señal de abandono (+ frente a - tratamiento con IAA) en p9 tras la normalización y la señal de abandono de fondo precedente se determinó para el ARN de control y el que contenía s4U empleando las transcriptasas inversas indicadas. Los datos representan la media ± DE. El análisis estadístico se realizó mediante la prueba de latde Student.
[0159] Figura 5. La alquilación permite la identificación cuantitativa de las incorporaciones de s4U en el ARN con una resolución de un solo nucleótido. (A)El ARN con o sin incorporación de 4-tiouridina (s4U) en una única posición (p9) se trató con yodoacetamida (IAA) y se sometió a transcripción inversa y extracción en gel del producto de longitud completa, seguido de amplificación por PCR y secuenciación de alto rendimiento (HTP).(B)Se muestran las tasas de mutación para cada posición de un ARN de control (paneles de la izquierda) y un ARN que contiene s4U (paneles de la derecha) en presencia o ausencia de tratamiento con yodoacetamida (IAA) empleando la transcriptasa inversa indicada. Las barras representan las tasas de mutación promedio ± DE de tres réplicas independientes. Se indica el número de lecturas secuenciadas en cada réplica (r1-r3). Se muestra la identidad del nucleótido que aparece en p9.(C)Tasas de mutación para las mutaciones indicadas en presencia o ausencia de tratamiento con yodoacetamida (IAA) empleando Superscript II (SSII), Superscript III (SSIII) o transcriptasa inversa Quant-seq (QS). Las tasas de mutación se promediaron para todas las posiciones con la misma identidad de nucleótidos, tanto para los oligonucleótidos de ARN que contienen s4U como para los que no lo contiene. Se indican los valores dep(determinados por la prueba de latde Student). N.s., no significativo (p > 0,05).
[0161] Figura 6. Efecto del tratamiento con s4U sobre la viabilidad de las células mES y el marcaje metabólico del ARN. (A)Se muestra la viabilidad de células mES cultivadas en presencia de la concentración indicada de 4-tiouridina (s4U) durante 12 h (izquierda) o 24 h (derecha) en relación con las condiciones sin tratar. La concentración final utilizada en los experimentos posteriores (100 pM) se indica con el triángulo y la línea de puntos.(B)Cuantificación de la incorporación de s4U en el ARN total tras el marcaje metabólico con s4U durante el tiempo indicado en un pulso, o tras la sustitución del medio en una persecución con uridina. La incorporación de s4U se determinó mediante análisis por HPLC tras la digestión y desfosforilación del ARN total a nucleósidos individuales. Se muestran las intensidades de la señal de s4U restadas del fondo a 330 nm normalizadas al punto temporal de marcaje por pulsos de 24 h y la absorbancia de las intensidades de la señal de uridina a 260 nm. Se muestra el tiempo de retención en columna (min) en relación con los máximos de adsorción de s4U.(C)Tasa de sustitución de s4U en comparación con la uridina no modificada determinada por HPLC. Incorporación de s4U en el ARN total a lo largo de todos los puntos temporales de un experimento de marcaje de persecución y pulso metabólico de s4U en células mES. Los valores representan la media ± DE de tres réplicas independientes. Se indican las tasas máximas de incorporación tras el marcaje de 24 h.
[0162] Figura 7. Protocolo de preparación de un banco de secuenciación del extremo 3' de ARNm Quantseq.Quant-seq utiliza<a>R<n>total como entrada, por lo que no es necesario el enriquecimiento previo con poli(A) ni la supresión del ARNr. La generación del banco se inicia mediante cebado con oligo(dT). El cebador ya contiene secuencias conectoras compatibles con Illumina (mostradas en verde, arriba: "adaptador", etapa siguiente: última curva). Tras la síntesis de la primera hebra, se retira el ARN y se inicia la síntesis de la segunda hebra mediante cebado aleatorio y una ADN polimerasa. El cebador aleatorio también contiene secuencias conectoras compatibles con Illumina (en azul). No se requiere purificación entre la síntesis de la primera y la segunda hebra. El tamaño del inserto está optimizado para lecturas más cortas (SR50 o SR100). La síntesis de la segunda hebra va seguida de una etapa de purificación basada en microesferas magnéticas. A continuación, se amplifica el banco, introduciendo las secuencias necesarias para la generación de agrupaciones (mostradas en rojo y morado). Los códigos de barras externos (BC) se introducen durante la etapa de amplificación de la PCR para la multiplexación.
[0164] Figura 8. Acontecimientos de incorporación de s4U en ARNm de células mES tras marcaje metabólico. (A)Captura de pantalla representativa del explorador del genoma para tres bancos independientes de ARNm generados a partir de ARN total de células mES, preparados mediante secuenciación convencional de ARNm (tres paneles superiores), análisis Cap de expresión génica (CAGE; tres paneles centrales) y secuenciación del extremo 3' del ARNm (tres paneles inferiores). Se muestra una zona representativa del genoma del ratón que codifica el gen Trim 28.(B)Ampliación de la zona del genoma que codifica el extremo 3' del ARNm de Trim28, incluida su región 3' no traducida (UTR). Se muestran los gráficos de cobertura de los bancos de secuenciación del extremo 3' del ARNm preparados a partir del ARN total de células mES no tratadas o de
células mES sometidas a mareaje metabólico con s4U durante 24 h, seguido de modificación y secuenciación. Se representa un subconjunto de lecturas individuales subyacentes a los gráficos de cobertura. Las barras rojas dentro de las lecturas individuales representan conversiones T>C; las barras negras representan cualquier mutación distinta de T>C.
[0166] Figura 9. Análisis global de las tasas de mutación en la secuenciación del extremo 3' del ARNm tras el marcaje metabólico del ARN con s4U en células mES.Los bancos de secuenciación del extremo 3' del ARNm generados a partir del ARN total de células mES antes y después del marcaje metabólico con s4U durante 24 h se cartografiaron en regiones no traducidas ("untranslated regions", UTR) 3' anotadas y se determinó cualquier tasa de mutación concreta para todos los genes expresados. Los diagramas de cajas de Tukey muestran las mutaciones por UTR en porcentaje. No se muestran los valores atípicos. Se indica la mediana de la frecuencia observada para cada mutación individual. El análisis estadístico del aumento de las conversiones T>C se determinó mediante la prueba de Mann-Whitney.
[0168] Figura 10. Determinación de la producción transcripcional poliadenilada en células mES. (A)Configuración experimental para determinar la producción transcripcional de ARNm poliadenilado en células mES por la invención.(B)Abundancia relativa de transcritos que contienen la conversión T>C ("SLAM-seq") y transcritos que no contienen la conversión T>C ("Estado estacionario") en recuentos por millón (cpm), detectados mediante secuenciación del extremo 3' del ARNm como se describe en (A). Los transcritos sobrerrepresentados en SLAM-seq en relación con el estado estacionario se indican en rojo (alta producción transcripcional; n = 828). Los transcritos más abundantes en estado estacionario se indican en amarillo (alta expresión en estado estacionario; n = 825). Se muestran los transcritos correspondientes a las agrupaciones de miARN primarios específicos de células mES miR-290 y miR-182.(C)Comparación de 828 genes que estaban sobrerrepresentados entre el ARN recién transcrito (SLAM-seq) con los 825 genes principales detectados en estado estacionario mediante secuenciación convencional del extremo 3' del ARNm (estado estacionario) por lo que se refiere a los factores de transcripción subyacentes predichos (mediante Ingenuity Pathway Analysis; www.Ingenuity.com), así como las vías moleculares (mediante Enrichr).
[0170] Figura 11. Análisis global de la estabilidad del ARNm en células mES. (A)Configuración experimental para determinar la estabilidad del ARNm poliadenilado en células mES por la invención.(B)Análisis global de las semividas del ARNm en células mES. La fracción relativa de la conversión T>C que contenía lecturas cartografiadas en las UTR 3' anotadas de 9430 genes expresados abundantemente en células mES se normalizó al punto temporal del marcaje por pulsos de 24 h y se ajustaron los cuartiles intermedio, superior e inferior a lo largo del tiempo mediante cinética de descomposición exponencial simple, lo que reveló una mediana de la semivida del ARNm (~ti/2) de 4,0 h.(C)Cálculo de la semivida para ejemplos de transcritos individuales. Se muestra la fracción promedio de las lecturas que contienen conversiones T>C relativas al punto temporal de pulso de 24 h de tres réplicas independientes para Junb, Id1, Eif5a y Ndufa7 y se ajustan a una cinética de descomposición exponencial simple. Se indica la semivida promedio (t-io) de cada transcrito determinada mediante ajuste de curvas.(D)Representación en diagrama de cajas de Tukey de la semivida del ARNm determinada por secuenciación del extremo 3' del ARNm para transcritos clasificados según sus términos GO asociados en regulación (es decir, regulación transcripcional, transducción de señales, ciclo celular y desarrollo) o mantenimiento (es decir, matriz extracelular, proceso metabólico y síntesis de proteínas). Se indica el número de transcritos de cada categoría. Se indica el valor de p (determinado mediante la prueba de Mann-Whitney).
[0172] Figura 12. Alquilación ligada a tioles para el marcaje metabólico de ARN pequeños. (A)Captura de pantalla del navegador representativa de genomas para bancos de ARN pequeño generados a partir de ARN total seleccionado por tamaño de células S2 deDrosophila.Se muestra una zona representativa del genoma deDrosophila melanogasterque codifica miR-184. Las posiciones de los nucleótidos que codifican timina (T, rojo) se indican en relación con el extremo 5' de cada especie de ARN pequeño. Se muestran lecturas que representan el 99 % de todas las isoformas 5' para miR-184-3p y -5p y el número respectivo de lecturas se indica en partes por millón (ppm).(B)Los bancos de secuenciación de ARN pequeño generados a partir del ARN total de células de S2 deDrosophilaantes y después del marcaje metabólico con s4U durante 24 h se cartografiaron en miARN anotados y se determinó cualquier tasa de mutación concreta para miARN expresados abundantemente (>100 ppm). Los diagramas de cajas de Tukey muestran las mutaciones por miARN en porcentaje. No se muestran los valores atípicos. Se indica la mediana de la frecuencia observada para cada mutación individual. Se indica el valor de p, determinado por la prueba de Mann-Whitney.
[0174] Figura 13. Cinética intracelular de la biogénesis de microARN. (A)Los microARN se derivan de transcritos de ARN polimerasa II que contienen horquillas (microARN primarios, pri-miARN) mediante el procesamiento secuencial por las enzimas ARNasa III Drosha en el núcleo y Dicer en el citoplasma, lo que da lugar a un dúplex de microARN de aproximadamente 22 nt. El intermedio de procesamiento de la horquilla (microARN precursor, pre-miARN) es exportado desde el núcleo al citoplasma por Ranbp21 de forma dependiente de RanGTP(B)Los gráficos de distribución acumulativa muestran la mediana de las tasas de mutación T>C para 42 miARN expresados abundantemente (izquierda) o 20 miR* (derecha) en bancos de ARN pequeño generados a partir de ARN total de células ago2k° S2 deDrosophilatratadas con s4U durante el tiempo indicado. Los valores depse determinaron mediante la prueba de Kolmogorov-Smirnov (**** =p <10-4). Bgmáx indica la tasa máxima de error de fondo.(C)Se muestra la abundancia promedio de los miARN (izquierda) o miR* (derecha) indicados en lecturas de estado estacionario o que contienen conversiones T>C en los puntos temporales indicados tras el marcaje metabólico por s4U. El número de lecturas normalizado con respecto al total de ARN pequeños se muestra en partes por millón (ppm). Se indica el exceso de tasas de mutación (Mu) por encima del máximo de fondo (bgmáx).(D)Se generaron horquillas de mirtrones a través del corte y empalme de transcritos codificantes de proteínas. Tras el desdoblamiento del lazo del intrón, las horquillas de mirtrones se someten a urilación postranscripcional en el citoplasma, lo que modula la proyección 2nt-3' de los premirtrones, impidiendo la biogénesis del miARN por Dicer.(E)Tasas de mutación T>C (arriba) o lecturas T>C normalizadas para ARN pequeños en partes por millón (ppm) para miARN canónicos (gris) o mirtrones (rojo) en el punto temporal indicado de un experimento de marcaje con s4U. Se indican la mediana y la amplitud intercuartílica. Se indica el valor dep(prueba de Mann-Whitney) (*,p< 0,05; **,p< 0,01; ***,p< 0,001). N.d., no detectado.
[0176] Figura 14. Cinética intracelular de la carga de microARN. (A)Tras su producción, el dúplex de microARN se carga en la proteína Argonauta Ago1. En este proceso, una de las dos hebras, la hebra miR, se retiene selectivamente en Ago1, mientras que la otra hebra, la hebra miR*, es expulsada y degradada. Un miARN monocatenario unido a Ago1 forma el complejo de silenciamiento inducido por miARN ("miRNA-induced silencing complex", miRISC) maduro.(B)Mediana de la acumulación de lecturas que contienen conversiones T>C (en ppm) de 20 pares de miR y miR* abundantemente expresados en el transcurso de un experimento de marcaje metabólico con s4U en célulasago2koS2. Se muestran la mediana y la amplitud intercuartílica para miR (rojo) y miR* (azul). Los valores proceden de dos mediciones independientes. El valor depindica una separación significativa entre miR y miR* según la prueba de Mann Whitney (*,p< 0,05; ****,p< 0,0001).(C)Ampliación del periodo de tiempo mostrado en (B) para miR (rojo, arriba) y miR* (azul, abajo).
[0178] Figura 15. Cinética intracelular del recorte exonucleolítico de miARN. (A)Modelo para la maduración exonucleolítica de miARN enDrosophila.Dicer produce un conjunto de microARN (por ejemplo, miR-34) en forma de dúplex de miARN más largos, de aproximadamente 24 nt, que, al cargarse en Ago1 y eliminarse la hebra miR*, experimentan una maduración exonucleolítica mediada por la exorribonucleasa 3'-a-5' Nibbler para formar un complejo de silenciamiento maduro, regulador de genes e inducido por miARN.(B)Distribución de longitudes en estado estacionario de miR-34-5p en células ago2ko S2 deDrosophilasegún se determina mediante secuenciación de alto rendimiento de ARN pequeños (izquierda, las barras representan la media ± desviación estándar de 18 mediciones; el recuento medio de clones se indica en partes por millón, ppm) o experimentos de hibridación Northern (derecha).(C)Distribución de la longitud de miR-34-5p en bancos preparados a partir de célulasago2koS2 deDrosophilasometidas a marcaje metabólico con s4U durante el tiempo indicado. Se muestra la distribución de longitud de las lecturas que contienen conversiones T>C (marcadas, rojo, arriba) y todas las lecturas (en estado estacionario, negro, abajo). Se indica el número subyacente de lecturas. Los datos muestran la media ± desviación estándar de dos réplicas independientes.(D)Longitud media ponderada de miR-34-5p en bancos preparados a partir de célulasago2koS2 deDrosophilasometidas a marcaje metabólico con s4U durante el tiempo indicado. Los datos representan la media ± desviación estándar de las lecturas que contienen la conversión T>C (marcadas, en rojo) y todas las lecturas (en estado estacionario, en negro). La disminución de la longitud media ponderada de las lecturas que contienen la conversión T>C indica un recorte exonucleolítico (resaltado en gris).(E)Carga de miR-34-5p determinada por la abundancia relativa de lecturas que contienen conversiones T>C en miR-34-5p (hebra miR, rojo) y miR-34-3p (hebra miR*, azul) tras el marcaje metabólico con s4U de células S2 de Drosophila. Se muestra la media ± desviación estándar de dos experimentos independientes. La carga está representada por la separación de miR de miR* y está resaltada por la zona gris.
[0180] Figura 16. Estabilidad diferencial de los miARN. (A)Tras la carga de un dúplex de microARN en Ago1, formando el pre-miRISC, la hebra miR* (azul) se degrada, dando lugar a un complejo de silenciamiento inducido por miARN (miRISC) maduro. La estabilidad exacta de los miARN en los miRlSc sigue siendo una incógnita.(B)Aumento de la tasa de mutación por posición T para 41 miARN abundantemente expresados (rojo, izquierda) y 20 miR* (azul, derecha) a lo largo del del marcaje metabólico con s4U durante un periodo de tiempo en célulasago2koS2 deDrosophila.Para cada ARN pequeño, se determinó la mediana de la tasa de mutación en todas las posiciones T y se normalizó con respecto al punto temporal de 24 horas. Se muestra la mediana y la amplitud intercuartílica. Los valores representan la media de dos réplicas independientes. La mediana de la semivida (t-io) y el intervalo de confianza del 95 % se determinaron mediante el ajuste de una curva exponencial simple.(C)Diagrama de cajas de Tukey que representa la semivida de 41 miR (rojo) y 20 miR* (azul). El valor depse determinó mediante la prueba de Mann-Whitney.(D)Abundancia en estado estacionario y semivida promedio para los miR indicados (rojo) y miR* (azul). La semivida promedio representa la media de dos réplicas independientes. Se presentan las mediciones individuales de la semivida de dos experimentos independientes (r1 y r2). Los datos de semivida que superan el tiempo total de la medición se indican como >24 h.(E)Comparación de los valores de semivida determinados en dos réplicas biológicas independientes para 41 hebras miR (rojo) y 20 hebras miR* (azul). Se muestran el coeficiente de correlación de Pearson (rp) y el valor depasociado.(F)La estabilidad de los microARN contribuye de forma diferencial a la abundancia en estado estacionario de los miARN. Los valores de semivida de 40 miR se
muestran en relación con su abundancia en estado estacionario. Los datos representan la media de dos réplicas biológicas independientes.
[0182] Figura 17. La identidad de la proteína Argonauta determina la estabilidad de ARN pequeños. (A)EnDrosophila,los miARN se cargan preferentemente sobre Ago1 para formar miRISC. Paralelamente, un subconjunto de miR* se carga en Ago2 para formar siRISC. La formación de siRISC va acompañada de la metilación específica de los ARN pequeños unidos a Ago2 en la posición 2' de la ribosa 3' terminal. Se desconoce si la identidad de la proteína Argonauta afecta diferencialmente a la estabilidad de los ARN pequeños.(B)Los gráficos circulares representan la abundancia relativa de diferentes clases de endo-ARNip y miARN en bancos de ARN pequeño de células S2 deDrosophilade tipo salvaje. Se muestran los resultados de un protocolo de clonación convencional (no oxidado, diagrama superior) y de una estrategia de clonación que está enriquecida en ARN pequeños con terminales 3' modificados (oxidado, diagrama inferior). La fracción de miR y miR* se indica para ambos bancos. Se muestra la distribución promedio de 7 conjuntos de datos. Se indica la profundidad promedio del banco.(C)Los mapas térmicos muestran la abundancia relativa de miR (rojo) y miR* (azul) en los bancos indicados (en escala de grises). La proporción de representaciones relativas en los bancos indica la asociación preferente de ARN pequeños con AGO1 (verde) o AGO2 (rojo).(D)Análisis de transferencia Western de células S2 de tipo salvaje (wt), o células S2 con supresión de Ago2 mediante ingeniería genómica CRISPR/Cas9 (ago2ko). La actina representa un control de carga.(E)Abundancia relativa de miR y miR* enriquecidos en Ago2 en células deDrosophilaS2 de tipo salvaje (wt) yago2ko. Se indica la mediana y la amplitud intercuartílica. El valor depse determinó mediante la prueba de Wilcoxon para datos emparejados.(F)Cinética de descomposición de ARN pequeños enriquecidos en Ago2 (izquierda) y Ago1 (derecha) en bancos convencionales preparados a partir del marcaje metabólico con s4U durante un periodo de tiempo en células de tipo salvaje (wt, negro) oago2koS2 (rojo) o a partir de células S2 de tipo salvaje empleando una estrategia de clonación que enriquece en ARN pequeños con terminales 3' modificados (wt oxidado, azul). Se muestran la mediana y la amplitud intercuartílica del ajuste exponencial bifásico o monofásico (como se especifica en el texto principal). Se indica la semivida (t1/2) determinada mediante ajuste de curvas. En el caso de la cinética bifásica, se muestra la contribución relativa de la cinética rápida y lenta.(G)Semivida de los 30 miARN más abundantes en células ago2ko S2 (rojo, Ago1) o de los miR y miR* más abundantes en bancos de ARN pequeño empleando una estrategia de clonación que enriquece en ARN pequeños con terminaciones 3' modificadas (azul, Ago2). Se indica la mediana y la amplitud intercuartílica. El valor depse determinó mediante la prueba de Mann-Whitney.
[0183] Figura 18. Marcaje metabólico con 4-tiouridina en células S2 deD rosoph ila.Cuantificación de la incorporación de s4U en el ARN total tras el marcaje metabólico con s4U durante el tiempo indicado en un experimento de marcaje por pulsos en células S2 deDrosophila. Se muestra la tasa de sustitución de s4U en comparación con la uridina no modificada determinada por HPLC y se determinó como se ha descrito previamente (Spitzeret al.(2014), Meth. Enzymol., 539, 113-161). Los valores representan la media ± DE de tres réplicas independientes. Se indican las tasas máximas de incorporación tras 24 h de marcaje.
[0185] Figura 19. El tratamiento con yodoacetamida no afecta a la calidad de los bancos de ARN pequeño.Los bancos de secuenciación de ARN pequeño generados a partir de ARN total de células S2 deDrosophilaantes y después del tratamiento con yodoacetamida se cartografiaron en miARN anotados y se analizaron los miARN expresados abundantemente (>100 ppm).(A)Se determinó cualquier tasa de mutación concreta para cada miARN procedente de bancos de ARN pequeño de ARN total tratado con yodoacetamida o sin tratar. Los diagramas de cajas de Tukey muestran las mutaciones por miARN en porcentaje. No se muestran los valores atípicos. Se indica la mediana de la frecuencia observada para cada mutación individual.(B)Abundancia de miARN en bancos de ARN pequeño preparados a partir de ARN total tratado con yodoacetamida o sin tratar. Se indica el coeficiente de correlación de Pearson y el valor depasociado.(C)Cambio en número de veces de la expresión para miARN individuales en bancos de ARN pequeño preparados a partir de ARN total tratado con yodoacetamida o sin tratar.
[0187] Figura 20. Frecuencia de incorporación de s4U en ARN pequeños marcados metabólicamente.Los diagramas de cajas de Tukey muestran la fracción de lecturas de conversión T>C que contienen una, dos o tres mutaciones T>C para cada uno de los 71 miARN expresados abundantemente (>100 ppm) en bancos de ARN pequeño preparados a partir de ARN total seleccionado por tamaño de células S2 deDrosophilasometidas a marcaje metabólico con s4U durante 24 h. Se indica la mediana de la fracción de lecturas de conversión T>C.
[0189] Figura 21. El marcaje metabólico con s4U no afecta a la biogénesis ni a la carga de microARN.Representación excesiva o insuficiente de conversiones T>C en posiciones individuales de un ARN pequeño concreto que se deriva del brazo 5p o 3p de un precursor de microARN (izquierda), o que constituye una hebra miR o miR*, según se define por carga selectiva en Argonauta (derecha). Los resultados se derivan de 71 microARN abundantemente expresados (>100 ppm) (correspondientes a 355p-miARN y 36 3p-miARN, o 44 miR y 27 miR*). Las diferencias estadísticamente significativas en la representación relativa se compararon con la población total para la posición indicada mediante la prueba de Mann-Whitney. n.s.,p> 0,05; n.d., no determinado debido al número limitado de puntos de datos.
[0190] Figura 22. La prolongación del miARN precursor contrarresta la biogénesis eficiente de miARN.Correlación entre la uridilación del pre-miARN y las tasas de mutación T>C en los bancos de ARN pequeño SLAM-seq preparados a partir de células ago2ko S2 tras el tratamiento con s4U durante el tiempo indicado. Se muestran el coeficiente de correlación de Pearson (rp) y el valor depasociado.
[0192] Figura 23. Modificación química de la 6-tioguanosina (s6G) con yodoacetamida.Se muestra una reacción química de la 6-tioguanosina con yodoacetamida(A)y las eficiencias de alquilación determinadas por espectrometría de masas tras el tratamiento de la 6-tioguanosina con yodoacetamida(B).
[0194] Figura 24. La alquilación identifica las incorporaciones de s6G en el ARN con una resolución de un solo nucleótido mediante conversiones de G a A. (A)Se trató ARN con o sin incorporación de 6-tioguanosina (s6G) en una única posición (p8) con yodoacetamida (IAA) y se sometió a transcripción inversa y extracción en gel del producto de longitud completa, seguido de amplificación por PCR y secuenciación de alto rendimiento (HTP).(B)Se muestran las tasas de mutación para cada posición de un ARN de control (paneles de la izquierda) y un ARN que contiene s6G (paneles de la derecha) en presencia o ausencia de tratamiento con yodoacetamida (IAA) empleando la transcriptasa inversa indicada. Los valores representan las tasas promedio de mutación ± DE de tres réplicas independientes. Se indica el número de lecturas secuenciadas en cada réplica (r1-r3). Se muestra la identidad del nucleótido que aparece en p8.(C)Tasas de mutación para las mutaciones indicadas en presencia o ausencia de tratamiento con yodoacetamida (IAA) empleando Superscript II (SSII), Superscript III (SSIII) o transcriptasa inversa Quant-seq (QS). Las tasas de mutación se promediaron en todas las posiciones con la misma identidad de nucleótidos tanto para los oligonucleótidos de ARN que contienen s6G como para los que no lo contienen. Se indican los valores dep(determinados por la prueba de latde Student). N.s., no significativo (p > 0,05).
[0196] Figura 25. Cartografiado resuelto en el tiempo de respuestas transcripcionales utilizando SLAM-seq. (A)Ejemplo de flujo de trabajo de un experimento SLAM-seq que cartografía respuestas tras 15 a 60 minutos de tratamiento con flavopiridol (300 nM) en células K562.(B)Cartografiado de lecturas totales y convertidas (>2 T>C) para un gen de bajo recambio, GAPDH sin o con tratamiento con flavopiridol.(C)Gráficos de cajas de los cambios de expresión inducidos por flavopiridol teniendo en cuenta todas las lecturas o lecturas con conversiones >1 y >2 T>C. Los bigotes indican un intervalo del 5-95 %.(D)Esquema simplificado de las vías efectoras BCR/ABL y los inhibidores de cinasas investigados mediante SLAM-seq en células K562 (30 min de pretratamiento, 60 min de marcaje con s4U).(E)Mapa de calor y agrupación jerárquica de los 50 genes más variables regulados al alza y a la baja en SLAM-seq y su comportamiento a nivel de ARNm total en células K562 tratadas con los inhibidores indicados.(F)Semividas estimadas de genes detectados como > 2 veces desregulados en ARNm total o SLAM-seq por al menos un inhibidor en (D).(G)Análisis de componentes principales de las lecturas SLAM-seq de K562 tratadas con los inhibidores indicados como se describe en (D).
[0198] Figura 26. La hipersensibilidad a BETi es distinta del control global de la transcripción por BRD4. (A)Esquema del alelo insertado AID-BRD4 y vector de transporte Tir1 de SOP(B)Inmunotransferencia de<BRD4 en células K562AID-BRD4 transducidas con SOP y tratadas con auxina (IAA 100 j>M).(C)Respuesta
SLAM-seq de células K562AID-BRD4 tratadas con auxina durante 30 min antes del marcaje con s4U durante 60 min.(D)Respuesta SLAM-seq de células K562 tratadas con JQ1 (200 nM) durante 30 min antes del marcaje con s4Us4U durante 60 min.(E)Comparación de las respuestas SLAM-seq con JQ1 en las células K562 mostradas en (C) y las células MV4-11 tratadas de forma idéntica. R, coeficiente de correlación de Pearson.(F)Comparación de las respuestas SLAM-seq medias y las puntuaciones CRISPR medias que indican esencialidad génica (14, 15) en células K562, MOLM-13 y MV4-11. Se muestran todos los genes significativamente regulados a la baja en las tres líneas celulares (FDR < 0,1).(G)Análisis de componentes principales de lecturas SLAM-seq marcadas con s4U de células MOLM-13 tratadas con JQ1 o con el inhibidor<de c>DK9<NVP-2, tal como se realizó en (C). (H) Mapa térmico y agrupación jerárquica de las correlaciones>de rangos de Spearman entre las respuestas SLAM-seq a la inhibición de JQ1 y CDK9 en las líneas celulares indicadas.
[0200] Figura 27. El contexto de la cromatina determina la hipersensibilidad a BETi. (A)Curva ROC para la distinción de genes hipersensibles a BETi a partir de un conjunto de control de expresión emparejado mediante predictores indicados en células K562.(B)Diagrama de Venn que muestra el solapamiento de los genes hipersensibles a BETi y las dianas superpotenciadoras publicadas en células K562.(C)Ejemplos de seguimientos de H3K27ac ChIP-seq y anotación de superpotenciadores para genes seleccionados que ilustran las categorías de (B).(D)Flujo de trabajo simplificado de generación de modelos para clasificar genes hipersensibles a BETi basándose en 214 firmas de cromatina a una distancia de 500 pb o 2000 pb desde TSS.(E)Curva ROC como en (A) para dos modelos independientes basados en firmas de cromatina de hipersensibilidad a BETi evaluados en un conjunto de pruebas retenidas.(F)Contribución relativa de los cinco predictores positivos y negativos más fuertes al GLM mostrado en (E) en función de sus coeficientes normalizados del modelo.(G)Mapa de calor y agrupación jerárquica de densidades relativas ChIP-seq de factores predictivos en (F) en TSS de 125 genes hipersensibles a BETi.
[0201] Figura 28. MYC es un activador directo selectivo del metabolismo celular en todos los tipos de cáncer. (A)Esquema del alelo MYC-AID y el vector Tir1.(B)Inmunotransferencia de MYC en células K562MYC-AID tras el tratamiento con auxina durante los tiempos indicados.(C)Perfil SLAM-seq tras la degradación de MYC en células K562MYC-AID (30 min de pretratamiento con auxina, 60 min de marcaje con s4U).(D)Respuestas SLAM-seq de todos los ARNm y conjuntos de genes significativamente enriquecidos.(E)Inmunotransferencia de MYC en células HCT116MYC-AID como en (B).(F)Comparación de las respuestas SLAM-seq en células K562MYC-AID y HCT116MYC-AID.(G)Curvas r Oc de diferentes predictores que distinguen los genes dependientes de MYC en (C) (FDR < 0,1, log2FC < -1) de un conjunto de control de expresión concordante. m Yc /MAX ChIP, genes clasificados por señal ChIP-seq a una distancia de 2 kpb desde TSS; GLM, GLM de red elástica basado en 214 perfiles de cromatina.(H)Contribución relativa de los predictores positivos y negativos más fuertes al GLM en (G).(I)Expresión de MYC y firma de la diana MYC basada en SLAM-seq en 672 líneas celulares de cáncer. Se resaltan las muestras con niveles de MYCN o MYCL superiores a los de MYC.(J, K)GSEA de la firma de la diana MYC en líneas celulares de (I) o pacientes con LMA con alta o baja expresión de MYC.(L)Expresión de la firma de la diana MYC en 5583 muestras de pacientes separados basándose en la expresión alta o baja de MYC y el tipo de cáncer. ****,p< 0,0001 (prueba de Wilcoxon para datos independientes).
[0203] Figura 29. Configuración experimental de SLAM-seq para cartografiar la expresión génica diferencial. (A)Esquema de una perturbación dirigida y sus efectos primarios y secundarios sobre los niveles de ARNm para genes con diferentes tasas de recambio, ilustrado por el tratamiento con BETi y la supresión indirecta de genes diana MYC. (B)Alquilación de un residuo de 4-tiouridina en el ARNm mediante yodoacetamida.(C)Contribución de las tasas de error de fondo a las lecturas con > 1 o 2 conversiones T>C en un experimento SLAM-seq con tiempo de marcaje de 60 min. La señal de fondo se midió mediante alquilación paralela y secuenciación de ARNm de células tratadas y no tratadas con s4U. Los gráficos de cajas muestran las tasas de error de los genes con un recambio de ARNm alto (el 10 % superior), intermedio (45-55 %) y bajo (el 10 % inferior), estimadas a partir de la fracción de lecturas marcadas en los bancos tratados con s4U. Los bigotes indican un intervalo del 5-95 %.(D)Recuperación de ARNm recién sintetizado mediante SLAM-seq en función del contenido de T por lectura. Las estimaciones se basan en una eficacia de marcaje del 11,4 % por T en ARNm recién sintetizado. Los histogramas superiores muestran el contenido de T de las lecturas UTR 3' para diferentes longitudes de lectura.(E)Validación de la inhibición de las vías MAPK y AKT en células K562 tratadas con los inhibidores de cinasas indicados para las muestras SLAM-seq mostradas en la figura 25E.
[0205] Figura 30. Respuestas directas de JQ1 en líneas celulares de leucemia mieloide.(A) Diagrama de cajas que resume los cambios globales de expresión génica medidos por SLAM-seq para las células K562 tratadas con JQ1 en la figura 26D. (B, C) Respuesta primaria al tratamiento con JQ1 cartografiada mediante SLAM-seq como en la figura 2D para las líneas celulares MOLM-13 y MV4-11. (D) Resumen de los cambios globales de expresión génica tras el tratamiento con JQ1 en las células MOLM-13 y MV4-11 como en (A). (E, F) Comparación por pares de los cambios de expresión génica tras el tratamiento con JQ1 en las líneas celulares indicadas.(G)Comparación de las respuestas SLAM-seq a JQ1 y a la degradación aguda de BRD4 en células K562 mostradas en la figura 26, B y C. Los genes que habitualmente son inducidos tras el tratamiento con JQ1 en MOLM-13, MV4-11 y K562, así como tras la degradación de BRD4, se resaltan en azul. **** indicap< 0,0001 calculado mediante la prueba de Wilcoxon para datos emparejados para la desviación de la mediana con respecto a 0.
[0207] Figura 31. Sinergia de la inhibición del bromodominio de CDK9 y BET a nivel celular y transcripcional. (A)Inhibición del crecimiento de las células MOLM-13 y OCI-AML3 por las dosis indicadas de NVP-2 y JQ1 durante 3 días medida mediante el ensayo de viabilidad celular luminiscente CellTiter-Glo.(B)Efectos sinérgicos de JQ1 y NVP-2 en (A) expresados como exceso sobre la aditividad de Bliss.(C)Respuestas primarias a JQ1, NVP-2 y el tratamiento combinado a las dosis indicadas en células MOLM-13 tratadas durante 30 min antes del marcaje con s4U durante 60 min.(D)Comparación por pares de las respuestas a JQ1 y a una dosis intermedia de NVP-2 (6 nM) mostrada en (C). R indica el coeficiente de correlación de Pearson.(E)Cambios globales en la producción de ARNm tras el tratamiento con NVP-2 y JQ1 de células OCI-AML3 como en (C). Los puntos indican la fracción marcada con s4U sobre el total de lecturas en SLAM-seq para tres réplicas independientes.(F)Análisis de componentes principales de lecturas SLAM-seq de células OCI/AML-3 tratadas con NVP-2 y JQ1 en (E). Los porcentajes indican la fracción de la varianza global explicada por cada componente principal.
[0209] Figura 32. Derivación y ensayo de predictores de hipersensibilidad a JQ1. (A)Flujo de trabajo para la selección de genes hipersensibles a jQ-1 y un conjunto equilibrado de genes de control basado en respuestas SLAM-seq tras 90 min de tratamiento con JQ1 (30 min de pretratamiento 60 min de marcaje con s4U). Los genes de control se seleccionaron mediante submuestreo iterativo y comprobación de la igualdad de expresión de la línea de base mediante una prueba de Kolmogorov-Smirnov (KS).(B)Curva ROC para la predicción de genes hipersensibles a JQ1 frente a genes control mediante superpotenciadores ("super enhancers", SE). Cada S<e>se asignó al gen con el TSS más cercano y los genes se ordenaron por rango de superpotenciador.(C)Flujo de trabajo para derivar clasificadores basados en TSS de hipersensibilidad a BETi
en células K562 mostrados en la figura 27E. SVM: máquina de vectores soporte, GLM: modelo lineal generalizado derivado por regularización de red elástica, GBM: modelo de gradiente reforzado.
[0211] Figura 33. Caracterización de un GLM que predice la hipersensibilidad a JQ1 en células K562. (A)Gráfico de barras de los coeficientes de todos los predictores que contribuyen al GLM mostrado en la figura 27E. La tabla adyacente enumera cada predictor, los identificadores de la correspondiente pista ChIP-seq publicada (véase también la tabla S1) y si las señales se midieron a una distancia de 500 o 2000 pb de los sitios de inicio de la transcripción.(B)Mapa de calor y agrupación jerárquica de genes hipersensibles a JQ1 y genes control basados en señales ChIP-seq relativas de los 5 predictores distintivos positivos y negativos más fuertes en (A).
[0213] Figura 34. Respuestas primarias a la degradación de MYC en líneas celulares MYC-AID marcadas endógenamente. (A)Diagrama de volcán de las respuestas SLAM-seq de las células K562MYC-AID tratadas con auxina mostradas en la figura 4C. El recuadro muestra el número total de genes regulados al alza y a la baja (FDR < 0,1) y los genes desregulados en más de dos veces. Los valores del eje de ordenadas se limitan a 20 por razones de legibilidad.(B)Respuestas SLAM-seq de células HCT116MYC-AID en (B) para genes asociados con los términos GO indicados.(C)Diagrama de volcán que muestra los resultados de SLAM-seq de las células HCT116MYC-AID tratadas con auxina como en (A).(d )Respuestas SLAM-seq a la degradación aguda de MYC en células K562MYC-AID para genes que codifican subunidades de diferentes<complejos de ARN polimerasa, agrupados por término>G<o>.
[0215] Figura 35. Predicción basada en la cromatina de la expresión génica dependiente de MYC. (A)Curva ROC que mide el rendimiento de 5 clasificadores a la hora de discernir los genes dependientes de MYC (FDR < 1, log2FC < -1) de los genes que no responden a la degradación de MYC (FDR < 0,1, -0,2 < log2FC < 0,2) en la figura 28C. Los modelos se derivaron como en la figura 32, se entrenaron con un conjunto de ensayo de 802 genes y se evaluaron con un conjunto de ensayo de 268 genes.(B)Curva ROC que evalúa el rendimiento del GLM mostrado en (A) en un conjunto adicional de genes retenidos para validación.(C)Coeficientes de todos los predictores del GLM mostrado en (A).(D)ROC para predicción de genes dependientes de MYC por presencia de un pico MYC ChIP-seq a una distancia de 2000 pb del TSS de un gen. Para cada gen, se seleccionó el TSS que más contribuía a los niveles de ARNm celular basándose en la señal CAGE-seq, como en la figura 32. Picos SPP - picos llamados por SPP, picos IDR - picos que superan un umbral de tasa de descubrimiento irreproducible del 2 %.(E)Diagrama de Venn de 7135 genes agrupados en genes ligados a MYC y genes dependientes de MYC como arriba.
[0217] Figura 36. Expresión de ortólogos de MYC en líneas celulares de cáncer humano. (A)Comparación de la expresión de MYC y MYCL en perfiles de secuenciación de ARN de 672 líneas celulares de cáncer.(B)Comparación de la expresión de MYC y MYCN en líneas celulares de cáncer como en (A).
[0218] Figura 37. Frecuencias de apareamiento de bases dependiente del pH durante la transcripción inversa de un oligonucleótido de a Rn que contiene 5-bromouridina (5BrU) medidas por secuenciación. (a)Las formas tautoméricas de 5BrU presentan diferentes propiedades de apareamiento de bases dependiente del pH con la adenina o la guanina.(b)Esquema del experimento para detectar el efecto dependiente del pH sobre la incorporación errónea de nucleótidos en una posición modificada con 5BrU en el contexto del ARN.(c)Tasas de conversión para las conversiones específicas observadas en la posición del nucleótido modificado con 5BrU tras la transcripción inversa en la condición de pH indicada. Se indica el aumento en número de veces de las tasas de conversión en relación con la condición de pH 7. El número de mediciones independientes es n = 3, y las barras representan las tasas promedio de conversión ± DE. Se indican los valores dep(prueba de latde Student paramétrica unilateral). N.s., no significativo (p > 0,05); *,p< 0,05; **,p< 0,01; ***,p< 0,001; y ****,p< 0,0001.
[0220] Ejemplos:
[0222] Ejemplo 1: Materiales y procedimientos
[0224] Carboxiamidometilación de s4U
[0226] Si no se indica lo contrario, la carboxiamidometilación se realizó en condiciones convencionales (DMSO al 50 %, yodoacetamida 10 mM, tampón fosfato de sodio 50 mM, pH 8, durante 15 min a 50 °C) utilizando 4-tiouracilo 1 mM (SIGMA), 4-tiouridina 800 jM (SIGMA), o 5-50 |jg de ARN total preparado a partir de experimentos de marcaje metabólico con s4U. La reacción se inactivó añadiendo un exceso de DTT.
[0228] Medidas de adsorción
[0230] Se incubó 4-tiouracilo 1 mM en condiciones de reacción óptimas (yodoacetamida 10 mM, DMSO al 50%, tampón fosfato de sodio 50 mM, pH 8, durante 15 min a 50 °C) si no se indica lo contrario. La reacción se inactivó añadiendo DTT 100 mM y los espectros de adsorción se midieron en un instrumento Nanodrop 2000 (Thermo Fisher Scientific), seguido de una sustracción de la línea de base de adsorción a 400 nm.
[0232] Espectrometría de masas
[0233] Se hicieron reaccionar 40 nmol de 4-tiouridina o 6-tioguanosina en ausencia o presencia de 0,05, 0,25, 0,5 o 5 |jmol de yodoacetamida en condiciones de reacción convencionales (tampón fosfato de sodio 50 mM, pH 8; DMSO al 50 %) a 50 °C durante 15 min. La reacción se detuvo con ácido acético al 1 %. Las muestras acidificadas se separaron en un sistema HPLC Ulitimate U300 BioRSLC (Dionex; Thermo Fisher Scientific), empleando una columna de pentafluorofenilo Kinetex F5 (150 mm x 2,1 mm; 2,6 jm , 100 A; Phenomenex) con un caudal de 100 ml/min. Los nucleósidos se analizaron en línea utilizando un espectrómetro de masas TSQ Quantiva (Thermo Fisher Scientific) tras ionización por electronebulización con los siguientes SRM: 4-Tiouridina m/z 260 ^ 129, 4-Tiouridina alquilada m/z 318 ^ 186, 6-Tioguanosina m/z 300 ^ 168 y 6-Tioguanosina alquilada m/z 357 ^ 225. Los datos se interpretaron utilizando el paquete de software Trace Finder (Thermo Fisher Scientific) y se validaron manualmente.
[0235] Ensayos de extensión con cebadores
[0237] Los ensayos de extensión con cebadores se realizaron fundamentalmente según lo descrito previamente por Nilsenet al.(Cold Spring Harb. Protoc., 2013, 1182-1185). Brevemente, oligonucleótidos de ARN plantilla (5L-let-7-3L o 5L-let-7-s4Up9-3L; Dharmacon; véanse las secuencias en la tabla) se desprotegieron siguiendo las instrucciones del fabricante y se purificaron por elución en gel de poliacrilamida desnaturalizante. Se trataron oligonucleótidos de ARN purificados 100 jM con yodoacetamida 10 mM (+IAA) o EtOH (-IAA) en condiciones de reacción convencionales (DMSO al 50 %, tampón fosfato de sodio 50 mM, pH 8) durante 15 min a 50 °C. La reacción se detuvo añadiendo DTT 20 mM, seguido de precipitación con etanol. El cebador RT (véase la tabla para la secuencia) se radiomarcó en 5' utilizando y-32P-ATP (Perkin-Elmer) y T4-polinucleótido cinasa (NEB), seguido de una purificación en gel de poliacrilamida desnaturalizante. Se hibridó el cebador<y>-32P-RT 640 nM con5L-let-7-3Lo 5L-let-7-s4Up9-3L 400 nM en 2 x tampón de hibridación (KCl 500 mM, Tris 50 mM, pH 8.3) en una máquina de PCR (3 min 95 °C, 30 s 85 °C Rampa 0,5 °C/s, 5 min 25 °C Rampa 0,1 °C/s). La transcripción inversa se realizó con Superscript II (Invitrogen), Superscript III (Invitrogen) o Quant-seq RT (Lexogen) según las recomendaciones del fabricante. Para las reacciones con didesoxinucleótidos, se añadió a las reacciones de RT una concentración final de 500 jM de ddNTP (según se indica). Una vez finalizadas, las reacciones RT se resuspendieron en tampón de carga de formamida (tampón de carga de gel II, Thermo Fisher Scientific) y se sometieron a electroforesis en gel de poliacrilamida desnaturalizante al 12,5 %. Los geles se secaron, se expusieron a una pantalla de fósforo de almacenamiento (PerkinElmer), se tomaron imágenes en un generador de imágenes de modo variable Typhoon TRIO (Amersham Biosciences) y se cuantificaron con ImageQuant TL v7.0 (GE Healthcare). Para el análisis del abandono, las intensidades de señal en p9 se normalizaron con respecto a las intensidades de señal de abandono precedentes (bg, figura 4B) para reacciones individuales. Se compararon los valores que mostraban el cambio en la señal de abandono (+IAA/-IAA) para los oligonucleótidos de ARN con y sin s4U para las transcriptasas inversas indicadas. Se utilizó un montaje correspondiente para analizar la modificación con 6-tioguanosina como alternativa a la 4-tiouridina.
[0239] t de ARN utilizados para el ensayo de extensión con cebadores. s4U indica 4-tiouridina; s6U indica 6-tioguanosina. La secuencia inspeccionada de let-7 se indica en cursiva.
[0242]
[0245] Oligonucleótido de ADN utilizado para el ensayo de extensión con cebadores.
[0246]
[0249] GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQ ID NO: 4)
[0251] Oligonucleótidos de ADN utilizados para la amplificación de ADNc, seguida de secuenciación de alto rendimiento IMumina. Los nucleótidos del código de barras (N) se indican en cursiva.
[0254]
[0257] Análisis por HPLC de ARN marcado con s4U o s6G
[0259] El análisis de la incorporación de s4U- o s6G en el ARN total tras el marcaje metabólico se realizó según lo descrito previamente porSpitzeret al.(Meth Enzymol., 539, 113-161 (2014)).
[0261] Ensayo de viabilidad celular
[0263] Se sembraron 5000 células mES por 96 pocillos el día anterior al experimento. Se añadió a las células medio con diferentes concentraciones de s4U (según se indica) durante 12 h o 24 h. Se evaluó la viabilidad celular mediante el ensayo de viabilidad celular luminiscente CellTiter-Glo® (Promega) de acuerdo con las instrucciones del fabricante. La señal luminiscente se midió en Synergy utilizando el software Gen5 (v2.09.1).
[0265] Cultivo celular
[0267] Las células madre embrionarias de ratón (mES) (clon AN3-12) se obtuvieron de Haplobank (Ellinget al.,documento WO2013/079670) y se cultivaron en FBS al 15 % (Gibco), 1x solución de penicilina-estreptomicina (penicilina 100 U/ml, estreptomicina 0,1 mg/ml, SIGMA), L-glutamina 2 mM (SIGMA), 1x solución MEM de aminoácidos no esenciales (SIGMA), piruvato de sodio 1 mM (SIGMA), 2-mercaptoetanol 50 pM (Gibco) y LIF 20 ng/ml (de producción propia). Las células se mantuvieron a 37 °C con un 5 % de CO2 y se realizó un pase cada dos días.
[0269] Modificación del ARN para alterar la secuenciación ("SLAM-seq")
[0271] Las células mES se sembraron el día anterior al experimento a una densidad de 105 células/ml en placas de 10 cm. El marcaje metabólico con s4U se realizó incubando células mES en medio convencional, pero añadiendo s4U o s6G 100 pM (SIGMA) de una solución madre 500 mM en agua. Durante el marcaje metabólico, el medio que contenía s4U o s6G se cambió cada 3 h. Para el experimento de persecución con uridina, se descartó el medio que contenía s4U o s6G, se lavaron las células dos veces con 1x PBS y se incubaron con medio convencional suplementado con uridina 10 mM (SIGMA). Las células se lisaron directamente en TRIzol® (Ambion) y el ARN se extrajo siguiendo las instrucciones del fabricante, salvo que se añadió 0,1 mM de concentración final de DTT durante la precipitación con isopropanol. El ARN se resuspendió en DTT 1 mM. Se trataron 5 pg de ARN total con yodoacetamida 10 mM en condiciones de reacción óptimas y posteriormente se precipitaron con etanol y se sometieron a la preparación de bancos de extremos 3' de ARNm de extremo 3' de QuantSeq (Mollet al.,Nat. Methods, 11 (2014); documento WO2015/140307).
[0273] Preparación de bancos de ARN
[0275] Se prepararon bancos de secuenciación de ARN convencionales utilizando el kit de preparación direccional de bancos<de>A<r>N<NEBNext® Ultra™ para Illumina® (NEB) siguiendo las instrucciones del fabricante. Se prepararon bancos Cap->seq según lo descrito previamente por Mohnet al.(Cell, 157, 1364-1379 (2014)), salvo que, antes de la fragmentación, se llevó a cabo la supresión del ARN ribosómico mediante el kit magnético RiboZero (Epicenter). La secuenciación del extremo 3' del ARN mensajero se realizó utilizando el kit de preparación de bancos de extremos 3' de ARNm Quantseq (Lexogen) siguiendo las instrucciones del fabricante.
[0277] Análisis de datos
[0279] Las imágenes de gel se cuantificaron utilizando ImageQuant v7.0a (GE Healthcare). El ajuste de curvas se realizó según la ley de velocidad integrada para una reacción de primer orden en Prism v7.0 (GraphPad) o R (v2.15.3). Los análisis estadísticos se realizaron en Prism v7.0a (GraphPad), Excel v15.22 (Microsoft) o R (v2.15.3).
[0281] Bioinformática
[0283] Para el análisis de la secuenciación de muestras de ARN sintético (figura 5), los bancos con código de barras se desmultiplexaron utilizando Picard Tools BamIndexDecoder v1.13 permitiendo 0 apareamientos erróneos en el código de barras. Los archivos resultantes se convirtieron a fastq utilizando Picard Tools SamToFastq v1.82. Se utilizó Cutadapt v1.7.1 para recortar los adaptadores (teniendo en cuenta un apareamiento erróneo del 10 % por defecto en la secuencia del adaptador) y filtrar las secuencias de 21 nt de longitud. Las secuencias resultantes se alinearon con la secuencia madura de dme-let-7 (5'-TGAGGTAGTAGGTTGTATAGT-3', SEQ ID NO: 7) usando bowtie v0.12.9 permitiendo 3 desapareamientos y convertido a bam usando samtools v0.1.18. Se eliminaron las secuencias que contenían nucleótidos ambiguos (N). Las lecturas alineadas restantes se convirtieron a formato pileup. Por último, la fracción de cada mutación por posición se extrajo del pileup. La tabla de resultados se analizó y representó en Excel v15.22 (Microsoft) y Prism v7.0a (GraphPad).
[0285] Para el análisis de los datos de secuenciación del extremo 3' del ARNm, los bancos de códigos de barras se desmultiplexaron utilizando Picard Tools BamIndexDecoder v1.13 permitiendo 1 desapareamiento en el código de barras. Los adaptadores se recortaron con cutadapt v1.5 y las lecturas se filtraron por tamaño para >15 nucleótidos. Las lecturas se alinearon con el genoma de ratón mm10 utilizando STAR aligner v2.5.2b. Las alineaciones se filtraron para puntuaciones de alineación >0,3 e identidad de alineación > 0,3 normalizadas a la longitud de lectura. Sólo se notificaron las alineaciones con >30 coincidencias. Sólo se permitieron alineaciones quiméricas con un solapamiento >15 pb. Se utilizó un cartografiados de 2 pasadas. Se filtraron los intrones <200 kb y las alineaciones que contenían uniones no canónicas. Se filtraron las alineaciones con una proporción de desapareamientos respecto a las bases cartografiadas >0,1 o con un número máximo de 10 apareamientos erróneos. El número máximo de huecos permitido para las uniones por 1,2,3,N lecturas se fijó en 10 kb, 20 kb, 30 kb y 50 kb, respectivamente. La longitud mínima de la proyección para las uniones de corte y empalme a ambos lados para (1) motivos no canónicos, (2) motivos GT/AG y CT/AC, (3) motivos GC/AG y CT/GC, (4) motivos AT/AC y GT/AT se fijó en 20, 12, 12, 12, respectivamente. Se utilizó el filtrado de uniones "espurias" y se fijó en 1 el número máximo de alineaciones múltiples permitidas para una lectura. Las lecturas exónicas (Gencode) se cuantificaron mediante FeatureCounts.
[0287] Para el análisis Cap de expresión génica ("Cap analysis gene expression", CAGE), los bancos de códigos de barras se desmultiplexaron utilizando Picard Tools BamIndexDecoder v1.13 permitiendo 1 desapareamiento en el código de barras. Los primeros 4 nt de las lecturas se recortaron con seqtk. Las lecturas se analizaron en busca de ARN ribosómico alineándolas con BWA (v0.6.1) con secuencias de ARNr conocidas (Ref-Seq). Las lecturas de ARNr restadas se alinearon con TopHat (v1.4.1) con el genoma deMus musculus(mm10). El máximo de multiaciertos se fijó en 1, la longitud del segmento en 18 y el desapareamiento del segmento en 1. Además, se proporcionó un modelo de gen como GTF (Gencode VM4).
[0289] Para el análisis de los conjuntos de datos de secuenciación del extremo 3' del ARNm (Quant-seq), las lecturas se desmultiplexaron utilizando Picard Tools BamIndexDecoder v1.13 permitiendo 1 apareamiento erróneo en el código de barras. Se recortaron cinco nucleótidos en el extremo 5' de las lecturas desmultiplexadas. Las lecturas se alinearon con el genoma de ratón mm10 y las alineaciones en 3' UTR anotadas (Gencode) se contaron utilizando SLAMdunk (Neumann y Rescheneder, t-neumann.github.io/slamdunk/; Herzoget al.,Nature Methods, 14, 1198-1204 (2017)). En resumen, SLAMdunk se basa en NextGenMap, un programa de cartografiado de lecturas flexible y rápido, y se adaptó utilizando un esquema de puntuación adaptado que elimina las penalizaciones por apareamiento erróneo T>C para la etapa de cartografiado. Se cuantificaron las lecturas que contenían T>C y las que no contenían T>C alineadas con las 3' UTR para deducir la abundancia de transcritos marcados con s4U o no marcados, respectivamente.
[0291] Para el análisis de la producción transcripcional, se obtuvo el número de lecturas normalizadas (en cpm; "Expresión en estado estacionario") y el número de lecturas normalizadas que contenían >1 mutación T/C (en cpm; "Producción transcriptional") para cada gen después de alinear los datos de secuenciación de alto rendimiento con SLAMdunk con el genoma de ratón mm10. Se excluyeron del análisis los genes mitocondriales (Mt-) y los genes predichos (GM-). Las lecturas de T/C de fondo (lecturas de T/C observadas sin marcaje con s4U) se restaron de las lecturas de T/C en el punto temporal de 1 h y se estableció un umbral de expresión de >5 cpm para la media de la "Expresión en estado estacionario". Para identificar los genes con una elevada producción transcripcional, se ajustó una regresión lineal tras representar gráficamente log10(Expresión en estado estacionario) frente a log10(Producción transcriptional) (número de genes: 6766), descrita por la ecuación Y = 0,6378*X - 1,676. Para cada gen, se calculó la distancia a la curva ajustada ("AY") como en AY = Resultado transcriptional (cpm) - (0,6378 * Expresión en estado estacionario (cpm) -1,676). Los genes de "alta producción transcripcional" se definieron por AY > 0,5 (número de genes: 828). Los "genes
de alta expresión" se definieron por cpm en estado estacionario > log10(2,15) (número de genes: 825). Para predecir la red de factores de transcripción que define cada clase de genes, se utilizó Ingenuity Pathway Analysis (Qiagen) v27821452, una aplicación web que permite a los biólogos descubrir, visualizar y explorar redes terapéuticamente importantes y significativas para sus resultados experimentales, tales como conjuntos de datos de expresión génica, con la entrada de genes de "Alto rendimiento transcripcional" o "Alta expresión". Para una descripción detallada de Ingenuity Pathways Analysis, visítese www.Ingenuity.com. Se muestran los 5 principales reguladores cadena arriba predichos.
[0293] Para predecir vías de genes de "Alto rendimiento transcripcional" o "Alta expresión", se utilizó la herramienta en línea Enrichr con la entrada de las dos clases de genes. Se muestran las 5 principales vías predichas.
[0295] Ejemplo 2: Alquilación ligada a tioles para la secuenciación metabólica del ARN
[0297] Como estudio demostrativo preliminar, se seleccionó el análogo de nucleótido de tiol como ejemplo de una estrategia de derivatización que evita la necesidad de separación bioquímica de especies de ARN marcadas y no marcadas con s4U- o s6G- para determinar la cinética de expresión del ARN en células cultivadas (figura 1). Esta estrategia se basa en enfoques de marcaje metabólico bien establecidos, pero evita la etapa de biotinilación, que es ineficaz y requiere mucho tiempo. Contiene un breve protocolo de tratamiento químico que implica la modificación del ARN que contiene s4U con yodoacetamida, un compuesto reactivo al sulfhidrilo que, al reaccionar con s4U o s6G, crea un grupo voluminoso en la interfaz de apareamiento de bases (figura 1). Cuando se combina con protocolos de preparación de bancos de ARN bien establecidos, la presencia del grupo voluminoso en los sitios de incorporación de s4U conduce a la incorporación errónea específica y cuantitativa de G durante la transcripción inversa (RT), pero no interfiere con la procesabilidad de la RT. Por lo tanto, las secuencias que contienen s4U o s6G pueden identificarse mediante comparación de secuencias o bioinformáticamente en bancos de secuenciación de alto rendimiento con una resolución de un solo nucleótido llamando a las transiciones de T a C. Es importante destacar que no se conoce ninguna enzima que convierta la uridina en citosina y que unas tasas de error similares (es decir, las conversiones T>C) en los conjuntos de datos de secuenciación de ARN de alto rendimiento que utilizan, por ejemplo, la plataforma Illumina HiSeq 2500, son poco frecuentes y se producen con una frecuencia inferior a una de cada diez mil. Este enfoque se denomina "SLAM-seq" como abreviatura de su realización más preferida, la alquilación ligada a tiol (SH) para la secuenciación metabólica del ARN.
[0299] SLAM-seq se basa en la química de derivatización de análogos de nucleótidos que permite detectar acontecimientos de incorporación de 4-tiouridina derivados del marcaje metabólico en especies de ARN a resolución de un solo nucleótido mediante secuenciación de alto rendimiento. Los inventores demostraron que el nuevo procedimiento mide con precisión la producción transcripcional poliadenilada dependiente de la ARN polimerasa II y recapitula las firmas globales de regulación génica postranscripcional en células madre embrionarias de ratón. La invención proporciona un procedimiento escalable, altamente cuantitativo, rentable y que consume poco tiempo para el análisis rápido y en todo el transcriptoma de la cinética de expresión del ARN con alta resolución temporal.
[0301] Para la derivatización con s4U, se empleó yodoacetamida (IAA) como ejemplo de un compuesto primario reactivo con tioles eficaz, uniendo un grupo carboxiamidometilo al grupo tiol como resultado de una reacción de sustitución nucleofílica (S<n>2) (figura 2A). Se produce una reacción similar con otras nucleobases tioladas, tal como s6G (figura 23A). Para controlar cuantitativamente la eficiencia de la derivatización con s4U en función de diferentes parámetros (es decir, tiempo, temperatura, pH, concentración de IAA y DMSO), se controló el espectro de absorción característico del 4-tiouracilo (aproximadamente 335 nm), que, al reaccionar con yodoacetamida (IAA), se desplaza a aproximadamente 297 nm (figura 2B a K) (45). En condiciones óptimas de reacción (IAA 10 mM; NaPO450 mM, pH 8; DMSO al 50 %; 50 °C; 15 min), la absorción a 335 nm disminuye 50 veces en comparación con el 4-tiouracilo no tratado, lo que da lugar a una tasa de alquilación de al menos el 98 % (figura 2L y M). (Nótese que las tasas de conversión pueden estar subestimadas, ya que el espectro de absorción del 4-tiouracilo y su derivado alquilado se solapan parcialmente). El análisis de la alquilación específica de tioles en un contexto de ribosa (es decir, 4-tiouridina o 6-tioguanosina) mediante espectrometría de masas confirmó una eficacia de derivatización casi completa (figuras 3 y 23B).
[0303] La recuperación cuantitativa de los acontecimientos de incorporación de s4U o s6G presupone que las transcriptasas inversas dejan pasar los residuos con s4U alquilados sin abandono. Para determinar el efecto de la alquilación de s4U o s6G en la procesabilidad de la transcriptasa inversa, se empleó un ARN sintético (para la secuencia, véase el ejemplo 1, tabla) que contiene una única incorporación de s4U o s6G, y se ensayaron tres transcriptasas inversas (RT) disponibles en el mercado, Superscript II, Superscript III y Quant-seq RT, en ensayos de extensión de cebadores (figura 4A). Cuando se normalizó con respecto a la señal de abandono de fondo, no se observó un efecto significativo de la alquilación de s4U o s6G sobre la procesabilidad de la RT en comparación con un oligo que no contenía s4U ni s6G con idéntica secuencia (figura 4B y C y figura 24B). Se llegó a la conclusión de que la alquilación no provoca la terminación prematura de la transcripción inversa.
[0305] Para evaluar el efecto de la alquilación de s4U y s6G en la incorporación de nucleótidos dirigida por transcriptasa inversa, se aislaron los productos de longitud completa de las reacciones de extensión con cebadores, se amplificó por PCR el ADNc y se sometió a los bancos a secuenciación de alto rendimiento utilizando un instrumento Illumina HiSeq2500 (figuras 5A y 24A). Como era de esperar, la uridina fue transcrita inversamente con precisión por las tres
RT en el ARN de control que no contenía s4U o que no contenía s6G, independientemente de su tratamiento con yodoacetamida, con tasas promedio de mutación inferiores a 10-2 (figuras 5B y 24B, paneles izquierdos). Por el contrario, la presencia de s4U provocó una conversión de T a C constante de entre el 10% y el 11 % incluso en ausencia de alquilación, presumiblemente debido a variaciones en el apareamiento de bases de los tautómeros de s4U (figura 5B, paneles superiores derechos). En el caso de s6G, se observó una conversión de G a A (figura 24B, panel derecho). Cabe destacar que la alquilación de s4U mediante el tratamiento con yodoacetamida provocó un aumento de 8,5 veces en la conversión de T a C, lo que dio lugar a una tasa de mutación de más de 0,94 en todas las RT analizadas (figura 5B, paneles inferiores derechos). En comparación con los errores de secuenciación notificados en los conjuntos de datos de secuenciación de alto rendimiento de Illumina (por debajo de 10-3), se obtuvo una relación señal/ruido de >940:1. Es importante destacar que no se observó un efecto significativo del tratamiento con yodoacetamida en las tasas de mutación de ningún nucleótido que no contuviera tiol (figuras 5C y 24C). Se llegó a la conclusión de que el tratamiento con yodoacetamida, seguido de la transcripción inversa, permite la identificación cuantitativa de las incorporaciones de s4U o s6G en el ARN con una resolución de un solo nucleótido, sin afectar a la información de la secuencia de los nucleótidos que no contienen tiol.
[0307] Ejemplo 3: Incorporación de nucleótidos modificados en ARNm marcado metabólicamente en células mES
[0309] Se ensayó la capacidad de células madre embrionarias de ratón para tolerar el marcaje metabólico de ARN con s4U después de 12 h o 24 h a concentraciones variables de s4U (figura 6A). Como se ha indicado anteriormente, las altas concentraciones de s4U comprometían la viabilidad celular con una EC50 de 3,1 mM o 380 pM tras 12 h o 24 h de marcaje, respectivamente (figura 6A). Por ello, se emplearon unas condiciones de marcaje de s4U 100 pM, que no afectaron gravemente a la viabilidad celular. En estas condiciones, se detectó un aumento constante de la incorporación de s4U en la preparación de ARN total 3 h, 6 h, 12 h y 24 h después del marcaje, así como una disminución constante 3 h, 6 h, 12 h y 24 h después de la persecución con uridina (figura 6B). Como era de esperar, la incorporación sigue una cinética exponencial simple, con una incorporación promedio máxima del 1,78 % de s4U, correspondiente a una incorporación de s4U por cada 56 uridinas en el ARN total (figura 6C). Estos experimentos establecen condiciones de marcaje con s4U en células mES, que pueden emplearse para medir la biogénesis del ARN y las tasas de recambio en condiciones inalteradas.
[0311] Para ensayar la capacidad del procedimiento para revelar acontecimientos de incorporación de s4U en conjuntos de datos de secuenciación de alto rendimiento, se generaron bancos de extremos 3' de ARNm (empleando el kit de preparación de bancos de secuenciación de ARNm 3' QuantSeq de Lexogen) utilizando ARN total preparado a partir de células cultivadas tras el marcaje metabólico de ARN con s4U durante 24 h (figura 7) (Mollet al., supra).El kit de preparación de bancos de secuenciación de ARNm 3' Quant-seq genera bancos compatibles con Illumina de las secuencias cercanas al extremo 3' del ARN poliadenilado, como se ejemplifica para el gen Trim28 (figura 8A). A diferencia de otros protocolos de secuenciación de ARNm, sólo se genera un fragmento por transcrito, por lo que no es necesario normalizar las lecturas en función de la longitud del gen. De este modo se obtienen valores precisos de expresión génica con una alta especificidad de hebra.
[0313] Además, los bancos listos para secuenciación pueden generarse en sólo 4,5 h, con aproximadamente 2 h de tiempo práctico. Cuando se combina con la invención, Quant-seq facilita la determinación precisa de las tasas de mutación a través de regiones específicas de transcripción, porque los bancos presentan un bajo grado de heterogeneidad de secuencias. De hecho, al generar bancos de ARN modificado con U mediante el protocolo Quantseq a partir de ARN total de células mES 24 h después del marcaje metabólico con s4U, se observó una fuerte acumulación de conversiones T>C en comparación con los bancos preparados a partir de ARN total de células mES no marcadas (figura 8B). Para confirmar esta observación en todo el transcriptoma, se alinearon las lecturas con las UTR 3' anotadas y se inspeccionó la aparición de cualquier mutación por UTR (figura 9). En ausencia de marcaje metabólico con s4U, se observó una mediana de la tasa de mutación del 0,1 % o menos para cualquier mutación concreta, una tasa que coincide con las tasas de error de secuenciación notificadas por Illumina. Tras 24 h de marcaje metabólico con s4U, se observó un aumento estadísticamente significativo (p < 10-4, prueba de Mann-Whitney) de 25 veces en las tasas de mutación T>C, mientras que todas las demás tasas de mutación se mantuvieron por debajo de las tasas de error de secuenciación esperadas (figura 9). Más concretamente, se midió una mediana de la incorporación de s4U del 2,56 % tras el marcaje de 24 horas, lo que corresponde a una incorporación de s4U por cada 39 uridinas (obsérvese que las medianas de la frecuencia de incorporación para el ARNm son superiores a las estimadas por HPLC en el ARN total [figura 6C], seguramente porque las especies estables de ARN no codificante, tales como el ARNr, están fuertemente sobrerrepresentadas en el ARN total). Estos análisis confirman que el nuevo procedimiento revela acontecimientos de incorporación de s4U en el ARNm tras el marcaje metabólico de ARN con s4U en células cultivadas.
[0314] Los inventores prevén los mismos resultados de incorporación de otros nucleótidos modificados, tales como s6G o 5-etiniluridina, como se ha notificado anteriormente (Eidinoffet al.,Science, 129, 1550-1551 (1959); Jaoet al.,PNAS, 105, 15779-15784 (2008); Melvinet al.,Eur. J. Biochem., 92, 373-379 (1978); Woodfordet al.,Anal. Biochem., 171, 166-172 (1988)).
[0316] Ejemplo comparativo 4: Uso de 5-bromouridina y frecuencias de apareamiento de bases dependientes del pH durante la transcripción inversa
[0317] Yuet al.(The Journal of Biological Chemistry, 268:21, 15935-15943, 1993) demostraron que el análogo de base bromouracilo forma apareamientos erróneos con G (guanina) en función del pH durante la polimerización. Además, se ha demostrado que el 5BrU es captado por las células, fosforilado e incorporado al ARN naciente (Larsenet al.,Current Protocols in Cytometry, 12 (7,12): 7.12.1-7.12.11, 2001). Se demostró que ambos pueden utilizarse para identificar el marcaje con 5BrU mediante preparaciones de bancos NGS con pH variante y secuenciación. Se utilizaron 100 pmol del oligonucleótido de ARN sintético que contenía una modificación 5BrU en una única posición central. La secuencia de ARN 5'-ACACUCUUUCCCUACACGACGCUCUUCCGAUCU-UGAGGUAGU[5BrU1AGGUUGUAUAGUAGAUCGGAAGCACACGUCUC-3' (SEQ ID NO: 8) posee dos secuencias conectoras subrayadas que se utilizaron para la transcripción inversa y la amplificación, y [5BrU], el marcador de 5-bromouridina en posición central. La transcripción inversa se realizó mediante Superscript II (Thermo Fisher Scientific) siguiendo las instrucciones del fabricante y utilizando el cebador oligonucleótido de ADN RT (5'-GTGACTGGAGTTCAGACGTGTGCTCTTCCGAT-CT-3', SEQ ID NO: 9) y 5x tampón RT cuyo pH se ajustó a pH 7, pH 8 o pH 9, respectivamente. Tras la transcripción inversa, 1 pmol de producto de transcripción inversa se sometió a amplificación por PCR utilizando el kit de amplificación de bancos en tiempo real KAPA (KAPA Biosystems) según las instrucciones del fabricante, utilizando los oligonucleótidos de<a>D<n>Solexa PCR Fwd (5'- AATGATAC-GGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3-, SEQ ID NO: 10) y Solexa IDX rev (5'-CAAGCAGAAGACGGCATACGAGATNNNNN-GTGACTGGAGTTCAGACGTGTGTCTTCCGATCT-3', SEQ ID NO: 11; NNNNNNN indica la posición de los nucleótidos del código de barras). Los bancos amplificados se secuenciaron mediante secuenciación de alto rendimiento utilizando la plataforma Illumina MiSeq. Las tasas de conversión del nucleótido 5BrU se determinaron contando la frecuencia de nucleótidos A (adenina), G (guanina) y C (citosina) distintos de la lectura mayoritaria esperada de T (timina) en la posición del 5BrU.
[0319] Las tasas de conversión dependientes del pH de 5BrU, o T en la lectura final, a A (conversión T>A) muestran un aumento de 1,1 veces y 1,4 veces con un aumento del pH durante la transcripción inversa a pH 8 y pH 9, respectivamente, en comparación con la tasa de conversión de fondo de 3-10'4 a pH 7 (figura 37C). La conversión T>G aumenta en 1,2 y 1,9 veces en comparación con la tasa de conversión de fondo más baja de 1-10-4 a pH 7. Por el contrario, la tasa de conversión T>C aumenta 2,2 veces y 4,3 veces en comparación con la tasa de conversión de fondo de 310 -4 a pH 7. La firma de los cambios dependientes del pH en las tasas de conversión es característica para el 5BrU en el ARN y puede utilizarse para identificar el número de 5BrU que se incorporan al ARN naciente durante la transcripción.
[0321] Ejemplo 5: Determinación de la producción transcripcional poliadenilada en células mES
[0323] Para comprobar si el marcaje con un pulso corto de s4U, seguido de la secuenciación del extremo 3' del ARNm, indica con precisión la producción transcripcional poliadenilada, se sometieron las células mES a un pulso corto de s4U de 1 h, seguido de la extracción del ARN total y la preparación de bancos de extremos 3' de ARNm (figura 10A). Los bancos generados por Quant-seq se cartografiaron a las UTR 3' anotadas en el genoma del ratón y se analizaron para detectar la presencia de conversiones T>C, que representaban ARN recién transcrito (figura 10A). Al comparar la abundancia relativa de los transcritos poliadenilados recién transcritos (es decir, con conversión T>C) con respecto a los transcritos poliadenilados en estado estacionario (es decir, con conversión T>C y sin conversión T>C), se observó un subconjunto de transcritos formado por 828 genes que estaban sobrerrepresentados entre el ARN recién transcrito (figura 10B). Entre los principales transcritos sobrerrepresentados se encontraban las agrupaciones de microARN específicos de células mES (agrupación miR-290 y miR182), que se cree que son especialmente efímeros porque sufren una rápida descomposición tras la escisión de las horquillas de microARN por Drosha en el núcleo, por lo que no se acumulan a niveles elevados en estado estacionario (figura 10B). Para caracterizar de forma más sistemática la producción transcripcionalde novomedida por el nuevo procedimiento, se realizó un análisis de enriquecimiento de la lista de genes de los 828 genes que estaban sobrerrepresentados entre el ARN recién transcrito, así como de los 825 genes principales detectados en estado estacionario por secuenciación convencional del extremo 3' del ARNm en relación con los factores de transcripción subyacentes predichos (utilizando Ingenuity Pathway Analysis, www.Ingenuity.com), así como de vías moleculares asociadas (utilizando Enrichr) (figura 10C). Como era de esperar, la expresión en estado estacionario de alto nivel no predijo la red de factores de transcripción asociada a la pluripotencia y se asoció principalmente a vías de mantenimiento, tales como las proteínas ribosómicas, el procesamiento del ARNm o el transporte de electrones. Por el contrario, el análisis de transcripciónde novomediante el procedimiento inventivo predijo con éxito factores de transcripción clave específicos de células mES, incluidos Oct4 (POU5F1), NANOG y SOX2, así como la red de pluripotencia (figura 10C). Se llegó a la conclusión de que el marcaje con s4U con pulsos cortos junto con la modificación del ARN y la secuenciación del extremo 3' del ARNm permite desacoplar la producción transcripcional inmediata de los efectos de estabilidad de la transcripción, por lo que proporciona un procedimiento rápido y escalable para estudiar la regulación transcripcional de los genes.
[0325] Ejemplo 6: Medición de la estabilidad de los transcritos de ARNm
[0327] Para determinar si el procedimiento inventivo puede emplearse para medir la estabilidad de los transcritos de ARNm, se realizó el marcaje con s4U de ARN en células mES durante 24 h, seguido de una persecución usando un exceso de uridina sin tiol, y se preparó ARN total en diferentes puntos temporales (0 min, 15 min, 30 min, 1 h, 3 h, 6 h, 12 h y 24 h), seguido de modificación con U y secuenciación del extremo 3' del ARNm (figura 11A). Una vez más, se cartografiaron los bancos en las UTR 3' anotadas en el genoma del ratón y se analizaron para detectar la presencia de conversiones T>C, que representaban transcritos antiguos (figura 11A). Un análisis global de la conversión T>C
que contiene transcritos a lo largo del tiempo, normalizado a la abundancia en estado estacionario (que permaneció constante en el transcurso del análisis) para 9430 genes reveló una mediana de la semivida del ARNm de 4 h (figura IIB ) . Como era de esperar, la semivida de los transcritos individuales varió en más de un orden de magnitud (figura I IC ) .
[0329] El control sobre la estabilidad del ARNm es fundamental para el orden temporal de la expresión génica. El nuevo procedimiento recapituló los principios clave subyacentes, ya que los transcritos reguladores, asociados a términos de GO, tales como "regulación transcripcional", "transducción de señales", "ciclo celular" o "desarrollo", presentaron unas semividas significativamente más cortas en comparación con los transcritos de mantenimiento, incluidos en términos de GO como "matriz extracelular", "proceso metabólico" o "síntesis de proteínas" (figura 11D). En conclusión, la invención permite la evaluación precisa de la estabilidad del ARNm, proporcionando un procedimiento conveniente para estudiar la regulación génica postranscripcional. Como se ha demostrado, el procedimiento recapitula firmas globales de regulación génica postranscripcional en células madre embrionarias de ratón.
[0331] Ejemplo 7: Alquilación ligada a tioles para la secuenciación metabólica de ARN pequeños
[0333] Para obtener información sobre la cinética intracelular de las vías de silenciamiento de ARN pequeños, se aplicó una estrategia de derivatización de análogos de nucleótidos que evita la necesidad del aislamiento bioquímico de especies de ARN marcadas y permite la determinación de la biogénesis del ARN y la cinética de recambio en el contexto del ARN total (figura 12). Esta estrategia se basa en un enfoque bien establecido de marcaje metabólico del ARN con 4-tiouridina (s4U), pero sustituye la etapa de biotinilación, ineficaz y difícil desde el punto de vista experimental, por un tratamiento químico breve que implica la reacción del ARN que contiene s4U con yodoacetamida, un compuesto reactivo al sulfhidrilo que, al reaccionar con s4U, crea un grupo amidometilo unido covalentemente en la interfaz de apareamiento de bases (figura 1). Cuando se combina con protocolos convencionales de preparación de bancos de ARN, tal como la secuenciación de ARN pequeños, la presencia del grupo voluminoso en los sitios de incorporación de s4U conduce a la incorporación errónea específica y cuantitativa de G durante la transcripción inversa (RT), pero no interfiere con la procesabilidad de la RT Los acontecimientos de s4U-incorporación pueden identificarse por comparación de secuencias, normalmente de modo bioinformático, en bancos de secuenciación de alto rendimiento con una resolución de un solo nucleótido y en el contexto de ARN no marcado, llamando a transiciones de T a C, por lo que elimina la necesidad de soluciones sembradas para medir eficiencias de marcado absolutas. Es importante destacar que no se conoce ninguna enzima que convierta la uridina en citosina y que las tasas de error T>C en los conjuntos de datos de secuenciación de ARN de alto rendimiento que utilizan, por ejemplo, la plataforma HiSeq 2500 de Illumina, son poco frecuentes, con una frecuencia inferior a uno de cada diez mil. Los inventores denominaron a este enfoque alquilación ligada a tiol (SH) para la secuenciación metabólica de ARN pequeños.
[0335] Para ensayar la capacidad de este procedimiento para revelar ARN pequeños marcados metabólicamente, se incubaron células deDrosophilaS2 con s4U durante 24 h en condiciones que no interfirieran con la viabilidad celular (es decir, 500|jM), seguido de extracción de ARN total y secuenciación de ARN pequeños. El marcaje metabólico se confirmó mediante análisis por HPLC del ARN total (figura 18), revelando una eficiencia de marcaje del 2,3 %, correspondiente a la incorporación de s4U en una de cada 43 uridinas. Al generar bancos a partir de ARN total seleccionado por tamaño de células S2 deDrosophilatras el marcaje metabólico con s4U durante 24 horas, se observó una fuerte acumulación de conversiones T>C en comparación con los bancos preparados a partir de células no marcadas, como se ilustra para el locus miR-184, que da lugar a un microARN expresado abundantemente, miR-184-3p, y a su miR* menos abundante, miR-184-5p (figura 12A). Para confirmar esta observación a escala genómica, se alinearon las lecturas con los loci de microARN anotados en el genoma deDrosophilay se inspeccionó la frecuencia de cualquier mutación concreta normalizada al contenido total de T por miARN (figura 12B). En ausencia de marcaje metabólico con s4U, se observó una mediana de tasa de mutación inferior al 0,1 % para cualquier mutación concreta, una tasa que coincide con las tasas de error de secuenciación notificadas por Illumina (obsérvese que el tratamiento con yodoacetamida del ARN total no marcado no tuvo un impacto detectable en la abundancia de ARN pequeños ni en la tasa de mutación, según se determinó mediante secuenciación de alto rendimiento. Véase la figura 19). Tras 24 h de marcaje metabólico con s4U, se observó un aumento estadísticamente significativo (p < 10-4, prueba de Mann-Whitney) de 74 veces en las tasas de mutación T>C, mientras que todas las demás mutaciones se mantuvieron por debajo de las tasas de error de secuenciación esperadas (figura 12B). Más concretamente, se midió una mediana de la incorporación de s4U del 2,22 % tras el marcaje de 24 horas, lo que corresponde a una incorporación de s4U por cada 45 uridinas, y concuerda con las tasas de incorporación determinadas mediante mediciones por HPLC del ARN total (figura 18). Por lo tanto, el marcaje metabólico en condiciones no alteradas hizo que la gran mayoría (>95 %) de los ARN pequeños presentaran como máximo un acontecimiento de incorporación de s4U (figura 20), que es insuficiente para la recuperación cuantitativa incluso mediante estrategias de biotinilación mejoradas (Duffyet al.,2015,supra),pero puede identificarse fácilmente mediante derivatización química de s4U (figura 12).
[0337] La capacidad del procedimiento inventivo de recuperar incorporaciones de s4U con una resolución de un solo nucleótido permitió diseccionar sistemáticamente el impacto del marcaje metabólico con s4U sobre el procesamiento y la carga de microARN. Con este fin, se determinó la sobrerrepresentación o infrarrepresentación de las conversiones T>C en posiciones individuales de un ARN pequeño concreto que se deriva del brazo 5p o 3p de un precursor de microARN, o que constituye una hebra miR o miR*, tal como se define mediante la carga selectiva de Argonauta. Al consultar los 71 microARN abundantemente expresados (>100 ppm) (correspondientes a 355p de miARN y 363p de miARN, o 44 miR y 27 miR*) no se observó una alteración sistemática significativa en las tasas de mutación T>C
relativas en ninguna posición determinada (figura 21). Se llegó a la conclusión de que el mareaje metabólico con s4U no afecta a la biogénesis ni a la carga de microARN.
[0339] En conjunto, el marcaje metabólico de ARN con s4U en células cultivadas S2 deDrosophila,seguido de SLAM-seq, recupera cuantitativamente los acontecimientos de incorporación de s4U en ARN pequeños con una resolución de un solo nucleótido y no revela ningún impacto significativo dependiente de la posición del marcaje con s4U en la biogénesis y carga de microARN.
[0341] Ejemplo 8: Cinética intracelular de la biogénesis de microARN
[0343] Los microARN derivan de transcritos de ARN polimerasa II que contienen horquillas y que son procesados secuencialmente por Drosha en el núcleo y por Dicer en el citoplasma, dando lugar a dúplex de miARN maduros (figura 13). Para investigar la cinética intracelular de la biogénesis de miARN, se determinó el aumento de las tasas de mutación T>C de miARN expresados abundantemente (>100 ppm en estado estacionario) en bancos de ARN pequeño preparados a partir de ARN total seleccionado por tamaño de células S2 deDrosophila5 min, 15 min, 30 min y 60 min después del marcaje metabólico con s4U y se comparó con las tasas de error detectadas en ausencia de marcaje con s4U (figura 13B). Después de un tiempo de etiquetado tan corto como 5 minutos, se detectó un aumento significativo de las tasas de conversión T>C, con un 17 % de todos los miR y un 90 % de todos los miR* que presentaban tasas de error por encima del nivel de fondo máximo. Esta fracción aumenta con el tiempo, con un 74 %, un 93 % y un 100 % de miR tras 15 min, 30 min y 1 h, respectivamente. Basándose en medidas conservadoras, más del 50 % de todos los miARN (22 de 42) se produjeron de forma detectable (es decir, superaron las tasas de conversión T>C máximas de fondo en un miR o en su respectivo compañero miR*) en un corto periodo de tiempo, es decir, 5 min, revelando una notable eficiencia en la organización celular del procesamiento de miARN.
[0345] También se determinó el número de lecturas que contenían conversiones T>C como un indicador indirecto del número de moléculas de miARN producidas a lo largo del tiempo (figura 13C). Aunque, por término medio, los miARN con una elevada abundancia en estado estacionario también muestran una elevada tasa de producción (tales como miR-184 o miR-14), otros muestran una baja abundancia en estado estacionario a pesar de sus elevadas tasas de biogénesis (tales como miR-276b o miR-190), o viceversa (es decir, miR-980 o miR-11), lo que indica que la tasa a la que se producen los miARN no es el único factor determinante de su abundancia intracelular.
[0347] Aunque el análisis global de los inventores reveló una eficiencia inesperadamente alta en la biogénesis general de miARN, los ARN pequeños seleccionados se produjeron a tasas significativamente más bajas. Algunos ejemplos de estos miARN producidos de forma ineficaz fueron los mirtrones (es decir, miR-1003, miR-1006 o miR-1008; figura 13C), una clase de microARN que se producen por corte y empalme en lugar de por procesamiento dirigido por Drosha. La biogénesis de los mirtrones puede ser selectivamente amortiguada, porque las horquillas precursoras derivadas del corte y empalme están específicamente dirigidas a la uridilación por la nucleotidiltransferasa terminal Tailor, que reconoce el sitio aceptor de corte y empalme 3' terminal, impidiendo así el procesamiento eficiente mediado por Dicer y desencadenando la descomposición exonucleolítica dirigida por dmDis3l2 (figura 13D). Los datos de los inventores aportan pruebas experimentales de la supresión selectiva de la biogénesis de mirtrones, ya que éstos presentan unas tasas de mutación T>C significativamente reducidas y las lecturas que contienen conversiones T>C se acumulan con menor rapidez a lo largo del tiempo, en comparación con los miARN canónicos (figura 13D). Además de confirmar la hipótesis de que la uridilación de las horquillas del pre-miARN subyace a la inhibición de la biogénesis de mirtrones, también se detectó una correlación significativa entre la prolongación del pre-miARN y las tasas de conversión T>C (figura 22).
[0349] En resumen, el nuevo procedimiento revela una notable eficiencia en las tasas intracelulares de producción de miARN y recapitula el efecto inhibidor selectivo de la uridilación de precursores de horquilla en la biogénesis de miARN.
[0350] Ejemplo 9: Control de la carga de ARN pequeño en complejos de ribonucleoproteínas
[0352] La biogénesis de microARN produce dúplex de miARN, pero sólo una de las dos hebras de un dúplex de miARN (la hebra miR) se carga preferentemente en Ago1 y se estabiliza selectivamente, mientras que la otra hebra (la hebra miR*) es expulsada y degradada en el proceso de carga del miARN (figura 14A). Para comprobar si el procedimiento inventivo recapitula el proceso de producción de dúplex de miARN y la carga de miARN en células vivas, se analizó la acumulación relativa de conversiones T>C que contenían lecturas para 20 miARN, para los que se detectaron niveles suficientemente altos tanto de miR como de su compañero miR* (figura 14B). No se observó una diferencia significativa en la abundancia entre los pares miR y miR* en los primeros puntos temporales tras el marcaje metabólico con s4U (es decir, 5 min, 15 min y 30 min; prueba de Mann Whitney,p> 0,05), lo que confirma que los miARN se acumulan inicialmente en forma de dúplex en un proceso que está cinéticamente desacoplado de la carga. Sólo después de una hora se detectó una acumulación significativamente mayor de miR que de hebras de miR* (prueba de Mann Whitney,p< 0,05, figura 14B), lo que indica que, en promedio, la carga de miARN en Ago1 se produce a velocidades mucho más lentas en comparación con la biogénesis de miARN.
[0354] Un análisis más detallado reveló un proceso bifásico subyacente a la acumulación de miARN: La primera fase era idéntica entre miR y miR* (kmiR = 0,35 ± 0,03 y kmiR* = 0,32 ± 0,03), por lo que reflejaba la acumulación de miARN en forma de dúplex. Cabe destacar que, tanto para miR como para miR*, una segunda fase, más lenta, estaba separada de la fase de biogénesis. Una grave caída en las tasas de acumulación de miR* (kmiR* = 0,32 ± 0,03) indicaba que la
gran mayoría (es decir, aproximadamente un 81 %) de las hebras miR* sufren una rápida degradación como consecuencia de la carga de miARN. En cambio, las hebras miR mostraron una segunda tasa de acumulación mucho más rápida (kmiR = 0,26 ± 0,03) en comparación con las hebras miR* (kmiR* = 0,32 ± 0,03), recapitulando la estabilización selectiva de las hebras miR, presumiblemente debido a la formación de miRISC. Pero cuando se compara con la tasa de biogénesis inicial (kmiR = 0,35 ± 0,03), también los miR mostraron una caída en la cinética de segunda fase (kmiR = 0,26 ± 0,03), lo que indica que sólo aproximadamente un 74 % de las hebras de miR se cargan eficazmente, mientras que alrededor de una cuarta parte de los miARN se degradan presumiblemente en forma de dúplex. Esto es coherente con que la disponibilidad de Argonauta vacía representa un factor limitante clave para la acumulación de miARN, y su sobreexpresión aumenta globalmente la abundancia intracelular de miARN.
[0356] La investigación más a fondo de pares individuales miR:miR* reveló eficiencias de carga variables entre los dúplex de miARN: Aunque la separación de hebras, y, por tanto, la carga, fue detectable en cuestión de minutos en el caso de miR-184,bantammostró una cinética de carga ligeramente retardada, con una separación de hebras que no se produjo antes de aproximadamente 30 min; y miR-282 se situó entre los miARN cargados con menor eficacia (figura 14D). Cabe destacar que las diferentes cinéticas de carga seguían las reglas termodinámicas de carga de Ago1, en las que los desajustes en la semilla o en la región de soporte 3' de los dúplex de miARN favorecían la formación eficiente de miRISC.
[0358] En resumen, el nuevo procedimiento reveló conocimientos detallados sobre la biogénesis de miARN y la cinética de carga.
[0360] Ejemplo 10: Producción de isomiR
[0362] Las pruebas acumuladas sugieren que una diversidad de procesos intracelulares diversifican la secuencia y la función de los microARN, pero los mecanismos subyacentes son poco conocidos y difíciles de diseccionar a partir de bancos de secuenciación de ARN pequeño en estado estacionario. Un ejemplo bien establecido de producción de isomiR es la maduración exonucleolítica de miARN en moscas. Aunque la mayoría de miARN enDrosophilase producen en forma de ARN pequeños de aproximadamente 22 nt, algunos miARN seleccionados se generan en forma más larga, con longitud aproximada de 24-meros, que requieren una maduración exonucleolítica adicional, mediada por la exorribonucleasa 3'-a-5' Nibbler para formar miRISC reguladores de genes. En los bancos convencionales de secuenciación de ARN pequeño y en los experimentos de hibridación Northern de alta resolución, miR-34-5p muestra un perfil de longitud diverso que varía desde isoformas de 24 a 21-meros expresadas abundantemente y originadas a partir de truncamientos del extremo 3' de la isoforma 5' idéntica (figura 15B). Para probar la capacidad del procedimiento inventivo para desentrañar el orden intracelular de los acontecimientos que dan lugar a múltiples isoformas de miR-34-5p, se analizaron bancos de ARN pequeño preparados a partir de ARN total de células S2 tras someterlas a marcaje metabólico con s4U llevado a cabo en el transcurso de un periodo de tiempo. En contraste con los ARN pequeños en estado estacionario, que presentan un perfil de longitud muy similar a lo largo de todo el periodo de tiempo, la conversión T>C que contenía lecturas de miR-34-5p se acumuló inicialmente en su totalidad como una isoforma 24-mera, en consonancia con el experimento previo de procesamientoin vitroque empleaba Dcr-1 recombinante o lisado de mosca y pre-miR-34 sintético (figura 15C, abajo). Sólo a partir de las 3 h se detectó la aparición de isoformas 3' de miR-34-5p más cortas, que contenían la conversión T>C (figura 15C superior). A partir de este punto temporal, la longitud media ponderada de miR-34-5p a lo largo del tiempo disminuyó continuamente, acercándose lentamente al perfil de longitud promedio de miR-34-5p observado en estado estacionario (figura 15D). Se concluyó que el procedimiento inventivo revela la aparición de isomiR, como ilustra el recorte exonucleolítico 3'-a-5' dirigido por Nibbler.
[0364] La maduración exonucleolítica de miARN requiere su carga en Ago1 y las pruebas bioquímicas sugieren que el recorte sólo se produce después de la eliminación de la hebra miR*, presumiblemente porque Nibbler propone funciones como una exorribonucleasa 3'-a-5' específica de una sola hebra. Dado que el procedimiento de los inventores permitía medir simultáneamente la carga de miARN y la producción de isomiR, se comprobó esta hipótesis comparando la señal de recorte de miR-34-5p (figura 15D) y la cinética de carga del dúplex de miR-34 (figura 15E). Se observó que el recorte en efecto se producía tras la carga de miR-34 y la eliminación de la hebra miR*, tal como determinaba el desplazamiento de la acumulación de miR-34-5p y -3p en los bancos de los inventores a partir de 1 h de marcaje metabólico (figura 15E). En conclusión, el procedimiento inventivo revela el orden intracelular de la producción de isoformas de miARN, por lo que proporciona una poderosa herramienta para arrojar luz sobre los procesos que diversifican la secuencia y la función de los miARN en las células vivas.
[0366] Ejemplo 11: Estabilidad de los microARN
[0368] Aunque diferentes miARN se ensamblan en complejos proteicos por lo demás indistinguibles, la acumulación de evidencias sugiere que su estabilidad puede diferir drásticamente (figura 16). Sin embargo, las tecnologías disponibles en la actualidad sólo miden la semivida relativa, pero no absoluta, de los miARN individuales, lo que impide una comprensión detallada de la estabilidad de los miARN. Además, el marcaje metabólico en condiciones inalteradas hace que la gran mayoría (>95 %) de los ARN pequeños marcados muestren como máximo un acontecimiento de incorporación de s4U (figura 20), que es insuficiente para la recuperación cuantitativa incluso mediante estrategias de biotinilación mejoradas (Duffyet al.,2015,supra),e introduce sesgos debidos a contenidos de U muy diferentes en secuencias de miARN diferentes. Por el contrario, el procedimiento inventivo proporciona un acceso rápido a las
estabilidades absolutas y normalizadas por contenido de secuencia de miARN en el contexto de bancos convencionales de ARN pequeño (figura 16). Mediante el análisis de la tasa de conversión T>C normalizada al contenido de miARN-U en bancos de ARN pequeño SLAM-seq preparados a partir de ARN total de células S2 deDrosophilasometidas a marcaje metabólico con s4U durante un máximo de 24 h, se determinó una mediana de la semivida de 12,13 h para las 41 hebras miR expresadas abundantemente (figura 16B), lo que indica que la semivida promedio de los miARN es significativamente más larga en comparación con la de los ARNm, que presentan una semivida de aproximadamente 4 a 6 horas. A diferencia de los miR, los miR* mostraron una semivida mucho más corta de 0,44 h (figura 16B), en consonancia con su mayor recambio como consecuencia de la carga de miR (figura 14). En general, los miR* son significativamente menos estables que los miR (figura 16C), pero incluso los miR mostraban estabilidades intrínsecamente distintas que diferían en más de un orden de magnitud, como ilustran el inestable miR-12-5p (t1/2 = 1,7 h) y el establebantam-5p(t-i/2 > 24 h). Es importante destacar que el procedimiento inventivo proporciona información sólida sobre las semividas individuales de los ARN pequeños, proporcionando resultados altamente reproducibles a través de una amplia diversidad de estabilidades de ARN pequeños (figura 16E).
[0370] La estabilidad de microARN es un factor que contribuye en gran medida al establecimiento de perfiles de ARN pequeños en células S2, como ilustran los dos miARN que se acumularon a los niveles más altos en estado estacionario: Aunquebantammostró una biogénesis relativamente lenta (figura 13) y tasas de carga intermedias (figura 14), se acumuló hasta alcanzar los niveles más altos en estado estacionario debido a una estabilidad inusualmente alta (t-i/2 > 24 h). Por el contrario, el segundo miARN más abundante, miR-184-3p, era 3 veces menos estable en comparación con bantam-5p (t1/2 = 6 h), pero aun así se acumulaba a niveles elevados debido a su extraordinaria cinética de biogénesis y carga (figuras 13 y 14). La secuenciación metabólica de ARN pequeños mediante SLAM-seq revela, por tanto, la contribución relativa de la biogénesis, la carga y el recambio de miARN al establecimiento de perfiles de ARN pequeños en estado estacionario, el principal determinante de la regulación génica mediada por miARN.
[0372] Ejemplo 12: La identidad de la proteína Argonauta define la estabilidad del ARN pequeño
[0374] Los genomas tanto de mamíferos como de insectos, codifican varias proteínas de la familia de proteínas Argonauta, algunas de las cuales cargan selectivamente ARN pequeños para regular subconjuntos distintos de transcritos por diferentes mecanismos. Aunque los dúplex de miARN son intrínsecamente asimétricos, es decir, la hebra miR se carga preferentemente en Ago1, cada precursor de miARN puede producir potencialmente dos hebras maduras de ARN pequeño que se clasifican de forma diferencial en dos proteínas Argonauta distintas de expresión ubicua en las moscas. A diferencia de la mayoría de miR, los miR* suelen cargarse en forma de especies funcionales en Ago2, la proteína efectora en la vía del ARNi, y sufren metilación selectiva en la posición 2' de la ribosa 3' terminal por la metiltransferasa Hen1 en la etapa final del ensamblaje de Ago2-RISC (figura 17A). La supresión de Ago2 no compromete la viabilidad celular, y permitió investigar el papel de las proteínas Ago en la estabilización selectiva de los ARN pequeños. Además, proporcionó un marco experimental para comprender si la semivida de los ARN pequeños está intrínsecamente determinada por la identidad de la proteína Ago con la que se asocian.
[0376] En primer lugar, se estableció el conjunto de miARN que se ensamblaban específicamente en Ago2 en células deDrosophilaS2 de tipo salvaje comparando bancos de ARN pequeño generados a partir de ARN total mediante clonación de ARN pequeños convencional (que reflejan predominantemente los ARN pequeños unidos a Ago1) con bancos generados a partir de ARN total, pero enriqueciendo para ARN pequeño metilado (es decir, unido a Ago2) mediante oxidación. Aunque la mayoría de los ARN pequeños en el procedimiento de clonación convencional consistían en miARN (en particular, hebras miR), la oxidación produjo un enriquecimiento selectivo en ARN pequeños endógenos unidos a Ago2 derivados de transposones, genes (predominantemente derivados de transcritos de ARNm solapantes) y loci que dan lugar a transcritos de replegamientos largos (loci estructurados). Como se ha descrito anteriormente, el subconjunto de miARN metilados (es decir, unidos a Ago2) se enriqueció selectivamente en miR*. La comparación de bancos de ARN pequeño oxidados y no oxidados permitió clasificar las hebras miR y miR* según su acumulación en Ago1 o Ago2 (figura 17C). Al comparar la abundancia de ARN pequeños enriquecidos en Ago2 en bancos de ARN pequeños convencionales generados a partir de células S2 de tipo salvaje y células S2 con supresión de Ago2 mediante ingeniería genómica CRISPR/Cas9 (figura 17D), se confirmó que los a Rn pequeños enriquecidos en Ago2 son significativamente menos abundantes tras la supresión de Ago2 (p < 0,002, prueba de Wilcoxon para datos emparejados, figura 17E).
[0378] A continuación, se determinó la estabilidad de los ARN pequeños enriquecidos en Ago2 midiendo la estabilidad de los ARN pequeños en bancos de ARN pequeños totales preparados a partir de células de tipo salvaje y células con supresión de Ago2(ago2ko)mediante marcaje metabólico con s4U, seguido de SLAM-seq. En las células de tipo salvaje, los ARN pequeños enriquecidos en Ago2 siguieron una cinética de descomposición en dos fases, en la que la mayoría (es decir, el 94 %) de la población mostró una alta estabilidad (t-i/2 >24 h) y sólo una minoría sufrió una descomposición rápida, con una semivida similar a la de los miR* (t-i/2 = 0,2 h). Se comprobó si la población asociada con una semivida larga podría representar la fracción unida a Ago2 determinando la estabilidad de la misma especie de ARN pequeño en bancos de a Rn pequeño metilados. De hecho, los ARN pequeños enriquecidos en Ago2 siguieron una cinética de descomposición exponencial simple con una semivida de >24 h (figura 17F). Por el contrario, en células S2 con supresión de Ago2, los ARN pequeños enriquecidos en Ago2 volvieron a seguir una cinética de descomposición de fase dual, pero ahora la mayoría (un 63 %) de la población mostraba una estabilidad similar a miR* (t-i/2 = 0,4 h), lo que indica que, en ausencia de Ago2, estos ARN pequeños se descomponen predominantemente tras la carga de su
hebra compañera en Ago1. Por el contrario, los ARN pequeños enriquecidos en Ago1 presentaban estabilidades idénticas en presencia y ausencia de Ago2 (figura 17F). Por tanto, los datos de los inventores desvelan estabilidades poblacionales específicas de miARN que vienen determinadas por su carga en proteínas Ago específicas. Por último, para diseccionar si las semividas de los ARN pequeños están intrínsecamente determinadas por la identidad de la proteína Ago con la que se asocian, se compararon las estabilidades de los 30 ARN pequeños más abundantes en Ago1 y Ago2 (figura 17G). Este análisis reveló que los ARN pequeños unidos a Ago2 mostraban una estabilidad significativamente mayor en comparación con los ARN pequeños unidos a Ago1(p< 10-4; prueba de Mann Whitney), quizás porque la metilación de los ARN pequeños unidos a Ago2 contribuye a la estabilización de los ARN pequeños en Ago2, pero no en Ago1.
[0380] En resumen, se proporciona un marco experimental para la disección de los mecanismos moleculares subyacentes al establecimiento y mantenimiento de perfiles de ARN pequeño que impactan en los estados de expresión génica en la salud y la enfermedad.
[0382] Ejemplo 13: SLAM-seq define funciones directas de regulación génica del eje BRD4-MYC
[0384] La definición de genes diana directos de reguladores transcripcionales, tales como BRD4 y MYC, es crucial, tanto para comprender su función celular básica como para el desarrollo de terapias. Sin embargo, descifrar las relaciones reguladoras directas sigue siendo un reto por diversas razones. Aunque los sitios de unión genómica pueden cartografiarse, por ejemplo, mediante inmunoprecipitación y secuenciación de la cromatina (ChIP-seq), la mera unión de un factor no predice funciones reguladoras en los genes vecinos. Un enfoque alternativo consiste en elaborar perfiles de expresión diferencial tras la perturbación experimental de un regulador determinado.
[0386] Para comprobar si SLAM-seq también captura respuestas transcripcionales más específicas evocadas por la perturbación, por ejemplo, de vías de transducción de señales, se trataron células K562 con inhibidores de molécula pequeña de su oncogén impulsor BCR/ABL, así como MEK y AKT, que actúan como mediadores en cascadas de transducción de señales diferenciadas corriente abajo de BCR/ABL (figura 25D, figura 30, A y B).
[0388] Cultivo celular
[0390] Las líneas celulares de leucemia K562, MOLM-13 y MV4-11 se cultivaron en RPMI 1640 y suero de ternera fetal ("fetal calf serum", FCS) al 10%. Se cultivaron células OCI/AML-3 en MEM-alfa con FCS al 10%. Se cultivaron células HCT116 y de encapsidación lentiviral Lenti-X (Clontech) en DMEM y FCS al 10 %. Todos los medios de crecimiento se suplementaron con L-glutamina (4 mM). Para las curvas de crecimiento, las células se sembraron con una densidad inicial de 2106 células/ml en presencia o ausencia de IAA 100 pM (sal de sodio del ácido indol-3-acético, Sigma-Aldrich) y se dividieron cada 24 h en una proporción de 1:2,6 para renovar el medio y la IAA y mantener las células subconfluentes. Las densidades celulares se midieron cada 24 horas utilizando un citómetro de flujo Guava EasyCyte (Merck Millipore).
[0392] Los ensayos de viabilidad de células tratadas con combinaciones de JQ1 y NVP-2 durante 72 h se realizaron usando el ensayo de viabilidad celular luminiscente CellTiter-Glo (Promega). Las señales de luminiscencia relativa ("relative luminescence signals", RLU) se registraron utilizando un lector de placas multimodo EnSpire (Perkin Elmer). Las respuestas fraccionales al tratamiento farmacológico se definieron como a = 1 - (RLUtratadas/RLUno tratadas) y el sinergismo se calculó como el exceso sobre la aditividad de Bliss (eob), siendo eob = aNVP-2, jq1 - ajQ1 - (aNVP-2 ■ 1 -ajQ-i).
[0394] Plásmidos y vectores utilizados en este ejemplo
[0396] SpCas9 y ARNgu se expresaron a partir del plásmido pLCG (hU6-ARNgu-EFS-SpCas9-P2A-GFP). pLCG se clonó basándose en un vector de expresión Cas9 de acceso público (lentiCRISPR v2, plásmido Addgene n.° 52961) e incluye un contexto de ARNquim mejorado. Para secuencias de ARNgu clonadas en pLCG. Como donantes para la reparación dirigida por homología de los loci diana, se generaron casetes con inserción de AID mediante síntesis génica (Integrated DNA Technologies) y amplificación por PCR de aproximadamente 500 pb de brazos de homología ("homology arms", HA) a partir de ADN genómico de líneas celulares diana. Todos los constituyentes se ensamblaron en un esqueleto de plásmido lentiviral (plásmido Addgene n.° 14748) que proporciona además expresión de GFP constitutiva para controlar las transfecciones. Se obtuvieron los vectores finales pLPG-AID-BRD4 (5'HA-BlastR-P2A-V5-AID-espaciador-3'HA-hPGK-eGFP) y pLPG-MYC-AID (5'HA-espaciador-AID-P2A-BlastR-3'HA-hPGK-eGFP). Para los experimentos de supresión aguda de proteínas, se introdujo Tir1 deOryza sativautilizando el vector lentiviral publicado SOP (pRRL-SFFV-Tir1-3xMYC-marcador-T2A-Puro). Para los ensayos de proliferación competitiva, Tir1 se introdujo utilizando el vector SO-blue (pRRL-SFFV-Tir1-3xMYC-marcador-T2A-EBFP2). El ARNi se llevó a cabo utilizando el vector LT3GEN que transporta insertos de ARNhc mir.
[0398] Edición del genomaytransducción lentiviral
[0400] Para obtener líneas celulares con inserción de AID, los plásmidos pLCG y pLPG se codistribuyeron mediante electroporación usando un electroporador MaxCyte STX (K562) o mediante transfección usando el reactivo de transfección FuGENE HD (Promega, HCT116). Tras la selección con blasiticidina (10 pg/ml, Invitrogen) para la inserción correcta, se aislaron clones unicelulares GFP' utilizando un clasificador celular BD FACSAria III (BD
Biosciences). Los clones se caracterizaron por genotipado con PCR en lisados celulares brutos. La inserción se confirmó también por inmunotransferencia de las proteínas marcadas y, en el caso de K562, los clones se caracterizaron por citometría de flujo para que se ajustaran lo mejor posible al inmunofenotipo de las células de tipo salvaje.
[0402] Para los experimentos de supresión aguda de proteínas, se transdujeron clones con inserción de AID homocigóticos validados con el vector de expresión SOP de Tir1. La encapsidación de partículas lentivirales se realizó en células Lenti-X mediante transfección con polietilenimina (PEI, Pm25000, Polysciences) del plásmido viral y los plásmidos auxiliares pCMVR8.74 (plásmido Addgene n.° 22036) y pCMV-vSv-G (plásmido Addgene n.° 8454) según procedimientos convencionales. Las células diana se infectaron a diluciones limitadas y se seleccionaron con puromicina (2 pg/ml, Sigma-Aldrich). Todos los experimentos de supresión se realizaron con células recién transducidas y seleccionadas para evitar un posible silenciamiento de los transgenes.
[0404] Inmunotransferencia e inmunofenotipado
[0406] La detección quimioluminiscente de anticuerpos primarios se realizó usando anticuerpos secundarios conjugados con HRP (Cell Signaling Technology, números de catálogo 7074, 7076 y 7077). Como alternativa, la detección por fluorescencia de los anticuerpos primarios de conejo y ratón se realizó en un sistema de obtención de imágenes Odyssey CLx (LI-COR Biosciences) utilizando anticuerpos secundarios de cabra anti-IgG de conejo IRDye 680RD y anticuerpos secundarios de cabra anti-IgG de ratón IRDye 800CW (LI-COR Biosciences).
[0408] Para el inmunofenotipado, las células se lavaron con tampón FACS (FCS al 5 % en PBS) y se preincubaron con un péptido bloqueante de receptores de FCS (Human TruStain FcX, Biolegend, diluido 1:20 en tampón FACS) durante 10 min a temperatura ambiente. Se añadieron anticuerpos conjugados con fluoróforos en una dilución final de 1:400 y las células se incubaron durante 20 min a 4 °C. Las células teñidas se lavaron dos veces y se resuspendieron en tampón FACS antes del análisis en un citómetro de flujo BD LSRFortessa (BD Biosciences).
[0410] Fraccionamiento de la cromatina
[0412] Para el fraccionamiento de la cromatina, las células se lavaron en PBS helado y se resuspendieron en tampón de extracción de cromatina (Tris-HCl 20 mM, NaCl 100 mM, MgCh 5 mM, glicerol al 10 %, IGEPAL CA-630 al 0,2 %, pglicerofosfato 20 mM, NaF 2 mM, Na3VO42 mM, cóctel de inhibidores de proteasas (sin EDTA, Roche), pH 7,5). La fracción insoluble se precipitó por centrifugación (16000g,5 min, 4 °C) y se lavó tres veces en tampón de extracción de cromatina en el que posteriormente se resuspendió. Se tomaron muestras de la fracción celular total y del sobrenadante antes y después de la primera precipitación, respectivamente. Todas las fracciones se suplementaron con SDS (dodecilsulfato de sodio, al 0,1 % (p/v)), se digirieron con benzonasa (Merck Millipore, 30 min, 4 °C) y se redisolvieron por sonicación en un dispositivo de sonicación Bioruptor (Diagenode).
[0414] SLAM-seq
[0416] Todos los ensayos SLAM-seq se realizaron al 60-70 % de confluencia para células adherentes o al 60 % de la densidad celular máxima contada en un hemocitómetro para células en suspensión. De 5 a 7 h antes de cada ensayo, se aspiró y sustituyó el medio de crecimiento. A menos que se indique lo contrario, las células se pretrataron con los inhibidores de molécula pequeña indicados o con IAA 100 pM durante 30 minutos para preestablecer la inhibición o degradación total de la diana. El ARN recién sintetizado se marcó durante los intervalos de tiempo indicados (45 min o 60 min) con una concentración final de 100 pM de 4-tiouridina (s4U, Carbosynth). Las células adherentes se recolectaron por congelación rápida directa de las placas en hielo seco. Las células en suspensión se centrifugaron y se congelaron inmediatamente. La extracción del ARN se realizó con el kit RNeasy Plus Mini Kit (Qiagen). El ARN total se sometió a alquilación mediante yodoacetamida (Sigma, 10 mM) durante 15 min y el ARN se volvió a purificar mediante precipitación con etanol. Se utilizaron 500 ng de ARN alquilado como entrada para generar bancos de secuenciación de ARNm 3' utilizando un kit disponible en el mercado (kit de preparación de bancos de secuenciación de ARNm 3' QuantSeq FWD para Illumina y kit PCR Add-on para Illumina, Lexogen). La secuenciación profunda se realizó utilizando las plataformas HiSeq1500 y HiSeq2500 (Illumina).
[0418] Análisis de la expresión génica diferencial, PCA y enriquecimiento de términos GO
[0420] Para el análisis a nivel de genes, las lecturas sin procesar cartografiadas en diferentes anotaciones UTR del mismo gen se sumaron por Entrez Gene ID. Los estudios piloto de células K562 con inhibidores de cinasas se realizaron como experimentos individuales. El análisis de la expresión génica diferencial se restringió a los genes con >10 lecturas en al menos una condición para las series de secuenciación de 50 pb (flavopiridol y DMSO) o >20 lecturas en al menos una condición para las series de secuenciación de 100 pb (mk2206, trametinib, nilotinib, trametinib mk2206 y DMSO). Para estimar la expresión diferencial, se añadió un pseudoconteo de 1 lectura sin procesar a todos los genes.
[0422] Todos los demás experimentos SLAM-seq se realizaron por triplicado y se analizaron de la siguiente manera. La llamada de expresión génica diferencial se realizó sobre recuentos de lecturas sin procesar con conversiones >2 T>C utilizando DESeq2 (versión 1.14.1) con ajustes por defecto, y con factores de tamaño estimados sobre las correspondientes lecturas totales de ARNm para la normalización global. El análisis descendente se restringió a los genes que pasaban todos los filtros internos para la estimación de FDR mediante DESeq2. Tras una transformación
estabilizadora de la varianza, se realizó un análisis de componentes principales de los 500 genes más variables en todas las condiciones de un experimento determinado. Se realizó un análisis de enriquecimiento en términos GO en genes significativa y fuertemente regulados a la baja (FDR < 0,1, log2FC < -1) en SLAM-seq tras el tratamiento con IAA en K562MYC'AID Tir1 mediante la prueba de sobrerrepresentación PANTHER (prueba exacta de Fisher con corrección de pruebas múltiples FDR, pantherdb.org).
[0424] Estimación del recambio de ARNm
[0426] Para obtener una estimación aproximada del recambio de ARNm en células K562 no perturbadas, se supuso que existía un equilibrio en estado estacionario de la biosíntesis y la descomposición de ARNm con cinética de primer orden que se aproxima al marcaje completo tras la exposición prolongada a s4U. Para cualquier gen i, podría utilizarse, por tanto, la fracción pi de lecturas convertidas (>2 conversiones T>C) dentro de los recuentos totales de lecturas tras 60 minutos de marcaje con s4U, para calcular la semivida del ARNm celular como:
[0429]
[0432] Inmunoprecipitación de la cromatina, seguida de secuenciación profunda (ChIP-Seq)
[0434] Para ChIP-Seq, de 1108 a 2108 células K562AID-BRD4 Tir1 se trataron durante 1 h con IAA 100 pM o DMSO, se reticularon con formaldehído al 1 % durante 10 min a temperatura ambiente y se inactivaron con glicina 500 mM durante 5 min, seguido de 2 lavados con PBS helado. Tras aislar los núcleos, los sedimentos se lisaron en un tampón de lisis (Tris-HCl 10 mM, NaCl 100 mM, EDTA 1 mM, EGTA0,5 mM, Na-desoxicolato al 0,1 % y N-lauroilsarcosina al 0,5 %, pH 8,0) que contenía inhibidores de proteasas (Complete, Roche). El cizallamiento de la cromatina se realizó utilizando un dispositivo de sonicación Bioruptor (Diagenode). Los restos celulares se sedimentaron por centrifugación a 4 °C durante 10 min a 16000 g. Para permitir la comparación directa entre las muestras de ChIP-seq tratadas con DMSO y con IAA, se añadió cromatina de una línea celular de LMA de ratón (RN2) como control sembrado para la normalización interna en una proporción de RN2:K562 “ 1:10. Se añadió Triton X-100 (concentración final del 1 %) y se realizó la inmunoprecipitación incubando el lisado de cromatina con 5-10 pg de anticuerpo durante toda la noche a 4 °C en una rueda giratoria. Los complejos de anticuerpo-cromatina se capturaron con esferas de Sepharose magnéticas (G&E Healthcare; bloqueadas con BSA 1 mg/ml en TE durante 2 h a temperatura ambiente) durante 2 h a 4 °C en una rueda giratoria. Las esferas se lavaron una vez cada una con tampón RIPA (NaCl 150 mM, Tris-HCl 50 mM, SDS al 0,1 %, IGEPAL CA-630 al 1 %, Na-desoxicolato al 0,5 %, pH 8,0), tampón Hi-Salt (NaCl 500 mM, Tris-HCl 50 mM, SDS al 0,1 %, IGEPAL CA-630 al 1 %, pH 8,0), tampón LiCl (LiCl 250 mM, Tris-HCl 50 mM, IGEPAL CA-630 al 1 %, Na-desoxicolato al 0,5 %, pH 8,0) y dos veces con TE. Los complejos inmunitarios se eluyeron en SDS al 1 %, NaHCO3100 mM. Las muestras se trataron con ARNasa A (100 pg/ml) durante 30 min a 37 °C, se añadió NaCl (200 mM) y se revirtieron los enlaces cruzados durante 6 h a 65 °C, seguido de una digestión con proteinasa K 200 ug/ml a 45 °C durante 2 h. El ADN genómico se recuperó mediante extracción con fenol-cloroformo y precipitación con etanol tanto del material precipitado como de la cromatina de entrada cizallada (un 1 % del material utilizado para ChIP). Los bancos para la secuenciación Illumina se prepararon utilizando el kit de preparación de bancos de ADN NEBNext Ultra II para Illumina (New England Biolabs, n.° 7645).
[0436] Análisis de los datos ChIP-seq controlados por siembra
[0438] Para el análisis de muestras ChIP-seq controladas por siembra se preparó un genoma híbrido de referencia fusionando secuencias genómicas humanas y de ratón (GRCh38 y mm10). Las lecturas se alinearon primero con este genoma híbrido utilizando bowtie2 v2.2.9 (--sensible) y posteriormente se separaron en bins humanos y de ratón. La cobertura de lectura de cada pista se calculó utilizando deeptools v2.5.0.1 y se reescaló utilizando factores de normalización de siembra. A las pistas de cobertura normalizadas resultantes se les restó su respectiva señal de entrada antes de calcular las proporciones entre las muestras tratadas con DMSO y las tratadas con IAA.
[0440] Reanálisis de los datos de ChIP-seq y Click-seq y llamada de superpotenciadores
[0442] Los datos Click-seq publicados anteriormente, los datos H3K27ac ChIP-seq y las muestras de entrada correspondientes se realinearon con GRCh38 con bowtie (versión 1.1.2) tras eliminar las secuencias adaptadoras mediante cutadapt. Para las células K562, se utilizaron genes proximales superpotenciadores. Para MV4-11 y MOLM-13, los picos H3K27ac se llamaron utilizando MACS2 (v2.1.0.20140616) con los parámetros por defecto. La llamada de superpotenciadores se realizó utilizando ROSE v0.1 con los parámetros por defecto. Los superpotenciadores se asignaron a genes basándose en el TSS más cercano en un radio de 100 kb. Las comparaciones subsiguientes se restringieron a los transcritos proximales del superpotenciador con un Entrez GeneID asignado y expresión detectable en SLAM-seq.
[0444] Modelización predictiva de las respuestas transcripcionales
[0446] Las posiciones TSS de todos los transcritos de Refseq en GRCh38.p9 se descargaron de www.ensembl.org/biomart. La densidad de lecturas de CAGE-seq a una distancia de 300 pb de cada TSS en la hebra respectiva se extrajo de los datos CAGE-seq publicados de células K562. El TSS con la señal media más alta de dos réplicas se retuvo para el análisis posterior. Del proyecto ENCODE (www.encodeproject.org/) o del Cistrome Data Browser (cistrome.org/db/)
se obtuvieron 213 pistas ChIP-seq preanalizadas y de acceso público y 1 experimento de secuenciación de bisulfito del genoma completo. Las señales ChIP-seq a una distancia de 500 y 2000 pb alrededor de cada TSS se utilizaron como entrada para la modelización de la clasificación.
[0448] Para la modelización predictiva de la hipersensibilidad a JQ1, los genes se clasificaron como regulados a la baja basándose en las respuestas de las células K562 a 200 nM de JQ1 medidas por SLAM-seq (FDR < 0,1, log2FC < -0,7). Los genes no afectados (FDR > 0,1, -0,1 < log2FC < 0,1) se submuestrearon para obtener un conjunto de control emparejado de igual tamaño y expresión de ARNm de línea de base mediante remuestreo iterativo y comparación con la distribución diana mediante una prueba de Kolmogorov-Smirnov. Los genes de búsqueda y de control se intersectaron con la matriz de señales TSS-ChIP-seq y se dividieron en conjuntos de entrenamiento (el 75 %) y de ensayo (el 25 %). Las señales ChIP escaladas y centradas se utilizaron para entrenar cinco clasificadores independientes (GLM de red elástica, máquina de aumento de gradiente y SVM con núcleos lineales, polinómicos y radiales) con validación cruzada >5 veces durante el ajuste de parámetros utilizando el paquete CARET El rendimiento de los 4 modelos finales se comparó con el conjunto de ensayo retenido.
[0450] Para la modelización predictiva de la transcripción dependiente de MYC, los genes se clasificaron como regulados a la baja (FDR < 0,1, log2FC < -1) o no afectados (FDR < 0,1, -0,2 < log2FC < 0,2) según las respuestas en SLAM-seq tras el tratamiento con IAA de células K562MYC'AID Tir1. Los genes no afectados se submuestrearon para obtener un conjunto de control de igual tamaño y expresión, tal como se describe para la modelización de la respuesta a JQ1. Dado el gran tamaño de la muestra, los genes se dividieron en conjuntos de entrenamiento (un 60 %) y de ensayo (un 20 %), así como en un conjunto de validación adicional (un 20 %), y se procesaron como se describe para la modelización de las respuestas a JQ1.
[0452] Análisis de una firma de diana directa de MYC en líneas celulares y datos de secuenciación de ARN de pacientes con cáncer
[0454] Para comparar la expresión de MYC con una firma empírica de respuesta a MYC, se obtuvieron datos de expresión génica normalizados para FPKM de 672 líneas celulares de cáncer humano de Klijnet al.(Nat. Biotechnol., 33, 306 312 (2015)). Se excluyeron las líneas celulares que expresaban MYCN o MYCL con niveles superiores a MYC y las muestras restantes se clasificaron como MYC-alto (el 20 % superior de expresión de MYC) o MYC-bajo (el 20 % inferior de expresión de MYC). Entre todos los genes anotados en el conjunto de datos de expresión de la línea celular por Entrez GeneID y significativamente regulados a la baja (FDR < 0,1) en K562MYC'AID Tir1 y HCT116 MYC-AID Tir1, los 100 genes con la media más fuerte de regulación a la baja en ambas líneas celulares se definieron como una firma común de respuesta a MYC. Para obtener una estimación equilibrada de la expresión de todos los genes de firma, los valores FPKM de cada gen se escalaron en todas las líneas celulares y los valores de expresión escalados de todos los genes de firma se promediaron para cada línea celular. Los datos de expresión génica normalizados en el cuartil superior de 5583 pacientes con cáncer de 11 proyectos TCGA se descargaron de portal.gdc.cancer.gov y se procesaron de forma independiente para cada tipo de cáncer como se describe para el conjunto de datos de líneas celulares. El análisis de enriquecimiento de conjuntos de genes se realizó con GSEA Desktop v3.0 beta.
[0456] Preparación de muestras para la proteómica
[0458] Las células K562AID'BRD4 Tir1 se trataron en tres experimentos independientes con IAA 100 pM o DMSO durante 60 min, se lavaron tres veces con PBS helado, se sedimentaron por centrifugación y se congelaron. Los sedimentos se resuspendieron en tampón de lisis (urea 10 M, HCl 50 mM) y se incubaron durante 10 min a temperatura ambiente, tras lo cual se ajustó el pH con tampón Tris 1 M (Tris-HCl, cfinal = 100 mM, pH 8). Los ácidos nucleicos se digirieron con benzonasa (Merck Millipore, 250 U por gránulo, 1 h, 37 °C), y se añadió yodoacetamida para la alquilación (15 mM, 30 min, temperatura ambiente) antes de la extinción con DTT (4 mM, 30 min, 37 °C). Para la proteólisis, se diluyeron 200 pg de proteína por muestra con tampón Tris 100 mM hasta una concentración de urea de 6 M y se digirieron con Lys-C (Wako) con una proporción de enzima-proteína de 1:50 (3 h, 37 °C). Las muestras se diluyeron de nuevo con tampón Tris 100 mM hasta una concentración final de urea de 2 M y se digirieron con tripsina (Trypsin Gold, Promega) con una proporción enzima-proteína de 1:50 (37 °C, durante la noche). El pH se ajustó a <2 utilizando ácido trifluoroacético (TFA, Pierce) al 10 % y se desalaron utilizando cartuchos C18 (Sep-Pak Vac (50 mg), Waters). Los péptidos se eluyeron con acetonitrilo al 70 % (ACN, Chromasolv, calidad de gradiente, Sigma-Aldrich) y TFA al 0,1 %, seguido de liofilización. El marcaje isobárico se realizó utilizando el TMTsixplex Isobaric Label Reagent Set (Thermo Fisher Scientific), las muestras se mezclaron en cantidades equimolares y se liofilizaron. Tras la repurificación con un cartucho C18, los péptidos se eluyeron con ACN al 70 % y ácido fórmico al 0,1 % (FA, Suprapur, Merck) seguido de liofilización.
[0460] Fraccionamiento de muestras proteómicas mediante cromatografía de intercambio catiónico fuerte (SCX)
[0462] La muestra seca se disolvió en tampón SCX A (NaH2PO45 mM, ACN al 15 %, pH 2,7). La SCX se realizó con 200 pg de péptido utilizando un sistema UltiMate 3000 Rapid Separation (Thermo Fisher Scientific) con un caudal de 35 pl/min y una columna TOSOH TSKgel SP-2PW SCX hecha a medida (partículas de 5 pm, tamaño de poro de 12,5 nm, 1 mm de diámetro interno x 250 mm). Para la separación se empleó un gradiente ternario comenzando con tampón A al 100 % durante 10 min, seguido de un incremento lineal hasta tampón B al 10 % (NaH2PO45 mM, NaCl 1 M, ACN al 15 %, pH 2,7) y tampón C al 50 % (Na2HPO45 mM, ACN al 15 %, pH 6) in 80 min, hasta tampón B al 25 % y tampón C al 50 % en 10 min, tampón B al 50 % y tampón C al 50 % en 10 min y una elución isocrática durante 15 min más. El
flujo se recogió como fracción única y a lo largo del gradiente se recogieron fracciones cada minuto durante 140 min, se agruparon en 110 fracciones y se almacenaron a -80 °C.
[0464] LC-MS/MS para la cuantificación de péptidos
[0466] Se realizó una LC-MS/MS utilizando un sistema Thermo Fisher RSLC nano (Thermo Fisher Scientific) acoplado a un espectrómetro de masas Q Exactive HF (Thermo Fisher Scientific) equipado con una fuente de nanonebulización Proxeon (Thermo Fisher Scientific). Los péptidos se cargaron en una columna trampa (Thermo Fisher Scientific, PepMap C18, 5 mm * 300 um DI, partículas de 5 pm, tamaño de poro 100 A) a 25 pl/min utilizando TFA al 0,1 % como fase móvil. Después de 10 min, se intercambió la columna trampa en línea por la columna analítica (Thermo Fisher Scientific, PepMap C18, 500 mm * 75 um DI, 2 um, 100 A). El gradiente comenzó con las fases móviles: A al 98 % (H2O/FA, 99,9/0,1, v/v) y B al 2% (H2O/ACN/EA, 19,92/80/0,08, v/v/v), aumentó hasta B al 35% durante 60 min, seguido de un aumento hasta B al 90 % durante 5 min, se mantuvo constante durante 5 min y volvió a disminuir hasta A al 98 % y B al 2 % durante 5 min para el equilibrio a 30 °C.
[0468] El espectrómetro de masas Q Exactive HF se hizo funcionar en su modo dependiente de datos, utilizando un barrido completo (intervalo m/z 350-1650, resolución nominal de 120000, valor diana 3E6), seguido de barridos MS/MS de los 10 iones más abundantes. Los espectros de MS/MS se adquirieron utilizando una energía de colisión normalizada del 35 %, una anchura de aislamiento de 1,2 m/z, una resolución de 60000, un valor diana de 1E5 y una primera masa fija fijada en 115 m/z. Los iones precursores seleccionados para la fragmentación (se excluye el estado de carga no asignado, 1, >8) se incluyeron en una lista de exclusión dinámica durante 30 s. Además, la diana mínima de AGC se fijó en 1E4 y el umbral de intensidad en 4E4. La característica de coincidencia de péptidos se configuró como preferida y se activó la característica de exclusión de isótopos.
[0470] Análisis de datos proteómicos
[0472] Los datos sin procesar se procesaron con Proteome Discoverer (versión 1.4.1.14, Thermo Fisher Scientific). Las búsquedas en bases de datos se realizaron con MS Amanda (versión 1.4.14.8240) en una base de datos compuesta por la base de datos humana SwissProt y contaminantes anexos (20508 secuencias de proteínas en total). La oxidación de la metionina se estableció como modificación dinámica y la carbamidometilación de la cisteína y la TMT en el N-terminal y la lisina se especificaron como modificaciones fijas. La tripsina se definió como la enzima proteolítica que se escinde después de la lisina o la arginina, excepto cuando va seguida de prolina, y se permitieron hasta dos escisiones no realizadas. La tolerancia de iones precursores y fragmento se fijó en 5 ppm y 0,03 Da, respectivamente. Los espectros identificados se volvieron a analizar con Percolator y se filtraron al 0,5% de FDR en el nivel de coincidencia del espectro peptídico. La agrupación de proteínas se realizó en Proteome Discoverer aplicando un principio estricto de parsimonia. Las intensidades de los iones indicadores se extrajeron de la masa centroide más segura con una tolerancia de integración de 10 ppm. Para todas las proteínas detectadas con al menos 2 péptidos distintivos, la cuantificación del nivel de proteína se calculó basándose en todos los péptidos distintivos dentro de un grupo de proteínas determinado. La confianza estadística de las proteínas diferencialmente abundantes se calculó utilizando limma.
[0474] Preparación de metabolitos celulares para la espectrometría de masas
[0476] Las células se sembraron a 2105 células/ml en medio de crecimiento precalentado en presencia de IAA 100 pM o DMSO (1:5000 (v/v)). El medio se cambió a las 24 horas y las células se contaron y recogieron a las 48 horas, se lavaron dos veces con PBS y se congelaron. Los sedimentos de 4106 células por muestra se lisaron en una mezcla de MeOH, ACN y H2O (en una proporción de 2:2:1 (v/v)), se agitaron en vórtice y se congelaron. Para una lisis completa, las células se sometieron a tres ciclos de congelación rápida, descongelación y sonicación (10 min, 4 °C, intensidad máxima en un dispositivo de sonicación Bioruptor (Diagenode)). Las proteínas se precipitaron durante 1 h a -20 °C, seguido de centrifugación (15 min, 18000g,4 °C). Los sobrenadantes se recuperaron y evaporaron en un concentrador SpeedVac, los sedimentos se volvieron a disolver en una mezcla 1:1 de ACN y H2O (v/v) por sonicación (10 min, 4 °C) y los restos restantes se eliminaron por centrifugación (4 °C, 15 min, 18000 g).
[0478] LC-MS/MS dirigida de metabolitos celulares
[0480] Antes del análisis, se añadieron 50 pl de ACN a 60 pl de cada muestra y se inyectaron 3 pl en un sistema HPLC UltiMate 3000 XRS (Dionex, Thermo Scientific). Los metabolitos se separaron utilizando un gradiente de 14 min que comenzaba con una fase móvil A al 5 % (acetato de amonio 10 mM en agua, pH 7,5) y aumentaba hasta un A al 50 % en fase B (ACN) utilizando una columna ZIC-HILIC (100 x 2,1 mm, 3,5 pm, 200 A, Merck) y empleando un caudal de 100 pl/min. La MS/MS se realizó con un espectrómetro de masas TSQ Quantiva de triple cuadrupolo (Thermo Scientific), utilizando el control de reacciones seleccionadas ("selected reaction monitoring", SRM) en el modo de iones negativos. Las muestras de tres experimentos independientes se analizaron por triplicado técnico y los datos de MS se analizaron con TraceFinder (Thermo Scientific).
[0482] Resultados
[0484] Una SLAM-seq tras 30 min de pretratamiento y 60 min de marcaje con s4U reveló respuestas inmediatas prominentes a los inhibidores de molécula pequeña (figura 25E, figura 30C) que no estaban sesgadas por las semividas del ARNm,
mientras que los cambios a nivel del ARNm total estaban confinados a unos pocos ARNm de vida corta (figura 25F). El tratamiento con un único agente con los tres inhibidores desencadenó respuestas transcripcionales específicas y diferenciadas (figura 30C), mientras que el tratamiento combinado con inhibidores de MEK y AKT se aproximó a los efectos observados tras la inhibición de BCR/ABL (figura 25, E y G), en consonancia con su función en las principales vías efectoras de BCR/ABL. En conjunto, estos estudios piloto establecen la SLAM-seq como un enfoque rápido, accesible y escalable para sondear respuestas transcripcionales específicas y globales con respecto a ARNm maduros, independientemente de la semivida del ARNm y en escalas de tiempo que excluyen los efectos indirectos. Combinado con la rápida perturbación de reguladores específicos, SLAM-seq permite la identificación inequívoca de genes diana transcripcionales directos.
[0486] Para generalizar este enfoque para investigar el gran número de reguladores para los que, como en el caso de BRD4, no se dispone de inhibidores selectivos, se intentó combinar SLAM-seq con la degradación química-genética de proteínas. Para conseguir una cinética lo suficientemente rápida como para asignar dianas de forma inequívoca, se empleó el sistema degron inducible por auxinas ("auxin-inducible degron", AID), que degrada proteínas marcadas con AID en menos de 1 hora. Específicamente, se modificó el locus BRD4 de las células K562 para que portase un marcador AID mínimo (figura 26A), y se transdujeron clones homocigóticos marcados con un vector lentiviral que expresaba altos niveles de la proteína F-box del arroz Tir1, que media en la ubiquitinación de proteínas marcadas con AID tras el tratamiento con auxina (ácido indol-3-acético, IAA). De hecho, el tratamiento con auxina de células marcadas con AID desencadenó una degradación altamente específica (figura 31, A y C) y casi completa de BRD4 en 30 min (figura 26B y figura 31B). Aunque la introducción del marcador o la expresión de Tir1 y el tratamiento con auxina fueron bien tolerados, la degradación prolongada de BRD4 suprimió fuertemente la proliferación (figura 31, D y E), en línea con su función esencial notificada.
[0488] Para cartografiar a continuación las consecuencias transcripcionales directas de la degradación de BRD4, se trataron las células con auxina durante 30 min y se marcó el ARN recién sintetizado durante los 60 min siguientes con s4U. La posterior cuantificación de los ARNm marcados mediante SLAM-seq reveló una regulación global a la baja de la transcripción (figura 26C y figura 31F), similar a los efectos de la inhibición de CDK9. Para investigar los acontecimientos reguladores que subyacen a este fenómeno, se midieron los niveles de la maquinaria de transcripción central unida a la cromatina tras la degradación de BRD4. Aunque ni los componentes del complejo de preiniciación, ni DSIF, NELF o P-TEFb mostraron un reclutamiento global alterado, si se observó una marcada disminución en la fosforilación de Pol2 en S2, pero no en S5, de sus repeticiones de heptadas C-terminales (figura 26D), indicativo de un defecto en la liberación de la pausa proximal del promotor. De hecho, la secuenciación ChIP controlada por siembra de Pol2 tras la degradación de BRD4 (después de 60 min de tratamiento con auxina) mostró un marcado incremento en la ocupación de Pol2 en los sitios de inicio de transcripción activos ("transcription start sites", TSS), mientras que la densidad de Pol2 disminuyó en todos los cuerpos génicos (figura 26, E y F y figura 32A). De forma similar, los niveles de Pol2 fosforilada en S5 aumentaron en los promotores, mientras que la Pol2 fosforilada en S2 (asociada a las últimas etapas de alargamiento) se redujo considerablemente en todos los cuerpos génicos (figura 26, E y F y figura 32, B y C). Estos hallazgos están en línea con una reducción generalizada de la transcripción tras la degradación de la proteína pan-BET independiente del reclutamiento de CDK9 a la cromatina, y demuestran que la pérdida de BRD4 por sí sola es suficiente para mediar en estos efectos. En conjunto, estos resultados establecen un papel central de BRD4 en la autorización de la liberación de polimerasas estancadas en la mayoría de los promotores activos.
[0489] Si bien estos hallazgos están en consonancia con la unión promiscua de BRD4 a TSS activos y su interacción física con la maquinaria transcripcional central, contrastan con los efectos selectivos observados tras el tratamiento con BETi en el análisis convencional de la expresión. Para definir los efectos transcripcionales inmediatos de BETi y compararlos con la degradación de BRD4, se llevó a cabo SLAM-seq tras el tratamiento con diferentes dosis del BETi JQ1 en células K562 y en la línea celular de leucemia mieloide aguda (LMA) MV4-11. En ambos tipos celulares, el tratamiento con altas dosis de JQ1 (1 o 5<j>M) suprimió ampliamente la transcripción (figura 26G, figura 33A) y redujo globalmente la fosforilación de Pol2-S2 (figura 33B), de forma similar a los efectos observados tras la degradación de BRD4, lo que indica que las funciones transcripcionales globales de BRD4 dependen del bromodominio BET Es importante destacar que los efectos del tratamiento con altas dosis de BETi sobre la fosforilación de Pol2 S2 también se recapitularon mediante la atenuación de BRD4 en momentos anteriores a los efectos antiproliferativos (figura 33, C y D), mientras que la supresión de BRD2 o BRD3, las otras dos dianas de BETi expresadas de forma ubicua, no desencadenaron tales fenómenos. Estos resultados demuestran que los efectos transcripcionales globales de BETi están mediados principalmente por la inhibición de BRD4 y no pueden ser compensados por otras proteínas que contienen bromodominios BET
[0491] Dado que las dosis de JQ1 superiores a 1<j>M superan ampliamente las concentraciones inhibidoras del crecimiento en la LMA y otras líneas celulares cancerosas sensibles a JQ1, se intentó explorar las respuestas transcripcionales directas con una dosis más selectiva de 200 nM, que desencadena fuertes efectos antileucémicos en una amplia gama de modelos de LMA. En las células K562, una de las pocas líneas celulares de leucemia insensibles a BETi, JQ1 200 nM indujo una desregulación selectiva de un pequeño número de transcritos (figura 26H). Sorprendentemente, el tratamiento de dos líneas celulares de LMA altamente sensibles con la misma dosis desencadenó respuestas transcripcionales comparables en escala (figura 26H y figura 34, A y B) y afectó a un conjunto similar de transcritos hipersensibles a BETi, que incluíanMYCy otras dependencias pan-mieloides (figura 26I y figura 34, C y D). Estos hallazgos demuestran que la resistencia a BETi en la leucemia viene determinada por una adaptación secundaria más que por una falta de respuestas transcripcionales primarias. También se observó un pequeño grupo de genes que
suelen regularse al alza tras la inhibición de BET o la degradación de BRD4 (figura 34E). Curiosamente, entre ellos se encuentra EGR1, un supresor tumoral en la LMA, que puede contribuir a potenciar los efectos de BETi en este contexto. En conjunto, los resultados de los inventores revelan una profunda dependencia de la dosis de las respuestas transcripcionales primarias a BETi y demuestran que las dosis terapéuticamente activas desencadenan efectos antileucémicos a través de la desregulación de un pequeño conjunto de genes hipersensibles. Además, esto ilustra que la inhibición parcial de la maquinaria transcripcional básica puede provocar respuestas muy específicas que pueden aprovecharse para atacar selectivamente las dependencias del cáncer.
[0493] Para explorar los factores que hacen que ciertos transcritos sean hipersensibles a BETi, los inventores se preguntaron si este fenómeno refleja simplemente una sensibilidad pronunciada a la interferencia con la maquinaria general de liberación de la pausa de Pol2. Para comprobarlo, se utilizó SLAM-seq para comparar las respuestas transcripcionales a la inhibición de BET (JQ1 200 nM) con los efectos desencadenados por diferentes dosis del inhibidor selectivo de CDK9 NVP-2. Aunque la inhibición de CDK9 en dosis altas (NVP-260 nM) suprimió globalmente la transcripción, una dosis intermedia (NVP-260 nM) desencadenó respuestas transcripcionales selectivas (figura 35A) que eran distintas de la respuesta conservada a BETi (figura 27, A y B, y figura 35B). Dado que los inhibidores de CDK9 y BET han presentado efectos fuertemente sinérgicos en informes previos y en los estudios de los inventores en LMA (figura 35, C y D), se intentó investigar las respuestas transcripcionales subyacentes a este fenómeno. En contraste con los efectos selectivos de un agente individual, la combinación de dosis intermedias de JQ1 y NVP-2 desencadenó una pérdida global de transcripción similar a la inhibición de CDK9 a dosis altas (figura 27, A y B y figura 35A). Estas observaciones son válidas en una línea celular de LMA genéticamente distinta (figura 35, E y F), lo que sugiere que la sinergia terapéutica entre BETi y CDK9i se basa en gran medida en la supresión sinérgica de la transcripción global, lo que plantea dudas sobre la tolerabilidad de esta combinación. En conjunto, los resultados de los inventores revelan que dosis terapéuticamente activas de inhibidores de CDK9 y BET, a pesar del papel general de sus dianas en la liberación de la pausa de Pol2, aprovechan diferentes cuellos de botella en este proceso para desencadenar respuestas transcripcionales selectivas.
[0495] Para investigar si el fenómeno de hipersensibilidad a BETi está determinado por características específicas de la cromatina, primero se ensayó si los niveles de ocupación de BRD4 en el TSS o su accesibilidad a BETi podían distinguir dianas directas de BETi (FDR < 0,1, log2FC < -0,7) de una cohorte de igual tamaño de genes no respondedores con idéntica expresión basal (FDR < 0,1, -0,1 < log2FC < 0,1; figura 36A). Aunque la ocupación de BRD4 apenas pudo superar a la selección aleatoria de genes (AUC 0,52; figura 31C), los niveles de unión a la cromatina de BETi recientemente comunicados y medidos mediante Click-seq pudieron explicar en parte las respuestas de BETi (AUC 0,63; figura 36B), lo que sugiere que las diferencias en la accesibilidad al fármaco contribuyen a los efectos selectivos de BETi. Otro modelo ampliamente adoptado atribuye los efectos transcripcionales y terapéuticos de los BETi a su capacidad para suprimir selectivamente los superpotenciadores, lo que ha sido cuestionado por un estudio reciente que identifica el potencial regulador basado en H3K27ac como predictor superior de las dianas de BETi. Dado que estos estudios se basaban en la secuenciación de ARN convencional tras un tratamiento farmacológico prolongado, se reevaluaron ambos modelos utilizando perfiles SLAM-seq. Tanto el potencial regulador de los genes basado en H3K27ac como su asociación con superpotenciadores predijeron la hipersensibilidad a BETi con una precisión modesta (AUC 0,66 y 0,64, respectivamente, figura 27C). Sin embargo, dos tercios de los genes sensibles a BETi no pudieron asignarse a superpotenciadores, y la gran mayoría de los genes expresados asociados a superpotenciadores no respondieron al tratamiento con b Etí (figura 27, D y E). Estas observaciones son válidas para otras líneas celulares de leucemia (figura 36C) y demuestran que la sensibilidad a la inhibición BET está asociada a la presencia de superpotenciadores, pero no determinada por ellos, lo que sugiere que este fenómeno se debe a factores más complejos.
[0497] Para explorarlos, se aprovecharon los amplios datos de perfiles disponibles para las células K562 y se ideó un enfoque no sesgado para modelizar modos combinatorios de regulación génica. Específicamente, se extrajeron señales de 214 experimentos ChIP y de secuenciación metilómica a una distancia de 500 y 2000 pb alrededor del TSS de genes sensibles y no sensibles a BETi, y se utilizaron estos datos para entrenar diferentes modelos de clasificación, que fueron posteriormente evaluados basándose en genes de ensayo retenidos (figura 27F y figura 36D). Este enfoque produjo múltiples clasificadores que predecían la sensibilidad a BETi con alta fidelidad (<a>U<c>> 0,8, figura 27G y figura 36E), entre ellos un modelo lineal generalizado ("generalized linear model", GLM) derivado por regresión de red elástica. El reanálisis de los coeficientes de este modelo reveló que varios factores, incluidos los altos niveles de REST proximal a TSS y H3K27ac, están asociados con la hipersensibilidad a BETi, mientras que la alta ocupación de SUPT5H, en sí mismo un regulador del alargamiento, fue el predictor negativo más fuerte (figura 27H y figura 37A). La agrupación no supervisada reveló que los TF y cofactores más predictivos están enriquecidos sólo en distintos subagrupamientos de genes sensibles o no sensibles a BETi (figura 27I y figura 37B). Por ejemplo, se encontraron altas cargas de los predictores positivos NFRKB y HMBOX1 en grupos diferenciados de genes sensibles a BETi, mientras que se observó una alta unión de CREM y SUPT5H en subagrupamientos diferenciados de genes insensibles a BETi. En conjunto, estos hallazgos sugieren que la respuesta transcripcional a BETi está determinada por reguladores específicos de cada locus y no puede predecirse basándose en un único factor cromatínico unificador.
[0498] De forma similar a los determinantes complejos de la sensibilidad a BETi, los efectos terapéuticos de BETi probablemente están mediados a través de la desregulación de múltiples genes diana hipersensibles. Tras validar queMYCes un gen prominente hipersensible a BETi en la leucemia, la respuesta transcripcional y celular a la supresión de MYC debe considerarse un mecanismo efector clave de BETi en este contexto. Sin embargo, las
funciones directas de regulación génica de MYC siguen siendo objeto de debate entre los estudios que describen efectos activadores, represores y dependientes de la dosis sobre dianas específicas, así como un papel de MYC como amplificador transcripcional general. Para ensayar estos modelos, se intentó medir los cambios directos en la producción de ARNm tras la pérdida aguda de MYC endógeno. Con este fin, se modificó el locusMYCde células K562 para que portase una etiqueta AID (figura 28A), que, en clones homocigóticos que expresan Tir1, desencadena una rápida degradación de<m>Y<c>en menos de 30 min (figura 28B). A continuación, se empleó SLAM-seq para cuantificar la producción de ARNm recién sintetizados a lo largo de 60 min tras la degradación de MYC. En comparación con la degradación de BRD4 y la inhibición farmacológica de CDK9 y BET, la pérdida aguda de MYC dio lugar a cambios altamente específicos en lugar de globales en la producción de ARNm (figura 28C). Predominaban los efectos represivos sobre 712 genes, mientras que sólo 15 ARNm estaban fuertemente regulados al alza. Por lo tanto, en las células K562, MYC no actúa como represor directo o amplificador general de la transcripción, sino que actúa predominantemente como activador transcripcional de genes diana específicos.
[0500] Puesto que se sabe que MYC ocupa prácticamente todos los promotores activos, a continuación se investigó cómo MYC ejerce una activación transcripcional selectiva a pesar de su unión ubicua. Para ello, se entrenaron modelos de clasificación para predecir transcritos dependientes de MYC (FDR < 0,1, log2FC < -1) basados en diferentes señales de ChIP-seq en su promotor. La regresión de red elástica produjo un GLM simple que fue altamente predictivo de la regulación génica dependiente de MYC (AUC 0,91). El factor que más contribuyó a este modelo fue la abundancia del propio MYC. De hecho, aunque la presencia de MYC en los promotores determinada por la llamada de picos convencional no consigue identificar los transcritos sensibles a<m>Y<c>, los niveles de unión de MYC o su cofactor MAX predicen la regulación génica dependiente de MYC con una precisión intermedia (AUC 0,76 y 0,74, respectivamente). En conjunto, estos resultados sugieren que los transcritos directamente dependientes de MYC se definen por una fuerte unión a MYC y una posterior modulación o compensación por factores adicionales, tales como MNT, NKRF, TBL1XR1, EP300 e YY1.
[0502] Para investigar la función celular de la regulación génica dependiente de MYC, se analizó el enriquecimiento de procesos biológicos entre los genes diana directa de MYC. Sorprendentemente, la pérdida aguda de MYC predominantemente reguló a la baja genes asociados con la biosíntesis de proteínas y nucleótidos (figura 28D), incluido el 36 % de todos los factores de biogénesis de ribosomas, reguladores clave en el metabolismo del AMP, y las seis enzimas de la vía de síntesisde novode purina (figura 28, C y D). De hecho, la degradación de MYC deterioró progresivamente la síntesis de proteínas (figura 28E) y condujo a una fuerte reducción de los niveles celulares de AMP y GMP, así como de su intermedio corriente arriba AICAR, antes del inicio de los defectos de proliferación (figura 28F). El papel de MYC en el control directo de enzimas clave en la biosíntesis de proteínas y nucleótidos, así como de varias subunidades de las polimerasas I, II y III, proporciona una explicación para el aumento notificado del ARN celular total tras la sobreexpresión de MYC, en apoyo de la idea de que estos efectos son de naturaleza secundaria y no se deben a efectos transcripcionales globales.
[0504] Para probar si las funciones transcripcionales directas de MYC se conservan en otros contextos, se introdujeron marcadores AID homocigóticos en el locusMYCde células de carcinoma de colon HCT116, que expresan niveles especialmente altos de MYC. Al igual que para K562, el tratamiento con auxina de células HCT116<myc>-<aid>que expresan TIR1 desencadenó la degradación completa de MYC en menos de 30 min (figura 28G). El perfil de SLAM-seq reveló efectos transcripcionales altamente selectivos (figura 28H) que afectaban a los mismos procesos celulares y se correlacionaban con la respuesta en células K562 (R = 0,64, figura 28H). Para comprobar si la conservación de las dianas de MYC entre dos líneas celulares no relacionadas se extiende a otros tipos de cáncer, se derivó una firma de los 100 genes más fuertemente regulados a la baja en SLAM-seq y se comparó su expresión con los niveles deMYCen un panel de 672 líneas celulares de cáncer. De hecho, los niveles de expresión deMYCy la firma utilizada se correlacionaron bien (figura 28I), excepto una pequeña fracción de valores atípicos que expresaban niveles bajos deMYCsin perder la firma. Cabe destacar que todos estos valores atípicos expresan altos niveles deMYCNoMYCL,lo que indica que los paralogos deMYCtienen funciones redundantes en la regulación de las dianas principales de MYC. La firma de dianas directas de MYC utilizada también estaba fuertemente correlacionada con los niveles deMYCen los perfiles de secuenciación de ARN de TCGA de 5583 muestras de pacientes primarios en los 11 cánceres humanos principales (figura 28J). En conjunto, estos hallazgos demuestran que, en diversos cánceres humanos, MYC dirige la expresión de un conjunto conservado de dianas transcripcionales, que deberían considerarse como puntos de entrada para bloquear sus funciones oncogénicas.
[0506] En resumen, la combinación de una rápida perturbación químico-genética y SLAM-seq establece una estrategia simple, pero potente, para sondear funciones directas específicas y globales de cofactores y factores de transcripción. Utilizando este enfoque, se caracterizó funcionalmente BRD4, un factor ampliamente estudiado como regulador de programas de expresión asociados a linajes y enfermedades, como cofactor global en la liberación de pausas transcripcionales. Por otra parte, se descubrió que MYC, que previamente ha sido implicado como un amplificador transcripcional global, activa un conjunto confinado y conservado de genes diana para impulsar procesos anabólicos básicos, en particular la biosíntesis de proteínas y nucleótidos. En términos más generales, al permitir la cuantificación directa de los cambios en la producción de ARNm, SLAM-seq proporciona un procedimiento sencillo, robusto y escalable para definir las respuestas transcripcionales directas a cualquier perturbación, y explorar así el cableado regulador de una célula.
Claims (14)
1. REIVINDICACIONES
1. Un procedimiento de identificación de un ácido polinucleico que comprende las etapas de proporcionar un ácido polinucleico; modificar una o más nucleobases del ácido polinucleico mediante la incorporación de una nucleobase modificada con tiol en el ácido polinucleico a través de la biosíntesis en una célula y que comprende además la alquilación de dicha nucleobase modificada con tiol con un agente alquilante que comprende un compañero de enlace de hidrógeno, alterando así la capacidad de apareamiento de bases de dichas una o más nucleobases; llevar a cabo el apareamiento de bases de un ácido nucleico complementario con el ácido polinucleico, incluido el apareamiento de bases con al menos una nucleobase modificada; identificar la secuencia del ácido nucleico complementario al menos en la posición que es complementaria con al menos una nucleobase modificada.
2. El procedimiento de la reivindicación 1, en el que la modificación conduce a un comportamiento de apareamiento de bases alterado, alterando así el apareamiento de bases preferente entre A y T/U y entre C y G en comparación con las nucleobases naturales seleccionadas entre A, T/U, C y G.
3. El procedimiento según la reivindicación 1 o 2, en el que la modificación comprende la alquilación en la posición 4 de una uridina con un agente alquilante que comprende el compañero de enlace de hidrógeno.
4. El procedimiento según una cualquiera de las reivindicaciones 1 a 3, en el que el ácido polinucleico comprende una o más 4-tiouridina o 6-tioguanosina.
5. El procedimiento según una cualquiera de las reivindicaciones 1 a 4, en el que el ácido polinucleico se sintetiza en una célula con una modificación que altera dicha capacidad de apareamiento de bases.
6. El procedimiento de una cualquiera de las reivindicaciones 1 a 5, en el que el apareamiento de bases con al menos una nucleobase modificada conduce a un apareamiento de bases con otro nucleótido que el apareamiento de bases con una nucleobase que no ha sido modificada, siendo dichas nucleobases por lo demás iguales.
7. El procedimiento según una cualquiera de las reivindicaciones 1 a 6, en el que el ácido polinucleico comprende o consiste en ARN o ADN.
8. El procedimiento según una cualquiera de las reivindicaciones 1 a 7, en el que, para cada tipo de nucleótido seleccionado entre A, G, C, U o T, el ácido polinucleico modificado comprende más nucleótidos naturales que nucleótidos modificados.
9. El procedimiento según una cualquiera de las reivindicaciones 1 a 8, en el que el ácido polinucleico comprende 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más y hasta 30 nucleótidos modificados.
10. El procedimiento de una cualquiera de las reivindicaciones 1 a 9, en el que proporcionar un ácido polinucleico comprende expresar el ácido polinucleico en célula; dicho procedimiento comprende además aislar el ácido polinucleico de la célula; modificar una o más nucleobases del ácido polinucleico en la célula y/o después del aislamiento; en el que la modificación o modificaciones en la célula o después del aislamiento o ambas juntas añaden o eliminan un compañero de enlace de hidrógeno de una o más nucleobases, alterando así la capacidad de apareamiento de bases de dichas una o más nucleobases.
11. El procedimiento según una cualquiera de las reivindicaciones 1 a 10, en el que una o más células se cultivan o crecen en al menos dos fases de cultivo o crecimiento, en el que una fase de cultivo o crecimiento comprende la incorporación de un nucleótido modificado al ácido polinucleico biosintetizado, que se modifica mediante la adición o eliminación de un compañero de enlace de hidrógeno, y otra fase de cultivo o crecimiento que carece de dicha incorporación del nucleótido modificado al ácido polinucleico biosintetizado o en la que los nucleótidos modificados se incorporan al ácido polinucleico biosintetizado a una concentración diferente que en la otra fase de cultivo o crecimiento; o en el que el procedimiento comprende la incorporación de un nucleótido modificado en el ácido polinucleico biosintetizado de al menos dos células diferentes o en al menos dos grupos diferentes de células, en el que preferentemente se compara la incorporación de las dos células diferentes o de los dos grupos diferentes de células.
12. El procedimiento según la reivindicación 11, en el que el ácido polinucleico biosintetizado de las dos fases de cultivo o crecimiento o del dichas al menos dos células diferentes o al menos dos grupos diferentes de células se recoge de dichas células, preferentemente también se mezcla, en especial se prefiere el marcaje del ácido polinucleico según el origen celular del ácido polinucleico, y en el que el apareamiento de bases de un ácido nucleico complementario con el ácido polinucleico comprende la generación de hebras de ácido polinucleico complementarias, preferentemente hebras de ADN, por transcripción, preferentemente transcripción inversa.
13. El procedimiento de la reivindicación 12, que comprende además determinar la secuencia de las hebras de ácido polinucleico complementarias y comparar las secuencias de las hebras, en el que un ácido nucleico complementario alterado como resultado de la modificación por adición o eliminación de un compañero de enlace de hidrógeno puede identificarse por comparación con el ácido nucleico complementario sin modificación.
14. El procedimiento de una cualquiera de las reivindicaciones 1 a 13, que comprende comparar secuencias identificadas del ácido nucleico complementario al menos en la posición que es complementaria con al menos una nucleobase modificada en al menos dos células o en al menos dos fases de crecimiento diferentes en una célula, en el que dichas al menos dos células o fases de crecimiento tienen expresión génica diferencial entre dichas al menos dos células o dichas fases de crecimiento, preferentemente en el que la expresión génica diferencial está causada por la inhibición o estimulación de al menos un gen en una célula.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP17166629.0A EP3388530A1 (en) | 2017-04-13 | 2017-04-13 | Nucleic acid modification and identification method |
| EP18165712 | 2018-04-04 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES3043187T3 true ES3043187T3 (en) | 2025-11-25 |
Family
ID=62002637
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES20179604T Active ES3043187T3 (en) | 2017-04-13 | 2018-04-13 | Nucleic acid modification and identification method |
Country Status (11)
| Country | Link |
|---|---|
| US (2) | US11299779B2 (es) |
| EP (2) | EP3589748B1 (es) |
| JP (2) | JP7341891B2 (es) |
| KR (1) | KR102703927B1 (es) |
| CN (1) | CN110520540B (es) |
| AU (1) | AU2018252187B2 (es) |
| CA (1) | CA3058540A1 (es) |
| DK (1) | DK3589748T3 (es) |
| ES (1) | ES3043187T3 (es) |
| LT (1) | LT3589748T (es) |
| WO (1) | WO2018189367A1 (es) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3810811B1 (en) * | 2018-06-20 | 2022-06-15 | PathoQuest | Method for discriminating between live and dead microbes in a sample |
| GB202111184D0 (en) * | 2021-08-03 | 2021-09-15 | Hendriks Gerardus Johannes | Methods |
| WO2025189419A1 (zh) * | 2024-03-14 | 2025-09-18 | 深圳华大智造科技股份有限公司 | 全长转录本mRNA序列的获取方法 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030180769A1 (en) | 2002-02-05 | 2003-09-25 | Metzker Michael L. | Substituted 4,4-difluoro-4-bora-3A,4A-diaza-s-indacene compounds for 8-color DNA sequencing |
| US20040259135A1 (en) | 2003-05-09 | 2004-12-23 | Cleary Michael D. | Biosynthetic labeling and separation of RNA |
| WO2006125808A1 (en) | 2005-05-25 | 2006-11-30 | Dkfz Deutsches Krebsforschungszentrum | Method for analysis of de-novo transcribed rna in vivo |
| EP2370598B1 (en) * | 2008-12-11 | 2017-02-15 | Pacific Biosciences Of California, Inc. | Classification of nucleic acid templates |
| US9175338B2 (en) * | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
| EP2599859A1 (en) | 2011-11-30 | 2013-06-05 | IMBA-Institut für Molekulare Biotechnologie GmbH | Haploid cells |
| AU2014235794A1 (en) * | 2013-03-14 | 2015-10-22 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
| EP2921556A1 (en) | 2014-03-21 | 2015-09-23 | Lexogen GmbH | Copy number preserving RNA analysis method |
| US20180080061A1 (en) | 2015-03-23 | 2018-03-22 | The Regents Of The University Of California | Biosynthetic labeling and separation of rna |
-
2018
- 2018-04-13 LT LTEP18718418.9T patent/LT3589748T/lt unknown
- 2018-04-13 WO PCT/EP2018/059518 patent/WO2018189367A1/en not_active Ceased
- 2018-04-13 US US16/301,680 patent/US11299779B2/en active Active
- 2018-04-13 ES ES20179604T patent/ES3043187T3/es active Active
- 2018-04-13 DK DK18718418.9T patent/DK3589748T3/da active
- 2018-04-13 CN CN201880024846.5A patent/CN110520540B/zh active Active
- 2018-04-13 AU AU2018252187A patent/AU2018252187B2/en active Active
- 2018-04-13 JP JP2019556245A patent/JP7341891B2/ja active Active
- 2018-04-13 EP EP18718418.9A patent/EP3589748B1/en active Active
- 2018-04-13 KR KR1020197033605A patent/KR102703927B1/ko active Active
- 2018-04-13 EP EP20179604.2A patent/EP3760734B1/en active Active
- 2018-04-13 CA CA3058540A patent/CA3058540A1/en active Pending
-
2022
- 2022-02-18 US US17/651,657 patent/US11859248B2/en active Active
-
2023
- 2023-08-29 JP JP2023139052A patent/JP2023155370A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| US20190177785A1 (en) | 2019-06-13 |
| US11299779B2 (en) | 2022-04-12 |
| US11859248B2 (en) | 2024-01-02 |
| US20230054714A1 (en) | 2023-02-23 |
| KR102703927B1 (ko) | 2024-09-05 |
| JP2020516302A (ja) | 2020-06-11 |
| AU2018252187A1 (en) | 2019-08-22 |
| WO2018189367A1 (en) | 2018-10-18 |
| EP3589748B1 (en) | 2020-07-22 |
| EP3760734C0 (en) | 2025-08-20 |
| EP3760734A1 (en) | 2021-01-06 |
| KR20190139960A (ko) | 2019-12-18 |
| EP3589748A1 (en) | 2020-01-08 |
| EP3760734B1 (en) | 2025-08-20 |
| CN110520540A (zh) | 2019-11-29 |
| CA3058540A1 (en) | 2018-10-18 |
| LT3589748T (lt) | 2020-10-26 |
| JP2023155370A (ja) | 2023-10-20 |
| AU2018252187B2 (en) | 2024-09-19 |
| DK3589748T3 (da) | 2020-09-07 |
| JP7341891B2 (ja) | 2023-09-11 |
| CN110520540B (zh) | 2023-10-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Sivaramakrishnan et al. | Binding to SMN2 pre-mRNA-protein complex elicits specificity for small molecule splicing modifiers | |
| Sas-Chen et al. | Dynamic RNA acetylation revealed by quantitative cross-evolutionary mapping | |
| Barbieri et al. | Role of RNA modifications in cancer | |
| Xue et al. | Advances in RNA cytosine-5 methylation: detection, regulatory mechanisms, biological functions and links to cancer | |
| Wilusz | Controlling translation via modulation of tRNA levels | |
| Kuttan et al. | Mechanistic insights into editing-site specificity of ADARs | |
| Sibbritt et al. | Mapping and significance of the mRNA methylome | |
| Hagenkort et al. | dUTPase inhibition augments replication defects of 5-Fluorouracil | |
| JP2023155370A (ja) | 核酸を修飾して同定する方法 | |
| CN105132409A (zh) | RNA 5mC重亚硫酸盐测序的文库构建方法及其应用 | |
| Foged et al. | Cytosolic N6AMT1-dependent translation supports mitochondrial RNA processing | |
| WO2017035821A1 (zh) | RNA 5mC重亚硫酸盐测序的文库构建方法及其应用 | |
| Frohlich et al. | Post-transcriptional modifications of RNA: impact on RNA function and human health | |
| Zhao et al. | Intracellular RNA Labeling Technologies for the Analysis of RNA Biology | |
| EP3388530A1 (en) | Nucleic acid modification and identification method | |
| Herzog et al. | Thiol-linked alkylation for the metabolic sequencing of RNA | |
| Tasak | The Biology of 1-Methyladenosine and Initiator tRNA in Evolutionarily Distant Yeast Species, and Other Aspects of tRNA Modification Biology | |
| Ramos | Disease-associated variants in human tRNA modification enzymes and their impact on cellular physiology | |
| Bacci et al. | Ribosomal protein L5 (RPL5/uL18) I60V mutation is associated to increased translation and modulates drug sensitivity in T-cell acute lymphoblastic leukemia cells | |
| Aydin | DEAD-box ATPase Dbp2 participates in a specific mRNP assembly checkpoint during RNA biogenesis in S. pombe | |
| Tavakoli | Identification and Perturbation of Pseudouridine Modifications in Human mRNAs | |
| Alhusaini | Effects of Codon Content and N4-Acetylcytidine within mRNA on Post-Transcriptional Gene Expression | |
| Tam et al. | Combinatorial in silico approach for cancer-associated [4Fe-4S] metalloprotein discovery | |
| Wu | Chemical Approaches to Decipher Transcription and RNA Metabolism | |
| Srinivasan | Understanding The Molecular Mechanisms Of The RNA Helicases DHX36 And DDX41 |