[go: up one dir, main page]

ES2891541T3 - Métodos que comprenden distintivos génicos para estratificar pacientes con cáncer de mama - Google Patents

Métodos que comprenden distintivos génicos para estratificar pacientes con cáncer de mama Download PDF

Info

Publication number
ES2891541T3
ES2891541T3 ES17732078T ES17732078T ES2891541T3 ES 2891541 T3 ES2891541 T3 ES 2891541T3 ES 17732078 T ES17732078 T ES 17732078T ES 17732078 T ES17732078 T ES 17732078T ES 2891541 T3 ES2891541 T3 ES 2891541T3
Authority
ES
Spain
Prior art keywords
subject
risk
genes
breast cancer
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17732078T
Other languages
English (en)
Inventor
Fiore Pier Paolo Di
Salvatore Pece
Manuela Vecchi
Stefano Confalonieri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Degli Studi Di Milano Univ Of Milan, University of
Fondazione St Firc Di Oncologia Molecolare Ifom
Istituto Europeo di Oncologia SRL IEO
Original Assignee
Degli Studi Di Milano Univ Of Milan, University of
Fondazione St Firc Di Oncologia Molecolare Ifom
Istituto Europeo di Oncologia SRL IEO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Degli Studi Di Milano Univ Of Milan, University of, Fondazione St Firc Di Oncologia Molecolare Ifom, Istituto Europeo di Oncologia SRL IEO filed Critical Degli Studi Di Milano Univ Of Milan, University of
Application granted granted Critical
Publication of ES2891541T3 publication Critical patent/ES2891541T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método de predicción de un riesgo de reaparición de cáncer de mama en un sujeto que comprende las etapas de: (a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; y (b) calcular una puntuación de riesgo basada en la expresión de los al menos tres genes; en donde el sujeto es un paciente con cáncer de mama ER+/HER2-.

Description

DESCRIPCIÓN
Métodos que comprenden distintivos génicos para estratificar pacientes con cáncer de mama
SOLICITUDES RELACIONADAS
Esta solicitud reivindica el beneficio de y la prioridad a la solicitud de patente europea N.° 16175354.6, presentada el 20 de junio de 2016, y la solicitud de patente europea N.° 16188855.7, presentada el 14 de septiembre de 2016.
CAMPO DE LA INVENCIÓN
Esta divulgación se refiere, en general, al campo de la biología del cáncer de mama, y en concreto, a herramientas clínicas de pronóstico refinadas, a métodos y a kits para la evaluación del riesgo y el abordaje de la reaparición a distancia en pacientes con cáncer de mama ER+/HER2-.
ANTECEDENTES DE LA INVENCIÓN
Los cánceres de mama positivos para el receptor endocrino (ER+)/negativos para HER2 (HER2-) constituyen la mayoría de los casos de cáncer de mama. Debido al alto nivel de heterogeneidad molecular y clínica presentada por estos cánceres, el pronóstico y la respuesta a la terapia son frecuentemente difíciles de predecir. Esto hace que sea complejo el abordaje clínico de los pacientes con cáncer de mama ER+/HER2-, particularmente, en términos del tipo y la duración de la terapia sistémica con adyuvante que debe recibir un individuo. Basándose en el riesgo intrínseco de reaparición (normalmente evaluado usando parámetros clinicopatológicos habituales), a los pacientes con cáncer de mama ER+/HER2- se les puede ofrecer una quimioterapia posquirúrgica, además de terapia hormonal o terapia hormonal prolongada más allá del tratamiento de referencia de cinco años. Sin embargo, puesto que los parámetros clinicopatológicos habituales son frecuentemente insuficientes para predecir con exactitud el riesgo de reaparición en estos pacientes, una proporción significativa de los pacientes son, por consiguiente, o tratados en exceso o tratados en defecto.
Por consiguiente, existe una necesidad sin cumplir de herramientas clínicas de pronóstico más refinadas para la evaluación del riesgo y el abordaje de la reaparición a distancia en pacientes con cáncer de mama ER+/HER2-.
El documento de patente WO2010/003771A1 desvela un marcador molecular para el pronóstico del cáncer. Joseph A. Sparano et al. desvelan, en BREAST CANCER RESEARCH AND TREATMENT, (2012), vol. 134, N.° 2, páginas 751 - 757, "la expresión de ARN de TOP2A y la reaparición en cáncer de mama positivo para el receptor de estrógenos". El documento de patente W02008/037700A2 desvela métodos para el pronóstico del cáncer de mama. Elin Karlsson et al. desvelan, en BREAST CANCER RESEARCH, (2013), vol. 15, N.° 5, página R96, "los efectores de mTOR 4EBP1 y S6K2 se coexpresan frecuentemente, y se asocian a un mal pronóstico y resistencia endocrina en cáncer de mama: un estudio retrospectivo que incluye pacientes de los ensayos de tamoxifeno aleatorizados de Stockholm". Zhenzhen Huang et al. desvelan, en BlOMED RESEARCH INTERNATIONAL, (2015), vol. 34, N.° 6, páginas 2833 - 10, "la identificación de un patrón de expresión génica relacionado con la supervivencia en el cáncer de mama usando conjuntos de datos integrados de TCGA y herramientas genómicas".
SUMARIO DE LA INVENCIÓN
Existe la necesidad de herramientas, métodos y kits clínicos de pronóstico refinado para la evaluación del riesgo y el abordaje de la reaparición a distancia en pacientes con cáncer de mama ER+/HER2-.
Un aspecto de la presente invención es un método de predicción de un riesgo de reaparición de cáncer de mama en un sujeto. El método comprende las etapas de (a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o Tabla 9 , en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; y (b) calcular una puntuación de riesgo basada en la expresión de al menos tres genes. El sujeto es un paciente con cáncer de mama ER+/HER2-.
Otro aspecto de la presente invención es un método de estratificación de un sujeto en un grupo de riesgo bajo o alto de reaparición de cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o Tabla 9 , en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; (b) calcular una puntuación de riesgo basada en la expresión de los al menos tres genes; y (c) estratificar el sujeto basándose en la puntuación de riesgo calculada. El sujeto es un paciente con cáncer de mama ER+/HER2-. En realizaciones de este aspecto, el sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 2 clases como se identificó en la Tabla 3 o Tabla 9 se estratifica en un grupo de riesgo alto y el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o Tabla 9 en un grupo de riesgo bajo.
Otro aspecto más de la presente invención es un método de estratificación de un sujeto en un grupo de riesgo bajo, medio o alto de reaparición de cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; (b) calcular una puntuación de riesgo basada en la expresión de los al menos tres genes; y (c) estratificar el sujeto basándose en la puntuación de riesgo calculada. El sujeto es una paciente con cáncer de mama ER+/HER2. En realizaciones de este aspecto, el sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo alto, el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 66 y superior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo intermedio , y el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo bajo.
En realizaciones de los aspectos anteriores, al sujeto estratificado en un grupo de riesgo alto se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo bajo. En realizaciones, al sujeto estratificado en un grupo de riesgo alto se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo intermedio. En realizaciones, al sujeto estratificado en un grupo de riesgo intermedio se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo bajo.
En el presente documento también se desvela un método de tratamiento de un sujeto que tiene un cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9 , en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; (b) calcular una puntuación de riesgo basada en la expresión de los al menos tres genes; y (c) proporcionar un tratamiento para el cáncer al sujeto. Al sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9 se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9.
En el presente documento también se desvela un método de tratamiento de un sujeto que tiene un cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9 , en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; (b) calcular una puntuación de riesgo basada en la expresión de los al menos tres genes; y (c) proporcionar un tratamiento para el cáncer al sujeto. Al sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 ; y al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 y superior a aproximadamente el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9.
En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en EIF4EBP1, MRPS23 y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden comprender al menos APOBEC3B, CENPW, EIF4EBP1, EXOSC4, LY6E, MMP1, MRPS23, NDUFB 10 y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en APOBEC3B, CENPW, EIF4EBP1, EXOSC4, LY6E, MMP1, MRPS23, NDUFB 10 y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden comprender al menos ALYREF, APOBEC3B, CDK1, CENPW, EIF4EBP1, EXOSC4, H2AFJ, LY6E, MIEN1, MMP1, MRPS23, NDUFB10, NOL3, RACGAP1, SFN y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en ALYREF, APOBEC3B, CDK1, CENPW, EIF4EBP1, EXOSC4, H2AFJ, LY6E, MIEN1, MMP1, MRPS23, NDUFB 10, NOL3, RACGAP1, SFN y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en cada gen de la Tabla 3 o la Tabla 9 y en donde cada puntuación de corte es como se identifica en la Tabla 3.
En cualquiera de los aspectos o realizaciones anteriores, la puntuación de riesgo se calcula según la siguiente fórmula:
Puntuación de riesgo = £ ¡ (P¡ * Cqnormalizado),
en donde i es el índice de suma para los al menos tres genes; p es el coeficiente del modelo de Cox con penalización de Ridge para cada uno de los al menos tres genes; y Cqnormalizado es el Cq promedio normalizado para cada uno de los al menos tres genes.
Otros modelos de riesgo y fórmulas pueden derivar de la divulgación citada en el presente documento.
En cualquiera de los aspectos o realizaciones anteriores, Cqnormalizado se normaliza a la expresión de al menos un gen de referencia; en realizaciones, el al menos un gen de referencia es un gen de mantenimiento, por ejemplo, como se cita en el presente documento. En cualquiera de los aspectos o realizaciones anteriores, Cqnormalizado se normaliza a la expresión de al menos un gen de referencia (por ejemplo, los cuatro genes) seleccionados del grupo que consiste en GAPDH, GUSB, HPRT1 y TBP. Cqnormaiizado se puede calcular según la siguiente fórmula: Cqnormaiizado = Cq AVG - SF, en la que en donde SF es la diferencia entre el valor de Cq AVG de al menos un gen de referencia para cada sujeto y un valor de referencia constante K, en donde K= 25,012586069, que representa la media de Cq AVG del al menos un gen de referencia calculado en una pluralidad de muestras de entrenamiento.
En cualquiera de los aspectos o realizaciones anteriores, la expresión génica se puede determinar usando cualquier método conocido en la técnica. Preferentemente, la expresión génica se puede determinar usando una o más técnicas seleccionadas del grupo que consiste en el análisis de polimorfismos de conformación de cadena simple, electroforesis capilar, cromatografía líquida de alta resolución desnaturalizante, tecnología de códigos de barras moleculares digitales, por ejemplo, el sistema nCountei® de Nanostring, secuenciación directa, ensayos de proteína de unión a desapareamiento de ADN, hibridación dinámica específica de alelo, hibridación in situ fluorescente (FISH), matrices de SNP de oligonucleótidos de alta densidad, análisis de fusión de alta resolución, micromatriz, secuenciación de nueva generación (NGS), por ejemplo, usando el analizador del genoma Illumina, instrumento Solid de ABI, instrumento 454 de Roche, instrumento Heliscope, análisis de transferencia Northern, análisis de protección de nucleasas, ensayos de ligasa de oligonucleótidos, reacción en cadena de la polimerasa (PCR), ensayos de extensión de cebadores, análisis Quantigene, ensayo cuantitativo de protección de nucleasas (qNPA), detección de genes indicadores, ensayos de polimorfismo de longitud de fragmentos de restricción (RFLP), reacción en cadena de la polimerasa cuantitativa con transcripción inversa en tiempo real (RT-qPCR), reacción en cadena de la polimerasa con transcripción inversa (RT-PCR), secuenciación de ARN (ARN-seq), análisis en serie de la expresión génica (SAGE), tecnología de secuenciación de ADN en tiempo real de moléculas individuales (SMRT), SNPLex, análisis de transferencia Southern, química de Sybr Green, ensayos basados en TaqMan, electroforesis en gel con gradiente de temperatura (TGGE), matriz de mosaico, análisis de transferencia Western e inmunohistoquímica. En cualquiera de los aspectos o realizaciones anteriores, la expresión génica se puede determinar usando transcripción inversa y reacción en cadena de la polimerasa cuantitativa en tiempo real (RT-qPCR) con cebadores y/o sondas (por ejemplo, sondas TaqMan®) específicos para cada uno de dichos al menos tres genes. Alternativamente, la expresión génica se puede determinar usando análisis de micromatrices con sondas específicas para un producto de expresión de cada uno de dichos al menos tres genes.
En cualquiera de los aspectos o realizaciones anteriores, la muestra puede ser un tumor obtenido del sujeto, una célula cancerosa obtenía del sujeto, o una célula madre cancerosa obtenida del sujeto. La muestra puede ser una estirpe celular primaria derivada de un tumor obtenido del sujeto, de una célula cancerosa obtenida del sujeto, o de una célula madre de cáncer obtenida del sujeto.
En cualquiera de los aspectos o realizaciones anteriores, se usaron las puntuaciones de riesgo mínimo y máximo de un conjunto de entrenamiento (como se describe a continuación) para cambiar de escala las puntuaciones de riesgo en un intervalo de 0 - 1.
En los aspectos o realizaciones anteriores, el sujeto tiene un cáncer de mama ER+/HER2-.
En el presente documento también se desvela un kit para su uso en el método de cualquiera de los aspectos o realizaciones anteriores. El kit puede comprender reactivos suficientes para determinar los niveles de expresión de los al menos tres genes.
Cualquiera de los aspectos y realizaciones anteriores se puede combinar con cualquier otro aspecto o realización como se desvela aquí en las secciones de Sumario y/o de Descripción detallada, que incluyen los Ejemplos de más adelante.
Otras características y ventajas de la invención serán evidentes a partir de la siguiente descripción detallada y reivindicaciones.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
Las características anteriores y adicionales serán más claramente apreciadas a partir de la siguiente descripción detallada cuando se considera junto con los dibujos adjuntos.
Figuras 1A y 1B. Validación del distintivo de SC de 20 genes por metanálisis mediante simulación computacional de conjuntos de datos públicamente disponibles de la expresión génica de cáncer de mama. Figura 1A. Análisis de grupos de la expresión de los 20 genes y su significancia pronóstica determinada por análisis de Kaplan-Meier (DMFS: supervivencia sin metástasis a distancia) en conjuntos de datos de cáncer de mama independientes. Se indican el cociente de riesgos instantáneos (HR) del análisis univariante, intervalos de confianza (IC) del 95 % y valores de p (P). Figura 1B. Comparación de la potencia predictiva para DMFS del distintivo de SC de 20 genes con distintivos génicos publicados [70 genes (van't Veer LJ et al. 2002. Nature 415:530), 76 genes (Wang Y, et al. 2005. Lancet 365:671) e índice de grado de la expresión génica (Sotiriou C, et al. 2006. JNCI 98:262.)] en >20 años de seguimiento en pacientes individuales del estudio TRANSBIG por análisis univariantes y multivariantes (ajustado para edad, tamaño del tumor, estado de ER y grado del tumor). P, valor de p para la diferencia en HR entre pacientes con distintivo génico positivo frente a con distintivo génico negativo calculado para cada distintivo génico analizado. *Datos de Haibe-Kains B., 2008. BMC Genomics 9:394.
Figura 2. Índice C para los 5.000 modelos del análisis de sensibilidad. Cada línea representa un conjunto de entrenamiento diferente: líneas azules = un tercio como entrenamiento; líneas rojas = la mitad como entrenamiento; líneas verdes = dos tercios como entrenamiento; línea negra = conjunto de entrenamiento usado para el desarrollo del algoritmo de pronóstico; y punto negro = índice C para el algoritmo de pronóstico considerado.
Figuras 3A y 3B . Rendimiento de los modelos de riesgo StemPrintER20 de 2 clases y 3 clases en el conjunto de entrenamiento ER+/HER2- (N=609) de la cohorte del Instituto Europeo de Oncología (Istituto Europeo di Oncologia: "IEO"). Se muestra la incidencia acumulada de metástasis a distancia según (Figura 3A) los modelos de riesgo de 2 clases (basados en el centil 50) y (Figura 3B) de 3 clases (basados en los centiles 33 y 66). Se presentan los cocientes de riesgos instantáneos (HR) para el grupo de riesgo alto (HRAlto: modelos de 2 clases y 3 clases) y el grupo de riesgo intermedio (HRint: modelo de 3 clases), con respecto al grupo de bajo riesgo, con un IC del 95%.
Figuras 4A a 4C . El modelo de riesgo StemPrintER20 de 2 clases predice tanto la reaparición temprana (0 - 5 años) como la tardía (5 - 10 años) en el conjunto de validación ER+/HER2- (N=1.218) de la cohorte IEO. Se muestra la incidencia acumulada de metástasis a distancia durante todo el periodo de seguimiento (Figura 4A) y a partir de los 5 años después de la cirugía (Figura 4B). Figura 4C : Se calcularon los cocientes de riesgos instantáneos (HR) para el grupo de riesgo alto con respecto al grupo de riesgo bajo (HRAlto frente a Bajo) para los intervalos de tiempo indicados, basándose en un análisis multivariante ajustado por pT, pN, malignidad del tumor, Ki-67 y edad.
Figuras 5A a 5C . El modelo de riesgo StemPrintER20 de 3 clases predice tanto la reaparición temprana (0 - 5 años) como la tardía (5 - 10 años) en el conjunto de validación ER+/HER2- (N=1.218) de la cohorte IEO. Se muestra la incidencia acumulada de metástasis a distancia durante todo el periodo de seguimiento (Figura 5A) y a partir de los 5 años después de la cirugía (Figura 5B). Figura 5C : Se calcularon los cocientes de riesgos instantáneos (HR) para el grupo de riesgo alto con respecto al grupo de riesgo bajo (HRAlto frente a Bajo) para los intervalos de tiempo indicados, basándose en un análisis multivariante ajustado por pT, pN, malignidad del tumor, Ki-67 y edad.
Figuras 6A y 6B . Análisis comparativo del índice C con respecto a cada uno de los 15.000 modelos generados a partir de los 15 conjuntos de entrenamiento diferentes. Figura 6A, representación de la distribución de los valores del índice C asociados a los 15.000 modelos derivados de las 1.000 simulaciones realizadas para cada uno de los 15 conjuntos de entrenamiento diferentes. Cada línea representa un conjunto de entrenamiento diferente: líneas azules = un tercio como entrenamiento; líneas rojas = dos tercios como entrenamiento; línea negra = toda la cohorte; línea violeta = conjunto de entrenamiento usado para el desarrollo de StemPrintER20; línea naranja = conjunto de validación usado para el desarrollo de StemPrintER20. Figura 6B, análisis estadístico de la variación entre el índice C mínimo y máximo, indicado junto con sus intervalos de confianza (IC). Esta diferencia no es estadísticamente significativa considerando un valor p estricto de 0,01.
Figuras 7A y 7B . Identificación de los grupos TOP3, TOP9 y TOP16. Figura 7A, análisis de la frecuencia de aparición de los 20 genes de células madre, cada uno considerado individualmente, en el número indicado de simulaciones realizadas usando conjuntos de datos basados en una división de un tercio (33 %) o de dos tercios (66 %), o basados en toda la cohorte. Se usó un corte del 80 % para seleccionar el grupo mínimo de genes en cada división. Este enfoque identificó un conjunto de los 3 genes más representados (TOP3) a partir de las 7.000 simulaciones del conjunto de entrenamiento de un tercio, nueve genes más representados a partir de las 7.000 simulaciones del conjunto de entrenamiento de dos tercios y 16 genes más representados a partir de las 1.000 simulaciones del conjunto de entrenamiento basado en la cohorte completa. Figura 7B, frecuencia de aparición de los distintivos TOP3, TOP9 y TOP16, en su conjunto, en los respectivos conjuntos de datos.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
La presente invención se refiere a herramientas, métodos y kits clínicos de pronóstico refinado para la evaluación del riesgo y el abordaje de la reaparición a distancia en pacientes con cáncer de mama ER+/HER2-.
La presente invención se basa en parte en un análisis retrospectivo de una cohorte consecutiva de 1.827 pacientes con cáncer de mama ER+/HER2- con seguimiento a largo plazo (~15 años), se estableció un distintivo de 20 genes que es capaz de estratificar pacientes con cáncer de mama según riesgo de reaparición temprana y tardía. Así, el "factor pronóstico genómico StemPrintER20" funciona como una herramienta clínica predictiva del pronóstico en pacientes con cáncer de mama ER+/HER2- que se puede usar para guiar la toma de decisiones clínicas sobre la selección de terapias sistémicas posquirúrgicas. Además, el distintivo de 20 genes se repartió además en distintivos de 3, 5, 9 y 16 genes, es decir, el "factor pronóstico genómico StemPrintER3", "factor pronóstico genómico StemPrintER5", "factor pronóstico genómico StemPrintER9" y "factor pronóstico genómico StemPrintER16", que sirven de herramientas clínicas predictivas del pronóstico en pacientes con cáncer de mama ER+/HER2- que se pueden usar para guiar la toma de decisiones clínicas sobre la selección de terapias sistémicas posquirúrgicas.
Un aspecto de la presente invención es un método de predicción de un riesgo de reaparición de cáncer de mama en un sujeto que es un paciente con cáncer de mama ER+/HER2-. El método comprende las etapas de (a) determinar, en una muestra obtenida del sujeto la expresión de al menos tres genes de la Tabla 3 o la Tabla 9 , en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; y (b) calcular una puntuación de riesgo según la siguiente fórmula: Puntuación de riesgo = £ ¡ (p¡ * Cqnormalizado), en la que i es el índice de suma para los al menos tres genes; p es el coeficiente del modelo de Cos con penalización de Ridge para cada uno de los al menos tres genes; y Cqnormalizado es el Cq promedio normalizado para cada uno de los al menos tres genes.
Otro aspecto de la presente invención es un método de estratificación de un sujeto que es un paciente con cáncer de mama ER+/HER2- en un grupo de riesgo bajo o alto de reaparición de cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; y (b) calcular una puntuación de riesgo según la siguiente fórmula: Puntuación de riesgo = £ ¡ (pi * Cqnormalizado), en la que i es el índice de suma para los al menos tres genes; p es el coeficiente del modelo de Cox con penalización de Ridge para cada uno de los al menos tres genes; y Cqnormalizado es el Cq promedio normalizado para cada uno de los al menos tres genes. En este aspecto, el sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo alto y el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo bajo.
Otro aspecto más de la presente invención es un método de estratificación de un sujeto que es un paciente con cáncer de mama ER+/HER2- en un grupo de riesgo bajo, intermedio o alto de reaparición de cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; y (b) calcular una puntuación de riesgo según la siguiente fórmula: Puntuación de riesgo = £ ¡(p¡ * Cqnormalizado), en la que i es el índice de suma para los al menos tres genes; p es el coeficiente del modelo de Cox con penalización de Ridge para cada uno de los al menos tres genes; y Cqnormalizado es el Cq promedio normalizado para cada uno de los al menos tres genes. En este aspecto, el sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo alto, el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 66 y superior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo intermedio, y el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo bajo.
En realizaciones de los aspectos anteriores, al sujeto estratificado en un grupo de riesgo alto se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo bajo. En realizaciones, al sujeto estratificado en un grupo de riesgo alto se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo intermedio. En realizaciones, al sujeto estratificado en un grupo de riesgo intermedio se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo bajo.
La estratificación de los sujetos en grupos de riesgo puede estar influida por otras características del sujeto. Por ejemplo, también se pueden derivar modelos de riesgo. Como ejemplos, las categorizaciones pueden ser más apropiadas para subconjuntos de pacientes (por ejemplo, tratamientos pre-pos-menopáusicos o NO N+).
También se desvela un método de tratamiento de un sujeto que tiene un cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; (b) calcular una puntuación de riesgo según la siguiente fórmula: Puntuación de riesgo = £ ¡ (p¡ * Cqnormalizado); en la que i es el índice de suma para los al menos tres genes; p es el coeficiente del modelo de Cox con penalización de Ridge para cada uno de los al menos tres genes; y Cqnormalizado es el Cq promedio normalizado para cada uno de los al menos tres genes; y (c) proporcionar un tratamiento para el cáncer al sujeto. Al sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9 se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9.
También se desvela un método de tratamiento de un sujeto que tiene un cáncer de mama. El método comprende las etapas de (a) determinar, en una muestra, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; (b) calcular una puntuación de riesgo según la siguiente fórmula: Puntuación de riesgo = £ ¡ (p¡ * Cqnormalizado), en la que i es el índice de suma para los al menos tres genes; p es el coeficiente del modelo de Cox con penalización de Ridge para cada uno de los al menos tres genes; y Cqnormalizado es el Cq promedio normalizado para cada uno de los al menos tres genes; y (c) proporcionar un tratamiento para el cáncer al sujeto. Al sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 ; y al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 y superior a aproximadamente el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se le puede proporcionar un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9.
En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en EIF4EBP1, MRPS23 y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden comprender al menos APOBEC3B, CENPW, EIF4EBP1, EXOSC4, LY6E, MMP1, MRPS23, NDUFB 10 y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en APOBEC3B, CENPW, EIF4EBP1, EXOSC4, LY6E, MMP1, MRPS23, NDUFB 10 y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden comprender al menos ALYREF, APOBEC3B, CDK1, CENPW, EIF4EBP1, EXOSC4, H2AFJ, LY6E, MIEN1, MMP1, MRPS23, NDUFB10, NOL3, RACGAP1, SFN y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en ALYREF, APOBEC3B, CDK1, CENPW, EIF4EBP1, EXOSC4, H2AFJ, LY6E, MIEN1, MMP1, MRPS23, NDUFB 10, NOL3, RACGAP1, SFN y TOP2A. En cualquiera de los aspectos o realizaciones anteriores, los al menos tres genes pueden consistir en cada gen de la Tabla 3 o la Tabla 9 y en donde cada puntuación de corte es como se identifica en la Tabla 3.
En cualquiera de los aspectos o realizaciones anteriores, el Cqnormalizado se normaliza a la expresión de al menos un gen de referencia; en realizaciones el al menos un gen referenciado es un gen de mantenimiento, por ejemplo, como se cita en el presente documento. En cualquiera de los aspectos o realizaciones anteriores, Cqnormalizado se normaliza a la expresión de al menos un gen de referencia (por ejemplo, los cuatro genes) seleccionado del grupo que consiste en GAPDH, GUSB, HPRT1 y TBP. Cqnormalizado se puede calcular según la siguiente fórmula: Cqnormalizado = Cq AVG -SF, en la que en donde SF es la diferencia entre el valor de Cq AVG de los genes de referencia para cada sujeto y un valor de referencia constante K, en donde K= 25,012586069, que representa la media de Cq AVG de los cuatro genes de referencia calculada a través de una pluralidad de muestras de entrenamiento.
Se pueden obtener otros modelos de riesgo y fórmulas de la divulgación citada en el presente documento.
En realizaciones particulares, la muestra, por ejemplo, "una muestra biológica", puede comprender una célula cancerosa o tejido canceroso, tal como una muestra de tejido de mama que comprende una célula cancerosa y/o una célula madre de cáncer o una muestra de tejido de tumor primario de mama. Por "muestra biológica" se prevé cualquier muestra de células, tejidos o líquidos corporales en los que se pueda detectar la expresión de un cáncer de mama, célula madre o gen de tipo célula madre. Los ejemplos de dichas muestras biológicas incluyen, pero no se limitan a, biopsias y frotis. Los líquidos corporales pueden ser útiles en la presente divulgación e incluyen sangre, linfa, orina, saliva, aspirados de pezón, líquidos ginecológicos, o cualquier otra secreción corporal o derivado de la misma cuando el líquido corporal comprende una célula cancerosa y/o una célula madre de cáncer. La sangre puede incluir sangre completa, plasma, suero, o cualquier derivado de la sangre. En algunas realizaciones, la muestra biológica incluye células de cáncer de mama, particularmente tejido de mama de una biopsia, tal como una muestra de tejido de tumor de mama, y cualquier derivado del mismo, tal como estructuras tridimensionales generadas en cultivos organotípicos en matrices o en cultivos en suspensión (comúnmente considerados como mamosferas). Se pueden obtener muestras biológicas de un sujeto mediante una variedad de técnicas que incluyen, por ejemplo, por raspado o hisopado de un área, usando una aguja para aspirar células o líquidos corporales, o retirando una muestra de tejido (es decir, biopsia). Se conocen bien en la técnica los métodos de recogida de diversas muestras biológicas. Se puede obtener una muestra de tejido de mama por, por ejemplo, biopsia por aspiración con aguja fina, biopsia con aguja gruesa o biopsia por excisión. Se pueden aplicar disoluciones fijadoras y de tinción a las células o tejidos para conservar el espécimen y para facilitar el examen. Las muestras biológicas, particularmente las muestras de tejido de mama, se pueden transferir a un portaobjetos de vidrio para ver bajo aumento. En una realización, la muestra biológica es una muestra de tejido de mama fijada en formol, incorporada en parafina, particularmente una muestra de tumor de mama primario o una célula cancerosa. En diversas realizaciones, la muestra de tejido se obtiene de una muestra de tejido con aguja gruesa guiada por un anatomopatólogo. En diversas realizaciones, la muestra de tejido es una muestra de tejido "fresca", es decir, sin fijar y/o sin congelar (por ejemplo, obtenida de una biopsia). En diversas realizaciones, la muestra de tejido es una muestra de tejido congelada sin fijar.
En cualquiera de los aspectos o realizaciones anteriores, la muestra se obtiene del sujeto. La muestra puede ser un tumor obtenido del sujeto, una célula cancerosa obtenida del sujeto, o una célula madre de cáncer obtenida del sujeto. La muestra puede ser una estirpe celular primaria derivada de un tumor obtenido del sujeto, de una célula cancerosa obtenida del sujeto, o de una célula madre de cáncer obtenida del sujeto.
El cáncer de mama incluye todas las formas de cáncer de la mama. El cáncer de mama puede incluir cánceres de mama epiteliales primarios y cualquier derivado de los mismos, tales como estructuras tridimensionales generadas en cultivos organotípicos en matrices o en cultivos en suspensión (comúnmente considerados como mamosferas). El cáncer de mama puede incluir cánceres en los que participa el tejido mamario de la mama. El cáncer de mama puede incluir cáncer de mama de estadio I, II, IIIA, IIIB, IIIc y IV. El carcinoma ductal de la mama puede incluir carcinoma invasivo, carcinoma invasivo in situ con componente intraductal predominante, cáncer de mama inflamatorio y un carcinoma ductal de la mama con un tipo histológico seleccionado del grupo que consiste en comedo, mucinoso (coloide), medular, medular con infiltrado linfocítico, papilar, escirroso y tubular. El carcinoma lobular de la mama puede incluir carcinoma lobular invasivo con componente predominante in situ, carcinoma lobular invasivo y carcinoma lobular infiltrante. El cáncer de mama puede incluir enfermedad de Paget, enfermedad de Paget con carcinoma intraductal y enfermedad de Paget con carcinoma ductal invasivo. El cáncer de mama puede incluir neoplasias de mama que tienen heterogeneidad histológica y ultraestructural (por ejemplo, tipos mixtos de células). Un cáncer de mama que es relevante para la presente invención puede incluir cáncer de mama familiar y hereditario.
Un cáncer de mama relevante para la presente invención (por ejemplo, que se trata) puede incluir un tumor localizado de la mama. Un cáncer de mama puede incluir un tumor de la mama que está asociado con una biopsia negativa de ganglio centinela (SLN). Un cáncer de mama puede incluir un tumor de la mama que está asociado con una biopsia positiva de ganglio centinela (SLN). Un cáncer de mama puede incluir un tumor de la mama que está asociado con uno o más ganglios linfáticos axilares positivos, donde los ganglios linfáticos axilares se han estadificado por cualquier método aplicable. Un cáncer de mama puede incluir un tumor de la mama que se ha tipificado que tiene un estado ganglionar negativo (por ejemplo, sin afectación ganglionar) o estado ganglionar positivo (por ejemplo, con afectación ganglionar). Un cáncer de mama puede incluir un tumor de la mama que se ha tipificado que es negativo para el receptor hormonal (por ejemplo, sin receptor estrogénico) o estado de receptores hormonales (por ejemplo, con receptores estrogénicos o sin receptores estrogénicos). Un cáncer de mama puede incluir un tumor de la mama que ha metastatizado a otras localizaciones en el cuerpo. Un cáncer de mama se puede clasificar como que ha metastatizado a una localización seleccionada del grupo que consiste en hueso, pulmón, hígado, ganglios linfáticos y cerebro. Un cáncer de mama se puede clasificar según una característica seleccionada del grupo que consiste en metastásico, localizado, regional, local-regional, localmente avanzado, a distancia, multicéntrico, bilateral, ipsilateral, contralateral, recién diagnosticado, recurrente e inoperable.
Como se usa en el presente documento, un "sujeto en necesidad del mismo" es un sujeto que tiene cáncer de mama o que presenta uno o más síntomas del cáncer de mama, un sujeto que se sospecha que tiene cáncer de mama, un sujeto que tiene cáncer de mama no diagnosticado o un sujeto realmente diagnosticado con cáncer de mama. Preferentemente, un sujeto en necesidad del mismo tiene un cáncer de mama diagnosticado. El cáncer de mama puede ser cáncer de mama primario, cáncer de mama localmente avanzado o cáncer de mama metastásico. Un "sujeto" incluye un mamífero. El mamífero puede ser cualquier mamífero, por ejemplo, un humano, un primate, un ratón, una rata, un perro, un gato, una vaca, un caballo, una cabra, un camello, una oveja y un cerdo. Preferentemente, el sujeto es un humano. El sujeto puede ser un macho o una hembra. El sujeto haber sido diagnosticado por un experto con un cáncer de mama y se incluye en una subpoblación de seres humanos que actualmente tienen cáncer de mama o tuvieron cáncer de mama. El sujeto que tiene cáncer de mama puede ser pre-mastectomía o post-mastectomía.
Los métodos de la presente invención pueden incluir determinar al menos uno de, una combinación de, o cada uno de, los siguientes: tamaño del tumor (pT), malignidad del tumor, estado ganglionar/participación ganglionar (pN), subtipo intrínseco, tipo histológico, infiltración perivascular, estado de Ki-67, estado de receptores estrogénicos (ER), estado de receptores de progesterona (PgR) y/o estado de HER2/ERBB2.
Cualquier método disponible en la técnica para detectar la expresión génica del cáncer de mama, célula madre o genes de tipo célula madre está englobado en el presente documento. Por "detectar la expresión" se prevé la determinación de la cantidad o presencia de un transcrito de ARN o su producto de expresión de un gen. Los ejemplos no limitantes de métodos de detección de la expresión génica incluyen, pero no se limitan a, análisis de polimorfismos de conformación de cadena simple, electroforesis capilar, cromatografía líquida de alta resolución desnaturalizante, tecnología de códigos de barras moleculares digitales, por ejemplo, sistema nCounter® de Nanostring, secuenciación directa, ensayos de proteína de unión a desapareamiento de ADN, hibridación dinámica específica de alelo, hibridación in situ fluorescente (FISH), matrices de SNP de oligonucleótidos de alta densidad, análisis de fusión de alta resolución, micromatriz, secuenciación de nueva generación (NGS), por ejemplo, usando el analizador del genoma Illumina, instrumento Solid de ABI, instrumento 454 de Roche, instrumento Heliscope, análisis de transferencia Northern, análisis de protección de nucleasas, ensayos de ligasa de oligonucleótidos, reacción en cadena de la polimerasa (PCR), ensayos de extensión de cebadores, análisis Quantigene, ensayo cuantitativo de protección de nucleasas (qNPA), detección de genes indicadores, ensayos de polimorfismo de longitud de fragmentos de restricción (RFLP), reacción en cadena de la polimerasa cuantitativa con transcripción inversa en tiempo real (RT-qPCR), reacción en cadena de la polimerasa con transcripción inversa (RT-PCR), secuenciación de ARN (ARN-seq), análisis en serie de la expresión génica (SAGE), tecnología de secuenciación de ADN en tiempo real de moléculas individuales (SMRT), SNPLex, análisis de transferencia Southern, química de Sybr Green, ensayos basados en TaqMan, electroforesis en gel con gradiente de temperatura (TGGE), matriz de mosaico, análisis de transferencia Western e inmunohistoquímica.
Los métodos de detección de la expresión de los genes de la divulgación, es decir, la pauta de expresión génica, incluyen métodos basados en análisis de hibridación de polinucleótidos, métodos basados en secuenciación de polinucleótidos, métodos inmunohistoquímicos y métodos basados en proteómica. En realizaciones preferidas, se usan los métodos basados en PCR, tales como PCR con transcripción inversa (RT-PCR) (Weis et al., TIG 8:263- 64, 1992), y los métodos basados en matriz, tales como micromatriz (Schena et al., Science 270:467- 70, 1995). Por "micromatriz" se prevé una disposición ordenada de elementos de matriz hibridables, tales como, por ejemplo, sondas de polinucleótidos, sobre un sustrato. El término "sonda" se refiere a cualquier molécula que es capaz de unirse selectivamente a una biomolécula diana específicamente prevista, por ejemplo, un nucleótido transcrito o una proteína codificada por o correspondiente a un gen intrínseco. Las sondas se pueden sintetizar por un experto en la técnica, o derivar de preparaciones biológicas apropiadas. Las sondas se pueden diseñar específicamente para ser marcadas. Los ejemplos de moléculas que se pueden utilizar como sondas incluyen, pero no se limitan a, ARN, ADN, proteínas, anticuerpos y moléculas orgánicas.
Muchos métodos de detección de la expresión usan ARN aislado. El material de partida normalmente es ARN total aislado de una muestra biológica, tal como un tumor o estirpe celular derivada de un tumor (es decir, una estirpe celular primaria), y tejido normal correspondiente o estirpe celular (por ejemplo, que puede servir de control), respectivamente. Si la fuente de ARN es un tumor primario, el ARN (por ejemplo, ARNm) se puede extraer, por ejemplo, de muestras de tejido congeladas o incorporadas en parafina y fijadas (por ejemplo, fijadas en formol) archivadas (por ejemplo, muestras de tejido con aguja gruesa guiada por un anatomopatólogo) y "frescas", es decir, muestras de tejido sin fijar y/o sin congelar (por ejemplo, obtenidas de una biopsia).
Se conocen bien en la técnica los métodos generales para la extracción de ARN y se desvelan en los libros de texto habituales de biología molecular, que incluyen Ausubel et al., ed., Current Protocols in Molecular Biology, John Wiley & Sons, New York 1987-1999. Los métodos para extracción de ARN de tejidos incorporados en parafina se desvelan, por ejemplo, en Rupp y Locker, Lab Invest. 56:A67, (1987); y De Andres et al. Biotechniques 18:42-44, (1995). En particular, el aislamiento de ARN se puede realizar usando un kit de purificación, un conjunto de tampón y proteasa de fabricantes comerciales, tales como Qiagen (Valencia, CA), según las instrucciones del fabricante. Por ejemplo, se puede aislar ARN total de células en cultivo usando mini-columnas de Qiagen RNeasy. Otros kits de aislamiento de ARN comercialmente disponibles incluyen el kit de purificación de ADN y ARN MASTERPURE™ Complete (Epicentre, Madison, Wis.) y el kit de aislamiento de ARN en bloques de parafina (Ambion, Austin, TX). El ARN total de muestras de tejido se puede aislar, por ejemplo, usando RNA Stat-60 (Tel-Test, Friendswood, TX). Se puede aislar ARN total de FFPE, por ejemplo, usando High Pure FFPE RNA Microkit, Cat N.° 04823125001 (Roche Applied Science, Indianapolis, IN). El ARN preparado de un tumor se puede aislar, por ejemplo, por centrifugación en gradiente de densidad de cloruro de cesio. Además, se pueden procesar fácilmente grandes números de muestras de tejido usando técnicas bien conocidas por los expertos en la técnica, tales como, por ejemplo, el proceso de aislamiento de ARN de una sola etapa de Chomczynski (patente de EE. UU. N° 4.843.155).
Un método preferido para determinar el nivel de expresión génica en una muestra implica el proceso de amplificación de ácido nucleico, por ejemplo, por RT-PCR (patente de EE. UU. N.° 4.683.202), reacción en cadena de la ligasa (Barany, PNAS USA 88: 189-93, (1991)), replicación autosostenida de secuencias (Guatelli et al., Proc. Natl. Acad. Sci USA 87: 1874-78, (1990)), sistema de amplificación transcripcional (Kwoh et al., Proc. Natl. Acad. Sci USA 86: 1173-77, (1989)), Q-Beta replicasa (Lizardi et al., Bio/Technology 6:1197, (1988)), replicación en círculo rodante (patente de EE. UU. N° 5.854.033), o cualquier otro método de amplificación de ácidos nucleicos, seguido por la detección de las moléculas amplificadas usando técnicas bien conocidas por los expertos en la técnica. Estos esquemas de detección son especialmente útiles para la detección de moléculas de ácidos nucleicos si tales moléculas están presentes en números muy bajos.
En aspectos particulares de la divulgación, la expresión génica intrínseca se evalúa por RT-PCR cuantitativa. Se conocen en la técnica numerosos protocolos diferentes de PCR o Q-PCR y se ejemplifican en el presente documento a continuación y pueden ser directamente aplicados o adaptados para su uso usando las composiciones presentemente descritas para la detección y/o cuantificación de los genes enumerados en el presente documento. En general, en la PCR, una secuencia de polinucleótidos diana se amplifica por reacción con al menos un cebador de oligonucleótidos o par de cebadores de oligonucleótidos. El (Los) cebador(es) se hibridan con una región complementaria del ácido nucleico diana y una ADN polimerasa extiende el (los) cebador(es) para amplificar la secuencia diana. En condiciones suficientes para proporcionar productos de amplificación de ácido nucleico basados en polimerasa, un fragmento de ácido nucleico de un tamaño domina los productos de reacción (la secuencia de polinucleótidos diana que es el producto de amplificación). El ciclo de amplificación se repite para aumentar la concentración de la secuencia de polinucleótidos diana individual. La reacción se puede realizar en cualquier ciclador térmico comúnmente usado para la PCR. Sin embargo, se prefieren cicladores con capacidades de medición de la fluorescencia en tiempo real, por ejemplo, SMARTCYCLER® (Cepheid, Sunnyvale, CA), ABI PRISM 7700® (Applied Biosystems, Foster City, Calif.), ROTOR-GENE™ (Corbett Research, Sídney, Australia), LIGHTCYCLER® (Roche Diagnostics Corp, Indianapolis, Ind.), ICYCLER® (Biorad Laboratories, Hercules, Calif.) y MX4000® (Stratagene, La Jolla, Calif.).
En otra realización de la divulgación, se usan micromatrices para la pauta de expresión. Las micromatrices son particularmente muy aptas con este fin debido a la reproducibilidad entre diferentes experimentos. Las micromatrices de ADN proporcionan un método para la medición simultánea de los niveles de expresión de grandes números de genes. Cada matriz consiste en un patrón reproducible de sondas de captura unidas a un soporte sólido. El ARN o ADN marcado se hibrida con sondas complementarias sobre la matriz y luego se detecta por barrido láser. Las intensidades de hibridación para cada sonda sobre la matriz se determinan y se convierten en un valor cuantitativo que representa niveles relativos de expresión génica. Véanse, por ejemplo, las patentes de EE. UU. N° 6.040.138, 5.800.992 y 6.020.135, 6.033.860, y 6.344.316. Son particularmente útiles las matrices de oligonucleótidos de alta densidad para determinar la expresión génica para un gran número de oligonucleótidos de ARN en una muestra.
En los métodos de la presente invención, la expresión génica se normaliza a la expresión de al menos un gen de referencia. El al menos un gen de referencia puede ser un gen de mantenimiento. Los genes de mantenimiento a modo de ejemplo incluyen y no se limitan a AAAS, AAGAB, AAMP, AAR2, AARS, AARS2, AARSD1, AASDHPPT, AATF, ABCB10, ABCB7, ABCD3, ABCE1, ABCF1, ABCF2, ABCF3, ABHD10, ABHD12, ABHD13, ABHD14A, ABHD16A, ABHD4, ABHD8, ABI1, ABT1, ACAD9, ACADVL, ACAP3, ACBD3, ACBD5, ACBD6, ACIN1, ACLY, ACOT13, ACOT8, ACOT9, ACOX1, ACOX3, ACP1, ACSF3, ACSL3, ACSS2, ACTR10, ACTR1A, ACTR1B, ACTR5, ACTR8, ACVR1, ACVR1B, ADCK2, ADCK4, ADH5, ADI1, ADIPOR1, ADIPOR2, ADK, ADNP, ADO, ADPRH, ADPRHL2, ADPRM, ADSL, AES, AFF4, AFTPH, AGFG1, AGGF1, AGPAT1, AGPAT3, AGPAT6, AGPS, AHCY, AHSA1, AIMP1, AIP, AK2, AK3, AKAP8, AKAP9, AKIP1, AKIRIN1, AKIRIN2, AKR1A1, AKR7A2, AKT1, AKT1S1, AKTIP, ALAD, ALDH3A2, ALDH9A1, ALG11, ALG5, ALG8, ALG9, ALKBH1, ALKBH2, ALKBH3, ALKBH5, ALS2, ALYREF, AMBRA1, AMD1, ANAPC10, ANAPC11, ANAPC13, ANAPC15, ANAPC16, ANAPC2, ANAPC5, ANAPC7, ANKFY1, ANKH, ANKHD1, ANKHDI-EIF4EBP3, ANKRD10, ANKRD17, ANKRD28, ANKRD39, ANKRD46, ANO6, ANP32A, ANP32B, ANP32C, ANP32E, ANXA6, ANXA7, AP1B1, AP1G1, AP1M1, AP2A1, AP2A2, AP2M1, AP2S1, AP3B1, AP3D1, AP3M1, AP3S1, AP3S2, AP4B1, AP5M1, APEH, APEX1, APEX2, APH1A, API5, APIP, APOA1BP, APOL2, APOOL, APOPT1, APPL2, APTX, ARAF, ARCN1, ARF1, ARF5, ARF6, ARFGAP2, ARFGAP3, ARFGEF2, ARFIP1, ARFIP2, ARFRP1, ARHGAP35, ARHGAP5, ARHGDIA, ARHGEF10L, ARHGEF11, ARHGEF40, ARIH1, ARIH2, ARIH2OS, ARL1, ARL14EP, ARL5A, ARL6IP4, ARL8A, ARL8B, ARMC1, ARMC10, ARMC5, ARMC6, ARMC7, ARMC8, ARMCX3, ARMCX5, ARNT, ARPC1A, ARPC2, ARPC5L, ARV1, ASB1, ASB6, ASB7, ASB8, ASCC1, ASCC3, ASF1A, ASH2L, ASNA1, ASNSD1, ASPSCR1, ASUN, ASXL1, ATAD1, ATAD3A, ATE1, ATF1, ATF2, ATF4, ATF6, ATF7, ATF7IP, ATG12, ATG13, ATG16L1, ATG2A, ATG2B, ATG3, ATG4B, ATG4D, ATG5, ATG7, ATIC, ATL2, ATMIN, ATOX1, ATP2C1, ATP5A1, ATP5B, ATP5C1, ATP5D, ATP5F1, ATP5G2, ATP5G3, ATP5H, ATP5J, ATP5J2, ATP5J2-PTCD1, ATP5L, ATP5O, ATP5S, ATP5SL, ATP6AP1, ATP6V0A2, ATP6V0B, ATP6V0C, ATP6V0D1, ATP6V0E1, ATP6V1C1, ATP6V1 D, ATP6V1 E1, ATP6V1 F, ATP6V1G1, ATP6V1H, ATPAF2, ATPIF1, ATRAID, ATRN, ATXN10, ATXN1L, ATXN2, ATXN2L, ATXN7L3, ATXN7L3B, AUH, AUP1, AURKAIP1, AXIN1, AZI2, AZIN1, B3GALT6, B4GALT3, B4GALT5, B4GALT7, BABAM1, BAD, BAG1, BAG4, BAG6, BAHD1, BANF1, BAP1, BAZ1B, BBS4, BCAP29, BCAP31, BCAS2, BCAT2, BCCIP, BCKDHA, BCKDK, BCL2L1, BCL2L13, BCL2L2-PABPN1, BCL7B, BCLAF1, BCS1L, BECN1, BFAR, BIRC2, BIVM-ERCC5, BLMH, BLOC1S1, BLOC1S2, BLOC1S3, BLOC1S4, BLOC1S6, BLZF1, BMI1, BMS1, BNIP1, BNIP2, BOD1, BOLA1, BOLA3, BPGM, BPNT1, BPTF, BRAT1, BRD2, BRD4, BRD7, BRD9, BRE, BRF1, BRF2, BRIX1, BRK1, BRMS1, BRPF1, BRPF3, BSDC1, BSG, BTBD2, BTD, BTF3, BUB3, BZW1, C10orf12, C10orf2, C10orf76, C10orf88, C11orf1, Cllorf24, C11orf31, Cllorf57, C11orf58, C11orf73, C11orf83, C12orf10, C12orf23, C12orf29, C12orf44, C12orf45, C12orf5, C12orf52, C12orf57, C12orf65, C12orf66, C14orf1, C14orf119, C14orf142, C14orf166, C14orf2, C14orf28, C15orf38-AP3S2, C15orf57, C16orf13, C16orf62, C16orf72, C16orf91, C17orf49, C17orf51, C17orf58, C17orf59, C17orf70, C17orf85, C18orf21, C18orf25, C18orf32, C18orf8, C19orf43, C19orf53, C19orf60, C19orf70, C1GALT1, C1QBP, C1orf109, C1orf122, C1orf123, Clorf174, C1orf43, C1orf50, Clorf52, C20orf111, C20orf24, C21orf2, C21orf33, C21orf59, C22orf28, C22orf29, C22orf32, C2orf47, C2orf49, C2orf69, C2orf74, C2orf76, C3orf17, C3orf37, C3orS8, C3orf58, C4orf27, C4orf3, C4orf52, C5orf15, C5orf24, C6orf1, C6orf106, C6orf120, C6orf136, C6orf226, C6orf47, C6orf57, C6orf62, C6orf89, C7orf25, C7orf26, C7orf49, C7orf50, C7orf55, C7orf55-LUC7L2, C7orf73, C8orf33, C8orf40, C8orf59, C8orf76, C8orf82, C9orf123, C9orf16, C9orf37, C9orf64, C9orf69, C9orf78, C9orf89, CAB39, CALCOCO2, CALM1, CALR, CALU, CAMTA1, CAMTA2, CANT1, CANX, CAPN1, CAPN7, CAPNS1, CAPRIN1, CAPZA2, CAPZB, CARKD, CARS, CARS2, CASC3, CASC4, CASP3, CASP7, CASP9, CBR4, CBX3, CBX5, CC2D1A, CC2D1B, CCAR1, CCBL1, CCDC12, CCDC124, CCDC127, CCDC130, CCDC137, CCDC149, CCDC174, CCDC22, CCDC23, CCDC25, CCDC47, CCDC50, CCDC51, CCDC59, CCDC71, CCDC86, CCDC90A, CCDC92, CCDC94, CCM2, CCNB1IP1, CCNDBP1, CCNG1, CCNH, CCNK, CCNL1, CCNL2, CCNY, CCPG1, CCT3, CCT4, CCT5, CCT6A, CCT7, CCT8, CD164, CD320, CD46, CD63, CD81, CD82, CD99L2, CDC123, CDC16, CDC23, CDC27, CDC37, CDC37L1, CDC40, CDC42, CDC5L, CDIP1, CDIPT, CDK12, CDK13, CDK16, CDK2AP1, CDK4, CDK5RAP1, CDK8, CDK9, CDS2, CDV3, CDYL, CEBPG, CEBPZ, CECR5, CELF1, CENPB, CENPT, CEP104, CEP57, CEP63, CERK, CERS2, CGGBP1, CHAMP 1, CHCHD1, CHCHD2, CHCHD3, CHCHD4, CHCHD5, CHCHD7, CHD1L, CHD4, CHD8, CHERP, CHID1, CHKB, CHMP1A, CHMP2A, CHMP2B, CHMP4A, CHMP4B, CHMP5, CHMP6, CHP1, CHPT1, CHRAC1, CHST12, CHST7, CHTOP, CHUK, CHURC1, CHURC1-FNTB, CIA01, CIB1, CIC, CINP, CIR1, CIRH1A, CISD1, CISD2, CISD3, CKAP4, CLCC1, CLCN3, CLCN7, CLINT1, CLK3, CLNS1A, CLOCK, CLP1, CLPP, CLPTM1, CLPTM1L, CLPX, CLTA, CLTB, CLTC, CMAS, CMC1, CMC2, CMC4, CMPK1, CNBP, CNIH, CNIH4, CNNM2, CNNM3, CNOT1, CNOT11, CNOT2, CNOT3, CNOT4, CNOT7, CNST, COA1, COA3, COA4, COA5, COA6, COASY, COG1, COG2, COG3, COG4, COG7, COG8, COMMD1, COMMD10, COMMD3, COMMD3-BMI1, COMMD5, COMMD6, COMMD7, COMMD9, COMT, COPA, COPB1, COPB2, COPE, COPG1, COPS2, COPS3, COPS4, COPS5, COPS6, COPS7A, COPS7B, COPS8, COPZ1, COQ10B, COQ2, COQ4, COQ5, COQ6, COROIC, COX11, COX14, COX15, COX16, COX19, COX20, COX4I1, COX5B, COX6B1, COX6C, COX7A2, COX7A2L, COX7C, COX8A, CPD, CPNE1, CPNE2, CPNE3, CPOX, CPSF2, CPSF3L, CPSF4, CPSF6, CPSF7, CRADD, CRBN, CRCP, CREB3, CREBZF, CREG1, CRELD1, CRIPAK, CRIPT, CRK, CRKL, CRLS1, CRNKL1, CRTC2, CRY2, CSGALNACT2, CSNK1A1, CSNK1A1L, CSNK1 D, CSNK1G3, CSNK2A3, CSNK2B, CSRP2BP, CST3, CSTB, CSTF1, CSTF2T, CTAGE5, CTBP1, CTCF, CTDSP2, CTNNA1, CTNNB1, CTNNBIP1, CTNNBL1, CTNND1, CTSA, CTSD, CTTN, CTU2, CUEDC2, CUL1, CUL2, CUL4A, CUL4B, CUL5, CUTA, CUX1, CWC15, CWC22, CWC25, CXXC1, CXXC5, CXorf40A, CXorf40B, CXorf56, CYB5B, CYB5D2, CYB5R3, CYC1, CYFIP1, CYHR1, CYP2U1, D2HGDH, DAD1, DAG1, DAGLB, DALRD3, DAP3, DARS, DARS2, DAXX, DAZAP1, DBT, DCAF10, DCAF11, DCAF12, DCAF13, DCAF5, DCAF7, DCAF8, DCAKD, DCTD, DCTN2, DCTN3, DCTN4, DCTN5, DCTN6, DCTPP1, DCUN1D3, DCUN1D4, DCUN1D5, DDA1, DDB1, DDB2, DDOST, DDRGK1, DDX1, DDX10, DDX17, DDX18, DDX19A, DDX19B, DDX21, DDX23, DDX24, DDX27, DDX39B, DDX3X, DDX41, DDX42, DDX46, DDX47, DDX49, DDX54, DDX56, DDX59, DEDD, DEF8, DEGS1, DEK, DENND1A, DENND4A, DENR, DERA, DERL1, DERL2, DESI1, DEXI, DFFA, DGCR14, DGCR2, DGCR6L, DHPS, DHRS12, DHRS7B, DHX15, DHX16, DHX29, DHX30, DHX32, DHX33, DHX36, DHX38, DHX8, DHX9, DIABLO, DIDO1, DIEXF, DIMT1, DIRC2, DIS3, DIS3L2, DKC1, DLD, DLG1, DLGAP4, DLST, DMAP1, DNAAF2, DNAJA2, DNAJA3, DNAJB11, DNAJB12, DNAJB9, DNAJC10, DNAJC11, DNAJC14, DNAJC17, DNAJC19, DNAJC2, DNAJC21, DNAJC3, DNAJC4, DNAJC5, DNAJC7, DNAJC8, DNAJC9, DNASE2, DNLZ, DNM1L, DNM2, DNTTIP1, DNTTIP2, DOHH, DOLK, DPAGT1, DPH1, DPH2, DPH3, DPH5, DPMI, DPP7, DPY30, DR1, DRAM2, DRAP1, DRG2, DROSHA, DSCR3, DTWD1, DUSP11, DUSP14, DUSP16, DUSP22, DUT, DVL3, DYM, DYNC1LI1, DYNLL2, DYNLRB1, DYNLT1, E2F4, E4F1, EAF1, EAPP, EARS2, EBAG9, EBNA1BP2, ECD, ECH1, ECHDC1, ECHS1, ECI1, ECI2, ECSIT, EDC3, EDC4, EDEM3, EDF1, EED, EEF1B2, EEF1E1, EEF2, EEFSEC, EFCAB14, EFHA1, EFR3A, EFTUD1, EFTUD2, EGLN2, EHMT1, E124, EID2, EIF1, EIF1AD, EIF1B, EIF2A, EIF2AK1, EIF2AK3, EIF2AK4, EIF2B2, EIF2B3, EIF2B4, EIF2B5, EIF2D, EIF2S1, EIF2S2, EIF3A, EIF3B, EIF3D, EIF3E, EIF3G, EIF3H, EIF3I, EIF3J, EIF3K, EIF3L, EIF3M, EIF4A1, EIF4A3, EIF4E2, EIF4G1, EIF4G2, EIF4G3, EIF4H, EIF5, EIF5A, EIF5AL1, EIF5B, EIF6, ELAC2, ELAVL1, ELF2, ELK1, ELK4, ELL2, ELMOD3, ELOVL1, ELP2, ELP3, ELP4, ELP6, EMC1, EMC10, EMC2, EMC3, EMC4, EMC6, EMC7, EMC8, EMC9, EMD, EMG1, ENDOG, ENOPH1, ENSA, ENTPD4, ENTPD6, ENY2, EPC1, EPM2AIP1, EPN1, EPRS, ERAL1, ERAP1, ERCC1, ERCC2, ERCC3, ERCC5, ERGIC2, ERGIC3, ERH, ERI3, ERICH1, ERLEC1, ERO1L, ERP44, ESD, ESF1, ETF1, ETFA, ETFB, ETV6, EWSR1, EXD2, EXOC1, EXOC2, EXOC3, EXOC4, EXOC7, EXOC8, EXOSC1, EXOSC10, EXOSC2, EXOSC4, EXOSC7, EXOSC8, EXT2, EXTL3, FADD, FAF1, FAF2, FAHD1, FAM104B, FAM108A1, FAM108B1, FAM114A2, FAM118B, FAM120A, FAM120AOS, FAM120B, FAM122A, FAM127B, FAM134A, FAM134C, FAM136A, FAM149B1, FAM160A2, FAM160B1, FAM160B2, FAM162A, FAM168B, FAM173A, FAM173B, FAM174A, FAM175B, FAM177A1, FAM178A, FAM192A, FAM199X, FAM200A, FAM204A, FAM206A, FAM208B, FAM20B, FAM210B, FAM32A, FAM35A, FAM3A, FAM50A, FAM50B, FAM58A, FAM63A, FAM73B, FAM8A1, FAM96A, FAM96B, FAM98A, FARS2, FARSA, FARSB, FASTK, FASTKD2, FASTKD5, FBRSL1, FBXL15, FBXL17, FBXL3, FBXL4, FBXL5, FBXL6, FBXO11, FBXO18, FBXO22, FBXO28, FBXO3, FBXO38, FBXO42, FBXO45, FBXO6, FBXO7, FBXW11, FBXW2, FBXW4, FBXW5, FBXW7, FCF1, FDFT1, FDPS, FDX1, FECH, FEM1C, FEN1, FEZ2, FGFR1OP2, FH, FIBP, FICD, FIP1L1, FIS1, FIZ1, FKBP3, FKBP8, FKBPL, FKRP, FLAD1, FLCN, FLOT1, FLOT2, FNDC3A, FNTA, FNTB, FOPNL, FOXK2, FOXP4, FOXRED1, FPGS, FPGT, FRA10AC1, FTO, FTSJ1, FTSJ2, FTSJ3, FTSJD1, FTSJD2, FUBP1, FUK, FUNDC2, FXN, FYTTD1, FZR1, G3BP1, GAA, GABARAP, GABARAPL2, GABPB1, GAPDH, GADD45GIP1, GALK2, GALNS, GALNT1, GALNT2, GALT, GANAB, GAPVD1, GARS, GART, GATAD2A, GATAD2B, GATC, GBA, GBA2, GBF1, GCC1, GCDH, GCLC, GCLM, GDE1, GDI2, GDPGP1, GEMIN7, GEMIN8, GET4, GFER, GFM1, GFOD2, GGCT, GGNBP2, GGT7, GHDC, GHITM, GID8, GINM1, GIPC1, GLCE, GLE1, GLG1, GLI4, GLOl, GLRX2, GLRX3, GLRX5, GLT8D1, GLTP, GLTPD1, GLYR1, GMPPA, GMPR2, GNB1, GNB2, GNE, GNL2, GNL3, GNPAT, GNPDA1, GNPNAT1, GNPTG, GNS, GOLGA1, GOLGA2, GOLGA3, GOLGA5, GOLGA7, GOLGB1, GOLPH3, GOLT1B, GOPC, GORASP1, GORASP2, GOSR1, GOSR2, GPAA1, GPANK1, GPATCH4, GPBP1, GPBP1L1, GPHN, GPI, GPKOW, GPN1, GPN2, GPN3, GPR107, GPR108, GPS1, GPS2, GPX4, GRAMD4, GRHPR, GRINA, GRIPAP1, GRPEL1, GRSF1, GRWD1, GSK3A, GSK3B, GSPT1, GSPT2, GSR, GSS, GSTK1, GSTM4, GSTO1, GTDC2, GTF2A1, GTF2B, GTF2F1, GTF2F2, GTF2H1, GTF2H4, GTF2H5, GTF2I, GTF3A, GTF3C1, GTF3C2, GTF3C3, GTF3C5, GTF3C6, GTPBP10, GTPBP4, GTPBP5, GTPBP8, GUK1, GUSB, GZF1, H1FX, H2AFV, H2AFX, H2AFY, H2AFZ, HADH, HADHA, HAGH, HARS, HARS2, HAT1, HAUS3, HAUS4, HAUS7, HAX1, HBP1, HBS1L, HCCS, HCFC1, HDAC2, HDAC3, HDAC6, HDAC8, HDDC3, HDGF, HDHD3, HDLBP, HEATR2, HEATR5A, HEBP1, HECTD3, HELZ, HEMK1, HERC4, HERPUD1, HERPUD2, HEXA, HEXDC, HEXIM1, HGS, HIAT1, HIATL1, HIBADH, HIGD1A, HIGD2A, HINFP, HINT1, HINT2, HIST1H2BC, HIVEP1, HMBS, HMG20A, HMG20B, HMGB1, HMGN3, HMGXB3, HMGXB4, HMOX2, HN1L, HNRNPA0, HNRNPA2B1, HNRNPAB, HNRNPC, HNRNPD, HNRNPF, HNRNPH1, HNRNPH2, HNRNPK, HNRNPL, HNRNPM, HNRNPR, HNRNPU, HNRNPUL1, HNRNPUL2, HNRPDL, HNRPLL, HPRT1, HP1BP3, HPS1, HPS6, HS1BP3, HS2ST1, HS6ST1, HSBP1, HSCB, HSD17B10, HSD17B12, HSD17B4, HSPA14, HSPA4, HSPA5, HSPA8, HSPA9, HSPBP1, HSPE1-MOB4, HTATIP2, HTRA2, HTT, HUS1, HUWE1, HYOU1, HYPK, IAH1, IARS, IARS2, IBA57, IBTK, ICK, ICMT, ICT1, IDE, IDH3A, IDH3B, IDH3G, IDI1, IER3IP1, IFNAR1, IFNGR1, IFRD1, IFT27, IKZF5, IL13RA1, IL6ST, ILF2, ILKAP, ILVBL, IMMT, IMP3, IMP4, IMPAD1, INF2, ING1, INO80B, INO80E, INPP5A, INPP5K, INSIG2, INTS1, INTS10, INTS12, INTS3, INTS4, INVS, IP6K1, IP6K2, IP07, IP08, IPO9, IRAK1, IREB2, IRF2BP1, IRF2BP2, IRF2BPL, IRGQ, ISCU, ISOC2, IST1, ISY1, ISY1-RAB43, ITCH, ITFG1, ITFG3, ITGB1, ITGB1BP1, ITM2B, ITPA, ITPK1, ITPKC, ITPRIPL2, IVNS1ABP, IWS1, JAGN1, JAK1, JKAMP, JMJD4, JMJD6, JMJD7, JMJD8, JOSD2, JTB, JUND, KANSL2, KANSL3, KARS, KAT2B, KAT5, KAT8, KBTBD2, KBTBD4, KBTBD7, KCMF1, KCTD20, KCTD21, KCTD6, KDM2A, KDM4A, KDM5C, KDSR, KHDRBS1, KHNYN, KHSRP, KIAA0100, KIAA0141, KIAA0195, KIAA0196, KIAA0232, KIAA0319L, KIAA0391, KIAA0754, KIAA0947, KIAA1143, KIAA1191, KIAA1429, KIAA1430, KIAA1586, KIAA1704, KIAA1715, KIAA1919, KIAA1967, KIAA2013, KLC4, KLF3, KLF9, KLHDC2, KLHDC3, KLHL20, KLHL25, KLHL36, KLHL5, KLHL8, KPNA1, KPNB1, KRCC1, KRR1, KTI12, KTN1, KXD1, L3MBTL2, LACTB, LAGE3, LAMP1, LAMP2, LAMTOR1, LAMTOR2, LAMTOR3, LAMTOR4, LAMTOR5, LAP3, LAPTM4A, LARP1, LARP4, LARP7, LARS2, LCOR, LDHA, LEMD2, LENG1, LEPROT, LETM1, LETMD1, LGALSL, LHPP, LIAS, LIG3, LIG4, LIN37, LIN54, LIN7C, LINS, LIPT1, LMAN1, LMBRD1, LMF2, LMO4, LNX2, LOC100129361, LOC100289561, LOC441155, LOC729020, LONP1, LONP2, LPCAT3, LPIN1, LPPR2, LRFN3, LRPAP1, LRPPRC, LRRC14, LRRC24, LRRC28, LRRC40, LRRC41, LRRC42, LRRC47, LRRC57, LRRC59, LRRC8A, LRRFIP2, LRSAM1, LSG1, LSM1, LSM10, LSM14A, LSM14B, LSM2, LSM3, LSM4, LSM5, LSM6, LSM7, LSMD1, LSS, LTV1, LUC7L2, LUC7L3, LUZP6, LYRM1, LYRM4, LYRM5, LYSMD1, LYSMD3, LYSMD4, LZTR1, M6PR, MAD2L1BP, MAD2L2, MAEA, MAGED1, MAGEF1, MAGOH, MAGT1, MAK16, MALSU1, MAN1A2, MAN1B1, MAN2A2, MAN2B2, MAN2C1, MAP1LC3B2, MAP2K1, MAP2K2, MAP2K5, MAP3K7, MAP4K4, MAPK1, MAPK1IP1L, MAPK6, MAPK8, MAPK9, MAPKAP1, MAPKAPK2, MAPKAPK5, MAPRE2, MARCH2, MARCH5, MARCH6, MARCH7, MARK3, MARK4, MARS, MARS2, MAT2B, MAVS, MAX, MAZ, MBD1, MBD2, MBD3, MBD4, MBLAC1, MBNL2, MBTPS1, MBTPS2, MCAT, MCCC1, MCEE, MCFD2, MCM3AP, MCM7, MCMBP, MCOLN1, MCPH1, MCRS1, MCTS1, MCU, MDC1, MDP1, ME2, MEAF6, MECP2, MED10, MED11, MED13, MED14, MED16, MED19, MED20, MED21, MED24, MED29, MED31, MED4, MED6, MED7, MED8, MEF2A, MEF2BNB, MEMO1, MEN1, MEPCE, METAP1, METAP2, METRN, METTL13, METTL14, METTL16, METTL17, METTL18, METTL20, METTL21A, METTL23, METTL2A, METTL2B, METTL3, METTL5, MFAP1, MFAP3, MFF, MFN1, MFSD11, MFSD12, MFSD3, MFSD5, MGAT2, MGAT4B, MGME1, MGMT, MGRN1, MGST3, MIA3, MIB1, MICALL1, MICU1, MID1IP1, MIDN, MIEN1, MIER1, MIF, MIF4GD, MIIP, MINOS 1, MIS12, MITD1, MKI67IP, MKKS, MKLN1, MKNK1, MKRN2, MLEC, MLF2, MLH1, MLLT1, MLLT10, MLST8, MLX, MMAA, MMADHC, MMS19, MNAT1, MNF1, MOB4, MOGS, MON1A, MON2, MORC2, MORF4L2, MOSPD1, MPC2, MPDU1, MPG, MPHOSPH10, MPI, MPLKIP, MPND, MPPE1, MPV17L2, MRFAP1, MRFAP1L1, MRI1, MRM1, MRP63, MRPL1, MRPL10, MRPL11, MRPL12, MRPL13, MRPL14, MRPL15, MRPL16, MRPL17, MRPL18, MRPL19, MRPL2, MRPL20, MRPL21, MRPL22, MRPL23, MRPL24, MRPL27, MRPL28, MRPL3, MRPL30, MRPL32, MRPL33, MRPL35, MRPL36, MRPL37, MRPL38, MRPL4, MRPL40, MRPL41, MRPL42, MRPL43, MRPL44, MRPL45, MRPL46, MRPL47, MRPL48, MRPL49, MRPL50, MRPL51, MRPL52, MRPL53, MRPL54, MRPL55, MRPL9, MRPS10, MRPS11, MRPS12, MRPS14, MRPS15, MRPS16, MRPS17, MRPS18A, MRPS18B, MRPS18C, MRPS2, MRPS21, MRPS22, MRPS23, MRPS24, MRPS25, MRPS26, MRPS27, MRPS28, MRPS30, MRPS31, MRPS33, MRPS34, MRPS35, MRPS5, MRPS6, MRPS7, MRPS9, MRRF, MRS2, MRTO4, MSANTD3, MSH3, MSH6, MSL3, MSMP, MSRA, MSRB2, MTA2, MTCH1, MTCH2, MTDH, MTERFD1, MTERFD2, MTERFD3, MTFMT, MTFR1, MTFR1L, MTIF3, MTM1, MTMR1, MTMR3, MTMR6, MTO1, MTPAP, MTRR, MTSS1, MTX2, MUL1, MUS81, MUT, MVD, MXD4, MXI1, MYBBP1A, MYEOV2, MYL12B, MYNN, MYO1E, MYPOP, MZF1, MZT2A, MZT2B, N4BP1, N4BP2L2, NAA10, NAA15, NAA20, NAA38, NAA50, NAA60, NABP2, NACA, NACA2, NACC1, NACC2, NAE1, NAMPT, NANS, NAP1L4, NAPA, NARF, NARFL, NARG2, NARS, NARS2, NAT10, NBN, NBR1, NCAPH2, NCBP2, NCK1, NCKIPSD, NCL, NCLN, NCOA1, NCOA6, NCOR1, NCSTN, NDEL1, NDFIP1, NDNL2, NDST1, NDUFA10, NDUFA11, NDUFA12, NDUFA13, NDUFA2, NDUFA3, NDUFA4, NDUFA5, NDUFA6, NDUFA7, NDUFA8, NDUFA9, NDUFAF2, NDUFAF3, NDUFAF4, NDUFB10, NDUFB11, NDUFB2, NDUFB3, NDUFB4, NDUFB5, NDUFB6, NDUFB7, NDUFB8, NDUFB9, NDUFC1, NDUFC2, NDUFC2-KCTD14, NDUFS2, NDUFS3, NDUFS4, NDUFS5, NDUFS6, NDUFS7, NDUFS8, NDUFV1, NDUFV2, NECAP1, NEDD8, NEDD8-MDP1, NEIL2, NEK4, NEK9, NELFB, NELFCD, NELFE, NENF, NEU1, NF2, NFATC2IP, NFE2L2, NFIL3, NFKBIB, NFKBIL1, NFU1, NFX1, NFYB, NFYC, NGDN, NGLY1, NGRN, NHP2, NHP2L1, NIF3L1, NINJ1, NIP7, NIPA2, NIPBL, NISCH, NIT1, NIT2, NKAP, NKIRAS2, NMD3, NME1-NME2, NME2, NME3, NME6, NMRK1, NMT1, NOA1, NOB1, NOC2L, NOL10, NOL11, NOL12, NOL6, NOL7, NOL8, NOLC1, NOM1, NONO, NOP10, NOP14, NOP16, NOP2, NOP56, NOP58, NOP9, NPC1, NPC2, NPLOC4, NPRL2, NPRL3, NQO2, NR1H2, NR2C1, NR2C2AP, NR3C2, NRBP1, NRDE2, NRIP1, NSA2, NSD1, NSDHL, NSFL1C, NSMCE1, NSMCE2, NSMCE4A, NSRP1, NSUN2, NSUN5, NSUN6, NT5C, NT5C3, NT5DC1, NTAN1, NTMT1, NTPCR, NUB1, NUBP1, NUBP2, NUCB1, NUCKS1, NUDC, NUDCD1, NUDCD2, NUDT14, NUDT15, NUDT2, NUDT21, NUDT22, NUDT3, NUDT9, NUFIP2, NUP107, NUP133, NUP153, NUP54, NUP62, NUP85, NUPL2, NUTF2, NXF1, NXT1, OAT, OAZ1, OAZ2, OBFC1, OCEL1, OCIAD1, ODC1, OGFOD1, OGFOD3, OGFR, OGG1, OGT, OLA1, OPA1, OPA3, ORC4, ORMDL1, ORMDL2, ORMDL3, OS9, OSBP, OSBPL2, OSBPL9, OSGEP, OSGIN2, OSTM1, OTUB1, OTUD5, OVCA2, OXA1L, OXNAD1, P4HTM, PA2G4, PABPN1, PACSIN2, PAF1, PAFAH1B1, PAGR1, PAICS, PAIP1, PAIP2, PAK1IP1, PAK2, PAM16, PANK2, PANK3, PANK4, PANX1, PAPD4, PAPD7, PAPOLA, PARK7, PARL, PARN, PARP1, PARP3, PARP9, PATL1, PATZ1, PAXBP1, PBDC1, PBX2, PCBP1, PCBP2, PCDHGB5, PCF11, PCGF1, PCGF5, PCID2, PCIF1, PCM1, PCMT1, PCNA, PCNX, PCNXL4, PCSK7, PCYOX1, PCYT1A, PDAP1, PDCD2, PDCD5, PDCD6, PDCD6IP, PDE12, PDE6D, PDGFC, PDHB, PDHX, PDK2, PDLIM5, PDP2, PDS5A, PDZD11, PDZD8, PEBP1, PEF1, PELO, PELP1, PEPD, PES1, PET100, PET 117, PEX1, PEX11A, PEX11B, PEX12, PEX13, PEX14, PEX16, PEX19, PEX2, PEX26, PEX5, PEX6, PFDN2, PFDN4, PFDN5, PFDN6, PFN1, PGAM5, PGBD3, PGK1, PGLS, PGP, PGPEP1, PGRMC2, PHACTR4, PHAX, PHB, PHB2, PHC2, PHF10, PHF12, PHF20L1, PHF23, PHF5A, PHKB, PHPT1, PHRF1, PI4K2A, PI4KA, PI4KB, PIAS1, PICALM, PICK1, PIGC, PIGF, PIGG, PIGH, PIGK, PIGP, PIGS, PIGT, PIGU, PIGW, PIGX, PIGY, PIH1D1, PIK3C3, PIK3CB, PIK3R1, PIK3R4, PIN1, PINK1, PINX1, PIP5KIA, PITHD1, PITPNA, PITPNB, PITRM1, PLA2G12A, PLAA, PLBD2, PLD3, PLEKHA1, PLEKHJ1, PLEKHM1, PLGRKT, PLIN3, PLOD1, PLOD3, PLRG1, PMF1, PMF1-BGLAP, PMPCA, PMPCB, PMS1, PMVK, PNISR, PNKD, PNKP, PNN, PNOl, PNPLA6, PNPLA8, PNPO, PNPT1, PNRC2, POFUT1, POLD2, POLDIP2, POLDIP3, POLE3, POLE4, POLG, POLH, POLK, POLL, POLM, POLR1C, POLR1D, POLR1E, POLR2A, POLR2B, POLR2C, POLR2D, POLR2E, POLR2F, POLR2G, POLR2H, POLR2I, POLR2J, POLR2K, POLR2L, POLR3C, POLR3E, POLR3GL, POLR3K, POM121, POM121C, POMGNT1, POMP, POMT1, POP4, POP5, POP7, PPA1, PPA2, PPAN, PPAN-P2RY11, PPARA, PPARD, PPCS, PPFIA1, PPHLN1, PPID, PPIE, PPIF, PPIG, PPIH, PPIL4, PPM1A, PPM1B, PPP1CA, PPP1CC, PPP1R10, PPP1R11, PPP1R15B, PPP1R37, PPP1R7, PPP1R8, PPP2CA, PPP2CB, PPP2R1A, PPP2R2A, PPP2R2D, PPP2R3C, PPP2R4, PPP2R5A, PPP2R5B, PPP2R5C, PPP2R5D, PPP2R5E, PPP4C, PPP4R1, PPP4R2, PPP5C, PPP6C, PPP6R2, PPP6R3, PPWD1, PQBP1, PQLC1, PQLC2, PRADC1, PRCC, PRDM4, PRDX1, PRDX2, PRDX3, PRDX5, PRDX6, PREB, PREP, PRKAA1, PRKAB1, PRKACA, PRKAG1, PRKAR1A, PRKRIP1, PRMT1, PRMT5, PRMT7, PROSC, PRPF18, PRPF19, PRPF3, PRPF31, PRPF4, PRPF40A, PRPF4B, PRPF6, PRPF8, PRPS1, PRPSAP1, PRR14, PRRC1, PRRC2A, PRRC2B, PRUNE, PSEN1, PSEN2, PSENEN, PSKH1, PSMA1, PSMA2, PSMA3, PSMA4, PSMA5, PSMA6, PSMA7, PSMB1, PSMB2, PSMB3, PSMB4, PSMB5, PSMB6, PSMB7, PSMC2, PSMC3, PSMC4, PSMC5, PSMC6, PSMD1, PSMD10, PSMD11, PSMD12, PSMD13, PSMD14, PSMD2, PSMD3, PSMD4, PSMD5, PSMD6, PSMD7, PSMD8, PSMD9, PSME1, PSME3, PSMF1, PSMG2, PSMG3, PSMG4, PSPC1, PTCD1, PTCD3, PTDSS1, PTEN, PTGES2, PTGES3, PTOV1, PTP4A2, PTPMT1, PTPN1, PTPN11, PTPN23, PTRH1, PTRH2, PTRHD1, PUF60, PUM1, PUM2, PURA, PURB, PUS3, PUS7, PUSL1, PWP1, PWP2, PWWP2A, PXMP4, PYCR2, PYGO2, PYURF, QARS, QRICH1, QRSL1, QSOX1, QTRT1, R3HCC1, R3HDM2, RAB10, RAB11A, RAB11B, RAB14, RAB18, RAB1A, RAB1B, RAB21, RAB22A, RAB2A, RAB2B, RAB3GAP1, RAB3GAP2, RAB40C, RAB4A, RAB5A, RAB5B, RAB5C, RAB6A, RAB7A, RAB9A, RABEP1, RABEPK, RABGEF1, RABGGTA, RABGGTB, RAD1, RAD17, RAD23B, RAD50, RAD51C, RAF1, RALA, RALBP1, RALY, RAN, RANBP1, RANBP2, RANBP3, RANBP6, RANGAP1, RANGRF, RAP1A, RAPGEF1, RAPGEF2, RARS, RARS2, RB1CC1, RBAK, RBBP4, RBBP7, RBCK1, RBFA, RBM10, RBM12, RBM12B, RBM14, RBM14-RBM4, RBM15, RBM15B, RBM17, RBM18, RBM19, RBM23, RBM27, RBM28, RBM33, RBM34, RBM39, RBM4, RBM41, RBM42, RBM5, RBM6, RBM7, RBM8A, RBMX, RBMXL1, RBX1, RC3H2, RCAN1, RCHY1, RCN2, RDH14, RDX, REEP3, REEP5, RELA, REPIN1, REPS1, RER1, REST, REXO1, RFC1, RFC2, RFC5, RFK, RFNG, RFT1, RFWD2, RFXANK, RGP1, RHBDD1, RHBDD3, RHOA, RHOB, RHOT1, RHOT2, RIC8A, RIN2, RING1, RINT1, RIOK1, RIOK2, RIOK3, RIPK1, RMDN1, RMDN3, RMI1, RMND1, RMND5A, RMND5B, RNASEH1, RNASEH2C, RNASEK, RNF10, RNF103, RNF11, RNF111, RNF113A, RNF115, RNF121, RNF126, RNF13, RNF14, RNF141, RNF146, RNF167, RNF181, RNF185, RNF187, RNF216, RNF220, RNF25, RNF26, RNF31, RNF34, RNF4, RNF40, RNF5, RNF6, RNF7, RNH1, RNMTL1, RNPEP, ROMO1, RP9, RPA2, RPA3, RPAIN, RPAP3, RPF1, RPF2, RPL10A, RPL11, RPL14, RPL26L1, RPL27, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36AL, RPL4, RPL6, RPL7L1, RPL8, RPN1, RPN2, RPP14, RPP25L, RPP30, RPP38, RPRD1B, RPS13, RPS19BP1, RPS23, RPS24, RPS27L, RPS5, RPS6, RPS6KA3, RPS6KB1, RPS6KB2, RPUSD3, RQCD1, RRAGA, RRM1, RRN3, RRNAD1, RRP1, RRP36, RRP7A, RRP8, RRS1, RSAD1, RSBN1L, RSC1A1, RSL1D1, RSPRY1, RSRC1, RSRC2, RTCA, RTFDC1, RTN4, RUFY1, RUVBL1, RWDD1, RWDD3, RXRA, RXRB, SAE1, SAMD1, SAMD4B, SAMD8, SAMM50, SAP18, SAP30, SAP30BP, SAP30L, SAR1A, SARNP, SARS, SART1, SART3, SAT2, SAV1, SBDS, SCAF1, SCAF11, SCAF4, SCAF8, SCAMP2, SCAMP3, SCAND1, SCAP, SCARB2, SCFD1, SCFD2, SCNM1, SCO1, SCO2, SCOC, SCP2, SCRIB, SCRN3, SCYL1, SCYL2, SCYL3, SDAD1, SDCBP, SDCCAG3, SDCCAG8, SDE2, SDF2, SDF4, SDHA, SDHAF2, SDHB, SDHC, SDHD, SDR39U1, SEC11A, SEC13, SEC16A, SEC22B, SEC22C, SEC23A, SEC231P, SEC24A, SEC24B, SEC24C, SEC31A, SEC61A1, SEC61B, SEC61G, SEC62, SEC63, SECISBP2, SEH1L, SEL1L, SELK, SELO, SELRC1, SELT, SENP2, SENP3, SENP5, SENP6, SEPHS1, SERBP1, SERF2, SERGEF, SERINC1, SERINC3, SERPINB6, SERTAD2, SET, SETD2, SETD3, SETD5, SETD6, SETD7, SETD8, SETDB1, SF1, SF3A1, SF3A3, SF3B1, SF3B14, SF3B2, SF3B3, SF3B4, SF3B5, SFSWAP, SGK196, SGMS1, SGPL1, SGSM3, SGTA, SH3BP5L, SH3GLB1, SHARPIN, SHOC2, SIAH1, SIAH2, SIGMAR1, SIKE1, SIL1, SIRT2, SIRT3, SIRT5, SIRT6, SIVA1, SKIL, SKIV2L, SKIV2L2, SKP1, SLC15A4, SLC20A1, SLC25A11, SLC25A26, SLC25A28, SLC25A3, SLC25A32, SLC25A38, SLC25A39, SLC25A44, SLC25A46, SLC25A5, SLC27A4, SLC30A1, SLC30A5, SLC30A9, SLC35A2, SLC35A4, SLC35B1, SLC35B2, SLC35C2, SLC35E1, SLC35E3, SLC35F5, SLC38A2, SLC39A1, SLC39A3, SLC39A7, SLC41A3, SLC46A3, SLC48A1, SLIRP, SLMO2, SLTM, SMAD2, SMAD4, SMAD5, SMAP1, SMARCA2, SMARCA4, SMARCAL1, SMARCB1, SMARCE1, SMC1A, SMC5, SMCR7L, SMEK1, SMEK2, SMG5, SMG7, SMG8, SMIM11, SMIM12, SMIM8, SMNDC1, SMPD1, SMPD4, SMU1, SMUG1, SNAP23, SNAP29, SNAP47, SNAPC3, SNAPC5, SNAPIN, SND1, SNF8, SNRNP200, SNRNP25, SNRNP27, SNRNP35, SNRNP40, SNRNP48, SNRNP70, SNRPA, SNRPB, SNRPB2, SNRPC, SNRPD1, SNRPD2, SNRPD3, SNRPG, SNUPN, SNW1, SNX12, SNX13, SNX17, SNX18, SNX19, SNX2, SNX25, SNX3, SNX4, SNX5, SNX6, SNX9, SOCS4, SOCS6, SOD1, SON, SPAG7, SPAG9, SPATA2, SPATA5L1, SPCS1, SPCS3, SPECC1L, SPEN, SPG11, SPG21, SPG7, SPHAR, SPNS1, SPOP, SPPL2B, SPPL3, SPRYD3, SPRYD7, SPSB3, SPTSSA, SPTY2D1, SRA1, SRD5A3, SREBF2, SREK1IP1, SRM, SRP14, SRP19, SRP54, SRP68, SRP72, SRP9, SRPR, SRPRB, SRR, SRRD, SRRM1, SRSF1, SRSF10, SRSF11, SRSF2, SRSF3, SRSF4, SRSF7, SRSF8, SS18L2, SSB, SSBP1, SSNA1, SSR1, SSR2, SSR3, SSRP1, SSSCA1, SSU72, ST3GAL2, ST6GALNAC6, ST7, STAM, STAM2, STAMBP, STARD3, STARD7, STAT3, STAU1, STAU2, STIM1, STIP1, STK11, STK16, STOM, STOML1, STOML2, STRAP, STRIP1, STRN3, STT3A, STT3B, STUB1, STX10, STX17, STX4, STX5, STX8, STXBP3, STYXL1, SUB1, SUCLA2, SUCLG1, SUCLG2, SUGP1, SUGT1, SUMO1, SUMO3, SUN2, SUPT4H1, SUPT5H, SUPT6H, SUPT7L, SUPV3L1, SURF1, SURF4, SURF6, SUV420H1, SUZ12, SYAP1, SYF2, SYMPK, SYNCRIP, SYNJ2BP, SYNJ2BP-COX16, SYPL1, SYS1, SYVN1, SZRD1, TAB1, TAB2, TACO1, TADA1, TADA3, TAF10, TAF11, TAF12, TAF13, TAF15, TAF1 D, TAF4, TAF5L, TAF8, TAF9, TALDO1, TAMM41, TANGO2, TANGO6, TANK, TAOK2, TAPBP, TAPT1, TARDBP, TARS, TATDN1, TATDN2, TAX1BP1, TAZ, TBC1D1, TBC1D14, TBC1D15, TBC1D20, TBC1D22A, TBC1 D23, TBC1 D7, TBC1 D9B, TBCA, TBCB, TBCC, TBCCD1, TBCD, TBCE, TBK1, TBP, TBRG1, TBRG4, TCAIM, TCEANC2, TCEB1, TCEB2, TCEB3, TCERG1, TCF12, TCF20, TCF25, TCP1, TCTN3, TDP2, TDRD3, TECR, TEF, TEFM, TELO2, TERF2, TERF2IP, TEX2, TEX261, TEX264, TFAM, TFB1M, TFB2M, TFCP2, TFDP1, TFE3, TFG, TFIP11, TFPT, TGIF2-C20orf24, TGOLN2, THADA, THAP3, THAP4, THAP5, THAP7, THOC5, THOC7, THOP1, THRAP3, THTPA, THUMPD3, THYN1, TIA1, TIAL1, TICAM1, TIGD5, TIGD6, TIMM10, TIMM10B, TIMM13, TIMM17A, TIMM17B, TIMM21, TIMM22, TIMM44, TIMM50, TIMM8B, TIMM9, TIMMDC1, TINF2, TIPRL, TJAP1, TLE1, TLK1, TM2D1, TM2D2, TM2D3, TM9SF1, TM9SF2, TM9SF3, TM9SF4, TMBIM1, TMBIM4, TMBIM6, TMCC1, TMCO1, TMCO3, TMED1, TMED10, TMED2, TMED4, TMED5, TMED7, TMED7-TICAM2, TMED9, TMEM101, TMEM106B, TMEM106C, TMEM115, TMEM120A, TMEM126A, TMEM127, TMEM128, TMEM129, TMEM131, TMEM134, TMEM141, TMEM147, TMEM14B, TMEM14C, TMEM161A, TMEM167B, TMEM168, TMEM177, TMEM179B, TMEM18, TMEM184C, TMEM185B, TMEM186, TMEM187, TMEM189, TMEM189-UBE2V1, TMEM19, TMEM192, TMEM199, TMEM203, TMEM205, TMEM214, TMEM219, TMEM222, TMEM223, TMEM230, TMEM242, TMEM248, TMEM251, TMEM256, TMEM258, TMEM259, TMEM30A, TMEM33, TMEM39A, TMEM41A, TMEM41B, TMEM42, TMEM5, TMEM50A, TMEM50B, TMEM55B, TMEM57, TMEM59, TMEM60, TMEM62, TMEM63B, TMEM64, TMEM66, TMEM69, TMEM70, TMEM81, TMEM87A, TMEM9, TMEM9B, TMF1, TMLHE, TMPO, TMUB1, TMUB2, TMX1, TMX2, TMX4, TNFAIP1, TNFAIP8L2-SCNM1, TNIP1, TNKS2, TNPO1, TNPO3, TNRC6A, TOB1, TOLLIP, TOMM20, TOMM22, TOMM40, TOMM5, TOMM6, TOMM7, TOMM70A, T0P1, TOP2B, TOPORS, TOR1A, TOR1AIP2, TOR1B, TOR3A, TOX4, TP53RK, TPCN1, TPD52L2, TPGS1, TPI1, TPP2, TPRA1, TPRG1L, TPRKB, TPRN, TPST2, TRA2A, TRA2B, TRAF6, TRAF7, TRAP1, TRAPPC1, TRAPPC10, TRAPPC11, TRAPPC12, TRAPPC13, TRAPPC2L, TRAPPC3, TRAPPC4, TRAPPC5, TRAPPC6B, TRAPPC8, TRAPPC9, TRIAP1, TRIM26, TRIM27, TRIM28, TRIM3, TRIM39, TRIM39-RPP21, TRIM41, TRIM44, TRIM56, TRIM65, TRIM8, TRIP12, TRIP4, TRMT1, TRMT10C, TRMT112, TRMT12, TRMT1L, TRMT2A, TRNAU1AP, TRNT1, TRPC4AP, TRPT1, TRUB2, TSC2, TSEN15, TSEN34, TSFM, TSG101, TSN, TSNAX, TSPAN17, TSPAN31, TSPYL1, TSR1, TSR2, TSR3, TSSC4, TSTA3, TSTD2, TTC1, TTC17, TTC19, TTC32, TTC33, TTC37, TTC4, TTC7B, TTC9C, TTI1, TTI2, TUBA1B, TUBA1C, TUBB, TUBD1, TUBGCP2, TUBGCP4, TUFM, TUSC2, TUT1, TVP23B, TXLNA, TXLNG, TXN2, TXNDC11, TXNDC12, TXNDC15, TXNDC17, TXNDC9, TXNL1, TXNL4A, TXNL4B, TXNRD1, TYK2, TYW1, U2AF1, U2AF1L4, U2AF2, UAP1, UBA1, UBA2, UBA3, UBA5, UBA52, UBAC2, UBALD1, UBAP1, UBAP2L, UBB, UBC, UBE2A, UBE2B, UBE2D2, UBE2D3, UBE2D4, UBE2E1, UBE2E2, UBE2E3, UBE2F, UBE2G2, UBE2H, UBE2I, UBE2J1, UBE2J2, UBE2K, UBE2L3, UBE2M, UBE2N, UBE2NL, UBE2Q1, UBE2R2, UBE2V1, UBE2V2, UBE2W, UBE2Z, UBE3A, UBE3B, UBE3C, UBE4A, UBE4B, UBFD1, UBIAD1, UBL3, UBL4A, UBL5, UBL7, UBOX5, UBP1, UBQLN1, UBQLN2, UBQLN4, UBR2, UBR7, UBTD1, UBTF, UBXN2A, UBXN4, UBXN6, UCHL3, UCHL5, UCK1, UCK2, UCKL1, UEVLD, UFC1, UFD1L, UFL1, UFSP2, UGP2, UHRF1BP1L, ULK1, ULK3, UNC50, UNG, UPF1, UPF2, UPF3B, UPRT, UQCC, UQCR10, UQCR11, UQCRB, UQCRC1, UQCRC2, UQCRHL, UQCRQ, URGCP, URIl, URM1, UROD, UROS, USB1, USE1, USF1, USF2, USP10, USP14, USP16, USP19, USP22, USP25, USP27X, USP33, USP38, USP39, USP4, USP47, USP5, USP7, USP8, USP9X, UTP11L, UTP14A, UTP14C, UTP15, UTP23, UTP3, UTP6, UXS1, UXT, VAC14, VAMP3, VAMP5, VAPA, VAPB, VARS2, VBP1, VCP, VDAC3, VEZT, VIMP, VMA21, VPS16, VPS18, VPS25, VPS26A, VPS26B, VPS28, VPS29, VPS33A, VPS36, VPS37A, VPS4A, VPS51, VPS52, VPS53, VPS72, VRK2, VRK3, VTA1, VTI1A, VTI1B, WAC, WAPAL, WARS2, WBP11, WBP1L, WBP2, WBP4, WBSCR22, WDR1, WDR12, WDR13, WDR18, WDR20, WDR24, WDR25, WDR26, WDR3, WDR33, WDR36, WDR41, WDR43, WDR44, WDR45, WDR45B, WDR46, WDR55, WDR59, WDR5B, WDR6, WDR61, WDR70, WDR73, WDR74, WDR75, WDR77, WDR81, WDR83OS, WDR85, WDR89, WDTC1, WIBG, WIPI2, WIZ, WRAP53, WRB, WRNIP1, WSB2, WTAP, WTH3DI, WWP1, WWP2, XIAP, XPA, XPC, XPNPEP1, XPO1, XPO7, XPOT, XRCC5, XRCC6, XYLT2, YAF2, YARS, YARS2, YIF1A, YIF1B, YIPF1, YIPF3, YIPF4, YIPF5, YIPF6, YKT6, YME1L1, YPEL2, YRDC, YTHDC1, YTHDF1, YTHDF2, YTHDF3, YWHAB, YWHAE, YY1, YY1AP1, ZADH2, ZBED4, ZBED6, ZBTB1, ZBTB10, ZBTB11, ZBTB14, ZBTB17, ZBTB18, ZBTB21, ZBTB25, ZBTB33, ZBTB39, ZBTB44, ZBTB45, ZBTB5, ZBTB6, ZBTB7A, ZBTB8OS, ZC3H10, ZC3H11A, ZC3H13, ZC3H15, ZC3H18, ZC3H3, ZC3H7A, ZC3H7B, ZCCHC10, ZCCHC11, ZCCHC3, ZCCHC7, ZCCHC9, ZCRB1, ZDHHC14, ZDHHC16, ZDHHC2, ZDHHC3, ZDHHC4, ZDHHC5, ZDHHC8, ZFAND1, ZFAND2B, ZFAND3, ZFAND5, ZFAND6, ZFP91, ZFPL1, ZFR, ZFYVE1, ZFYVE19, ZFYVE27, ZGPAT, ZHX1, ZHX1-C8ORF76, ZHX2, ZHX3, ZKSCAN1, ZMAT2, ZMAT3, ZMAT5, ZMPSTE24, ZMYM2, ZMYND11, ZNF121, ZNF131, ZNF134, ZNF138, ZNF142, ZNF143, ZNF146, ZNF174, ZNF181, ZNF189, ZNF195, ZNF197, ZNF207, ZNF22, ZNF226, ZNF232, ZNF24, ZNF259, ZNF274, ZNF277, ZNF280D, ZNF281, ZNF3, ZNF32, ZNF322, ZNF326, ZNF330, ZNF335, ZNF33A, ZNF343, ZNF347, ZNF37A, ZNF384, ZNF394, ZNF397, ZNF398, ZNF408, ZNF41, ZNF410, ZNF414, ZNF419, ZNF438, ZNF444, ZNF446, ZNF48, ZNF480, ZNF491, ZNF506, ZNF507, ZNF513, ZNF518A, ZNF526, ZNF561, ZNF574, ZNF576, ZNF579, ZNF580, ZNF592, ZNF593, ZNF598, ZNF620, ZNF622, ZNF623, ZNF638, ZNF639, ZNF641, ZNF644, ZNF649, ZNF654, ZNF655, ZNF664, ZNF668, ZNF672, ZNF687, ZNF688, ZNF691, ZNF7, ZNF706, ZNF721, ZNF740, ZNF76, ZNF764, ZNF770, ZNF777, ZNF787, ZNF805, ZNF814, ZNF830, ZNF865, ZNF91, ZNHIT1, ZNHIT3, ZNRD1, ZRANB1, ZRANB2, ZSCAN21, ZSCAN29, ZSCAN32, ZSWIM1, ZSWIM7, ZSWIM8, ZW10, ZXDA, ZXDB y ZZZ3.
Preferentemente, el al menos un gen de referencia es uno o más de GAPDH, GUSB, HPRT1 y TBP. Más preferentemente, el al menos un gen de referencia incluye al menos cada uno de GAPDH, GUSB, HPRT1 y TBP.
La presente divulgación también describe kits útiles para determinar la expresión génica de una muestra de cáncer de mama y/o proporcionar información pronóstica para identificar el riesgo de reaparición. Estos kits comprenden un conjunto de sondas y/o cebadores específicos para los 3, 5, 9, 16 o 20 genes enumerados en la Tabla 7 o Tabla 9. El kit puede comprender además un medio legible por ordenador.
Las sondas de captura se pueden inmovilizar sobre una matriz. Por "matriz" está previsto un soporte sólido o un sustrato con péptido o sondas de ácido nucleico unidas al soporte o sustrato. Las matrices comprenden normalmente una pluralidad de sondas de captura diferentes que se acoplan a una superficie de un sustrato en diferentes localizaciones conocidas. Las matrices de la divulgación comprenden un sustrato que tiene una pluralidad de sondas de captura que se pueden unir específicamente a un producto de expresión génica intrínseco. El número de sondas de captura sobre el sustrato varía en función de la finalidad de la matriz. Las matrices pueden ser matrices de baja densidad o matrices de alta densidad y pueden contener 4 o más, 8 o más, 12 o más, 16 o más, 32 o más direcciones, pero comprenderán mínimamente sondas para los 3, 5, 9, 16 o 20 genes enumerados en la Tabla 7 o Tabla 9.
Las técnicas para la síntesis de estas matrices usando métodos de síntesis mecánicos se describen en, por ejemplo, la patente de EE. UU. N.° 5.384.261. La matriz se puede fabricar sobre una superficie de prácticamente cualquier forma o incluso una multiplicidad de superficies. Las matrices pueden ser sondas (por ejemplo, sondas que se unen a ácido nucleico) sobre perlas, geles, superficies poliméricas, fibras tales como fibra óptica, vidrio o cualquier otro sustrato apropiado, véanse las patentes de EE. UU. N° 5.770.358, 5.789.162, 5.708.153, 6.040.193 y 5.800.992. Las matrices se pueden envasar de tal manera que se permita el diagnóstico u otra manipulación en el dispositivo. Véanse, por ejemplo, las patentes de EE. UU. N° 5.856.174 y 5.922.591.
El kit puede comprender un conjunto de cebadores de oligonucleótidos suficiente para la detección y/o la cuantificación de cada uno de los 3, 5, 9, 16 o 20 genes enumerados en la Tabla 7 o Tabla 9. Los cebadores de oligonucleótidos se pueden proporcionar en una forma liofilizada o reconstituida, o se pueden proporcionar como un conjunto de secuencias de nucleótidos. Los cebadores se pueden proporcionar en un formato de microplaca, donde cada conjunto de cebadores ocupa un pocillo (o múltiples pocillos, como en el caso de duplicados) en la microplaca. La microplaca puede comprender además cebadores suficientes para la detección de uno o más genes de mantenimiento como se trata más adelante. El kit puede comprender además reactivos e instrucciones suficientes para la amplificación de productos de expresión de los 3, 5, 9, 16 o 20 genes enumerados en la Tabla 7 o Tabla 9.
Para facilitar el acceso inmediato, por ejemplo, para la comparación, revisión, recuperación y/o modificación, las expresiones génicas se registran normalmente en una base de datos. Lo más normalmente, la base de datos es una base de datos relacional accesible por un dispositivo informático, aunque se pueden usar otros formatos, por ejemplo, archivos indexados accesibles manualmente de perfiles de expresión como fotografías, lecturas de obtención de imágenes analógicas o digitales, hojas de cálculo, etc. Independientemente de si los patrones de expresión inicialmente registrados son de naturaleza analógica o digital, los patrones de expresión, perfiles de expresión (patrones de expresión en conjunto) y distintivos moleculares (patrones de expresión correlacionados) se almacenan digitalmente y se accede a ellos por una base de datos. Normalmente, la base de datos se compila y se mantiene en una instalación central, estando el acceso disponible localmente y/o remotamente.
Los métodos descritos en el presente documento se pueden implementar y/o los resultados registrar usando cualquier dispositivo capaz de implementar los métodos y/o de registrar los resultados. Los ejemplos de dispositivos que se pueden usar incluyen, pero no se limitan a, dispositivos informáticos electrónicos, que incluyen ordenadores de todos los tipos. Cuando los métodos descritos en el presente documento se implementan y/o registran en un ordenador, el programa informático que se puede usar para configurar el ordenador para llevar a cabo las etapas de los métodos puede estar contenido en cualquier medio legible por ordenador capaz de de contener el programa informático. Los ejemplos de medio legible por ordenador que se pueden usar incluyen, pero no se limitan a, disquetes, CD- ROM, DVD, ROM, RAM, y otra memoria y dispositivos de almacenamiento informático. El programa informático que se puede usar para configurar el ordenador para llevar a cabo las etapas de los métodos y/o registrar los resultados también se puede proporcionar mediante una red electrónica, por ejemplo, mediante internet, una intranet, u otra red.
En el presente documento también se desvela proporcionar a un sujeto en necesidad un tratamiento para el cáncer de mama. El tratamiento para el cáncer de mama puede incluir uno o más agentes antineoplásicos o quimioterapéuticos. Las clases de agentes antineoplásicos o quimioterapéuticos pueden incluir antraciclinas, agentes alquilantes, análogos de nucleósidos, agentes de platino, agentes de la vinca, fármacos antiestrogénicos, inhibidores de la aromatasa, agentes de supresión ovárica, agentes endocrinos/hormonales, agentes para terapia con bisfosfonato y agentes para terapia biológica dirigida (por ejemplo, anticuerpos). Los agentes antineoplásicos o quimioterapéuticos específicos incluyen ciclofosfamida, fluorouracilo (o 5-fluorouracilo o 5-FU), metotrexato, tiotepa, carboplatino, cisplatino, gemcitabina, antraciclina, taxanos, paclitaxel, paclitaxel unido a proteína, doxorubicina, docetaxel, vinorelbina, tamoxifeno, raloxifeno, toremifeno, fulvestrant, irinotecán, ixabepilona, temozolmida, topotecán, vincristina, vinblastina, eribulina, mutamicina, capecitabina, capecitabina, anastrozol, exemestano, letrozol, leuprolida, abarelix, buserlina, goserelina, acetato de megestrol, risedronato, pamidronato, ibandronato, alendronato, denosumab, zoledronato, trastuzumab, tykerb o bevacizumab, o combinaciones de los mismos.
El tratamiento puede incluir radioterapia. Preferentemente, el tratamiento que incluye radiación también incluye ciclofosfamida, fluorouracilo (o 5-fluorouracilo o 5-FU), metotrexato, o combinaciones de los mismos. Una de dichas combinaciones es CMF, que incluye ciclofosfamida, metotrexato y fluorouracilo; otra de dicha combinación es AC que incluye doxorubicina y ciclofosfamida.
El tratamiento puede incluir una intervención quirúrgica.
Un tratamiento contra el cáncer "más agresivo" puede comprender una mayor dosis de un agente antineoplásico o quimioterapéutico. Un tratamiento contra el cáncer "más agresivo" puede comprender la administración más frecuente de un agente antineoplásico o quimioterapéutico. Un tratamiento contra el cáncer "más agresivo" puede comprender un agente antineoplásico o quimioterapéutico más potente. Un tratamiento contra el cáncer "más agresivo" puede comprender una pluralidad de agentes antineoplásicos o quimioterapéuticos. Un tratamiento contra el cáncer "más agresivo" puede combinar una pluralidad de modalidades de tratamiento, por ejemplo, agentes antineoplásicos o quimioterapéuticos junto con intervención quirúrgica, agentes antineoplásicos o quimioterapéuticos junto con radiación, radiación junto con intervención quirúrgica, y agentes antineoplásicos o quimioterapéuticos, intervención quirúrgica y radiación. Cualquiera de los tratamientos contra el cáncer "más agresivos" anteriormente mencionados se puede combinar con cualquier otro tratamiento contra el cáncer "más agresivo" anteriormente mencionado o con otros tratamientos contra el cáncer conocidos en la técnica.
A menos que se defina de otro modo, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que comúnmente es entendido por un experto habitual en la técnica a la que pertenece la presente invención.
Como se usa en el presente documento, las formas en singular de una palabra también incluyen la forma en plural de la palabra, a menos que el contexto dicte claramente de otro modo; como ejemplos, se entiende que los términos "un", "una", "el" y "la" son en singular o plural y se entiende que el término "o" es incluyente. A modo de ejemplo, "un elemento" significa uno o más elementos.
Se entiende que los términos "uno o más", "al menos uno" y similares incluyen, pero no se limitan a, al menos 1,2, 3,
4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 1920, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36,
37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61,62, 63, 64, 65, 66, 67,
68, 69, 70, 71,72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91,92, 93, 94, 95, 96, 9 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122,
123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145,
146, 147, 148, 149 o 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000 o más y cualquier número intermedio.
Los términos "pluralidad", "al menos dos", "dos o más", "al menos un segundo", y similares, se entiende que incluyen, pero no se limitan a, al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 1920, 21,22, 23, 24, 25, 26, 27,
28, 29, 30, 31,32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49, 50, 51,52, 53, 54, 55, 56, 5 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71,72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 8 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115,
116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138,
139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149 o 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000 o más y cualquier número intermedio.
En toda la memoria descriptiva, se entenderá que la palabra "que comprende", o variaciones tales como "comprende" o "que comprende", implica la inclusión de un elemento establecido, número entero o etapa, o grupo de elementos, números enteros o etapas, pero no la exclusión de ningún otro elemento, número entero o etapa, o grupo de elementos, números enteros o etapas.
Aproximadamente se puede entender como dentro del 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4 %, 3 %, 2 %, 1 %, 0,5 %,
0,1 %, 0,05 % o 0,01 % del valor establecido. A menos que el contexto indique claramente lo contrario, todos los valores numéricos en el presente documento se proporcionan modificados por el término "aproximadamente".
Aunque en la práctica o en las pruebas de la presente invención se pueden usar métodos y materiales similares o equivalentes a los descritos en el presente documento, a continuación se describen métodos y materiales adecuados.
No se admite que las referencias citadas en el presente documento sean el estado de la técnica de la invención reivindicada. En caso de conflicto, prevalecerá la presente memoria descriptiva, que incluye definiciones. Además, los materiales, métodos y ejemplos son solo ilustrativos y no pretenden ser limitativos.
Cualquiera de los aspectos anteriores y realizaciones se puede combinar con cualquier otro aspecto o realización como se desvela en el presente documento en las secciones de Sumario y/o de Descripción detallada, que incluye los siguientes Ejemplos.
EJEMPLOS
EJEMPLO 1: DERIVACIÓN DE STEMPRINTER20, LA PUNTUACIÓN DE RIESGO BASADA EN EL CONJUNTO COMPLETO DE 20 GENES DE CÉLULAS MADRE.
1.1 INTRODUCCIÓN
Con el objetivo de desarrollar una herramienta clínica de pronóstico más refinado para la evaluación del riesgo de reaparición a distancia en pacientes con cáncer de mama ER+/HER2-, se desarrolló un ensayo multigénico por reacción en cadena de la polimerasa cuantitativa en tiempo real (RT-qPCR), denominado StemPrintER20, que se basa en la expresión de veinte biomarcadores específicos de células madre (SC) de mama. Se dedujo que dada la función clave de las células madre de cáncer (CSC) en la tumorigénesis y la progresión del cáncer de mama, los biomarcadores específicos de SC mamarias podrían ser particularmente informativos en términos de la predicción de los riesgos de reaparición.
Para identificar biomarcadores específicos de SC, se realizó un perfilado transcripcional global de células madre mamarias normales (MaSC) humanas, que produjo un distintivo que comprendió 2.306 conjuntos de sondas Affymetrix, que es predictivo de las características biológicas, moleculares y patológicas de los cánceres de mama humanos. El uso de un enfoque bioinformático permitió la destilación de un "distintivo de rigor" refinado del perfil de MaSC original. Brevemente, se analizó la expresión de conjuntos de sondas regulada por incremento en el perfil de MaSC en el conjunto de datos público de la expresión génica de cáncer de mama informado por Ivshina et al. Se identificó que un grupo de 329 conjuntos de sondas reguladas por incremento que distinguió claramente entre cánceres de mama de "tipo SC", caracterizados por un desenlace clínico negativo, y cánceres de mama "no de tipo SC" que presentan un pronóstico más favorable [HR = 2,30 (1,50-3,59), P<0,0001]. La potencia pronóstica de estos 329 conjuntos de sondas se confirmó en un conjunto de datos de cáncer de mama independiente [Pawitan et al. HR =
3,69, (1,89-7,72), P<0,0001].
Hacia el desarrollo de una herramienta genómica que se pudiera incorporar en la práctica clínica, el tamaño del distintivo de 329 genes se redujo aún más seleccionando los 20 genes que fueron los genes más altamente y diferencialmente expresados en los cánceres de mama de mal pronóstico de "tipo SC" del conjunto de datos de Ivshina. En particular, el distintivo "restringido" de 20 genes fue tan poderoso como el distintivo de 329 genes en predecir que los pacientes estaban en un riesgo alto de desarrollar metástasis distales en el conjunto de datos de Ivshina etal. [HR = 2,82, (1,80-4,56), P<0,0001]. Además, en tres conjuntos de datos independientes (Pawitan, y KI y GUYT de Loi), se observó que 20 genes de SC se expresaron en exceso en tumores con malos desenlaces clínicos (Figura 1 A). Finalmente, la potencia pronóstica del distintivo de 20 genes se comparó con la de los distintivos de cáncer de mama publicados usando el conjunto de datos TRANSBIG, que se ha usado como una referencia para el análisis comparativo de la validez clínica de muchos perfiles de pronóstico recientemente publicados. Solo 15 de los 20 genes estuvieron presentes en los chips Affymetrix usados en el estudio TRANSBIG, sin embargo, el patrón de expresión de estos 15 genes solo fue tan poderoso como otros distintivos de pronóstico disponibles en la predicción del riesgo de reaparición (todo el periodo de seguimiento del paciente, >20 años) tanto en los análisis univariantes como en los multivariantes (Figura 1B).
1.2 MÉTODOS
1.2.1 Población del estudio
Se recogió sistemáticamente toda la información sobre pacientes con cáncer de mama consecutivos operados en el Instituto Europeo de Oncología (Istituto Europeo di Oncologia: IEO) en Milán, Italia, en un base de datos dedicada y se extrajeron los datos del periodo 1997 a 2000. Se identificaron 1.827 pacientes con cáncer de mama ER+/HER2-que se operaron durante este periodo. Estuvieron disponibles los datos referentes a la edad, fecha en el momento de la cirugía, características del tumor (por ejemplo, tipo histológico, tamaño del tumor (pT), participación ganglionar (pN), malignidad del tumor, infiltración perivascular, estado Ki-67, estado de receptores estrogénicos (ER) y estado de receptores de progesterona (PgR)), y modalidad de tratamiento (por ejemplo, tipo de cirugía, radioterapia complementaria, terapia endocrina y quimioterapia).
La cohorte de 1.827 pacientes se dividió aleatoriamente en un tercio como el conjunto de entrenamiento (N=609) y dos tercios como el conjunto de validación (N=1.218). Los dos conjuntos se equilibraron para edad y características del tumor (Tabla 1). Se usó el conjunto de entrenamiento para desarrollar el algoritmo StemPrintER20 mediante el modelado de Cox penalizado, que considera metástasis a distancia como acontecimientos. Los acontecimientos de metástasis a distancia se definieron como el tiempo desde la cirugía hasta la aparición de una metástasis a distancia o muerte por cáncer de mama como primer acontecimiento.
Tabla 1. Características clinicopatológicas de pacientes ER+/HER2-incluidos en los conjuntos de entrenamiento y de validación.
Figure imgf000017_0001
Figure imgf000018_0001
1.2.2 Preparación de muestras y análisis
Extracción de ARN y PCR cuantitativa en tiempo real
Para el análisis por PCR, se evaluaron 1.827 bloques de tejido incorporado en parafina y fijado en formol (FFPE) como adecuados para la extracción de ARN. Se tomó un núcleo de tejido de 1,5 mm de diámetro o al menos dos secciones de tejido de 10 pm de espesor (según el tamaño del tumor) de cada bloque de tejido de un área tumoral representativa con celularidad tumoral adecuada (>60 %), como seleccionó un anatomopatólogo.
Se extrajo ARN total de las muestras de tejido de FFPE usando el kit AllPrep DNA/RNA FFPE automatizado en QIAcube siguiendo las instrucciones del fabricante (Qiagen, Hilden, Alemania). Para el análisis de ARNm, se retrotranscribieron 250 ng de ARN total (concentración de ARN medida usando el espectrofotómetro NanoDrop® ND 1000) con cebadores aleatorios usando el kit de síntesis SuperScript® VILO™ cDNA (Thermo Fisher Scientific). Para optimizar el análisis de expresión de RT-qPCR de los 20 genes del distintivo de cantidades limitadas de ARN degradado de tejidos de FFPE, se seleccionaron sondas que se dirigieron a regiones cortas (<100 pb de tamaño) del transcrito para aumentar la probabilidad de detección. También se implementó un método de pre-amplificación múltiple para el fin doble de estirar la preciosa muestra en más reacciones de qPCR y de mejorar la relación entre la señal y el ruido para la detección de los transcritos de abundancia baja-moderada. Por lo tanto, después de la transcripción inversa, se preamplificó el ADNc con el kit PreAMP Master Mix (Thermo Scientific) durante 10 ciclos, siguiendo las instrucciones del fabricante, y se diluyó 1:25 antes del análisis por PCR (entonces se usaron 5 pl por reacción de PCR, correspondiente a 1 ng de ADNc).
Se realizó la PCR cuantitativa con sondas de hidrólisis (ThermoFisher Scientific) usando SsoAdvanced Universal Probes Supermix (Bio-Rad Laboratories) en 10 pl de volumen final en placas de 384 pocillos. La reacción de PCR se realizó en instrumentos de PCR en tiempo real LightCycler (LC) 480 (Roche) usando las siguientes condiciones de ciclado térmico: 1 ciclo a 95 °C durante 30 s, 45 ciclos a 95 °C durante 5 s y 60 °C durante 30 s.
Se seleccionaron ensayos de expresión génica TaqMan® basándose en el tamaño de amplicón (<100 pb), y en su capacidad para detectar el identificador Ref Seq en el metanálisis de Affymetrix y tantas isoformas como fuera posible. Se diseñaron los ensayos TaqMan® personalizados (enumerados en la Tabla 2), cuando fuera posible, en la región 3' del gen usando el software Primer Express V3.0 (ThermoFisher Scientific). Los ensayos de TaqMan® usados para las reacciones de PCR se resumen en la Tabla 2.
Tabla 2. Detalles del diseño para cada ensayo de expresión génica TaqMan® usado en el análisis de PCR
Figure imgf000020_0001
Figure imgf000021_0001
Figure imgf000022_0001
Se indican nombre del gen (Símbolo del gen), número de identificación (ID del ensayo) de cada ensayo TaqMan, número de acceso de los transcritos (RefSeq) reconocidos por el ensayo, límite de exón, localización del ensayo y longitud del amplicón. Para los ensayos personalizados TaqMan, se indican las localizaciones del inicio del nucleótidos en 5 ’ y del fin del nucleótido en 3 ’ de todo el amplicón y las secuencias de oligonucleótidos de los cebadores directos e inversos, así como las sondas FAM. Para ensayos TaqMan diseñados registrados, se informan las localizaciones correspondientes a la base nucleotídica localizada en el centro de la sonda y las secuencias de contexto del oligonucleótido de sondas FAM liberadas por el vendedor.
Para el análisis de RT-qPCR, se usaron métodos convencionales para la minería de datos de RT-qPCR y las recomendaciones de los fabricantes para el control de calidad y el rechazo de muestras. Brevemente, Cq=35 se definió como el límite de detección. Por lo tanto, los valores de Cq más allá de este límite se establecieron en 35 y se omitió la normalización. Cada diana se ensayó por triplicado y se calcularon valores de Cq promedio (Cq AVG) ya fuera a partir de valores triplicados, cuando la desviación estándar fue <0,4, o a partir de los mejores valores duplicados, cuando la desviación estándar fue >0,4. Los datos (Cq AVG) se normalizaron usando cuatro genes de referencia (HPRT1, GAPDH, GUSB y TBP) para compensar posibles variaciones en la expresión de genes de referencia individuales y en integridad de ARN debido a la fijación de tejido. Se calculó el Cq normalizado (Cqnormalizado) de cada gen diana usando la siguiente fórmula:
Cqnormalizado = Cq AVG - SF
donde: SF es la diferencia entre el valor de Cq AVG de los genes de referencia para cada paciente y un valor de referencia K constante; K representa la media del Cq AVG de los cuatro genes de referencia calculado en todas las muestras (K= 25,012586069). Esta estrategia de normalización permitió la retención de información sobre la abundancia del transcrito original, como se mide por PCR (es decir, en la escala de Cq), que en cambio se pierde cuando se usa el método de ACq más clásico. Entonces se procesaron los datos normalizados para análisis estadístico. Basándose en la distribución de los genes de referencia, se aplicó la regla intercuartílica de Tukey para valores atípicos para identificar datos de RT-qPCR de mala calidad. Basándose en esta regla, no se excluyeron muestras.
1.2.3 Desarrollo del algoritmo StemPrintER20
Se implementó el modelo de regresión de Cox penalizado por Ridge en el conjunto de entrenamiento considerando la expresión génica normalizada de los 20 genes como covariables continuas con efecto lineal logarítmico. Se aplicó la probabilidad logarítmica validada de forma cruzada (10 veces) (CVL) con optimización del parámetro de penalización por ajuste. El ajuste del parámetro de penalización se repitió 500 veces usando un plegamiento diferente en cada simulación y se seleccionó el modelo asociado a la mayor CVL (Tabla 3).
Tabla 3. Desarrollo del algoritmo StemPrintER20.
Figure imgf000023_0001
Se asignó una puntuación de riesgo continua a cada paciente basándose en la siguiente fórmula:
Puntuación de riesgo = £ ¡ (P¡ * Cqnormalizado)
donde: i es el índice de suma para los 20 genes diana; es el coeficiente del modelo de Cox con penalización de Ridge para cada gen diana; Cqnormalizado es el Cq promedio normalizado para cada gen diana. Se usaron puntuaciones mínimas y máximas de riesgo del conjunto de entrenamiento para cambiar de escala las puntuaciones de riesgo en un intervalo de 0 - 1. La mediana de la puntuación de riesgo continua del conjunto de entrenamiento se usó para identificar dos clases de riesgo (bajo y alto). Se usaron los centiles 33 y 66 para identificar tres clases de riesgo (bajo, intermedio, alto: Tabla 3). Se calculó el índice C como una medida de discriminación del modelo, que representa la probabilidad de concordancia entre respuestas predichas y observadas.
1.2.4 Análisis de sensibilidad del algoritmo StemPrintER20
Se realizó un análisis de sensibilidad del algoritmo de pronóstico considerando diferentes escenarios basándose en nueve conjuntos de entrenamiento diferentes. En concreto, se consideraron tres formas diferentes de dividir la cohorte para obtener el conjunto de entrenamiento, basándose en una división de un tercio (N=609), la mitad (N=914) o dos tercios (N=1.218). Para cada división, se realizaron tres selecciones aleatorias diferentes de pacientes. Se implementó el modelo de progresión de Cox penalizado por Ridge en cada conjunto de entrenamiento adicional con el mismo método aplicado a la cohorte de entrenamiento usada para el desarrollo del algoritmo de pronóstico. El ajuste del parámetro de penalización se repitió 500 veces usando un plegamiento diferente en cada simulación. Se obtuvo un total de 4.500 modelos adicionales del análisis de sensibilidad. Se calculó el índice C para cada uno de los 4.500 modelos adicionales y se comparó con los 500 modelos obtenidos en la cohorte de entrenamiento usada para el desarrollo del algoritmo StemPrintER20 (Tabla 4 y Figura 2).
Tabla 4. Índice C de los datos de sensibilidad.
Figure imgf000024_0001
1.3 RESULTADOS
Se asignó una puntuación de riesgo continua a cada paciente del conjunto de entrenamiento basándose en el algoritmo StemPrintER20. Se obtuvo un índice C 0,70 (0,65-0,75). Los valores mínimo y máximo del índice C obtenido de los 5.000 modelos evaluados en el análisis de sensibilidad fueron 0,69 (0,65-0,74) y 0,74 (0,70-0,78), respectivamente (Tabla 4). Basándose en los resultados del análisis de sensibilidad, se aplicó el algoritmo StemPrintER20 para estimar los cocientes de riesgos instantáneos (HR) en bruto y ajustados para la clasificación de grupos de riesgo en tanto los conjuntos de entrenamiento como de validación.
En el conjunto de entrenamiento, con el modelo de riesgo de 2 clases, se obtuvo HR para el grupo de riesgo alto (HRAlto) = 4,2 (2,6-7,1), p<0,0001, con respecto al grupo de riesgo bajo, mientras que con el modelo de riesgo de 3 clases se obtuvo un HRAlto = 5,0 (2,7-9,4), p<0,0001, y un HR para el grupo de riesgo intermedio (HR int.) = 2,2 (1,1­ 4,4), p=0,0277, con respecto al grupo de riesgo bajo (Figura 3). En el conjunto de validación, en un análisis mutivariante (ajustado para pT, pN, malignidad del tumor, Ki-67 y edad), se observó que ambos modelos de riesgo eran predictivos del pronóstico con respecto a durante todo el periodo de seguimiento. Con el modelo de riesgo de 2 clases, se obtuvo un HRAlto frente a Bajo = 1,9 (1,3-2,7), p=0,0019, mientras que con el modelo de riesgo de 3 clases se obtuvo un HRAlto frente a Bajo = 2,1 (1,3-3,6), p=0,0042 (Figuras 4 y 5).
También se determinó la capacidad de los modelos de riesgo de 2 y 3 clases para predecir la reaparición temprana (<5 años desde la cirugía) y tardía (5 - 10 años después de la cirugía) en el conjunto de validación. En un análisis multivariante (ajustado para pT, pN, malignidad del tumor, Ki-67 y edad), se demostró que tanto los modelos de riesgo de 2 clases como de 3 clases fueron predictivos de la reaparición temprana y tardía (Figuras 4 y 5, Tabla 5). Además, la puntuación de riesgo continua, basada en un incremento de 10 unidades también fue predictiva de la reaparición temprana y tardía en pacientes ER+/HER2- (Tabla 5). Usando la puntuación de riesgo continua, se determinó la incidencia acumulada de acontecimientos a los 5 y a 10 años después de la cirugía para cada grupo de riesgo. En particular, se estimó que la incidencia acumulada a los 10 años era del 5,8 % y del 4,5 % en los grupos de riesgo bajo derivados de los modelos de riesgo de 2 clases y de 3 clases, respectivamente (Tabla 6).
Taba 5. Resumen del rendimiento de los modelos de riesgo StemPrintER20 de 2 clases, 3 clases y continuos (incremento de 10 unidades) en la predicción del riesgo de reaparición en los intervalos de tiempo 0-5 años y 5-10 años después de la cirugía en diferentes subgrupos de paciente del conjunto de validación ER+/HER2-
(N=1.218).
Figure imgf000025_0001
Tabla 6. Incidencia acumulada de acontecim ientos de reaparición a distancia a los 5 años y a los 10 años después de la cirugía estratificada según los modelos de riesgo de 2 clases y de 3 clases de StemPrintER20.
Figure imgf000025_0002
Finalmente, la capacidad de los modelos de riesgo de 2 clases, 3 clases y continuo para predecir el riesgo de reaparición en subgrupos de pacientes específicos: es decir, mujeres premenopáusicas y posmenopáusicas, y pacientes con ganglio linfático negativo (N0) y ganglio con linfático positivo (N+) (Tabla 5). Se observó que el algoritmo StemPrintER20 era predictivo de tanto la reaparición temprana como tardía en mujeres premenopáusicas. En mujeres posmenopáusicas, el modelo de riesgo de 2 clases fue predictivo de la reaparición temprana. En los pacientes N0, todos los modelos de riesgo fueron predictivos de la reaparición temprana, mientras que en los pacientes N+, se obtuvo una HR estadísticamente significativa con el modelo de riesgo de 2 clases para reaparición temprana, mientras que todos los modelos dieron HR estadísticamente significativas para la reaparición tardía (Tabla 5).
Juntos, estos resultados subrayan el posible valor clínico del factor pronóstico genómico de StemPrintER20 en el abordaje clínico de pacientes con cáncer de mama ER+/HER2-, ya sea como una prueba autónoma o como una prueba que se va a usar en combinación con otros factores pronósticos genómicos y/o parámetros clinicopatológicos.
EJEMPLO 2: DERIVACIÓN DE LOS MODELOS DE RIESGO STEMPRINTER3, STEMPRINTER9 Y STEMPRINTER16 DEL CONJUNTO ORIGINAL DE 20 GENES DE CÉLULA MADRE.
2.1. INTRODUCCIÓN
En análisis previos, StemPrintER5, se identificó una puntuación de riesgo basada en un grupo de 5 genes de SC que fueron capaces de resumir la potencia de pronóstico de los 20 genes de SC. Sin embargo, basándose en varios motivos resumidos en los Puntos 2A y 2B a continuación, se empleó una metodología estadística independiente, que también implica etapas adicionales de permutación (descritas con detalle en las siguientes Secciones 2.2.1 y 2.2.2) para obtener algoritmos refinados adicionales a partir del conjunto original de 20 genes de SC. Este procedimiento condujo a la identificación de tres nuevos modelos de riesgo, concretamente StemPrintER3, StemPrintER9 y StemPrintER16.
Punto 2.A
Para la generación de StemPrintER5, se usó el modelo de regresión de Cox penalizado con Ridge que considera la expresión génica normalizada de los 20 genes de SC originales como covariables continuas con efecto logarítmico lineal. Se aplicó la probabilidad logarítmica validada de forma cruzada (10 veces) (CVL) con optimización del parámetro de penalización por ajuste. El ajuste del parámetro de penalización se repitió 500 veces usando un plegamiento diferente en cada simulación. Este enfoque fue implementado en un conjunto de entrenamiento derivado de toda la cohorte de pacientes con cáncer de mama ER+/HER2- (N=1.827) usando una estrategia de división de un tercio (N=609), un procedimiento que originó un conjunto complementario de 1.218 pacientes que se usaron para la cohorte de validación. A partir de este análisis, se seleccionó StemPrintER5 como el modelo asociado a la mayor CVL. StemPrintER5 también fue el distintivo que apareció con la mayor frecuencia (36,8 %) en comparación con todos los otros modelos posibles (con una longitud variable que variaba desde 3 hasta 6 genes) que estaban presentes en las 500 simulaciones del conjunto de entrenamiento (Tabla 7).
Tabla 7. Comparación de la tasa de manifestación de todos los posibles distintivos reducidos que se pueden obtener del conjunto original de 20 genes de SC en las 500 simulaciones de un conjunto de entrenamiento diseñado con una estrategia de división de un tercio.
Figure imgf000026_0001
Sin embargo, en un análisis retrospectivo de la tasa de manifestación de todos los otros modelos, se observó un distintivo compuesto de 3 genes y que representó el 'núcleo' de todos los otros distintivos identificados en el análisis de permutación, que aparece con una frecuencia (32,4 %) próxima a la de StemPrintER5 (Tabla 7). Basándose en esta observación, se dedujo que, centrándose en el mejor candidato, más fuerte e inmediatamente evidente, es decir, StemPrintER5, se podría haber subestimado la relevancia de otras agrupaciones de genes en términos de requisito mínimo para el pronóstico óptimo.
Punto 2.B
El modelo de riesgo StemPrintER5 se desarrolló usando un conjunto de entrenamiento obtenido de una división de un tercio de toda la cohorte de cáncer de mama ER+/HER2-. Este enfoque es un procedimiento bien establecido para este tipo de estudio ya que garantiza, por una parte, un número adecuado de pacientes/acontecimientos en el conjunto de entrenamiento para el desarrollo inicial de un modelo de riesgo robusto y, por otra parte, un número suficiente de pacientes/acontecimientos para la validación independiente del rendimiento de la puntuación de riesgo, lo que evita así el ajuste excesivo en los análisis. Usando este enfoque, que fue idéntico al usado para obtener StemPrintER20 (véase la Sección 1.2.3 anterior), fue posible validar StemPrintER5 y también realizar una comparación directa de StemPrintER5 y StemPrintER20 en el mismísimo conjunto de validación de 1.218 pacientes (véase el Ejemplo 1, Secciones 1.3 y 1.4 de resultados para StemPrintER20; resultados para StemPrintER5: datos no mostrados).
A pesar de esto, se comprobó si el uso de cohortes de entrenamiento de diferentes dimensiones podría tener un efecto sobre el tamaño de grupo mínimo de genes requeridos para un pronóstico óptimo. Con esta idea en mente, independientemente de la necesidad de tener un conjunto independiente de pacientes para el análisis de validación, se usaron diferentes estrategias de división para dar conjuntos de entrenamiento de diferentes dimensiones de la cohorte completa. Para este fin, además de la estrategia de división de un tercio usada en un análisis previo, también se consideró una estrategia de división de dos tercios y una estrategia basada en toda la cohorte de 1.827 pacientes para diseñar conjuntos de entrenamiento para la obtención de un distintivo de pronóstico reducido del grupo original de 20 genes de SC (véanse las siguientes Secciones 2.2.1 y 2.2.2 para una descripción detallada de estos procedimientos). Los resultados de este nuevo enfoque (véanse las siguientes Secciones 2.3 y 2.4) muestran que el aumento en el número de pacientes usados para el entrenamiento inicial de la puntuación de riesgo influye de hecho en el tamaño del número mínimo óptimo de genes identificados por el modelo de regresión de Cox con penalización de Lasso. Una explicación biológica plausible para este fenómeno es que los tumores de mama son altamente heterogéneos, una noción que puede ser extendida a su naturaleza de rigor intrínseco y, por lo tanto, aumentar el número de tumores de mama en una cohorte dada puede requerir que más genes describan la variabilidad intertumoral de los fenotipos de rigidez. Con respecto a la traducción en la práctica, existe la posibilidad de que diferentes grupos de genes de células madre puedan estratificar mejor subconjuntos específicos de pacientes con cáncer de mama ER+/HER2- basándose en sus características de rigor intrínseco (por ejemplo, pacientes pre- frente a posmenopáusicos, o sin afectación ganglionar frente a con afectación ganglionar).
En el presente documento se describe la metodología escalonada usada para identificar tres nuevos modelos de riesgo, StemPrintER3, StemPrintER9 y StemPrintER16, que representan los modelos de riesgo "secundarios" que rinden mejor que se pueden obtener del conjunto original de los 20 genes de SC que comprenden el StemPrintER20 "original".
2.2. MÉTODOS
2.2.1. Población del estudio
La cohorte completa de pacientes con cáncer de mama ER+/HER2- se describe con detalle anteriormente en el Ejemplo 1, Sección 1.2.1.
Para la identificación de los conjuntos de entrenamiento, se usaron tres divisiones de corte diferentes, considerando pacientes de un tercio (N=609) o dos tercios (N=1.218) de pacientes, o toda la cohorte (N=1.827), como conjuntos de entrenamiento. Se realizaron tres selecciones aleatorias diferentes para cada división. Considerando todos los conjuntos de datos complementarios, este enfoque generó 15 conjuntos de entrenamiento diferentes (7 conjuntos de datos de "un tercio" diferentes, 7 conjuntos de datos de "dos tercios" diferentes más un conjunto de datos correspondiente a toda la población).
2.2.2. Procedimiento para la identificación de un distintivo reducido
Se implementó el modelo de regresión de Cox con penalización de Lasso en el conjunto de entrenamiento que consideró la expresión génica normalizada de los 20 genes como covariables continuas con efecto lineal logarítmico. Se aplicó la probabilidad logarítmica validada de forma cruzada (10 veces) (CVL) con optimización del parámetro de penalización por ajuste. El ajuste del parámetro de penalización se repitió 1.000 veces usando un plegamiento diferente en cada simulación, para un total de 15.000 simulaciones en los diferentes conjuntos de entrenamiento.
Se asignó una puntuación de riesgo continua a cada paciente basándose en la siguiente fórmula:
Puntuación de riesgo = £ ¡ (* Cqnormalizado),
donde: i es el índice de suma para los genes diana identificados; 3 es el coeficiente del modelo de Cox con penalización de Lasso para cada gen diana; Cqnormalizado es el Cq promedio normalizado para cada gen diana. El índice C se calculó como una medida de discriminación del modelo, que representa la probabilidad de concordancia entre respuestas predichas y observadas. El resultado de este proceso fue la generación de 15.000 distintivos diferentes (1.000 distintivos diferentes/conjunto de datos). En un intento por identificar el distintivo mínimo asociado a la potencia de pronóstico más fuerte en los 15 conjuntos de entrenamiento diferentes, se usó un enfoque doble:
i) un análisis comparativo del índice C asociado con cada uno de los 15.000 distintivos (Figura 6).
ii) un cuidadoso análisis de la frecuencia a la que los distintivos con longitudes variables aparecieron en las diferentes divisiones de entrenamiento (Tabla 8).
Tabla 8. Análisis de la distribución de longitudes de distintivo por tamaño del conjunto de datos.
Figure imgf000028_0001
Ningún enfoque fue capaz de identificar un distintivo reducido que fuera superior a todos los otros, como se demuestra por resultados que muestran que: i) todos los 15.000 modelos presentaron una potencia de pronóstico estadísticamente equivalente, cuando se usó un enfoque riguroso (p < 0,01) para evaluar la variaciones del índice C en todos los modelos (Figura 6); ii) no fue posible identificar un distintivo reducido con una frecuencia predominante en ninguno de los diferentes conjuntos de datos (Tabla 8). Una excepción importante fue un distintivo compuesto de 16 genes que aparecieron con una frecuencia superior al 80 % en el conjunto de entrenamiento compuesto de toda la cohorte de pacientes (Tabla 8).
Por lo tanto, se realizó un análisis de la frecuencia de manifestación de cada uno de los 20 genes de SC, considerados individualmente, en las diferentes simulaciones obtenidas para cada conjunto de datos de entrenamiento (7.000 para un tercio, 7.000 para dos tercios y 1.000 para toda la cohorte). Usando un umbral del 80 % para seleccionar el mayor grupo de genes más altamente representado en cada división, se identificó un grupo mínimo de 3 genes (TOP3) para el conjunto de entrenamientos basándose en una división de un tercio, 9 genes (TOP9) para el conjunto de entrenamientos basado en una división de dos tercios y 16 genes (TOP16) para los conjuntos de entrenamiento basados en toda la cohorte (Figura 7 , panel superior). Cuando se consideraron en conjunto, estos tres distintivos se representaron en más del 80 % de las simulaciones de sus conjuntos de datos respectivos: TOP3 en el 85,7 % de los conjuntos de datos de un tercio, TOP9 en el 84,2 % de los conjuntos de datos de dos tercios, TOP16 en el 95,2 % de las simulaciones realizadas en toda la cohorte (Figura 7 , panel inferior). Y, lo que es más importante, este análisis mostró que la longitud del distintivo reducido está muy influida por el tamaño de la cohorte usada para el análisis de entrenamiento.
2.2.3. Derivación de StemPrintER3, StemPrintER9 y StemPrintER16
TOP3, TOP9 y TOP16 representaron el punto de partida para la derivación de StemPrintER3, StemPrintER9 y StemPrintER16, es decir, las puntuaciones de riesgo asociadas a estos tres distintivos diferentes. Usando un enfoque idéntico a la derivación de StemPrintER20 (véase anteriormente la Sección 1.2.3), se implementó el modelo de regresión de Cox con penalización de Ridge en cada uno de los diferentes conjuntos de entrenamiento, que consideró la expresión génica normalizada de los genes identificados (TOP3, TOP9 y TOP16) como covariables continuas con efecto lineal logarítmico. Se aplicó la probabilidad logarítmica validada de forma cruzada (10 veces) (CVL) con optimización del parámetro de penalización por ajuste. El ajuste del parámetro de penalización se repitió 500 veces usando un plegamiento diferente en cada simulación y se seleccionó el modelo asociado al mayor CVL.
Se asignó una puntuación de riesgo continua a cada paciente basándose en la siguiente fórmula:
Puntuación de riesgo = £ ¡ (* Cqnormalizado)
donde: i es el índice de suma para los genes diana identificados; /3 es el coeficiente del modelo de Cox con penalización de Ridge para cada gen diana; Cqnormaiizado es el Cq promedio normalizado para cada gen diana. Se usaron puntuaciones mínimas y máximas de riesgo del conjunto de entrenamiento para escalar el riesgo puntuaciones en un intervalo de 0 - 1. La mediana de la puntuación de riesgo continua del conjunto de entrenamiento se usó para identificar 2 clases de riesgo (bajo, alto). Se usaron los centiles 33 y 66 para identificar 3 clases de riesgo (bajo, intermedio, alto;
Tabla 9).
Tabla 9. Desarrollo de algoritmos StemPrintER3, StemPrintER9 y StemPrintER16.
Figure imgf000029_0001
Figure imgf000030_0001
2.3. RESULTADOS
Se asignó una puntuación de riesgo continua a cada paciente del conjunto de entrenamiento basándose en los algoritmos StemPrintER3, StemPrintER9 y StemPrintER16. Se aplicaron los algoritmos StemPrintER3, StemPrintER9 y StemPrintER16 para estimar los cocientes de riesgos instantáneos (HR) en bruto y ajustados para la clasificación de grupos de riesgo en el conjunto de entrenamientos. Puesto que StemPrintER16 derivó de un conjunto de entrenamiento basado en toda la cohorte, no se pudo realizar un análisis de validación con este algoritmo. Por lo tanto, solo se pudo usar StemPrintER3 y StemPrintER9, derivados respectivamente de conjuntos de datos basados en una división de un tercio y dos tercios, para los análisis de validación usando sus conjuntos de datos complementarios. Se usó la mediana de la puntuación de riesgo continuo del conjunto de entrenamiento para identificar 2 clases de riesgo (bajo, alto). Se usaron los centiles 33 y 66 para identificar 3 clases de riesgo (bajo, intermedio, alto).
En un análisis univariante con los modelos de riesgo de 2 clases, los HR para el grupo de riesgo alto, con respecto al grupo de riesgo bajo, fue 4,0 (2,4-6,6), p<0,0001 para StemPrintER3, 4,6 (3,1 -6,7), p<0,0001 para StemPrintER9 y 3,6 (2,7-4,8), p<0,0001 para StemPrintER16 (Tabla 10). Con el modelo de riesgo de 3 clases se obtuvieron los siguientes resultados (Tabla 10):
Tabla 10. Sumario del rendimiento de los modelos de riesgo StemPrintER3, StemPrintER9 y StemPrintER16 de 2 clases, 3 clases y continuo (incremento de 10 unidades) en la predicción del riesgo de reaparición en el conjunto de entrenamiento. Análisis univariante.
Figure imgf000031_0001
Finalmente, usando la puntuación de riesgo continua, se determinó la incidencia acumulada de acontecimientos a los 5 y a los 10 años después de la cirugía para cada grupo de riesgo usando el modelo de riesgo de 3 clases de StemPrintER3, StemPrintER9 y StemPrintER16. En particular, se estimó que la incidencia acumulada a los 10 años fue muy similar en los grupos de riesgo alto derivados de los modelos de riesgo de 3 clases [23,9 % (18,2-30,1) para StemPrintER3, 25,0 % (20,8-29,4) para StemPrintER9 y 24,5 % (21,1-28,1) para StemPrintER16] (Tabla 11). Se obtuvieron resultados similares, en términos de la incidencia acumulada a los 10 años, para los grupos de bajo riesgo identificados por los tres factores pronósticos diferentes [4,1 % (1,9-7,6) para StemPrintER3, 4,4 % (2,6-6,7) para StemPrintER9 y 3,9 % (2,6-5,7) para StemPrintER16] (Tabla 11). Juntos, estos resultados subrayan el posible valor clínico de estos tres factores pronósticos genómicos en el abordaje clínico de pacientes ER+/HER2-. Sin embargo, se requiere un amplio análisis comparativo en grandes cohortes clínicas para comparar el valor clínico de estos tres factores pronósticos genómicos con el de StemPrintER20.
Tabla 11. Incidencia acumulada de los acontecimientos de reaparición a distancia a los 5 años y a los 10 años después de la cirugía estratificada según los modelos de riesgo de 3 clases de StemPrintER3, StemPrintER9 y StemPrintER16.
Figure imgf000031_0002
En el conjunto de validación, en un análisis multivariante ajustado para pT, pN, malignidad del tumor, Ki-67 y edad, se observó que la puntuación de riesgo continua StemPrintER3, basada en un incremento de 10 unidades, era predictiva del pronóstico con respecto a todo el periodo de seguimiento [HR = 1,3 (1,1-1,5), p=0,0009 (Tabla 12). La puntuación de riesgo continua StemPrintER3 también fue predictiva de la reaparición temprana y tardía [HR <5 años = 1,3 (1,1­ 1,5), p=0,0022; HR 5-10 años = 1,3 (1,1-1,6), p=0,0091] (Tabla 12). Es digno de mención que el rendimiento de las puntuaciones de riesgo continuo de StemPrintER3 y StemPrintER9 fue muy similar en los análisis univariantes (Tabla 12). En los análisis multivariantes, aunque muy similares a los calculados con StemPrintER3, los HR obtenidos con la puntuación de riesgo continua StemPrintER9 para todo el seguimiento [HR = 1,2 (1,0-1,5), p=0,0896], y para el riesgo de reaparición tardío y temprano [HR<5 años = 1,3 (1,0-1,7), p=0,0591; HR 5-10 años = 1,2 (0,9-1,7), p=0,231] no fueron estadísticamente significativos (Tabla 12). Sin embargo, es probable que un cuidadoso análisis de los intervalos de confianza y valores de p asociados a los HR de la puntuación de riesgo continua de StemPrintER9 revelara que estos resultados se atribuyeron al tamaño relativamente pequeño del conjunto de datos (un tercio de toda la cohorte) disponible de la validación de StemPrintER9.
Tabla 12. Sumario del rendimiento del modelo de riesgo continuo (incremento de 10 unidades) StemPrintER3 y StemPrintER9 en la predicción del riesgo de reaparición en el conjunto de validación.
Figure imgf000032_0001
REFERENCIAS
Nadji, M., Gomez-Fernandez, C., Ganjei-Azar, P. & Morales, A. R. Immunohistochemistry of estrogen and progesterone receptors reconsidered: experience with 5,993 breast cancers. Am J Clin Pathol 123, 21-27 (2005).
Sorlie, T. et al. Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications. Proc Natl Acad Sci USA 98, 10869-10874, doi:10.1073/pnas.191367098 (2001).
Goldhirsch, A. et al. Personalizing the treatment of women with early breast cancer: highlights of the St Gallen International Expert Consensus on the Primary Therapy of Early Breast Cancer 2013. Ann Oncol 24, 2206-2223, doi:10.1093/annonc/mdt303 (2013).
Davies, C. et al. Long-term effects of continuing adjuvant tamoxifen to 10 years versus stopping at 5 years after diagnosis of oestrogen receptor-positive breast cancer: ATLAS, a randomised trial. Lancet 381, 805-816, doi:10.1016/S0140-6736(12)61963-1 (2013).
Geffen, D. B. et al. The impact of the 21-gene recurrence score assay on decision making about adjuvant chemotherapy in early-stage estrogen-receptor-positive breast cancer in an oncology practice with a unified treatment policy. Ann Oncol 22, 2381-2386, doi:10.1093/annonc/mdq769 (2011).
Katz, S. J. & Morrow, M. Addressing overtreatment in breast cancer: The doctors' dilemma. Cancer 119, 3584­ 3588, doi:10.1002/cncr.28260 (2013).
Visvader, J. E. & Lindeman, G. J. Cancer stem cells in solid tumours: accumulating evidence and unresolved questions. Nat Rev Cancer 8, 755-768, doi:10.1038/nrc2499 (2008).

Claims (14)

REIVINDICACIONES
1. Un método de predicción de un riesgo de reaparición de cáncer de mama en un sujeto que comprende las etapas de:
(a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A; y
(b) calcular una puntuación de riesgo basada en la expresión de los al menos tres genes;
en donde el sujeto es un paciente con cáncer de mama ER+/HER2-.
2. Un método de estratificación de un sujeto en un grupo de riesgo bajo o alto de reaparición de cáncer de mama que comprende las etapas de:
(a) determinar, en una muestra obtenida del sujeto, la expresión de al menos tres genes de la Tabla 3 o la Tabla 9, en donde los al menos tres genes comprenden al menos EIF4EBP1, MRPS23 y TOP2A;
(b) calcular una puntuación de riesgo basada en la expresión de los al menos tres genes; y
(c) estratificar el sujeto basándose en la puntuación de riesgo calculada;
en donde el sujeto es un paciente con cáncer de mama ER+/HER2-.
3. El método de la reivindicación 2, en donde el sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo alto y el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 2 clases como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo bajo.
4. El método de la reivindicación 2, en donde el sujeto que tiene una puntuación de riesgo superior a aproximadamente la puntuación de corte de 3 clases para el centil 66 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo alto, el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 66 y superior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo intermedio, y el sujeto que tiene una puntuación de riesgo inferior a aproximadamente la puntuación de corte de 3 clases para el centil 33 como se identifica en la Tabla 3 o la Tabla 9 se estratifica en un grupo de riesgo bajo.
5. El método de una cualquiera de las reivindicaciones 2 a 4, en donde al sujeto estratificado en un grupo de riesgo alto se le proporciona un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo bajo.
6. El método de una cualquiera de las reivindicaciones 2 a 5, en donde al sujeto estratificado en un grupo de riesgo alto se le proporciona un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo intermedio;
y/o en donde al sujeto estratificado en un grupo de riesgo intermedio se le proporciona un tratamiento para el cáncer que es más agresivo que el tratamiento para el cáncer proporcionado al sujeto estratificado en un grupo de riesgo bajo.
7. El método de una cualquiera de las reivindicaciones 1 a 6, en donde los al menos tres genes consisten en:
(a) EIF4EBP1, MRPS23 y TOP2A;
(b) APOBEC3B, CENPW, EIF4EBP1, EXOSC4, LY6E, MMP1, MRPS23, NDUFB10 y TOP2A;
(c) ALYREF, APOBEC3B, CDK1, CENPW, EIF4EBP1, EXOSC4, H2AFJ, LY6E, MIEN1, MMP1, MRPS23, NDUFB10, NOL3, RACGAP1, SFN y TOP2A; o
(d) cada gen de la Tabla 3 o la Tabla 9 y en donde cada puntuación de corte es como se identifica en la Tabla 3.
8. El método de una cualquiera de las reivindicaciones 1 a 6, en donde los al menos tres genes comprenden:
(a) al menos APOBEC3B, CENPW, EIF4EBP1, EXOSC4, LY6E, MMP1, MRPS23, NDUFB10 y TOP2A; o (b) al menos ALYREF, APOBEC3B, CDK1, CENPW, EIF4EBP1, EXOSC4, H2AFJ, LY6E, MIEN1, MMP1, MRPS23, NDUFB10, NOL3, RACGAP1, SFN y TOP2A.
9. El método de una cualquiera de las reivindicaciones 1 a 8, en donde la puntuación de riesgo se calcula según la siguiente fórmula:
Puntuación de riesgo = £¡ (P¡ * Cqnormalizado),
en donde i es el índice de suma para los al menos tres genes; p es el coeficiente del modelo de Cox con penalización de Ridge para cada uno de los al menos tres genes; y Cqnormalizado es el Cq promedio normalizado para cada uno de los al menos tres genes.
10. El método de la reivindicación 9, en donde Cqnormalizado se normaliza a la expresión de al menos un gen de referencia,
opcionalmente en donde Cqnormalizado se calcula según la siguiente fórmula:
Cqnormalizado = Cq AVG - SF
en donde SF es la diferencia entre el valor de Cq AVG de el al menos un gen de referencia para cada sujeto y un valor de referencia K constante, en donde K= 25,012586069, que representa la media de Cq AVG de el al menos un gen de referencia calculado en una pluralidad de muestras de entrenamiento.
11. El método de la reivindicación 10, en donde el al menos un gen de referencia es un gen de mantenimiento;
y/o en donde el al menos un gen de referencia se selecciona del grupo que consiste en GAPDH, GUSB, HPRT1 y TBP; o en donde el al menos un gen de referencia comprende al menos cada uno de GAPDH, GUSB, HPRT1 y TBP.
12. El método de una cualquiera de las reivindicaciones 1 a 11, en donde la expresión génica se determina usando una o más técnicas seleccionadas del grupo que consiste en análisis de polimorfismos de conformación de cadena simple, electroforesis capilar, cromatografía líquida de alta resolución desnaturalizante, tecnología de códigos de barras moleculares digitales, por ejemplo, sistema nCounter® de Nanostring, secuenciación directa, ensayos de proteína de unión a desapareamiento de ADN, hibridación dinámica específica de alelo, hibridación in situ fluorescente (FISH), matrices de SNP de oligonucleótidos de alta densidad, análisis de fusión de alta resolución, micromatriz, secuenciación de nueva generación (NGS), por ejemplo, usando el analizador del genoma Illumina, instrumento Solid de ABI, instrumento 454 de Roche, instrumento Heliscope, análisis de transferencia Northern, análisis de protección de nucleasas, ensayos de ligasa de oligonucleótidos, reacción en cadena de la polimerasa (PCR), ensayos de extensión de cebadores, análisis Quantigene, ensayo cuantitativo de protección de nucleasas (qNPA), detección de genes indicadores, ensayos (RFLP) de polimorfismo de longitud de fragmentos de restricción, reacción en cadena de la polimerasa cuantitativa con transcripción inversa en tiempo real (RT-qPCR), reacción en cadena de la polimerasa con transcripción inversa (RT-PCR), secuenciación de ARN (ARN-seq), análisis en serie de la expresión génica (SAGE), tecnología de secuenciación de ADN en tiempo real de moléculas individuales (SMRT), SNPLex, análisis de transferencia Southern, química de Sybr Green, ensayos basados en TaqMan, electroforesis en gel con gradiente de temperatura (TGGE), matriz de mosaico, análisis de transferencia Western e inmunohistoquímica.
13. El método de una cualquiera de las reivindicaciones 1 a 12, en donde la expresión génica se determina usando reacción en cadena de la polimerasa cuantitativa con transcripción inversa en tiempo real (RT-qPCR) con cebadores y/o sondas específicos para cada uno de dichos al menos tres genes, opcionalmente donde las sondas específicas para cada uno de dicho al menos tres genes es una sonda TaqMan®;
o en donde la expresión génica se determina usando análisis de micromatrices con sondas específicas para un producto de expresión de cada uno de dichos al menos tres genes.
14. El método de una cualquiera de las reivindicaciones 1 a 13, en donde la muestra es un tumor obtenido del sujeto, una célula cancerosa obtenida del sujeto, o una célula madre de cáncer obtenida del sujeto; o en donde la muestra es una estirpe celular primaria derivada de un tumor obtenido del sujeto, de una célula cancerosa obtenida del sujeto, o de una célula madre de cáncer obtenida del sujeto.
ES17732078T 2016-06-20 2017-06-19 Métodos que comprenden distintivos génicos para estratificar pacientes con cáncer de mama Active ES2891541T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16175354.6A EP3260552A1 (en) 2016-06-20 2016-06-20 Methods and kits comprising gene signatures for stratifying breast cancer patients
EP16188855.7A EP3260553A1 (en) 2016-06-20 2016-09-14 Methods and kits comprising gene signatures for stratifying breast cancer patients
PCT/EP2017/064937 WO2017220492A1 (en) 2016-06-20 2017-06-19 Methods and kits comprising gene signatures for stratifying breast cancer patients

Publications (1)

Publication Number Publication Date
ES2891541T3 true ES2891541T3 (es) 2022-01-28

Family

ID=56363702

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17732078T Active ES2891541T3 (es) 2016-06-20 2017-06-19 Métodos que comprenden distintivos génicos para estratificar pacientes con cáncer de mama

Country Status (5)

Country Link
US (3) US11441191B2 (es)
EP (3) EP3260552A1 (es)
CA (1) CA3025860A1 (es)
ES (1) ES2891541T3 (es)
WO (1) WO2017220492A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3260552A1 (en) 2016-06-20 2017-12-27 Istituto Europeo di Oncologia (IEO) Methods and kits comprising gene signatures for stratifying breast cancer patients
CN111465707A (zh) * 2017-11-17 2020-07-28 简·探针公司 用于检测C1orf43核酸的组合物和方法
CN110358826A (zh) * 2019-07-05 2019-10-22 江苏医药职业学院 检测人源全长重组蛋白1表达水平的试剂的应用和试剂盒
CN111041092A (zh) * 2019-07-08 2020-04-21 江苏医药职业学院 检测Fas相关因子家族成员2表达水平的试剂的应用和试剂盒
CN111154875A (zh) * 2020-01-16 2020-05-15 安徽省第二人民医院(安徽医学高等专科学校附属医院、安徽省职业病防治院) 一种乳腺癌基因ERBB2位点g.39711928A>G突变体及其应用
EP3907301A1 (en) * 2020-05-08 2021-11-10 Istituto Europeo di Oncologia S.r.l. Methods and kits for determining the risk of breast cancer recurrence
CN113436741B (zh) * 2021-07-16 2023-02-28 四川大学华西医院 基于组织特异增强子区域dna甲基化的肺癌复发预测方法
CN114703287B (zh) * 2022-06-06 2022-08-12 江苏省肿瘤医院 CXorf56基因在治疗三阴性乳腺癌中的应用
EP4621073A1 (en) 2024-03-22 2025-09-24 Istituto Europeo di Oncologia S.r.l. Method for prognosis of breast cancer

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4843155A (en) 1987-11-19 1989-06-27 Piotr Chomczynski Product and process for isolating RNA
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
EP0773227A1 (en) 1991-09-18 1997-05-14 Affymax Technologies N.V. Diverse collections of oligomers in use to prepare drugs, diagnostic reagents, pesticides or herbicides
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
EP0916396B1 (en) 1991-11-22 2005-04-13 Affymetrix, Inc. (a Delaware Corporation) Combinatorial strategies for polymer synthesis
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
EP0880598A4 (en) 1996-01-23 2005-02-23 Affymetrix Inc RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM
JP2001521753A (ja) 1997-10-31 2001-11-13 アフィメトリックス インコーポレイテッド 成人臓器及び胎児臓器中の発現プロフィール
US6020135A (en) 1998-03-27 2000-02-01 Affymetrix, Inc. P53-regulated genes
EP3135773A1 (en) * 2006-09-27 2017-03-01 Sividon Diagnostics GmbH Methods for breast cancer prognosis
WO2010003771A1 (en) * 2008-06-16 2010-01-14 Siemens Healthcare Diagnostics Gmbh Molecular markers for cancer prognosis
EP3260552A1 (en) 2016-06-20 2017-12-27 Istituto Europeo di Oncologia (IEO) Methods and kits comprising gene signatures for stratifying breast cancer patients

Also Published As

Publication number Publication date
EP3260552A1 (en) 2017-12-27
EP3260553A1 (en) 2017-12-27
EP3472345A1 (en) 2019-04-24
US12139766B2 (en) 2024-11-12
WO2017220492A1 (en) 2017-12-28
EP3472345B1 (en) 2021-08-11
US20250101532A1 (en) 2025-03-27
CA3025860A1 (en) 2017-12-28
US11441191B2 (en) 2022-09-13
US20190161809A1 (en) 2019-05-30
US20230151428A1 (en) 2023-05-18

Similar Documents

Publication Publication Date Title
US12139766B2 (en) Methods and kits comprising gene signatures for stratifying breast cancer patients
AU2017366813B2 (en) Methods and compositions to detect mutations in plasma using exosomal RNA and cell free DNA from non-small cell lung cancer patients
US20190093172A1 (en) Plasma-based detection of anaplastic lymphoma kinase (alk) nucleic acids and alk fusion transcripts and uses thereof in diagnosis and treatment of cancer
US20190360051A1 (en) Swarm intelligence-enhanced diagnosis and therapy selection for cancer using tumor- educated platelets
US20100009357A1 (en) Prediction of lung cancer tumor recurrence
WO2019079647A2 (en) IA STATISTICS FOR DEEP LEARNING AND PROBABILISTIC PROGRAMMING, ADVANCED, IN BIOSCIENCES
KR102080161B1 (ko) 개인 맞춤형 의료를 위한 유전자 패널, 그를 구성하는 방법, 및 그를 이용한 개인 맞춤형 치료 방법
US9970056B2 (en) Methods and kits for diagnosing, prognosing and monitoring parkinson&#39;s disease
US20230112964A1 (en) Assessment of melanoma therapy response
JP2019149987A (ja) 頭頸部扁平上皮癌に対する放射線療法の有効性を予測する方法
KR20200044677A (ko) 암 약물 반응성 판단을 위한 바이오 마커, 이를 이용한 암 약물 반응성 판단 방법 및 이를 위한 암 약물 반응성 진단칩
US20240182975A1 (en) Method for selecting normalizing genes for copy number variation detection and composition for detecting c-met copy number variation selected by method
US20230143295A1 (en) Methods and kits for determining the risk of breast cancer recurrence
US20240218457A1 (en) Method for diagnosing active tuberculosis and progression to active tuberculosis
WO2024191957A1 (en) Diagnosing and treating atopic dermatitis, psoriasis, and/or mycosis fungoides
Ma Detecting Gene Modules Differentially Expressed in Multiple Human Brain Regions