[go: up one dir, main page]

MX2012005822A - Metodos para predecir el desenlace clinico del cancer. - Google Patents

Metodos para predecir el desenlace clinico del cancer.

Info

Publication number
MX2012005822A
MX2012005822A MX2012005822A MX2012005822A MX2012005822A MX 2012005822 A MX2012005822 A MX 2012005822A MX 2012005822 A MX2012005822 A MX 2012005822A MX 2012005822 A MX2012005822 A MX 2012005822A MX 2012005822 A MX2012005822 A MX 2012005822A
Authority
MX
Mexico
Prior art keywords
expression
genes
gene
patient
prognostic
Prior art date
Application number
MX2012005822A
Other languages
English (en)
Other versions
MX337650B (es
Inventor
Joffre B Baker
Maureen T Cronin
Francois Collin
mei-lan Liu
Original Assignee
Genomic Health Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genomic Health Inc filed Critical Genomic Health Inc
Publication of MX2012005822A publication Critical patent/MX2012005822A/es
Publication of MX337650B publication Critical patent/MX337650B/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La presente invención proporciona métodos para determinar el pronóstico y el tratamiento adecuado para pacientes con diagnóstico de cáncer, basándose en los niveles de expresión de uno más biomarcadores. De manera más particular, la invención se refiere a la identificación de genes, o de conjuntos de genes, capaces de distinguir a los pacientes de cáncer de mama con buen pronóstico clínico respecto de aquellos que tienen un mal pronóstico clínico. La invención también proporciona métodos para obtener un informe genómico personalizado para un paciente de cáncer. La invención también se refiera a sistemas de computadora y software para análisis de datos utilizando los métodos de pronóstico y estadística divulgados en la presente.

Description

METODOS PARA PREDECIR EL DESENLACE CLINICO DEL CANCER Antecedentes de la Invención Los oncólogos disponen de varias opciones de tratamiento, incluidas diferentes combinaciones de regímenes terapéuticos calificados como "tratamiento de referencia" . El beneficio absoluto del tratamiento adyuvante es mayor en aquellos pacientes que presentan un mal pronóstico y esto ha resultado en la política de seleccionar únicamente a los llamados pacientes "de alto riesgo" para la quimioterapia adyuvante. Véase, por ejemplo, S. Paik, et al., J Clin Oncol . 24 (23) : 3726-34 (2006). Por consiguiente, la mayor probabilidad de obtener un buen resultado con el tratamiento requiere que se asigne a los pacientes el mejor tratamiento para el cáncer disponible y que la asignación se realice lo más rápido posible después del diagnóstico.
En nuestro sistema de salud actual abundan las ineficiencias y el desperdicio de dinero. Un ejemplo de esto es que la tasa de eficacia de muchas terapias oncológicas apenas es positiva en aproximadamente un 25% de los casos.
Muchos de los pacientes que padecen cáncer experimentan efectos secundarios tóxicos a causa de terapias costosas que pueden no funcionar. Este desequilibrio entre los altos costos del tratamiento y la baja eficacia terapéutica a menudo es consecuencia de tratar un diagnóstico específico de Ref . : 229834 una única forma en una población de pacientes diversa. Esto está comenzando a cambiar con la llegada de las herramientas de establecimiento de perfiles genéticos, prueba genómica y diagnóstico avanzado.
En particular, una vez que se diagnostica cáncer de mama a la paciente, existe una gran necesidad de contar con métodos que permitan al médico predecir el curso esperado de la enfermedad, incluida la probabilidad de reaparición del cáncer, la supervivencia a largo plazo de la paciente y similares, así como de seleccionar la opción de tratamiento más adecuada. Los factores pronóstico y de predicción aceptados en el cáncer de mama incluyen la edad, el tamaño del tumor, el estado de los ganglios linfáticos axilares, el tipo histológico del tumor, el grado patológico y el estado del receptor de hormonas . No obstante, se ha demostrado que con el diagnóstico molecular se identifican más pacientes con un riesgo bajo de cáncer de mama de las que se identificaban con los indicadores pronóstico estándar. S. Paik, The Oncologist 12 ( 6 ) : 631 - 635 (2007) .
Pese a los últimos avances, el desafío del tratamiento del cáncer de mama sigue siendo el diseño de regímenes de tratamiento específicos para tipos de tumores patógenamente diferentes y, en última instancia, la personalización del tratamiento del tumor para maximizar el resultado. La predicción precisa del pronóstico y el desenlace clínico permitiría al oncólogo adaptar la administración de la quimioterapia adyuvante de forma que las mujeres con un riesgo más alto de reaparición o con un mal pronóstico reciban un tratamiento más agresivo. Asimismo, la estratificación precisa de pacientes en virtud del riesgo adelantaría enormemente la comprensión del beneficio absoluto esperado del tratamiento, lo que aumenta las tasas de éxito de los ensayos clínicos para nuevas terapias contra el cáncer de mama .
Actualmente, la mayoría de las pruebas de diagnóstico utilizadas en la práctica clínica no son cuantitativas y se basan en la inmunohistoquímica (IHC, por sus siglas en inglés) . Este método habi tualmente proporciona diferentes resultados en diferentes laboratorios, en parte debido a que los reactivos no están estandarizados y en parte debido a que las interpretaciones son subjetivas y no pueden cuant i f i carse fácilmente. Otros diagnósticos moleculares basados en el ARN requieren tejidos recién congelados, lo que presenta un sinnúmero de desafíos, incluidas las incompatibilidades con las prácticas clínicas actuales y las regulaciones del transporte de muestras. El tejido fijado con inclusiones de parafina se encuentra más fácilmente disponible y se han establecido métodos para detectar el ARN en el tejido fijado. No obstante, estos métodos generalmente no permiten el estudio de una gran cantidad de genes (ADN o ARN) a partir de pequeñas cantidades de material. Por tanto, el tejido t radicionalmente fijado rara vez ha sido utilizado más que para la detección IHC de las proteínas.
Sumario de la Invención La presente invención proporciona un grupo de genes, cuyos niveles de expresión se asocian con un desenlace clínico particular en el cáncer. Por ejemplo, el desenlace clínico puede ser un buen o mal pronóstico suponiendo que el paciente recibe el tratamiento de referencia. El desenlace clínico puede definirse por criterios de valoración clínicos, como la supervivencia libre de enfermedad o de reaparición, la supervivencia libre de metástasis, la supervivencia global , etc .
La presente invención comprende el uso de material de biopsia archivado con inclusiones de parafina para el ensayo de todos los marcadores en el grupo y por tanto es compatible con el tipo de material de biopsia más ampliamente disponible. Asimismo, es compatible con varios métodos diferentes de cosecha de tejido tumoral, por ejemplo, mediante la biopsia del núcleo o la aspiración con aguja fina. La muestra tisular puede comprender células cancerígenas.
En un aspecto, la presente invención comprende un método para predecir el desenlace clínico de una paciente que padece cáncer, que comprende (a) obtener un nivel de expresión de un producto de expresión (por ejemplo, una transcripción de ARN) de al menos un gen pronóstico listado en las tablas 1-12 a partir de una muestra de tejido obtenida de un tumor del paciente; (b) normalizar el nivel de expresión del producto de expresión de al menos un gen pronóstico para obtener un nivel de expresión normalizado; y (c) calcular un valor de riesgo basado en el valor de expresión normalizado, donde el aumento en la expresión de los genes pronósticos en las tablas 1, 3, 5 y 7 tiene una correlación positiva con un buen pronóstico y el aumento en la expresión de los genes pronósticos en las tablas 2, 4, 6 y 8 se asocia de forma negativa con un buen pronóstico. En algunas modalidades, el tumor es receptor de estrógeno positivo. En otras modalidades, el tumor es receptor de estrógeno negat ivo .
En un aspecto, la presente divulgación proporciona un método para predecir el desenlace clínico de un paciente que padece cáncer, que comprende (a) obtener un nivel de expresión de un producto de expresión (por ejemplo, una transcripción de A N) de al menos un gen pronóstico de una muestra de tejido obtenida de un tumor del paciente, donde al menos un gen pronóstico se selecciona de GSTM2 , IL6ST, GSTM3 , C8orf4, TNFRSF1 IB , NATI, RUNX1 , CSF1, ACTR2 , LMNB1, TFRC, LAPTM4B, EN01, CDC20 e IDH2 ; (b) normalizar el nivel de expresión del producto de expresión de al menos un gen pronóstico para obtener un nivel de expresión normalizado; y (c) calcular un valor de riesgo basado en el valor de expresión normalizado, donde el aumento en la expresión del gen pronóstico seleccionado de GSTM2 , IL6ST, GST 3 , C8orf4, TNFRSF11B, NATI, RUNX1 y CSF1 tiene una correlación positiva con un buen pronóstico y el aumento en la expresión del gen pronóstico seleccionado de ACTR2 , LMNB1, TFRC, LAPTM4B , EN01, CDC20 e IDH2 se asocia de forma negativa con un buen pronóstico. En algunas modalidades, el tumor es receptor de estrógeno positivo. En otras modalidades, el tumor es receptor de estrógeno negativo.
En varias modalidades, se determina el nivel de expresión normalizado de al menos 2 o al menos 5 o al menos 10 o al menos 15 o al menos 20 o al menos 25 genes pronósticos (como se determina mediante el ensayo de un nivel de un producto de expresión del gen) . En modalidades alternativas, se obtienen los niveles de expresión normalizados de al menos uno de los genes que se coexpresan con los genes pronósticos en las tablas 16 a 18.
En otra modalidad, el valor de riesgo se determina mediante el uso de niveles de expresión normalizados de al menos un gen del grupo receptor de estroma o transferrina , o un gen que se coexpresa con un gen del grupo receptor de estroma o transferrina .
En otra modalidad, el cáncer es cáncer de mama.
En otra modalidad, el paciente es un paciente humano.
En aun otra modalidad, el cáncer es cáncer de mama ER positivo.
En aun otra modalidad, el cáncer es cáncer de mama ER negativo.
En una modalidad adicional, el producto de expresión comprende ARN. Por ejemplo, el ARN puede ser ARN exónico, ARN intrónico o ARN corto (por ejemplo, microARN, siARN, ARN pequeño asociado con promotor, shARN, etc.) . En varias modalidades, el ARN es ARN fragmentado .
En un aspecto diferente, la invención comprende un arreglo que comprende pol inuc leót idos que se hibridan a una transcripción de ARN de al menos uno de los genes pronósticos listados en las tablas 1-12.
En aun otro aspecto, la invención comprende un método para preparar un perfil genómico personalizado para un paciente, que comprende (a) obtener un nivel de expresión de un producto de expresión (por ejemplo, una transcripción de ARN) de al menos un gen pronóstico listado en las tablas 1-12 a partir de una muestra de tejido obtenida de un tumor del paciente ; (b) normalizar el nivel de expresión del producto de expresión de al menos un gen pronóstico para obtener un nivel de expresión normalizado; y (c) calcular un valor de riesgo basado en el valor de expresión normalizado, donde el aumento en la expresión de los genes pronósticos en las tablas 1, 3, 5 y 7 tiene una correlación positiva con un buen pronóstico y el aumento en la expresión de los genes pronósticos en las tablas 2, 4, 6 y 8 se asocia de forma negativa con un buen pronóstico. En algunas modalidades, el tumor es receptor de estrógeno positivo y en otras modalidades el tumor es receptor de estrógeno negat ivo .
En varias modalidades, el método puede incluir además el suministro de un informe. El informe puede incluir la predicción de la probabilidad de riesgo de que el paciente tenga un desenlace clínico particular.
La invención proporciona además un método implementado por computadora para clasificar a un paciente que padece cáncer sobre la base del riesgo de reaparición del cáncer, que comprende (a) clasificar, en una computadora, a el paciente según tenga un buen pronóstico o un mal pronóstico en virtud de un perfil de expresión que comprende mediciones de los niveles de expresión de los productos de expresión de una pluralidad de genes pronósticos en, una muestra tisular de tumor extraída del paciente, comprendiendo la pluralidad de genes al menos tres genes pronósticos diferentes listados en cualquiera de las tablas 1-12, donde un buen pronóstico predice que no habrá reaparición ni metástasis en un período predeterminado después del diagnóstico inicial y un mal pronóstico predice que habrá reaparición o metástasis en el período predeterminado después del diagnóstico inicial; y (b) calcular un valor de riesgo sobre la base de el niveles de expresión.
Descripción Detallada de la Invención DEFINICIONES A menos que se defina lo contrario, los términos técnicos y científicos utilizados en la presente tienen los mismos significados comúnmente utilizados por un entendido en la técnica a la que pertenece la presente invención. Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed . , J. iley & Sons (New York, NY 1994) , y March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons (New York, NY 1992) proporcionan al entendido en la técnica una guía general para muchos de los términos utilizados en la presente solicitud.
El entendido en la técnica reconocerá muchos métodos y materiales similares o equivalentes a los descritos en la presente, que pueden utilizarse en la práctica de la presente invención. De hecho, la presente invención no se limita de ninguna forma a los métodos y materiales descritos. A los efectos de la presente invención a continuación se definen los siguientes términos.
"Factores pronósticos" son las variables relacionadas con los antecedentes naturales del cáncer, que tienen influencia en las tasas de reaparición y en el desenlace de los pacientes una vez que han desarrollado cáncer. Los parámetros clínicos que se han asociado con un peor pronóstico incluyen, por ejemplo, la implicación de ganglios linfáticos y los tumores de alto grado. Los factores pronósticos se utilizan frecuentemente para clasificar a los pacientes en subgrupos con diferentes riesgos de recaída de los valores de referencia.
El término "pronóstico" se utiliza en la presente para referirse a la predicción de la probabilidad de muerte o progresión atribuible al cáncer, incluida la reaparición, la metástasis y la resistencia a fármacos, de una enfermedad neoplásica como el cáncer de mama. El término "buen pronóstico" significa un desenlace clínico deseado o "positivo". Por ejemplo, en el contexto del cáncer de mama, un buen pronóstico puede ser la expectativa de ninguna reaparición o metástasis dentro de los dos, tres, cuatro, cinco o más años a partir del diagnóstico inicial de cáncer de mama. El término "mal pronóstico" se utiliza en la presente para referirse a un desenlace clínico indeseado. Por ejemplo, en el contexto del cáncer de mama, un mal pronóstico puede ser la expectativa de reaparición o metástasis dentro de los dos, tres, cuatro, cinco o más años a partir del diagnóstico inicial de cáncer de mama.
El término "gen pronóstico" se utiliza en la presente para referirse a un gen cuya expresión tiene una correlación positiva o negativa con un buen pronóstico para un paciente que padece cáncer tratado con un tratamiento de referencia. Un gen puede ser un gen pronóstico y predictivo, en función de la correlación del nivel de expresión genética con el criterio de valoración correspondiente. Por ejemplo, mediante el uso de un modelo de riesgo proporcional de Cox, si un gen es únicamente pronóstico, su tasa de riesgo (HR, por sus siglas en inglés) no cambia cuando se mide en pacientes tratados con el tratamiento de referencia o en pacientes tratados con una nueva intervención .
El término "gen predictivo" se utiliza en la presente para referirse a un gen, cuya expresión tiene una correlación positiva o negativa con la respuesta a una respuesta beneficiosa al tratamiento. Por ejemplo, el tratamiento puede incluir quimioterapia.
Los términos "valor de riesgo" o "clasificación de riesgo" se utilizan de forma intercambiable en la presente para describir un nivel de riesgo (o probabilidad) de que un paciente experimente un desenlace clínico particular. Un paciente puede clasificarse en un grupo de riesgo o clasificarse en un nivel de riesgo sobre la base de los métodos de la presente divulgación, por ejemplo, riesgo alto, medio o bajo. Un "grupo de riesgo" es un grupo de sujetos o individuos con un nivel similar de riesgo para un desenlace clínico particular.
Un desenlace clínico puede definirse mediante el uso de diferentes criterios de valoración. El término supervivencia "a largo plazo" se utiliza en la presente para referirse a la supervivencia por un determinado período de tiempo, por ejemplo, durante al menos 3 años, más preferentemente durante al menos 5 años. El término "supervivencia libre de reaparición" (RFS, por sus siglas en inglés) se utiliza en la presente para referirse a la supervivencia durante un período de tiempo ( habi tualmente en años) desde la aleatori zación hasta una primera reaparición del cáncer o la muerte debido a la reaparición del cáncer. El término "supervivencia global" (OS, por sus siglas en inglés) se utiliza en la presente para referirse al tiempo (en años) desde la aleatorización hasta la muerte por cualquier causa. El término "supervivencia libre de enfermedad" (DFS, por sus siglas en inglés) se utiliza en la presente para referirse a la supervivencia durante un período de tiempo (habitualmente en años) desde la aleatorización hasta una primera reaparición del cáncer o la muerte por cualquier causa.
El cálculo de las mediciones enumeradas anteriormente en la práctica puede variar de un estudio a otro en función de la definición de los eventos que se censurarán o que no se considerarán.
El término " biomarcador" como se utiliza en la presente se refiere a un gen cuyo nivel de expresión se mide mediante el uso de un producto del gen.
El término "microensayo" se refiere a una disposición ordenada de elementos de ensayo hibridables, preferentemente sondas de polinucleótidos , sobre un sustrato.
Como se utiliza en la presente, el término "nivel de expresión normalizado" aplicado a un gen se refiere al nivel normalizado de un producto de gen, por ejemplo, el valor normalizado determinado para el nivel de expresión de ARN de un gen o para el nivel de expresión del polipéptido de un gen.
El término "Ct" como se utiliza en la presente se refiere al ciclo umbral, el número de ciclo en la reacción en cadena de la polimerasa cuantitativa (qPCR, por sus siglas en inglés) en el cual la fluorescencia generada dentro de un pocilio de reacción excede el umbral definido, es decir, el punto durante la reacción en el cual se acumuló un número suficiente de amplicones para alcanzar el umbral definido .
Los términos "producto del gen" o "producto de expresión" se utilizan en la presente para referirse a los productos de transcripción de ARN (t anscripciones) del gen, incluido el ARNm y los productos de traducción del polipéptido de las transcripciones de ARN. El producto del gen puede ser, por ejemplo, un ARN sin corte y empalme, un ARNm, un ARNm con variante de corte y empalme, un microARN, un ARN fragmentado, un polipéptido, un polipéptido modificado post raslacionalmente , un polipéptido con variante de corte y empalme, etc.
El término "transcripción de ARN" como se utiliza en la presente se refiere a los productos de transcripción de ARN de un gen, incluido, por ejemplo, el ARNm, el ARN sin corte y empalme, el ARNm con variante de alternativa de corte y empalme, el microARN y el ARN fragmentado. "ARN fragmentado" como se utiliza en la presente se refiere a ARN, una mezcla de ARN intacto y ARN que se degradó como resultado del procesamiento de la muestra (por ejemplo, fijación, bloques tisulares de seccionamiento, etc.) .
A menos que se indique lo contrario, cada nombre de gen utilizado en la presente corresponde al símbolo oficial asignado al gen y proporcionado por Entrez Gene (URL: www.ncbi.nlm.nih.gov/sites/entrez) desde la fecha de presentación de la presente solicitud.
Los términos "correlacionado" y "asociado" se utilizan de forma intercambiable en la presente para referirse a una fuerza de asociación entre dos mediciones (o entidades medidas) . La divulgación proporciona genes y subgrupos de genes cuyos niveles de expresión se asocian con una medición de desenlace particular. Por ejemplo, el aumento en el nivel de expresión de un gen puede correlacionarse positivamente (asociarse positivamente) con un aumento en la probabilidad de un desenlace clínico bueno para el paciente, como un aumento en la probabilidad de supervivencia a largo plazo sin reaparición del cáncer y/o supervivencia libre de metástasis. Tal correlación positiva puede demostrarse estadísticamente en varias formas, por ejemplo, mediante una tasa de riesgo baja (por ejemplo, HR < 1,0) . En otro ejemplo, el aumento en el nivel de expresión de un gen puede correlacionarse negativamente (asociarse negativamente) con un aumento en la probabilidad de un desenlace clínico bueno para el paciente. En el caso, por ejemplo, el paciente puede presentar una disminución en la probabilidad de supervivencia a largo plazo sin reaparición del cáncer y/o metástasis del cáncer y similares. La correlación negativa indica que el paciente probablemente tiene un mal pronóstico, por ejemplo, una tasa de riesgo alta (por ejemplo, HR > 1,0). "Correlacionado" se utiliza además en la presente para referirse a la fuerza de asociación entre los niveles de expresión de dos genes diferentes, de forma que el nivel de expresión de un primer gen puede sustituirse con un nivel de expresión de un segundo gen en un algoritmo dado en vista de su correlación de expresión. Tal "expresión correlacionada" de dos genes que son sustituibles en un algoritmo, habitualmente niveles de expresión de genes que se correlacionan positivamente el uno con el otro, por ejemplo, si el aumento en la expresión de un primer gen se correlaciona positivamente con un desenlace (por ejemplo, aumento en la probabilidad de un desenlace clínico bueno) , entonces el segundo gen que se coexpresa y muestra una expresión correlacionada con el primer gen, se relaciona también positivamente con el mismo desenlace.
El término "reaparición", como se utiliza en la presente, se refiere a la reaparición local o distante (metástasis) del cáncer. Por ejemplo, el cáncer de mama puede volver como una reaparición local (en el seno tratado o cerca del sitio quirúrgico del tumor) o como una reaparición distante en el cuerpo. Los sitios más comunes de reaparición de cáncer de mama son los ganglios linfáticos, los huesos, el hígado y los pulmones .
El término "pol inuc 1eót ido" , cuando se utiliza en singular o plural, generalmente se refiere a cualquier pol iribonucleot ido o pol idesoxi ribonuc leót ido , que puede ser ARN o ADN sin modificar o ARN o ADN modificado. Por consiguiente, por ejemplo, los pol inucleót idos como se definen en la presente incluyen, a modo no taxativo, ADN de hebra simple y doble, ADN incluidas las regiones de hebra simple y doble, ARN de hebra simple y doble, y ARN incluidas las regiones de hebra simple y doble, moléculas híbridas que comprenden ADN y ARN que puede ser de hebra simple o, más típicamente, de hebra doble o incluir regiones de hebra simple y doble. Además, el término "polinucleótido" como se utiliza en la presente se refiere a regiones de hebra triple que comprenden ARN o ADN o ambos ADN y ARN. Las hebras en tales regiones pueden ser de la misma molécula o de moléculas diferentes. Las regiones pueden incluir una o más de las moléculas, pero más típicamente implican únicamente una región de algunas de las moléculas. Una de las moléculas de una región triple helicoidal a menudo es un ol igonucleótido . El término "pol inucleót ido" específicamente incluye ADNc . El término incluye ADN (incluido el ADNc) y ARN que contienen una o más bases modificadas. Por consiguiente, los ADN y ARN con su estructura principal modificada por razones de estabilidad o por otras razones son "pol inucleót idos " como se pretende expresar con el término en la presente. Además, los ADN y ARN que comprenden bases inusuales, como inopina, o bases modificadas, como bases tritiadas, se incluyen dentro del término "polinucleót idos" como se define en la presente. En general, el término "pol inuc leót ido" abarca todas las formas modificadas químicamente, enzimát icamente y/o metaból icamente de los pol inucleót idos sin modificar, así como las formas químicas de ADN y ARN características de virus y células, incluidas las células simples y complejas.
El término "oligonucleótido" se refiere a un pol inucleótido relativamente corto que incluye, a modo no taxativo, desoxirribonucleót idos de hebra simple, ribonucleót idos de hebra simple o doble, híbridos de ARN : ADN y ADN de hebra doble. Los ol igonucleót idos , como los oligonucleót idos de sonda de ADN de hebra simple, a menudo se sintetizan mediante métodos químicos, por ejemplo, mediante el uso de s int et i zadores automáticos de ol igonucleot idos que se encuentran disponibles comerc ialmente . No obstante, los oligonucleót idos pueden prepararse mediante una variedad de otros métodos, incluidas las técnicas mediadas por ADN recombinante in vitro y mediante la expresión de ADN en células y organismos.
La frase "amplificación" se refiere a un proceso mediante el cual se forman múltiples copias de un gen o transcripción de ARN en una muestra particular o línea celular. La región duplicada (un tramo de polinucleót ido amplificado) a menudo se denomina "amplicón" . Habi tualmente , la cantidad de ARN mensajero (ARNm) producida, es decir, el nivel de expresión del gen, también aumenta en proporción del número de copias hechas del gen particular expresado.
El término "receptor de estrógeno (ER, por sus siglas en inglés)" designa el estado del receptor de estrógeno de un paciente que padece cáncer. Un tumor es ER positivo si hay un número significativo de receptores de estrógeno en las células cancerígenas, mientras que ER negativo indica que las células no tienen un número significativo de receptores. La definición de "significativo" varía de un sitio y método de prueba a otro (por ejemplo, inmunohi stoquímica , PCR) . El estado de ER de un paciente que padece cáncer puede evaluarse a través de varios medios conocidos. Por ejemplo, el nivel de ER de cáncer de mama se determina mediante la medición de un nivel de expresión de un gen que codifica el receptor de estrógeno en una muestra de tumor de seno obtenida de una paciente.
El término "tumor", como se utiliza en la presente, se refiere a todo crecimiento y proliferación de células neoplásicas, ya sean malignas o benignas, y a todas las células y los tejidos precancerígenos y cancerígenos.
Los términos "cáncer" y "cancerígeno" se refieren a o describen la afección fisiológica en mamíferos que generalmente se caracteriza por un crecimiento celular no regulado. Los ejemplos de cáncer incluyen, a modo no taxativo, cáncer de mama, cáncer de ovarios, cáncer de colon, cáncer de pulmón, cáncer de próstata, cáncer hepatocelular , cáncer gástrico, cáncer pancreático, cáncer cervical, cáncer de hígado, cáncer de vejiga, cáncer del tracto urinario, cáncer de tiroides, cáncer renal, carcinoma, melanoma y cáncer de cerebro.
El subgrupo de genes identificado en la presente como el "grupo estromal" incluye genes que se sintetizan predominantemente mediante células estromales y se encuentran implicados en la respuesta estromal y genes que se coexpresan con genes del grupo estromal. Las "células estromales" se definen en la presente como las células de tejido conjuntivo que forman la estructura de apoyo de los tej idos biológicos. Las células estromales incluyen fibroblastos, células inmuni tarias , pericitos, células endoteliales y células inflamatorias. "Respuesta estromal" se refiere a la respuesta desmoplásica de los tejidos huésped en el sitio de un tumor ó invasión primaria. Véase, por ejemplo, E. Rubin, J. Farber, Pathology, 985-986 (2- Ed. 1994). El grupo estromal incluye, por ejemplo, CDH11, TAGLN, ITGA4 , INHBA, C0LIA1, C0LIA2, FN1 , CXCL14 , TNFRSF1, CXCL12, C10ORF116, RUNX1, GSTM2 , TGFB3 , CAVI, DLC1, TNFRSF10 , F3 y DICER1, y los genes que se coexpresan identificados en las tablas 16-18.
El subgrupo de genes identificado en la presente como el "grupo metabólico" incluye genes que se asocian con el metabolismo celular, incluidos genes asociados con las proteínas transportadoras para transferir el hierro, la vía de homeostasis celular del hierro y las vías metabólicas bioquímicas homeostát icas y los genes que se coexpresan con los genes del grupo metabólico. El grupo metabólico incluye, por ejemplo TFRC, EN01, IDH2 , ARF1 , CLDN4 , PRDX1 y GBP1, y los genes coexpresados identificados en las tablas 16-18.
El subgrupo de genes identificado en la presente como el "grupo inmune" incluye genes que se encuentran implicados en las funciones celulares inmunorreguladoras , como el tráfico de células T y B, marcadores de linfocitos o asociados con linfocitos, y genes de regulación de interferón y genes que se coexpresan con los genes del grupo inmune. El grupo inmune incluye, por ejemplo, CCL19 e IRF1, y los genes coexpresados identificados en las tablas 16-18.
El subgrupo de genes identificado en la presente como el "grupo de proliferación" incluye genes que se asocian con el desarrollo y la división celular, el ciclo celular y la regulación mitótica, la angiogénesis , la replicación celular, el transporte y la estabilidad nuclear, la señalización de wnt , la apoptosis y los genes que se coexpresan con los genes del grupo de proliferación. El grupo de proliferación incluye, por ejemplo, PGF, SPC25, AURKA, BIRC5, BUB1, CCNB1, CENPA, KPNA, LMNB1, MCM2 , MELK, NDC80, TPX2M y WISP1, y los genes que se coexpresan identificados en las tablas 16-18.
El término "coexpresados", como se utiliza en la presente, se refiere a la correlación estadística entre el nivel de expresión de un gen y el nivel de expresión de otro gen. La coexpresión en pares puede calcularse a través de varios métodos conocidos en la técnica, por ejemplo, mediante el cálculo de los coeficientes de correlación de Pearson o los coeficientes de correlación de Spearman. Los grupos de genes coexpresados también pueden identificarse mediante el uso de una teoría gráfica.
Como se utilizan en la presente, los términos "grupo de genes" y "grupo" se refieren a una subgráfica de una gráfica en la cual todos los vértices se conectan por una arista a todos los demás vértices de la subgráfica.
Como se utiliza en la presente, un "grupo máximo" es un grupo donde no puede agregarse ningún otro vértice y aun es un grupo.
La "patología" de cáncer incluye todos los fenómenos que comprometen el bienestar del paciente. Esto incluye, a modo no taxativo, crecimiento celular anormal o incontrolable, metástasis, interferencia con el funcionamiento normal de las células vecinas, liberación de citocinas u otros productos secretorios a niveles anormales, supresión o empeoramiento de la respuesta inflamatoria o inmunológica , neoplasia, premal ignidad , malignidad, invasión de tejidos u órganos circundantes o distantes, como los ganglios linfáticos, etc.
"Sistema informático" se refiere a un sistema de hardware , software y medio de almacenamiento de datos utilizado para analizar información. El hardware mínimo de un sistema informático de un paciente comprende una unidad central de procesamiento (CPU, por sus siglas en inglés) y un soporte físico para la entrada de datos, la salida de datos (por ejemplo, pantalla) y el almacenamiento de datos. El entendido en la técnica podrá apreciar fácilmente que cualquier sistema informático disponible en la actualidad y/o sus componentes son adecuados para el uso con relación a los métodos de la presente divulgación. El medio de almacenamiento de datos puede comprender cualquier producto que comprenda un registro de la presente información como se describe anteriormente o un dispositivo de acceso de memoria que pueda acceder a el producto.
"Registrar" datos, programas u otra información en un medio legible por computadora se refiere a un proceso para almacenar información mediante el uso de cualquier método conocido en la técnica. Puede elegirse cualquier estructura de almacenamiento de datos conveniente, sobre la base de los medios utilizados para acceder a la información almacenada. Puede utilizarse una variedad de programas y formatos de procesamiento de datos para el almacenamiento, por ejemplo, archivo de texto de procesamiento de palabras, formato de base de datos, etc.
Un "procesador" o "medio de computadora" hace referencia a cualquier combinación de hardware y/o software que realizará las funciones requeridas. Por ejemplo, un procesador adecuado puede ser un microprocesador digital programable como los que se encuentran disponibles en forma de controlador electrónico, unidad central, servidor o computadora personal (de escritorio o portátil) . Cuando el procesador es programable, la programación adecuada puede comunicarse desde una ubicación remota al procesador o guardarse previamente en un producto de programa de computadora (como un medio de almacenamiento legible por computadora portátil o fijo, basado en un dispositivo en estado magnético, óptico . o sólido) . Por ejemplo, un medio magnético o disco óptico' puede llevar a cabo la programación y puede leerse mediante un lector adecuado que se comunica con cada procesador en su estación correspondiente .
Como se utiliza en la presente, "teoría gráfica" se refiere a un campo de estudio de la informática y la matemática en el cual las situaciones se representan por un diagrama que contiene un grupo de puntos y líneas que conectan algunos de esos puntos. El diagrama se denomina "gráfica" y los puntos y líneas se denominan "vértices" y "aristas" de la gráfica. En términos de análisis de coexpresión de genes, un gen (o su ident i f i cador equivalente, por ejemplo, una sonda de ensayo) puede representarse como un nodo o vértice en la gráfica. Si las medidas de similitud (por ejemplo, coeficiente de correlación, información mutua y expectativas condicionales alternativas) entre dos genes son mayores que un umbral significativo, se dice que los dos genes se coexpresan y se dibujará una arista en la gráfica. Una vez dibujadas las aristas coexpresadas para todos los pares de genes posibles para un determinado estudio, se computan todos los grupos máximos . El grupo máximo resultante se define como un grupo de genes . Un grupo de genes es un grupo de genes coexpresados computado que cumple con los criterios predefinidos.
La "rigurosidad" de las reacciones de hibridación se determina fácilmente por el entendido en la técnica y generalmente es un cálculo empírico que depende de la longitud de la sonda, la temperatura de lavado y la concentración de sal. En general, las sondas más largas requieren temperaturas más altas para una hibridación adecuada mientras que las sondas más cortas requieren temperaturas más bajas. La hibridación generalmente depende de la capacidad del ADN desnaturalizado para hibridarse cuando las hebras complementarias se encuentran presentes en un ambiente por debajo de su temperatura de fusión. Cuanto más alto es el grado de homología deseado entre la sonda y la secuencia hibridable, mayor será la temperatura relativa que puede utilizarse. Como resultado, las temperaturas relativas más altas tenderán a hacer que las condiciones de reacción sean más rigurosas, mientras que las temperaturas bajas tienden a lo contrario. Véanse más detalles y una explicación de la rigurosidad de las reacciones de hibridación en Ausubel et al., Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995) .
Las "condiciones rigurosas" o "condiciones de alta rigurosidad", como se definen en la presente, generalmente: (1) utilizan fuerza iónica baja y temperatura elevada para el lavado, por ejemplo, cloruro de sodio 0,015 /citrato de sodio 0,0015 M/dodecil sulfato de sodio al 0,1% a 50°C; (2) utilizan un agente de desnaturalización durante la hibridación, como formamida, por ejemplo, formamida al 50% (v/v) con albúmina de suero bovino al 0,1%/Ficoll al 0 , 1%/polivinilpirrolidona al 0 , 1%/solución amortiguadora de fosfato de sodio 50mM a un pH de 6,5 con cloruro de sodio 750 mM , citrato de sodio 75 m a 42°C; o (3) utilizan formamida al 50%, 5 x SSC (NaCl 0,75 M, citrato de sodio 0,075 M) , fosfato de sodio 50 mM (pH 6,8), pirofosfato de sodio al 0,1%, solución de Denhardt 5 x, ADN de esperma de salmón sonicado (50 g/ml) , SDS al 0,1% y sulfato de dextrano al 10% a 42°C, con lavados a 42°C en 0,2 x SSC (cloruro de sodio/ci trato de sodio) y formamida al 50% a 55°C, seguido de un lavado de alta rigurosidad que consiste en 0,1 x SSC que contiene EDTA a 55°C.
Las "condiciones moderadamente rigurosas" pueden identificarse como se describe en Sambrook et al., Molecular Cloning: A Laboratory Manual, New York: Cold Spring Harbor Press, 1989, e incluyen el uso de una solución de lavado y condiciones de hibridación (por ejemplo, temperatura, fuerza iónica y %SDS) menos rigurosas que las descritas anteriormente. Un ejemplo de condiciones moderadamente rigurosas es la incubación durante la noche a 37°C en una solución que comprende: formamida al 20%, 5 x SSC (NaCl 150 mM , citrato de trisodio 15 mM) , fosfato de sodio 50 mM (pH 7,6) , solución de Denhardt 5 x, sulfato de dextrano al 10% y 20 mg/ml de ADN de esperma de salmón desnaturalizado fragmentado, seguido del lavado de los filtros en 1 x SSC a aproximadamente 37-50°C. El entendido en la técnica reconocerá cómo ajustar la temperatura, la fuerza iónica, etc., según sea necesario para adaptar los factores como la longitud de la sonda y similares .
En el contexto de la presente invención, la referencia a "al menos uno", "al menos dos", "al menos cinco", etc. de los genes enumerados en cualquier grupo de genes particular significa cualquiera de todas y cada una de las combinaciones de genes enumeradas .
El término cáncer "con ganglio negativo", como cáncer de mama "con ganglio negativo", se utiliza en la presente para referirse al cáncer que no se ha propagado a los ganglios linfáticos.
Los términos "empalme" y "empalme de ARN" se utilizan de forma intercambiable y se refieren al procesamiento de ARN que extrae intrones y une exones para producir ARNm maduro con secuencia de codificación continua que se mueve hacia el citoplasma de una célula eucariota.
En teoría, el término "exón" se refiere a cualquier segmento de un gen interrumpido que se representa en el producto de ARN maduro (B. Le in. Genes IV Cell Press, Cambridge Mass. 1990) . En teoría, el término "intrón" se refiere a cualquier segmento de ADN que se transcribe pero se elimina de la transcripción mediante el empalme de los exones en cualquier lado de este. Operativamente, las secuencias de exones ocurren en la secuencia de ARNm de un gen como se define en los números de secuencias de referencia. Operativamente, las secuencias de intrones son las secuencias inte vini ente s dentro del ADN genómico de un gen, sujetado por secuencias de exones y que tiene secuencias consenso de empalme GT y AG en sus límites 5' y 3' .
ENSAYO DE EXPRESIÓN DE GENES La presente divulgación proporciona métodos que utilizan, a menos que se indique lo contrario, técnicas convencionales de biología molecular (incluidas las técnicas recombinant es ) , microbiología, biología celular y bioquímica, que se encuentran dentro de la destreza en la técnica. Tales técnicas se explican a fondo en la literatura, como "Molecular Cloning: A Laboratory Manual", 2- edición (Sambrook et al., 1989) ; "01 igonuc leot ide Synthesis" (M.J. Gait, ed. , 1984) ; "Animal Cell Culture" (R.I. Freshney, ed. , 1987); "Methods in Enzymology" (Academic Press, Inc.); "Handbook of Experimental Immunology" , 4- edición (D.M. Weir & C.C. Blackwell, eds . , Blackwell Science Inc., 1987); "Gene Transfer Vectors for Mammalian Cells" (J.M. Miller & M.P. Calos, eds., 1987); "Current Protocols in Molecular Biology" (F.M. Ausubel et al., eds., 1987); y "PCR: The Polymerase Chain Reaction", (Mullís et al., eds., 1994) . 1. Trazado de perfil de expresión de genes Los métodos de trazado de perfil de expresión de genes incluyen métodos basados en el análisis de hibridación de pol inucleót idos , métodos basados en el secuenciado de polinucleótidos y métodos basados en la proteómica. Los métodos más utilizados conocidos en la técnica para la cuantif icación de la expresión de ARNm en una muestra incluyen la transferencia de tipo Northern y la hibridación in situ (Parker & Barnes, Methods in Molecular Biology 106:247-283 (1999)); ensayos de protección de ARN (Hod, Biotechniques 13:852 -854 (1992)); y métodos basados en PCR, como la reacción en cadena de la polimerasa con transcriptasa inversa (RT-PCR) (Weis et al., Trends in Genetics 8:263-264 (1992)) . De forma alternativa, pueden emplearse anticuerpos que pueden reconocer dúplex específicos, incluidos dúplex de AD , dúplex de ARN y dúplex híbridos ADN-ARN o dúplex ADN-prote ína . 2. Métodos de trazado de perfil de expresión de genes basados en PCR a . PCR con transcriptasa inversa (RT-PCR) De las técnicas enumeradas anteriormente, el método cuantitativo más sensible y flexible es la PCR con transaripcion inversa (RT-PCR, por sus siglas en ingles) que puede utilizarse para comparar los niveles de ARNm en diferentes poblaciones de muestra, en tejidos tumorales y normales, con o sin tratamiento farmacológico, para caracterizar los patrones de expresión de genes, para discriminar entre los ARNm estrechamente relacionados y para analizar la estructura de ARN.
El primer paso es el aislamiento de ARNm de una muestra diana. El material de partida suele ser ARN total aislado de tumores o líneas celulares tumorales humanas, y que corresponden a tejidos o líneas celulares normales, respectivamente. Por consiguiente, el ARN puede aislarse de una variedad de tumores primarios, incluidos tumores de mama, pulmón, colon, próstata, cerebro, hígado, riñon, páncreas, bazo, timo, testículos, ovarios, útero, etc., o líneas celulares tumorales, con ADN agrupado de donantes sanos. Si la fuente de ARNm es un tumor primario, el ARNm puede extraerse, por ejemplo, de muestras de tejido congeladas o archivadas con inclusiones de parafina y fijas (por ejemplo, fijas a la formalina) .
Los métodos generales para la extracción de ARNm son bien conocidos en la técnica y se divulgan en los libros de texto estándar de biología molecular, incluido Ausubel et al . , Current Protocols of Molecular Biology, John iley and Sons (1997) . Los métodos para la extracción de ARN de tejidos con inclusiones de parafina se divulgan, por ejemplo, en Rupp y Locker, Lab Invest . 56:A67 (1987), y De Andrés et al., BioTechniques 18:42044 (1995) . En particular, el aislamiento del ARN puede realizarse mediante el uso de un kit de purificación, un juego de solución amortiguadora y proteasa de fabricantes comerciales, como Qiagen, de conformidad con las instrucciones del fabricante. Por ejemplo, puede aislarse ARN total de células en cultivo mediante el uso de minicolumnas RNeasy de Qiagen. Otros kits de aislamiento de ARN disponibles comercialmente incluyen el kit de purificación completa de ADN y ARN MasterPure™ ( EPICENTRE® , Madison, WI) y el kit de aislamiento de ARN en bloque de parafina (Ambion, Inc.) . El ARN total de las muestras de tejido puede aislarse mediante el uso de RNA Stat-60 (Tel-Test) . El ARN preparado a partir del tumor puede aislarse, por ejemplo, mediante centrifugación por gradiente de densidad de cloruro de cesio .
En algunos casos, puede ser adecuado amplificar el ARN antes de iniciar el trazado de perfil de expresión. A menudo sucede que solamente cantidades muy limitadas de especímenes clínicos valiosos se encuentran disponibles para el análisis molecular. Esto puede deberse a que los tejidos ya fueron utilizados para otros análisis de laboratorio o a que el espécimen original es muy pequeño, como en el caso de la biopsia con aguja o tumores primarios muy pequeños. Cuando el tejido se limita en cantidad generalmente también ocurre que solamente pueden recuperarse pequeñas cantidades del ARN total del espécimen y como resultado solo puede analizarse un número limitado de marcadores genómicos en el espécimen. La amplificación del ARN compensa esta limitación mediante la reproducción fiel de la muestra de ARN original como una cantidad mucho mayor de ARN de la misma composición relativa. Mediante el uso de esta copia amplificada del espécimen de ARN original, puede llevarse a cabo un análisis genómico ilimitado para descubrir biomarcadores asociados con las características clínicas de la muestra biológica original. Esto inmortaliza de forma eficaz los especímenes de estudio clínico para el análisis genómico y el descubrimiento de biomarcadores.
Como el ARN no puede servir como una plantilla para la PCR, la primera etapa en el trazado de perfil de la expresión de genes mediante RT-PCR (RT-PCR) en tiempo real es la transcripción inversa de la plantilla de ARN en ADNc , seguida de su amplificación exponencial en una reacción de PCR. Las dos t ranscriptasas inversas más utilizadas son la t ranscriptasa inversa del virus de la mieloblastosis aviar (AMV-RT, por sus siglas en inglés) y la t ranscriptasa inversa del virus de la leucemia murina de Moloney (MMLV-RT, por sus siglas en inglés) . La etapa de transcripción inversa generalmente se ceba mediante el uso de cebadores específicos, hexámeros aleatorios o cebadores oligo-dT, en función de las circunstancias y el propósito del perfilado de expresión. Por ejemplo, el ARN extraído puede transcribirse de forma inversa mediante el uso del kit GeneAmp RNA PCR (Perkin Elmer, CA, EUA) , de acuerdo con las instrucciones del fabricante. El ADNc derivado puede utilizarse a continuación como una plantilla en la reacción de PCR subsiguiente. Pueden verse más detalles, por ejemplo, en Held et al., Genome Research 6:986-994 (1996) .
A pesar de que la etapa de PCR puede utilizar una variedad de polimerasas de ADN termoestables dependientes de ADN, generalmente emplea la Taq ADN polimerasa, que tiene una actividad de nucleasa 5' -3' pero carece de actividad de corrección de endonucleasa 3'-5'. Por consiguiente, la TaqMan® PCR generalmente utiliza la actividad de la nucleasa 5' de la Taq o Tth polimerasa para hidrolizar una sonda de hibridación unida a su amplicón diana, pero puede utilizarse cualquier enzima con actividad de nucleasa 5' equivalente. Se utilizan dos cebadores de oligonucleót idos para generar un amplicón típico de una reacción de PCR. Se diseña un tercer oligonucleót ido o sonda para detectar la secuencia de nucleótidos ubicada entre los dos cebadores de PCR. La sonda no es extensible por la enzima de la Taq ADN polimerasa y se marca con un tinte fluorescente reportero y un tinte fluorescente inactivador.
Cualquier emisión inducida por láser del tinte reportero se inactiva mediante el tinte inactivador cuando los dos tintes se encuentran cerca el uno del otro mientras están en la sonda. Durante la reacción de amplificación, la enzima de Taq ADN polimerasa escinde la sonda en una forma que depende de la plantilla. Los fragmentos de sonda resultantes se disocian en solución y la señal del tinte reportero liberado se encuentra libre del efecto de inactivación del segundo fluoróforo. Se libera una molécula de tinte reportero para cada nueva molécula sintetizada y la detección del tinte reportero sin inactivar proporciona la base para la interpretación cuantitativa de los datos.
La TaqMan® RT-PCR puede llevarse a cabo mediante el uso de kits disponibles comerc ialmente , como, por ejemplo, ABI PRISM 7900® Sequence Detection System™ (Perkin Elmer-Appl ied Biosystems, Foster City, CA, EUA) o LightCycler® 480 Real-Time PCR System (Roche Diagnostics, GmbH, Penzberg, Alemania). En una modalidad preferida, el procedimiento de la nucleasa 5' se ejecuta en un dispositivo de PCR cuantitativa en tiempo real como el ABI PRISM 7900* Sequence Detection System™. El sistema consiste en un termociclador , un láser, un dispositivo acoplado por carga (CCD, por sus siglas en inglés), una cámara y una computadora. El sistema amplifica las muestras en un formato de 384 pocilios sobre un termociclador . Durante la amplificación, la señal fluorescente inducida por láser se toma en tiempo real a través de cables de fibra óptica para los 384 pocilios y se detecta en el CCD. El sistema incluye software para ejecutar el instrumento y para analizar los datos.
Los datos del ensayo de nucleasa 5' se expresan inicialmente como Ct, o el ciclo de umbral. Como ya se discutió, los valores de fluorescencia se registran durante todos los ciclos y representan la cantidad de producto amplificado a el punto en la reacción de amplificación. El punto donde la señal de fluorescencia se registra por primera vez como estadísticamente significativa es el ciclo de umbral (Ct) .
Para minimizar los errores y el efecto de la variación muestra a muestra, la RT-PCR habitualmente se realiza mediante el uso de un estándar interno. El estándar interno ideal se expresa a un nivel constante entre tejidos diferentes y no se encuentra afectado por el tratamiento experimental. Los ARN utilizados más frecuentemente para normalizar los patrones de la expresión de genes son ARNm para gl iceraldehído- 3 -fosfato- dehidrogenasa (GAPDH) de los genes de mantenimiento y ß-actina.
Las etapas de un protocolo representativo para el trazado de perfil de la expresión de genes mediante el uso de tejidos fijos con inclusiones de parafina como fuente de ARN, incluido el aislamiento de ARNm, la purificación, la extensión y amplificación de cebadores, se proporcionan en varios artículos de periódicos publicados. M. Cronin, Am J Pathol 164(1) :35-42 (2004) . En resumen, un proceso representativo comienza con el corte de secciones de aproximadamente 10 µp\ de espesor de muestras de tejido de tumores con inclusiones de parafina. A continuación se extrae el ARN y se eliminan las proteínas y el ADN . Después del análisis de la concentración de ARN, pueden incluirse etapas de reparación y/o amplificación de ARN, si fuera necesario, y el ARN se transcribe de forma inversa mediante el uso de cebadores específicos de genes seguidos por RT-PCR. b . Diseño de cebadores y sondas de PCR basados en introñes Los cebadores y sondas de PCR pueden diseñarse sobre la base de las secuencias de exones e intrones presentes en la transcripción de ARNm del gen de interés. Antes de realizar el diseño del cebador o la sonda, es necesario trazar la secuencia de genes diana al montaje de genoma humano para identificar los límites intrón-exón y la estructura general de los genes. Esto puede realizarse mediante el uso de software disponible públicamente, como Primer3 (Whitehead Inst . ) y Primer Express® (Applied Biosystems ) .
Cuando fuera necesario o deseable, las secuencias repetitivas de la secuencia diana pueden enmascararse para mitigar señales no específicas. Las herramientas ejemplares para lograr esto incluyen el programa Repeat Masker disponible en línea a través de Baylor College of Medicine, que muestra secuencias de ADN contra una biblioteca de elementos repetitivos y devuelve una secuencia de consulta en la cual los elementos repetitivos se encuentran enmascarados. Las secuencias de intrones y exones enmascaradas pueden a continuación utilizarse para diseñar secuencias del cebador y la sonda para los sitios diana deseados mediante el uso de cualquier paquete de diseño de cebador o sonda comercial o públicamente disponible, como Primer Express (Applied Biosystems), MGB assay-by-design (Applied Biosystems) , Primer3 (Steve Rozen y Helen J. Skaletsky (2000) Primer3 en la Web para usuarios generales y programadores biólogos. En: Rrawetz S, Misener S (eds) Bioinformat ics ethods and Protocols: Methods in Molecular Biology. Humana Press, Totowa, NJ, pp 365-386) .
Otros factores que pueden influir en el diseño del cebador de PCR incluyen la longitud del cebador, la temperatura de fusión (Tm, por sus siglas en inglés) y contenido de G/C, la especificidad, las secuencias de cebadores complementarias y la secuencia del extremo 3' . En general, los cebadores de PCR óptimos son de 17-30 bases de longitud y contienen aproximadamente un 20-80%, como, por ejemplo, aproximadamente un 50-60%, de bases G+C y muestran Tm de entre 50 y 80°C, por ejemplo, aproximadamente de 50 a 70°C.
Encontrará más directrices para el diseño de cebadores y sondas de PCR, por ejemplo, en Dieffenbach, CW . et al, "General Concepts for PCR Primer Design" en: PCR Primer, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Nueva York, 1995, pp . 133 -155 ; Innis y Gelfand, "Opt imi zat ion of PCRs" en: PCR Protocols, A Guide to Methods and Applications, CRC Press, Londres, 1994, pp . 5-11; y Plasterer, T.N. Primerselect : Primer and probé design. Methods Mol. Biol . 70:520-527 (1997), cuyas divulgaciones se incorporan expresamente en la presente en su totalidad a modo de referencia.
La tabla A proporciona más información respecto de las secuencias del cebador, la sonda y el amplicón asociadas con los ejemplos divulgados en la presente. c . Sistema MassARRAY En el método de trazado de perfil de expresión de genes basado en MassARRAY, desarrollado por Sequenom, Inc. (San Diego, CA) , después del aislamiento del ARN y la transcripción inversa, el ADNc obtenido se agrega con una molécula de ADN sintética (competidor) que coincide con la región de ADNc fijada como objetivo en todas las posiciones, excepto una base simple, y sirve como estándar interno. La mezcla de ADNc/compet idor se amplifica mediante PCR y se somete a un tratamiento enzimático con fosfatasa alcalina sérica (SAP, por sus siglas en inglés) después de la PCR, lo que resulta en la defosforilación de los nucleótidos restantes. Después de la inactivación de la fosfatasa alcalina, los productos de la PCR del competidor y el ADNc se someten a la extensión del cebador, lo que genera señales de masa diferentes para los productos de PCR derivados del competidor y el ADNc. Después de la purificación, estos productos se administran en una matriz de chips, que se precarga con los componentes necesarios para el análisis con espectrometría de masas de tiempo de vuelo de desorción/ionización láser asistida por matriz (MALDI-TOF MS , por sus siglas en inglés) . El ADNc presente en la reacción a continuación se cuantifica mediante el análisis de la proporción de las áreas de los picos en el espectro de masas generado. Véanse más detalles, por ejemplo, en Ding y Cantor, Proc . Nati. Acad. Sci. USA 100:3059-3064 (2003) . d . Otros métodos basados en PCR Otras técnicas basadas en PCR incluyen, por ejemplo, el despliegue diferencial (Liang y Pardee, Science 257:967-971 (1992)); el polimorfismo en la longitud de fragmentos amplificados (iAFLP) (Kawamoto et al., Genome Res. 12:1305-1312 (1999)); la tecnología BeadArray™ (Illumina, San Diego, CA; Oliphant et al., Discovery of Markers for Disease (Supplement to Biotechniques ) , junio de 2002; Ferguson et al., Analytical Chemistry 72:5618 (2000)); el ensayo de microesferas para la detección de la expresión de genes (BADGE) , el uso del sistema LuminexlOO LabMAP disponible comercialmente y múltiples microesferas codificadas por color (Luminex Corp., Austin, TX) en un ensayo rápido para la expresión de genes (Yang et al., Genome Res. 11:1888-1898 (2001)); y el análisis de trazado de perfiles de expresión de alta cobertura (HiCEP) (Fukumura et al., Nucí. Acids. Res. 31(16) e94 (2003)) . 3. Mi cromatri ees La expresión diferencial de genes puede también identificarse o confirmarse mediante el uso de la técnica de análisis en micromatriz . Por consiguiente, el perfil de expresión de los genes asociados al cáncer de mama puede medirse en tejido de tumor fresco o con inclusiones de parafina, mediante el uso de tecnología de análisis de micromatriz. En este método, las secuencias de pol inuc leót idos de interés (incluidos los ADNc y oligonucleót idos ) se colocan en placas o en una matriz sobre el sustrato de un microchip. Las secuencias colocadas en la matriz a continuación se hibridan con sondas de ADN específicas a partir de células y tejidos de interés. Al igual que en el método de RT-PCR, la fuente de ARNm por lo general es ARN total aislado de tumores humanos o líneas celulares tumorales, que corresponden a tejidos o líneas celulares normales. Por consiguiente, el ARN puede aislarse de una variedad de tumores primarios o líneas celulares de tumores. Si la fuente de ARNm es un tumor primario, el ARNm puede extraerse, por ejemplo, de muestras de tejido congeladas o archivadas con inclusiones de parafina y fijas (por ejemplo, fijas a la formalina) , que se preparan y conservan rutinariamente en la práctica clínica diaria.
En una modalidad específica de la técnica de análisis en micromatriz, las inserciones de clones de ADNc amplificados por PC se aplican a un sustrato en una matriz densa. Preferentemente, al menos 10.000 secuencias de nucleótidos se aplican al sustrato. Los genes analizados por micromatriz, inmovilizados sobre el microchip a 10.000 elementos cada uno, son adecuados para la hibridación en condiciones rigurosas. Las sondas de ADNc marcadas con fluorescencia pueden generarse a través de la incorporación de nucleótidos fluorescentes mediante la transcripción inversa del ARN extraído de los tejidos de interés. Las sondas de ADNc marcadas aplicadas al chip se hibridan con especificidad para cada mancha de ADN sobre la matriz. Después del lavado riguroso para extraer las sondas que no se encuentran unidas específicamente, el chip se escanea mediante microscopía láser confocal u otro método de detección, como la cámara CCD . La cuant ificación de la hibridación de cada elemento colocado en la matriz permite la evaluación de la abundancia de ARNm correspondiente. Con la fluorescencia de dos colores, las sondas de ADNc marcadas de forma separada generadas a partir de dos fuentes de ARN se hibridan en pares en la matriz. La abundancia relativa de las transcripciones de las dos fuentes que corresponden a cada gen especificado por consiguiente se determina simultáneamente. La escala miniaturi zada de la hibridación proporciona una evaluación conveniente y rápida del patrón de expresión para un gran número de genes. Se ha demostrado que tales métodos tienen la sensibilidad requerida para detectar transcripciones raras, que se expresan en unas pocas copias por célula, y para detectar de forma reproducible diferencias de al menos aproximadamente dos veces en los niveles de expresión (Schena et al., Proc . Nati. Acad. Sci. USA 93 ( 2 ) : 106 - 149 (1996)) . El análisis en micromatriz puede llevarse a cabo con kits disponibles comercialmente , de acuerdo con los protocolos del fabricante, como mediante el uso de la tecnología Affymetrix GenChip, o la tecnología de análisis en micromatriz de Agilent.
El desarrollo de métodos de análisis en micromatriz para el análisis a gran escala de la expresión de genes hace que sea posible buscar sistemáticamente los marcadores moleculares de clasificación del cáncer y la predicción del desenlace en diversos tipos de tumores. 4. Análisis de expresión de genes mediante el secuenciado de ácidos nucleicos Las tecnologías de secuenciado de ácidos nucleicos son métodos adecuados para el análisis de la expresión de genes. El principio que subyace a estos métodos es que la cantidad de veces que se detecta una secuencia de ADNc en una muestra se relaciona directamente con la expresión relativa del ARNm que corresponde a la secuencia. Estos métodos a veces se denominan con el término expresión digital de genes (DGE, por sus siglas en inglés) para reflejar la propiedad numérica discreta de los datos resultantes. Los primeros métodos que aplicaron este principio fueron el análisis en serie de la expresión de genes (SAGE, por sus siglas en inglés) y la secuenciacion masiva de firmas en paralelo (MPSS, por sus siglas en inglés) . Véase, por ejemplo, S. Brenner, et al . , Nature Biotechnology 18 ( 6 ) : 630 - 634 (2000) . Más recientemente, el advenimiento de tecnologías de secuenciacion de "próxima generación" ha hecho que la DGE sea más simple y accesible, y tenga una capacidad de procesamiento más alta. Como resultado, más laboratorios pueden utilizar la DGE para detectar la expresión de más genes en más muestras de pacientes individuales que antes. Véase, por ejemplo, J. Marioni, Genome Research 18 ( 9) : 1509-1517 (2008); R. Morin, Genome Research 18 ( 4 ) : 610 - 621 (2008); A. Mortazavi, Nature Methods 5(7) :621-628 (2008); N. Cloonan, Nature Methods 5(7) :613-619 (2008) . 5. Aislamiento del ARN de los fluidos corporales Se han descrito métodos de aislamiento de ARN para el análisis de expresión de la sangre, el plasma y el suero (véase, por ejemplo, Tsui NB et al. (2002) 48,1647-53 y las referencias allí citadas) y de la orina (véase, por ejemplo, Boom R et al. (1990) J Clin Microbiol. 28, 495-503 y las referencias allí c i tadas ) . 6. Inmunohistoquimica Los métodos de inmunohistoquimica también son adecuados para detectar los niveles de expresión de los marcadores pronósticos de la presente invención. Por consiguiente, paira detectar la expresión se utilizan anticuerpos o antisueros, preferentemente antisueros policlonales y más preferentemente anticuerpos monoclonales específicos para cada marcador. Los anticuerpos pueden detectarse mediante el marcado de los anticuerpos en sí, por ejemplo, con marcadores radiactivos, marcadores fluorescentes, marcadores haptenos, como biotina, o una enzima como peroxidasa de rábano o fosfatasa alcalina. De forma alternativa, el anticuerpo primario sin marcar se utiliza conjuntamente con un anticuerpo secundario marcado, que comprende antisueros, antisueros policlonales o un anticuerpo monoclonal específico para el anticuerpo primario. Los protocolos y kits de inmunohi stoquímica son bien conocidos en la técnica y se encuentran disponibles comerc ialmente . 7. Proteómica El término "proteoma" se define como la totalidad de proteínas presentes en una muestra (por ejemplo, tejido, organismo o cultivo celular) en un cierto momento. La proteómica incluye, entre otras cosas, el estudio de los cambios globales en la expresión de proteínas en una muestra (también denominada "proteómica de expresión" ) . La proteómica en general incluye las siguientes etapas: (1) separación de proteínas individuales en una muestra mediante electroforesis en gel 2-D (2-D PAGE); (2) identificación de las proteínas individuales recuperadas del gel, por ejemplo, mediante espectrometría de masas o secuenciación del N-terminal, y (3) análisis de datos mediante el uso de bioinformát ica . Los métodos de proteómica son complementos valiosos para otros métodos de trazado de perfiles de expresión de genes y pueden utilizarse solos, o en combinación con otros métodos, para detectar los productos de los marcadores pronósticos de la presente invención. 8. Descripción general del aislamiento, la purificación y la amplificación del ARNm Las etapas de un protocolo representativo para el trazado de perfil de la expresión de genes mediante el uso de tejidos fijos con inclusiones de parafina como fuente de ARN, incluido el aislamiento de ARNm, la purificación, la extensión y amplificación de cebadores, se proporcionan en varios artículos de periódicos publicados (por ejemplo, T.E. Godfrey et al,. J. Molec. Diagnostics 2: 84-91
[2000]; K. Specht et al., A . J. Pathol .158: 419-29
[2001]) . En resumen, un proceso representativo comienza con el corte de secciones de aproximadamente 10 µ?? de espesor de muestras de tejido de tumores con inclusiones de parafina. A continuación, se extrae el ARN y se eliminan las proteínas y el AD . Después del análisis de la concentración de ARN, pueden incluirse etapas de reparación y/o amplificación de ARN, si fuera necesario, y el ARN se transcribe de forma inversa mediante el uso de cebadores específicos de genes seguidos por RT-PCR. Finalmente, los datos se analizan para identificar la o las mejores opciones de tratamiento disponibles para el paciente en virtud del patrón de expresión de genes característico identificado en la muestra de tumor examinada, que depende de la probabilidad prela de reaparición del cáncer . 9. Normal ización Los datos de expresión utilizados en los métodos divulgados en la presente pueden normalizarse. El término normalización se refiere a un proceso para corregir (normalizar), por ejemplo, las diferencias en la cantidad de ARN colocado en matriz y la variabilidad en la calidad del ARN utilizado, para extraer las fuentes indeseadas de variación sistemática en las mediciones de Ct y similares. Con respecto a los experimentos de RT-PCR que implican las muestras de tejido archivadas y fijas con inclusiones de parafina, se sabe que las fuentes de variación sistemática incluyen el grado de degradación del ARN con relación a la edad de la muestra del paciente y el tipo de solución de fijación utilizada para conservar la muestra. Otras fuentes de variación sistemática se atribuyen a las condiciones de procesamiento de laboratorio .
Los ensayos pueden permitir la normalización mediante la incorporación de la expresión de ciertos genes normal i zadores que no difieren significativamente en los niveles de expresión en las condiciones pertinentes. Los genes de normalización ejemplares incluyen los genes de mantenimiento como PGK1 y UBB (véase, por ejemplo, E. Eisenberg, et al., Trends in Genetics 19 ( 7 ) : 362 - 365 (2003) .) La normalización puede basarse en la señal media o mediana (CT) de todos los genes colocados en matrices o un gran grupo de estos (enfoque de normalización global) . En general, los genes de normalización, también denominados genes de referencia, deben ser genes que se sabe que no tienen una expresión significativamente diferente en el cáncer colorrectal en comparación con el tejido colorrectal no canceroso, y que no son afectados de forma significativa por varias condiciones de proceso y muestra, lo que permite la normalización de los efectos extraños.
A menos que se indique lo contrario, los niveles de expresión normalizados para cada ARNm/ tumor/paciente probado se expresarán como el porcentaje del nivel de expresión medido en el grupo de referencia. El grupo de referencia de un número suficientemente alto de tumores (por ejemplo, 40) proporciona una distribución de niveles normalizados de cada especie de ARNm . El nivel medido en una muestra de tumor particular para analizarse cae en algún percentil dentro de este intervalo, que puede determinarse mediante métodos bien conocidos en la técnica .
En las modalidades ejemplares, se utilizan uno o más de los siguientes genes como referencia, mediante lo cual se normalizan los datos de expresión: AAMP, ARF1 , EEF1A1 , ESD, GPS1, H3F3A, HNRPC, RPL13A, RPL41, RPS23, RPS27, SDHA , TCEA1 , UBB , Y HAZ , B-actina, GUS , GAPDH, RPLPO y TFRC . Por ejemplo, las mediciones medias de Ct calibradas y ponderadas para cada uno de los genes pronósticos pueden normalizarse con relación a la media de al menos tres genes de referencia, al menos cuatro genes de referencia o al menos cinco genes de referencia.
El entendido en la técnica reconocerá que la normalización puede lograrse de varias formas y las técnicas descritas anteriormente pretenden ser únicamente ejemplares, no exhaustivas.
RESULTADOS DE LOS INFORMES Los métodos de la presente divulgación son adecuados para la preparación de informes que resumen el desenlace clínico esperado o preel que resulta de los métodos de la presente divulgación. Un "informe", como se describe en la presente, es un documento electrónico o tangible que incluye elementos de informe que proporcionan información de interés relacionada con una evaluación de probabilidad o una evaluación de riesgo y sus resultados. El informe de un individuo incluye al menos una evaluación de probabilidad o una evaluación de riesgo, por ejemplo, un indicio en cuanto al riesgo de reaparición del cáncer de mama, incluida la reaparición local y la metástasis del cáncer de mama. El informe de un individuo puede incluir una evaluación o estimación de una o más de: supervivencia sin enfermedad, supervivencia sin reaparición, supervivencia sin metástasis y supervivencia global. El informe de un individuo puede generarse total o parcialmente en forma electrónica, por ejemplo, presentarse en una pantalla electrónica (por ejemplo, monitor de computadora) . El informe puede incluir además uno o más de: 1) información con respecto al lugar donde se realizó la prueba; 2) información acerca del proveedor de servicios, 3) datos del paciente; 4) datos de la muestra; 5) un informe interpreta ivo que puede incluir informaciones diversas que incluyen: a) indicación; b) datos de prueba, donde los datos de prueba pueden incluir un nivel normalizado de uno o más genes de interés, y 6) otras características.
La presente divulgación por consiguiente proporciona métodos para crear informes y los informes que resultan de estos. El informe puede incluir un resumen de los niveles de expresión de las transcripciones de AR , o los productos de expresión de las transcripciones de ARN, para ciertos genes en las células obtenidas del tumor del paciente. El informe puede incluir información relacionada con covariables de pronóstico del paciente. El informe puede incluir información estimada de que el paciente tiene un mayor riesgo de reaparición. La estimación puede ser en la forma de un esquema de estratificación de valores o pacientes (por ejemplo, riesgo de reaparición bajo, intermedio o alto) . El informe puede incluir información pertinente para ayudar a decidir la cirugía (por ejemplo, mastectomía parcial o total) o el tratamiento más adecuado para el paciente.
Por consiguiente, en algunas modalidades, los métodos de la presente divulgación incluyen además la generación de un informe que incluye información con respecto al desenlace clínico probable del paciente, por ejemplo, el riesgo de reaparición. Por ejemplo, los métodos divulgados en la presente pueden incluir además una etapa de generación o devolución de un informe que proporciona los resultados de la evaluación de riesgos de un individuo; el informe puede proporcionarse en forma de un medio electrónico (por ejemplo, una pantalla electrónica en un monitor de computadora) o de un medio tangible (por ejemplo, un informe impreso en papel u otro medio tangible) .
Se proporciona al usuario un informe que incluye información acerca del probable pronóstico del paciente (por ejemplo, la probabilidad de que una paciente que padezca de cáncer de mama tenga un buen pronóstico o desenlace clínico positivo en respuesta a la cirugía y/o el tratamiento) . La evaluación en cuanto a la probabilidad se denomina a continuación como "informe de riesgo" o, simplemente, "valor de riesgo" . La persona o entidad que prepara el informe ("generador del informe") también puede realizar una evaluación de probabilidad. El generador del informe puede llevar a cabo una o más recolecciones de muestras, procesamiento de muestras y generación de datos, por ejemplo, el generador del informe puede también llevar a cabo uno o más de: a) recolección de muestras; b) procesamiento de muestras; c) medición del nivel de un gen de riesgo; d) medición del nivel de un gen de referencia; y e) determinación de un nivel normalizado de un gen de riesgo. De forma alternativa, una entidad diferente al generador del informe puede llevar a cabo una o más recolecciones de muestras, procesamiento de muestras y generación de datos .
A los efectos de proporcionar una mayor claridad, debe apreciarse que el término "usuario", que se utiliza de forma intercambiable con "cliente" , pretende referirse a una persona o entidad a la cual se transmite un informe y puede ser la misma persona o entidad que lleva a cabo uno o más de lo siguiente: a) recolectar una muestra; b) procesar una muestra; c) proporcionar una muestra o una muestra procesada; y d) generar datos (por ejemplo, el nivel de un gen de riesgo; nivel de uno o más productos de un gen de referencia; nivel normalizado de un gen de riesgo ("gen pronóstico") para su uso en la evaluación de la probabilidad. En algunos casos, la persona o entidad que realiza la recolección de las muestras y/o el procesamiento de las muestras y/o la generación de datos y la persona que recibe los resultados y/o el informe pueden ser personas diferentes, pero ambas se denominan "usuarios" o "clientes" en la presente, para evitar confusiones. En ciertas modalidades, por ejemplo, donde los métodos se ejecutan completamente en una única computadora, el usuario o cliente realiza el ingreso de datos y analiza la salida de datos. El "usuario" puede ser un profesional de la salud (por ejemplo, un médico, un técnico de laboratorio, un físico (por ejemplo, un oncólogo, un cirujano, un patólogo) , etc.) .
En las modalidades en que el usuario solamente ejecuta una parte del método, el individuo que, después del procesamiento de datos computari zado de conformidad con los métodos de la presente divulgación, analiza la salida de datos (por ejemplo, los resultados antes del lanzamiento para proporcionar un informe completo o que analiza un informe "incompleto" y prevé una intervención manual y finalización de un informe interpretativo) se denomina en la presente "analizador". El analizador puede encontrarse en una ubicación remota con respecto al usuario (por ejemplo, en un servicio proporcionado de forma separada de la institución de cuidado de la salud donde puede encontrarse el usuario) .
En los casos en que corresponda aplicar regulaciones gubernamentales u otras restricciones (por ejemplo, requisitos de salud, mala praxis o seguro de responsabilidad), todos los resultados, ya sea generados completa o parcialmente de forma electrónica, se someten a un control de calidad de rutina antes de ponerse a disposición del usuario.
UTILIDAD CLÍNICA El ensayo de expresión de genes y la información proporcionada por la práctica de los métodos divulgados en la presente facilitan que los médicos puedan tomar decisiones más completas respecto del tratamiento, así como la personalización del tratamiento del cáncer según las necesidades de cada paciente, lo que maximiza el beneficio del tratamiento y minimiza la exposición de los pacientes a tratamientos innecesarios que pueden proporcionar beneficios escasos o insignif icativos y que a menudo acarrean riesgos serios debido a los efectos secundarios tóxicos.
Las pruebas de expresión de genes de analitos simples o múltiples pueden utilizarse para medir el nivel de expresión de uno o más genes implicados en cada uno de los varios procesos fisiológicos o características de los componentes celulares. El o los niveles de expresión pueden utilizarse para calcular el valor cuantitativo y ese valor puede disponerse en subgrupos (por ejemplo, terciles) donde todos los pacientes en un intervalo dado se clasifican como pertenecientes a una categoría de riesgo (por ejemplo, bajo, intermedio o alto) . La agrupación de genes puede realizarse, al menos en parte, sobre la base del conocimiento del aporte de los genes de conformidad con las funciones fisiológicas o las características de los componentes celulares, como en los grupos discutidos anteriormente.
La utilidad de un marcador de genes en la predicción del cáncer puede no ser única para ese marcador. Un marcador alternativo que tiene un patrón de expresión paralelo al del gen seleccionado por el marcador puede ser sustituido por, o utilizarse de manera adicional a, un marcador de prueba. Debido a la coexpresión de tales genes, la sustitución de los valores del nivel de expresión debería tener un impacto pequeño en la utilidad de pronóstico global de la prueba. Los patrones de expresión muy similares de dos genes pueden resultar de la participación de ambos genes en el mismo proceso y/o de que se encuentren bajo un control regulatorio común en las células tumorales del colon. Por consiguiente, la presente divulgación contempla el uso de tales genes coexpresados o grupos de genes como sustitutos para, o agregados a, los métodos pronósticos de la presente divulgación.
El ensayo molecular y la información asociada proporcionada por los métodos divulgados en la presente para predecir el desenlace clínico del cáncer, por ejemplo, cáncer de mama, son de utilidad en varias áreas, incluido el desarrollo y uso adecuado de fármacos para tratar el cáncer, la estratificación de los pacientes que padecen cáncer para su inclusión en (o exclusión de) estudios clínicos, la ayuda a pacientes y médicos en la toma de decisiones de tratamiento, la generación de beneficios económicos mediante el direcc ionamiento del tratamiento en virtud de un perfil genómico personalizado y similares. Por ejemplo, el valor de reaparición puede utilizarse en muestras extraídas de pacientes en un estudio clínico y los resultados de la prueba utilizados junto con los resultados del paciente para determinar si es más o menos probable que los subgrupos de pacientes demuestren un beneficio absoluto con un nuevo fármaco en comparación con la totalidad del grupo u otros subgrupos. Además, tales métodos pueden utilizarse para identificar, a partir de datos clínicos, subgrupos de pacientes que se espera que se beneficien de la terapia adyuvante. Asimismo, es más probable que un paciente se incluya en un estudio clínico si los resultados de la prueba indican una mayor probabilidad de que el paciente tenga un mal desenlace clínico si se le trata solo con cirugía y es menos probable que un paciente se incluya en un estudio clínico si los resultados de la prueba indican una menor probabilidad de que el paciente tenga un mal desenlace clínico si se le trata solo con cirugía.
ANÁLISIS ESTADÍSTICO DE LOS NIVELES DE EXPRESIÓN DE GENES El entendido en la técnica reconocerá que existen muchos métodos estadísticos que pueden utilizarse para determinar si existe una relación significativa entre un desenlace de interés (por ejemplo, la probabilidad de supervivencia, la probabilidad de respuesta a la quimioterapia) y los niveles de expresión de un gen marcador como se describe en la presente. Esta relación puede presentarse como un valor de reaparición continuo (RS, por sus siglas en inglés) o los pacientes pueden estratificarse en grupos de riesgo (por ejemplo, bajo, intermedio, alto) . Por ejemplo, el modelo de regresión de riesgos proporcionales de Cox puede ajustarse a un criterio de valoración clínico particular (por ejemplo, RFS, DFS, OS) . Una suposición del modelo de regresión de riesgos proporcionales de Cox es el supuesto de riesgos proporcionales, es decir, la suposición de que los parámetros de efecto multiplican el riesgo subyacente.
ANALISIS DE COEXPRESIÓN La presente divulgación proporciona genes que se coexpresan con genes determinados pronósticos y/o predictivos que se ha identificado que tienen una correlación significativa con la reaparición y/o el beneficio del tratamiento. Para llevar a cabo procesos biológicos particulares, los genes a menudo trabajan juntos de manera coordinada, es decir, se coexpresan. Los grupos de genes coexpresados identificados para un proceso de enfermedad como el cáncer pueden servir como biomarcadores para la progresión de la enfermedad y la respuesta al tratamiento. Tales genes coexpresados pueden probarse en lugar de, o además de, la prueba de los genes pronósticos y/o predictivos con los cuales se coexpresan.
El entendido en la técnica reconocerá que muchos métodos de análisis de coexpresión actualmente conocidos o desarrollados con posterioridad se encontrarán dentro del alcance y espíritu de la presente invención. Estos métodos pueden incorporar, por ejemplo, coeficientes de correlación, análisis de red de coexpresión, análisis de grupos, etc., y pueden basarse en los datos de expresión de RT-PCR, análisis en micromatriz, secuenciación y otras tecnologías similares. Por ejemplo, los grupos de expresión de genes pueden identificarse mediante el uso de análisis de correlación en pares en virtud de los coeficientes de correlación de Pearson o Spearman. (Véase, por ejemplo, Pearson K. y Lee A., Biometrika 2, 357 (1902) ; C. Spearman, Amer. J. Psychol 15:72-101 (1904) ; J. Myers, A. Well, Research Design and Statistical Analysis, p. 508 (2- Ed . , 2003) .) En general, un coeficiente de correlación igual o mayor de 0,3 se considera estadísticamente significativo en un tamaño de muestra de al menos 20. (Ver, por ejemplo, G. Norman, D. Streiner, Biostatist ics : The Bare Essentials, 137-138 (3rd Ed . 2007) .) En una modalidad divulgada en la presente, los genes coexpresados se identificaron mediante el uso de un valor de correlación de Spearman de al menos 0,7.
PROGRAMA INFORMÁTICO Los valores de los ensayos descritos anteriormente, como los datos de expresión, el valor de reaparición, el valor de tratamiento y/o el valor de beneficio, pueden calcularse y almacenarse manualmente. De forma alternativa, las etapas descritas anteriormente pueden realizarse de forma total o parcial mediante un producto de programa informático. Por consiguiente, la presente invención proporciona un producto de programa informático que incluye un medio de almacenamiento legible con la computadora que tiene un programa informático almacenado en él. El programa puede, cuando se lee con la computadora, realizar cálculos pertinentes basados en los valores obtenidos del análisis de una o más muestras biológicas de un individuo (por ejemplo, niveles de expresión de genes, normalización, umbral y conversión de valores de los ensayos a un valor y/o representación gráfica de la probabilidad de reaparición/respuesta a la quimioterapia, coexpresión de genes o análisis de grupos y similares) . El producto del programa informático tiene almacenado un programa informático para realizar el cálculo.
La presente divulgación proporciona sistemas para ejecutar el programa descrito anteriormente, el sistema generalmente incluye: a) un ambiente informático central; b) un dispositivo de introducción de datos, conectado operativamente al ambiente informático, para recibir datos del paciente, donde los datos del paciente pueden incluir, por ejemplo, el nivel de expresión u otro valor obtenido de un ensayo mediante el uso de una muestra biológica del paciente, o datos del análisis en micromatriz, como ya se describió en detalle; c) un dispositivo de salida, conectado al ambiente informático para proporcionar información al usuario (por ejemplo, personal médico) ; y d) un algoritmo ejecutado por el ambiente informático central (por ejemplo, un procesador) , donde el algoritmo se ejecuta en virtud de los datos recibidos por el dispositivo de introducción de datos, y donde el algoritmo calcula el riesgo, el valor de riesgo o la clasificación de grupo de tratamiento, el análisis de coexpresión de genes, el umbral u otras funciones descritas en la presente. Los métodos proporcionados por la presente invención también pueden automatizarse total o parcialmente.
MÉTODOS Y PRODUCTOS MANUALES Y ASISTIDOS POR COMPUTADORA Los métodos y sistemas descritos en la presente pueden implementarse de numerosas formas. En una modalidad de interés particular, los métodos implican el uso de una infraestructura de comunicaciones, por ejemplo Internet. Varias modalidades se discuten a continuación. Asimismo debe entenderse que la presente divulgación puede implementarse de varias formas de hardware, software, memoria fija, procesadores o una combinación de estos. Los métodos y sistemas descritos en la presente pueden implementarse como una combinación de hardware y software. El software puede implementarse como un programa de aplicación contenido de forma tangible en un dispositivo de almacenamiento de programas o diferentes porciones de software implementadas en el ambiente informático del usuario (por ejemplo, como una aplicación) y en el ambiente informático del analizador, donde el analizador puede ubicarse en un sitio remoto asociado (por ejemplo, en una instalación de servicios del proveedor) .
Por ejemplo, durante o después del ingreso de datos, algunas partes del procesamiento de datos pueden realizarse en el ambiente informático del usuario. Por ejemplo, el ambiente informático del usuario puede programarse para proporcionar códigos de prueba definidos para indicar una probabilidad de "valor de riesgo", donde el valor se transmite como respuestas procesadas o parcialmente procesadas al ambiente informático del analizador en forma de código de prueba para la posterior ejecución de uno o más algoritmos para proporcionar resultados y/o generar un informe en el ambiente informático del analizador. El valor de riesgo puede ser un valor numérico (representativo de un valor numérico, por ejemplo, la probabilidad de reaparición basada en la población de un estudio de validación) o un valor no numérico representativo de un valor numérico o intervalo de valores numéricos (por ejemplo, bajo, intermedio o alto) .
El programa de aplicación para ejecutar los algoritmos descritos en la presente puede cargarse a una máquina que comprende cualquier arquitectura adecuada y ejecutarse a través de ella. En general, la máquina implica una plataforma informática que tiene hardware , como una o más unidades centrales de procesamiento (CPU) , una memoria de acceso aleatorio (RAM, por sus siglas en inglés) e interfases de entrada/salida. La plataforma informática incluye además un sistema operativo y un código de microinstrucción . Los diferentes procesos y funciones descritos en la presente pueden ser parte del código de microinstrucción o del programa de aplicación (o su combinación) que se ejecuta mediante el sistema operativo. Además, otros dispositivos periféricos pueden conectarse a la plataforma informática, como un dispositivo adicional de almacenamiento de datos y un dispositivo de impresión.
Como sistema informático, el sistema generalmente incluye una unidad de procesamiento. La unidad de procesamiento funciona para recibir información, que puede incluir datos de prueba (por ejemplo, el nivel de un gen de riesgo, el nivel de los productos de un gen de referencia, el nivel normalizado de un gen) y también puede incluir otros datos como datos del paciente. Esta información recibida puede almacenarse, al menos temporalmente, en una base de datos y los datos pueden analizarse para generar un informe como se describe anteriormente .
Todos o parte de los datos de entrada y salida pueden además enviarse electrónicamente; ciertos datos de salida (por ejemplo, informes) pueden enviarse electrónicamente o vía telefónica (por ejemplo, por facsímil, por ejemplo, mediante el uso de dispositivos como un fax) . Los dispositivos receptores de salida ejemplares pueden incluir un elemento de visualización, una impresora, un dispositivo facsímil y similares. Las formas electrónicas de transmisión y/o visualización pueden incluir correo electrónico, televisión interactiva y similares. En una modalidad de interés particular, todos o parte de los datos de entrada y/o todos o parte de los datos de salida (por ejemplo, habitualmente al menos el informe final) se mantienen en un servidor web para poder acceder a ellos, preferentemente de modo confidencial, con navegadores típicos. Los datos pueden enviarse a los profesionales de la salud o estos pueden acceder a ellos en la forma deseada. Los datos de entrada y de salida, incluidos todos o una parte del informe final, pueden utilizarse para completar la historia clínica de un paciente que puede existir en una base de datos confidencial en la institución de atención de salud.
Un sistema para usar en los métodos descritos en la presente generalmente incluye al menos un procesador informático (por ejemplo, cuando el método se lleva a cabo en su totalidad en un único sitio) o al menos dos procesadores informáticos en red (por ejemplo, cuando los datos deben ser ingresados por el usuario (también denominado "cliente") y transmitidos a un sitio remoto a un segundo procesador informático para el análisis, donde el primer y segundo procesadores informáticos están conectados por una red, por ejemplo, una intranet o Internet) . El sistema puede incluir además uno o más componentes del usuario para el ingreso y uno o más componentes del analizador para el análisis de datos, informes generados e intervención manual. Los componentes adicionales del sistema pueden incluir uno o más componentes de un servidor y una o más bases de datos para almacenar información (por ejemplo, como en una base de datos de elementos de informe, por ejemplo, elementos de informe interpretativo, o una base de datos relacional (RDB, por sus siglas en inglés) que puede incluir el ingreso .de datos por el usuario y la salida de datos) . Los procesadores informáticos pueden ser procesadores que se encuentran generalmente en computadoras personales de escritorio (por ejemplo, IBM, Dell, Macintosh), computadoras portátiles, computadoras centrales, minicomputadoras u otros dispositivos informát icos .
La arquitectura de cliente/servidor en red puede seleccionarse en la forma deseada y puede ser, por ejemplo, un modelo de servidor de cliente clásico de dos o tres filas. Un sistema de gestión de base de datos relacional (RDMS, por sus siglas en inglés) , ya sea como parte de un componente de servidor de aplicación o como un componente aparte (máquina RDB) , proporciona una interfase para la base de datos.
En un ejemplo, la arquitectura se proporciona como una arquitectura cliente/servidor centrada en una base de datos, en la cual la aplicación del cliente generalmente requiere servicios del servidor de aplicación que realiza consultas a la base de datos (o al servidor de base de datos) para completar el informe con los diversos elementos de informe necesarios, particularmente los elementos de informe interpretativos, especialmente los textos y alertas de interpretación. El o los servidores (por ejemplo, ya sea como parte de la máquina de servidor de aplicación o una máquina de base de datos relacional/RDB aparte) responden a las consultas del cliente.
Los componentes de ingreso de datos del cliente pueden ser computadoras personales completas e independientes que ofrecen una amplia gama de potencia y características para ejecutar aplicaciones. El componente del cliente generalmente funciona en cualquier sistema operativo deseado e incluye un elemento de comunicación (por ejemplo, un módem u otro hardware para conectarse a una red) , uno o más dispositivos de ingreso de datos (por ejemplo, teclado, ratón, teclado numérico u otro dispositivo utilizado para transferir información o comandos) , un elemento de almacenamiento (por ejemplo, un disco duro u otro medio de almacenamiento legible por computadora o que puede ser escrito por computadora) y un elemento de visualización (por ejemplo, monitor, televisión, LCD, LED u otro dispositivo de visualización que proporciona información al usuario) . El usuario ingresa los comandos de entrada en el procesador informático a través de un dispositivo de ingreso de datos. Generalmente, la interfase del usuario es una interfase de usuario gráfica (GUI, por sus siglas en inglés) escrita para aplicaciones de navegador web.
El o los componentes del servidor pueden ser una computadora personal, una minicomputadora o una unidad central y ofrecen la gestión de datos, información compartida entre clientes, administración de red y seguridad. La aplicación y cualquier base de datos que se utilice pueden encontrarse en el mismo servidor o en servidores diferentes.
Se contemplan otras configuraciones informáticas para el cliente y el o los servidores, incluido el procesamiento en una única máquina, como una unidad central, un grupo de máquinas u otra configuración adecuada. En general, las máquinas del cliente y del servidor trabajan juntas para lograr el procesamiento de la presente divulgación.
Cuando se utilizan, las bases de datos habi tualmente se encuentran conectadas al componente servidor de la base de datos y pueden ser cualquier dispositivo que almacene datos. Por ejemplo, la base de datos puede ser cualquier dispositivo de almacenamiento magnético u óptico para computadora (por ejemplo, CDROM, disco duro interno, mecanismo impulsor de cinta) . La base de datos puede ubicarse de forma remota al componente servidor (con acceso a través de una red, módem, etc.) o de forma local con respecto al componente servidor.
Cuando se utiliza en el sistema y los métodos, la base de datos puede ser una base de datos relacional que se encuentra organizada, y a la cual se puede acceder, de conformidad con las relaciones entre los artículos de datos. La base de datos relacional generalmente se compone de una pluralidad de tablas (entidades) . Las filas de las tablas representan registros (recolecciones de información acerca de diferentes artículos) y las columnas representan campos (atributos particulares de un registro) . En su concepción más simple, la base de datos relacional es un conjunto de entradas de datos que se "relacionan" entre sí a través de al menos un campo común.
Las estaciones de trabajo adicionales equipadas con computadoras e impresoras pueden utilizarse en el punto de servicio para ingresar datos y, en algunas modalidades, generar informes adecuados, si se desea. Las computadoras pueden tener un acceso directo (por ejemplo, en el escritorio) para ejecutar la aplicación, a fin de facilitar el inicio del ingreso de datos, la transmisión, el análisis, la recepción de informes, etc., según se desee.
MEDIO DE ALMACENAMIENTO LEGIBLE POR COMPUTADORA La presente divulgación contempla además un medio de almacenamiento legible por computadora (por ejemplo, CD-ROM, tecla de memoria, tarjeta de memoria flash, disquete, etc.) en el cual se almacena un programa que, al ejecutarlo en un ambiente informático, permite la implementación de algoritmos para realizar todos o parte de los resultados de una evaluación de probabilidad de respuesta como se describe en la presente. Cuando el medio legible por computadora contiene un programa completo para realizar los métodos descritos en la presente, el programa incluye instrucciones de programa para recabar, analizar y generar salidas, y generalmente incluye dispositivos de código legibles por computadora para interactuar con un usuario como se describe en la presente, el procesamiento de el datos junto con la información analítica y la generación de un medio electrónico o impreso único para el usuario.
Cuando el medio de almacenamiento proporciona un programa que permite la implementación de una parte de los métodos descritos en la presente (por ejemplo, el aspecto del lado del usuario de los métodos (por ejemplo, ingreso de datos, funcionalidad de recepción de informes, etc.)), el programa permite la transmisión de los datos ingresados por el usuario (por ejemplo, mediante Internet, intranet, etc.) a un ambiente informático en un sitio remoto. El procesamiento o la finalización del procesamiento de los datos se lleva a cabo en el sitio remoto para generar un informe. Después del análisis del informe y la finalización de cualquier intervención manual necesaria para proporcionar un informe completo, el informe completo se vuelve a transmitir al usuario como un documento electrónico o impreso (por ejemplo, un informe en papel enviado por fax o correo electrónico) . El medio de almacenamiento que contiene un programa de conformidad con la presente divulgación puede empaquetarse con instrucciones (por ejemplo, para la instalación del programa, el uso, etc.) grabadas en un sustrato adecuado o una dirección web donde pueden obtenerse las instrucciones. El medio de almacenamiento legible por computadora puede además proporcionarse en combinación con uno o más reactivos para realizar la evaluación de la probabilidad de respuesta (por ejemplo, cebadores, sondas, matrices u otros componentes del kit) .
Todos los aspectos de la presente invención pueden además llevarse a cabo de forma que un número limitado de genes adicionales que se coexpresan con los genes divulgados, por ejemplo, como lo prueban los coeficientes de correlación de Pearson o Spearman estadísticamente significativos, se incluyan en una prueba de pronóstico o predictiva además de y/o en lugar de los genes divulgados.
Una vez descrita la invención, será más fácil comprenderla a través de la referencia a los siguientes ejemplos, que se proporcionan a modo de ilustración y no pretenden limitar la invención de ninguna forma.
EJEMPLO 1 : El estudio incluyó muestras de tumor de cáncer de mama obtenidas de 136 pacientes a las que se diagnosticó cáncer de mama ("Estudio de previsión") . Los estudios de modelado bioestadí st ico de los conjuntos de datos prototípicos demostraron que el ARN amplificado es un sustrato útil para los estudios de identificación de biomarcadores . Esto se verificó en el presente estudio mediante la inclusión de biomarcadores de cáncer de mama conocidos junto con los genes pronósticos candidatos en las muestras de tejidos. Se mostró que los biomarcadores conocidos están asociados con el desenlace clínico en el ARN amplificado sobre la base de los criterios descritos en este protocolo.
Diseño del estudio Consulte el protocolo de estudio de previsión de fase II original para obtener información acerca de especímenes de biopsia. El estudio se enfocó en la asociación estadística entre el desenlace clínico y los biomarcadores de 384 candidatos probados en muestras amplificadas derivadas de 25 ng de ARNm que se extrajo de las muestras de tejido fijas con inclusiones de parafina obtenidas de 136 muestras del estudio de previsión de fase II original. El nivel de expresión de los genes candidatos se normalizó mediante el uso de genes de referencia. Se analizaron varios genes de referencia en el presente estudio: AAMP, ARF1, EEF1A1 , ESD, GPS1 , H3F3A, HNRPC , RPL13A, RPL41, RPS23, RPS27, SDHA , TCEA1 , UBB , Y HAZ , B-actina, GUS, GAPDH, RPLPO y TFRC .
Las 136 muestras se separaron en 3 placas de RT automatizadas con 2X 48 muestras y una con 40 muestras y 3 controles RT positivo y negativo. Los ensayos cuantitativos de PCR se realizaron en 384 pocilios sin replicar mediante el uso de QuantiTect Probé PCR Master Mix® (Qiagen) . Las placas se analizaron en el Light Cycler® 480 y, después del control de calidad de datos, todas las muestras de la placa de RT 3 se repitieron y se generaron nuevos datos de RT-PCR. Los datos se normalizaron mediante la resta del punto de cruce medio (CP) (punto en el cual la detección se eleva por encima de la señal de fondo) para cinco genes de referencia del valor CP para cada gen candidato individual. Esta normalización se realiza en cada muestra, lo que resulta en datos finales ajustados para las diferencias en la CP de la muestra total. Este conjunto de datos se utilizó para el análisis final de datos.
Análisis de datos Para cada gen se ejecutó una prueba z estándar. (S. Darby, J. Reissland, Journal of the Royal Statistical Society 144 ( 3 ) : 298 - 331 (1981)) . Esto devuelve un valor z (medida de distancia en las desviaciones estándar de una muestra de la media) , un valor p y residuos junto con otras estadísticas y parámetros del modelo. Si el valor z es negativo, la expresión se correlaciona positivamente con un buen pronóstico; si es positivo, la expresión se correlaciona negativamente con un buen pronóstico. Mediante el uso de los valores p, se creó un valor q mediante el uso de un valor q de biblioteca. Los genes poco correlacionados y expresados débilmente se excluyeron del cálculo de la distribución utilizada para los valores q. Para cada gen, la prueba del modelo de regresión de riesgos proporcionales de Cox se llevó a cabo mediante la verificación del tiempo de supervivencia correspondiente al vector de evento contra la expresión de genes. Esto devolvió una tasa de riesgo (HR) que estima el efecto de la expresión de cada gen (individualmente) ante el riesgo de un evento relacionado con cáncer. Los datos resultantes se proporcionan en las tablas 1-6. Una HR < 1 indica que la expresión de el gen se encuentra asociada positivamente con un buen pronóstico, mientras que una HR > 1 indica que la expresión de el gen se encuentra asociada negativamente con un buen pronóstico.
EJEMPLO 2 : Diseño del estudio Las muestras amplificadas se derivaron de 25 ng de ARNm que se extrajo de las muestras de tejido fijas con inclusiones de parafina obtenidas de 78 casos evaluables de un estudio de cáncer de mama de fase II llevado a cabo en el Rush University Medical Center. Tres de las muestras no proporcionaron ARN amplificado suficiente a 25 ng, por lo que la amplificación se repitió una segunda vez con 50 ng de ARN. El estudio analizó además varios genes de referencia para su uso en la normalización: AAMP, ARF1, EEF1A1, ESD, GPS1, H3F3A, HNRPC, RPL13A, RPL41, RPS23, RPS27, SDHA, TCEA1, UBB, YWHAZ, Beta-actina, RPLPO, TFRC, GUS y GAPDH.
Los ensayos se realizaron en 384 pocilios sin replicar mediante el uso de QuantiTect Probé PCR Master Mix. Las placas se analizaron sobre los instrumentos del Light Cycler 480. Este conjunto de datos se utilizó para el análisis de datos final. Los datos se normalizaron restando el punto de cruce medio (CP) para cinco genes de referencia del valor CP para cada gen candidato individual. Esta normalización se realizó en cada muestra, lo que resultó en datos finales ajustados para las diferencias en la CP de la muestra total .
Análisis de datos Hubo 34 muestras con valores CP medios mayores de 35. No obstante, ninguna de las muestras se excluyó del análisis debido a que se estimó que contenían suficiente información valiosa para permanecer en el estudio. Se utilizó el análisis de componentes principales (PCA, por sus siglas en inglés) para determinar si hubo un efecto de placa que causó variación a lo largo de las diferentes placas de RT . El primer componente principal se correlacionó bien con los valores de expresión medianos, lo que indicó que el nivel de expresión explicaba la mayoría de las variaciones entre las muestras. Asimismo, no hubo variaciones inesperadas entre las placas.
Datos para otras variables Grupo - Los pacientes se dividieron en dos grupos (cáncer/sin cáncer) . Hubo poca diferencia entre los dos en la expresión de genes total ya que la diferencia entre los valores de CP medianos en cada grupo fue mínima (0,7) .
Edad de la muestra - Las muestras variaron ampliamente en su expresión de genes total, pero hubo una tendencia hacia los valores de CP más bajos a medida que disminuía la edad.
Instrumento - La expresión de genes total de la muestra de un instrumento a otro fue uniforme. Un instrumento mostró CP medianos levemente más altos en comparación con los otros tres, pero se encontró dentro de la variación aceptable.
Placa de RT - La expresión de genes total de la muestra entre las placas RT también fue muy uniforme. Los CP medianos para cada una de las 3 placas de RT (2 placas de RT automatizadas y 1 placa manual que contenía muestras repetidas) se encontraron dentro de 1 CP de cada una.
Anál is i s univari ado para genes significativamente diferentes entre los grupos de estudio Los genes se analizaron mediante el uso de la prueba z y el modelo de regresión de riesgos proporcionales de Cox, como se describe en el ejemplo 1. Los datos resultantes pueden observarse en las tablas 7-12.
EJEMPLO 3 : Las correlaciones estadísticas entre el desenlace clínico y los niveles de expresión de los genes identificados en los ejemplos 1 y 2 se validaron en los conjuntos de datos de expresión de genes de cáncer de mama archivados por el Instituto Suizo de Bioinformát ica (SIB, por sus siglas en inglés) . En P. irapati, et al., Breast Cáncer Research 10(4) :R65 (2008) se proporciona información adicional respecto de la base de datos del SIB, los conjuntos de datos de estudio y los métodos de procesamiento. Los análisis univariados de riesgos proporcionales de Cox se llevaron a cabo para confirmar la relación entre el desenlace clínico (DFS, MFS , OS) de las pacientes que padecían cáncer de mama y los niveles de expresión de los genes identificados como significativos en los estudios de ARN amplificado descritos anteriormente. El análisis meta incluyó ambos modelos de efecto fijo y efecto aleatorio que se describen en detalle en L. Hedges y J. Vevea, Psychological Methods 3 (4) : 486-504 (1998) y en K. Sidik y J. Jonkman, Statistics in Medicine 26:1964-1981 (2006) (cuyo contenido se incorpora en la presente a modo de referencia) . Los resultados de la validación para todos los genes identificados por tener una asociación estadísticamente significativa con el desenlace clínico del cáncer de mama se describen en la tabla 13. En las tablas, "Est" designa un coeficiente estimado de una covariable (expresión de genes) ; "SE" significa error estándar; "t" es el valor t para esa estimación (es decir, Est/SE) ; y "fe" es la estimación fija de efecto que surge del análisis meta. Varias familias de genes con una asociación estadística significativa con el desenlace clínico (incluidos los grupos de genes metabólicos, de proliferación, inmunes y estromales) del cáncer de mama se confirmaron mediante el uso del conjunto de datos del SIB. Por ejemplo, la tabla 14 contiene el análisis de genes incluidos en el grupo metabólico y la tabla 15 del grupo estromal .
EJEMPLO 4: El análisis de coexpresión se llevó a cabo mediante el uso de los datos del análisis en micromatriz de seis (6) conjuntos de datos de cáncer de mama. Si bien los valores de expresión "procesados" se tomaron del sitio web de GEO , fue necesario un procesamiento adicional. Si los valores de expresión son RMA, se normalizan por mediana en el nivel de muestra. Si los valores de expresión son MAS5.0: (1) se cambian a 10 si son <10; (2) se transforman a base log; y (3) se normalizan por mediana en el nivel de muestra .
Pares de correlación generados: se generó una matriz de clasificación mediante la disposición de los valores de expresión para cada muestra en orden decreciente. A continuación se creó una matriz de correlación mediante el cálculo de los valores de correlación de Spearman para cada par de ID de sonda. Los pares de sonda que tenían un valor de Spearman = 0,7 se consideraron coexpresados. Se identificaron los pares de correlación redundantes o superpuestos en múltiples conjuntos de datos. Para cada matriz de correlación generada a partir de un conjunto de datos de matriz, se identificaron los pares de sondas significativos que ocurren en el conjunto de datos >1. Esto sirvió para filtrar los pares "insignificantes" del análisis, así como para proporcionar información adicional para pares "significativos" con su presencia en múltiples conjuntos de datos. En función del número de conjuntos de datos incluidos en cada análisis específico de tejido, se incluyeron únicamente los pares que ocurrieron en un # o % mínimo de conjuntos de datos .
Los grupos de coexpresión se generaron mediante el uso del algoritmo de Bron- Kerbosch para el resultado del grupo máximo en una gráfica sin dirección. El algoritmo genera tres grupos de nodos: compsub, candidatos y otros. El Compsub contiene un conjunto de nodos que se extienden o encogen en uno en función de su dirección de recorrido en las tres búsquedas. El de Candidatos consiste en todos los nodos seleccionados para agregarse al compsuJb. Otros contiene el conjunto de nodos que se agregó al compsub y que ahora se excluyen de la extensión. El algoritmo consta de cinco etapas: seleccionar un candidato; agregar el nodo candidato al compsub ; crear nuevos conjuntos de candidatos y otros a partir de los antiguos conjuntos mediante la eliminación de todos los puntos que no están conectados al nodo candidato; llamar recursivamente al operador de extensión acerca de los nuevos conjuntos de candidatos y otros; y, tras la devolución, eliminar el nodo candidato de compsub y colocarlo en el antiguo grupo de otros.
Hubo una primera búsqueda profunda con recorte y la selección de nodos candidatos tuvo un efecto sobre el tiempo de ejecución del algoritmo. Mediante la selección de los nodos en orden decreciente de frecuencia en los pares, se optimizó el tiempo de ejecución. Además, los algoritmos recursivos generalmente no pueden implementarse en una forma con múltiples roscas, pero el operador de extensión del primer nivel recursivo tenía múltiples roscas. Debido a que los datos entre los hilos de ejecución eran independientes ya que se encontraban en el nivel superior del árbol recursivo, se ejecutaron en paralelo.
Mapeo de grupos y normalización: debido a que los miembros de los pares y grupos de coexpresión se encuentran en el nivel de sonda, es necesario copiar los ID de sonda a los genes (o Refsec) antes de analizarlos. La información del mapa de genes Affymetrix se utilizó para copiar cada ID de sonda a un nombre de gen. Las sondas pueden copiarse a múltiples genes y los genes pueden representarse mediante múltiples sondas. Los datos para cada grupo se validan mediante el cálculo manual de los valores de correlación para cada par de un único grupo.
Los resultados de este análisis de coexpresión se muestran en las tablas 16-18. ?? 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 Lfl LO i-l 106 107 108 109 110 111 112 114 116 LO o 5 10 119 Tabla 1: Riesgos proporcionales de Cox para genes pronósticos que se asocian positivamente con un buen pronóstico para el cáncer de mama (estudio de previsión) 5 15 20 Tabla 2: Riesgos proporcionales de Cox para genes pronósticos que se asocian negativamente con un buen pronóstico para el cáncer de mama (estudio de previsión) Tabla 3: Riesgos proporcionales de Cox para genes pronósticos que se asocian positivamente con un buen pronóstico para el cáncer de mama ER negativo (ERO) (estudio de previsión) Tabla 4: Riesgos proporcionales de Cox para genes pronósticos que se asocian negativamente con un buen pronóstico para el cáncer de mama ER negativo (ERO) (estudio de previsión) Tabla 5: Riesgos proporcionales de Cox para genes pronósticos que se asocian positivamente con un buen pronóstico para el cáncer de mama ER positivo (ER1) (estudio de previsión) 5 20 25 Tabla 6: Riesgos proporcionales de Cox para genes pronósticos que se asocian negativamente con un buen pronóstico para el cáncer de mama ER positivo (ER1) (estudio de previsión) Tabla 7: Riesgos proporcionales de Cox para genes pronósticos que se asocian positivamente con un buen pronóstico para el cáncer de mama (estudio de Rush) Tabla 8: Riesgos proporcionales de Cox para genes pronósticos que se asocian negativamente con un buen pronóstico para el cáncer de mama (estudio de Rush) Tabla 9: Riesgos proporcionales de Cox para genes pronósticos que se asocian positivamente con un buen pronóstico para el cáncer de mama ER negativo (ERO) (estudio de Rush) Tabla 10: Riesgos proporcionales de Cox para genes pronósticos que se asocian negativamente con un buen pronóstico para el cáncer de mama ER negativo (ERO) (estudio de Rush) Tabla 11: Riesgos proporcionales de Cox para genes pronósticos que se asocian positivamente con un buen pronóstico para el cáncer de mama ER positivo (ER1) (estudio de Rush) Tabla 12 : Riesgos proporcionales de Cox para genes pronósticos que se asocian negativamente con un buen pronóstico para el cáncer de mama ER positivo (ER1) (estudio de Rush) 5 15 25 Tabla 13 : Validación de los genes pronósticos en los conjuntos de datos del SIB 5 15 15 15 15 15 5 15 5 5 5 5 15 Tabla 14: Validación de los genes del grupo de receptores de transferrina en los conjuntos de datos del SZB Tabla 15: Validación de los genes del grupo estromal en los conjuntos de datos del SIB 5 10 Tabla 16: Genes que se coexpresan con los genes pronósticos en los tumores de cáncer de mama ER+ (coeficiente de correlación de Spearman = 0,7) Tabla 17: Genes que se coexpresan con los genes pronósticos en los tumores de cáncer de mama ER- (coeficiente de correlación de Spearman = 0,7) Tabla 18: Genes que se coexpresan con los genes pronósticos en todos los tumores de cáncer de mama (coeficiente de correlación de Spearman = 0,7) Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (18)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones:
1. Un método para predecir el desenlace clínico de un paciente con diagnóstico de cáncer, caracterizado porque comprende: (a) obtener un nivel de expresión de un producto de expresión de al menos un gen pronóstico de una muestra de tejido obtenida de un tumor del paciente, donde al menos un gen pronóstico se selecciona de GSTM2, IL6ST, GSTM3 , C8orf4 , TNFRSF1 IB , NATI, RUNX1, CSF1, ACTR2 , LMNB1, TFRC, LAPTM4B, EN01 , CDC20 y IDH2 , o un gen indicado en las Tablas 1, 2, 7 o 8 ; (b) normalizar el nivel de expresión del producto de expresión de al menos un gen pronóstico para obtener un nivel de expresión normalizado; y (c) calcular un valor de riesgo basado en el valor de expresión normalizado, donde el aumento en la expresión del gen pronóstico seleccionado de GSTM2, IL6ST, GSTM3 , C8orf4 , TNFRSF1 IB , NATI, RUNX1 y CSF1, o un gen pronóstico incluido en las Tablas 1 y 7, tiene una correlación positiva con un buen pronóstico y donde el aumento en la expresión del gen pronóstico seleccionado de ACTR2 , LMNB1, TFRC, LAPTM4B, EN01, CDC20 y IDH2 , o un gen pronóstico de las Tablas 2 y 8, se asocia de forma negativa con un buen pronóstico.
2. El método de conformidad con la reivindicación 1, caracterizado porque comprende además : generar un informe basado en el valor de ri esgo .
3. El método de conformidad con la reivindicación 1, caracterizado porque el paciente es un paciente humano.
4. El método de conformidad con la reivindicación 1, caracterizado porque el tumor es un tumor de cáncer de mama.
5. El método de con ormidad con la reivindicación 1, caracterizado porque la muestra tisular es un tejido con inclusiones de parafina f i j ado .
6. El método de conformidad con la reivindicación 1, caracterizado porque el nivel de expresión se obtiene utilizando un método basado en PCR .
7. El método de conformidad con la reivindicación 1, caracterizado porque un nivel de expresión se obtiene de al menos dos de los genes en cualquiera de los grupos estromales, metabólicos , inmunes, de proliferación o metabólicos, o sus productos genéticos.
8. El método de conformidad con la reivindicación 1, caracterizado porque un nivel de expresión se obtiene de al menos cuatro genes en cualesquiera dos de los grupos estromales, metabólicos, inmunes, de proliferación o metabólicos, o sus productos genéticos.
9. El método de conformidad con la reivindicación 1, caracterizado porque comprende además obtener un nivel de expresión de al menos un gen coexpresado de los enumerados en la Tabla 18.
10. Un método para predecir el desenlace clínico de un paciente con diagnóstico de cáncer de mama de receptor de estrógeno negativo (ER-) caracterizado porque comprende : (a) obtener un nivel de expresión de un producto de expresión de al menos un gen pronóstico incluido en las Tablas 3, 4, 9 o 10 de una muestra de tejido obtenida de un tumor del paciente, donde el tumor es receptor de estrógeno negativo; (b) normalizar el nivel de expresión del producto de expresión de al menos un gen pronóstico para obtener un nivel de expresión normalizado; y (c) calcular un valor de riesgo basado en el valor de expresión normalizado, donde el aumento en la expresión de los genes pronósticos en la Tabla 3 y la Tabla 9 tienen una correlación positiva con buen pronóstico, y donde el aumento en la expresión de los genes pronósticos en la Tabla 4 y la Tabla 10 están asociados nega ivamente con un buen pronóstico.
11. El método de conformidad con la reivindicación 10, caracterizado porque comprende además : generar un informe basado en el valor de riesgo .
12. El método de conformidad con la reivindicación 10, caracterizado porque el paciente es un paciente humano.
13. El método de conformidad con la reivindicación 10, caracterizado porque el tumor es un tumor de cáncer de mama con tejido con inclusiones de parafina fijado.
14. El método de conformidad con la reivindicación 10, caracterizado porque el nivel de expresión se obtiene utilizando un método basado en PCR .
15. El método de conformidad con la reivindicación 10, caracterizado porque un nivel de expresión se obtiene de al menos dos de los genes en cualquier grupo estromal, metabólico, inmune, de proliferación o metabólico, o sus productos genéticos .
16. El método de conformidad con la reivindicación 10, caracterizado porque un nivel de expresión se obtiene de al menos cuatro genes en cualesquiera dos de los grupos estromales, metabólicos, inmunes, de proliferación o metabólicos, o sus productos genéticos.
17. El método de conformidad con la reivindicación 10, caracterizado porque comprende además obtener un nivel de expresión de al menos un gen coexpresado de los enumerados en la Tabla 17.
18. Un producto de programa de computadora para clasificar a un paciente de cáncer en función del pronóstico, el producto de programa de computadora para usar en conjunto con una computadora que tiene una memoria y un procesador, caracterizado porque el producto de programa de computadora comprende un medio de almacenamiento legible por computadora que incluye un programa de computadora codificado, donde el producto de programa de computadora puede cargarse en una o más unidades de memoria de una computadora y hace que una o más unidades de procesador de la computadora ejecuten las etapas de: (a) recibir una primera estructura de datos que comprende los niveles respectivos de un producto de expresión de cada uno de al menos tres genes pronósticos diferentes enumerados en cualquiera de las Tablas 1-12 en muestras de te ido obtenidas de un tumor de el paciente; (b) normalizar el al menos tres valores de expresión para obtener valores de expresión normal i zados ; (c) determinar la similitud de los valores de expresión normalizados de cada uno de el al menos tres genes pronósticos con los niveles de control respectivos de expresión de los al menos tres genes pronósticos obtenidos de una segunda estructura de datos para obtener un valor de similitud de paciente, donde la segunda estructura de datos se basa en niveles de expresión de una pluralidad de tumores cancerígenos ; (d) comparar el valor de similitud de paciente con un valor umbral de similitud seleccionado de el valores de expresión normalizados respectivos de cada uno de el al menos tres genes pronósticos con el niveles de control de expresión respectivos de el al menos tres genes pronósticos; y (e) clasificar a el paciente con un primer diagnóstico si el valor de similitud de paciente supera el valor umbral de similitud, y un segundo pronóstico si el valor de similitud de paciente no supera el valor umbral de similitud.
MX2012005822A 2009-11-23 2010-11-19 Metodos para predecir el desenlace clinico del cancer. MX337650B (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US26376309P 2009-11-23 2009-11-23
PCT/US2010/057490 WO2011063274A2 (en) 2009-11-23 2010-11-19 Methods to predict clinical outcome of cancer

Publications (2)

Publication Number Publication Date
MX2012005822A true MX2012005822A (es) 2012-06-19
MX337650B MX337650B (es) 2016-03-14

Family

ID=44060376

Family Applications (3)

Application Number Title Priority Date Filing Date
MX2012005822A MX337650B (es) 2009-11-23 2010-11-19 Metodos para predecir el desenlace clinico del cancer.
MX2019003811A MX391499B (es) 2009-11-23 2010-11-19 Metodos para predecir el desenlace clinico del cancer.
MX2016003089A MX363817B (es) 2009-11-23 2010-11-19 Métodos para predecir el desenlace clínico del cáncer.

Family Applications After (2)

Application Number Title Priority Date Filing Date
MX2019003811A MX391499B (es) 2009-11-23 2010-11-19 Metodos para predecir el desenlace clinico del cancer.
MX2016003089A MX363817B (es) 2009-11-23 2010-11-19 Métodos para predecir el desenlace clínico del cáncer.

Country Status (13)

Country Link
US (4) US20110123990A1 (es)
EP (4) EP3739060A1 (es)
JP (7) JP5964752B2 (es)
AU (1) AU2010321829B2 (es)
CA (2) CA3043089A1 (es)
DK (1) DK2504451T3 (es)
ES (1) ES2735993T3 (es)
HU (1) HUE044374T2 (es)
IL (5) IL219051A (es)
MX (3) MX337650B (es)
NZ (1) NZ599194A (es)
PL (1) PL2504451T3 (es)
WO (1) WO2011063274A2 (es)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040231909A1 (en) 2003-01-15 2004-11-25 Tai-Yang Luh Motorized vehicle having forward and backward differential structure
US7871769B2 (en) 2004-04-09 2011-01-18 Genomic Health, Inc. Gene expression markers for predicting response to chemotherapy
AU2005304824B2 (en) * 2004-11-05 2011-12-22 Genomic Health, Inc. Predicting response to chemotherapy using gene expression markers
US7888019B2 (en) 2006-03-31 2011-02-15 Genomic Health, Inc. Genes involved estrogen metabolism
WO2009158620A2 (en) * 2008-06-26 2009-12-30 Dana-Farber Cancer Institute, Inc. Signatures and determinants associated with metastasis methods of use thereof
US20120041274A1 (en) 2010-01-07 2012-02-16 Myriad Genetics, Incorporated Cancer biomarkers
DK177532B1 (en) 2009-09-17 2013-09-08 Bio Bedst Aps Medical use of sPLA2 hydrolysable liposomes
JP5964752B2 (ja) * 2009-11-23 2016-08-03 ジェノミック ヘルス, インコーポレイテッド 癌の臨床転帰を予測する方法
CA3256492A1 (en) 2010-01-11 2025-11-29 Genomic Health, Inc. Method to use gene expression to determine likelihood of clinical outcome of renal cancer
GB201009798D0 (en) 2010-06-11 2010-07-21 Immunovia Ab Method,array and use thereof
EP3812469A1 (en) 2010-07-07 2021-04-28 Myriad Genetics, Inc. Gene signatures for cancer prognosis
SG10201505769PA (en) 2010-07-27 2015-09-29 Genomic Health Inc Method for using gene expression to determine prognosis of prostate cancer
WO2012030840A2 (en) 2010-08-30 2012-03-08 Myriad Genetics, Inc. Gene signatures for cancer diagnosis and prognosis
US8916344B2 (en) 2010-11-15 2014-12-23 Exact Sciences Corporation Methylation assay
US8361720B2 (en) 2010-11-15 2013-01-29 Exact Sciences Corporation Real time cleavage assay
JP2014509868A (ja) * 2011-03-26 2014-04-24 オレゴン ヘルス アンド サイエンス ユニバーシティー 癌の予後のための遺伝子発現予測因子
CA2840472A1 (en) * 2011-06-22 2012-12-27 Oncocyte Corporation Methods and compositions for the treatment and diagnosis of bladder cancer
WO2013006495A2 (en) * 2011-07-01 2013-01-10 Dana-Farber Cancer Institute, Inc. Methods of predicting prognosis in cancer
JP2014523589A (ja) 2011-07-13 2014-09-11 ザ マルチプル ミエローマ リサーチ ファウンデーション, インコーポレイテッド データ収集及び配信のための方法
WO2013025952A2 (en) * 2011-08-16 2013-02-21 Oncocyte Corporation Methods and compositions for the treatment and diagnosis of breast cancer
AU2012336120B2 (en) * 2011-11-08 2017-10-26 Genomic Health, Inc. Method of predicting breast cancer prognosis
JP5805518B2 (ja) 2011-12-21 2015-11-04 株式会社島津製作所 マルチプレックス大腸がんマーカーパネル
SG10201605210PA (en) * 2012-01-31 2016-08-30 Genomic Health Inc Gene expression profile algorithm and test for determining prognosis of prostate cancer
GB201206323D0 (en) * 2012-04-10 2012-05-23 Immunovia Ab Methods and arrays for use in the same
AU2013248989A1 (en) * 2012-04-20 2014-11-27 Memorial Sloan-Kettering Cancer Center Gene expression profiles associated with metastatic breast cancer
WO2014055398A1 (en) * 2012-10-05 2014-04-10 Siemens Healthcare Diagnostics Inc. Method for detecting an increased risk or incidence of colorectal cancer
WO2014078700A1 (en) 2012-11-16 2014-05-22 Myriad Genetics, Inc. Gene signatures for cancer prognosis
KR101672531B1 (ko) * 2013-04-18 2016-11-17 주식회사 젠큐릭스 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도
DK3004392T3 (da) * 2013-05-30 2020-10-26 Genomic Health Inc Genekspressionsprofilalgoritme til beregning af en recidivscore for en patient med nyrecancer
US10392667B2 (en) * 2013-06-07 2019-08-27 Medical Prognosis Institute A/S Methods and devices for predicting treatment efficacy of fulvestrant in cancer patients
WO2015138769A1 (en) * 2014-03-12 2015-09-17 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for assessing patients with non-small cell lung cancer
WO2015175692A1 (en) * 2014-05-13 2015-11-19 Myriad Genetics, Inc. Gene signatures for cancer prognosis
WO2016046640A2 (en) 2014-09-26 2016-03-31 Medical Prognosis Institute A/S Methods for predicting drug responsiveness
US10184154B2 (en) 2014-09-26 2019-01-22 Mayo Foundation For Medical Education And Research Detecting cholangiocarcinoma
WO2016092299A1 (en) * 2014-12-09 2016-06-16 Medical Research Council Methods and kits for predicting the response to therapy of cancer
WO2016160454A1 (en) 2015-03-27 2016-10-06 Exact Sciences Corporation Detecting esophageal disorders
CA3002196C (en) 2015-10-30 2024-05-14 Exact Sciences Development Company, Llc Multiplex amplification detection assay and isolation and detection of dna from plasma
US11401558B2 (en) 2015-12-18 2022-08-02 Clear Gene, Inc. Methods, compositions, kits and devices for rapid analysis of biological markers
SG11201901466PA (en) * 2016-09-07 2019-03-28 Agency Science Tech & Res A method of identifying risk of cancer and therapeutic options
US9725769B1 (en) 2016-10-07 2017-08-08 Oncology Venture ApS Methods for predicting drug responsiveness in cancer patients
AU2017258901A1 (en) 2016-12-30 2018-07-19 Allarity Therapeutics Europe ApS Methods for predicting drug responsiveness in cancer patients
KR102892245B1 (ko) 2017-01-27 2025-11-27 이그젝트 싸이언스 디블롭먼트 컴패니, 엘엘씨 메틸화된 dna 분석에 의한 결장 신조직형성의 검출
WO2018212192A1 (ja) * 2017-05-18 2018-11-22 京都府公立大学法人 癌の予後及び/又は転移可能性を評価する方法及びマーカー
US12275994B2 (en) * 2017-06-22 2025-04-15 Clear Gene, Inc. Methods and compositions for the analysis of cancer biomarkers
CN114023403A (zh) 2017-11-13 2022-02-08 多发性骨髓瘤研究基金会公司 综合、分子、组学、免疫疗法、代谢、表观遗传学和临床数据库
US10648025B2 (en) 2017-12-13 2020-05-12 Exact Sciences Development Company, Llc Multiplex amplification detection assay II
WO2019173644A1 (en) * 2018-03-08 2019-09-12 University Of Notre Dame Du Lac Systems and methods for assessing colorectal cancer molecular subtype and risk of recurrence and for determining and administering treatment protocols based thereon
JP7199045B2 (ja) * 2018-04-13 2023-01-05 国立大学法人大阪大学 乳癌の予後に関する情報の取得方法、乳癌の予後の判定装置及びコンピュータプログラム
US20220120753A1 (en) * 2018-09-21 2022-04-21 The University Of Tokyo Method for determining prognosis of cancer
JP2019032334A (ja) * 2018-10-03 2019-02-28 イムノヴィア・アクチエボラーグ 乳癌関連の疾患状態を決定する方法およびこの方法における使用のためのアレイ
KR102216645B1 (ko) * 2018-10-29 2021-02-17 사회복지법인 삼성생명공익재단 폐암의 분자 아형 결정을 위한 바이오마커 패널 및 이의 용도
US20220033912A1 (en) * 2018-12-08 2022-02-03 Pfs Genomics Inc Transcriptomic profiling for prognosis of breast cancer to identify subjects who may be spared adjuvant systemic therapy
WO2020226333A1 (ko) * 2019-05-03 2020-11-12 주식회사 디시젠 암 예후 예측방법 및 이의 조성물
CN111235270B (zh) * 2019-08-29 2022-04-29 北京臻知医学科技有限责任公司 一种基于高通量测序法的肿瘤抗原表达检测引物及试剂盒
US12165747B2 (en) * 2020-01-23 2024-12-10 The Broad Institute, Inc. Molecular spatial mapping of metastatic tumor microenvironment
WO2022174089A1 (en) * 2021-02-12 2022-08-18 Mammogen, Inc. Biomarkers for the diagnosis of breast cancer
WO2022192128A2 (en) * 2021-03-08 2022-09-15 Castle Biosciences, Inc. Determining prognosis and treatment based on clinical-pathologic factors and continuous multigene-expression profile scores
CN117116345B (zh) * 2023-07-24 2025-09-16 中国人民解放军军事科学院军事医学研究院 一种基于基因调控网络构建患者生存网络的方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE503023T1 (de) * 2001-06-18 2011-04-15 Rosetta Inpharmatics Llc Diagnose und prognose von brustkrebspatientinnen
US7171311B2 (en) * 2001-06-18 2007-01-30 Rosetta Inpharmatics Llc Methods of assigning treatment to breast cancer patients
WO2003004989A2 (en) * 2001-06-21 2003-01-16 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
EP2261368A1 (en) * 2002-03-13 2010-12-15 Genomic Health, Inc. Gene expression profiling in biopsied tumor tissues
US20040067234A1 (en) * 2002-07-11 2004-04-08 Paz Einat Isocitrate dehydrogenase and uses thereof
US20040231909A1 (en) * 2003-01-15 2004-11-25 Tai-Yang Luh Motorized vehicle having forward and backward differential structure
EP3330875B1 (en) * 2003-07-10 2021-12-01 Genomic Health, Inc. Expression profile algorithm and test for prognosing breast cancer recurrence
EP1730308A4 (en) * 2004-03-05 2008-10-08 Rosetta Inpharmatics Llc CLASSIFICATION OF BREAST CANCER PATIENTS USING A COMBINATION OF CLINICAL CRITERIA AND INFORMATIVE SKILLS
JP2008515398A (ja) * 2004-09-30 2008-05-15 バイエル・ヘルスケア・アクチェンゲゼルシャフト 癌治療における治療の成功および再発しない生存を予測するための方法およびキット
WO2006103442A2 (en) * 2005-04-01 2006-10-05 Ncc Technology Ventures Pte. Ltd. Materials and methods relating to breast cancer classification
WO2006133460A2 (en) * 2005-06-09 2006-12-14 Yale University Methods for diagnosing and treating breast cancer based on a her/er ratio
US20070099209A1 (en) * 2005-06-13 2007-05-03 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
EP1907858A4 (en) * 2005-06-13 2009-04-08 Univ Michigan COMPOSITIONS AND METHODS OF TREATMENT AND DIAGNOSIS OF CANCER
TWI304443B (en) * 2005-12-30 2008-12-21 Nat Health Research Institutes Alpha-enolase specific antibody and method of use
US7888019B2 (en) * 2006-03-31 2011-02-15 Genomic Health, Inc. Genes involved estrogen metabolism
EP2140025A2 (en) * 2007-04-16 2010-01-06 Ipsogen Methods of assessing a propensity of clinical outcome for a female mammal suffering from breast cancer
WO2008150512A2 (en) * 2007-06-04 2008-12-11 University Of Louisville Research Foundation, Inc. Methods for identifying an increased likelihood of recurrence of breast cancer
WO2009095319A1 (en) * 2008-01-28 2009-08-06 Siemens Healthcare Diagnostics Gmbh Cancer prognosis by majority voting
WO2009132928A2 (en) * 2008-05-02 2009-11-05 Siemens Healthcare Diagnostics Gmbh Molecular markers for cancer prognosis
EP2607497B1 (en) * 2008-05-12 2014-10-01 Genomic Health, Inc. Tests to predict responsiveness of cancer patients to chemotherapy treatment options
JP5964752B2 (ja) * 2009-11-23 2016-08-03 ジェノミック ヘルス, インコーポレイテッド 癌の臨床転帰を予測する方法

Also Published As

Publication number Publication date
EP3739060A1 (en) 2020-11-18
MX337650B (es) 2016-03-14
DK2504451T3 (da) 2019-08-05
IL264072A (en) 2019-02-28
WO2011063274A3 (en) 2014-03-27
JP2022169647A (ja) 2022-11-09
AU2010321829B2 (en) 2015-07-30
EP2504451B1 (en) 2019-06-05
JP2022166064A (ja) 2022-11-01
JP2016214245A (ja) 2016-12-22
EP3556867A1 (en) 2019-10-23
EP4350001A2 (en) 2024-04-10
JP5964752B2 (ja) 2016-08-03
HUE044374T2 (hu) 2019-10-28
IL257063B (en) 2019-01-31
IL249159A0 (en) 2017-01-31
US20190241967A1 (en) 2019-08-08
MX2019003811A (es) 2019-08-05
JP2013514058A (ja) 2013-04-25
CA2776751A1 (en) 2011-05-26
MX363817B (es) 2019-04-04
US20110123990A1 (en) 2011-05-26
US20170211154A1 (en) 2017-07-27
CA3043089A1 (en) 2011-05-26
JP7042717B2 (ja) 2022-03-28
ES2735993T3 (es) 2019-12-23
NZ599194A (en) 2014-07-25
EP2504451A4 (en) 2016-07-06
IL276487B (en) 2022-03-01
IL219051A (en) 2016-12-29
JP2021058207A (ja) 2021-04-15
IL264072B (en) 2020-08-31
JP2018196385A (ja) 2018-12-13
WO2011063274A2 (en) 2011-05-26
IL219051A0 (en) 2012-06-28
EP2504451A2 (en) 2012-10-03
JP2024037948A (ja) 2024-03-19
US20210062275A1 (en) 2021-03-04
CA2776751C (en) 2019-07-02
MX391499B (es) 2025-03-21
PL2504451T3 (pl) 2019-09-30
AU2010321829A1 (en) 2012-05-03
IL276487A (en) 2020-09-30
EP4350001A3 (en) 2024-06-19

Similar Documents

Publication Publication Date Title
JP7042717B2 (ja) 癌の臨床転帰を予測する方法
JP7042784B2 (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
US20200263257A1 (en) Method of predicting breast cancer prognosis
JP6351112B2 (ja) 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験
JP7301798B2 (ja) 腎臓がんを有する患者に対する再発スコアを計算するための遺伝子発現プロファイルアルゴリズム
JP7239477B2 (ja) 前立腺がんにおける後期臨床エンドポイントを評価するためのアルゴリズムおよび方法
EP3063689A1 (en) Methods of incorporation of transcript chromosomal locus information for identification of biomarkers of disease recurrence risk
AU2017268510A1 (en) Method for using gene expression to determine prognosis of prostate cancer
WO2014130617A1 (en) Method of predicting breast cancer prognosis
WO2014130444A1 (en) Method of predicting breast cancer prognosis
US20110287958A1 (en) Method for Using Gene Expression to Determine Colorectal Tumor Stage
HK40014990A (en) Methods to predict clinical outcome of cancer
HK40052881A (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer
NZ752676B2 (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer
HK1223132B (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer
NZ711680B2 (en) Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer

Legal Events

Date Code Title Description
FG Grant or registration