ES2366178T3 - Diagnóstico y pronóstico del cáncer de mama en pacientes. - Google Patents
Diagnóstico y pronóstico del cáncer de mama en pacientes. Download PDFInfo
- Publication number
- ES2366178T3 ES2366178T3 ES02746538T ES02746538T ES2366178T3 ES 2366178 T3 ES2366178 T3 ES 2366178T3 ES 02746538 T ES02746538 T ES 02746538T ES 02746538 T ES02746538 T ES 02746538T ES 2366178 T3 ES2366178 T3 ES 2366178T3
- Authority
- ES
- Spain
- Prior art keywords
- seq
- expression
- template
- gene
- expression profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Método para clasificar a un individuo aquejado de cáncer de mama como poseedor de buen pronóstico o pronóstico deficiente, en donde dicho individuo es un humano, en donde dicho pronóstico indica que se espera que dicho individuo no tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama y en donde dicho pronóstico deficiente indica que se espera que dicho individuo tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, que comprende (ia) calcular un primer parámetro clasificador entre un primer perfil de expresión y una plantilla de buen pronóstico, o (ib) calcular un segundo parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico y un tercer parámetro clasificador entre dicho primer perfil de expresión y una plantilla de pronóstico deficiente; comprendiendo dicho primer perfil de expresión los niveles de expresión de una primera pluralidad de genes en una muestra de células tomada del individuo, comprendiendo dicha plantilla de buen pronóstico, para cada gen en dicha primera pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que no tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; y comprendiendo dicha plantilla de pronóstico deficiente, para cada gen en dicha primera pluralidad, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; consistiendo dicha primera pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 5, y (iia) clasificar a dicho individuo como poseedor de buen pronóstico si dicho primer parámetro clasificador está por encima de un umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de buen pronóstico que a dicha plantilla de pronóstico deficiente, o (iib) clasificar a dicho individuo como poseedor de dicho pronóstico deficiente si dicho primer parámetro clasificador está por debajo de dicho umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de pronóstico deficiente que a dicha plantilla de buen pronóstico.
Description
- 1.
- CAMPO DE APLICACIÓN DE LA INVENCIÓN
[0001] La presente invención se refiere a la identificación de genes marcadores que sirven para el diagnóstico y el pronóstico del cáncer de mama. Más concretamente, la invención se refiere a la identificación de un conjunto de genes marcadores asociados al cáncer de mama, un conjunto de genes marcadores expresados diferenciadamente en tumores de receptor de estrógeno (+) frente a receptor de estrógeno (-), un conjunto de genes marcadores expresados diferenciadamente en el BRCA1 frente a tumores esporádicos y un conjunto de genes marcadores expresados diferenciadamente en tumores esporádicos procedentes de pacientes con buen pronóstico clínico (esto es, sin metástasis ni dolencia durante más de 5 años) frente a pacientes con pronóstico clínico deficiente (esto es, sin metástasis ni dolencia durante menos de 5 años). Para cada uno de los conjuntos marcadores mencionados más arriba la invención se refiere además a métodos para distinguir las afecciones que se dan en el cáncer de mama. También se describen métodos para determinar el curso del tratamiento de las pacientes con cáncer de mama.
- 2.
- ANTECEDENTES DE LA INVENCIÓN
[0002] El número creciente de casos de cáncer declarados en los Estados Unidos, y de hecho en todo el mundo, constituye un grave problema. Actualmente se dispone sólo de unos cuantos tratamientos para tipos específicos de cáncer, pero que no ofrecen garantía alguna de éxito. Para aumentar su eficacia, estos tratamientos tendrían que facilitar no sólo una detección más precoz del carácter maligno del tumor, sino también una valoración fiable de la gravedad de dicho tumor.
[0003] La incidencia del cáncer de mama, una de las causas principales de muerte entre las mujeres, ha ido aumentando gradualmente en los Estados Unidos en los treinta últimos años. Su riesgo acumulativo es relativamente alto; se prevé que, en los Estados Unidos, 1 de cada 8 mujeres desarrollará cáncer de mama antes de que cumpla 85 años. De hecho, el cáncer de mama es el cáncer más corriente entre las mujeres y la segunda causa más frecuente de muerte por cáncer en los Estados Unidos. En 1997 se estimó en 181.000 el número de nuevos casos declarados en los Estados Unidos, así como que 44.000 personas morirían de cáncer de mama (Parker et a/., CA Cancer J. Clin. 47:5-27 (1997); Chu et al., J. Nat. Cancer Inst. 88:1571-1579 (1996)). Aunque se conoce en gran medida el mecanismo de oncogénesis de la mayoría de los carcinomas de mama, existen factores genéticos que pueden predisponer a algunas mujeres a desarrollar cáncer de mama ((Miki et al., Science, 266:66-71(1994)). El descubrimiento y la caracterización del BRCA1 y BRCA2 ha ampliado recientemente nuestro conocimiento de los factores genéticos que pueden contribuir al cáncer de mama familiar. Las mutaciones germinales en estos dos loci suponen de un 50 a un 85% del riesgo de cáncer de mama o de ovarios a lo largo de la vida (Casey, Curr. Opin. Oncol. 9:88-93 (1997); Marcus et al., Cancer 77:697-709 (1996)). Solo de un 5% a un 10% de casos de cáncer están relacionados con los genes de susceptibilidad al cáncer de mama, BRCA1 y BRCA2. El riesgo de cáncer acumulado a lo largo de la vida para las mujeres portadoras del BRCA1 mutante se calcula en aproximadamente el 92%, mientras que el riesgo acumulado a lo largo de la vida para la mayoría de no portadoras se estima en aproximadamente un 10%. El BRCA1 es un gen supresor de tumores que interviene en la reparación del ADN y en el control del ciclo celular, ambos de suma importancia para el mantenimiento de la estabilidad genómica. Más del 90% de todas las mutaciones reveladas hasta ahora desembocan en un truncamiento prematuro del producto proteínico con función anormal o suprimida. La histología del cáncer de mama en los portadores de la mutación BRCA1 varía en casos esporádicos, pero el análisis de la mutación es la única manera de hallar a la portadora.
Al igual que el BRCA1, el BRCA2 interviene en el desarrollo del cáncer de mama y, al igual que el BRC41, juega su papel en la reparación del ADN. Sin embargo, a diferencia del BRCA1, no está presente en el cáncer de ovarios
[0004] En la técnica se conocen marcadores moleculares para diferenciar los tipos de tumores.
Perou CM, et al. (Nature 2000 406:747-752) efectúan retratos moleculares de tumores del cáncer de mama humano. Se identificó un subconjunto de genes en el que la variación en expresión era mayor entre tumores diferentes que entre muestras emparejadas del mismo tumor. Alizadeh AA, et al. (Nature 2000 403:503-511) describen dos formas diferentes de linfoma difuso de células B grandes (DLBCL) identificadas sobre la base del patrón de expresión de genes. Se identificó un subconjunto de genes al hallarse expresado de forma selectiva en una de las dos formas de DLBCL. Perou CM, et al. (PNAS 1999 96:9212-9217) describen patrones de expresión de genes diferenciados en las células epiteliales mamarias humanas y cánceres de mama. En respuesta a una serie de perturbaciones experimentales, se identificó un subconjunto de genes en los que se apreciaba claramente una expresión diferenciada en las células epiteliales mamarias humanas. Khan J, et al. (Nature Medicine 2001 7:673-679) describen un criterio de clasificación y predicción diagnóstica de cánceres mediante perfiles de expresión de genes y redes neuronales artificiales. Se usó un subconjunto de genes para clasificar pequeñas muestras de tumores de células redondas y azules en categorías diagnósticas. Hedenfalk I, et al. (New Eng J Med 2001 344:539.548) describen perfiles de expresión de genes en el cáncer de mama hereditario e identificaron un subconjunto de genes que se dividía en tumores mutantes de BRCA1, tumores mutantes de BRCA2 y tumores esporádicos de tejido de cáncer de mama. A diferencia de estos documentos donde se da a conocer métodos para distinguir los tipos de tumores, la presente invención ofrece métodos para determinar si los individuos con cáncer de mama han tenido un pronóstico bueno o deficiente.
[0005] Con el cáncer de mama se ha relacionado también otros genes, por ejemplo el c-erb-2 (HER2) y el p53 (Beenken et al., Ann. Surg. 233(5):630-638 (2001). La superexpresión del c-erb-2 (HER2) y del p53 se ha relacionado con pronósticos deficientes (Rudolph et al., Hum. Pathol. 32(3):311-319 (2001), pues ha sido una expresión aberrante de productos de mdm2 (Lukas et al., Cancer Res. 61(7):3212-3219 (2001) y ciclina 1 y p27 (Porter & Roberts, International Publication WO98/33450, publicado el 6 de agosto de 1998). No obstante, no se han identificado otros marcadores clínicamente útiles y estrechamente asociados al cáncer de mama.
[0006] Los tumores esporádicos, o sea, aquellos no asociados comúnmente a una mutación germinal conocida, constituyen el cáncer de mama en la mayoría de los casos. También es probable que otros factores, no genéticos, influyan de modo significativo en la etiología de la enfermedad. Independientemente del origen del cáncer, la morbilidad y mortalidad del cáncer de mama aumentan de modo significativo si no se detectan en la fase inicial de su progreso. Por consiguiente, se han dedicado muchos esfuerzos a la detección precoz de la transformación celular y la formación de tumores en el tejido mamario.
[0007] La identificación y caracterización del tumor basándose en marcadores hace esperar una mayor fiabilidad del diagnóstico y del pronóstico. Típicamente, para el diagnóstico del cáncer de mama se requiere una prueba histopatológica de la presencia del tumor. Además del diagnóstico, los exámenes histopatológicos también suministran información sobre el pronóstico y la selección de regímenes de tratamiento. El pronóstico se puede basar también en parámetros clínicos, como el tamaño del tumor, el grado del tumor, la edad de la paciente y la metástasis del ganglio linfático.
[0008] El diagnóstico y/o el pronóstico se puede determinar en diversos grados de eficacia por observación directa del exterior de la mama, mediante mamografía o por otros métodos de imagen por rayos X (Jatoi, Am. J. Surg. 177:518-524 (1999)). Estos últimos, no obstante, tienen un coste elevado. Cada vez que se le hace una mamografía, la paciente corre un leve riesgo de tener un tumor de mama inducido por las propiedades ionizantes de la radiación usada durante la prueba. Además, el proceso es caro y las interpretaciones subjetivas de un técnico pueden llevar a imprecisión. Por ejemplo, un estudio mostró discrepancias clínicas importantes en aproximadamente un tercio de un conjunto de mamografías que fueron interpretadas individualmente por un grupo de radiólogos a que se encuestó. Asimismo, muchas mujeres opinan que someterse a una mamografía es una experiencia dolorosa. En consecuencia, el National Cancer Institute desaconseja las mamografías para mujeres que no hayan cumplido los cincuenta años, ya que este colectivo no es tan propenso a desarrollar cáncer de mama como el de las mujeres de más edad. Hay que tener en cuenta, no obstante, que, aunque sólo el 22% de los casos de cáncer de mama se da en mujeres menores de cincuenta años, los datos muestran que el cáncer de mama es más agresivo en mujeres premenopáusicas.
[0009] En la práctica clínica es importante un diagnóstico exacto de los diversos tipos de cáncer de mama, ya que las opciones de tratamiento, el pronóstico y la probabilidad de la respuesta terapéutica varían todos en función del diagnóstico. Con un pronóstico acertado, o con una determinación de la supervivencia libre de metástasis distante, el oncólogo podrá personalizar la administración de quimioterapia adyuvante, mientras que a las mujeres con peores pronósticos se les aplican los tratamientos más agresivos. Además, la predicción exacta de pronósticos deficientes tendría gran impacto en los ensayos clínicos de nuevas terapias contra el cáncer de mama, ya que entonces las potenciales pacientes de estudio podrían estratificarse según el pronóstico. Así, los ensayos se limitarían a las pacientes con pronósticos deficientes, con lo que a su vez sería más fácil discernir si una terapia experimental es eficaz.
[0010]Hasta la fecha no se ha identificado ningún conjunto de predictores de pronóstico satisfactorios basados exclusivamente en información clínica. La detección de las mutaciones del BRCA1 o del BRCA2 constituye un paso hacia el diseño de terapias para controlar mejor e impedir la aparición de estos tumores. Sin embargo, no existen medios equivalentes para el diagnóstico de pacientes con tumores esporádicos, que es el tipo más corriente de tumor de cáncer de mama, ni tampoco de dispone de medios para diferenciar los subtipos de cáncer de mama.
3. RESUMEN DE LA INVENCIÓN
[0011] La invención suministra conjuntos de marcadores de genes que distinguen entre diversos tipos y subtipos de cáncer de mama, así como métodos para su uso. La invención suministra un método para determinar si un individuo aquejado de cáncer de mama tiene un pronóstico bueno o deficiente, en donde dicho individuo es un humano, en donde dicho buen pronóstico indica que se espera que el individuo en cuestión no tenga metástasis distantes dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, y en donde dicho pronóstico deficiente indica que se espera que el individuo en cuestión tenga metástasis distantes dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, y que supone: (ia) calcular un primer parámetro clasificador entre un primer perfil de expresión y una plantilla de buenos pronósticos, o (ib) calcular un segundo parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buenos pronósticos y un tercer parámetro clasificador entre dicho primer perfil de expresión y una plantilla de pronósticos deficientes; dicho primer perfil de expresión comprende los niveles de expresión de una primera serie de genes en una muestra de células tomada del individuo, dicha plantilla de buenos pronósticos comprende para cada gen de dicha primera serie de genes el nivel medio de expresión de dicho gen en una serie de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; dicha primera serie de genes consta de al menos 5 de los genes para los que se incluye una lista de marcadores en la Tabla 5, y (iia) determinar si dicho individuo tiene buen pronóstico si dicho primer parámetro de clasificación está por encima de un umbral establecido o si dicho primer perfil de expresión es más parecido a dicha plantilla de buenos pronósticos que a dicha plantilla de pronósticos deficientes, o (iib) determinar si dicho individuo tiene dicho pronóstico deficiente si dicho primer parámetro de clasificación está por debajo de dicho umbral establecido o si dicho primer perfil de expresión es más parecido a dicha plantilla de pronósticos deficientes que a dicha plantilla de buenos pronósticos. En una de las materializaciones se describe un método para clasificar una muestra de células como ER (+) o ER (-) que supone detectar una diferencia en la expresión de una primera serie de genes con respecto a un control, constando dicha primera serie de genes de al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 1. En materializaciones específicas, dicha serie de genes consta de al menos 50, 100, 200, 500, 1.000, hasta 2.460 de los genes enumerados en la Tabla 1. En otra materialización específica, dicha serie de genes consta de cada uno de los genes correspondientes a los 2.460 marcadores enumerados en la Tabla 1. En otra materialización específica, dicha serie consta de los 550 marcadores enumerados en la Tabla 2. En otra materialización específica, dicho control comprende ácidos nucleicos obtenidos de una reserva de tumores de pacientes esporádicas concretas. En otra materialización específica, dicha detección comprende los pasos de: (a) generar una plantilla de ER (+) mediante la hibridación de ácidos nucleicos obtenidos de una serie de pacientes con E (+) dentro de una serie de pacientes esporádicas contra ácidos nucleicos obtenidos de una reserva de tumores de pacientes esporádicas concretas; (b) generar una plantilla de ER (-) mediante la hibridación de ácidos nucleicos obtenidos de una serie de pacientes con ER () dentro de dicha serie de pacientes esporádicas contra ácidos nucleicos obtenidos de dicha reserva de tumores de pacientes esporádicas concretas dentro de dicha serie; (c) hibridar ácidos nucleicos obtenidos de una muestra específica contra dicha reserva; y (d) determinar la semejanza de la expresión de gen marcador en la muestra específica con la plantilla de ER (+) y la plantilla de ER (-), en donde si dicha expresión es más parecida a la plantilla de ER (+), se clasifica la muestra como ER (+), mientras que si dicha expresión es más parecida a la plantilla de ER (-), se clasifica la muestra como ER (-).
[0012] Ya se han descrito más arriba métodos aplicados a la clasificación como BRCA1 o esporádico. La invención suministra los métodos de más arriba aplicados a la clasificación de pacientes como poseedoras de buen pronóstico o pronóstico deficiente. Para los marcadores de BRCAI/gen esporádico, se puede usar un método en el que la serie de genes es al menos de 5, 20, 50, 100, 200 or 300 de los BRCAI/marcadores esporádicos enumerados en la Tabla 3. En una materialización específica, se usan los 100 marcadores óptimos enumerados en la Tabla 4. Para los marcadores de pronóstico, la invención implica que se pueden usar al menos 5, 20, 50, 100 o 200 marcadores de genes enumerados en la Tabla 5. En una materialización específica, se usan los 70 marcadores óptimos enumerados en la Tabla 6.
[0013] La invención posibilita además la combinación de los marcadores. En otra materialización se usan al menos 5 marcadores de la Tabla 5 en conjunción con al menos 5 marcadores de la Tabla 3. En otra materialización se usan al menos 5 marcadores de la Tabla 1 en conjunción con al menos 5 marcadores de la Tabla 5. En otra materialización se usan simultáneamente al menos 5 marcadores de cada una de las Tablas 1, 3 y 5.
[0014] También se describe un método para clasificar una muestra como ER(+) or ER(-) calculando la semejanza entre la expresión de al menos 5 de los marcadores enumerados en la Tabla 1 en la muestra con la expresión de los mismos marcadores en una reserva de ácido nucleico de ER (-) y una reserva de ácido nucleico de ER (+), que comprende los pasos de (a) etiquetar ácidos nucleicos obtenidos de una muestra con un primer fluoróforo para obtener una primera reserva de ácidos nucleicos etiquetados con fluoróforo; (b) etiquetar con un segundo fluoróforo una primera reserva de ácidos nucleicos obtenidos de dos o más muestras de ER(+) y una segunda reserva de ácidos nucleicos obtenidos de dos o más muestras de ER(-); (c) poner en contacto dicho primer ácido nucleico etiquetado con fluoróforo y dicha primera reserva de segundo ácido nucleico etiquetado con fluoróforo con dicho primer biochip en condiciones en que pueda darse dicha hibridación, y poner en contacto dicho primer ácido nucleico etiquetado con fluoróforo y dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo con dicho segundo biochip en condiciones en que pueda darse dicha hibridación, detectando en cada uno de una serie de loci discretos en el primer biochip una primera señal de emisión fluorescente de dicho primer ácido nucleico etiquetado con fluoróforo y una segunda señal de emisión fluorescente de dicha primera reserva de segunda materia genética etiquetada con fluoróforo cuyo destino es dicho primer biochip en dichas condiciones, y detectando en cada uno de los marcadores de loci de dicho segundo biochip dicha primera señal de emisión fluorescente de dicho primer ácido nucleico etiquetado con fluoróforo y una tercera señal de emisión fluorescente de dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo; (d) determinar la semejanza de la muestra con las reservas de ER(-) y ER(+) comparando dichas primeras señales de emisión de fluorescencia y dichas primeras señales de emisión de fluorescencia por una parte, y por otra dichas primeras señales señales de emisión de fluorescencia y dichas terceras señales de emisión de fluorescencia, y clasificar como ER(+)las muestras en que las primeras señales de emisión de fluorescencia sean más parecidas a dichas segundas señales de emisión de fluorescencia que a dichas terceras señales de emisión de fluorescencia y clasificar como ER(-) las muestras en que las primeras señales de emisión sean más parecidas a dichas terceras señales de emisión de fluorescencia que a dichas segundas señales de emisión de fluorescencia, en donde dicha semejanza se define como criterio estadístico. La invención señala además que los demás conjuntos de marcadores que da a conocer pueden usarse en el método de más arriba para distinguir el BRCA1 de los tumores esporádicos, así como las pacientes con diagnóstico deficiente de las pacientes con buen diagnóstico.
[0015] En una materialización específica, dicha semejanza se calcula determinando una primera suma de las diferencias de niveles de expresión para cada marcador entre dicho primer ácido nucleico etiquetado con fluoróforo y dicha primera reserva de segundo ácido nucleico etiquetado con fluoróforo y una segunda suma de las diferencias de niveles de expresión para cada marcador entre dicho primer ácido nucleico etiquetado con fluoróforo y dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo, en donde si dicha primera suma es mayor que dicha segunda suma, la muestra se clasifica como ER(-), y si dicha segunda suma es mayor que dicha primera suma, la mezcla se clasifica como ER(+). En otra materialización específica, dicha semejanza se calcula computando un primer parámetro clasificador P1 entre una plantilla de ER(+) y la expresión de dichos marcadores en dicha muestra, y un segundo parámetro clasificador P2 entre una plantilla de ER(-) y la expresión de dichos marcadores en dicha muestra, en donde P1 y P2 se calculan según la fórmula:
en donde ž1 y ž2 son plantillas de ER(-) y ER(+), respectivamente, y se calculan hallando la media de dicha segunda señal de emisión de fluorescencia para cada uno de dichos marcadores en dicha primera reserva de segundo ácido nucleico etiquetado con fluoróforo y dicha tercera señal de emisión de fluorescencia para cada uno de dichos marcadores en dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo, respectivamente, y donde ŷ indica la primera señal de emisión de fluorescencia de cada uno de dichos marcadores en la muestra que se va a clasificar como ER(+) or ER(-), en donde la expresión de los marcadores en la muestra es parecida a ER(+) si P1 < P2, y parecida a ER (-) si P1 > P2.
[0016] Asimismo se describe un método para identificar genes marcadores cuya expresión esté asociada a un fenotipo en concreto. También se describe un método para determinar un conjunto de genes marcadores cuya expresión esté asociada a un fenotipo en concreto y que comprende los pasos de: (a) seleccionar el fenotipo que tenga dos o más categorías de fenotipo; (b) identificar una serie de genes en donde la expresión de dichos genes esté en correlación o anticorrelación con una de las categorías de fenotipo y en donde el coeficiente de correlación para cada gene se calcula según la ecuación:
en donde č es un número que representa dicha categoría de fenotipo y ř es el cociente de expresión logarítmica en todas las muestras para cada gen en concreto, en donde si el coeficiente de correlación tiene el valor absoluto de un valor umbral o mayor, dicha expresión de dicho gen está asociada a la categoría de fenotipo y en donde dicha serie de genes es un conjunto de genes marcadores cuya expresión está asociada a un fenotipo en concreto. El umbral depende del número de muestras empleadas; el umbral se puede calcular como imagen1
imagen1
3 X
en donde es la anchura de distribución y n = el número de muestras. En una materialización específica donde n = 98, dicho valor umbral es 0,3. En una materialización específica, dicho conjunto de genes marcadores se valida mediante: (a) el uso de un criterio estadístico para aleatorizar la asociación entre dichos genes marcadores y dicha categoría de fenotipo, creando de este modo un coeficiente de correlación de control para cada gen marcador; (b) la repetición del paso (a) cien veces o más para desarrollar una distribución de frecuencia de dichos coeficientes de correlación de control para cada gen marcador; (c) la determinación del número de genes marcadores que tengan con coeficiente de correlación de control de un valor umbral o mayor, creando de este modo un conjunto de genes marcadores de control, y (d) la comparación del número de genes marcadores de control identificados como tales con el número de genes marcadores, en donde si el valor p es la diferencia entre el número de genes marcadores y el número de genes de control es menor de 0,01, se valida dicho conjunto de genes marcadores. En otra materialización específica, dicho conjunto de genes marcadores se optimiza con un método que consiste en: (a) ordenación jerarquizada de genes por amplitud de correlación o por relevancia de los coeficientes de correlación, y (b) selección de un número arbitrario de genes marcadores de los puestos más altos de la lista jerarquizada. El valor umbral depende del número de muestras sometidas a prueba.
[0017] Asimismo se describe un método para asignar a una persona una serie de categorías en un ensayo clínico, que consiste en determinar para cada persona el nivel de expresión de al menos cinco de los marcadores de pronóstico enumerados en la Tabla 6, determinar a partir de los mismos si la persona tiene un patrón de expresión que se halla en correlación con un buen pronóstico o un pronóstico deficiente, y clasificar a dicha persona en una categoría de un ensayo clínico si se establece que dicha persona tiene un buen pronóstico, o en una categoría diferente si se establece que dicha persona tiene un pronóstico deficiente. También se describe un método para clasificar a una persona en una de una serie de categorías de un ensayo clínico, donde cada una de dichas categorías está asociada a un fenotipo diferente, y que consiste en determinar para cada una de dichas personas el nivel de expresión de al menos cinco marcadores de un conjunto de marcadores, en donde dicho conjunto de marcadores comprende marcadores asociados a cada una de dichas categorías clínicas, determinando a partir de dichos marcadores si la persona tiene un patrón de expresión que se halla en correlación con una de las categorías clínicas y clasificando a dicha persona en una de dichas categorías si se establece que dicha persona tiene un fenotipo asociado a dicha categoría.
[0018] Asimismo se describe un método para determinar si la primera célula u organismo tiene uno de al menos dos diferentes fenotipos, consistiendo dichos al menos dos diferentes fenotipos en un primer fenotipo y un segundo fenotipo, método que consiste en: (a) comparar el nivel de expresión de cada uno de una serie de genes en una primera muestra de la primera célula u organismo con el nivel de expresión de cada uno de dichos genes, respectivamente, en una muestra colectiva de una serie de células u organismos, comprendiendo dicha serie de células u organismos diferentes células u organismos cada uno de los cuales muestra los al menos dos diferentes fenotipos, respectivamente, para producir un primer valor comparado; (b) comparar dicho primer valor comparado con un segundo valor comparado, en donde dicho segundo valor comparado es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo caracterizado por tener dicho primer fenotipo al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva; (c) comparar dicho primer valor comparado con un tercer valor comparado, en donde dicho tercer valor comparado es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo caracterizado por tener dicho segundo fenotipo al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva; (d) opcionalmente, llevar a cabo una o más veces el paso de comparar dicho primer valor comparado con uno o más valores comparados adicionales, respectivamente, siendo cada uno de dichos valores comparados adicionales el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo caracterizado por tener un fenotipo diferente de dichos primer y segundo fenotipos, pero incluido en los dichos al menos dos diferentes fenotipos, al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva, y (e) determinar a cuál de dichos segundo, tercero y, si están presentes, a uno o más valores comparados adicionales, es más parecido dicho primer valor comparado adicional, en donde se determina que dicha primera célula u organismo tiene el fenotipo de la célula u organismo usados para producir dicho valor comparado más parecido al primer valor comparado.
[0019] En una materialización específica del método de más arriba, cada uno de dichos valores comparados es el cociente de los niveles de expresión de cada uno de estos genes. En otra materialización específica, cada uno de dichos niveles de expresión de cada uno de dichos genes en dicha muestra colectiva se normaliza antes de proceder a cualquiera de dichos pasos de comparación. En otra materialización específica, la normalización de dichos niveles de expresión se lleva a cabo dividiendo cada uno de dichos niveles de expresión por la mediana o el nivel medio de expresión de uno o más genes constitutivos en dicha muestra colectiva. En una materialización más específica, dichos niveles de expresión normalizados se someten a una transformación logarítmica y dichos pasos de comparación consisten en sustraer dicha transformación logarítmica del logaritmo de dichos niveles de expresión de cada uno de dichos genes en dicha muestra de dicha célula u organismo. En otra materialización específica, dichos al menos dos fenotipos diferentes son etapas diferentes de una enfermedad o desorden. En otra materialización específica, dichos al menos dos fenotipos diferentes son diferentes pronósticos de una enfermedad o desorden. En una materialización específica más, dichos niveles de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva o dichos niveles de expresión de cada uno de dichos genes en una muestra de dicha célula u organismo caracterizada por tener dicho primer fenotipo, dicho segundo fenotipo o dicho fenotipo diferente de dicho primer y segundo fenotipos, respectivamente, se almacenan en un ordenador.
[0020] Asimismo se describen biochips que comprenden los conjuntos de marcadores que se dan a conocer. Se describe un biochip que comprende al menos 5 marcadores derivados de cualquiera de los de las Tablas 1-6, en donde al menos un 50% de las sondas del biochip están presentes en alguna de las Tablas 1-6. En materializaciones más específicas, al menos un 60%, 70%, 80%, 90%, 95% o 98% de las sondas de dicho biochip están presentes en alguna de las Tablas 1- 6.
[0021] Asimismo se describe un biochip para distinguir entre muestras de células ER (+) y ER (-) que comprenden un despliegue de posición direccionable de sondas polinucleótidas conectadas a un soporte, comprendiendo dichas sondas polinucleótidas una serie de sondas polinucleótidas de diferentes secuencias polinucleótidas que comprenden una secuencia complementaria e hibridable con una serie de genes, consistiendo dicha serie en al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 1 o en la Tabla 2, en donde al menos un 50% de las sondas del biochip están presentes en la Tabla 1 o en la Tabla 2. También se describe una selección para distinguir muestras de células afines a Brai y de tipo tumor esporádico que comprenden un despliegue de posición direccionable de sondas polinucleótidas conectadas a un soporte, comprendiendo dichas sondas polinucleótidas una serie de sondas polinucleótidas de diferentes secuencias polinucleótidas, comprendiendo cada una de dichas secuencias polinucleótidas una secuencia complementaria e hibridable con una serie de genes, consistiendo dicha serie en al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 3 o en la Tabla 4, en donde al menos un 50% de las sondas del biochip están presente en la Tabla 3 o en la Tabla 4. Asimismo se describe un biochip para distinguir muestras de células de pacientes que tienen un buen pronóstico y muestras de células de pacientes que tienen un pronóstico deficiente, el cual comprende un despliegue de posición direccionable de sondas polinucleótidas conectadas a un soporte, comprendiendo dichas sondas polinucleótidas una serie de sondas polinucleótidas de diferentes secuencias polinucleótidas, consistiendo cada una de dichas diferentes secuencias polinucleótidas una secuencia complementaria e hibridable con una serie de genes, consistiendo dicha serie en al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 5 o en la Tabla 6, en donde al menos un 50% de las sondas del biochip están presentes en la Tabla 5 o en la Tabla 6. También se describen biochips que comprenden al menos 5, 20, 50, 100, 200, 500, 100, 1.250, 1.500, 1.750, o 2.000 de los genes marcadores de categoría ER- enumerados en la Tabla 1, al menos 5, 20, 50, 100, 200 o 300 del los genes marcadores esporádicos del BRCA1 enumerados en la Tabla 3, o al menos 5, 20, 50, 100 o 200 de los genes marcadores de pronóstico enumerados en la Tabla 5, en cualquier combinación, en donde al menos un 50%, 60%, 70%, 80%, 90%, 95% o 98% de las sondas de dichos biochips están presentes en la Tabla 1, la Tabla 3 y/o la Tabla 5.
[0022] Se describe un kit para determinar la categoría de ER de una muestra que comprende al menos dos biochips, de los que cada uno comprende 5 de los marcadores enumerados en la Tabla 1, y un sistema informático para determinar la semejanza del nivel de ácido nucleico derivado de los marcadores enumerados en la Tabla 1 en una muestra con el de una reserva de ER (-) y una reserva de ER (+), sistema informático que comprende un procesador y una memoria que lleva codificados uno o más programas acoplados al procesador, en donde dichos uno o más programas hacen que el procesador ejecute un método consistente en computar las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de ER (-) y las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de ER (+), o un método consistente en determinar la correlación calculada según la Ecuación (4). También se describen kits capaces de distinguir entre el BRCA1 y los tumores esporádicos y muestras de pacientes con buen pronóstico de muestras de pacientes con pronóstico deficiente, mediante la inclusión de los conjuntos de genes marcadores apropiados. También se describe un kit para determinar si una muestra procede de una paciente con buen pronóstico o de una con pronóstico deficiente, que comprende al menos un biochip que comprende sondas para al menos 5 de los genes correspondientes a los marcadores enumerados en la Tabla 5, y un soporte informático legible en el que se hayan grabado uno o más programas para determinar la semejanza del nivel de ácido nucleico derivado de los marcadores enumerados en la Tabla 5 en una muestra con el de una reserva de muestras procedentes de individuos con buen pronóstico y una reserva de muestras procedentes de individuos con pronóstico deficiente, en donde dichos uno o más programas hace que un ordenador ejecute un método consistente en computar las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de buen pronóstico y las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de pronóstico deficiente, o un método consistente en determinar la correlación de expresión de los marcadores de la muestra con la expresión en las reservas de buen pronóstico y pronóstico deficiente, correlación que se calcula según la Ecuación (3).
4. BREVE DESCRIPCIÓN DE LAS FIGURAS
[0023]
La FIG. 1 es un diagrama de tipo Venn que muestra la superposición entre los conjuntos de marcadores que aquí se dan a conocer, incluidos los 2.460 marcadores de ER, los 430 marcadores de BRCA1/esporádicos y los 231 indicadores de pronóstico.
La FIG. 2 muestra los procedimientos experimentales para medir diferentes cambios en la densidad de transcripción de ARNm en los tumores de cáncer de mama usados en este estudio. En cada experimento, el ARNc etiquetado como Cy5 de un tumor X se hibrida en un biochip humano de 25k junto con una reserva de ARNc etiquetada como Cy3 hecha de muestras de ARNc de los tumores 1, 2, ... N. Los datos de expresión digital se obtuvieron por escaneo y procesado de imágenes. El error de modelado nos permitió asignar un valor-p a cada medición del cociente de transcripción.
La FIG. 3 El agrupamiento bidimensional revela dos tipos diferenciados de tumores. El agrupamiento se basó en los datos de expresión de genes de 98 tumores de cáncer de mama sobre 4.986 genes relevantes. El gris oscuro (rojo) representa regulación hacia arriba, el gris claro (verde) representa regulación hacia abajo, el negro indica sin cambios en la expresión y el gris indica que los datos no están disponibles. Se seleccionaron 4.986 genes que mostraron un cambio de cociente de más del doble en más de cinco experimentos. Los datos clínicos seleccionados para los resultados de las pruebas de mutaciones del BRCA1, receptor de estrógeno (ER) y receptor de proestrógeno (PR), grado del tumor, infiltrado linfocítico y angioinvasión se muestran a la derecha. El negro indica negativo y el blanco indica positivo. El patrón predominante en la parte inferior consta de 36 pacientes, de las cuales 34 son ER-negativas (total 39), y 16 son portadoras de mutación de BRCA1 (total 18).
FIG. 4 Una porción de resultados agrupados no supervisados, como los de la FIG. 3. ESR1 (el gen receptor de estrógenos) está regulado conjuntamente con un grupo de genes fuertemente regulados entre sí para formar un patrón dominante.
FIG. 5A Histograma de coeficientes de correlación de genes relevantes entre sus cocientes de expresión y la categoría del receptor de estrógenos (ER) (esto es, el nivel de ER). El histograma para datos experimentales aparece en línea gris. Los resultados de un ensayo Monte-Carlo aparecen en línea negra gruesa. Hay 2.460 genes cuyos datos de expresión están en correlación con la categoría de ER a un nivel superior a 0,3 o en anticorrelación con la categoría de ER a un nivel inferior a -0.3.
FIG. 5B La distribución del número de genes que se ajustó a los mismos criterios de selección (amplitud de correlación por encima de 0,3) de entre 10.000 ensayos Monte-Carlo. Se estima que este conjunto de 2.460 genes informa de la categoría de ER a un nivel de fiabilidad de p >99.99%.
FIG. 6 Tasas de error de clasificación para Tipo 1 y Tipo 2 como función del número (excepto 2,460) de genes marcadores usados en el clasificador. La tasa de error combinada más baja se da cuando se usan aproximadamente 550 genes marcadores.
FIG. 7 Clasificación de 98 muestras de tumores como ER(+) o ER(-) basándose en niveles de expresión de los 550 genes marcadores óptimos. Las muestras de ER(+) (por encima de la línea blanca) muestran un patrón de expresión claramente diferente al de las muestras de ER(-) (por debajo de la línea blanca).
FIG. 8 Correlación entre los niveles de expresión en muestras de cada paciente y el perfil medio del grupo de ER(-) con respecto a. la correlación con el grupo de ER(+). Los cuadrados representan muestras de pacientes clínicamente ER(-); los redondeles representan muestras de pacientes clínicamente ER(-).
FIG. 9A El histograma de coeficientes de correlación de expresión de genes sobre el cociente de cada gen relevante con la clase de mutación del BRCA1 aparece en línea continua. La línea discontinua indica una distribución de frecuencia a partir de un ensayo Monte-Carlo. 430 genes mostraron una amplitud de correlación o anticorrelación superior a 0,35.
FIG. 9B Distribución de frecuencia del número de genes que muestran una amplitud de correlación o anticorrelación superior a 0,35 para el control de los 10.000 ensayos Monte-Carlo. Media=115.p(n>430)=0.48% y p(>430/2)=9.0%.
FIG. 10 Tasas de error de clasificación para Tipo 1 y Tipo 2 como función del número de genes discriminantes usados en el clasificador (plantilla). La tasa de error combinada más baja se da cuando se usan aproximadamente 100 genes marcadores discriminantes.
FIG. 11A La clasificación de 38 tumores del grupo ER(-) en dos subgrupos, BRCA1 y esporádicos, usando el conjunto óptimo de 100 genes marcadores discriminantes. Las pacientes por encima de la línea blanca se caracterizan por patrones asociados al BRCA1.
FIG. 11B Correlación entre niveles de expresión en muestras de cada paciente ER(-) y el perfil medio del grupo BRCA1 frente a correlación con el grupo esporádico. Los cuadrados representan muestras de pacientes con tumores de tipo esporádico; los redondeles representan muestras de pacientes portadoras de la mutación de BRCA1.
FIG. 12A El histograma de los coeficientes de correlación de cociente de expresión de genes de cada gen relevante con la clase de pronóstico (grupo de metástasis distantes y grupo de metástasis no distantes aparece en línea continua. La distribución procedente de un ensayo Monte-Carlo aparece en línea discontinua. La amplitud de correlación o anticorrelación de 231 genes marcadores es superior a 0,3.
FIG. 12B Distribución de frecuencia del número de genes cuya amplitud de correlación o anticorrelación fue superior a 0,3 en 10,000 ensayos Monte-Carlo.
FIG. 13 Tasa de error de clasificación del grupo de metástasis distante para Tipo 1 y Tipo 2 como función del número de genes discriminantes usados en el clasificador. La tasa de error combinada más baja se da cuando se usan aproximadamente 70 genes marcadores discriminantes.
FIG. 14 Clasificación de 78 tumores esporádicos en dos grupos de pronóstico, metástasis distante (pronóstico deficiente) y metástasis no distante (buen pronóstico) mediante el conjunto óptimo de 70 genes marcadores discriminantes. Las pacientes por encima de la línea blanca se caracterizan por tener buen pronóstico. Las pacientes por debajo de la línea blanca se caracterizan por tener pronóstico deficiente.
FIG. 15 Correlación entre los niveles de expresión en muestras de cada paciente y el perfil medio del grupo de buen pronóstico frente a la correlación con el grupo de pronóstico deficiente. Los cuadrados representan muestras de pacientes que tienen pronóstico deficiente, los redondeles representan muestras de pacientes que tienen pronóstico deficiente. Los cuadrados rojos representan las “recaídas”, mientras que los redondeles azules representan las “no recaídas”. Se clasificó erróneamente a 13 de un total de 78.
FIG. 16 Probabilidad de recaída como función de tiempo desde el diagnóstico. La predicción del Grupo A y del grupo B se realizó según el método de “dejar uno fuera” basándose en el conjunto óptimo de 70 genes marcadores discriminantes. Las 43 pacientes del grupo A se dividen en 37 pacientes del grupo de metástasis no distante y 6 pacientes del grupo de metástasis distante. Las 35 pacientes del grupo B se dividen en 28 pacientes del grupo de metástasis distante y 7 pacientes del grupo de metástasis no distante.
FIG. 17 Probabilidad de metástasis distante como función de tiempo desde el diagnóstico para individuos con receptor de progesterona PR(+) (sí) o PR(-) (no).
FIG. 18 Probabilidad de metástasis distante como función de tiempo desde el diagnóstico para individuos de ER(+) (sí) o ER(-) (no).
FIG. 19A, B Probabilidad de metástasis distante como función de tiempo desde el diagnóstico. Los grupos se definieron por grados de tumor.
FIG. 20A Clasificación de 19 tumores esporádicos independientes en dos grupos de pronóstico, metástasis distante y metástasis no distante, mediante los 70 genes marcadores óptimos. Las pacientes por encima de la línea blanca tienen buen pronóstico. Las pacientes por debajo de la línea blanca tienen pronóstico deficiente.
FIG. 20B La correlación entre los cocientes de expresión de cada paciente y el cociente medio de expresión del grupo de buen pronóstico se define mediante el conjunto de ensayo con respecto a la correlación entre los cocientes de expresión de cada paciente y el cociente medio de expresión del conjunto de ensayo de pronóstico deficiente. De nueve pacientes en el grupo de buen pronóstico, tres son del "grupo de metástasis distante"; de diez pacientes en el grupo de buen pronóstico, una paciente es del "grupo de metástasis no distante". Esta tasa de error de 4 sobre 19 se corresponde con la de 13 sobre 78 en las 78 pacientes iniciales.
FIG. 20C Probabilidad de recaída como función de tiempo desde el diagnóstico para dos grupos cuya predicción se hizo basándose en la expresión de los 70 genes marcadores óptimos.
FIG. 21A Sensibilidad frente a 1-especificidad para la clasificación de buen pronóstico.
FIG. 21B Sensibilidad frente a 1-especificidad para la clasificación de pronóstico deficiente.
FIG. 21C Tasa total de error como función de umbral en la probabilidad modelada. Se usaron seis parámetros clínicos (categoría de ER, categoría de PR, grado de tumor, tamaño de tumor, edad de la paciente y presencia o ausencia de angioinvasión) para realizar el modelado clínico.
FIG. 22 Comparación del cociente logarítmico de muestras individuales mediante la "reserva de muestras de material" frente a la intensidad logarítmica sustraída media mediante la "reserva de muestras matemáticas" para 70 genes indicadores en las 78 muestras de tumores esporádicos. La "reserva de muestras de material" estaba constituida por las 78 muestras de tumores esporádicos.
FIG. 23A Los resultados de la validación cruzada dejando un elemento fuera basándose en los datos de un solo canal. Las muestras se agrupan según el coeficiente de correlación de cada muestra con el perfil medio de "buen pronóstico" y "pronóstico deficiente" en los 70 genes examinados. La línea blanca separa las muestras de los pacientes con pronóstico deficiente (abajo) de las de aquellos con buen pronóstico (arriba).
FIG. 23B Diagrama de dispersión de coeficientes de correlación con la expresión media en muestras de “buen pronóstico” y “pronóstico deficiente”. La falsa tasa positiva (esto es, la tasa de clasificaciones incorrectas de una muestra de una paciente con buen pronóstico como perteneciente a una con pronóstico deficiente) fue de 10 sobre 44, mientras que la falsa tasa negativa fue de 6 sobre 34.
FIG. 24A Hibridación de datos de un solo canal para muestras ordenadas jerárquicamente por coeficientes de correlación con el clasificador de buen pronóstico. Las muestras clasificadas como “buen pronóstico” se hallan por encima de la línea blanca, mientras que las clasificadas como “pronóstico deficiente” se hallan por debajo de la misma.
FIG. 24B Diagrama de dispersión de coeficientes de correlación con tres muestras clasificadas incorrectamente que se hallan a la derecha del valor umbral de coeficiente de correlación. Dicho valor umbral de correlación se fijó en 0,2727 para limitar las falsas muestras negativas a aproximadamente el 10% de las mismas.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
5.1 INTRODUCCIÓN
[0024] La invención se refiere a conjuntos de marcadores genéticos cuyos patrones de expresión guardan correlación con importantes características del cáncer de mama, esto es, la categoría del receptor de estrógeno (ER), la categoría del BRCA1 y la probabilidad de recaída (esto es, metástasis distante o pronóstico deficiente). Se describen conjuntos marcadores genéticos que pueden distinguir las tres siguientes categorías clínicas. En primer lugar, la invención se refiere a conjuntos de marcadores cuya expresión guarda correlación con la categoría de ER de un paciente y que puede usarse para distinguir los pacientes ER (+) de los pacientes ER (-). La categoría de ER es un indicador de pronóstico muy útil y un indicador de la probabilidad de que un paciente responda a ciertas terapias como el tamoxifeno.
[0025] Igualmente, entre las mujeres que son ER positivas la tasa de respuesta (superior al 50%) a la terapia hormonal es mucho mayor que la tasa de respuesta (inferior al 10%) en pacientes con categoría negativa de ER. En pacientes con tumores de ER positivo la posibilidad de conseguir una respuesta hormonal es directamente proporcional al nivel de ER (P. Calabresi y P. S. Schein, MEDICAL ONCOLOGY (2ND ED.), McGraw-Hill, Inc., New York (1993)). En segundo lugar, la invención se refiere además a conjuntos de marcadores cuya expresión guarda correlación con la presencia de mutaciones de BRCA1 y que pueden usarse para distinguir los tumores de tipo BRCA1 de los tumores esporádicos. En tercer lugar, la invención se refiere a marcadores genéticos cuya expresión guarda correlación con el pronóstico clínico y que puede usarse para distinguir entre las pacientes que tienen buen pronóstico (esto es, que no tengan metástasis distante de un tumor dentro de los cinco años) y las de pronóstico deficiente (esto es, que tengan metástasis distante de un tumor durante cinco años). En cuanto al uso de estos marcadores, se suministran métodos para distinguir entre estos grupos de pacientes y para determinar pautas generales de tratamiento. También se suministran biochips que contienen estos marcadores, así como métodos para elaborar dichos biochips. Cada uno de los marcadores corresponde a un gen del genoma humano, es decir, dicho marcador es identificable como el todo o una porción de un gen. Por último, como cada uno de los marcadores de más arriba está en correlación con ciertas afecciones relacionadas con el cáncer de mama, los marcadores, o las proteínas codificadas en éstos, serán muy probablemente el destino de medicamentos contra el cáncer de mama.
5.2 DEFINICIONES
[0026] Tal como se usa aquí, “tumor BRCAI” significa tumor que tiene células que contienen una mutación del locus BRCA1.
[0027] La “amplitud absoluta” de expresiones de correlación significa la distancia, tanto si es positiva como negativa, a un valor cero, es decir, ambos coeficientes, -0,35 y 0,35, tienen una amplitud absoluta de 0,35.
[0028] “Categoría” significa un estado de expresión de genes de un conjunto de marcadores genéticos cuya expresión está en estrecha correlación con un fenotipo concreto. Por ejemplo, “categoría de ER” significa un estado de expresión de genes de un conjunto de marcadores genéticos cuya expresión está en estrecha correlación con la del ESR1 (gen receptor de estrógeno), en donde el patrón de expresión de estos genes varía significativamente entre los tumores que expresan el receptor y los tumores que no expresan el receptor.
[0029] “Buen pronóstico” significa que se espera que una paciente no tenga metástasis distantes de un tumor de mama dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama.
[0030] “Pronóstico deficiente” significa que se espera que una paciente tenga metástasis distantes de un tumor de mama dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama.
[0031] “Marcador” significa un gen entero, o un EST derivado de dicho gen, cuyo nivel de expresión cambia en ciertas condiciones. Allí donde la expresión del gen esté en correlación con un estado en concreto, el gen será un marcador para ese estado.
[0032] “Polinucleótidos derivados de marcador” significa el ARN transcrito de un gen marcador, cualquier ADNc 5 o ARNc producido del mismo y cualquier ácido nucleico derivado del mismo, como el ácido nucleico sintético que tenga una secuencia derivada del gen correspondiente al gen marcador.
5.3 MARCADORES ÚTILES EN EL DIAGNÓSTICO Y PRONÓSTICO DEL CÁNCER DE MAMA
5.3.1 CONJUNTOS DE MARCADORES
[0033] Se describe un conjunto de 4.986 marcadores genéticos cuya expresión está en correlación con la
10 existencia de cáncer de mama mediante análisis de agrupación. En la SEQ ID Nos: 1-2,699 se enumera un subconjunto de dichos marcadores identificados como útiles para el diagnóstico o el pronóstico. La invención también se refiere a un método de uso de dichos marcadores para distinguir los tipos de tumores en el diagnóstico o el pronóstico.
[0034] También se describe un conjunto de 2.460 marcadores genéticos que pueden clasificar a las pacientes
15 de cáncer de mama por la categoría del receptor de estrógeno (ER), esto es, distinguir entre pacientes o tumores con ER (+) y ER (-) obtenidos de dichas pacientes. La categoría de ER es un importante indicador de la probabilidad de la respuesta de un paciente a algunas quimioterapias (esto es, al tamoxifeno). Dichos marcadores se enumeran en la Tabla 1. La invención también se refiere a subconjuntos de al menos 5, 10, 25, 50, 100, 200, 300, 400, 500, 750, 1.000, 1.250, 1.500, 1.750 o 2.000 marcadores genéticos, sacados del conjunto
20 de 2.460 marcadores, que también pueden distinguir pacientes o tumores con ER (+) y ER (-). Preferiblemente, el número de marcadores será de 550. Se describe además un conjunto de 550 de los 2.460 marcadores que son óptimos para distinguir la categoría de ER (Tabla 2). También se suministra un método de uso de dichos marcadores para distinguir entre pacientes o tumores ER (+) y ER (-) obtenidos de los mismos.
[0035] En otra materialización se describe un conjunto de 430 marcadores genéticos que pueden clasificar a
25 pacientes de cáncer de mama con ER (-) por la categoría del BRCA1, es decir, distinguir entre tumores que contienen una mutación de BRCA1 y tumores esporádicos. Dichos marcadores se enumeran en la Tabla 3. Además, se proporcionan subconjuntos de al menos 5, 10, 20, 30, 40, 50, 75, 100, 150, 200, 250, 300 o 350 marcadores, sacados del conjunto de 430 marcadores, que también distinguen entre tumores que contienen una mutación de BRCA1 y tumores esporádicos. Preferiblemente, el número de marcadores será de 100. En la Tabla
30 4 se suministra un conjunto preferido de 100 marcadores. También se suministra un método de uso de dichos marcadores para distinguir entre pacientes o tumores BRCA1 y esporádicos obtenidos de los mismos.
[0036] La invención se refiere a un conjunto de 231 marcadores genéticos que pueden distinguir entre las pacientes con un buen pronóstico de cáncer de mama (ausencia de metástasis distantes de tumores de cáncer de mama dentro de los cinco años siguientes) y las pacientes con un pronóstico deficiente de cáncer de mama 35 (presencia de metástasis distantes de tumores de cáncer de mama dentro de los cinco años siguientes). Dichos marcadores se enumeran en la Tabla 5. Se suministran subconjuntos de al menos 5, 10, 20, 30, 40, 50, 75, 100, 150 o 200 marcadores, sacados del conjunto de 231, que también distinguen entre pacientes con buen y con pronóstico deficiente. En la Tabla 6 se suministra un conjunto preferido de 70 marcadores. En una materialización específica, el conjunto de marcadores consta de los doce marcadores relacionados con la
40 quinasa y los siete marcadores relacionados con la división de células o mitosis. La invención también suministra un método de uso de los marcadores de más arriba para distinguir entre pacientes con buen pronóstico y con pronóstico deficiente.
Table 1. 2.460 marcadores de genes que distinguen entre muestras de células ER(+) y ER(-).
- Banco de Genes
- Bando de Genes
- Número de Acceso
- SEQ ID NO Número de Acceso SEQ ID NO
- AA555029_RC
- SEQ ID NO 1 NM_006984 SEQ ID NO 1344
- AB000509
- SEQ ID NO 2 NM_007005 SEQ ID NO 1345
- AB001451
- SEQ ID NO 3 NM_007006 SEQ ID NO 1346
- AB002301
- SEQ ID NO 4 NM_007019 SEQ ID NO 1347
- AB002308
- SEQ ID NO 5 NM_007027 SEQ ID NO 1348
- AB002351
- SEQ ID NO 6 NM_007044 SEQ ID NO 1350
- AB002448
- SEQ ID NO 7 NM_007050 SEQ ID NO 1351
- AB006628
- SEQ ID NO 9 NM_007057 SEQ ID NO 1352
- AB006630
- SEQ ID NO 10 NM_007069 SEQ ID NO 1353
- AB006746
- SEQ ID NO 11 NM_007074 SEQ ID NO 1355
- AB007458
- SEQ ID NO 12 NM_007088 SEQ ID NO 1356
- AB007855
- SEQ ID NO 13 NMB_007111 SEQ ID NO 1357
- AB007857
- SEQ ID NO 14 NMB_007146 SEQ ID NO 1358
- AB007863
- SEQ ID NO 15 NM_007173 SEQ ID NO 1359
- AB007883
- SEQ ID NO 16 NMB_007177 SEQ ID NO 1360
- AB007896
- SEQ ID NO 17 NMB_007196 SEQ ID NO 1361
- AB007899
- SEQ ID NO 18 NM_007203 SEQ ID NO 1362
- AB007916
- SEQ ID NO 19 NM_007214 SEQ ID NO 1363
- AB007950
- SEQ ID NO 20 NMB_007217 SEQ ID NO 1364
- AB011087
- SEQ ID NO 21 NM_007231 SEQ ID NO 1365
- AB011089
- SEQ ID NO 22 NM_007268 SEQ ID NO 1367
- AB011104
- SEQ ID NO 23 NM_007274 SEQ ID NO 1368
- AB011105
- SEQ ID NO 24 NM_007275 SEQ ID NO 1369
- AB011121
- SEQ ID NO 25 NM_007281 SEQ ID NO 1370
- AB011132
- SEQ ID NO 26 NM_007309 SEQ ID NO 1371
- AB011152
- SEQ ID NO 27 NMB_007315 SEQ ID NO 1372
- AB011179
- SEQ ID NO 28 NM_007334 SEQ ID NO 1373
- AB014534
- SEQ ID NO 29 NM_007358 SEQ ID NO 1374
- AB014568
- SEQ ID NO 30 NM_009585 SEQ ID NO 1375
- AB018260
- SEQ ID NO 31 NM_009587 SEQ ID NO 1376
- AB018268
- SEQ ID NO 32 NM_009588 SEQ ID NO 1377
- AB018289
- SEQ ID NO 33 NMB_012062 SEQ ID NO 1378
- AB018345
- SEQ ID NO 35 NMB_012067 SEQ ID NO 1379
- AB020677
- SEQ ID NO 36 NMB_012101 SEQ ID NO 1380
- AB020689
- SEQ ID NO 37 NMB_012105 SEQ ID NO 1381
- AB020695
- SEQ ID NO 38 NMB_012108 SEQ ID NO 1382
- AB020710
- SEQ ID NO 39 NM_012110 SEQ ID NO 1383
- AB023139
- SEQ ID NO 40 NMB_012124 SEQ ID NO 1384
- AB023151
- SEQ ID NO 41 NM_012142 SEQ ID NO 1386
- AB023152
- SEQ ID NO 42 NM_012155 SEQ ID NO 1388
- AB023163
- SEQ ID NO 43 NM_012175 SEQ ID NO 1389
- AB023173
- SEQ ID NO 44 NMB_012177 SEQ ID NO 1390
- AB023211
- SEQ ID NO 45 NM_012205 SEQ ID NO 1391
- AB024704
- SEQ ID NO 46 NM_012219 SEQ ID NO 1393
- AB028985
- SEQ ID NO 47 NMB_012242 SEQ ID NO 1394
- AB028986
- SEQ ID NO 48 NMB_012250 SEQ ID NO 1395
- AB028998
- SEQ ID NO 49 NM_012261 SEQ ID NO 1397
- AB029031
- SEQ ID NO 51 NM_012286 SEQ ID NO 1398
- AB032951
- SEQ ID NO 52 NM_012319 SEQ ID NO 1400
- AB032966
- SEQ ID NO 53 NM_012332 SEQ ID NO 1401
- AB032969
- SEQ ID NO 54 NM_012336 SEQ ID NO 1402
- AB032977
- SEQ ID NO 56 NMB_012339 SEQ ID NO 1404
- AB033007
- SEQ ID NO 58 NMB_012341 SEQ ID NO 1405
- AB033034
- SEQ ID NO 59 NMB_012391 SEQ ID NO 1406
12
- AB033035
- SEQ ID NO 60 NM_012394 SEQ ID NO 1407
- AB033040
- SEQ ID NO 61 NM_012413 SEQ ID NO 1408
- AB033049
- SEQ ID NO 63 NM_012421 SEQ ID NO 1409
- AB033050
- SEQ ID NO 64 NMB_012425 SEQ ID NO 1410
- AB033053
- SEQ ID NO 65 NM_012427 SEQ ID NO 1411
- AB033055
- SEQ ID NO 66 NM_012429 SEQ ID NO 1413
- AB033058
- SEQ ID NO 67 NM_012446 SEQ ID NO 1414
- AB033073
- SEQ ID NO 68 NM_012463 SEQ ID NO 1415
- AB033092
- SEQ ID NO 69 NM_012474 SEQ ID NO 1416
- AB033111
- SEQ ID NO 70 NM_013230 SEQ ID NO 1417
- AB036063
- SEQ ID NO 71 NM_013233 SEQ ID NO 1418
- AB037720
- SEQ ID NO 72 NM_013238 SEQ ID NO 1419
- AB037743
- SEQ ID NO 74 NM_013239 SEQ ID NO 1420
- AB037745
- SEQ ID NO 75 NM_013242 SEQ ID NO 1421
- AB037756
- SEQ ID NO 76 NM_01 3257 SEQ ID NO 1423
- AB037765
- SEQ ID NO 77 NM_013261 SEQ ID NO 1424
- AB037778
- SEQ ID NO 78 NM_013262 SEQ ID NO 1425
- AB037791
- SEQ ID NO 79 NM_013277 SEQ ID NO 1426
- AB037793
- SEQ ID NO 80 NM_013296 SEQ ID NO 1427
- AB037802
- SEQ ID NO 81 NM_013301 SEQ ID NO 1428
- AB037806
- SEQ ID NO 82 NM_013324 SEQ ID NO 1429
- AB037809
- SEQ ID NO 83 NM_013327 SEQ ID NO 1430
- AB037836
- SEQ ID NO 84 NM_013336 SEQ ID NO 1431
- AB037844
- SEQ ID NO 85 NM_013339 SEQ ID NO 1432
- AB037845
- SEQ ID NO 86 NM_013363 SEQ ID NO 1433
- AB037848
- SEQ ID NO 87 NM_013378 SEQ ID NO 1435
- AB037863
- SEQ ID NO 88 NM_013384 SEQ ID NO 1436
- AB037864
- SEQ ID NO 89 NM_013385 SEQ ID NO 1437
- AB040881
- SEQ ID NO 90 NM_013406 SEQ ID NO 1438
- AB040900
- SEQ ID NO 91 NM_013437 SEQ ID NO 1439
- AB040914
- SEQ ID NO 92 NM_013451 SEQ ID NO 1440
- AB040926
- SEQ ID NO 93 NM_013943 SEQ ID NO 1441
- AB040955
- SEQ ID NO 94 NMB_013994 SEQ ID NO 1442
- AB040961
- SEQ ID NO 95 NMB_013995 SEQ ID NO 1443
- AF000974
- SEQ ID NO 97 NMB_014026 SEQ ID NO 1444
- AF005487
- SEQ ID NO 98 NM_014029 SEQ ID NO 1445
- AF007153
- SEQ ID NO 99 NM_014036 SEQ ID NO 1446
- AF007155
- SEQ ID NO 100 NM_014062 SEQ ID NO 1447
- AF015041
- SEQ ID NO 101 NMB_014074 SEQ ID NO 1448
- AF016004
- SEQ ID NO 102 NM_014096 SEQ ID NO 1450
- AF016495
- SEQ ID NO 103 NM_014109 SEQ ID NO 1451
- AF020919
- SEQ ID NO 104 NM_014112 SEQ ID NO 1452
- AF026941
- SEQ ID NO 105 NM_014147 SEQ ID NO 1453
- AF035191
- SEQ ID NO 106 NM_014149 SEQ ID NO 1454
- AF035284
- SEQ ID NO 107 NMB_014164 SEQ ID NO 1455
- AF035318
- SEQ ID NO 108 NMB_014172 SEQ ID NO 1456
- AF038182
- SEQ ID NO 109 NM_014175 SEQ ID NO 1457
13
- AF038193
- SEQ ID NO 110 NM_014181 SEQ ID NO 1458
- AF042838
- SEQ ID NO 111 NM_014184 SEQ ID NO 1459
- AF044127
- SEQ ID NO 112 NM_014211 SEQ ID NO 1460
- AF045229
- SEQ ID NO 113 NM_014214 SEQ ID NO 1461
- AF047002
- SEQ ID NO 114 NM_014216 SEQ ID NO 1462
- AF047826
- SEQ ID NO 115 NM_014241 SEQ ID NO 1463
- AF049460
- SEQ ID NO 116 NM_014246 SEQ ID NO 1465
- AF052101
- SEQ ID NO 117 NM_014268 SEQ ID NO 1466
- AF052117
- SEQ ID NO 118 NM_014272 SEQ ID NO 1467
- AF052155
- SEQ ID NO 119 NM_014274 SEQ ID NO 1468
- AF052159
- SEQ ID NO 120 NM_014289 SEQ ID NO 1469
- AF052176
- SEQ ID NO 122 NM_014298 SEQ ID NO 1470
- AF052185
- SEQ ID NO 123 NM_014302 SEQ ID NO 1471
- AF055270
- SEQ ID NO 126 NM_014315 SEQ ID NO 1473
- AF058075
- SEQ ID NO 127 NM_014316 SEQ ID NO 1474
- AF061034
- SEQ ID NO 128 NM_014317 SEQ ID NO 1475
- AF063725
- SEQ ID NO 129 NM_014320 SEQ ID NO 1476
- AF063936
- SEQ ID NO 130 NM_014321 SEQ ID NO 1477
- AF065241
- SEQ ID NO 131 NM_014325 SEQ ID NO 1478
- AF067972
- SEQ ID NO 132 NM_014335 SEQ ID NO 1479
- AF070536
- SEQ ID NO 133 NM_014363 SEQ ID NO 1480
- AF070552
- SEQ ID NO 134 NM_014364 SEQ ID NO 1481
- AF070617
- SEQ ID NO 135 NM_014365 SEQ ID NO 1482
- AF073770
- SEQ ID NO 138 NM_014373 SEQ ID NO 1483
- AF076612
- SEQ ID NO 139 NM_014382 SEQ ID NO 1484
- AF079529
- SEQ ID NO 140 NM_014395 SEQ ID NO 1485
- AF090913
- SEQ ID NO 142 NM_014398 SEQ ID NO 1486
- AF095719
- SEQ ID NO 143 NM_014399 SEQ ID NO 1487
- AF098641
- SEQ ID NO 144 NM_014402 SEQ ID NO 1488
- AF099032
- SEQ ID NO 145 NM_014428 SEQ ID NO 1489
- AF100756
- SEQ ID NO 146 NM_014448 SEQ ID NO 1490
- AF101051
- SEQ ID NO 147 NM_014449 SEQ ID NO 1491
- AF103375
- SEQ ID NO 148 NM_014450 SEQ ID NO 1492
- AF103458
- SEQ ID NO 149 NM_014452 SEQ ID NO 1493
- AF103530
- SEQ ID NO 150 NM_014453 SEQ ID NO 1494
- AF103804
- SEQ ID NO 151 NM_014456 SEQ ID NO 1495
- AF111849
- SEQ ID NO 152 NM_014479 SEQ ID NO 1497
- AF112213
- SEQ ID NO 153 NM_014501 SEQ ID NO 1498
- AF113132
- SEQ ID NO 154 NM_014552 SEQ ID NO 1500
- AF116682
- SEQ ID NO 156 NM_014553 SEQ ID NO 1501
- AF118224
- SEQ ID NO 157 NM_014570 SEQ ID NO 1502
- AF118274
- SEQ ID NO 158 NM_014575 SEQ ID NO 1503
- AF119256
- SEQ ID NO 159 NM_014585 SEQ ID NO 1504
- AF119665
- SEQ ID NO 160 NM_014595 SEQ ID NO 1505
- AF121255
- SEQ ID NO 161 NM_014624 SEQ ID NO 1507
- AF131748
- SEQ ID NO 162 NM_014633 SEQ ID NO 1508
- AF131753
- SEQ ID NO 163 NM_014640 SEQ ID NO 1509
14
- AF131760
- SEQ ID NO 164 NM_014642 SEQ ID NO 1510
- AF131784
- SEQ ID NO 165 NM_014643 SEQ ID NO 1511
- AF131828
- SEQ ID NO 166 NM_014656 SEQ ID NO 1512
- AF135168
- SEQ ID NO 167 NM_014668 SEQ ID NO 1513
- AF141882
- SEQ ID NO 168 NM_014669 SEQ ID NO 1514
- AF148505
- SEQ ID NO 169 NM_014673 SEQ ID NO 1515
- AF149785
- SEQ ID NO 170 NM_014675 SEQ ID NO 1516
- AF151810
- SEQ ID NO 171 NM_014679 SEQ ID NO 1517
- AF152502
- SEQ ID NO 172 NM_014680 SEQ ID NO 1518
- AF155120
- SEQ ID NO 174 NM_014696 SEQ ID NO 1519
- AF159092
- SEQ ID NO 175 NM_014700 SEQ ID NO 1520
- AF161407
- SEQ ID NO 176 NM_014715 SEQ ID NO 1521
- AF161553
- SEQ ID NO 177 NM_014721 SEQ ID NO 1522
- AF164104
- SEQ ID NO 178 NM_014737 SEQ ID NO 1524
- AF167706
- SEQ ID NO 179 NM_014738 SEQ ID NO 1525
- AF175387
- SEQ ID NO 180 NM_014747 SEQ ID NO 1526
- AF176012
- SEQ ID NO 181 NM_014750 SEQ ID NO 1527
- AF186780
- SEQ ID NO 182 NM_014754 SEQ ID NO 1528
- AF217508
- SEQ ID NO 184 NM_014767 SEQ ID NO 1529
- AF220492
- SEQ ID NO 185 NM_014770 SEQ ID NO 1530
- AF224266
- SEQ ID NO 186 NM_014773 SEQ ID NO 1531
- AF230904
- SEQ ID NO 187 NM_014776 SEQ ID NO 1532
- AF234532
- SEQ ID NO 188 NM_014782 SEQ ID NO 1533
- AF257175
- SEQ ID NO 189 NM_014785 SEQ ID NO 1534
- AF257659
- SEQ ID NO 190 NM_014791 SEQ ID NO 1535
- AF272357
- SEQ ID NO 191 NM_014808 SEQ ID NO 1536
- AF279865
- SEQ ID NO 192 NM_014811 SEQ ID NO 1537
- AI497657_RC
- SEQ ID NO 193 NM_014812 SEQ ID NO 1538
- AJ012755
- SEQ ID NO 194 NM_014838 SEQ ID NO 1540
- AJ223353
- SEQ ID NO 195 NM_014862 SEQ ID NO 1542
- AJ224741
- SEQ ID NO 196 NM_014865 SEQ ID NO 1543
- AJ224864
- SEQ ID NO 197 NM_014870 SEQ ID NO 1544
- AJ225092
- SEQ ID NO 198 NM_014875 SEQ ID NO 1545
- AJ225093
- SEQ ID NO 199 NM_014886 SEQ ID NO 1547
- AJ249377
- SEQ ID NO 200 NM_014889 SEQ ID NO 1548
- AJ270996
- SEQ ID NO 202 NM_014905 SEQ ID NO 1549
- AJ272057
- SEQ ID NO 203 NM_014935 SEQ ID NO 1550
- AJ275978
- SEQ ID NO 204 NM_014945 SEQ ID NO 1551
- AJ276429
- SEQ ID NO 205 NM_014965 SEQ ID NO 1552
- AK000004
- SEQ ID NO 206 NM_014967 SEQ ID NO 1553
- AK000005
- SEQ ID NO 207 NM_014968 SEQ ID NO 1554
- AK000106
- SEQ ID NO 208 NM_015032 SEQ ID NO 1555
- AK000142
- SEQ ID NO 209 NM_015239 SEQ ID NO 1556
- AK000168
- SEQ ID NO 210 NM_015383 SEQ ID NO 1557
- AK000345
- SEQ ID NO 212 NM_015392 SEQ ID NO 1558
- AK000543
- SEQ ID NO 213 NM_015416 SEQ ID NO 1559
- AK000552
- SEQ ID NO 214 NM_015417 SEQ ID NO 1560
15
- AK000643
- SEQ ID NO 216 NM_015420 SEQ ID NO 1561
- AK000660
- SEQ ID NO 217 NM_015434 SEQ ID NO 1562
- AK000689
- SEQ ID NO 218 NM_015474 SEQ ID NO 1563
- AK000770
- SEQ ID NO 220 NM_015507 SEQ ID NO 1565
- AK000933
- SEQ ID NO 221 NM_015513 SEQ ID NO 1566
- AK001100
- SEQ ID NO 223 NM_015515 SEQ ID NO 1567
- AK001164
- SEQ ID NO 224 NM_015523 SEQ ID NO 1568
- AK001166
- SEQ ID NO 225 NM_015524 SEQ ID NO 1569
- AK001295
- SEQ ID NO 226 NM_015599 SEQ ID NO 1571
- AK001380
- SEQ ID NO 227 NM_015623 SEQ ID NO 1572
- AK001423
- SEQ ID NO 228 NM_015640 SEQ ID NO 1573
- AK001438
- SEQ ID NO 229 NM_015641 SEQ ID NO 1574
- AK001492
- SEQ ID NO 230 NM_015678 SEQ ID NO 1575
- AK001499
- SEQ ID NO 231 NM_015721 SEQ ID NO 1576
- AK001630
- SEQ ID NO 232 NM_015892 SEQ ID NO 1578
- AK001872
- SEQ ID NO 234 NM_015895 SEQ ID NO 1579
- AK001890
- SEQ ID NO 235 NM_015907 SEQ ID NO 1580
- AK002016
- SEQ ID NO 236 NM_015925 SEQ ID NO 1581
- AK002088
- SEQ ID NO 237 NM_015937 SEQ ID NO 1582
- AK002206
- SEQ ID NO 240 NM_015954 SEQ ID NO 1583
- AL035297
- SEQ ID NO 241 NM_015955 SEQ ID NO 1584
- AL049265
- SEQ ID NO 242 NM_015961 SEQ ID NO 1585
- AL049365
- SEQ ID NO 244 NM_015984 SEQ ID NO 1587
- AL049370
- SEQ ID NO 245 NM_015986 SEQ ID NO 1588
- AL049381
- SEQ ID NO 246 NM_015987 SEQ ID NO 1589
- AL049397
- SEQ ID NO 247 NM_015991 SEQ ID NO 1590
- AL049415
- SEQ ID NO 248 NM_016002 SEQ ID NO 1592
- AL049667
- SEQ ID NO 249 NM_016028 SEQ ID NO 1594
- AL049801
- SEQ ID NO 250 NM_016029 SEQ ID NO 1595
- AL049932
- SEQ ID NO 251 NM_016047 SEQ ID NO 1596
- AL049935
- SEQ ID NO 252 NM_016048 SEQ ID NO 1597
- AL049943
- SEQ ID NO 253 NM_016050 SEQ ID NO 1598
- AL049949
- SEQ ID NO 254 NM_016056 SEQ ID NO 1599
- AL049963
- SEQ ID NO 255 NM_016058 SEQ ID NO 1600
- AL049987
- SEQ ID NO 256 NM_016066 SEQ ID NO 1601
- AL050021
- SEQ ID NO 257 NM_016072 SEQ ID NO 1602
- AL050024
- SEQ ID NO 258 NM_016073 SEQ ID NO 1603
- AL050090
- SEQ ID NO 259 NM_016108 SEQ ID NO 1605
- AL050148
- SEQ ID NO 260 NM_016109 SEQ ID NO 1606
- AL050151
- SEQ ID NO 261 NM_016121 SEQ ID NO 1607
- AL050227
- SEQ ID NO 262 NM_016126 SEQ ID NO 1608
- AL050367
- SEQ ID NO 263 NM_016127 SEQ ID NO 1609
- AL050370
- SEQ ID NO 264 NM_016135 SEQ ID NO 1610
- AL050371
- SEQ ID NO 265 NM_016142 SEQ ID NO 1612
- AL050372
- SEQ ID NO 266 NM_016153 SEQ ID NO 1613
- AL050388
- SEQ ID NO 267 NM_016171 SEQ ID NO 1614
- AL079276
- SEQ ID NO 268 NM_016175 SEQ ID NO 1615
16
- AL079298
- SEQ ID NO 269 NM_016184 SEQ ID NO 1616
- AL080079
- SEQ ID NO 271 NM_016185 SEQ ID NO 1617
- AL080192
- SEQ ID NO 273 NM_016187 SEQ ID NO 1618
- AL080199
- SEQ ID NO 274 NM_016199 SEQ ID NO 1619
- AL080209
- SEQ ID NO 275 NM_016210 SEQ ID NO 1620
- AL080234
- SEQ ID NO 277 NM_016217 SEQ ID NO 1621
- AL080235
- SEQ ID NO 278 NM_016228 SEQ ID NO 1623
- AL096737
- SEQ ID NO 279 NM_016229 SEQ ID NO 1624
- AL110126
- SEQ ID NO 280 NM_016235 SEQ ID NO 1625
- AL110139
- SEQ ID NO 281 NM_016240 SEQ ID NO 1626
- AL110202
- SEQ ID NO 283 NM_016243 SEQ ID NO 1627
- AL110212
- SEQ ID NO 284 NM_016250 SEQ ID NO 1628
- AL110260
- SEQ ID NO 285 NM_016267 SEQ ID NO 1629
- AL117441
- SEQ ID NO 286 NM_016271 SEQ ID NO 1630
- AL117452
- SEQ ID NO 287 NM_016299 SEQ ID NO 1631
- AL117477
- SEQ ID NO 288 NM_016306 SEQ ID NO 1632
- AL117502
- SEQ ID NO 289 NM_016308 SEQ ID NO 1634
- AL117523
- SEQ ID NO 290 NM_016321 SEQ ID NO 1635
- AL117595
- SEQ ID NO 291 NM_016337 SEQ ID NO 1636
- AL117599
- SEQ ID NO 292 NM_016352 SEQ ID NO 1637
- AL117600
- SEQ ID NO 293 NM_016359 SEQ ID NO 1638
- AL117609
- SEQ ID NO 294 NM_016401 SEQ ID NO 1641
- AL117617
- SEQ ID NO 295 NM_016403 SEQ ID NO 1642
- AL117666
- SEQ ID NO 296 NM_016411 SEQ ID NO 1643
- AL122055
- SEQ ID NO 297 NM_016423 SEQ ID NO 1644
- AL133033
- SEQ ID NO 298 NM_016463 SEQ ID NO 1647
- AL133035
- SEQ ID NO 299 NM_016475 SEQ ID NO 1649
- AL133074
- SEQ ID NO 301 NM_016477 SEQ ID NO 1650
- AL133096
- SEQ ID NO 302 NM_016491 SEQ ID NO 1651
- AL133105
- SEQ ID NO 303 NM_016495 SEQ ID NO 1652
- AL133108
- SEQ ID NO 304 NM_016542 SEQ ID NO 1653
- AL133572
- SEQ ID NO 305 NM_016548 SEQ ID NO 1654
- AL133619
- SEQ ID NO 307 NM_016569 SEQ ID NO 1655
- AL133622
- SEQ ID NO 308 NM_016577 SEQ ID NO 1656
- AL133623
- SEQ ID NO 309 NM_016582 SEQ ID NO 1657
- AL133624
- SEQ ID NO 310 NM_016593 SEQ ID NO 1658
- AL133632
- SEQ ID NO 311 NM_016603 SEQ ID NO 1659
- AL133644
- SEQ ID NO 312 NM_016612 SEQ ID NO 1660
- AL133645
- SEQ ID NO 313 NM_016619 SEQ ID NO 1661
- AL133651
- SEQ ID NO 314 NM_016623 SEQ ID NO 1663
- AL137310
- SEQ ID NO 316 NM_016625 SEQ ID NO 1664
- AL137316
- SEQ ID NO 317 NM_016629 SEQ ID NO 1665
- AL137332
- SEQ ID NO 318 NM_016640 SEQ ID NO 1666
- AL137342
- SEQ ID NO 319 NM_016645 SEQ ID NO 1667
- AL137362
- SEQ ID NO 321 NM_016650 SEQ ID NO 1668
- AL137381
- SEQ ID NO 322 NM_016657 SEQ ID NO 1669
- AL137407
- SEQ ID NO 323 NM_016733 SEQ ID NO 1670
17
- AL137448
- SEQ ID NO 324 NM_016815 SEQ ID NO 1671
- AL137502
- SEQ ID NO 326 NM_016817 SEQ ID NO 1672
- AL137514
- SEQ ID NO 327 NM_016818 SEQ ID NO 1673
- AL137540
- SEQ ID NO 328 NM_016839 SEQ ID NO 1675
- AL137566
- SEQ ID NO 330 NM_017414 SEQ ID NO 1676
- AL137615
- SEQ ID NO 331 NM_017422 SEQ ID NO 1677
- AL137673
- SEQ ID NO 335 NM_017423 SEQ ID NO 1678
- AL137718
- SEQ ID NO 336 NM_017447 SEQ ID NO 1679
- AL137736
- SEQ ID NO 337 NM_017518 SEQ ID NO 1680
- AL137751
- SEQ ID NO 338 NM_017522 SEQ ID NO 1681
- AL137761
- SEQ ID NO 339 NM_017540 SEQ ID NO 1682
- AL157431
- SEQ ID NO 340 NM_017555 SEQ ID NO 1683
- AL157432
- SEQ ID NO 341 NM_017572 SEQ ID NO 1684
- AL157454
- SEQ ID NO 342 NM_017585 SEQ ID NO 1685
- AL157476
- SEQ ID NO 343 NM_017586 SEQ ID NO 1686
- AL157480
- SEQ ID NO 344 NM_017596 SEQ ID NO 1687
- AL157482
- SEQ ID NO 345 NM_017606 SEQ ID NO 1688
- AL157484
- SEQ ID NO 346 NM_017617 SEQ ID NO 1689
- AL157492
- SEQ ID NO 347 NM_017633 SEQ ID NO 1690
- AL157505
- SEQ ID NO 348 NM_017634 SEQ ID NO 1691
- AL157851
- SEQ ID NO 349 NM_017646 SEQ ID NO 1692
- AL160131
- SEQ ID NO 350 NM_017660 SEQ ID NO 1693
- AL161960
- SEQ ID NO 351 NM_017680 SEQ ID NO 1694
- AL162049
- SEQ ID NO 352 NM_017691 SEQ ID NO 1695
- AL355708
- SEQ ID NO 353 NM_017698 SEQ ID NO 1696
- D13643
- SEQ ID NO 355 NM_017702 SEQ ID NO 1697
- D14678
- SEQ ID NO 356 NM_017731 SEQ ID NO 1699
- D25328
- SEQ ID NO 357 NM_017732 SEQ ID NO 1700
- D26070
- SEQ ID NO 358 NM_017733 SEQ ID NO 1701
- D26488
- SEQ ID NO 359 NM_017734 SEQ ID NO 1702
- D31887
- SEQ ID NO 360 NM_017746 SEQ ID NO 1703
- D38521
- SEQ ID NO 361 NM_017750 SEQ ID NO 1704
- D38553
- SEQ ID NO 362 NM_017761 SEQ ID NO 1705
- D42043
- SEQ ID NO 363 NM_017763 SEQ ID NO 1706
- D42047
- SEQ ID NO 364 NM_017770 SEQ ID NO 1707
- D43950
- SEQ ID NO 365 NM_017779 SEQ ID NO 1708
- D50402
- SEQ ID NO 366 NM_017780 SEQ ID NO 1709
- D50914
- SEQ ID NO 367 NM_017782 SEQ ID NO 1710
- D55716
- SEQ ID NO 368 NM_017786 SEQ ID NO 1711
- D80001
- SEQ ID NO 369 NM_017791 SEQ ID NO 1712
- D80010
- SEQ ID NO 370 NM_017805 SEQ ID NO 1713
- D82345
- SEQ ID NO 371 NM_017816 SEQ ID NO 1714
- D83781
- SEQ ID NO 372 NM_017821 SEQ ID NO 1715
- D86964
- SEQ ID NO 373 NM_017835 SEQ ID NO 1716
- D86978
- SEQ ID NO 374 NM_017843 SEQ ID NO 1717
- D86985
- SEQ ID NO 375 NM_017857 SEQ ID NO 1718
- D87076
- SEQ ID NO 376 NM_017901 SEQ ID NO 1719
18
- D87453
- SEQ ID NO 377 NM_017906 SEQ ID NO 1720
- D87469
- SEQ ID NO 378 NM_017918 SEQ ID NO 1721
- D87682
- SEQ ID NO 379 NM_017961 SEQ ID NO 1722
- G26403
- SEQ ID NO 380 NM_017996 SEQ ID NO 1723
- J02639
- SEQ ID NO 381 NM_018000 SEQ ID NO 1724
- J04162
- SEQ ID NO 382 NM_018004 SEQ ID NO 1725
- K02403
- SEQ ID NO 384 NM_018011 SEQ ID NO 1726
- L05096
- SEQ ID NO 385 NM_018014 SEQ ID NO 1727
- L10333
- SEQ ID NO 386 NM_018022 SEQ ID NO 1728
- L11645
- SEQ ID NO 387 NM_018031 SEQ ID NO 1729
- L21934
- SEQ ID NO 388 NM_018043 SEQ ID NO 1730
- L22005
- SEQ ID NO 389 NM_018048 SEQ ID NO 1731
- L48692
- SEQ ID NO 391 NM_018062 SEQ ID NO 1732
- M12758
- SEQ ID NO 392 NM_018069 SEQ ID NO 1733
- M15178
- SEQ ID NO 393 NM_018072 SEQ ID NO 1734
- M21551
- SEQ ID NO 394 NM_018077 SEQ ID NO 1735
- M24895
- SEQ ID NO 395 NM_018086 SEQ ID NO 1736
- M26383
- SEQ ID NO 396 NM_018087 SEQ ID NO 1737
- M27749
- SEQ ID NO 397 NM_018093 SEQ ID NO 1738
- M28170
- SEQ ID NO 398 NM_018098 SEQ ID NO 1739
- M29873
- SEQ ID NO 399 NM_018099 SEQ ID NO 1740
- M29874
- SEQ ID NO 400 NM_018101 SEQ ID NO 1741
- M30448
- SEQ ID NO 401 NM_018103 SEQ ID NO 1742
- M30818
- SEQ ID NO 402 NM_018109 SEQ ID NO 1744
- M31932
- SEQ ID NO 403 NM_018123 SEQ ID NO 1746
- M37033
- SEQ ID NO 404 NM_018131 SEQ ID NO 1747
- M55914
- SEQ ID NO 405 NM_018136 SEQ ID NO 1748
- M63438
- SEQ ID NO 406 NM_018138 SEQ ID NO 1749
- M65254
- SEQ ID NO 407 NM_018166 SEQ ID NO 1750
- M68874
- SEQ ID NO 408 NM_018171 SEQ ID NO 1751
- M73547
- SEQ ID NO 409 NM_018178 SEQ ID NO 1752
- M77142
- SEQ ID NO 410 NM_018181 SEQ ID NO 1753
- M80899
- SEQ ID NO 411 NM_018186 SEQ ID NO 1754
- M90657
- SEQ ID NO 413 NM_018194 SEQ ID NO 1757
- M93718
- SEQ ID NO 414 NM_018204 SEQ ID NO 1758
- M96577
- SEQ ID NO 415 NM_018208 SEQ ID NO 1759
- NM_000022
- SEQ ID NO 417 NM_018212 SEQ ID NO 1760
- NM_000044
- SEQ ID NO 418 NM_018234 SEQ ID NO 1763
- NM_000050
- SEQ ID NO 419 NM_018255 SEQ ID NO 1764
- NM_000057
- SEQ ID NO 420 NM_018257 SEQ ID NO 1765
- NM_000060
- SEQ ID NO 421 NM_018265 SEQ ID NO 1766
- NM_000064
- SEQ ID NO 422 NM_018271 SEQ ID NO 1767
- NM_000073
- SEQ ID NO 424 NM_018290 SEQ ID NO 1768
- NM_000077
- SEQ ID NO 425 NM_018295 SEQ ID NO 1769
- NM_000086
- SEQ ID NO 426 NM_018304 SEQ ID NO 1770
- NM_000087
- SEQ ID NO 427 NM_018306 SEQ ID NO 1771
- NM_000095
- SEQ ID NO 429 NM_018326 SEQ ID NO 1772
19
- NM_000096
- SEQ ID NO 430 NM_018346 SEQ ID NO 1773
- NM_000100
- SEQ ID NO 431 NM_018366 SEQ ID NO 1775
- NM_000101
- SEQ ID NO 432 NM_018370 SEQ ID NO 1776
- NM_000104
- SEQ ID NO 433 NM_018373 SEQ ID NO 1777
- NM_000109
- SEQ ID NO 434 NM_018379 SEQ ID NO 1778
- NM_000125
- SEQ ID NO 435 NM_018384 SEQ ID NO 1779
- NM_000127
- SEQ ID NO 436 NM_018389 SEQ ID NO 1780
- NM_000135
- SEQ ID NO 437 NM_018410 SEQ ID NO 1783
- NM_000137
- SEQ ID NO 438 NM_018439 SEQ ID NO 1785
- NM_000146
- SEQ ID NO 439 NM_018454 SEQ ID NO 1786
- NM_000149
- SEQ ID NO 440 NM_018455 SEQ ID NO 1787
- NM_000154
- SEQ ID NO 441 NM_018465 SEQ ID NO 9788
- NM_000161
- SEQ ID NO 443 NM_018471 SEQ ID NO 1789
- NM_000165
- SEQ ID NO 444 NM_018478 SEQ ID NO 1790
- NM_000168
- SEQ ID NO 445 NM_018479 SEQ ID NO 1791
- NM_000169
- SEQ ID NO 446 NM_018529 SEQ ID NO 1793
- NM_000175
- SEQ ID NO 447 NM_018556 SEQ ID NO 1794
- NM_000191
- SEQ ID NO 448 NM_018569 SEQ ID NO 1795
- NM_000201
- SEQ ID NO 450 NM_018584 SEQ ID NO 1796
- NM_000211
- SEQ ID NO 451 NM_018653 SEQ ID NO 1797
- NM_000213
- SEQ ID NO 452 NM_018660 SEQ ID NO 1798
- NM_000224
- SEQ ID NO 453 NM_018683 SEQ ID NO 1799
- NM_000239
- SEQ ID NO 454 NM_018685 SEQ ID NO 1800
- NM_000251
- SEQ ID NO 455 NM_018686 SEQ ID NO 1801
- NM_000268
- SEQ ID NO 456 NM_018695 SEQ ID NO 1802
- NM_000270
- SEQ ID NO 458 NM_018728 SEQ ID NO 1803
- NM_000271
- SEQ ID NO 459 NM_018840 SEQ ID NO 1804
- NM_000283
- SEQ ID NO 460 NM_018842 SEQ ID NO 1805
- NM_000284
- SEQ ID NO 461 NM_018950 SEQ ID NO 1806
- NM_000286
- SEQ ID NO 462 NM_018988 SEQ ID NO 1807
- NM_000291
- SEQ ID NO 463 NM_019000 SEQ ID NO 1808
- NM_000299
- SEQ ID NO 464 NM_019013 SEQ ID NO 1809
- NM_000300
- SEQ ID NO 465 NM_019025 SEQ ID NO 1810
- NM_000310
- SEQ ID NO 466 NM_019027 SEQ ID NO 1811
- NM_000311
- SEQ ID NO 467 NM_019041 SEQ ID NO 1812
- NM_000317
- SEQ ID NO 468 NM_019044 SEQ ID NO 1813
- NM_000320
- SEQ ID NO 469 NM_019063 SEQ ID NO 1815
- NM_000342
- SEQ ID NO 470 NM_019084 SEQ ID NO 1816
- NM_000346
- SEQ ID NO 471 NM_019554 SEQ ID NO 1817
- NM_000352
- SEQ ID NO 472 NM_019845 SEQ ID NO 1818
- NM_000355
- SEQ ID NO 473 NM_019858 SEQ ID NO 1819
- NM_000358
- SEQ ID NO 474 NM_020130 SEQ ID NO 1820
- NM_000359
- SEQ ID NO 475 NM_020133 SEQ ID NO 1821
- NM_000362
- SEQ ID NO 476 NM_020143 SEQ ID NO 1822
- NM_000365
- SEQ ID NO 477 NM_020150 SEQ ID NO 1823
- NM_000381
- SEQ ID NO 478 NM_020163 SEQ ID NO 1824
- NM_000397
- SEQ ID NO 480 NM_020166 SEQ ID NO 1825
20
- NM_000399
- SEQ ID NO 481 NM_020169 SEQ ID NO 1826
- NM_000414
- SEQ ID NO 482 NM_020179 SEQ ID NO 1827
- NM_000416
- SEQ ID NO 483 NM_020184 SEQ ID NO 1828
- NM_000422
- SEQ ID NO 484 NM_020186 SEQ ID NO 1829
- NM_000424
- SEQ ID NO 485 NM_020188 SEQ ID NO 1830
- NM_000433
- SEQ ID NO 486 NM_020189 SEQ ID NO 1831
- NM_000436
- SEQ ID NO 487 NM_020197 SEQ ID NO 1832
- NM_000450
- SEQ ID NO 488 NM_020199 SEQ ID NO 1833
- NM_000462
- SEQ ID NO 489 NM_020215 SEQ ID NO 1834
- NM_000495
- SEQ ID NO 490 NM_020347 SEQ ID NO 1836
- NM_000507
- SEQ ID NO 491 NM_020365 SEQ ID NO 1837
- NM_000526
- SEQ ID NO 492 NM_020386 SEQ ID NO 1838
- NM_000557
- SEQ ID NO 493 NM_020445 SEQ ID NO 1839
- NM_000560
- SEQ ID NO 494 NM_020639 SEQ ID NO 1840
- NM_000576
- SEQ ID NO 495 NM_020659 SEQ ID NO 1841
- NM_000579
- SEQ ID NO 496 NM_020675 SEQ ID NO 1842
- NM_000584
- SEQ ID NO 497 NM_020686 SEQ ID NO 1843
- NM_000591
- SEQ ID NO 498 NM_020974 SEQ ID NO 1844
- NM_000592
- SEQ ID NO 499 NM_020978 SEQ ID NO 1845
- NM_000593
- SEQ ID NO 500 NM_020979 SEQ ID NO 1846
- NM_000594
- SEQ ID NO 501 NM_020980 SEQ ID NO 1847
- NM_000597
- SEQ ID NO 502 NM_021000 SEQ ID NO 1849
- NM_000600
- SEQ ID NO 504 NM_021004 SEQ ID NO 1850
- NM_000607
- SEQ ID NO 505 NM_021025 SEQ ID NO 1851
- NM_000612
- SEQ ID NO 506 NM_021063 SEQ ID NO 1852
- NM_000627
- SEQ ID NO 507 NM_021065 SEQ ID NO 1853
- NM_000633
- SEQ ID NO 508 NM_021077 SEQ ID NO 1854
- NM_000636
- SEQ ID NO 509 NM_021095 SEQ ID NO 1855
- NM_000639
- SEQ ID NO 510 NM_021101 SEQ ID NO 1856
- NM_000647
- SEQ ID NO 511 NM_021103 SEQ ID NO 1857
- NM_000655
- SEQ ID NO 512 NM_021128 SEQ ID NO 1858
- NM_000662
- SEQ ID NO 513 NM_021147 SEQ ID NO 1859
- NM_000663
- SEQ ID NO 514 NM_021151 SEQ ID NO 1860
- NM_000666
- SEQ ID NO 515 NM_021181 SEQ ID NO 1861
- NM_000676
- SEQ ID NO 516 NM_021190 SEQ ID NO 1862
- NM_000685
- SEQ ID NO 517 NM_021198 SEQ ID NO 1863
- NM_000693
- SEQ ID NO 518 NM_021200 SEQ ID NO 1864
- NM_000699
- SEQ ID NO 519 NM_021203 SEQ ID NO 1865
- NM_000700
- SEQ ID NO 520 NM_021238 SEQ ID NO 1866
- NM_000712
- SEQ ID NO 521 NM_021242 SEQ ID NO 1867
- NM_000727
- SEQ ID NO 522 S40706 SEQ ID NO 1869
- NM_000732
- SEQ ID NO 523 S53354 SEQ ID NO 1870
- NM_000734
- SEQ ID NO 524 S59184 SEQ ID NO 1871
- NM_000767
- SEQ ID NO 525 S62138 SEQ ID NO 1872
- NM_000784
- SEQ ID NO 526 U09848 SEQ ID NO 1873
- NM_000802
- SEQ ID NO 528 U10991 SEQ ID NO 1874
- NM_000824
- SEQ ID NO 529 U17077 SEQ ID NO 1875
21
- NM_000849
- SEQ ID NO 530 U18919 SEQ ID NO 1876
- NM 000852
- SEQ ID NO 531 U41387 SEQ ID NO 1877
- NM_000874
- SEQ ID NO 532 U45975 SEQ ID NO 1878
- NM_000878
- SEQ ID NO 533 U49835 SEQ ID NO 1879
- NM_000884
- SEQ ID NO 534 U56725 SEQ ID NO 1880
- NM_000908
- SEQ ID NO 537 U58033 SEQ ID NO 1881
- NM_000909
- SEQ ID NO 538 U61167 SEQ ID NO 1882
- NM_000926
- SEQ ID NO 539 U66042 SEQ ID NO 1883
- NM_000930
- SEQ lD NO 540 U68385 SEQ ID NO 1885
- NM_000931
- SEQ ID NO 541 U68494 SEQ ID NO 1886
- NM_000947
- SEQ ID NO 542 U74612 SEQ ID NO 1887
- NM_000949
- SEQ ID NO 543 U75968 SEQ ID NO 1888
- NM_000950
- SEQ ID NO 544 U79293 SEQ ID NO 1889
- NM_000954
- SEQ ID NO 545 U80736 SEQ ID NO 1890
- NM_000964
- SEQ ID NO 546 U82987 SEQ ID NO 1891
- 3 NM_001003
- SEQ ID NO 549 U83115 SEQ ID NO 1892
- NM_001016
- SEQ ID NO 551 U89715 SEQ ID NO 1893
- NM_001047
- SEQ ID NO 553 U90916 SEQ ID NO 1894
- NM_001066
- SEQ ID NO 555 U92544 SEQ ID NO 1895
- NM_001071
- SEQ ID NO 556 U96131 SEQ ID NO 1896
- NM_001078
- SEQ ID NO 557 U96394 SEQ ID NO 1897
- NM_001085
- SEQ ID NO 558 W61000_RC SEQ ID NO 1898
- NM_001089
- SEQ ID NO 559 X00437 SEQ ID NO 1899
- NM_001109
- SEQ ID NO 560 X00497 SEQ ID NO 1900
- NM_001122
- SEQ ID NO 561 X01394 SEQ ID NO 1901
- NM_001124
- SEQ ID NO 562 X03084 SEQ ID NO 1902
- NM_001161
- SEQ ID NO 563 X07834 SEQ ID NO 1905
- NM_001165
- SEQ ID NO 564 X14356 SEQ ID NO 1906
- NM_001166
- SEQ ID NO 565 X16302 SEQ ID NO 1907
- NM_001168
- SEQ ID NO 566 X52486 SEQ ID NO 1909
- NM_001179
- SEQ ID NO 567 X52882 SEQ ID NO 1910
- NM_001185
- SEQ ID NO 569 X56807 SEQ ID NO 1911
- NM_001203
- SEQ ID NO 570 X57809 SEQ ID NO 1912
- NM_001207
- SEQ ID NO 573 X57819 SEQ ID NO 1913
- NM_001216
- SEQ ID NO 574 X58529 SEQ ID NO 1914
- NM_001218
- SEQ ID NO 575 X59405 SEQ ID NO 1915
- NM_001223
- SEQ ID NO 576 X72475 SEQ ID NO 1918
- NM_001225
- SEQ ID NO 577 X73617 SEQ ID NO 1919
- NM_001233
- SEQ ID NO 578 X74794 SEQ ID NO 1920
- NM_001236
- SEQ ID NO 579 X75315 SEQ ID NO 1921
- NM_001237
- SEQ ID NO 580 X79782 SEQ ID NO 1922
- NM_001251
- SEQ ID NO 581 X82693 SEQ ID NO 1923
- NM_001255
- SEQ ID NO 582 X83301 SEQ ID NO 1924
- NM_001262
- SEQ ID NO 583 X93006 SEQ ID NO 1926
- NM_001263
- SEQ ID NO 584 X94232 SEQ ID NO 1927
- NM_001267
- SEQ ID NO 585 X98834 SEQ ID NO 1929
- NM_001276
- SEQ ID NO 587 X99142 SEQ ID NO 1930
22
- NM_001280
- SEQ ID NO 588 Y14737 SEQ ID NO 1932
- NM_001282
- SEQ ID NO 589 Z11887 SEQ ID NO 1933
- NM_001295
- SEQ ID NO 590 Z48633 SEQ ID NO 1935
- NM_001305
- SEQ ID NO 591 NM_004222 SEQ ID NO 1936
- NM_001310
- SEQ ID NO 592 NM_016405 SEQ ID NO 1937
- NM_001312
- SEQ ID NO 593 NM_017690 SEQ ID NO 1938
- NM_001321
- SEQ ID NO 594 Contig29 RC SEQ ID NO 1939
- NM_001327
- SEQ ID NO 595 Contig237_RC SEQ ID NO 1940
- NM_001329
- SEQ ID NO 596 Contig263_RC SEQ ID NO 1941
- NM_001333
- SEQ ID NO 597 Contig292_RC SEQ ID NO 1942
- NM_001338
- SEQ ID NO 598 Contig382_RC SEQ ID NO 1944
- NM_001360
- SEQ ID NO 599 Contig399_RC SEQ ID NO 1945
- NM_001363
- SEQ ID NO 600 Contig448_RC SEQ ID NO 1946
- NM_001381
- SEQ ID NO 601 Contig569_RC SEQ ID NO 1947
- NM_001394
- SEQ ID NO 602 Contig580_RC SEQ ID NO 1948
- NM_001395
- SEQ ID NO 603 Contig678_RC SEQ ID NO 1949
- NM_001419
- SEQ ID NO 604 Contig706_RC SEQ ID NO 1950
- NM_001424
- SEQ ID NO 605 Contig718_RC SEQ ID NO 1951
- NM_001428
- SEQ ID NO 606 Contig719_RC SEQ ID NO 1952
- NM_001436
- SEQ ID NO 607 Contig742_RC SEQ ID NO 1953
- NM_001444
- SEQ ID NO 608 Contig753_RC SEQ ID NO 1954
- NM_001446
- SEQ ID NO 609 Contig758_RC SEQ ID NO 1956
- NM_001453
- SEQ ID NO 611 Contig760_RC SEQ ID NO 1957
- NM_001456
- SEQ ID NO 612 Contig842_RC SEQ ID NO 1958
- NM_001457
- SEQ ID NO 613 Contig848_RC SEQ ID NO 1959
- NM_001463
- SEQ ID NO 614 Contig924_RC SEQ ID NO 1960
- NM_001465
- SEQ ID NO 615 Contig974_RC SEQ ID NO 1961
- NM_001481
- SEQ ID NO 616 Contig1018_RC SEQ ID NO 1962
- NM_001493
- SEQ ID NO 617 Contig1056_RC SEQ ID NO 1963
- NM_001494
- SEQ ID NO 618 Contig1061_RC SEQ ID NO 1964
- NM_001500
- SEQ ID NO 619 Contig1129_RC SEQ ID NO 1965
- NM_001504
- SEQ ID NO 620 Contig1148 SEQ ID NO 1966
- NM_001511
- SEQ ID NO 621 Contig1239_RC SEQ ID NO 1967
- NM_001513
- SEQ ID NO 622 Contig1277 SEQ ID NO 1968
- NM_001527
- SEQ ID NO 623 Contig1333_RC SEQ ID NO 1969
- NM_001529
- SEQ ID NO 624 Contig1386_RC SEQ ID NO 1970
- NM_001530
- SEQ ID NO 625 Contig1389_RC SEQ ID NO 1971
- NM_001540
- SEQ ID NO 626 Contig1418_RC SEQ ID NO 1972
- NM_001550
- SEQ ID NO 627 Contig1462_RC SEQ ID NO 1973
- NM_001551
- SEQ ID NO 628 Contig1505_RC SEQ ID NO 1974
- NM_001552
- SEQ ID NO 629 Contig1540_RC SEQ ID NO 1975
- NM_001554
- SEQ ID NO 631 Contig1584_RC SEQ ID NO 1976
- NM_001558
- SEQ ID NO 632 Contig1632_RC SEQ ID NO 1977
- NM_001560
- SEQ ID NO 633 Contig1682_RC SEQ ID NO 1978
- NM_001565
- SEQ ID NO 634 Contig1778_RC SEQ ID NO 1979
- NM_001569
- SEQ ID, NO 635 Contig1829 SEQ ID NO 1981
- NM_001605
- SEQ ID NO 636 Contig1838_RC SEQ ID NO 1982
23
- NM_001609
- SEQ ID NO 637 Contig1938_RC SEQ ID NO 1983
- NM_001615
- SEQ ID NO 638 Contig1970_RC SEQ ID NO 1984
- NM_001623
- SEQ ID NO 639 Contig1998_RC SEQ ID NO 1985
- NM_001627
- SEQ ID NO 640 Contig2099_RC SEQ ID NO 1986
- NM_001628
- SEQ ID NO 641 Contig2143_RC SEQ ID NO 1987
- NM_001630
- SEQ ID NO 642 Contig2237_RC SEQ ID NO 1988
- NM_001634
- SEQ ID NO 643 Contig2429_RC SEQ ID NO 1990
- NM_001656
- SEQ ID NO 644 Contig2504_RC SEQ ID NO 1991
- NM_001673
- SEQ ID NO 645 Contig2512_RC SEQ ID NO 1992
- NM_001675
- SEQ ID NO 647 Contig2575_RC SEQ ID NO 1993
- NM_001679
- SEQ ID NO 648 Contig2578_RC SEQ ID NO 1994
- NM_001689
- SEQ ID NO 649 Contig2639_RC SEQ ID NO 1995
- NM_001703
- SEQ ID NO 650 Contig2647_RC SEQ ID NO 1996
- NM_001710
- SEQ ID NO 651 Contig2657_RC SEQ ID NO 1997
- NM_001725
- SEQ ID NO 652 Contig2728_RC SEQ ID NO 1998
- NM_001730
- SEQ ID NO 653 Contig2745_RC SEQ ID NO 1999
- NM_001733
- SEQ ID NO 654 Contig2811_RC SEQ ID NO 2000
- NM_001734
- SEQ ID NO 655 Contig2873_RC SEQ ID NO 2001
- NM_001740
- SEQ ID NO 656 Contig2883_RC SEQ ID NO 2002
- NM_001745
- SEQ ID NO 657 Contig2915_RC SEQ ID NO 2003
- NM_001747
- SEQ 1D NO 658 Contig2928_RC SEQ ID NO 2004
- NM_001756
- SEQ ID NO 659 Contig3024_RC SEQ ID NO 2005
- NM_001757
- SEQ ID NO 660 Contig3094_RC SEQ ID NO 2006
- NM_001758
- SEQ ID NO 661 Contig3164_RC SEQ ID NO 2007
- NM_001762
- SEQ ID NO 662 Contig3495_RC SEQ ID NO 2009
- NM_001767
- SEQ ID NO 663 Contig3607_RC SEQ ID NO 2010
- NM_001770
- SEQ ID NO 664 Contig3659_RC SEQ ID NO 2011
- NM_001777
- SEQ ID NO 665 Contig3677_RC SEQ ID NO 2012
- NM_001778
- SEQ ID NO 666 Contig3682_RC SEQ ID NO 2013
- NM_001781
- SEQ ID NO 667 Contig3734_RC SEQ ID NO 2014
- NM_001786
- SEQ ID NO 668 Contig3834_ RC SEQ ID NO 2015
- NM_001793
- SEQ ID NO 669 Contig3876_RC SEQ ID NO 2016
- NM_001803
- SEQ ID NO 671 Contig3902_RC SEQ ID NO 2017
- NM_001806
- SEQ ID NO 672 Contig3940_RC SEQ ID NO 2018
- NM_001809
- SEQ ID NO 673 Contig4380_RC SEQ ID NO 2019
- NM_001814
- SEQ ID NO 674 Contig4388_RC SEQ ID NO 2020
- NM_001826
- SEQ ID NO 675 Contig4467_RC SEQ ID NO 2021
- NM_001830
- SEQ ID NO 677 Contig4949_RC SEQ ID NO 2023
- NM_001838
- SEQ ID NO 678 Contig5348_RC SEQ ID NO 2024
- NM_001839
- SEQ ID NO 679 Contig5403_RC SEQ ID NO 2025
- NM_001853
- SEQ ID NO 681 Contig5716_RC SEQ ID NO 2026
- NM_001859
- SEQ ID NO 682 Contig6118_RC SEQ ID NO 2027
- NM_001861
- SEQ ID NO 683 Contig6164_RC SEQ ID NO 2028
- NM_001874
- SEQ ID NO 685 Contig6181_RC SEQ ID NO 2029
- NM_001885
- SEQ ID NO 686 Contig6514_RC SEQ ID NO 2030
- NM_001892
- SEQ ID NO 688 Contig6612_RC SEQ ID NO 2031
- NM_001897
- SEQ ID NO 689 Contig6881_RC SEQ ID NO 2032
24
- NM_001899
- SEQ ID NO 690 Contig8165_RC SEQ ID NO 2033
- NM_001905
- SEQ ID NO 691 Contig8221_RC SEQ ID NO 2034
- NM_001912
- SEQ ID NO 692 Contig8347_RC SEQ ID NO 2035
- NM_001914
- SEQ ID NO 693 Contig8364_RC SEQ ID NO 2036
- NM_001919
- SEQ ID NO 694 Contig8888_RC SEQ ID NO 2038
- NM_001941
- SEQ ID NO 695 Contig9259_RC SEQ ID NO 2039
- NM_001943
- SEQ ID NO 696 Contig9541_RC SEQ ID NO 2040
- NM_001944
- SEQ ID NO 697 Contig10268_RC SEQ ID NO 2041
- NM_001953
- SEQ ID NO 699 Contig10363_RC SEQ ID NO 2042
- NM_001954
- SEQ ID NO 700 Contig10437_RC SEQ ID NO 2043
- NMB_001955
- SEQ ID NO 701 Contig11086_RC SEQ ID NO 2045
- NMB_001956
- SEQ ID NO 702 Contig11275_RC SEQ ID NO 2046
- NM_001958
- SEQ ID NO 703 Contig11648_RC SEQ ID NO 2047
- NMB_001961
- SEQ ID NO 705 Contig12216_RC SEQ ID NO 2048
- NMB_001970
- SEQ ID NO 706 Contig12369_RC SEQ ID NO 2049
- NMB_001979
- SEQ ID NO 707 Contig12814_RC SEQ ID NO 2050
- NM_001982
- SEQ ID NO 708 Contig12951_RC SEQ ID NO 2051
- NMB_002017
- SEQ ID NO 710 Contig13480_RC SEQ ID NO 2052
- NM_002033
- SEQ ID NO 713 Contig14284_RC SEQ ID NO 2053
- NM_002046
- SEQ ID NO 714 Contig14390_RC SEQ ID NO 2054
- NM_002047
- SEQ ID NO 715 Contig14780_RC SEQ ID NO 2055
- NM_002051
- SEQ ID NO 716 Contig14954_RC SEQ ID NO 2056
- NM_002053
- SEQ ID NO 717 Contig14981_RC SEQ ID NO 2057
- NM_002061
- SEQ ID NO 718 Contig15692_RC SEQ ID NO 2058
- NM_002065
- SEQ ID NO 719 Contig16192_RC SEQ ID NO 2059
- NM_002068
- SEQ ID NO 720 Contig16759_RC SEQ ID NO 2061
- NM_002077
- SEQ ID NO 722 Contig16786_RC SEQ ID NO 2062
- NM_002091
- SEQ ID NO 723 Contig16905_RC SEQ ID NO 2063
- NMB_002101
- SEQ ID NO 724 Contig17103_RC SEQ ID NO 2064
- NM_002106
- SEQ ID NO 725 Contig17105_RC SEQ ID NO 2065
- NMB_002110
- SEQ ID NO 726 Contig17248_RC SEQ ID NO 2066
- NM_002111
- SEQ ID NO 727 Contig17345_RC SEQ ID NO 2067
- NMB_002115
- SEQ ID NO 728 Contig18502_RC SEQ ID NO 2069
- NMB_002118
- SEQ ID NO 729 Contig20156_RC SEQ ID NO 2071
- NMB_002123
- SEQ ID NO 730 Contig20302_RC SEQ ID NO 2073
- NMB_002131
- SEQ ID NO 731 Contig20600_RC SEQ ID NO 2074
- NMB_002136
- SEQ ID NO 732 Contig20617_RC SEQ ID NO 2075
- NM_002145
- SEQ ID NO 733 Contig20629_RC SEQ ID NO 2076
- NMB_002164
- SEQ ID NO 734 Contig20651_RC SEQ ID NO 2077
- NMB_002168
- SEQ ID NO 735 Contig21130_RC SEQ ID NO 2078
- NM_002184
- SEQ ID NO 736 Contig21185_RC SEQ ID NO 2079
- NM_002185
- SEQ ID NO 737 Contig21421_RC SEQ ID NO 2080
- NM_002189
- SEQ ID NO 738 Contig21787_RC SEQ ID NO 2081
- NM_002200
- SEQ ID NO 739 Contig21812_RC SEQ ID NO 2082
- NM_002201
- SEQ ID NO 740 Contig22418_RC SEQ ID NO 2083
- NM_002213
- SEQ ID NO 741 Contig23085_RC SEQ ID NO 2084
- NMB_002219
- SEQ ID NO 742 Contig23454_RC SEQ ID NO 2085
25
- NM_002222
- SEQ ID NO 743 Contig24138_RC SEQ ID NO 2086
- NM_002239
- SEQ ID NO 744 Contig24252_RC SEQ ID NO 2087
- NM_002243
- SEQ ID NO 745 Contig24655_RC SEQ ID NO 2089
- NM_002245
- SEQ ID NO 746 Contig25055_RC SEQ ID NO 2090
- NM_002250
- SEQ ID NO 747 Contig25290_RC SEQ ID NO 2091
- NM_002254
- SEQ ID NO 748 Contig25343_RC SEQ ID NO 2092
- NM_002266
- SEQ ID NO 749 Contig25362_RC SEQ ID NO 2093
- NM_002273
- SEQ ID NO 750 Contig25617_RC SEQ ID NO 2094
- NM_002281
- SEQ ID NO 751 Contig25659_RC SEQ ID NO 2095
- NM_002292
- SEQ ID NO 752 Contig25722_RC SEQ ID NO 2096
- NM_002298
- SEQ ID NO 753 Contig25809_RC SEQ ID NO 2097
- NM_002300
- SEQ ID NO 754 Contig25991 SEQ ID NO 2098
- NM_002308
- SEQ ID NO 755 Contig26022_RC SEQ ID NO 2099
- NMB_002314
- SEQ ID NO 756 Contig26077_RC SEQ ID NO 2100
- NM_002337
- SEQ ID NO 757 Contig26310_RC SEQ ID NO 2101
- NM_002341
- SEQ ID NO 758 Contig26371_RC SEQ ID NO 2102
- NM_002342
- SEQ ID NO 759 Contig26438_RC SEQ ID NO 2103
- NM_002346
- SEQ ID NO 760 Contig26706_RC SEQ ID NO 2104
- NM_002349
- SEQ ID NO 761 Contig27088_RC SEQ ID NO 2105
- NM_002350
- SEQ ID NO 762 Contig27186_RC SEQ ID NO 2106
- NM_002356
- SEQ ID NO 763 Contig27228_RC SEQ ID NO 2107
- NM_002358
- SEQ ID NO 764 Contig27344_RC SEQ ID NO 2109
- NM_002370
- SEQ ID NO 765 Contig27386_RC SEQ ID NO 2110
- NM_002395
- SEQ ID NO 766 Contig27624_RC SEQ ID NO 2111
- NMB_002416
- SEQ ID NO 767 Contig27749_RC SEQ ID NO 2112
- NM_002421
- SEQ ID NO 768 Contig27882_RC SEQ ID NO 2113
- NM_002426
- SEQ ID NO 769 Contig27915_RC SEQ ID NO 2114
- NM_002435
- SEQ ID NO 770 Contig28030_RC SEQ ID NO 2115
- NM_002438
- SEQ ID NO 771 Contig28081_RC SEQ ID NO 2116
- NM_002444
- SEQ ID NO 772 Contig28152_RC SEQ ID NO 2117
- NM_002449
- SEQ ID NO 773 Contig28550_RC SEQ ID NO 2119
- NM_002450
- SEQ ID NO 774 Contig28552_RC SEQ ID NO 2120
- NM_002456
- SEQ ID NO 775 Contig28712_RC SEQ ID NO 2121
- NM_002466
- SEQ ID NO 776 Contig28888_RC SEQ ID NO 2122
- NM_002482
- SEQ ID NO 777 Contig28947_RC SEQ ID NO 2123
- NM_002497
- SEQ ID NO 778 Contig29126_RC SEQ ID NO 2124
- NM_002510
- SEQ ID NO 779 Contig29193_RC SEQ ID NO 2125
- NMB_002515
- SEQ ID NO 781 Contig29369_RC SEQ ID NO 2126
- NM_002524
- SEQ ID NO 782 Contig29639_RC SEQ ID NO 2127
- NM_002539
- SEQ ID NO 783 Contig30047_RC SEQ ID NO 2129
- NM_002555
- SEQ ID NO 785 Contig30154_RC SEQ ID NO 2131
- NM_002570
- SEQ ID NO 787 Contig30209_RC SEQ ID NO 2132
- NM_002579
- SEQ ID NO 788 Contig30213_RC SEQ ID NO 2133
- NM_002587
- SEQ ID NO 789 Contig30230_RC SEQ ID NO 2134
- NM_002590
- SEQ ID NO 790 Contig30267_RC SEQ ID NO 2135
- NM_002600
- SEQ ID NO 791 Contig30390_RC SEQ ID NO 2136
- NMB_002614
- SEQ ID NO 792 Contig30480_RC SEQ ID NO 2137
26
- NMB_002618
- SEQ ID NO 794 Contig30609_RC SEQ ID NO 2138
- NM_002626
- SEQ ID NO 795 Contig30934_RC SEQ ID NO 2139
- NM_002633
- SEQ ID NO 796 Contig31150_RC SEQ ID NO 2140
- NM_002639
- SEQ ID NO 797 Contig31186_RC SEQ ID NO 2141
- NM_002648
- SEQ ID NO 798 Contig31251_RC SEQ ID NO 2142
- NM_002659
- SEQ ID NO 799 Contig31288_RC SEQ ID NO 2143
- NM_002661
- SEQ ID NO 800 Contig31291_RC SEQ ID NO 2144
- NM_002662
- SEQ ID NO 801 Contig31295_RC SEQ ID NO 2145
- NM_002664
- SEQ ID NO 802 Contig31424_RC SEQ ID NO 2146
- NM_002689
- SEQ ID NO 804 Contig31449_RC SEQ ID NO 2147
- NM_002690
- SEQ ID NO 805 Contig31596_RC SEQ ID NO 2148
- NM_002709
- SEQ ID NO 806 Contig31864_RC SEQ ID NO 2149
- NM_002727
- SEQ ID NO 807 Contig31928_RC SEQ ID NO 2150
- NM_002729
- SEQ ID NO 808 Contig31966_RC SEQ ID NO 2151
- NM_002734
- SEQ ID NO 809 Contig31986_RC SEQ ID NO 2152
- NM_002736
- SEQ ID NO 810 Contig32084_RC SEQ ID NO 2153
- NM_002740
- SEQ ID NO 811 Contig32105_RC SEQ ID NO 2154
- NM_002748
- SEQ ID NO 813 Contig32185_RC SEQ ID NO 2156
- NM_002774
- SEQ ID NO 814 Contig32242_RC SEQ ID NO 2157
- NM_002775
- SEQ ID NO 815 Contig32322_RC SEQ ID NO 2158
- NM_002776
- SEQ ID NO 816 Contig32336_RC SEQ ID NO 2159
- NM_002789
- SEQ ID NO 817 Contig32558_RC SEQ ID NO 2160
- NM_002794
- SEQ ID NO 818 Contig32798_RC SEQ ID NO 2161
- NM_002796
- SEQ ID NO 819 Contig33005_RC SEQ ID NO 2162
- NM_002800
- SEQ ID NO 820 Contig33230_RC SEQ ID NO 2163
- NM_002801
- SEQ ID NO 821 Contig33260_RC SEQ ID NO 2164
- NM_002808
- SEQ ID NO 822 Contig33654_RC SEQ ID NO 2166
- NM_002821
- SEQ ID NO 824 Contig33741_RC SEQ ID NO 2167
- NM_002826
- SEQ ID NO 825 Contig33771_RC SEQ ID NO 2168
- NM_002827
- SEQ ID NO 826 Contig33814_RC SEQ ID NO 2169
- NM_002838
- SEQ ID NO 827 Contig33815_RC SEQ ID NO 2170
- NM_002852
- SEQ ID NO 828 Contig33833 SEQ ID NO 2171
- NM_002854
- SEQ ID NO 829 Contig33998_RC SEQ ID NO 2172
- NM_002856
- SEQ ID NO 830 Contig34079 SEQ ID NO 2173
- NM_002857
- SEQ ID NO 831 Contig34080_RC SEQ ID NO 2174
- NM_002858
- SEQ ID NO 832 Contig34222_RC SEQ ID NO 2175
- NM_002888
- SEQ ID NO 833 Contig34233_RC SEQ ID NO 2176
- NM_002890
- SEQ ID NO 834 Contig34303_RC SEQ ID NO 2177
- NM_002901
- SEQ ID NO 836 Contig34393_RC SEQ ID NO 2178
- NM_002906
- SEQ ID NO 837 Contig34477_RC SEQ ID NO 2179
- NMB_002916
- SEQ ID NO 838 Contig34766_RC SEQ ID NO 2181
- NM_002923
- SEQ ID NO 839 Contig34952 SEQ ID NO 2182
- NM_002933
- SEQ ID NO 840 Contig34989_RC SEQ ID NO 2183
- NM_002936
- SEQ ID NO 841 Contig35030_RC SEQ ID NO 2184
- NM_002937
- SEQ ID NO 842 Contig35251_RC SEQ ID NO 2185
- NM_002950
- SEQ ID NO 843 Contig35629_RC SEQ ID NO 2186 .
- NM_002961
- SEQ ID NO 844 Contig35635_RC SEQ ID NO 2187
27
- NM_002964
- SEQ ID NO 845 Contig35763_RC SEQ ID NO 2188
- NM_002965
- SEQ ID NO 846 Contig35814_RC SEQ ID NO 2189
- NM_002966
- SEQ ID NO 847 Contig35896_RC SEQ ID NO 2190
- NM_002982
- SEQ ID NO 849 Contig35976_RC SEQ ID NO 2191
- NM_002983
- SEQ ID NO 850 Contig36042_RC SEQ ID NO 2192
- NM_002984
- SEQ ID NO 851 Contig36081_RC SEQ ID NO 2193
- NM_002985
- SEQ ID NO 852 Contig36152_RC SEQ ID NO 2194
- NM_002988
- SEQ ID NO 853 Contig36193_RC SEQ ID NO 2195
- NM_002996
- SEQ ID NO 854 Contig36312_RC SEQ ID NO 2196
- NM_002997
- SEQ ID NO 855 Contig36323_RC SEQ ID NO 2197
- NM_002999
- SEQ ID NO 856 Contig36339_RC SEQ ID NO 2198
- NMB_003012
- SEQ ID NO 857 Contig36647_RC SEQ ID NO 2199
- NM_003022
- SEQ ID NO 858 Contig36744_RC SEQ ID NO 2200
- NM_003034
- SEQ ID NO 859 Contig36761_RC SEQ ID NO 2201
- NM_003035
- SEQ ID NO 860 Contig36879_RC SEQ ID NO 2202
- NM_003039
- SEQ ID NO 861 Contig36900_RC SEQ ID NO 2203
- NM_003051
- SEQ ID NO 862 Contig37015_RC SEQ ID NO 2204
- NM_003064
- SEQ ID NO 863 Contig37024_RC SEQ ID NO 2205
- NM_003066
- SEQ ID NO 864 Contig37072_RC SEQ ID NO 2207
- NM_003088
- SEQ ID NO 865 Contig37140_RC SEQ ID NO 2208
- NM_003090
- SEQ ID NO 866 Contig37141_RC SEQ ID NO 2209
- NM_003096
- SEQ ID NO 867 Contig37204_RC SEQ ID NO 2210
- NM_003099
- SEQ ID NO 868 Contig37281_RC SEQ ID NO 2211
- NMB_003102
- SEQ ID NO 869 Contig37287_RC SEQ ID NO 2212
- NMB_003104
- SEQ ID NO 870 Contig37439_RC SEQ ID NO 2213
- NMB_003108
- SEQ ID NO 871 Contig37562_RC SEQ ID NO 2214
- NMB_003121
- SEQ ID NO 873 Contig37571_RC SEQ ID NO 2215
- NMB_003134
- SEQ ID NO 874 Contig37598 SEQ ID NO 2216
- NM_003137
- SEQ ID NO 875 Contig37758_RC SEQ ID NO 2217
- NM_003144
- SEQ ID NO 876 Contig37778_RC SEQ ID NO 2218
- NM_003146
- SEQ ID NO 877 Contig37884_RC SEQ ID NO 2219
- NM_003149
- SEQ ID NO 878 Contig37946_RC SEQ ID NO 2220
- NM_003151
- SEQ ID NO 879 Contig38170_RC SEQ ID NO 2221
- NM_003157
- SEQ ID NO 880 Contig38288_RC SEQ ID NO 2223
- NM_003158
- SEQ ID NO 881 Contig38398_RC SEQ ID NO 2224
- NM_003165
- SEQ ID NO 882 Contig38580_RC SEQ ID NO 2226
- NM_003172
- SEQ ID NO 883 Contig38630_RC SEQ ID NO 2227
- NMB_003177
- SEQ ID NO 884 Contig38652_RC SEQ ID NO 2228
- NM_003197
- SEQ ID NO 885 Contig38683_RC SEQ ID NO 2229
- NM_003202
- SEQ ID NO 886 Contig38726_RC SEQ ID NO 2230
- NM_003213
- SEQ ID NO 887 Contig38791_RC SEQ ID NO 2231
- NMB_003217
- SEQ ID NO 888 Contig38901_RC SEQ ID NO 2232
- NM_003225
- SEQ ID NO 889 Contig38983_RC SEQ ID NO 2233
- NM_003226
- SEQ ID NO 890 Contig39090_RC SEQ ID NO 2234
- NM_003236
- SEQ ID NO 892 Contig39132_RC SEQ ID NO 2235
- NM_003239
- SEQ ID NO 893 Contig39157_RC SEQ ID NO 2236
- NM_003248
- SEQ ID NO 894 Contig39226_RC SEQ ID NO 2237
28
- NM_003255
- SEQ ID NO 895 Contig39285_RC SEQ ID NO 2238
- NM_003258
- SEQ ID NO 896 Contig39556_RC SEQ ID NO 2239
- NM_003264
- SEQ ID NO 897 Contig39591_RC SEQ ID NO 2240
- NM_003283
- SEQ ID NO 898 Contig39826_RC SEQ ID NO 2241
- NM_003318
- SEQ ID NO 899 Contig39845_RC SEQ ID NO 2242
- NM_003329
- SEQ ID NO 900 Contig39891_RC SEQ ID NO 2243
- NM_003332
- SEQ ID NO 901 Contig39922_RC SEQ ID NO 2244
- NM_003358
- SEQ ID NO 902 Contig39960_RC SEQ ID NO 2245
- NM_003359
- SEQ ID NO 903 Contig40026_RC SEQ ID NO 2246
- NM_003360
- SEQ ID NO 904 Contig40121_RC SEQ ID NO 2247
- NM_003368
- SEQ ID NO 905 Contig40128_RC SEQ ID NO 2248
- NM_003376
- SEQ ID NO 906 Contig40146 SEQ ID NO 2249
- NM_003380
- SEQ ID NO 907 Contig40208_RC SEQ ID NO 2250
- NM_003392
- SEQ ID NO 908 Contig40212_RC SEQ ID NO 2251
- NM_003412
- SEQ ID NO 909 Contig40238_RC SEQ ID NO 2252
- NM_003430
- SEQ ID NO 910 Contig40434_RC SEQ ID NO 2253
- NM_003462
- SEQ ID NO 911 Contig40446_RC SEQ ID NO 2254
- NM_003467
- SEQ ID NO 912 Contig40500_RC SEQ ID NO 2255
- NM_003472
- SEQ ID NO 913 Contig40573_RC SEQ ID NO 2256
- NM_003479
- SEQ ID NO 914 Contig40813_RC SEQ ID NO 2258
- NM_003489
- SEQ ID NO 915 Contig40816_RC SEQ ID NO 2259
- NM_003494
- SEQ ID NO 918 Contig40845_RC SEQ ID NO 2261
- NM_003498
- SEQ ID NO 917 Contig40889_RC SEQ ID NO 2262
- NM_003504
- SEQ ID NO 919 Contig41035 SEQ ID NO 2263
- NM_003508
- SEQ ID NO 920 Contig41234_RC SEQ ID NO 2264
- NMB_003510
- SEQ ID NO 921 Contig41413_RC SEQ ID NO 2266
- NMB_003512
- SEQ ID NO 922 Contig41521_RC SEQ ID NO 2267
- NM_003528
- SEQ ID NO 923 Contig41530 RC SEQ ID NO 2268
- NM_003544
- SEQ ID NO 924 Contig41590 SEQ ID NO 2269
- NM_003561
- SEQ ID NO 925 Contig41618_RC SEQ ID NO 2270
- NM_003563
- SEQ ID NO 926 Contig41624_RC SEQ ID NO 2271
- NM_003568
- SEQ ID NO 927 Contig41635_RC SEQ ID NO 2272
- NM_003579
- SEQ ID NO 928 Contig41676_RC SEQ ID NO 2273
- NM_003600
- SEQ ID NO 929 Contig41689_RC SEQ ID NO 2274
- NM_003615
- SEQ ID NO 931 Contig41804_RC SEQ ID NO 2275
- NM_003627
- SEQ ID NO 932 Contig41887_RC SEQ ID NO 2276
- NM_003645
- SEQ ID NO 935 Contig41905_RC SEQ ID NO 2277
- NM_003651
- SEQ ID NO 936 Contig41954_RC SEQ ID NO 2278
- NM_003657
- SEQ ID NO 937 Contig41983_RC SEQ ID NO 2279
- NM_003662
- SEQ ID NO 938 Contig42006_RC SEQ ID NO 2280
- NM_003670
- SEQ ID NO 939 Contig42014_RC SEQ ID NO 2281
- NM_003675
- SEQ ID NO 940 Contig42036_RC SEQ ID NO 2282
- NM_003676
- SEQ ID NO 941 Contig42041_RC SEQ ID NO 2283
- NM_003681
- SEQ ID NO 942 Contig42139 SEQ ID NO 2284
- NM_003683
- SEQ ID NO 943 Contig42161_RC SEQ ID NO 2285
- NM_003686
- SEQ ID NO 944 Contig42220_RC SEQ ID NO 2286
- NM_003689
- SEQ ID NO 945 Contig42306_RC SEQ ID NO 2287
29
- NM_003714
- SEQ ID NO 946 Contig42311_RC SEQ ID NO 2288
- NM_003720
- SEQ ID NO 947 Contig42313_RC SEQ ID NO 2289
- NM_003726
- SEQ ID NO 948 Contig42402_RC SEQ ID NO 2290
- NM_003729
- SEQ ID NO 949 Contig42421_RC SEQ lD NO 2291
- NM_003740
- SEQ ID NO 950 Contig42430_RC SEQ ID NO 2292
- NM_003772
- SEQ ID NO 952 Contig42431_RC SEQ ID NO 2293
- NM_003791
- SEQ ID NO 953 Contig42542_RC SEQ ID NO 2294
- NM_003793
- SEQ ID NO 954 Contig42582 SEQ ID NO 2295
- NM_003795
- SEQ ID NO 955 Contig42631_RC SEQ ID NO 2296
- NM_003806
- SEQ ID NO 956 Contig42751_RC SEQ ID NO 2297
- NM_003821
- SEQ ID NO 957 Contig42759_RC SEQ ID NO 2298
- NM_003829
- SEQ ID NO 958 Contig43054 SEQ ID NO 2299
- NM_003831
- SEQ ID NO 959 Contig43079_RC SEQ ID NO 2300
- NM_003862
- SEQ ID NO 960 Contig43195_RC SEQ ID NO 2301
- NM_003866
- SEQ ID NO 961 Contig43368_RC SEQ ID NO 2302
- NM_003875
- SEQ ID NO 962 Contig43410_RC SEQ ID NO 2303
- NM_003878
- SEQ ID NO 963 Contig43476_RC SEQ ID NO 2304
- NM_003894
- SEQ ID NO 965 Contig43549_RC SEQ ID NO 2305
- NM_003897
- SEQ ID NO 966 Contig43645_RC SEQ ID NO 2306
- NM_003904
- SEQ ID NO 967 Contig43648_RC SEQ ID NO 2307
- NM_003929
- SEQ ID NO 968 Contig43673_RC SEQ ID NO 2308
- NM_003933
- SEQ ID NO 969 Contig43679_RC SEQ ID NO 2309
- NM_003937
- SEQ ID NO 970 Contig43694_RC SEQ ID NO 2310
- NM_003940
- SEQ ID NO 971 Contig43747_RC SEQ ID NO 2311
- NM_003942
- SEQ ID NO 972 Contig43918_RC SEQ ID NO 2312
- NM_003944
- SEQ ID NO 973 Contig43983_RC SEQ ID NO 2313
- NM_003953
- SEQ ID NO 974 Contig44040_RC SEQ ID NO 2314
- NM_003954
- SEQ ID NO 975 Contig44064_RC SEQ ID NO 2315
- NM_003975
- SEQ ID NO 976 Contig44195_RC SEQ ID NO 2316
- NM_003981
- SEQ ID NO 977 Contig44226_RC SEQ ID NO 2317
- NM_003982
- SEQ ID NO 978 Contig44289_RC SEQ ID NO 2320
- NM_003986
- SEQ ID NO 979 Contig44310_RC SEQ ID NO 2321
- NM_004003
- SEQ ID NO 980 Contig44409 SEQ ID NO 2322
- NM_004010
- SEQ ID NO 981 Contig44413_RC SEQ ID NO 2323
- NM_004024
- SEQ ID NO 982 Contig44451_RC SEQ ID NO 2324
- NM_004038
- SEQ ID NO 983 Contig44585_RC SEQ ID NO 2325
- NM_004049
- SEQ ID NO 984 Contig44656_RC SEQ ID NO 2326
- NM_004052
- SEQ ID NO 985 Contig44703_RC SEQ ID NO 2327
- NM_004053
- SEQ ID NO 986 Contig44708_RC SEQ ID NO 2328
- NM_004079
- SEQ ID NO 987 Contig44757_RC SEQ ID NO 2329
- NM_004104
- SEQ ID NO 988 Contig44829_RC SEQ ID NO 2331
- NM_004109
- SEQ ID NO 989 Contig44870 SEQ ID NO 2332
- NM_004110
- SEQ ID NO 990 Contig44893_RC SEQ ID NO 2333
- NM_004120
- SEQ ID NO 991 Contig44909_RC SEQ ID NO 2334
- NM_004131
- SEQ ID NO 992 Contig44939_RC SEQ ID NO 2335
- NM_004143
- SEQ ID NO 993 Contig45022_RC SEQ ID NO 2336
- NM_004154
- SEQ ID NO 994 Contig45032_RC SEQ ID NO 2337
- NM_004170
- SEQ ID NO 996 Contig45041_RC SEQ ID NO 2338
30
- NM_004172
- SEQ ID NO 997 Contig45049_RC SEQ ID NO 2339
- NM_004176
- SEQ ID NO 998 Contig45090_RC SEQ ID NO 2340
- NM_004180
- SEQ ID NO 999 Contig45156_RC SEQ ID NO 2341
- NM_004181
- SEQ ID NO 1000 Contig45316_RC SEQ ID NO 2342
- NM_004184
- SEQ ID NO 1001 Contig45321 SEQ ID NO 2343
- NM_004203
- SEQ ID NO 1002 Contig45375_RC SEQ ID NO 2345
- NM_004207
- SEQ ID NO 1003 Contig45443_RC SEQ ID NO 2346
- NM_004217
- SEQ ID NO 1004 Contig45454_RC SEQ ID NO 2347
- NM_004219
- SEQ ID NO 1005 Contig45537_RC SEQ ID NO 2348
- NM_004221
- SEQ ID NO 1006 Contig45588_RC SEQ ID NO 2349
- NM_004233
- SEQ ID NO 1007 Contig45708_RC SEQ ID NO 2350
- NM_004244
- SEQ ID NO 1008 Contig45816_RC SEQ ID NO 2351
- NM_004252
- SEQ ID NO 1009 Contig45847_RC SEQ ID NO 2352
- NM_004265
- SEQ ID NO 1010 Contig45891_RC SEQ ID NO 2353
- NM_004267
- SEQ ID NO 1011 Contig46056_RC SEQ ID NO 2354
- NM_004281
- SEQ ID NO 1012 Contig46062_RC SEQ ID NO 2355
- NM_004289
- SEQ ID NO 1013 Contig46075_RC SEQ ID NO 2356
- NM_004298
- SEQ ID NO 1015 Contig46164_RC SEQ ID NO 2357
- NM_004301
- SEQ ID NO 1016 Contig46218_RC SEQ ID NO 2358
- NM_004305
- SEQ ID NO 1017 Contig46223_RC SEQ ID NO 2359
- NM_004311
- SEQ ID NO 1018 Contig46244_RC SEQ ID NO 2360
- NM_004315
- SEQ ID NO 1019 Contig46262_RC SEQ ID NO 2361
- NM_004323
- SEQ ID NO 1020 Contig46362_RC SEQ ID NO 2364
- NM_004330
- SEQ ID NO 1021 Contig46443_RC SEQ ID NO 2365
- NM_004336
- SEQ ID NO 1022 Contig46553_RC SEQ ID NO 2367
- NM_004338
- SEQ ID NO 1023 Contig46597_RC SEQ ID NO 2368
- NM_004350
- SEQ ID NO 1024 Contig46653_RC SEQ ID NO 2369
- NM_004354
- SEQ ID NO 1025 Contig46709_RC SEQ ID NO 2370
- NM_004358
- SEQ ID NO 1026 Contig46777_RC SEQ ID NO 2371
- NM_004360
- SEQ ID NO 1027 Contig46802_RC SEQ ID NO 2372
- NM_004362
- SEQ ID NO 1028 Contig46890_RC SEQ ID NO 2374
- NM_004374
- SEQ ID NO 1029 Contig46922_RC SEQ ID NO 2375
- NM_004378
- SEQ ID NO 1030 Contig46934_RC SEQ ID NO 2376
- NM_004392
- SEQ ID NO 1031 Contig46937_RC SEQ ID NO 2377
- NM_004395
- SEQ ID NO 1032 Contig46991_RC SEQ ID NO 2378
- NM_004414
- SEQ ID NO 1033 Contig47016_RC SEQ ID NO 2379
- NM_004418
- SEQ ID NO 1034 Contig47045_RC SEQ ID NO 2380
- NM_004425
- SEQ ID NO 1035 Contig47106_RC SEQ ID NO 2381
- NM_004431
- SEQ ID NO 1036 Contig47146_RC SEQ ID NO 2382
- NM_004436
- SEQ ID NO 1037 Contig47230_RC SEQ ID NO 2383
- NM_004438
- SEQ ID NO 1038 Contig47405_RC SEQ ID NO 2384
- NM_004443
- SEQ ID NO 1039 Contig47456_RC SEQ ID NO 2385
- NM_004446
- SEQ ID NO 1040 Contig47465_RC SEQ ID NO 2386
- NM_004451
- SEQ ID NO 1041 Contig47498_RC SEQ ID NO 2387
- NM_004454
- SEQ ID NO 1042 Contig47578_RC SEQ ID NO 2388
- NM_004456
- SEQ ID NO 1043 Contig47645_RC SEQ ID NO 2389
- NM_004458
- SEQ ID NO 1044 Contig47680_RC SEQ ID NO 2390
31
- NM_004472
- SEQ ID NO 1045 Contig47781_RC SEQ ID NO 2391
- NM_004480
- SEQ ID NO 1046 Contig47814_RC SEQ ID NO 2392
- NM_004482
- SEQ ID NO 1047 Contig48004_RC SEQ ID NO 2393
- NM_004494
- SEQ ID NO 1048 Contig48043_RC SEQ ID NO 2394
- NM_004496
- SEQ ID NO 1049 Contig48057_RC SEQ ID NO 2395
- NM_004503
- SEQ ID NO 1050 Contig48076_RC SEQ ID NO 2396
- NM_004504
- SEQ ID NO 1051 Contig48249_RC SEQ ID NO 2397
- NM_004515
- SEQ ID NO 1052 Contig48263_RC SEQ ID NO 2398
- NM_004522
- SEQ ID NO 1053 Contig48270_RC SEQ ID NO 2399
- NM_004523
- SEQ ID NO 1054 Contig48328_RC SEQ ID NO 2400
- NM_004525
- SEQ ID NO 1055 Contig48518_RC SEQ ID NO 2401
- NM_004556
- SEQ ID NO 1056 Contig48572_RC SEQ ID NO 2402
- NM_004559
- SEQ ID NO 1057 Contig48659_RC SEQ ID NO 2403
- NM_004569
- SEQ ID NO 1058 Contig48722_RC SEQ ID NO 2404
- NM_004577
- SEQ ID NO 1059 Contig48774_RC SEQ ID NO 2405
- NM_004585
- SEQ ID NO 1060 Contig48776_RC SEQ ID NO 2406
- NM_004587
- SEQ ID NO 1061 Contig48800_RC SEQ ID NO 2407
- NM_004594
- SEQ ID NO 1062 Contig48806_RC SEQ ID NO 2408
- NM_004599
- SEQ ID NO 1063 Contig48852_RC SEQ ID NO 2409
- NM_004633
- SEQ ID NO 1066 Contig48900_RC SEQ ID NO 2410
- NM_004642
- SEQ ID NO 1067 Contig48913_RC SEQ ID NO 2411
- NM_004648
- SEQ ID NO 1068 Contig48970_RC SEQ ID NO 2413
- NM_004663
- SEQ ID NO 1069 Contig49058_RC SEQ ID NO 2414
- NM_004664
- SEQ ID NO 1070 Contig49063_RC SEQ ID NO 2415
- NM_004684
- SEQ ID NO 1071 Contig49093 SEQ ID NO 2416
- NM_004688
- SEQ ID NO 1072 Contig49098_RC SEQ ID NO 2417
- NM_004694
- SEQ ID NO 1073 Contig49169_RC SEQ ID NO 2418
- NM_004695
- SEQ ID NO 1074 Contig49233_RC SEQ ID NO 2419
- NM_004701
- SEQ ID NO 1075 Contig49270_RC SEQ ID NO 2420
- NM_004708
- SEQ ID NO 1077 Contig49282_RC SEQ ID NO 2421
- NM_004711
- SEQ ID NO 1078 Contig49289_RC SEQ ID NO 2422
- NM_004726
- SEQ ID NO 1079 Contig49342_RC SEQ ID NO 2423
- NM_004750
- SEQ ID NO 1081 Contig49344 SEQ ID NO 2424
- NM_004761
- SEQ ID NO 1082 Contig49388_RC SEQ ID NO 2425
- NM_004762
- SEQ ID NO 1083 Contig49405_RC SEQ ID NO 2426
- NM_004780
- SEQ ID NO 1085 Contig49445_RC SEQ ID NO 2427
- NM_004791
- SEQ ID NO 1086 Contig49468_RC SEQ ID NO 2428
- NM_004798
- SEQ ID NO 1087 Contig49509_RC SEQ ID NO 2429
- NM_004808
- SEQ ID NO 1088 Contig49578_RC SEQ ID NO 2431
- NM_004811
- SEQ ID NO 1089 Contig49581_RC SEQ ID NO 2432
- NM_004833
- SEQ ID NO 1090 Contig49631_RC SEQ ID NO 2433
- NM_004835
- SEQ ID NO 1091 Contig49673_RC SEQ ID NO 2435
- NM_004843
- SEQ ID NO 1092 Contig49743_RC SEQ ID NO 2436
- NM_004847
- SEQ ID NO 1093 Contig49790_RC SEQ ID NO 2437
- NM_004848
- SEQ ID NO 1094 Contig49818_RC SEQ ID NO 2438
- NM_004864
- SEQ ID NO 1095 Contig49849_RC SEQ ID NO 2439
- NM_004865
- SEQ ID NO 1096 Contig49855 SEQ ID NO 2440
32
- NM_004866
- SEQ ID NO 1097 Contig49910_RC SEQ ID NO 2441
- NM_004877
- SEQ ID NO 1098 Contig49948_RC SEQ ID NO 2442
- NM_004900
- SEQ ID NO 1099 Contig50004_RC SEQ ID NO 2443
- NM_004906
- SEQ ID NO 1100 Contig50094 SEQ ID NO 2444
- NM_004910
- SEQ ID NO 1101 Contig50120_RC SEQ ID NO 2446
- NM_004918
- SEQ ID NO 1103 Contig50153_RC SEQ ID NO 2447
- NM_004923
- SEQ ID NO 1104 Contig50189_RC SEQ ID NO 2448
- NM_004938
- SEQ ID NO 1105 Contig50276 RC SEQ ID NO 2449
- NM_004951
- SEQ ID NO 1106 Contig50288_RC SEQ ID NO 2450
- NM_004968
- SEQ ID NO 1107 Contig50297_RC SEQ ID NO 2451
- NM_004994
- SEQ ID NO 1108 Contig50391_RC SEQ ID NO 2452
- NM_004999
- SEQ ID NO 1109 Contig50410 SEQ ID NO 2453
- NM_005001
- SEQ ID NO 1110 Contig50523_RC SEQ ID NO 2454
- NM_005002
- SEQ ID NO 1111 Contig50529 SEQ ID NO 2455
- NM_005012
- SEQ ID NO 1112 Contig50588_RC SEQ ID NO 2456
- NM_005032
- SEQ ID NO 1113 Contig50592 SEQ ID NO 2457
- NM_005044
- SEQ ID NO 1114 Contig50669_RC SEQ ID NO 2458
- NM_005046
- SEQ ID NO 1115 Contig50719_RC SEQ ID NO 2460
- NM_005049
- SEQ ID NO 1116 Contig50728_RC SEQ ID NO 2461
- NM_005067
- SEQ ID NO 1117 Contig50731_RC SEQ ID NO 2462
- NM_005077
- SEQ ID NO 1118 Contig50802_RC SEQ ID NO 2463
- NM_005080
- SEQ ID NO 1119 Contig50822_RC SEQ ID NO 2464
- NM_005084
- SEQ ID NO 1120 Contig50850_RC SEQ ID NO 2466
- NM_005130
- SEQ ID NO 1122 Contig50860_RC SEQ ID NO 2467
- NM_005139
- SEQ ID NO 1123 Contig50913_RC SEQ ID NO 2468
- NM_005168
- SEQ ID NO 1125 Contig50950_RC SEQ ID NO 2469
- NM_005190
- SEQ ID NO 1126 Contig51066_RC SEQ ID NO 2470
- NM_005196
- SEQ ID NO 1127 Contig51105_RC SEQ ID NO 2472
- NM_005213
- SEQ ID NO 1128 Contig51117_RC SEQ ID NO 2473
- NM_005218
- SEQ ID NO 1129 Contig51196_RC SEQ ID NO 2474
- NM_005235
- SEQ ID NO 1130 Contig51235_RC SEQ ID NO 2475
- NM_005245
- SEQ ID NO 1131 Contig51254_RC SEQ ID NO 2476
- NM_005249
- SEQ ID NO 1132 Contig51352_RC SEQ ID NO 2477
- NM_005257
- SEQ ID NO 1133 Contig51369_RC SEQ ID NO 2478
- NM_005264
- SEQ ID NO 1134 Contig51392_RC SEQ ID NO 2479
- NM_005271
- SEQ ID NO 1135 Contig51403_RC SEQ ID NO 2480
- NM_005314
- SEQ ID NO 1136 Contig51685_RC SEQ ID NO 2483
- NM_005321
- SEQ ID NO 1137 Contig51726_RC SEQ ID NO 2484
- NM_005322
- SEQ ID NO 1138 Contig51742_RC SEQ ID NO 2485
- NM_005325
- SEQ ID NO 1139 Contig51749_RC SEQ ID NO 2486
- NM_005326
- SEQ ID NO 1140 Contig51775_RC SEQ ID NO 2487
- NM_005335
- SEQ ID NO 1141 Contig51800 SEQ ID NO 2488
- NM_005337
- SEQ ID NO 1142 Contig51809_RC SEQ ID NO 2489
- NM_005342
- SEQ ID NO 1143 Contig51821_RC SEQ ID NO 2490
- NM_005345
- SEQ ID NO 1144 Contig51888_RC SEQ ID NO 2491
- NM_005357
- SEQ ID NO 1145 Contig51953_RC SEQ ID NO 2493
- NM_005375
- SEQ ID NO 1146 Contig51967_RC SEQ ID NO 2495
33
- NM_005391
- SEQ ID NO 1147 Contig51981_RC SEQ ID NO 2496
- NM_005408
- SEQ ID NO 1148 Contig51994_RC SEQ ID NO 2497
- NM_005409
- SEQ ID NO 1149 Contig52082_RC SEQ ID NO 2498
- NM_005410
- SEQ ID NO 1150 Contig52094_RC SEQ ID NO 2499
- NM_005426
- SEQ ID NO 1151 Contig52320 SEQ ID NO 2500
- NM_005433
- SEQ ID NO 1152 Contig52398_RC SEQ ID NO 2501
- NM_005441
- SEQ ID NO 1153 Contig52425_RC SEQ ID NO 2503
- NM_005443
- SEQ ID NO 1154 Contig52482_RC SEQ ID NO 2504
- NM_005483
- SEQ ID NO 1155 Contig52543_RC SEQ ID NO 2505
- NM_005486
- SEQ ID NO 1156 Contig52553_RC SEQ ID NO 2506
- NM_005496
- SEQ ID NO 1157 Contig52579_RC SEQ ID NO 2507
- NM_005498
- SEQ ID NO 1158 Contig52603_RC SEQ ID NO 2508
- NM_005499
- SEQ ID NO 1159 Contig52639_RC SEQ ID NO 2509
- NM_005514
- SEQ ID NO 1160 Contig52641_RC SEQ ID NO 2510
- NM_005531
- SEQ ID NO 1162 Contig52684 SEQ ID NO 2511
- NM_005538
- SEQ ID NO 1163 Contig52705_RC SEQ ID NO 2512
- NM_005541
- SEQ ID NO 1164 Contig52720_RC SEQ ID NO 2513
- NM_005544
- SEQ ID NO 1165 Contig52722_RC SEQ ID NO 2514
- NM_005548
- SEQ ID NO 1166 Contig52723_RC SEQ ID NO 2515
- NM_005554
- SEQ ID NO 1167 Contig52740_RC SEQ ID NO 2516
- NM_005555
- SEQ ID NO 1168 Contig52779_RC SEQ ID NO 2517
- NM_005556
- SEQ ID NO 1169 Contig52957_RC SEQ ID NO 2518
- NM_005557
- SEQ ID NO 1170 Contig52994_RC SEQ ID NO 2519
- NM_005558
- SEQ ID NO 1171 Contig53022_RC SEQ ID NO 2520
- NM_005562
- SEQ ID NO 1172 Contig53038_RC SEQ ID NO 2521
- NM_005563
- SEQ ID NO 1173 Contig53047_RC SEQ ID NO 2522
- NM_005565
- SEQ ID NO 1174 Contig53130 SEQ ID NO 2523
- NM_005566
- SEQ ID NO 1175 Contig53183_RC SEQ ID NO 2524
- NM_005572
- SEQ ID NO 1176 Contig53242_RC SEQ ID NO 2526
- NM_005582
- SEQ ID NO 1177 Contig53248_RC SEQ ID NO 2527
- NM_005608
- SEQ ID NO 1178 Contig53260_RC SEQ ID NO 2528
- NM_005614
- SEQ ID NO 1179 Contig53296_RC SEQ ID NO 2531
- NM_005617
- SEQ ID NO 1180 Contig53307_RC SEQ ID NO 2532
- NM_005620
- SEQ ID NO 1181 Contig53314_RC SEQ ID NO 2533
- NM_005625
- SEQ ID NO 1182 Contig53401_RC SEQ ID NO 2534
- NM_005651
- SEQ ID NO 1183 Contig53550_RC SEQ ID NO 2535
- NM_005658
- SEQ ID NO 1184 Contig53551_RC SEQ ID NO 2536
- NM_005659
- SEQ ID NO 1185 Contig53598_RC SEQ ID NO 2537
- NM_005667
- SEQ ID NO 1186 Contig53646_RC SEQ ID NO 2538
- NM_005686
- SEQ ID NO 1187 Contig53658_RC SEQ ID NO 2539
- NM_005690
- SEQ ID NO 1188 Contig53698_RC SEQ ID NO 2540
- NM_005720
- SEQ ID NO 1190 Contig53719_RC SEQ ID NO 2541
- NM_005727
- SEQ ID NO 1191 Contig53742_RC SEQ ID NO 2542
- NM_005733
- SEQ ID NO 1192 Contig53757_RC SEQ ID NO 2543
- NM_005737
- SEQ ID NO 1193 Contig53870_RC SEQ ID NO 2544
- NM_005742
- SEQ ID NO 1194 Contig53952_RC SEQ ID NO 2546
- NM_005746
- SEQ ID NO 1195 Contig53962_RC SEQ ID NO 2547
34
- NM_005749
- SEQ ID NO 1196 Contig53968_RC SEQ ID NO 2548
- NM_005760
- SEQ ID NO 1197 Contig54113_RC SEQ ID NO 2549
- NM_005764
- SEQ ID NO 1198 Contig54142_RC SEQ ID NO 2550
- NM_005794
- SEQ ID NO 1199 Contig54232_RC SEQ ID NO 2551
- NM_005796
- SEQ ID NO 1200 Contig54242_RC SEQ ID NO 2552
- NM_005804
- SEQ ID NO 1201 Contig54260_RC SEQ ID NO 2553
- NM_005813
- SEQ ID NO 1202 Contig54263_RC SEQ ID NO 2554
- NM_005824
- SEQ ID NO 1203 Contig54295_RC SEQ ID NO 2555
- NM_005825
- SEQ ID NO 1204 Contig54318_RC SEQ ID NO 2556
- NM_005849
- SEQ ID NO 1205 Contig54325_RC SEQ ID NO 2557
- NM_005853
- SEQ ID NO 1206 Contig54389_RC SEQ ID NO 2558
- NM_005855
- SEQ ID NO 1207 Contig54394_RC SEQ ID NO 2559
- NM_005864
- SEQ ID NO 1208 Contig54414_RC SEQ ID NO 2560
- NM_005874
- SEQ ID NO 1209 Contig54425 SEQ ID NO 2561
- NM_005876
- SEQ ID NO 1210 Contig54477_RC SEQ ID NO 2562
- NM_005880
- SEQ ID NO 1211 Contig54503_RC SEQ ID NO 2563
- NM_005891
- SEQ ID NO 1212 Contig54534_RC SEQ ID NO 2564
- NM_005892
- SEQ ID NO 1213 Contig54560_RC SEQ ID NO 2566
- NM_005899
- SEQ ID NO 1214 Contig54581_RC SEQ ID NO 2567
- NM_005915
- SEQ ID NO 1215 Contig54609_RC SEQ ID NO 2568
- NM_005919
- SEQ ID NO 1216 Contig54666_RC SEQ ID NO 2569
- NM_005923
- SEQ ID NO 1217 Contig54667_RC SEQ ID NO 2570
- NM_005928
- SEQ ID NO 1218 Contig54726_RC SEQ ID NO 2571
- NM_005932
- SEQ ID NO 1219 Contig54742_RC SEQ ID NO 2572
- NM_005935
- SEQ ID NO 1220 Contig54745_RC SEQ ID NO 2573
- NM_005945
- SEQ ID NO 1221 Contig54757_RC SEQ ID NO 2574
- NM_005953
- SEQ ID NO 1222 Contig54761_RC SEQ ID NO 2575
- NM_005978
- SEQ ID NO 1223 Contig54813_RC SEQ ID NO 2576
- NM_005990
- SEQ ID NO 1224 Contig54867_RC SEQ ID NO 2577
- NM_006002
- SEQ ID NO 1225 Contig54895_RC SEQ ID NO 2578
- NM_006004
- SEQ ID NO 1226 Contig54898_RC SEQ ID NO 2579
- NM_006005
- SEQ ID NO 1227 Contig54913_RC SEQ ID NO 2580
- NM_006006
- SEQ ID NO 1228 Contig54965_RC SEQ ID NO 2582
- NM_006017
- SEQ ID NO 1229 Contig54968_RC SEQ ID NO 2583
- NM_006018
- SEQ ID NO 1230 Contig55069_RC SEQ ID NO 2584
- NM_006023
- SEQ ID NO 1231 Contig55181_RC SEQ ID NO 2585
- NM_006027
- SEQ ID NO 1232 Contig55188_RC SEQ ID NO 2586
- NM_006029
- SEQ ID NO 1233 Contig55221_RC SEQ ID NO 2587
- NM_006033
- SEQ ID NO 1234 Contig55254_RC SEQ ID NO 2588
- NM_006051
- SEQ ID NO 1235 Contig55265_RC SEQ ID NO 2589
- NM_006055
- SEQ ID NO 1236 Contig55377_RC SEQ ID NO 2591
- NM_006074
- SEQ ID NO 1237 Contig55397_RC SEQ ID NO 2592
- NM_006086
- SEQ ID NO 1238 Contig55448_RC SEQ ID NO 2593
- NM_006087
- SEQ ID NO 1239 Contig55468_RC SEQ ID NO 2594
- NM_006096
- SEQ ID NO 1240 Contig55500_RC SEQ ID NO 2595
- NM_006101
- SEQ ID NO 1241 Contig55538_RC SEQ ID NO 2596
- NM_006103
- SEQ ID NO 1242 Contig55558_RC SEQ ID NO 2597
35
- NM_006111
- SEQ ID NO 1243 Contig55606_RC SEQ ID NO 2598
- NM_006113
- SEQ ID NO 1244 Contig55674_RC SEQ ID NO 2599
- NM_006115
- SEQ ID NO 1245 Contig55725_RC SEQ ID NO 2600
- NM_006117
- SEQ ID NO 1246 Contig55728_RC SEQ ID NO 2601
- NM_006142
- SEQ ID NO 1247 Contig55756_RC SEQ ID NO 2602
- NM_006144
- SEQ ID NO 1248 Contig55769_RC SEQ ID NO 2603
- NM_006148
- SEQ ID NO 1249 Contig55771_RC SEQ ID NO 2605
- NM_006153
- SEQ ID NO 1250 Contig55813_RC SEQ ID NO 2607
- NM_006159
- SEQ ID NO 1251 Contig55829_RC SEQ ID NO 2608
- NM_006170
- SEQ ID NO 1252 Contig55852_RC SEQ ID NO 2609
- NM_006197
- SEQ ID NO 1253 Contig55883_RC SEQ ID NO 2610
- NM_006224
- SEQ ID NO 1255 Contig55920_RC SEQ ID NO 2611
- NM_006227
- SEQ ID NO 1256 Contig55940_RC SEQ iD NO 2612
- NM_006235
- SEQ ID NO 1257 Contig55950_RC SEQ ID NO 2613
- NM_006243
- SEQ ID NO 1258 Contig55991_RC SEQ ID NO 2614
- NM_006264
- SEQ ID NO 1259 Contig55997_RC SEQ ID NO 2615
- NM_006271
- SEQ ID NO 1261 Contig56023_RC SEQ ID NO 2616
- NM_006274
- SEQ ID NO 1262 Contig56030_RC SEQ ID NO 2617
- NM_006290
- SEQ ID NO 1265 Contig56093_RC SEQ ID NO 2618
- NM_006291
- SEQ ID NO 1266 Contig56205_RC SEQ ID NO 2621
- NM_006296
- SEQ ID NO 1267 Contig56270_RC SEQ ID NO 2622
- NM_006304
- SEQ ID NO 1268 Contig56276_RC SEQ ID NO 2623
- NM_006314
- SEQ ID NO 1269 Contig56291-RC SEQ ID NO 2624
- NM_006332
- SEQ ID NO 1270 Contig56298_RC SEQ ID NO 2625
- NM_006357
- SEQ ID NO 1271 Contig56307 SEQ ID NO 2627
- NM_006366
- SEQ ID NO 1272 Contig56390_RC SEQ ID NO 2628
- NM_006372
- SEQ ID NO 1273 Contig56434_RC SEQ ID NO 2629
- NM_006377
- SEQ ID NO 1274 Contig56457 RC SEQ ID NO 2630
- NM_006378
- SEQ ID NO 1275 Contig56534_RC SEQ ID NO 2631
- NM_006383
- SEQ ID NO 1276 Contig56670_RC SEQ ID NO 2632
- NM_006389
- SEQ ID NO 1277 Contig56678_RC SEQ ID NO 2633
- NM_006393
- SEQ ID NO 1278 Contig56742_RC SEQ ID NO 2634
- NM_006398
- SEQ ID NO 1279 Contig56759_RC SEQ ID NO 2635
- NM_006406
- SEQ ID NO 1280 Contig56765_RC SEQ ID NO 2636
- NM_006408
- SEQ ID NO 1281 Contig56843_RC SEQ ID NO 2637
- NM_006410
- SEQ ID NO 1282 Contig57011_RC SEQ ID NO 2638
- NM_006414
- SEQ ID NO 1283 Contig57023_RC SEQ ID NO 2639
- NM_006417
- SEQ ID NO 1284 Contig57057_RC SEQ ID NO 2640
- NM_006430
- SEQ ID NO 1285 Contig57076_RC SEQ ID NO 2641
- NM_006460
- SEQ ID NO 1286 Contig57081_RC SEQ ID NO 2642
- NM_006461
- SEQ ID NO 1287 Contig57091_RC SEQ ID NO 2643
- NM_006469
- SEQ ID NO 1288 Contig57138_RC SEQ ID NO 2644
- NM_006470
- SEQ ID NO 1289 Contig57173_RC SEQ ID NO 2645
- NM_006491
- SEQ ID NO 1290 Contig57230_RC SEQ ID NO 2646
- NM_006495
- SEQ ID NO 1291 Contig57258_RC SEQ ID NO 2647
- NM_006500
- SEQ ID NO 1292 Contig57270_RC SEQ ID NO 2648
- NM_006509
- SEQ ID NO 1293 Contig57272_RC SEQ ID NO 2649
36
- NMB_006516
- SEQ ID NO 1294 Contig57344_RC SEQ ID NO 2650
- NM_006533
- SEQ ID NO 1295 Contig57430_RC SEQ ID NO 2651
- NM_006551
- SEQ ID NO 1296 Contig57458_RC SEQ ID NO 2652
- NM_006556
- SEQ ID NO 1297 Contig57493_RC SEQ ID NO 2653
- NM_006558
- SEQ ID NO 1298 Contig57584_RC SEQ ID NO 2654
- NM_006564
- SEQ ID NO 1299 Contig57595 SEQ ID NO 2655
- NM_006573
- SEQ ID NO 1300 Contig57602_RC SEQ ID NO 2656
- NM_006607
- SEQ ID NO 1301 Contig57609_RC SEQ ID NO 2657
- NM_006622
- SEQ ID NO 1302 Contig57610 RC SEQ ID NO 2658
- NM_006623
- SEQ ID NO 1303 Contig57644_RC SEQ ID NO 2659
- NM_006636
- SEQ ID NO 1304 Contig57725_RC SEQ ID NO 2660
- NM_006670
- SEQ ID NO 1305 Contig57739_RC SEQ ID NO 2661
- NM_006681
- SEQ ID NO 1306 Contig57825_RC SEQ ID NO 2662
- NM_006682
- SEQ ID NO 1307 Contig57864_RC SEQ ID NO 2663
- NM_006696
- SEQ ID NO 1308 Contig57940_RC SEQ ID NO 2664
- NM_006698
- SEQ ID NO 1309 Contig58260_RC SEQ ID NO 2665
- NM_006705
- SEQ ID NO 1310 Contig58272_RC SEQ ID NO 2666
- NM_006739
- SEQ ID NO 1311 Contig58301_RC SEQ ID NO 2667
- NM_006748
- SEQ ID NO 1312 Contig58368_RC SEQ ID NO 2668
- NM_006759
- SEQ ID NO 1313 Contig58471_RC SEQ ID NO 2669
- NM_006762
- SEQ ID NO 1314 Contig58755_RC SEQ ID NO 2671
- NM_006763
- SEQ ID NO 1315 Contig59120-RC SEQ ID NO 2672
- NM_006769
- SEQ ID NO 1316 Contig60157 RC SEQ ID NO 2673
- NM_006770
- SEQ ID NO 1317 Contig60864_RC SEQ ID NO 2676
- NM_006780
- SEQ ID NO 1318 Contig61254_RC SEQ ID NO 2677
- NM_006787
- SEQ ID NO 1319 Contig61815 SEQ ID NO 2678
- NM_006806
- SEQ ID NO 1320 Contig61975 SEQ ID NO 2679
- NMB_006813
- SEQ ID NO 1321 Contig62306 SEQ ID NO 2680
- NM_006825
- SEQ ID NO 1322 Contig62568_RC SEQ ID NO 2681
- NM_006826
- SEQ ID NO 1323 Contig62922_RC SEQ ID NO 2682
- NM_006829
- SEQ ID NO 1324 Contig62964_RC SEQ ID NO 2683
- NM_006834
- SEQ ID NO 1325 Contig63520_RC SEQ ID NO 2685
- NM_006835
- SEQ ID NO 1326 Contig63649_RC SEQ ID NO 2686
- NM_006840
- SEQ ID NO 1327 Contig63683_RC SEQ ID NO 2687
- NM_006845
- SEQ ID NO 1328 Contig63748_RC SEQ ID NO 2688
- NM_006847
- SEQ ID NO 1329 Contig64502 SEQ ID NO 2689
- NM_006851
- SEQ ID NO 1330 Contig64688 SEQ ID NO 2690
- NM_006855
- SEQ ID NO 1331 Contig64775_RC SEQ ID NO 2691
- NM_006864
- SEQ ID NO 1332 Contig65227 SEQ ID NO 2692
- NM_006868
- SEQ ID NO 1333 Contig65663 SEQ ID NO 2693
- NM_006875
- SEQ ID NO 1334 Contig65785_RC SEQ ID NO 2694
- NM_006889
- SEQ ID NO 1336 Contig65900 SEQ ID NO 2695
- NM_006892
- SEQ ID NO 1337 Contig66219 RC SEQ ID NO 2696
- NMB_006912
- SEQ ID NO 1338 Contig66705_RC SEQ ID NO 2697
- NM_006931
- SEQ ID NO 1341 Contig66759_RC SEQ ID NO 2698
- NM_006941
- SEQ ID NO 1342 Contig67182_RC SEQ ID NO 2699
- NM_006943
- SEQ ID NO 1343
37
Tabla 2. 550 marcadores de categoría de ER preferidos sacados de la Tabla 1
- Identificador
- correlación Nombre Descripción
- NM_002051
- 0.763977 GATA3 Proteína 3 de enlace con GATA
- AB020689
- 0.753592 KIAA0882 Proteína KIAA0882
- NM_001218
- 0.753225 CA12 Anhidrasa carbónica XII
- NM_000125
- 0.748421 ESR1 Receptor de estrógeno 1
- Contig56678_RC
- 0.747816 ESTs
- NM_004496
- 0.729116 HNF3A factor nuclear 3 de hepatocitos, alfa
- NM_017732
- 0.713398 FLJ20262 Proteína hipotética FLJ20262
- NM_006806
- -0.712678 BTG3 Familia BTG, miembro 3
- Contig56390_RC
- 0.705940 ESTs
- Contig37571_RC
- 0.704468 ESTs
- NM_004559
- -0.701617 NSEP1 Proteína 1 de enlace con elemento sensible a la nucleasa
- Contig50153_RC
- -0.696652 ESTs, ligeramente parecidos al precursor de proteína de enlace proteoglicano [H.sapiens]
- NMB_012155
- 0.694332 EMAP-2 Proteína asociada a microtubulo como EMAP equinodermo
- Contig237_RC
- 0.687485 FLJ21127 Proteína hipotética FLJ21127
- NMB_01 9063
- -0.686064 C2ORF2 Marco de lectura abierta 2 del cromosoma 2
- NMB_012219
- -0.680900 MRAS Homólogo de oncógeno RAS de músculo
- NM_001982
- 0.676114 ERBB3 Homólogo 3 de oncógeno viral de leucemia eritoblástica aviar v-erb-b 2
- NM_006623
- -0.675090 PHGDH Fosfogliceratodehidrogenasa
- NMB_000636
- -0.674282 SOD2 Superóxido dismutasa 2, mitocondrial
- NMB_006017
- -0.670353 PROML1 Prominina 1 similar a (ratón)
- Contig57940_RC
- 0.667915 MAP-1 Proteína MAP-1
- Contig46934_RC
- 0.666908 ESTs, ligeramente parecidos a gradiente 2 Anterior JE0350 [H.sapiens]
- NM_005080
- 0.665772 XBP1 Proteína 1 de enlace con X-caja
- NM_014246
- 0.665725 CELSR1 Cadherina, receptor 1 de tipo G de siete pases EGF LAG, homólogo de flamingo (Drosophila)
- Contig54667_RC
- -0.663727 Secuencia de ADN humano del clon RP1-187J11 en cromosoma 6q11.1-22.33. Contiene el gen para una nueva proteína parecida a las proteínas previstas S. pombe y S. cerevisiae, el gen para una nueva proteína parecida a los inhibidores C de quinasa proteínica, el extremo de 3’ del gen para una nueva proteínal parecida a Drosophila L82 y proteínas de gusanos previstas, ESTs, STSs, GSSs y dos islas CpG putativas
- Contig51994_RC
- 0.663715 ESTs, ligeramente parecido a B0416.1 [C.elegans]
- NM_016337
- 0.663006 RNB6 RNB6
- NMB_015640
- -0.660165 PAI-RBP1 Proteína de enlace con PAI-1 ARNm
- X07834
- -0.657798 SOD2 Superóxido dismutasa 2, mitocondrial
- NMB_012319
- 0.657666 LIV-1 Proteína LIV-1, regulada por estrógeno
- Contig41887_RC
- 0.656042 ESTs, ligeramente parecidos al homólogo de la proteína de la membrana del corpúsculo de zimógeno de rata [H.sapiens]
- NM_003462
- 0.655349 P28 dineina, axonemal, polipéptido intermedio ligero
38
- Contig58301_RC
- 0.654268 ARNm de Homo sapiens; ADNc DKFZp667D095 (del clon DKFZp667D095)
- NM_005375
- 0.653783 MYB Homólogo de oncógeno viral de mieloblastosis aviar v-myb
- NMB_017447
- -0.652445 YG81 Proteína hipotética LOC54149
- Contig924_RC
- -0.650658 ESTs
- M55914
- -0.650181 MPB1 Proteína 1 de enlace con el promotor MYC
- NM_006004
- -0.649819 UQCRH Proteína bisagra con ubiquinol-citocromo c reductasa
- NM_000964
- 0.649072 RARA Receptor de ácido retinoico, alfa
- NM_013301
- 0.647583 HSU79303 Proteína prevista por el clon 23882
- AB023211
- -0.647403 PDI2 Peptidil arginina deiminasa, tipo II
- NM_016629
- -0.646412 LOC51323 Proteína hipotética
- K02403
- 0.645532 C4A Componente de complemento 4A
- NM_016405
- -0.642201 HSU93243 Homólogo de Ubc6p
- Contig46597_RC
- 0.641733 ESTs
- Contig55377_RC
- 0.640310 ESTs
- NM_001207
- 0.637800 BTF3 Factor 3 de transcripción básica
- NM_018166
- 0.636422 FLJ10647 Proteína hipotética FLJ10647
- AL110202
- -0.635398 ARNm de Homo sapiens; ADNc DKFZp586I2022 (del clon DKFZp586I2022)
- AL133105
- -0.635201 DKFZp434F 2322 Proteína hipotética DKFZp434F2322
- NMB_016839
- -0.635169 RBMS1 Motivo de enlace con ARN, proteína 1 interactuante monocatenaria
- Contig53130
- -0.634812 ESTs, ligeramente parecidos al canal controlado por nucleótido cíclico activado por hiperpolarización hHCN2 [H.sapiens]
- NM_018014
- -0.634460 BCL11A CLUlinfoma 11A de célula B (proteína de dedo de cinc)
- NM_006769
- -0.632197 LMO4 Dominio LIM solo 4
- U92544
- 0.631170 JCL-1 Proteína asociada al carcinoma hepatocelular; gen 1 asociado al cáncer de mama
- Contig49233_RC
- -0.631047 Homo sapiens, parecido al factor 2 de enlace con receptor nuclear, clon IMAGE:3463191, ARNm, cds parcial
- AL133033
- 0.629690 KIAA1025 KIAA1025 protein
- AL049265
- 0.629414 ARN de Homo sapiens; ADNc DKFZp564F053 (del clon DKFZp564F053)
- NM_018728
- 0.627989 MYO5C Miosina 5C
- NM_004780
- 0.627856 TCEAL1 Factor A de alargamiento de transcripción de tipo 1(SII)
- Contig760_RC
- 0.627132 ESTs
- Contig399_RC
- 0.626543 FLJ12538 Proteína hipotética FLJ12538 parecida a la proteína relacionada con ras RAB17
- M83822
- 0.625092 CDC4L Ciclo de división de célula de tipo 4
- NM_001255
- -0.625089 CDC20 CDC20 (ciclo de división de célula 20, S. cerevisiae, homólogo)
- NM_006739
- -0.624903 MCM5 Deficiente mantenimiento de minicromosomas (S. cerevisiae) 5 (ciclo de división celular 46)
- NM_002888
- -0.624664 RARRES1 Respondedor 1 a receptor de ácido retinoico (inducido por tazaroteno)
39
- NM_003197
- 0.623850 TCEB1L Factor B de alargamiento de transcripción (SIII), afín a polipéptido 1
- NM_006787
- 0.623625 JCL-1 Proteína asociada al carcinoma hepatocelular; gen 1 asociado al cáncer de mama
- Contig49342_RC
- 0.622179 ESTs
- AL133619
- 0.621719 ARNm de Homo sapiens: ADNc DKFZp434E2321 (del clon DKFZp434E2321); cds parcial
- AL133622
- 0.621577 KIAA0876 Proteína KIAA0876
- NM_004648
- -0.621532 PTPNS1 Tirosina fosfatasa proteínica, sustrato 1 de tipo no- receptor
- NM_001793
- -0.621530 CDH3 Cadherina 3, tipo 1, P-caderina (placentaria)
- NM_003217
- 0.620915 TEGT Trascripción mejorada de genes de testículos (inhibidor 1 de BAX)
- NM_001551
- 0.620832 IGBP1 Proteína 1 asociada a la inmunoglobulina (CD79A)
- NM_002539
- -0.620683 ODC1 Ornitina decarboxilasa 1
- Contig55997_RC
- -0.619932 ESTs
- NM_000633
- 0.619547 BCL2 CLL/linfoma 2 de célula B
- NMB_016267
- -0.619096 TONDU TONDU
- Contig3659_RC
- 0.618048 FLJ21174 Proteína hipotética FLJ21174
- NM_000191
- 0.617250 HMGCL 3-hidroximetil-3-metilglutaril-Coenzima A liasa (hydroximetilglutaricaciduria)
- NM_001267
- 0.616890 CHAD Condroadherina
- Contig39090_RC
- 0.616385 ESTs
- AF055270
- -0.616268 HSSG1 Proteína 1 suprimida de choque de calor
- Contig43054
- 0.616015 FLJ21603 Proteína hipotética FLJ21603
- NM_001428
- -0.615855 ENO1 Enolasa 1, (alfa)
- Contig51369_RC
- 0.615466 ESTs
- Contig36647_RC
- 0.615310 GFRA1 Alfa 1 de receptor de familia GDNF
- NM_014096
- -0.614832 PRO1659 Proteína PRO1659
- NM_015937
- 0.614735 LOC51604 Proteína CGI-06
- Contig49790_RC
- -0.614463 ESTs
- NM_006759
- -0.614279 UGP2 UDP-glucosa pirofosforilasa 2
- Contig53598_RC
- -0.613787 FLJ11413 Proteína hipotética FLJ11413
- AF113132
- -0.613561 PSA Fosfoserina aminotransferasa
- AK000004
- 0.613001 ARNm de Homo sapiens para proteína FLJ00004, cds parcial
- Contig52543_RC
- 0.612960 ADNc de Homo sapiens, fis FLJ13945, clon Y79AA1000969
- AB032966
- -0.611917 KIAA1140 Proteína KIAA1140
- AL080192
- 0.611544 ADNc de Homo sapiens; FLJ21238 fis, clon COL01115
- X56807
- -0.610654 DSC2 Desmocolina 2
- Contig30390_RC
- 0.609614 ESTs
- AL137362
- 0.609121 FLJ22237 Proteína hipotética FLJ22237
- NM_014211
- -0.608585 GABRP Ácido gamma-aminobutírico acid (GABA) receptor A, pi
- NM_006696
- 0.608474 SMAP Proteína coactivadora del receptor de hormonas de la tiroides
- Contig45588_RC
- -0.608273 ADN de Homo sapiens; FLJ22610 fis, clon HSI04930
- NM_003358
- 0.608244 UGCG UDP-glucosa ceramida glucosiltransferasa
- NMB_006153
- -0.608129 NCK1 Proteína 1 del adaptador de NCK
40
- NMB_001453
- -0.606939 FOXC1 Forkhead box C1
- Contig54666_RC
- 0.606475 oy65e02.x1 NCl_CGAP_CLL1 ADNC de Homo sapiens clon IMAGE: 1670714 3’ parecido a TR:Q29168 PROTEINA DESCONOCIDA Q29168; secuencia de ARNm.
- NM_005945
- -0.605945 MPB1 Proteína 1 de enlace con promotor MYC
- Contig55725_RC
- -0.605841 ESTs, ligeramente parecido a T50635 proteína hipotética DKFZp762L0311.1 [H.sapiens]
- Contig37015_RC
- -0.605780 ESTs, ligeramente parecidos a UAS3_PROTEÍNA HUMANA UBASH3A PROTEIN [H.sapiens]
- AL157480
- -0.604362 SH3BP1 Proteína 1 de enlace con dominio SH3
- NM_005325
- -0.604310 H1F1 Familia de histona H1, miembro 1
- NM_001446
- -0.604061 FABP7 Proteína 7 de enlace con el ácido graso, cerebro
- Contig263_RC
- 0.603318 ADNc de Homo sapiens cDNA: fis FLJ23000, clon LNG00194
- Contig8347_RC
- -0.603311 ESTs
- NM_002988
- -0.603279 SCYA18 Pequeña subfamilia A inducible por citoquina (Cys- Cys), miembro 18, pulmonar y regulada por activación
- AF111849
- 0.603157 HELO1 Enzima 2 de alargamiento de ácido graso poliinsaturado de cadena larga homólogo de levadura
- NM_014700
- 0.603042 KIAA0665 Producto del gen KIAA0665
- NM_001814
- -0.602988 CTSC Catepsia C
- AF116682
- -0.602350 PRO2013 Proteína hipotética PRO2013
- AB037836
- 0.602024 KIAA1415 Proteína KIAA1415
- AB002301
- 0.602005 KIAA0303 Proteína KIAA0303
- NM_002996
- -0.601841 SCYD1 Pequeña subfamilia D (Cys-X3-Cys), miembro 1, (fractalina, neurotactina)
- NM_018410
- -0.601765 KFZp762E1312 Proteína hipotética DKFZp762E1312
- Contig49581_RC
- -0.601571 KIAA1350 Proteína KIAA1350
- NM_003088
- -0.601458 SNL Gaseado (afín a Drosophila) (tipo de homólogo de fascina de erizo de mar)
- Contig47045_RC
- 0.601088 ESTs, ligeramente parecido a DP1 PROTEÍNA HUMANA 1 DE POLIPOSIS DE LOCUS [H.sapiens]
- NM_001806
- -0.600954 CEBPG Proteína (C/EBP) de enlace con CCAAT/potenciador, gamma
- NM_004374
- 0.600766 COX6C Subunidad Vlc de citocromo c oxidasa
- Contig52641_RC
- 0.600132 MOUSE ESTs, ligeramente parecidos a AUTOANTIGENO B CENTRÓMERO CENB PRINCIPAL [M.musculus]
- NM_000100
- -0.600127 CSTB Cistatina B (estefina B)
- NM_002250
- -0.600004 KCNN4 Intermediario de potasio/pequeño canal de conductancia activado por calcio, subfamilia N, miembro 4
- AB033035
- -0.599423 KIAA1209 Proteína KIAA1209
- Contig53968_RC
- 0.599077 ESTs
- NM_002300
- -0.598246 LDHB Lactato dehidrogenasa B
- NM_000507
- 0.598110 FBP1 Fructosa-1,6-bisfosfatasa 1
- NM_002053
- -0.597756 GBP1 Proteína 1 de enlace con guanilato, inducible por interferón, 67kD
- AB007883
- 0.597043 KIAA0423 Proteína KIAA0423
41
- NM_004900
- -0.597010 DJ742C19.2 Forbolina (parecida a la proteína editora de ARNm apolipoproteína B)
- NM_004480
- 0.596321 FUT8 Fucosiltransferasa 8 (alfa (1,6) fucosiltransferasa)
- Contig35896_RC
- 0.596281 ESTs
- NM_020974
- 0.595173 CEGP1 Proteína CEGP1
- NM_000662
- 0.595114 NAT1 N-acetiltransferasa 1 (arilamina N-acetiltransferasa)
- NMB_006113
- 0.595017 VAV3 oncógeno vav 3
- NM_014865
- -0.594928 KIAA0159 Proteína 1 asociada a SMC de condensación de cromosoma
- Contig55538_RC
- -0.594573 BA395L14.2 Proteína hipotética bA395L14.2
- NM_016056
- 0.594084 LOC51643 Proteina CGI-119
- NM_003579
- -0.594063 RAD54L RAD54 (afín a S.cerevisiae)
- NM_014214
- -0.593860 IMPA2 Inositol(mio)-1 (o 4)- monofosfatasa 2
- U79293
- 0.593793 Secuencia de ARNm del clon humano 23948
- NM_005557
- -0.593746 KRT16 queratina 16 (queratoderma palmoplantar focla no epidermolítico)
- NM_002444
- -0.592405 MSN Moesina
- NM_003681
- -0.592155 PDXK piridoxal (pyridoxina, vitamina B6) quinasa
- NM_006372
- -0.591711 NSAP1 Proteína 1 asociada a NS1
- NM_005218
- -0.591192 DEFB1 Defensina, beta 1
- NM_004642
- -0.591081 DOC1 Borrado en cáncer oral (ratón, homólogo) 1
- AL133074
- 0.590359 ADNC de Homo sapiens; fis FLJ22139, clon HEP20959
- M73547
- 0.590317 D5S346 Segmento de ADN, sonda de una sola copia LNS- CAI/LNS-CAII (borrada en poliposis)
- Contig65663
- 0.590312 ESTs
- AL035297
- -0.589728 Gen de H.sapiens de PAC 747L4
- Contig35629_RC
- 0.589383 ESTs
- NM_019027
- 0.588862 FLJ20273 Proteína hipotética
- NM_012425
- -0.588804 Proteína 1 del supresor del Ras de Homo sapiens (RSU1), ARNm
- NM_020179
- -0.588326 FN5 Proteína FN5
- AF090913
- -0.587275 TMSB10 Timosina, beta 10
- NM_004176
- 0.587190 SREBF1 Factor 1 de transcripción de enlace con el elemento regulatorio de esterol
- NM_016121
- 0.586941 LOC51133 Antígeno NY-REN-45
- NM_014773
- 0.586871 KIAA0141 Producto del gen KIAA0141
- NM_019000
- 0.586677 FLJ20152 Proteína hipotética
- NM_016243
- 0.585942 LOC51706 Citocromo b5 reductasa 1 (B5R.1)
- NM_014274
- -0.585815 ABP/ZF Proteína de enlace Alu con dominio de dedo de cinc
- NM_018379
- 0.585497 FLJ11280 Proteína hipotética FLJ11280
- AL157431
- -0.585077 DKFZp762A227 Proteína hipotética DKFZp762A227
- D38521
- -0.584684 KIAA0077 Proteína KIAA0077
- NM_002570
- 0.584272 PACE4 Sistema 4 apareado de exfoliado de aminoácido básico
42
- NM_001809
- -0.584252 CENPA Proteína centrómera A (17kD)
- NM_003318
- -0.583556 TTK Proteína quinasa TTK
- NM_014325
- -0.583555 CORO1C Coronina, proteína de enlace con actina, 1C
- NM_005667
- 0.583376 ZFP103 Proteína homóloga de cinc homóloga de Zfp103 en ratón
- NM_004354
- 0.582420 CCNG2 Ciclina G2
- NM_003670
- 0.582235 BHLHB2 Contenido de helix básico-bucle-dominio de helix domain, class B, 2
- NM_001673
- -0.581902 ASNS Asparagina sintetasa
- NM_001333
- -0.581402 CTSL2 Catepsina L2
- Contig54295_RC
- 0.581256 ESTs
- Contig33998_RC
- 0.581018 ESTs
- NM_006002
- -0.580592 UCHL3 Ubiquitina carboiyl-terminal esterasa L3 (ubiquitin tiolesterasa)
- NM_015392
- 0.580568 NPDC1 Proliferación, dfferenciación y control neural, 1
- NM_004866
- 0.580138 SCAMP1 Proteína 1 de la membrana portadora secretora 1
- Contig50391_RC
- 0.580071 ESTs
- NM_000592
- 0.579965 C4B Componente de complemento 4B
- Contig50802_RC
- 0.579881 ESTs
- Contig41635_RC
- -0.579468 ESTs
- NM_006845
- -0.579339 KNSL6 Tipo 6 de quinesina (quinesina asociada a centrómero mitótico)
- NM_003720
- -0.579296 DSCR2 Gen 2 de la región crítica del síndrome de Down
- NM_000060
- 0.578967 BTD Biotinidasa
- AL050388
- -0.578736 ARNm de Homo sapiens; ADNc DKFZp564M2422 (de clon DKFZp564M2422); cds parcial
- NM_003772
- -0.578395 JRKL Homólogo afín a jerky (ratón)
- NM_014398
- -0.578388 TSC403 Parecido a glicoproteína de membrana asociada a lisosoma
- NM_001280
- 0.578213 CIRBP Proteína de enlace con ARN inducible por frío
- NM_001395
- -0.577369 DUSP9 Fosfatasa 9 de especificidad dual
- NM_016229
- -0.576290 LOC51700 Citocromo b5 reductasa b5R.2
- NM_006096
- -0.575615 NDRG1 N-myc regulado corriente abajo
- NM_001552
- 0.575438 IGFBP4 Proteína 4 de enlace con el factor de crecimiento afín a insulina
- NM_005558
- -0.574818 LAD1 Ladinina 1
- Contig54534_RC
- 0.574784 Pseudogen transportador de glucosa humana
- Contig1239_RC
- 0.573822 Cromosoma humano 16 BAC clon CIT987SK-A-362G6
- Contig57173_RC
- 0.573807 ARNm de Homo sapiens para proteína KIAA1737, cds parcial
- NM_004414
- -0.573538 DSCR1 Gen1 de la región crítica del síndrome de Down
- NM_021103
- -0.572722 TMSB10 Timosina, beta 10
- NM_002350
- -0.571917 LYN Homólogo del oncógeno relacionado con el sarcoma viral Yamaguchi v-sí-1
- Contig51235_RC
- 0.571049 ADNc de Homo sapiens: fis FLJ23388, clon HEP17008
- NM_013384
- 0.570987 TMSG1 Supresor de metástasis tumoral
- NM_014399
- 0.570936 NET-6 Proteína tetraspan NET-6
- Contig26022_RC
- -0.570851 ESTs
43
- AB023152
- 0.570561 KIAA0935 Proteína KIAA0935
- NM_021077
- -0.569944 NMB Neuromedina B
- NM_003498
- -0.569129 SNN Estannina
- U17077
- -0.568979 BENE Proteína BENE
- D86985
- 0.567698 KIAA0232 Producto del gen KIAA0232
- NM_006357
- -0.567513 UBE2E3 Enzima E2E 3 conjugadora con ubiquitina (homólogo de levadura UBC4/5)
- AL049397
- -0.567434 ARNm de Homo sapiens; ADNc DKFZp586C1019 (de clon DKFZp586C1019)
- Contig64502
- 0.567433 ESTs, ligeramente parecidos a [M.musculus] desconocido
- Contig56298_RC
- -0.566892 FLJ13154 Proteína hipotética FLJ13154
- Contig46056_RC
- 0.566634 ESTs, ligeramente parecidos a YZ28 PROTEÍNA HIPOTÉTICA HUMANA ZAP128 [H.sapiens]
- AF007153
- 0.566044 Clon de Homo sapiens 23736 de secuencia de ARNm
- Contig1778_RC
- -0.565789 ESTs
- NM_017702
- -0.565789 FLJ20186 Proteína hipotética FLJ20186
- Contig39226_RC
- 0.565761 Fis FLJ12187 de ADNc de Homo sapiens, clon MAMMA1000831
- NM_000168
- 0.564879 GLI3 Miembro GL13 de familia GLI-Kruppel (Síndrome de Greig)
- Contig57609_RC
- 0.564751 ESTs, ligeramente parecido a SUBUNIDAD TFIID 135 KDA T2D3_DE FACTOR de INITIACIÓN DE TRANSCRIPCiÓN HUMANA [H.sapiens]
- U45975
- 0.564602 PIB5PA Fosfatidilinositol (4,5) bisfosfato 5-fosfatasa, A
- AF038182
- 0.564596 Clon 23860 de Homo sapiens secuencia de ARNm
- Contig5348_RC
- 0.564480 ESTs, ligeramente parecidos al factor de transcripción 1607338A BTF3a [H.sapiens]
- NM_001321
- -0.564459 CSRP2 Proteína 2 rica en cisteína y glicina
- Contig25362_RC
- -0.563801 ESTs
- NM_001609
- 0.563782 ACADSB Acil-Coenzima A dehidrogenasa, cadena ramificada corta
- Contig40146
- 0.563731 ADNc de Homo sapiens wi84e12.x1 NCl_CGAP_Kid12 clon IMAGE: 2400046 3’ parecido a PROTEÍNA RAS DE TIPO RAS SW:RASD_DICDI P03967; secuencia de ARNm
- NMB_016002
- 0.563403 LOC51097 Proteína CGI-49
- Contig34303_RC
- 0.563157 ADNc de Homo sapiens; fis FLJ21517, clon COL05829
- Contig55883_RC
- 0.563141 ESTs
- NM_017961
- 0.562479 FLJ20813 Proteína hipotética FLJ20813
- M21551
- -0.562340 NMB Neuromedina B
- Contig3940_RC
- -0.561956 YWHAH Proteína de activación de tirosina 3- Monooxigena-sa/triptofano 5monooxigenasa, polipéptido eta
- AB033111
- -0.561746 KIAA1285 Proteína KIAA1285
- Contig43410_RC
- 0.561678 ESTs
- Contig42006_RC
- -0.561677 ESTs
- Contig57272_RC
- 0.561228 ESTs
- G26403
- -0.561068 YWHAH Proteína de activación de tirosina 3-monooxigenasa/triptofano 5monooxygenasa, polipéptido eta
44
- NM_005915
- -0.560813 MCM6 Deficiente en mantenimiento de minicromosoma (mis5, S. pombe) 6
- NM_003875
- -0.560668 GMPS Monofosfato sintetasa de guanina
- AK000142
- 0.559651 AK000142 ADNc de Homo sapiens fis FLJ20135 fis, clon COL06818.
- NM_002709
- -0.559621 PPP1CB Fosfatasa proteínica 1, subunidad catalítica, isoforma beta
- NM_001276
- -0.558868 CHI3L1 Tipo 1 de quitinasa 3 (glicoproteína de cartílago-39)
- NM_002857
- 0.558862 PXF Proteína farnesilatada de peroxisomal
- Contig33815_RC
- -0.558741 FLJ22833 Proteína hipotética FLJ22833
- NM_003740
- -0.558491 KCNK5 Canal de potasio, subfamilia K, miembro 5 (TASK-2)
- Contig53646_RC
- 0.558455 ESTs
- NM_005538
- -0.558350 INHBC Inhibina, beta C
- NM_002111
- 0.557860 HD Huntingtina (enfermedad de Huntington)
- NM_003683
- -0.557807 D21S2056E Segmento de ADN en cromosoma 21 (único) secuencia expresada 2056
- NM_003035
- -0.557380 SIL TAL1 (SCL) interrupting locus
- Contig4388_RC
- -0.557216 Homo sapiens, parecida a proteína integral 3 de membrana, clon MGC:3011, ARNm, cds completo
- Contig38288_RC
- -0.556426 ESTs, ligeramente parecido a proteína ISHUSS disulfuro-isomerasa [H.sapiens]
- NM_015417
- 0.556184 DKFZP434I114 Proteína DKFZP434I114
- NM_015507
- -0.556138 EGFL6 Dominio afín a EGF, múltiple 6
- AF279865
- 0.555951 KIF13B Miembro de la familia de la quinesia 13B
- Contig31288_RC
- -0.555754 ESTs
- NM_002966
- -0.555620 S100A10 Proteína A10 de enlace con calcio S100 (ligando de anexina II, calpactina I, polipéptido ligero (p11))
- NM_017585
- -0.555476 SLC2A6 Familia 2 del portador de soluto 2 (transportador de glucosa facilitado), miembro 6
- NM_013296
- -0.555367 HSU54999 Proteina LGN
- NM_000224
- 0.554838 KRT18 Queratina 18
- Contig49270_RC
- -0.554593 KIAA1553 Proteina KIAA1553
- NM_004848
- -0.554538 ICB-1 Gen inducido por mebrana basal
- NM_007275
- 0.554278 FUS1 Candidato de cáncer de pulmón
- NM_007044
- -0.553550 KATNA1 Katanina p60 (contenedora de ATPasa) subunidad A 1
- Contig1829
- 0.553317 ESTs
- AF272357
- 0.553286 NPDC1 Proliferación, dfferenciación y control neural, 1
- Contig57584_RC
- -0.553080 Homo sapiens, parecido a agrupamiento rico en, gen C8, clon MGC:2577, ARNm, cds completo
- NM_003039
- -0.552747 SLC2A5 Familia 2 del portador de soluto 2 (transportador de glucosa facilitado), miembro 5
- NM_014216
- 0.552321 ITPK1 inositol 1,3,4-trifosfato 5/6 quinasa
- NM_007027
- -0.552064 TOPBP1 Proteína de enlace con topoisomerasa (ADN) II
- AF118224
- -0.551916 ST14 Supresión de tumorigenicidad 14 (carcinoma de colon, matriptasa, epitina)
- X75315
- -0.551853 HSRNASEB Seb4D
- NM_012101
- -0.551824 ATDC Proteína asociada al grupo D de ataxia-telangiectasia
45
- AL157482
- -0.551329 FLJ23399 Proteína hipotética FLJ23399
- NM_012474
- -0.551150 UMPK Uridina monofosfato quinasa
- Contig57081_RC
- 0.551103 ESTs
- NM_006941
- -0.551069 SOX10 SRY (región Y de determinación de sexo)-caja 10
- NM_004694
- 0.550932 SLC16A6 Familia 2 del portador de soluto 16 (transportadores de ácido monocarboxílico), miembro 6
- Contig9541_RC
- 0.550680 ESTs
- Contig20617_RC
- 0.550546 ESTs
- NM_004252
- 0.550365 SLC9A3R1 Familia 9 del portadointercambiador de sodio/hidrógeno), isoforma 3 factor regulador 1
- NM_015641
- -0.550200 KFZP586B2022 Testina
- NM_004336
- -0.550164 BUB1 Injerto desinhibido por benzimidazoles 1 (homólogo de levadura)
- Contig39960_RC
- -0.549951 FLJ21079 Proteína hipotética FLJ21079
- NM_020686
- 0.549659 NPD009 Proteína NPD009
- NM_002633
- -0.549647 PGM1 Fosfoglucomutasa 1
- Contig30480_RC
- 0.548932 ESTs
- NM_003479
- 0.548896 PTP4A2 proteína tirosina fosfatasa typo IVA, miembro 2
- NM_001679
- -0.548768 ATP1 B3 ATPasa, Na+/K+ transportador, polipéptido beta 3
- NM_001124
- -0.548601 ADM Adrenomedulina
- NM_001216
- -0.548375 CA9 Anhidrasa carbónica IX
- U58033
- -0.548354 MTMR2 Proteína 2 relacionada con miotubularina
- NM_018389
- -0.547875 FLJ11320 Proteína hipotética FLJ11320
- AF176012
- 0.547867 JDP1 Dominio J qe contiene proteína 1
- Contig66705_RC
- -0.546926 ST5 Supresión de tumorigenicidad 5
- NMB_018194
- 0.546878 FLJ10724 Proteína hipotética FLJ10724
- NM_006851
- -0.546823 RTVP1 Proteína relacionada con la patogénesis de glioma
- Contig53870_RC
- 0.546756 ESTs
- NM_002482
- -0.546012 NASP Proteína del esperma autoanígeno nuclear (de enlace con histona)
- NM_002292
- 0.545949 LAMB2 Laminina, beta 2 (laminina S)
- NMB_014696
- -0.545758 KIAA0514 Producto del gen KlAA0514
- Contig49855
- 0.545517 ESTs
- AL117666
- 0.545203 DKFZP586 DKFZP58601624 Proteína O1624
- NM_004701
- -0.545185 CCNB2 Ciclina B2
- NM_007050
- 0.544890 PTPRT Proteína tirosina fosfatasa, tipo receptor, T
- NMB_000414
- 0.544778 HSD17B4 Hidroxisteroide (17-beta) dehidrogenasa 4
- Contig52398_RC
- -0.544775 ADNc de Homo sapiens: fis FLJ21950, clon HEP04949
- AB007916
- 0.544496 KlAA0447 Producto del gen KIAA0447
- Contig66219_RC
- 0.544467 FLJ22402 Proteína hipotética FLJ22402
- D87453
- 0.544145 KlAA0264 Proteína KIAA0264
- NM_015515
- -0.543929 DKFZP434G032 Proteína DKFZP434G032
- NM_001530
- -0.543898 HIF1A Factor 1 inducible por hipoxia, subunidad alfa (factor de transcripción helix básico-bucle-helix)
- NM_004109
- -0.543893 FDX1 Ferredoxina 1
- NM_000381
- -0.543871 MID1 Midlina 1 (síndrome de Opitz/BBB)
- Contig43983_RC
- 0.543523 CS2 Calsintenina-2
46
- AL137761
- 0.543371 ARNm de Homo sapiens; ADNc DKFZp586L2424 (del clon DKFZp586L2424)
- NM_005764
- -0.543175 DD96 Proteína epitelial aumentada en carcinoma, proteína 17 asociada a membrana
- Contig1838_RC
- 0.542996 ADNc de Homo sapiens: fis FLJ22722, clon HSI14444
- NM_006670
- 0.542932 5T4 Oncofetal trofoblasto glicoproteina
- Contig28552_RC
- -0.542617 ARN de Homo sapiens; ADNc DKFZp434C0931 (del clon DKFZp434C0931); cds parcial
- Contig14284_RC
- 0.542224 ESTs
- NM_006290
- -0.542115 TNFAIP3 Factor de necrosis tumoral, proteína 3 inducida por alfa
- AL050372
- 0.541463 ARNm de Homo sapiens; ADNc DKFZp434A091 (del clon DKFZp434A091); cds parcial
- NM_014181
- -0.541095 HSPC159 Proteína HSPC159
- Contig37141_RC
- 0.540990 ADNc de Homo sapiens: fis FLJ23582, clon LNG13759
- NM_000947
- -0.540621 PRIM2A Primasa, polipéptido 2A (58kD)
- NMB_002136
- 0.540572 HNRPA1 Ribonucleoproteína A1 nuclear heterogénea
- NM_004494
- -0.540543 HDGF Factor del crecimiento derivado de hepatoma (proteína de tipo 1 del grupo de alta movilidad)
- Contig38983_RC
- 0.540526 ESTs
- Contig27882_RC
- -0.540506 ESTs
- Z11887
- -0.540020 MMP7 Metaloproteinasa 7 de matriz (matrilisina, uterina)
- NM_014575
- -0.539725 SCHIP-1 Proteína 1 interactuante con schwannomina
- Contig38170_RC
- 0.539708 ESTs
- Contig44064_RC
- 0.539403 ESTs
- U68385
- 0.539395 MEIS3 Homólogo 3 de Meis (ratón)
- Contig51967_RC
- 0.538952 ESTs
- Contig37562_RC
- 0.538657 ESTs, ligeramente parecidos a la proteína relacionada con transformación [H.sapiens]
- Contig40500_RC
- 0.538582 ESTs, ligeramente parecidos a producto proteínico sin nombre [H.sapiens]
- Contig1129_RC
- 0.538339 ESTs
- NM_002184
- 0.538185 IL6ST Transductor de señal de interleuquina 6 (gp130, receptor de oncostatina M)
- AL049381
- 0.538041 ADNc de Homo sapiens fis FLJ12900, clon NT2RP2004321
- NM_002189
- -0.537867 IL15RA Receptor de interleuquina 15, alfa
- NM_012110
- -0.537562 CHIC2 Dominio hidrófobo 2 rico en cisteína
- AB040881
- -0.537473 KIAA1448 Proteína KIAA1448
- NM_016577
- -0.537430 RAB6B RAB6B, miembro de la familia del oncógeno RAS
- NM_001745
- 0.536940 CAMLG Ligando modulador de calcio
- NM_005742
- -0.536738 P5 Proteína relacionada con proteína disulfuro isomerasa
- AB011132
- 0.536345 KIAA0560 Producto del gen KIAA0560
- Contig54898_RC
- 0.536094 PNN protein Pinina, asociada a desmosoma
- Contig45049_RC
- -0.536043 FUT4 Fucosiltransferasa 4 (alfa (1,3) fucosiltransferasa, específico de mieloide
47
- NM_006864
- -0.535924 LILRB3 Receptor afín a inmunoglobulina de leucocitos, subfamilia B (con dominios TM e ITIM), miembro 3
- Contig53242_RC
- -0.535909 ADNc de Homo sapiens fis FLJ11436, clon HEMBA1001213
- NM_005544
- 0.535712 IRS1 Sustrato 1 del receptor de insulina
- Contig47456_RC
- 0.535493 CACNA1D Canal de calcio, dependiente del voltaje, tipo L, subunidad alfa 1 D
- Contig42751_RC
- -0.535469 ESTs
- Contig29126_RC
- -0.535186 ESTs
- NM_012391
- 0.535067 PDEF Factor de transcripción de Ets específico del epitelio de la próstata
- NMB_012429
- 0.534974 SEC14L2 SEC14 tipo 2 de (S. cerevisiae)
- NMB_018171
- 0.534898 FLJ10659 Proteína hipotética FLJ10659
- Contig53047_RC
- -0.534773 TTYH1 Homólogo 1 de tweety (Drosophila)
- Contig54968_RC
- 0.534754 ADNc de Homo sapiens fis FLJ13558, clon PLACE1007743
- Contig2099_RC
- -0.534694 KIAA1691 Proteína KIAA9691
- NM_005264
- 0.534057 GFRA1 Alfa 1 de receptor de familia GDNF
- NM_014036
- -0.533638 SBBI42 Precursor de proteína de membrana de tipo BCM
- NMB_018101
- -0.533473 FLJ10468 Proteína hipotética FLJ10468
- Contig56765_RC
- 0.533442 K02E10.2 ESTs, moderadamente parecidos a [C.elegans]
- AB006746
- -0.533400 PLSCR1 Fosfolípido escramblasa 1
- NMB_001089
- 0.533350 ABCA3 Casete de enlace con ATP, subfamilia A (ABC1), miembro 3
- NMB_018188
- -0.533132 FLJ10709 Proteína hipotética FLJ10709
- X94232
- -0.532925 MAPRE2 Proteína asociada a microtúbulo, familia RP/EB, miembro 2
- AF234532
- -0.532910 MYO10 Miosina X
- Contig292_RC
- 0.532853 FLJ22386 Proteína hipotética FLJ22386
- NMB_000101
- -0.532767 CYBA Citocromo b-245, polipéptido alfa
- Contig47814_RC
- -0.532656 HHGP Proteína HHGP
- NM_014320
- -0.532430 SOUL Proteína de enlace con heme putativo
- NM_020347
- 0.531976 LZTFL1 Tipo 1 de factor de transcripción de cremallera de Leucina
- NM_004323
- 0.531936 BAG1 Atanógeno asociado a BCL2
- Contig50850_RC
- -0.531914 ESTs
- Contig11648_RC
- 0.531704 ESTs
- NMB_018131
- -0.531559 FLJ10540 Proteína hipotética FLJ10540
- NM_004688
- -0.531329 NMI Interactor N-myc (y STAT)
- NM_014870
- 0.531101 KIAA0478 Producto del gen KIAA0478
- Contig31424_RC
- 0.530720 ESTs
- NM_000874
- -0.530545 IFNAR2 Receptor 2 de interferón (alfa, beta y omega)
- Contig50588_RC
- 0.530145 ESTs
- NMB_016463
- 0.529998 HSPC195 Proteína hipotética
- NMB_013324
- 0.529966 CISH Proteína contenedora de SH2 inducible por citoquina
- NM_006705
- 0.529840 GADD45G Paro de crecimiento e inducible a daño de ADN, gamma
- Contig38901_RC
- -0.529747 ESTs
- NM_004184
- -0.529635 WARS Triptofanil-ARNt sintetasa
- NM_015955
- -0.529538 LOC51072 Proteína CGI-27
- AF151810
- 0.529416 CGI-52 Parecido a proteína 2 de transferencia de
48
- fosfatidilcolina
- NMB_002164
- -0.529117 INDO Indoleamina-pirrol 2,3 dioxigenasa
- NM_004267
- -0.528679 CHST2 Carbohidrato (condroitina 6/queratano) sulfotransferasa 2
- Contig32185_RC
- -0.528529 ADNc de Homo sapiens fis FJ13997, clon Y79AA1002220
- NM_004154
- -0.528343 P2RY6 Receptor pirimidinérgico P2Y, acoplado a proteiína G, 6
- NM_005235
- 0.528294 ERBB4 Tipo 4 de homólogo de oncógeno viral de leucemia eritoblástica aviar v-erb-a
- Contig40208_RC
- -0.528062 LOC56938 Factor de transcripción BMAL2
- NMB_013262
- 0.527297 MIR Proteína interactuante con la cadena ligera reguladora de miosina
- NM_003034
- -0.527148 SIAT8A Sialiltransferasa 8 (alfa-N-acetilneuraminato: alfa-2,8- sialitransferasa, sintasa GD3) A
- NM_004556
- -0.527146 NFKBIE Factor nuclear de potenciador del gen polipéptido ligero kappa en inhibidor de células B, epsilon
- NM_002046
- -0.527051 GAPD Gliceraldehído-3-fosfato dehidrogenasa
- NMB_001905
- -0.526986 CTPS Sintasa CTP
- Contig42402_RC
- 0.526852 ESTs
- NM_014272
- -0.526283 ADAMTS7 Tipo A de disintegrina y metaloproteasa (afín a reprolisina) con motivo de tipo 1 de trombospondina, 7
- AF076612
- 0.526205 CHRD Cordina
- Contig57725_RC
- -0.526122 ARNm de Homo sapiens para factor de transcripción TCF-3 de caja HMG, cds completo
- Contig42041_RC
- -0.525877 ESTs
- Contig44656_RC
- -0.525868 ESTs, muy parecido al precursor del receptor de S02392 alfa-2-macroglobulina [H.sapiens]
- NMB_018004
- -0.525610 FLJ10134 Proteína hipotética FLJ10134
- Contig56434_RC
- 0.525510 ADNc de Homo sapiens fis FLJ13603, clon PLACE1010270
- D25328
- -0.525504 PFKP Fosfofructoquinasa, plaqueta
- Contig55950_RC
- -0.525358 FLJ22329 Proteína hipotética FLJ22329
- NM_002648
- -0.525211 PIM1 Oncógeno pim-1
- AL157505
- 0.525186 ARNm de Homo sapiens; ADNc DKFZp586P1124 (del clon DKFZp586P1124)
- AF061034
- -0.525185 FIP2 ARNm de Homo sapiens alternativamente convertido a FIP2, cds completo
- NMB_014721
- -0.525102 KIAA0680 Producto del gen KIAA0680
- NMB_001634
- -0.525030 AMD1 S-adenosilmetionina decarboxilasa 1
- NM_006304
- -0.524911 DSS1 Borrado en región 1 de mano hendida-pie hendido
- Contig37778_RC
- 0.524667 ESTs, muy parecidos a HLHUSB MHC clase II antígeno de histocompatibilidad precursor de cadena HLA-DP alfa-1 [H.sapiens]
- NM_003099
- 0.524339 SNX1 Nexina 1 de clasificación
- AL079298
- 0.523774 MCCC2 Metilcrotonoil-Coenzima A carboxilasa 2 (beta)
- NM_019013
- -0.523663 FLJ10156 Proteína hipotética
- NM_000397
- -0.523293 CYBB Citocromo b-245, polipéptido beta (enfermedad granulomatosa crónica)
49
- NM_014811
- 0.523132 KIAA0649 Producto del gen KIAA0649
- Contig20600_RC
- 0.523072 ESTs
- NMB_005190
- -0.522710 CCNC Ciclina C
- AL161960
- -0.522574 FLJ21324 Proteína hipotética FLJ21324
- AL117502
- 0.522280 ARNm de Homo sapiens; ADNc DKFZp434D0935 (del clon DKFZp434D0935)
- AF131753
- -0.522245 Secuencia de ARNm del clon 24859 de Homo sapiens
- NM_000320
- 0.521974 QDPR Dihidropteridina reductasa quinoide
- NMB_002115
- -0.521870 HK3 Hexoquinasa 3 (célula blanca)
- NM_006460
- 0.521696 HIS1 Inducible por HMBA
- NMB_018683
- -0.521679 ZNF313 Proteína de dedo de cinc 313
- NM_004305
- -0.521539 BIN1 Integrador puente 1
- NM_006770
- -0.521538 MARCO Receptor macrófago con estructura colágena
- NM_001166
- -0.521530 BIRC2 Contendedor de reptición 2 del baculoviral IAP
- D42047
- 0.521522 KIAA0089 Proteína KIAA0089
- NMB_016235
- -0.521298 GPRC5B Receptor acoplado a la proteína G, familia C, grupo 5, miembro B
- NM_004504
- -0.521189 HRB Proteína de enlace con VIH-1 Rev
- NM_002727
- -0.521146 PRG1 Proteoglicano 1, gránulo secretor
- AB029031
- -0.520761 KIAA1108 Proteína KIAA1108
- NM_005556
- -0.520692 KRT7 Queratina 7
- NMB_018031
- 0.520600 WDR6 Dominio 6 de repetición de WD
- AL117523
- -0.520579 KIAA1053 Proteína KIAA1053
- NMB_004515
- -0.520363 ILF2 Factor 2 de enlace con el potenciador de interleuquina, 45kD
- NM_004708
- -0.519935 PDCD5 Muerte programada de célula 5
- NM_005935
- 0.519765 MLLT2 Leucemia mieloide/linfoide o de trazado mixto (homólogo de tritórax (Drosophila); trasladado a 2
- Contig49289_RC
- -0.519546 ARNm de Homo sapiens; ADNc DKFZp586J1119 (del clon DKFZp586J1119); cds completo
- NMB_000211
- -0.519342 ITGB2 Integrina, beta 2 (antígeno CD18 (p95), antígeno 1 asociado a la función de linfocito; antígeno macrófago 1 (mac-1) subunidad beta)
- AL079276
- 0.519207 LOC58495 Proteína putativa de dedo de cinc procedente de EUROIMAGE 566589
- Contig57825_RC
- 0.519041 ESTs
- NM_002466
- -0.518911 MYBL2 Tipo 2 de homólogo de oncógeno viral de leucemia eritoblástica aviar v-erb-a
- NMB_016072
- -0.518802 LOC51026 Proteína CGI-141
- AB007950
- -0.518699 KIAA0481 Producto del gen KIAA0481
- NMB_001550
- -0.518549 IFRD1 Regulador de desarrollo 1 relacionado con el interferón
- AF155120
- -0.518221 UBE2V1 Variante 1 de la enzima E que conjuga con ubiquitina
- Contig49849_RC
- 0.517983 ESTs, ligeramente parecidos a laproteína AF188706 1 g20 [H.sapiens]
- NMB_016625
- -0.517936 LOC51319 Proteína hipotética
- NM_004049
- -0.517862 BCL2A1 Proteína A1 relacionada con BCL2
- Contig50719_RC
- 0.517740 ESTs
- D80010
- -0.517620 LPIN1 Lipina 1
50
- NM_000299
- -0.517405 PKP1 Placofilina 1 (síndrome de displasia ectodérmica/fragilidad epidérmica)
- AL049365
- 0.517080 FTL Ferritina, polipéptido ligero
- Contig65227
- 0.517003 ESTs
- NM_004865
- -0.516808 TBPL1 Tipo 1 de TBP
- Contig54813_RC
- 0.516246 FLJ13962 Proteína hipotética FLJ13962
- NM_003494
- -0.516221 DYSF Disferlina, distrofia de miopatía muscular de miembros 2B (autosómico recesivo)
- NM_004431
- -0.516212 EPHA2 EphA2
- AL117600
- -0.516067 DKFZP564 J0863 Proteína DKFZP564J0863
- AL080209
- -0.516037 DKFZP586 F2423 Proteína hipotética DKFZp586F2423
- NM_000135
- -0.515613 FANCA Anemia de Fanconi, grupo de complementación A
- NM_000050
- -0.515494 ASS Argininosuccinato sintetasa
- NMB_001830
- -0.515439 CLCN4 Canal de cloruro 4
- NMB_018234
- -0.515365 FLJ10829 Proteína hipotética FLJ10829
- Contig53307_RC
- 0.515328 ESTs, ligeramente parecidos a la proteína KIAA1437 [H.sapiens]
- AL117617
- -0.515141 ARNm de Homo sapiens; ADNc DKFZp564H0764 (del clon DKFZp564H0764)
- NM_002906
- -0.515098 RDX Radixina
- NMB_003360
- -0.514427 UGT8 UDP glicosiltransferasa 8 (UDP-galactosa ceramida galactosiltransferasa)
- NM_018478
- 0.514332 HSMNP1 Proteína del hipotálamo no caracterizada HSMNP1
- M90657
- -0.513908 TM4SF1 Miembro 1 de la superfamilia de la transmembrana 4
- NM_014967
- 0.513793 KIAA1018 Proteína KIAA1018
- Contig1462_RC
- 0.513604 C11ORF15 Marco de lectura abierta 15 del cromosoma 11
- ontig37287_RC
- -0.513324 ESTs
- NM_000355
- -0.513225 TCN2 Transcobalamina II; anemia macrocítica anemia
- AB037756
- 0.512914 KIAA1335 hypothetical protein KIAA1335
- Contig842_RC
- -0.512880 ESTs
- NMB_018186
- -0.512878 FLJ10706 Proteína hipotética FLJ10706
- NM_014668
- 0.512746 KIAA0575 Producto del gen KIAA0575
- NM_003226
- 0.512611 TFF3 Factor de trébol 3 (intestinal)
- Contig56457_RC
- -0.512548 TMEFF1 Proteína de transmembrana con afín a EGF y dos dominios 1 afines a la folistatina
- AL050367
- -0.511999 ARNm de Homo sapiens; ADNc DKFZp564A026 (del clon DKFZp564A026)
- NM_014791
- -0.511963 KIAA0175 Producto del gen KIAA0175
- Contig36312_RC
- 0.511794 ESTs
- NM_004811
- -0.511447 LPXN Leupaxina
- Contig67182_RC
- -0.511416 ESTs, muy parecidos al precursor del antígeno epitelial de tipo V [H.sapiens]
- Contig52723_RC
- -0.511134 ESTs
- Contigl 7105_RC
- -0.511072 ARNm de Homo sapiens para proteína citoplasmática putativa (ORF1-FL21)
- NMB_014449
- 0.511023 A Proteína "A"
51
- Contig52957_RC
- 0.510815 ESTs
- Contig49388_RC
- 0.510582 FLJ13322 Proteína hipotética FLJ13322
- NM_017786
- 0.510557 FLJ20366 Proteína hipotética FLJ20366
- AL157476
- 0.510478 ARNm de Homo sapiens; ADNc DKFZp761 C082 (del clon DKFZp761 C082)
- NMB_001919
- 0.510242 DCl Dodecenoil-Coenzima A delta isomerasa (3,2 transenoil-Coenzima A isomerasa)
- NM_000268
- -0.510165 NF2 Neurofibromina 2 (neuroma acústico bilateral)
- NMB_016210
- 0.510018 LOC51161 Proteína g20
- Contig45816_RC
- -0.509977 ESTs
- NM_003953
- -0.509969 MPZL1 Proteína de la mielina 1 de tipo cero
- NM_000057
- -0.509669 BLM Síndrome de Bloom
- NM_014452
- -0.509473 DR6 Receptor de muerte 6
- Contig45156_RC
- 0.509284 ESTs, moderadamente parecidos al dominio motor de KIF12 [M.musculus]
- NM_006943
- 0.509149 SOX22 SRY (región determinante del sexo Y)-caja 22
- NM_000594
- -0.509012 TNF Factor de necrosis tumoral (superfamilia TNF, miembro 2)
- AL137316
- -0.508353 KIAA1609 Proteína KIAA1609
- NM_000557
- -0.508325 GDF5 Factor de diferenciación del crecimiento 5 (proteína morfogénica 1 derivada de cartílago)
- NMB_018685
- -0.508307 ANLN Anilina (homólogo de Detritus de Drosophila), proteína de enlace con actina
- Contig53401_RC
- 0.508189 ESTs
- NM_014364
- -0.508170 GAPDS Gliceraldehído-3-fosfato dehidrogenasa, específica de los testículos
- Contig50297_RC
- 0.508137 ESTs, moderadamente parecidos a ALU8_ALU HUMANO SUBFAMILIA SX ENTRADA DE AVISO DE CONTAMINACIÓN DE SECUENCIA [H.sapiens]
- Contig51800
- 0.507891 ESTs, moderadamente parecidos a ALU6_ALU HUMANO SUBFAMILIA SP ENTRADA DE AVISO DE CONTAMINACIÓN DE SECUENCIA [H.sapiens]
- Contig49098_RC
- -0.507716 MGC4090 Proteína hipotética MGC4090
- NM_002985
- -0.507554 SCYA5 Citoquina inducible pequeña A5 (RANTES)
- AB007899
- 0.507439 KIAA0439 Proteína KIAA0439; homólogo de ubiquitina-proteína ligasa de levadura Rsp5
- AL110139
- 0.507145 ARNm de Homo sapiens; ADNc DKFZp56401763 (del clon DKFZp56401763)
- Contig51117_RC
- 0.507001 ESTs
- NMB_017660
- -0.506768 FLJ20085 Proteína hipotética FLJ20085
- NM_018000
- 0.506686 FLJ10116 Proteína hipotética FLJ10116
- NM_005555
- -0.506516 KRT6B Queratina 6B
- NM_005582
- -0.506462 LY64 Homólogo de antígeno de linfocito 64 (ratón homolog, radioprotector, 105kD
- Contig47405_RC
- 0.506202 ESTs
- NM_014808
- 0.506173 KIAA0793 Producto del gen KIAA0793
- NM_004938
- -0.506121 DAPK1 Proteína quinasa 1 asociada a la muerte
- NM_020659
- -0.505793 TTYH1 Homólogo 1 de tweety (Drosophila)
- NM_006227
- -0.505604 PLTP Proteína de transferencia de fosfolípidos
52
- NMB_014268
- -0.505412 MAPRE2 Proteína asociada a microtúbulo, fammilia RP/EB, miembro 2
- NM_004711
- 0.504849 SYNGR1 Sinaptogirina 1
- NMB_004418
- -0.504497 DUSP2 Fosfatasa 2 de especificidad dual
- NM_003508
- -0.504475 FZD9 Homólogo 9 (Drosophila) rizado
Tabla 3. 430 marcadores de genes que distinguen entre muestras tumorales relacionadas con BRCA1-1 y muestras tumorales esporádicas
- Bando de Genes Número de Acceso SEQ ID NO
- Bando de Genes Número de Acceso SEQ ID NO
- AB002301 SEQ ID NO 4
- NM_012391 SEQ ID NO 1406
- AB004857 SEQ ID NO 8
- NM_012428 SEQ ID NO 1412
- AB007458 SEQ ID NO 12
- NM_013233 SEQ ID NO 1418
- AB014534 SEQ ID NO 29
- NM_013253 SEQ ID NO 1422
- AB018305 SEQ ID NO 34
- NM_013262 SEQ ID NO 1425
- AB020677 SEQ ID NO 36
- NM_013372 SEQ ID NO 1434
- AB020689 SEQ ID NO 37
- NM_013378 SEQ ID NO 1435
- AB023151 SEQ ID NO 41
- NM_014096 SEQ ID NO 1450
- AB023163 SEQ ID NO 43
- NM_014242 SEQ ID NO 1464
- AB028986 SEQ ID NO 48
- NM_014314 SEQ ID NO 1472
- AB029025 SEQ ID NO 50
- NM_014398 SEQ ID NO 1486
- AB032966 SEQ ID NO 53
- NM_014402 SEQ ID NO 1488
- AB032988 SEQ ID NO 57
- NM_014476 SEQ ID NO 1496
- AB033049 SEQ ID NO 63
- NM_014521 SEQ ID NO 1499
- AB033055 SEQ ID NO 66
- NM_014585 SEQ ID NO 1504
- AB037742 SEQ ID NO 73
- NM_014597 SEQ ID NO 1506
- AB041269 SEQ ID NO 96
- NM_014642 SEQ ID NO 1510
- AF000974 SEQ ID NO 97
- NM_014679 SEQ ID NO 1517
- AF042838 SEQ ID NO 111
- NM_014680 SEQ ID NO 1518
- AF052155 SEQ ID NO 119
- NM_014700 SEQ ID NO 1520
- AF055084 SEQ ID NO 125
- NM_014723 SEQ ID NO 1523
- AF063725 SEQ ID NO 129
- NM_014770 SEQ ID NO 1530
- AF070536 SEQ ID NO 133
- NM_014785 SEQ ID NO 1534
- AF070617 SEQ ID NO 135
- NM_014817 SEQ ID NO 1539
- AF073299 SEQ ID NO 136
- NM_014840 SEQ ID NO 1541
- AF079529 SEQ ID NO 140
- NM_014878 SEQ ID NO 1546
- AF090353 SEQ ID NO 141
- NM_015493 SEQ ID NO 1564
- AF116238 SEQ ID NO 155
- NM_015523 SEQ ID NO 1568
- AF151810 SEQ ID NO 171
- NM_015544 SEQ ID NO 1570
- AF220492 SEQ ID NO 185
- NM_015623 SEQ ID NO 1572
- AJ224741 SEQ ID NO 196
- NM_015640 SEQ ID NO 1573
- AJ250475 SEQ ID NO 201
- NM_015721 SEQ ID NO 1576
- AJ270996 SEQ ID NO 202
- NM_015881 SEQ ID NO 1577
- AJ272057 SEQ ID NO 203
- NM_015937 SEQ ID NO 1582
- AK000174 SEQ ID NO 211
- NM_015964 SEQ ID NO 1586
- AK000617 SEQ ID NO 215
- NM_015984 SEQ ID NO 1587
53
- AK000959
- SEQ ID NO 222 NM_016000 SEQ ID NO 1591
- AK001438
- SEQ ID NO 229 NM_016018 SEQ ID NO 1593
- AK001838
- SEQ ID NO 233 NM_016066 SEQ ID NO 1601
- AK002107
- SEQ ID NO 238 NM_016073 SEQ ID NO 1603
- AK002197
- SEQ ID NO 239 NM_016081 SEQ ID NO 1604
- AL035297
- SEQ ID NO 241 NM_016140 SEQ ID NO 1611
- AL049346
- SEQ ID NO 243 NM_016223 SEQ ID NO 1622
- AL049370
- SEQ ID NO 245 NM_016267 SEQ ID NO 1629
- AL049667
- SEQ ID NO 249 NM_016307 SEQ ID NO 1633
- AL080222
- SEQ ID NO 276 NM_016364 SEQ ID NO 1639
- AL096737
- SEQ ID NO 279 NM_016373 SEQ ID NO 1640
- AL110163
- SEQ ID NO 282 NM_016459 SEQ ID NO 1646
- AL133057
- SEQ ID NO 300 NM_016471 SEQ ID NO 1648
- AL133096
- SEQ ID NO 302 NM_016548 SEQ ID NO 1654
- AL133572
- SEQ ID NO 305 NM_016620 SEQ ID NO 1662
- AL133619
- SEQ ID NO 307 NM_016820 SEQ ID NO 1674
- AL133623
- SEQ ID NO 309 NM_017423 SEQ ID NO 1678
- AL137347
- SEQ ID NO 320 NM_017709 SEQ ID NO 1698
- AL137381
- SEQ ID NO 322 NM_017732 SEQ ID NO 1700
- AL137461
- SEQ ID NO 325 NM_017734 SEQ ID NO 1702
- AL137540
- SEQ ID NO 328 NM_017750 SEQ ID NO 1704
- AL137555
- SEQ ID NO 329 NM_017763 SEQ ID NO 1706
- AL137638
- SEQ ID NO 332 NM_017782 SEQ ID NO 1710
- AL137639
- SEQ ID NO 333 NM_017816 SEQ ID NO 1714
- AL137663
- SEQ ID NO 334 NM_018043 SEQ ID NO 1730
- AL137761
- SEQ ID NO 339 NM_018072 SEQ ID NO 1734
- AL157431
- SEQ ID NO 340 NM_018093 SEQ ID NO 1738
- AL161960
- SEQ ID NO 351 NM_018103 SEQ ID NO 1742
- AL355708
- SEQ ID NO 353 NM_018171 SEQ ID NO 1751
- AL359053
- SEQ ID NO 354 NM_018187 SEQ ID NO 1755
- D26488
- SEQ ID NO 359 NM_018188 SEQ ID NO 1756
- D38521
- SEQ ID NO 361 NM_018222 SEQ ID NO 1761
- D50914
- SEQ ID NO 367 NM_018228 SEQ ID NO 1762
- D80001
- SEQ ID NO 369 NM_018373 SEQ ID NO 1777
- G26403
- SEQ ID NO 380 NM_018390 SEQ ID NO 1781
- K02276
- SEQ ID NO 383 NM_018422 SEQ ID NO 1784
- M21551
- SEQ ID NO 394 NM_018509 SEQ ID NO 1792
- M27749
- SEQ ID NO 397 NM_018584 SEQ ID NO 1796
- M28170
- SEQ ID NO 398 NM_018653 SEQ ID NO 1797
- M73547
- SEQ ID NO 409 NM_018660 SEQ ID NO 1798
- M80899
- SEQ ID NO 411 NM_018683 SEQ ID NO 1799
- NM_000067
- SEQ ID NO 423 NM_019049 SEQ ID NO 1814
- NM_000087
- SEQ ID NO 427 NM_019063 SEQ ID NO 1815
- NM_000090
- SEQ ID NO 428 NM_020150 SEQ ID NO 1823
- NMB_000165
- SEQ ID NO 444 NM_020987 SEQ ID NO 1848
- NM_000168
- SEQ ID NO 445 NM_021095 SEQ ID NO 1855
- NM_000196
- SEQ ID NO 449 NM_021242 SEQ ID NO 1867
54
- NM_000269
- SEQ ID NO 457 U41387 SEQ ID NO 1877
- NM_000310
- SEQ ID NO 466 U45975 SEQ ID NO 1878
- NM_000396
- SEQ ID NO 479 U58033 SEQ ID NO 1881
- NM_000397
- SEQ ID NO 480 U67784 SEQ ID NO 1884
- NM_000597
- SEQ ID NO 502 U68385 SEQ ID NO 1885
- NM_000636
- SEQ ID NO 509 U80736 SEQ ID NO 1890
- NM_000888
- SEQ ID NO 535 X00437 SEQ ID NO 1899
- NM_000903
- SEQ ID NO 536 X07203 SEQ ID NO 1904
- NM_000930
- SEQ ID NO 540 X16302 SEQ ID NO 1907
- NM_000931
- SEQ ID NO 541 X51630 SEQ ID NO 1908
- NM_000969
- SEQ ID NO 547 X57809 SEQ ID NO 1912
- NM_000984
- SEQ ID NO 548 X57819 SEQ ID NO 1913
- NM_001026
- SEQ ID NO 552 X58529 SEQ ID NO 1914
- NM_001054
- SEQ ID NO 554 X66087 SEQ ID NO 1916
- NM_001179
- SEQ ID NO 567 X69150 SEQ ID NO 1917
- NM_001184
- SEQ ID NO 568 X72475 SEQ ID NO 1918
- NM_001204
- SEQ ID NO 571 X74794 SEQ ID NO 1920
- NM_001206
- SEQ ID NO 572 X75315 SEQ ID NO 1921
- NM_001218
- SEQ ID NO 575 X84340 SEQ ID NO 1925
- NM_001275
- SEQ ID NO 586 X98260 SEQ ID NO 1928
- NM_001394
- SEQ ID NO 602 Y07512 SEQ ID NO 1931
- NM_001424
- SEQ ID NO 605 Y14737 SEQ ID NO 1932
- NM_001448
- SEQ ID NO 610 Z34893 SEQ ID NO 1934
- NM_001504
- SEQ ID NO 620 Contig237_RC SEQ ID NO 1940
- NM_001553
- SEQ ID NO 630 Contig292_RC SEQ ID NO 1942
- NM_001674
- SEQ ID NO 646 Contig372_RC SEQ ID NO 1943
- NM_001675
- SEQ ID NO 647 Contig756_RC SEQ ID NO 1955
- NM_001725
- SEQ ID NO 652 Contig842_RC SEQ ID NO 1958
- NM_001740
- SEQ ID NO 656 Contig1632_RC SEQ ID NO 1977
- NM_001756
- SEQ ID NO 659 Contig1826 RC SEQ ID NO 1980
- NM_001770
- SEQ ID NO 664 Contig2237_RC SEQ ID NO 1988
- NM_001797
- SEQ ID NO 670 Contig2915 RC SEQ ID NO 2003
- NM_001845
- SEQ ID NO 680 Contig3164 RC SEQ ID NO 2007
- NM_001873
- SEQ ID NO 684 Contig3252_RC SEQ ID NO 2008
- NM_001888
- SEQ ID NO 687 Contig3940_RC SEQ ID NO 2018
- NM_001892
- SEQ ID NO 688 Contig9259_RC SEQ ID NO 2039
- NM_001919
- SEQ ID NO 694 Contig10268_RC SEQ ID NO 2041
- NM_001946
- SEQ ID NO 698 Contig10437_RC SEQ ID NO 2043
- NM_001953
- SEQ ID NO 699 Contig10973_RC SEQ ID NO 2044
- NM_001960
- SEQ ID NO 704 Contig14390_RC SEQ ID NO 2054
- NM_001985
- SEQ ID NO 709 Contig16453_RC SEQ ID NO 2060
- NM_002023
- SEQ ID NO 712 Contig16759 RC SEQ ID NO 2061
- NM_002051
- SEQ ID NO 716 Contig19551 SEQ ID NO 2070
- NM_002053
- SEQ ID NO 717 Contig24541_RC SEQ ID NO 2088
- NM_002164
- SEQ ID NO 734 Contig25362 RC SEQ ID NO 2093
- NM_002200
- SEQ ID NO 739 Contig25617 RC SEQ ID NO 2094
- NM_002201
- SEQ ID NO 740 Contig25722 RC SEQ ID NO 2096
55
- NM_002213
- SEQ ID NO 741 Contig26022 RC SEQ ID NO 2099
- NM_002250
- SEQ ID NO 747 Contig27915 RC SEQ ID NO 2114
- NM_002512
- SEQ ID NO 780 Contig28081_RC SEQ ID NO 2116
- NM_002542
- SEQ ID NO 784 Contig28179 RC SEQ ID NO 2118
- NM_002561
- SEQ ID NO 786 Contig28550_RC SEQ ID NO 2119 D
- NM_002615
- SEQ ID NO 793 Contig29639 RC SEQ ID NO 2127
- NM_002686
- SEQ ID NO 803 Contig29647 RC SEQ ID NO 2128
- NM_002709
- SEQ ID NO 806 Contig30092 RC SEQ ID NO 2130
- NM_002742
- SEQ ID NO 812 Contig30209_RC SEQ ID NO 2132
- NM_002775
- SEQ ID NO 815 Contig32185_RC SEQ ID NO 2156
- NM_002975
- SEQ ID NO 848 Contig32798_RC SEQ ID NO 2161
- NM_002982
- SEQ ID NO 849 Contig33230_RC SEQ ID NO 2163
- NM_003104
- SEQ ID NO 870 Contig33394_RC SEQ ID NO 2165
- NM_003118
- SEQ ID NO 872 Contig36323_RC SEQ ID NO 2197
- NM_003144
- SEQ ID NO 876 Contig36761_RC SEQ ID NO 2201
- NM_003165
- SEQ ID NO 882 Contig37141_RC SEQ ID NO 2209
- NM_003197
- SEQ ID NO 885 Contig37778_RC SEQ ID NO 2218
- NM_003202
- SEQ ID NO 886 Contig38285_RC SEQ ID NO 2222
- NM_003462
- SEQ ID NO 911 Contig39826_RC SEQ ID NO 2241
- NM_003500
- SEQ ID NO 918 Contig40212_RC SEQ ID NO 2251
- NM_003561
- SEQ ID NO 925 Contig40712_RC SEQ ID NO 2257
- NM_003607
- SEQ ID NO 930 Contig41402_RC SEQ ID NO 2265
- NM_003633
- SEQ ID NO 933 Contig41635_RC SEQ ID NO 2272
- NM_003641
- SEQ ID NO 934 Contig42006_RC SEQ ID NO 2280
- NM_003683
- SEQ ID NO 943 Contig42220_RC SEQ ID NO 2286
- NM_003729
- SEQ ID NO 949 Contig42306_RC SEQ ID NO 2287
- NM_003793
- SEQ ID NO 954 Contig43918_RC SEQ ID NO 2312
- NM_003829
- SEQ ID NO 958 Contig44195_RC SEQ ID NO 2316
- NM_003866
- SEQ ID NO 961 Contig44265_RC SEQ ID NO 2318
- NM_003904
- SEQ ID NO 967 Contig44278_RC SEQ ID NO 2319
- NM_003953
- SEQ ID NO 974 Contig44757_RC SEQ ID NO 2329
- NM_004024
- SEQ ID NO 982 Contig45588_RC SEQ ID NO 2349
- NM_004053
- SEQ ID NO 986 Contig46262_RC SEQ ID NO 2361
- NM_004295
- SEQ ID NO 1014 Contig46288_RC SEQ ID NO 2362
- NM_004438
- SEQ ID NO 1038 Contig46343_RC SEQ ID NO 2363
- NM_004559
- SEQ ID NO 1057 Contig46452_RC SEQ ID NO 2366
- NM_004616
- SEQ ID NO 1065 Contig46868_RC SEQ ID NO 2373
- NM_004741
- SEQ ID NO 1080 Contig46937_RC SEQ ID NO 2377
- NM_004772
- SEQ ID NO 1084 Contig48004_RC SEQ ID NO 2393
- NM_004791
- SEQ ID NO 1086 Contig48249_RC SEQ ID NO 2397
- NM_004848
- SEQ ID NO 1094 Contig48774_RC SEQ ID NO 2405
- NM_004866
- SEQ ID NO 1097 Contig48913_RC SEQ ID NO 2411
- NM_005128
- SEQ ID NO 1121 Contig48945_RC SEQ ID NO 2412
- NM_005148
- SEQ ID NO 1124 Contig48970_RC SEQ ID NO 2413
- NM_005196
- SEQ ID NO 1127 Contig49233_RC SEQ ID NO 2419
- NM_005326
- SEQ ID NO 1140 Contig49289_RC SEQ ID NO 2422
- NM_005518
- SEQ ID NO 1161 Contig49342_RC SEQ ID NO 2423
56
- NM_005538 SEQ ID NO 1163
- Contig49510_RC SEQ ID NO 2430
- NM_005557 SEQ ID NO 1170
- Contig49855_RC SEQ ID NO 2440
- NM_005718 SEQ ID NO 1189
- Contig49948_RC SEQ ID NO 2442
- NM_005804 SEQ ID NO 1201
- Contig50297_RC SEQ ID NO 2451
- NM_005824 SEQ ID NO 1203
- Contig50669_RC SEQ ID NO 2458
- NM_005935 SEQ ID NO 1220
- Contig50673_RC SEQ ID NO 2459
- NM_006002 SEQ ID NO 1225
- Contig50838_RC SEQ ID NO 2465
- NM_006148 SEQ ID NO 1249
- Contig51068_RC SEQ ID NO 2471
- NM_006235 SEQ ID NO 1257
- Contig51929 SEQ ID NO 2492
- NM_006271 SEQ ID NO 1261
- Contig51953_RC SEQ ID NO 2493
- NM_006287 SEQ ID NO 1264
- Contig52405_RC SEQ ID NO 2502
- NM_006296 SEQ ID NO 1267
- Contig52543_RC SEQ ID NO 2505
- NM_006378 SEQ ID NO 1275
- Contig52720_RC SEQ ID NO 2513
- NM_006461 SEQ ID NO 1287
- Contig53281_RC SEQ ID NO 2530
- NM_006573 SEQ ID NO 1300
- Contig53598_RC SEQ ID NO 2537
- NM_006622 SEQ ID NO 1302
- Contig53757_RC SEQ ID NO 2543
- NM_006696 SEQ ID NO 1308
- Contig53944_RC SEQ ID NO 2545
- NM_006769 SEQ ID NO 1316
- Contig54425 SEQ ID NO 2561
- NM_006787 SEQ ID NO 1319
- Contig54547_RC SEQ ID NO 2565
- NM_006875 SEQ ID NO 1334
- Contig54757_RC SEQ ID NO 2574
- NM_006885 SEQ ID NO 1335
- Contig54916_RC SEQ ID NO 2581
- NM_006918 SEQ ID NO 1339
- Contig55770_RC SEQ ID NO 2604
- NM_006923 SEQ ID NO 1340
- Contig55801_RC SEQ ID NO 2606
- NM_006941 SEQ ID NO 1342
- Contig56143_RC SEQ ID NO 2619
- NM_007070 SEQ ID NO 1354
- Contig56160_RC SEQ ID NO 2620
- NM_007088 SEQ ID NO 1356
- Contig56303_RC SEQ ID NO 2626
- NM_007146 SEQ ID NO 1358
- Contig57023_RC SEQ ID NO 2639
- NM_007173 SEQ ID NO 1359
- Contig57138_RC SEQ ID NO 2644
- NM_007246 SEQ ID NO 1366
- Contig57609_RC SEQ ID NO 2657
- NM_007358 SEQ ID NO 1374
- Contig58301_RC SEQ ID NO 2667
- NM_012135 SEQ ID NO 1385
- Contig58512_RC SEQ ID NO 2670
- NM_012151 SEQ ID NO 1387
- Contig60393 SEQ ID NO 2674
- NM_012258 SEQ ID NO 1396
- Contig60509_RC SEQ ID NO 2675
- NM_012317 SEQ ID NO 1399
- Contig61254_RC SEQ ID NO 2677
- NM_012337 SEQ ID NO 1403
- Contig62306 SEQ ID NO 2680
- NM_012339 SEQ ID NO 1404
- Contig64502 SEQ ID NO 2689
Tabla 4. 100 marcadores preferidos de la Tabla 3 que distinguen entre tumores relacionados con BRCA1 y tumores esporádicos.
- Identificador
- Correlación Nombre de secuencia Descripción
- NM_001892
- -0.651689 CSNK1A1 Caseína quinasa 1, alfa 1
- NM_018171
- -0.637696 FLJ10659 Proteína hipotética FLJ10659
- Contig40712_RC
- -0.612509 ESTs
- NM_001204
- -0.608470 BMPR2 Receptor de proteína morfogenética de los huesos, tipo II (serina/treonina quinasa)
57
- NM_005148
- -0.598612 UNC119 Homólogo de unc119 (C.elegans)
- G26403
- 0.585054 YWHAH Proteína de activación de tirosina 3- monooxigenasa/triptofano 5monooxigenasa, polipéptido eta
- NM_015640
- 0.583397 PAI-RBP1 Proteína de enlace con PAI-1 ARNm
- Contig9259_RC
- 0.581362 ESTs
- AB033049
- -0.578750 KIAA1223 Proteína KIAA1223
- NM_015523
- 0.576029 DKFZP566E144 Pequeño fragmento de nucleasa
- Contig41402_RC
- -0.571650 Secuencia de ADN humano del clon RP11-16L21 en el cromosoma 9. Contiene el gen para leucotrieno B4 12-hidroxidehidrogenasa dependiente de NDAP, el gen para una nueva proteína de dominio DnaJ parecida a Drosophila, C. elegans y a las proteínas previstas por Arabidopsis, el gen GNG10 para la proteína gene de enlace con nucleótido de guanina 10, un nuevo gen, ESTs, STSs, GSSs y seis islas CpG
- NM_004791
- -0.564819 ITGBL1 Integrina, tipo 1 beta (con dominios de repetición afines a EGF)
- NM_007070
- 0.561173 FAP48 Proteína asociada a FKBP
- NM_014597
- 0.555907 HSU15552 ARNm ácido de proteína 82 kDa
- AF000974
- 0.547194 TRIP6 Interactor 6 del receptor de hormonas de la tiroides
- NM_016073
- -0.547072 CGI-142 CGI-142
- Contig3940_RC
- 0.544073 YWHAH Proteína de activación de tirosina 3-mono-oxygenasa/triptofano 5monooxygenasa, polipépeptido eta
- NM_003683
- 0.542219 D2152056E Segmento de AND en cromosoma 21 (único) secuencia expresada 2056
- Contig58512_RC
- -0.528458 ARNm de proteína relacionada con el tumor de páncreas de Homo sapiens (FKSG12), cds 21completo
- NM_003904
- 0.521223 ZNF259 Proteína de dedo de cinc 259
- Contig26022_RC
- 0.517351 ESTs
- Contig48970_RC
- -0.516953 KIAA0892 Proteína KIAA0892
- NM_016307
- -0.515398 PRX2 Proteína de caja homeo relacionada apareada
- AL137761
- -0.514891 ARNm de Homo sapiens; ADNc DKFZp586L2424 (del clon DKFZp586L2424)
- NM_001919
- -0.514799 DCI Dodecenoil-Coenzima A delta isomerasa (3,2 transenoil-Coenzima A isomerasa)
- NM_000196
- -0.514004 HSD11B2 Hidroxiesteroide (11-beta) dehidrogenasa 2
- NM_002200
- 0.513149 IRF5 Factor 5 regulador del interferón
- AL133572
- 0.511340 ARNm de Homo sapiens; ADNc DKFZp43410535 (del clon DKFZp43410535); cds parcial
- NM_019063
- 0.511127 C2ORF2 Marco de lectura abierta 2 del cromosoma 2
- Contig25617_RC
- 0.509506 ESTs
- NM_007358
- 0.508145 M96 Proteína putativa de enlace con ADN
- NM_014785
- -0.507114 KIAA0258 Producto del gen KIAA0258
- NM_006235
- 0.506585 POU2AF1 Dominio POU, clase 2, factor asociador 1
- NM_014680
- -0.505779 KIAA0100 Producto del gen KIAA0100
- X66087
- 0.500842 MYBL1 Tipo 1 del homólogo del oncógeno viral de la mieloblastosis aviar v-myb
- Y07512
- -0.500686 PRKG1 Proteína quinasa, dependiente de cGMP, tipo I
58
- NM_006296
- 0.500344 VRK2 Quinasa 2 relacionada con la vaccinia
- Contig44278_RC
- 0.498260 DKFZP434K114 Proteína DKFZP434K114
- Contig56160_RC
- -0.497695 ESTs
- NM_002023
- -0.497570 FMOD Fibromodulina
- M28170
- 0.497095 CD19 Antígeno CD19
- D26488
- 0.496511 KIAA0007 Proteína KIAA0007
- X72475
- 0.496125 ARNm de H.sapiens para región variable de cadena ligera kappa lg reorganizada (I.114)
- K02276
- 0.496068 MYC Homólogo del oncógeno viral de la mieloblastosis aviar v-myc
- NM_013378
- 0.495648 VPREB3 Gen 3 de pre-B linfocito
- X58529
- 0.495608 IGHM Mu constante pesado de inmunoglobulina
- NM_000168
- -0.494260 GLI3 Miembro GL13 de la familia GLI-Kruppel (síndrome de Greig)
- NM_004866
- -0.492967 SCAMP1 Proteína 1 de la mebrana portadora secretora
- NM_003729
- 0.488971 RPC Fosfato ciclasa del terminal 3’ de ARN
- NM_006875
- 0.487407 PIM2 Oncógeno pim-2
- NM_018188
- 0.487126 FLJ10709 Proteína hipotética FLJ10709
- NM_004848
- 0.485408 ICB-1 Gen inducico por la membrana basal
- NM_001179
- 0.483253 ART3 ADP-ribosiltransferasa 3
- NM_016548
- -0.482329 LOC51280 Proteína GP73 de la membrana de Golgi
- NM_007146
- -0.481994 ZNF161 Proteína de dedo de cinc 161
- NM_021242
- -0.481754 STRAIT11499 Proteína hipotética STRAIT11499
- NM_016223
- 0.481710 PACSIN3 Sustrato de proteína quinasa C y caseína quinasa en neuronas 3
- NM_003197
- -0.481526 TCEB1L Factor B de alargamiento de transcripción (SIII), afín a polipéptido 1
- NM_000067
- -0.481003 CA2 Anhidrasa carbónica II
- NM_006885
- -0.479705 ATBF1 Factor 1 de transcripción de enlace con AT
- NM_002542
- 0.478282 OGG1 8-oxoguanina ADN glicosilasa
- AL133619
- -0.476596 ARNm de Homo sapiens mRNA; ADNc DKFZp434E2321 (del clon DKFZp434E2321); cds parcial cds
- D80001
- 0.476130 KIAA0179 Proteína KIAA0179
- NM_018660
- -0.475548 LOC55893 Factor regulador del virus del papiloma PRF-1
- AB004857
- 0.473440 SLC11A2 Familia 11 del portador de soluto (transportadores de iones de metal divalente acoplados a protones), miembro 2
- NM_002250
- 0.472900 KCNN4 Canal activado por calcio de intermedia/pequeña conductancia de potasio, subfamilia N, miembro 4
- Contig56143_RC
- -0.472611 ESTs, ligeramente parecidos al precursor de cadena del colágeno A54849 alfa 1 (VII) [H.sapiens]
- NM_001960
- 0.471502 EEF1D Factor 1 delta de alargamiento de conversión eucariótica (proteína de intercambio con nucleótido de guanina)
- Contig52405_RC
- -0.470705 ESTs, moderadamente parecidos a ALU8_ALU HUMANO SUBFAMILIA SX ENTRADA DE AVISO DE CONTAMINACIÓN DE SECUENCIA [H.sapiens]
- Contig30092_RC
- -0.469977 ARNm de isoforma B (PRDM6) de proteína 6 de dedo de cinc del dominio PR de Homo sapiens, cds partial; alternativamente empalmado
- NM_003462
- -0.468753 P28 Dineína, axonemal, polipéptido intermedio ligero
- Contig60393
- 0.468475 ESTs
59
- Contig842_RC
- 0.468158 ESTs
- NM_002982
- 0.466362 SCYA2 Citoquina inducible pequeña A2 (proteína 1 quemotáctica de monocito, homólogo de ratón Sig-je)
- Contig14390_RC
- 0.464150 ESTs
- NM_001770
- 0.463847 CD19 Antígeno CD19
- AK000617
- -0.463158 ARNm de Homo sapiens; ADNc DKFZp434L235 (del clon DKFZp434L235)
- AF073299
- -0.463007 SLC9A2 Familia 9 del portador de soluto (intercambiador de sodio/hidrógeno), isoforma 2
- NM_019049
- 0.461990 FLJ20054 Proteína hipotética
- AL137347
- -0.460778 DKFZP761M1511 Proteína hipotética
- NM_000396
- -0.460263 CTSK Catepsina K (picnodisostosis)
- NM_018373
- -0.459268 FLJ11271 Proteína hipotética FLJ11271
- NM_002709
- 0.458500 PPP1CB Proteína fosfatasa 1, subunidad catalítica, isoforma beta
- NM_016820
- 0.457516 OGG1 8-oxoguanina ADN glicosilasa
- Contig10268_RC
- 0.456933 Secuencia de ADN humano del clon RP11-196N14 en el cromosoma 20. Contiene ESTs, STSs, GSSs e islas CpG. Contiene tres nuevos genes, parte de un gen para una nueva proteína parecida a la proteína serina/treonina fosfatasa 4 subunidad reguladora 1 (PP4R1) y un gen para una nueva proteína con una dominio de anquirina.
- NM_014521
- -0.456733 SH3BP4 Proteína 4 de enlace con el dominio SH3
- AJ272057
- -0.456548 STRAIT11499 Proteína hipotética STRAIT11499
- NM_015964
- -0.456187 LOC51673 Proteína específica del cerebro
- Contig16759_RC
- -0.456169 ESTs
- NM_015937
- -0.455954 LOC51604 Proteína CGI-06
- NM_007246
- -0.455500 KLHL2 Kelch 2 afín a (Drosophila) (Mayven)
- NM_001985
- -0.453024 ETFB Flavoproteína de transferencia de electrones, polipéptido beta
- NM_000984
- -0.452935 RPL23A Proteína ribosomal L23a
- Contig51953_RC
- -0.451695 ESTs
- NM_015984
- 0.450491 UCH37 Ubiquitina C-terminal hidrolasa UCH37
- NM_000903
- -0.450371 DIA4 Diaforasa (NADH/NADPH) (citocromo b-5 reductasa)
- NM_001797
- -0.449862 CDH11 Cadherina 11, tipo 2, OB-cadherina (osteoblasto)
- NM_014878
- 0.449818 KIAA0020 Producto del gen KIAA0020
- NM_002742
- -0.449590 PRKCM Proteína quinasa C, mu
Tabla 5. 231 marcadores de genes que distinguen entre pacientes con buen pronóstico y pacientes con pronostico deficiente.
- Banco de Genes
- SEQ ID NO Bando de Genes SEQ ID NO
- Número de Acceso
- Número de Acceso
- AA555029_RC
- SEQ ID NO 1 NM_013296 SEQ ID NO 1427
- AB020689
- SEQ ID NO 37 NM_013437 SEQ ID NO 1439
- AB032973
- SEQ ID NO 55 NM_014078 SEQ ID NO 1449
- AB033007
- SEQ ID NO 58 NM_014109 SEQ ID NO 1451
- AB033043
- SEQ ID NO 62 NM_014321 SEQ ID NO 1477
- AB037745
- SEQ ID NO 75 NM_014363 SEQ ID NO 1480
- AB037863
- SEQ ID NO 88 NM_014750 SEQ ID NO 1527
60
- AF052159
- SEQ ID NO 120 NM_014754 SEQ ID NO 1528
- AF052162
- SEQ ID NO 121 NM_014791 SEQ ID NO 1535
- AF055033
- SEQ ID NO 124 NM_014875 SEQ ID NO 1545
- AF073519
- SEQ ID NO 137 NM_014889 SEQ ID NO 1548
- AF148505
- SEQ ID NO 169 NM_014968 SEQ ID NO 1554
- AF155117
- SEQ ID NO 173 NM_015416 SEQ ID NO 1559
- AF161553
- SEQ ID NO 177 NM_015417 SEQ ID NO 1560
- AF201951
- SEQ ID NO 183 NM_015434 SEQ ID NO 1562
- AF257175
- SEQ ID NO 189 NM_015984 S SEQ ID NO 1587
- AJ224741
- SEQ ID NO 196 NM_016337 SEQ ID NO 1636
- AK000745
- SEQ ID NO 219 NM_016359 SEQ ID NO 1638
- AL050021
- SEQ ID NO 257 NM_016448 SEQ ID NO 1645
- AL050090
- SEQ ID NO 259 NM_016569 SEQ ID NO 1655
- AL080059
- SEQ ID NO 270 NM_016577 SEQ ID NO 1656
- AL080079
- SEQ ID NO 271 NM_017779 SEQ ID NO 1708
- AL080110
- SEQ ID NO 272 NM_018004 SEQ ID NO 1725
- AL133603
- SEQ ID NO 306 NM_018098 SEQ ID NO 1739
- AL133619
- SEQ ID NO 307 NM_018104 SEQ ID NO 1743
- AL137295
- SEQ ID NO 315 NM_018120 SEQ ID NO 1745
- AL137502
- SEQ ID NO 326 NM_018136 SEQ ID NO 1748
- AL137514
- SEQ ID NO 327 NM_018265 SEQ ID NO 1766
- AL137718
- SEQ ID NO 336 NM_018354 SEQ ID NO 1774
- AL355708
- SEQ ID NO 353 NM_018401 SEQ ID NO 1782
- D25328
- SEQ ID NO 357 NM_018410 SEQ ID NO 1783
- L27560
- SEQ ID NO 390 NM_018454 SEQ ID NO 1786
- M21551
- SEQ 10 NO 394 NM_018455 SEQ ID NO 1787
- NM_000017
- SEQ ID NO 416 NM_019013 SEQ ID NO 1809
- NM_000096
- SEQ ID NO 430 NM_020166 SEQ ID NO 1825
- NM_000127
- SEQ ID NO 436 NM_020188 SEQ ID NO 1830
- NM_000158
- SEQ ID NO 442 NM_020244 SEQ ID NO 1835
- NM_000224
- SEQ ID NO 453 NM_020386 SEQ ID NO 1838
- NM_000286
- SEQ ID NO 462 NM_020675 SEQ ID NO 1842
- NM_000291
- SEQ ID NO 463 NM_020974 SEQ ID NO 1844
- NM_000320
- SEQ ID NO 469 R70506_RC SEQ ID NO 1868
- NM_000436
- SEQ ID NO 487 U45975 SEQ ID NO 1878
- NM_000507
- SEQ ID NO 491 U58033 SEQ ID NO 1881
- NM_000599
- SEQ ID NO 503 U82987 SEQ ID NO 1891
- NM_000788
- SEQ ID NO 527 U96131 SEQ ID NO 1896
- NM_000849
- SEQ ID NO 530 X05610 SEQ ID NO 1903
- NM_001007
- SEQ ID NO 550 X94232 SEQ ID NO 1927
- NM_001124
- SEQ ID NO 562 Contig753_RC SEQ ID NO 1954
- NM_001168
- SEQ ID NO 566 Contig1778_RC SEQ ID NO 1979
- NM_001216
- SEQ ID NO 574 Contig2399_RC SEQ ID NO 1989
- NM_001280
- SEQ ID NO 588 Contig2504_RC SEQ ID NO 1991
- NM_001282
- SEQ ID NO 589 Contig3902_RC SEQ ID NO 2017
- NM_001333
- SEQ ID NO 597 Contig4595 SEQ ID NO 2022
- NM_001673
- SEQ ID NO 645 Contig8581_RC SEQ ID NO 2037
61
- NM_001809
- SEQ ID NO 673 Contig13480_RC SEQ ID NO 2052
- NM_001827
- SEQ ID NO 676 Contig17359_RC SEQ ID NO 2068
- NM_001905
- SEQ ID NO 691 Contig20217_RC SEQ ID NO 2072
- NM_002019
- SEQ ID NO 711 Contig21812_RC SEQ ID NO 2082
- NM_002073
- SEQ ID NO 721 Contig24252_RC SEQ ID NO 2087
- NM_002358
- SEQ ID NO 764 Contig25055_RC SEQ ID NO 2090
- NM_002570
- SEQ ID NO 787 Contig25343_RC SEQ ID NO 2092
- NM_002808
- SEQ ID NO 822 Contig25991 SEQ ID NO 2098
- NM_002811
- SEQ ID NO 823 Contig27312_RC SEQ ID NO 2108
- NM_002900
- SEQ ID NO 835 Contig28552_RC SEQ ID NO 2120
- NM_002916
- SEQ ID NO 838 Contig32125_RC SEQ ID NO 2155
- NM_003158
- SEQ ID NO 881 Contig32185_RC SEQ ID NO 2156
- NM_003234
- SEQ ID NO 891 Contig33814_RC SEQ ID NO 2169
- NM_003239
- SEQ ID NO 893 Contig34634_RC SEQ ID NO 2180
- NM_003258
- SEQ ID NO 896 Contig35251_RC SEQ ID NO 2185
- NM_003376
- SEQ ID NO 906 Contig37063_RC SEQ ID NO 2206
- NM_003600
- SEQ ID NO 929 Contig37598 SEQ ID NO 2216
- NM_003607
- SEQ ID NO 930 Contig38288_RC SEQ ID NO 2223
- NM_003662
- SEQ ID NO 938 Contig40128_RC SEQ ID NO 2248
- NM_003676
- SEQ ID NO 941 Contig40831_RC SEQ ID NO 2260
- NM_003748
- SEQ ID NO 951 Contig41413_RC SEQ ID NO 2266
- NM_003862
- SEQ ID NO 960 Contig41887_RC SEQ ID NO 2276
- NM_003875
- SEQ ID NO 962 Contig42421_RC SEQ ID NO 2291
- NM_003878
- SEQ ID NO 963 Contig43747_RC SEQ ID NO 2311
- NM_003882
- SEQ ID NO 964 Contig44064_RC SEQ ID NO 2315
- NM_003981
- SEQ ID NO 977 Contig44289_RC SEQ ID NO 2320
- NM_004052
- SEQ ID NO 985 Contig44799_RC SEQ ID NO 2330
- NM_004163
- SEQ ID NO 995 Contig45347_RC SEQ ID NO 2344
- NM_004336
- SEQ ID NO 1022 Contig45816_RC SEQ ID NO 2351
- NM_004358
- SEQ ID NO 1026 Contig46218_RC SEQ ID NO 2358
- NM_004456
- SEQ ID NO 1043 Contig46223_RC SEQ ID NO 2359
- NM_004480
- SEQ ID NO 1046 Contig46653_RC SEQ ID NO 2369
- NM_004504
- SEQ ID NO 1051 Contig46802_RC SEQ ID NO 2372
- NM_004603
- SEQ ID NO 1064 Contig47405_RC SEQ ID NO 2384
- NM_004701
- SEQ ID NO 1075 Contig48328_RC SEQ ID NO 2400
- NM_004702
- SEQ ID NO 1076 Contig49670_RC SEQ ID NO 2434
- NM_004798
- SEQ ID NO 1087 Contig50106_RC SEQ ID NO 2445
- NM_004911
- SEQ ID NO 1102 Contig50410 SEQ ID NO 2453
- NM_004994
- SEQ ID NO 1108 Contig50802_RC SEQ ID NO 2463
- NM_005196
- SEQ ID NO 1127 Contig51464_RC SEQ ID NO 2481
- NM_005342
- SEQ ID NO 1143 Contig51519_RC SEQ ID NO 2482
- NM_005496
- SEQ ID NO 1157 Contig51749_RC SEQ ID NO 2486
- NM_005563
- SEQ ID NO 1173 Contig51963 SEQ ID NO 2494
- NM_005915
- SEQ ID NO 1215 Contig53226_RC SEQ ID NO 2525
- NM_006096
- SEQ ID NO 1240 Contig53268_RC SEQ ID NO 2529
- NM_006101
- SEQ ID NO 1241 Contig53646_RC SEQ ID NO 2538
- NM_006115
- SEQ ID NO 1245 Contig53742_RC SEQ ID NO 2542
62
- NM_006117
- SEQ ID NO 1246 Contig55188_RC SEQ ID NO 2586
- NM_006201
- SEQ ID NO 1254 Contig55313_RC SEQ ID NO 2590
- NM_006265
- SEQ ID NO 1260 Contig55377_RC SEQ ID NO 2591
- NM_006281
- SEQ ID NO 1263 Contig55725_RC SEQ ID NO 2600
- NM_006372
- SEQ ID NO 1273 Contig55813_RC SEQ ID NO 2607
- NM_006681
- SEQ ID NO 1306 Contig55829_RC SEQ ID NO 2608
- NM_006763
- SEQ ID NO 1315 Contig56457_RC SEQ ID NO 2630
- NM_006931
- SEQ ID NO 1341 Contig57595 SEQ ID NO 2655
- NM_007036
- SEQ ID NO 1349 Contig57864_RC SEQ ID NO 2663
- NM_007203
- SEQ ID NO 1362 Contig58368_RC SEQ ID NO 2668
- NM_012177
- SEQ ID NO 1390 Contig60864_RC SEQ ID NO 2676
- NM_012214
- SEQ ID NO 1392 Contig63102_RC SEQ ID NO 2684
- NM_012261
- SEQ ID NO 1397 Contig63649_RC SEQ ID NO 2686
- NM_012429
- SEQ ID NO 1413 Contig64688 SEQ ID NO 2690
- NM_013262
- SEQ ID NO 1425
Tabla 6. 70 marcadores de pronóstico preferidos sacados de la Tabla 5.
- AL080059
- -0.527150 ARNm de Homo sapiens para proteína KIAA1750, cds parcial
- Contig63649_ RC
- -0.468130 ESTs
- Contig46218_ RC
- -0.432540 ESTs
- NM_016359
- -0.424930 LOC51203 Clon HQ0310 PRO0310p1
- AA555029_RC
- -0.424120 ESTs
- NM_003748
- 0.420671 ALDH4 Aldehído dehidrogenasa 4 (glutamato gamma semialdehído dehidrogenasa; pirrolina-5-carboxilato dehidrogenasa)
- Contig38288_ RC
- -0.414970 ESTs, ligeramente parecidos a ISHUSS proteína disulfuroisomerasa [H.sapiens]
- NM_003862
- 0.410964 FGF18 Factor del crecimiento fibroblasto 18
- Contig28552_ RC
- -0.409260 ARNm de Homo sapiens; ADNc DKFZp434C0931 (de clon DKFZp434C0931); cds parcial
- Contig32125_RC
- 0.409054 ESTs
- U82987
- 0.407002 BBC3 Componente 3 de enlace con Bcl-2
- AL137718
- -0.404980 ARN de Homo sapiens; ADNc DKFZp434C0931 (del clon DKFZp434C0931); cds parcial
- AB037863
- 0.402335 KIAA1442 Proteína KIAA1442
- NM_020188
- -0.400070 DC13 Proteína DC13
- NM_020974
- 0.399987 CEGP1 Proteína CEGP1
- NM_000127
- -0.399520 EXT1 Exostosis (múltiple) 1
- NM_002019
- -0.398070 FLT1 Tirosina quinasa 1 relacionada con fms (factor de crecimiento endotelial vascular/receptor de factor de permeabilidad vascular)
- NM_002073
- -0.395460 GNAZ Proteína de enlace con nucleótido de guanina (proteína G), polipéptido alfa z
- NM_000436
- -0.392120 OXCT 3-oxoácido CoA transferasa
- NM_004994
- -0.391690 MMP9 Metaloproteinasa 9 de matriz (gelatinasa B, 92kD gelatinasa, 92kD
63
- tipo IV colagenasa)
- Contig55377_RC
- 0.390600 ESTs
- Contig35251_RC
- -0.390410 ADNc de Homo sapiens: fis FLJ22719, clon HSI14307
- Contig25991
- -0.390370 ECT2 Oncógeno de secuencia transformadora 2 de célula epitelial
- NM_003875
- -0.386520 GMPS Guanina monofosfato sintetasa
- NM_006101
- -0.385890 HEC Altamente expresado en cáncer, rico en repeticiones de heptadas de leucina
- NM_003882
- 0.384479 WISP1 WNT1 procedimiento de señalización inducible proteína 1
- NM_003607
- -0.384390 PK428 Proteína quinasa Ser-Thr relacionada con la proteína quinasa de distrofia miotónica
- AF073519
- -0.383340 SERF1A Pequeño factor 1A rico enl EDRK (telomérico)
- AF052162
- -0.380830 FLJ12443 Proteína hipotética FLJ12443
- NM_000849
- 0.380831 GSTM3 Glutationa S-transferasa M3 (cerebro)
- Contig32185_ RC
- -0.379170 ADNc de Homo sapiens fis FLJ13997, clon Y79AA1002220
- NM_016577
- -0.376230 RAB6B RAB6B, miembro de familia de oncógeno RAS
- Contig48328_ RC
- 0.375252 ESTs, ligeramente parecidos a T17248 proteína hipotética DKFZp586G1122.1 [H.sapiens]
- Contig46223_ RC
- 0.374289 ESTs
- NM_015984
- -0.373880 UCH37 Ubiquitina C-terminal hidrolasa UCH37
- NM_006117
- 0.373290 PECI Peroxisomal D3,D2-enoil-CoA isomerasa
- AK000745
- -0.373060 ADNc de Homo sapiens fis FLJ20738, clon HEP08257
- Contig40831_ RC
- -0.372930 ESTs
- NM_003239
- 0.371524 TGFB3 Factor transformador del crecimiento, beta 3
- NM_014791
- -0.370860 KIAA0175 Producto del gen KIAA0175
- X05610
- -0.370860 COL4A2 Colágeno, tipo IV, alfa 2
- NM_016448
- -0.369420 L2DTL Proteína L2DTL
- NM_018401
- 0.368349 HSA250839 Gen para serina/treonina proteína quinasa
- NM_000788
- -0.367700 DCK Deoxicitidina quinasa
- Contig51464_ RC
- -0.367450 FLJ22477 Proteína hipotética FLJ22477
- AL080079
- -0.367390 DKFZP564D0462 Proteína hipotética DKFZp564D0462
- NM_006931
- -0.366490 SLC2A3 Familia 2 del portador de soluto (trnsportador de glucosa facilitado), miembro 3
- AF257175
- -0.365900 ARN (HCA64) de Homo sapiens del antígeno 64 asociado al carcinoma hepatocelular 64, cds completo
- NM_014321
- -0.365810 ORC6L Complejo de reconocimiento de origen, subunidad 6 afín a (homólogo de levadura)
- NM_002916
- -0.365590 RFC4 Factor de replicación C (activador 1) 4 (37kD)
- Contig55725_ RC
- -0.365350 ESTs, moderadamente parecidos a T50635 proteína hipotética DKFZp762L0311.1 [H.sapiens]
- Contig24252_ RC
- -0.364990 ESTs
- AF201951
- 0.363953 CFFM4 Subunidad beta de receptor epsilon de inmunoglobulina de alta afinidad
- NM_005915
- -0.363850 MCM6 Deficiente en mantenimiento de minicromosoma (mis5, S. pombe) 6
- NM_001282
- 0.363326 AP2B1 Complejo 2 de proteína relacionada con adaptador, subunidad beta 1
64
- Contig56457_ RC
- -0.361650 TMEFF1 Proteína de transmembrana con afín a EGF y dos dominios 1 afines a folistatina
- NM_000599
- -0.361290 IGFBP5 Proteína 5 de enlace con factor de crecimiento afín a insulina
- NM_020386
- -0.360780 LOC57110 Proteína relacionada con proteína H-REV107
- NM_014889
- -0.360040 MP1 Metaloproteasa 1 (familia de pitrilisina)
- AF055033
- -0.359940 IGFBP5 Proteína 5 de enlace con factor de crecimiento afín a insulina
- NM_006681
- -0.359700 NMU Neuromedina U
- NM_007203
- -0.359570 AKAP2 A Proteína 2 de amarre a quinasa (PRKA)
- Contig63102_ RC
- 0.359255 FLJ11354 Proteína hipotética FLJ11354
- NM_003981
- -0.358260 PRC1 Regulador proteínico de la citoquinesis 1
- Contig20217_ RC
- -0.357880 ESTs
- NM_001809
- -0.357720 CENPA Proteína A (17kD) de centrómero
- Contig2399_RC
- -0.356600 SM-20 Similar a la proteína SM-20 de músculo liso de rata
- NM_004702
- -0.356600 CCNE2 Ciclina E2
- NM_007036
- -0.356540 ESM1 Molécula 1 específica de célula endotelial
- NM_018354
- -0.356000 FLJ11190 Proteina hipotelial FLJ11190
[0037] Los conjuntos de marcadores enumerados en las Tablas 1-6 están parcialmente superpuestos; en otras palabras, algunos marcadores están presentes en múltiples conjuntos, mientras que otros son exclusivos de un conjunto en concreto (FIG. 1).
5 [0038] Así pues, en una materialización se describe un conjunto de 256 marcadores genéticos que pueden distinguir entre ER (+) y ER (-) y también entre tumores de BRCA1 y tumores esporádicos (es decir, clasificar un tumor como ER (-) o ER (-) y relacionado con BRCA1 o esporádico). En una materialización más específica, se describen subconjuntos de al menos 20, al menos 50, al menos 100 o al menos 150 del conjunto de 256 marcadores que pueden clasificar un tumor como ER (-) o ER (-) y relacionado con BRCA1 o esporádico. En otra
10 materialización se describen 165 marcadores que pueden distinguir entre ER (+) y ER (-) y también entre pacientes con buen pronóstico frente a pronóstico deficiente (es decir, clasificar un tumor como ER (-) o como ER (+) y como que tenga que ser extirpado de una paciente con buen pronóstico o con pronóstico deficiente). Se describen asimismo subconjuntos de al menos 20, 50, 100 o 125 del conjunto completo de 165 marcadores, que también pueden clasificar un tumor como ER (-) o como ER (+) y como que tenga que ser extirpado de una
15 paciente con buen pronóstico o con pronóstico deficiente. Además, se describe un conjunto de doce marcadores que pueden distinguir entre tumores de BRCA1 y tumores esporádicos, y entre pacientes con buen pronóstico frente a pronóstico deficiente. Por último, se describen once marcadores que son capaces de diferenciar las tres categorías. Y a la inversa, se describen 2.050 de los 2.460 marcadores con categoría de ER que pueden determinar solo la categoría de ER, 173 de los 430 marcadores ARC47 frente a marcadores esporádicos que
20 solo pueden determinar el BRCA1 frente a la categoría esporádica y 65 de los 231 marcadores de pronóstico que solo pueden determinar el pronóstico. En materializaciones más específicas se describen subconjuntos de al menos 20, 50, 100, 200, 500, 1.000, 1.500 o 2.000 de los 2,050 marcadores con categoría de ER que igualmente solo pueden determinar la categoría de ER. También se describen subconjuntos de al menos 20, 50, 100 o 150 de los 173 marcadores que también determinan solo el BRCA1 frente a tumores esporádicos. Asimismo, se
25 describen subconjuntos de al menos 20, 30, 40, o 50 de los 65 marcadores de pronóstico que igualmente solo pueden determinar la categoría del pronóstico.
[0039] Cualquiera de los conjuntos de marcadores suministrados más arriba puede usarse solo específicamente o en combinación con otros marcadores que no sean del conjunto. Por ejemplo, los marcadores que distinguen la categoría de ER pueden usarse en combinación con los marcadores de BRCA1 frente a los 30 esporádicos, o con los marcadores de pronóstico, o ambos. Cualquiera de los conjuntos de marcadores suministrados más arriba puede usarse también en combinación con otros marcadores para el cáncer de mama,
o para cualquier otra afección clínica o fisiológica.
[0040] La relación entre los conjuntos de marcadores se muestra en el diagrama de la FIG. 1.
5.3.2 IDENTIFICACIÓN DE MARCADORES
35 [0041] Se describen conjuntos de marcadores para la identificación de condiciones o indicaciones relacionadas con el cáncer de mama. De modo general, los conjuntos de marcadores se identificaron determinando cuáles de entre -25.000 marcadores humanos tenían patrones de expresión que se hallaran en correlación con las condiciones o indicaciones.
[0042] En una materialización, el método para identificar conjuntos de marcadores es como sigue. Tras la extracción y el etiquetado de polinucleótidos destino, se compara la expresión de todos los marcadores (genes) en una muestra X con la expresión de todos los marcadores (genes) en un patrón o control. En una materialización, el patrón o control comprende moléculas polinucleótidas destino obtenidas de una muestra de un individuo normal (es decir, de un individuo no aquejado de cáncer de mama). En una materialización preferida, el patrón o control es una reserva de moléculas polinucleótidas destino. La reserva puede obtenerse de muestras recogidas de una serie de individuos normales. En una materialización preferida, la reserva comprende muestras tomadas de una serie de individuos que tienen tumores de tipo esporádico. En otra materialización preferida, la reserva comprende una población de ácidos nucleicos generados artificialmente y destinados a aproximar el nivel de ácido nucleico derivado de cada marcador hallado en una reserva de marcadores derivados de ácidos nucleicos obtenidos de muestras de tumores. En una materialización preferida más, la reserva se obtiene de líneas celulares o de muestras de líneas de células normales o de cáncer de mama.
[0043] La comparación puede realizarse por cualquiera de los medios conocidos en la técnica. Por ejemplo, los niveles de expresión de marcadores diversos pueden calcularse mediante la separación de moléculas polinucleótidas destino (por ej., ARN o ADNc), derivadas de los marcadores en geles de agarosa o poliacrilamida, seguida por la hibridación con sondas oligonucleótidas específicas de marcadores. Como alternativa, la comparación puede realizarse mediante el etiquetado de moléculas polinucleótidas destino seguidas por la separación en un gel secuenciador. Se colocan muestras polinucleótidas en el gel de modo que paciente y control o patrón se hallen en corredores adyacentes. La comparación de niveles de expresión se realiza visualmente o por medio de densitómetro. En una materialización preferida, la expresión de todos los marcadores se calcula simultáneamente por hibridación a un biochip. En cada aproximación, los marcadores que reúnen determinados requisitos se identifican como asociados al cáncer de mama.
[0044] El marcador se selecciona basándose en alguna diferencia significativa de expresión en una muestra al compararla con una condición de patrón o control. Se puede hacer la selección basándose bien en una regulación significativa hacia arriba o hacia abajo del marcador en la muestra de la paciente. También se puede hacer la selección calculando la relevancia estadística (esto es, el valor-p) de la correlación entre la expresión del marcador y la condición o indicación. A ser posible, deben usarse ambos criterios de selección. De este modo, en una materialización de la presente invención, los marcadores asociados al cáncer de mama se seleccionan si cumplen estas dos condiciones: que muestren un cambio de más del doble (aumento o disminución) en expresión en comparación con un patrón y que el valor-p para la correlación entre la existencia del cáncer de mama y el cambio en el marcador de expresión no sea superior a 0,01 (es decir, que sea significativo estadísticamente).
[0045] La expresión de los marcadores identificados en relación con el cáncer de mama se usa entonces para identificar marcadores que puedan diferenciar tumores en tipos clínicos. En una materialización específica que usa una serie de muestras de tumores, los marcadores se identifican mediante el cálculo de correlación de coeficientes entre la categoría clínica o parámetro(s) clínico(s) y el cociente de expresión lineal, logarítmico o cualquier transformación del mismo en todas las muestras de cada gen por separado. Concretamente, el coeficiente de correlación se calcula como
en donde č representa los parámetros o categorías clínicos y ř representa el cociente de expresión lineal, logarítmico o cualquier transformación del mismo entre muestra y control. Los marcadores en los que el coeficiente de correlación exceda de un límite se clasifican como marcadores en relación con el cáncer de mama específicos para un determinado tipo clínico. Dicho límite o umbral coincide con una cierta relevancia de los genes diferenciadores obtenidos mediante simulaciones Monte-Carlo. El umbral depende del imagen1
número de
muestras usadas; el umbral puede calcularse como 3 Ximagen1
donde
es la anchura de distribución y n = el número de muestras. En una materialización específica, los marcadores se eligen si el coeficiente de correlación es superior a 0,3, aproximadamente, o inferior a 0.3, aproximadamente.
[0046] A continuación se calcula la relevancia de la correlación. Dicha relevancia puede calcularse por cualquier medio estadístico con el que se calcule dicha relevancia. En un ejemplo concreto, se genera un conjunto de datos ordenados mediante una técnica Monte-Carlo para aleatorizar la asociación entre la diferencia de expresión de un marcador en particular y la categoría clínica. La distribución de frecuencia de los marcadores que reúnen los requisitos mediante el cálculo de coeficientes correlación se compara con el número de marcadores que reúnen los requisitos en los datos generados mediante la técnica Monte-Carlo. La distribución de frecuencia de los marcadores que reúnen los requisitos en los ensayos Monte-Carlo se usa para determinar si el número de marcadores seleccionados por correlación con los datos clínicos es significativo. Véase el Ejemplo
4.
[0047] Una vez identificado un marcador, los marcadores pueden ordenarse jerárquicamente por su relevancia de diferenciación. Una forma de ordenación jerárquica es por la amplitud de correlación entre el cambio en la expresión y la condición específica que se está diferenciando. Otro medio también muy utilizado es usar una métrica estadística. En una materialización específica, la métrica es una estadística de tipo Fisher:
Ecuación (3)
[0048] En esta ecuación, (x1) es la media ponderada de error del cociente logarítmico de las mediciones de expresión de transcripción dentro de un primer grupo de diagnóstico (por ej., ER(-), x-2) es la media ponderada 10 del cociente logarítmico dentro de un segundo grupo de diagnóstico relacionado con el primero (por ej., ER(+)), σ1 es la varianza del logaritmo del cociente dentro del grupo ER(-) y n1 es el número de muestras para las que se dispone de mediciones válidas de logaritmos del cociente. σ2 es la varianza del cociente logarítmico dentro de un segundo grupo de diagnóstico (por ej., ER(+)), y n2 es el número de muestras para las que se dispone de mediciones válidas de cocientes logarítmicos. El valor-t representa la diferencia de compensación de varianza
15 entre dos medias.
[0049] El conjunto jerarquizado de marcadores puede usarse para optimizar el número de marcadores en el conjunto usado para la diferenciación. Esto se lleva a cabo generalmente en un método de “dejar uno fuera” de la forma siguiente: en un primer ensayo, se usa un subconjunto, por ejemplo 5, de los marcadores de los primeros puestos de la lista jerarquizada para generar una plantilla, donde de X muestras se usan X-1 para generar la 20 plantilla y se predice la categoría de la muestra restante. Este proceso se repite para cada muestra hasta que cada una de las muestras X se haya previsto una vez. En un segundo ensayo, se añaden marcadores adicionales, por ejemplo 5, de modo que ahora se genera una plantilla a partir de 10 marcadores, y se predice el resultado de la muestra restante. Este proceso se repite hasta que se haya usado todo el conjunto de marcadores para generar una plantilla. Para cada uno de los ensayos se cuentan los errores de tipo 1 (falso
25 positivo) y los errores de tipo 2 (falso negativo): el número óptimo de marcadores es aquel número donde la tasa de error 1 o la tasa de error 2, o preferiblemente la tasa total de error 1 y de error 2 sea más baja.
[0050] Para los marcadores de pronóstico, la validación del conjunto de marcadores puede llevarse a cabo mediante una estadística adicional, un modelo de supervivencia. Esta estadística genera la probabilidad de metástasis distantes de tumor como función de tiempo desde el diagnóstico inicial. Se puede usar una serie de
30 modelos, como el Weibull, el normal, el normal logarítmico, el logístico logarítmico, el exponencial logarítmico o el Rayleigh logarítmico (Capítulo 12 de "Life Testing", S-PLUS 2000 GUIDE TO STATISTICS, Vol. 2, p. 368 (2000)). Para el modelo "normal", la probabilidad de metástasis distante P en un tiempo t se calcula como
[0051] donde α es fijo e igual a 1 y τ es un parámetro que hay que ajustar y que mide la “previsión de vida”.
35 [0052] Para todos aquellos experimentados en la técnica resultará evidente que los métodos de más arriba, especialmente los métodos estadísticos, descritos más arriba, no están limitados a la identificación de marcadores asociados al cáncer de mama, sino que pueden usarse para identificar conjuntos de genes marcadores asociados a cualquier fenotipo. El fenotipo puede ser la presencia o ausencia de una enfermedad como el cáncer, o la presencia o ausencia de cualquier categoría clínica de identificación asociado a ese cáncer.
40 En el contexto de las enfermedades, el fenotipo puede ser un pronóstico como el tiempo de supervivencia, la probabilidad de metástasis distante de un estado de enfermedad o la probabilidad de una respuesta específica a un régimen terapéutico o profiláctico. El fenotipo no tiene por qué ser un cáncer o una enfermedad; el fenotipo puede ser una característica nominal asociada a un individuo sano.
5.3.3 RECOGIDA DE MUESTRAS
45 [0053] En la presente invención, se extraen moléculas polinucleótidas destino de una muestra tomada de un individuo aquejado de cáncer de mama. La muestra puede recogerse de cualquier manera clínicamente aceptable, pero siempre de forma que se conserven los polinucleótidos derivados de marcadores (por ej., ARN). A ser posible, el ANRm o los ácidos nucleicos derivados del mismo (esto es, el ADNc o el ADN amplificado) deben etiquetarse de forma que se distingan de las moléculas polinucleótidas de control o patrón y ambos se
50 hibridarán simultánea o independientemente con un biochip que comprenda algunos o todos los marcadores o conjuntos o subconjuntos de marcadores descritos más arriba. Como alternativa, el ANRm o los ácidos nucleicos derivados del mismo pueden etiquetarse con la misma etiqueta que las moléculas polinucleótidas de control o patrón, en las que se compara la intensidad de hibridación de cada uno en una sonda en concreto. La muestra puede consistir en cualquier muestra de tejido clínicamente relevante, como una biopsia tumoral o un aspirado con aguja fina, o una muestra de fluido corporal, como sangre, plasma, suero, linfa, fluido ascítico, fluido cístico, orina o exudado de pezón. La muestra puede tomarse de un ser humano o, en un contexto veterinario, de animales no humanos como rumiantes, equinos, porcinos u ovinos, o de animales domésticos de compañía como felinos y caninos.
[0054] Los métodos para preparar ARN total y poli(A) + son bien conocidos y se describen de modo general en Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)) y Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994)).
[0055] El ARN puede aislarse de las células eucarióticas mediante procesos que implican la lisis de las células y la desnaturalización de las proteínas contenidas en las mismas. Las células de interés consisten en las células de tipo natural (esto es, no cancerosas), las células de tipo natural expuestas a medicamentos, las células tumorales u procedentes de tumores, las células modificadas, las células de línea celular normal o tumoral y las células modificadas expuestas a medicamentos.
[0056] Se pueden ejecutar pasos adicionales para eliminar el ADN. Se puede llevar a cabo una lisis celular con un detergente no iónico seguida de microcentrifugado para eliminar los núcleos y por ende la masa del ADN celular. En una materialización, el ARN se extrae de las células de los diversos tipos de interés mediante lisis de tiocianato de guanidina seguida de centrifugado de CsCl para separar el ARN del ADN (Chirgwin et al., Biochemistry 18:5294-5299 (1979)). El Poli(A)+ ARN se selecciona mediante selección con celulosa oligo-dT (véase Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989). Como alternativa, la separación del ARN del ADN se puede llevar a cabo mediante extracción orgánica, por ejemplo, con fenol caliente o fenol/cloroformo/alcohol isoamílico.
[0057] Si se desea, se puede añadir inhibidores de RNasa al tampón de lisis. Igualmente, para ciertos tipos de células, puede ser aconsejable añadir al protocolo un paso de desnaturalización/digestión de proteína.
[0058] Para muchas aplicaciones, es deseable ante todo enriquecer el ARNm con respecto a otros ARNs celulares, como ARN de transferencia (ARNt) y ARN ribosómico (ARNr). La mayoría de los ARNm contienen una cola de poli(A) en su extremo 3’. Con esto es posible enriquecerlos por afinidad cromatográfica, por ejemplo, mediante oligo(dT) or poly(U) acoplado a un soporte sólido, como celulosa o Sephadex™ (véase Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994). Una vez ligado el poly(A)+ ARNm, se lo eluye de la columna de afinidad mediante 2 mM EDTA/0.1% SDS.
[0059] La muestra de ARN comprende una pluralidad de diferentes moléculas de ARNm, cada una de las cuales tiene una secuencia nucleótida diferente. En una materialización específica, las moléculas de ARNm en la muestra de ARN comprenden al menos 100 secuencias nucleótidas diferentes. Más preferiblemente, las moléculas de ARNm en la muestra de ARN comprenden moléculas de ARNm correspondientes a cada uno de los genes marcadores. En otra materialización específica, la muestra de ARN es una muestra de ARN de mamífero.
[0060] En una materialización específica, se usan ARN o ARNm totales de las células en los métodos de la invención. La fuente de ARN puede ser células de una planta o animal, humano, mamífero, primate, animal no humano, perro, gato, ratón, ave, levadura, eucariota, procariota, etc. En materializaciones específicas, el método de la invención se usa con una muestra que contiene ARNm o ARN total de 1x106 células o menos. En otra materialización se puede aislar las proteínas de las fuentes anteriores con métodos conocidos en la técnica para usarlas en análisis de expresión a nivel proteínico.
[0061] Las sondas a los homólogos de las secuencias de marcadores que aquí se dan a conocer pueden emplearse preferiblemente allí donde se analice ácido nucleico no humano.
5.4 MÉTODOS DE EMPLEO DE LOS CONJUNTOS DE MARCADORES DE CÁNCER DE MAMA
5.4.1 MÉTODOS DE DIAGNÓSTICO
[0062] A continuación se describen métodos de empleo de los conjuntos de marcadores para analizar una muestra de un individuo con el fin de determinar el tipo o subtipo de tumor del individuo a nivel molecular, tanto si es un tumor de tipo ER(+) o ER(-) y tanto si es un tumor asociado a BRCA1 o esporádico. En realidad no es preciso que el individuo esté aquejado de cáncer de mama. Esencialmente, consiste en comparar la expresión de genes de marcadores específicos en el individuo, o una muestra tomada de los mismos, con un patrón o control. Por ejemplo, supongamos dos condiciones en relación con el cáncer de mama, X e Y. Podemos comparar el nivel de expresión de los marcadores de pronóstico de cáncer de mama para la condición X en un
individuo con el nivel de los polinucleótidos derivados del marcador en un control, en donde el nivel representa el nivel de expresión indicado por las muestras que tienen la condición X. En este caso, si la expresión de los marcadores en la muestra del individuo es sustancialmente (esto es, estadísticamente) diferente de la del control, entonces el individuo no tiene condición X. Donde, como aquí, la opción es bimodal (esto es, una muestra es o X 5 o Y), se puede decir adicionalmente que el individuo tiene la condición Y. Por supuesto que también se puede realizar la comparación con un control que represente la condición Y. Preferiblemente, las dos se llevarán a cabo simultáneamente, de modo que cada control actúe a la vez como control positivo y como negativo. Así, el resultado típico puede ser bien una diferencia demostrable respecto a los niveles de expresión (esto es, la cantidad de ARN derivado del marcador, o los polinucleótidos derivados del mismo) representados por el control,
10 o bien ninguna diferencia significativa.
[0063] Así pues, en una materialización, el método para determinar el estado concreto de un individuo en relación con un tumor comprende los pasos de (1) hibridar los nucleótidos destino etiquetados de un individuo con un biochip que contenga uno de los conjuntos de marcadores de más arriba; (2) hibridar las moléculas polinucleótidas de patrón o control con el biochip, en donde las moléculas de patrón o control se etiquetan de 15 forma diferenciada a partir de las moléculas destino, y (3) determinar la diferencia en los niveles de transcripción,
o la ausencia de la misma, entre el destino y el patrón o control, en donde la diferencia, o la ausencia de la misma, determina el estado del individuo en relación con el tumor. En una materialización más específica, las moléculas de patrón o control comprenden polinucleótidos obtenidos de marcadores a partir de una reserva de muestras de individuos normales, o una reserva de muestras de tumores de individuos con tumores de tipo 20 esporádico. En una materialización preferida, el patrón o control es una reserva de polinucleótidos derivados de marcadores generada artificialmente, reserva que está destinada a mimetizar el nivel de expresión de marcadores apreciado en las muestras clínicas de tejido normal o de cáncer de mama que tenga una indicación clínica específica (esto es, canceroso o no canceroso); tumor de ER(+) o ER(-); tumor de BRCA1- o de tipo esporádico. En otra materialización específica, las moléculas de control comprenden una reserva obtenida de
25 líneas celulares normales o de cáncer de mama.
[0064] A continuación se describen conjuntos de marcadores que sirven para distinguir tipos de tumores ER(+) de los de ER(-). Así, en una materialización del método de más arriba, el nivel de polinucleótidos (esto es, ARNm
o polinucleótidos derivados del mismo) en una muestra de un individuo, expresada a partir de los marcadores suministrados en la Tabla 1, se compara con el nivel de expresión de los mismos marcadores a partir de un 30 control, en donde el control comprende polinucleótidos en relación con marcadores obtenidos de muestras de ER(+), de ER (-) o de ambos. Preferiblemente, la comparación será tanto con ER(+) como con ER(-) y preferiblemente la comparación será con reservas de polinucleótidos procedentes de una serie de muestras de ER(+) y ER(-), respectivamente. Allí donde la expresión de marcadores del individuo se parezca más o esté en correspondencia más estrecha con el control de ER(+) y no se parezca o corresponda con el control de ER(-), al
35 individuo se le clasificará como ER(+). Allí donde la reserva no sea ER(+) o ER(-) puros, por ejemplo, se usará una reserva esporádica. Se debe hibridar contra la reserva un conjunto de experimentos que usen individuos con categoría de ER conocida, con el fin de definir las plantillas de expresión para el grupo de ER(+) y de ER(-). A cada individuo con categoría de ER desconocida se lo hibridará contra la misma reserva y se comparará el perfil de expresión con las plantillas (s) para determinar la categoría de ER del individuo.
40 [0065] Lo que se describe a continuación son conjuntos de marcadores que sirven para distinguir los tumores relacionados con BRCA1 de los tumores esporádicos. Por lo tanto, el método puede ejecutarse sustancialmente igual que para la determinación de ER(+/-), con la excepción de que los marcadores son los enumerados en las Tablas 3 y 4 y que los marcadores de control son una reserva de muestras de tumores de BRCA1 de polinucleótidos derivados de marcadores y una reserva de polinucleótidos derivados de marcadores procedente
45 de tumores esporádicos. Se considera que una paciente tiene una mutación germinal de BRCA1 allí donde la expresión de los polinucleótidos derivados de marcador del individuo se parezca más, o donde esté en correspondencia más estrecha, a la del control del BRCA1. Cuando el control no sea BRCA1 o esporádico puros, se pueden definir dos plantillas de manera parecida a la usada para hallar la categoría de ER, como se explica más arriba.
50 [0066] Para las dos anteriores materializaciones del método se puede usar todo el conjunto de marcadores (esto es, el conjunto completo de marcadores para las Tablas 1 o 3). En otras materializaciones se pueden usar subconjuntos de los marcadores. En una materialización preferida se usan los marcadores preferidos enumerados las Tablas 2 o 4.
[0067] La semejanza entre el perfil de expresión de marcadores de un individuo y el de un control puede
55 calcularse de varias maneras. En el caso más simple, los perfiles pueden compararse visualmente en una lista impresa de datos de diferencia de expresión. Como alternativa, la semejanza puede calcularse matemáticamente.
[0068] En una materialización, la medida de la semejanza entre dos pacientes x e y, o una paciente x y una plantilla y, puede calcularse mediante la siguiente ecuación:
Ecuación (5)
En esa ecuación, x e y son dos pacientes con componentes de cociente logarítmico xi e yi, i =1,...,N = 4.986. A va asociado el error σxi. Cuanto menor es el valor σxi, más fiable es la medición xi
es la media aritmética ponderada de error.
[0069] En una materialización preferida, se desarrolla las plantillas por comparación de muestras. Se define la plantilla como la media ponderada de error del cociente logarítmico de la diferencia de expresión para el grupo de genes marcadores capaces de diferenciar la condición específica de la relacionada con el cáncer de mama. Por ejemplo, se definen plantillas para muestras de ER(+) y para muestras de ER(-). A continuación se calcula un parámetro clasificador. Este parámetro puede calcularse mediante diferencias de nivel de expresión entre la muestra y la plantilla o bien hallando un coeficiente de correlación. Dicho coeficiente, Pi, puede calcularse mediante la siguiente ecuación:
donde Zi es la plantilla de expresión i, e y es el perfil de expresión de una paciente.
[0070] De este modo, en una materialización más específica, el método de más arriba para determinar la categoría concreta de un individuo en relación con el tumor comprende los pasos de (1) hibridar los polinucleótidos destino etiquetados de un individuo con un biochip que contenga uno de los conjuntos de marcadores de más arriba; (2) hibridar moléculas polinucleótidas de patrón o control con el biochip, en donde las moléculas de patrón o control están etiquetadas de forma diferenciada con respecto a las moléculas destino; (3) determinar el cociente (o diferencia) de niveles de transcripción entre dos canales (individual y de control), o simplemente los niveles de transcripción del individuo, y (4) comparar los resultados de (3) con las plantillas predefinidas, en donde dicha determinación se lleva a cabo mediante la estadística de la Ecuación 1 o de la Ecuación 5 y en donde la diferencia, o la ausencia de la misma, determina la categoría del individuo en relación con el tumor.
5.4.2 MÉTODOS DE PRONÓSTICO
[0071] La presente invención se refiere a conjuntos de marcadores que sirven para distinguir las muestras de pacientes con buen pronóstico de las muestras de pacientes con pronóstico deficiente. Así pues, la invención suministra un método de uso de estos marcadores para determinar si un individuo aquejado de cáncer de mama tendrá un pronóstico clínico bueno o deficiente. En una materialización, la invención suministra un método para determinar si un individuo aquejado de cáncer de mama tiene probabilidades de experimentar una recaída dentro de los cinco años siguientes al diagnóstico inicial (eso es, si un individuo tiene pronóstico deficiente) que comprende (1) comparar el nivel de expresión de los marcadores enumerados en la Tabla 5 en una muestra tomada del individuo al nivel de los mismos marcadores en un patrón o control, donde los niveles del patrón o control representan los hallados en un individuo con pronóstico deficiente, y (2) determinar si el nivel de los nucleótidos relacionados con marcadores en la muestra del individuo se diferencia significativamente del nivel del control, en donde si no se aprecia una diferencia sustancial, la paciente tiene pronóstico deficiente, mientras que si hay una diferencia sustancial, la paciente tiene buen pronóstico. Los experimentados en la técnica advertirán en seguida que los marcadores asociados al buen pronóstico también pueden usarse como controles. En una materialización más específica se prueban ambos controles. En caso de que la reserva no sea “buen pronóstico” o “pronóstico deficiente” puros, debe hibridarse contra la reserva un conjunto de experimentos con individuos con resultado conocido, para definir las plantillas de expresión para los grupos de buen diagnóstico y diagnóstico deficiente. A cada individuo con resultado desconocido se lo hibrida contra la misma reserva y el perfil de expresión resultante se compara con las plantillas para predecir el resultado del mismo.
[0072] El pronóstico deficiente del cáncer de mama puede indicar que un tumor es relativamente agresivo, mientras que el buen pronóstico puede indicar que un tumor es relativamente no agresivo. Existe un método para determinar el curso del tratamiento de una paciente de cáncer de mama, que consiste en determinar si el nivel de expresión de los 231 marcadores de la Tabla 5, o un subconjunto de los mismos, se corresponde con el nivel de dichos marcadores en una muestra que representa un patrón de expresión de buen pronóstico o un patrón de pronóstico deficiente, y determinar una duración de tratamiento, en donde si la expresión se corresponde con el patrón de pronóstico deficiente, el tumor es tratado como tumor agresivo.
[0073] Al igual que con los marcadores de diagnóstico, el método puede usar el conjunto completo de marcadores enumerados en la Tabla 5. Sin embargo, también pueden usarse subconjuntos de los marcadores. En una materialización preferida, se usa el subconjunto enumerado en la Tabla 6.
[0074] La clasificación de una muestra como “buen pronóstico” o “pronóstico deficiente” se lleva a cabo de manera sustancialmente igual que para los marcadores de diagnóstico descritos más arriba, en donde se genera una plantilla con la que se comparan los niveles de expresión de marcadores en la muestra.
[0075] El uso de conjuntos de marcadores no está limitado a los estados referentes al pronóstico del cáncer de mama, por lo que puede aplicarse en una variedad de fenotipos o estados, clínicos o experimentales, donde juegue algún papel la expresión de genes. Allí donde se haya identificado un conjunto de marcadores que corresponda a dos o más fenotipos puede usarse los conjuntos de marcadores para distinguir dichos fenotipos. Por ejemplo, los fenotipos pueden ser el diagnóstico y/o el pronóstico de categorías clínicas o fenotipos asociados a otros cánceres, otros estados de enfermedad u otros estados fisiológicos, en donde los datos de nivel de expresión proceden de un conjunto de genes en correlación con el estado de enfermedad o fisiológico concreto.
5.4.3 MEJORA DE LA SENSIBILIDAD A LAS DIFERENCIAS DE NIVEL DE EXPRESIÓN
[0076] Al usar los marcadores que aquí se dan a conocer y, de hecho, al usar cualquier conjunto de marcadores para diferenciar a un individuo con un fenotipo de otro individuo con un segundo fenotipo, podemos comparar la expresión absoluta de cada uno de los marcadores de una muestra con un control; por ejemplo, el control puede ser el del nivel medio de expresión de cada uno de los marcadores, respectivamente, en una reserva de individuos. Para aumentar la sensibilidad de la comparación, no obstante, los valores del nivel de expresión deben transformarse preferentemente de una serie de maneras.
[0077] Por ejemplo, el nivel de expresión de cada uno de los marcadores puede normalizarse por el nivel medio de expresión de todos los marcadores cuyo nivel de expresión se determina, o por el nivel medio de expresión de un conjunto de genes de control. Así, en una materialización, los marcadores se representan con sondas en un biochip y el nivel de expresión de cada uno de los marcadores se normaliza mediante la media o la mediana del nivel de expresión en todos los genes representados en el biochip, incluido cualquier gen no marcador. En una materialización específica, la normalización se lleva a cabo dividiendo la mediana o media del nivel de expresión de todos los genes del biochip. En otra materialización, el nivel de expresión de los marcadores se normaliza mediante la media o la mediana del nivel de expresión de un conjunto de marcadores de control. En una materialización específica, los marcadores de control comprenden un conjunto de genes constitutivos. En otra materialización específica, la normalización se lleva a cabo dividiendo por la mediana o media del nivel de expresión de los genes de control.
[0078] La sensibilidad de un ensayo basado en marcadores aumentará también si los niveles de expresión de marcadores individuales se comparan con la expresión de esos mismos marcadores en una reserva de muestras. Preferiblemente, la comparación se hará con la media o la mediana del nivel de expresión de cada uno de los genes marcadores en la reserva de muestras. Dicha comparación puede realizarse, por ejemplo, dividiendo por la media o la mediana del nivel de expresión de la reserva para cada uno de los marcadores del nivel de expresión cada uno de los marcadores de la muestra. Esto produce el efecto de acentuar las diferencias relativas de expresión entre los marcadores de la muestra y los marcadores de la reserva en conjunto, haciendo las comparaciones más sensibles y con más probabilidades de que produzcan resultados significativos que si solo se usan niveles de expresión absolutos. Los datos del nivel de expresión pueden transformarse de la forma que más convenga; preferiblemente, los datos del nivel de expresión para todos se transforman a logaritmo antes de tomar las medias o las medianas.
[0079] Para realizar comparaciones con una reserva pueden usarse dos métodos. Primero, los niveles de expresión de los marcadores de la muestra pueden compararse con el nivel de expresión de aquellos marcadores de la reserva donde el ácido nucleico procedente de la muestra y el ácido nucleico procedente de la reserva se hibridan en el curso de un único experimento. Dicho método exige que se genere nuevo ácido nucleico en la reserva para cada comparación o números limitados de comparaciones, por lo que se halla limitado por la cantidad de ácido nucleico disponible. Como alternativa, y preferiblemente, los niveles de expresión en una reserva, ya estén normalizados y/o transformados o no, se almacenarán en un ordenador, o en soportes informáticos, para usarlos en comparaciones con los datos individuales de nivel de expresión de la muestra (esto es, datos de un solo canal).
[0080] Así pues, la presente invención suministra el siguiente método para clasificar una primera célula u organismo como poseedor de uno de al menos dos diferentes fenotipos, donde los diferentes fenotipos comprenden un primer fenotipo y un segundo fenotipo. El nivel de expresión de cada gen de una pluralidad de ellos en una primera muestra procedente de la primera célula u organismo se compara con el nivel de expresión de cada uno de dichos genes, respectivamente, en una muestra colectiva de una pluralidad de células u organismos, pluralidad de células u organismos que comprende diferentes células u organismos que muestran al menos dos diferentes fenotipos, respectivamente, como se dice más arriba, para producir un primer valor comparado. El primer valor comparado se compara a continuación con un segundo valor comparado, en donde dicho segundo valor comparado es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo que se caracteriza por tener el segundo fenotipo al nivel de expresión de cada uno de dichos genes, respectivamente, en la muestra colectiva. Opcionalmente, se puede comparar el primer valor comparado con valores comparados adicionales, respectivamente, donde cada valor comparado adicional es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo que se caracteriza por tener un fenotipo diferente de dichos primer y segundos fenotipos, pero incluido entre al menos dos diferentes fenotipos, al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva. Por último, se determina a cuál de dichos segundo, tercer y, si está presente, uno o más valores comparados adicionales se parece más dicho primer valor comparado, en donde se clasifica la primera célula u organismo como poseedor del fenotipo de la célula u organismo usado para producir dicho valor comparado más parecido a dicho primer valor comparado.
[0081] En una materialización específica de este método, cada uno de los valores comparados es un cociente de los niveles de expresión de cada uno de dichos genes. En otra materialización específica, se normaliza cada uno de los niveles de expresión de cada uno de los genes de la muestra colectiva antes de proceder a cualquier paso de la comparación. En una materialización más específica, la normalización de los niveles de expresión se lleva a cabo dividiendo por la mediana o media del nivel de expresión de cada uno de los genes o dividiendo por la media o mediana del nivel de expresión de uno o más genes constitutivos de la muestra colectiva de dicha célula u organismo. En otra materialización específica, los niveles de expresión normalizados se someten a una transformación logarítmica y los pasos de la comparación consisten en restar la transformación logarítmica del logaritmo de los niveles de expresión de cada uno de los genes de la muestra. En otra materialización específica, los dos o más diferentes fenotipos son diferentes etapas de una enfermedad o trastorno. En otra materialización específica, los dos o más diferentes fenotipos son diferentes pronósticos de una enfermedad o trastorno. En otra materialización específica más, los niveles de expresión de cada uno de los genes, respectivamente, de la muestra colectiva o de dichos niveles de expresión de cada uno de dichos genes de una muestra de la célula u organismo que se caracteriza por tener el primer fenotipo, segundo fenotipo o dicho fenotipo diferente de dichos primer y segundo fenotipos, respectivamente, se almacenan en un ordenador o en un soporte informático.
[0082] En otra materialización específica, los dos fenotipos tienen categoría de ER(+) o ER(-). En otra materialización específica, los dos fenotipos tienen categoría de BRCA1 o de tumor esporádico. En otra materialización específica más, los dos fenotipos son de buen pronóstico y de pronóstico deficiente.
[0083] Se pueden usar también, por supuesto, datos de un solo canal sin comparación específica con una reserva de muestras matemática. Por ejemplo, se puede clasificar una muestra como poseedora de un primer o un segundo fenotipo, en donde el primer y el segundo fenotipos están relacionados, calculando la semejanza de la expresión de al menos 5 marcadores en la muestra, donde los marcadores están en correlación con el primer
o el segundo fenotipo, con la expresión de los mismos marcadores en una primera plantilla de fenotipos y una segunda plantilla de fenotipos, (a) etiquetando ácidos nucleicos procedentes de una muestra con un fluoróforo para obtener una reserva de ácidos nucleicos etiquetados con fluoróforo; (b) poniendo en contacto dicho ácido nucleico etiquetado con fluoróforo con un biochip en condiciones en las que pueda darse la hibridación, detectando en cada uno de una pluralidad de diferentes loci del biochip una señal de emisión fluorescente procedente de dicho ácido nucleico etiquetado con fluoróforo que está ligado a dicho biochip en dichas condiciones, y (c) determinando la semejanza de expresión de genes marcadores de la muestra individual con la primera y segunda plantillas, en donde si dicha expresión es más parecida a la primera plantilla, se clasifica la muestra como poseedora del primer fenotipo, mientras que si dicha expresión es más parecida a la segunda plantilla, se clasifica la muestra como poseedora del segundo fenotipo.
5.5 DETERMINACIÓN DE LOS NIVELES DE EXPRESIÓN DE GENES MARCADORES
5.5.1 MÉTODOS
[0084] Los niveles de expresión de los genes marcadores de una muestra pueden determinarse por cualquier medio conocido en la técnica. El nivel de expresión puede determinarse aislando y determinando el nivel (esto es, la cantidad) de ácido nucleico transcrito de cada gen marcador. Como alternativa, o adicionalmente, se puede determinar el nivel de proteínas específicas convertidas desde el ARNm transcrito de un gen marcador.
[0085] El nivel de expresión de genes marcadores específicos puede hallarse determinando la cantidad de ARNm, o de polinucleótidos derivados del mismo, presente en una muestra. Puede usarse cualquier método para determinar los niveles de ARN. Por ejemplo, se aísla el ARN de una muestra y se lo separa en un gel de agarosa. A continuación el ARN separado se transfiere a un soporte sólido, como puede ser un filtro. Luego se hibridan con el filtro mediante hibridación northern sondas de ácido nucleico que representan uno o más marcadores y se determina la cantidad de ARN procedente del marcador. Dicha determinación puede ser visual o asistida por ordenador, por ejemplo, mediante un densitómetro. Otro método de determinar los niveles de ARN consiste en el uso de un dot-blot (borrón de puntos) o un slot-blot (borrón de ranura). En este método se etiqueta el ARN de una muestra, o el ácido nucleico derivado del mismo. A continuación el ARN o el ácido nucleico derivado del mismo se hibrida con un filtro que contiene oligonucleótidos procedentes de uno o más genes marcadores, en donde los oligonucleótidos se colocan sobre el filtro en posiciones diferenciadas y fácilmente identificables. La hibridación, o la ausencia de la misma, del ARN etiquetado con los oligonucleótidos ligados al filtro se determina visualmente o mediante densitómetro. Los polinucleótidos se pueden etiquetar mediante radiomarcaje o con una etiqueta fluorescente (esto es, visible).
[0086] Estos ejemplos no pretenden ser restrictivos; en la técnica se conocen otros métodos para determinar la abundancia de ARN.
[0087] El nivel de expresión de genes marcadores concretos puede calcularse también determinando el nivel de la proteína específica expresado a partir de los genes marcadores. Esto puede realizarse, por ejemplo, mediante la separación de proteínas de una muestra en un gel de poliacrilamida, seguida de la identificación de proteínas específicas derivadas de marcador mediante anticuerpos en un borrón de western. Como alternativa, las proteínas se pueden separar mediante sistemas de electroforesis bidimensional en gel. La electroforesis bidimensional en gel es bien conocida en la técnica y normalmente consiste en un enfoque isoeléctrico a lo largo de una primera dimensión seguido de electroforesis de SDS-PAGE (sistema de dilución simple-electroforesis en gel de poliacrilamida) a lo largo de una segunda dimensión. Véase, por ej., Hames et al, 1990, GEL ELECTROPHORESIS OF PROTEINS: A PRACTICAL APPROACH, IRL Press, New York; Shevchenko et al., Proc. Nat’l Acad. Sci. USA 93: 1440-1445 (1996); Sagliocco et al., Yeast 12:1519-1533 (1996); Lander, Science 274:536-539 (1996). Los electroferogramas resultantes pueden analizarse con numerosas técnicas, incluidas las técnicas de espectrometría de masas, los borrones de western y el análisis de inmunotransferencia mediante anticuerpos policlonales y monoclonales.
[0088] Como alternativa, los niveles de proteínas derivadas de marcadores pueden determinarse construyendo un biochip de anticuerpos en el que los centros de unión comprenden anticuerpos específicos, inmovilizados y preferiblemente monoclonales, a una pluralidad de especies proteínicas codificadas por el genoma de la célula. Preferiblemente, los anticuerpos estarán presentes en una fracción sustancial de las proteínas derivadas de marcadores que interesen. Los métodos para hacer anticuerpos monoclonales son bien conocidos (véase, por ej., Harlow and Lane, 1988, ANTIBODIES: A LABORATORY MANUAL, Cold Spring Harbor, New York). En una materialización, se crían anticuerpos monoclonales contra fragmentos de péptido sintético diseñados sobre la base de la secuencia genómica de la célula. Con dicho despliegue de anticuerpos, las proteínas procedentes de la célula se ponen en contacto con el despliegue y su unión se somete a prueba con ensayos conocidos en la técnica.
De modo general, la expresión, y el nivel de expresión, de proteínas de diagnóstico o pronóstico de interés pueden detectarse por tinción inmunohistoquímica de rodajas o secciones de tejido.
[0089] Por último, la expresión de genes marcadores en una serie de especímenes de tejido puede caracterizarse mediante un “despliegue de tejidos” (Kononen et al., Nat. Med 4 (7): 844-7 (1998)). En un despliegue de tejidos se calculan múltiples muestras de tejidos en el mismo biochip. Los despliegues permiten la detección in situ de los niveles de ARN y proteínas; las secciones consecutivas permiten el análisis de múltiples muestras simultáneamente.
5.5.2 BIOCHIPS
[0090] En materializaciones preferidas, se usan biochips para medir la expresión a fin de que la categoría de expresión de cada uno de los marcadores de más arriba se calcule simultáneamente. Se describen despliegues de oligonucleótidos y ADNc que comprenden sondas hibridables con los genes correspondientes a cada uno de los conjuntos de marcadores descritos más arriba (esto es, marcadores para distinguir la categoría de ER; marcadores para distinguir tumores de BRCA1 de tumores esporádicos; marcadores para distinguir pacientes con buen pronóstico de pacientes con pronóstico deficiente; marcadores para distinguir tanto ER (+) de ER (-) como tumores de BRCA1 de tumores esporádicos; marcadores para distinguir ER (+) de ER (-) y pacientes con buen pronóstico de pacientes con pronóstico deficiente; marcadores para distinguir tumores de BRCAI de tumores esporádicos y pacientes con buen pronóstico de pacientes con pronóstico deficiente; marcadores capaces de distinguir ER (+) de ER (-), tumores de BRCA1 de tumores esporádicos y pacientes con buen pronóstico de pacientes con pronóstico deficiente, y marcadores únicos para cada categoría).
[0091] Los biochips pueden comprender sondas hibridables con los genes con marcadores capaces de distinguir la categoría de una, dos o hasta las tres categorías clínicas indicados más arriba. Se suministran despliegues polinucleótidos que comprenden sondas a un subconjunto o subconjuntos de al menos 50, 100, 200, 300, 400, 500, 750, 1.000, 1.250, 1.500, 1.750, 2.000 o 2.250 marcadores genéticos, hasta el conjunto total de
2.460 marcadores, que distinguen entre ER (+) y ER (-) pacientes o tumores. También se suministran sondas a subconjuntos de al menos 20,30, 40, 50, 75, 100, 150, 200, 250, 300, 350 o 400 marcadores, hasta el conjunto total de 430 marcadores, que distinguen entre tumores que contienen una mutación de BRCA1 y tumores esporádicos dentro de un grupo de tumores ER (-). Además, se suministran sondas a subconjuntos de al menos 20, 30, 40, 50, 75, 100, 150 o 200 marcadores, hasta el conjunto total de 231 marcadores, que distinguen entre pacientes con buen pronóstico y pronóstico deficiente dentro de los tumores esporádicos. En una materialización específica, el despliegue comprende sondas a conjuntos o subconjuntos de marcadores dirigidos a las tres categorías clínicas.
[0092] En otra materialización específica, los biochips que se usan en los métodos que aquí se muestran poseen marcadores adicionales a al menos algunos de los marcadores enumerados en las Tablas 1-6. Por ejemplo, en una materialización específica, el biochip es un despliegue de cribado o escaneo como el que se describe en Altschuler et al., International Pub. WO 02/18646, de 7 Marrzo de 2002 y Scherer et al., International Pub. WO 02/16650, del 28 de febrero de 2002. Los despliegues de cribado y escaneo comprenden sondas de posición direccionable situadas a intervalos regulares y derivadas de la secuencia del ácido nucleico genómico, tanto expresa como no. También pueden comprender sondas en un subconjunto, o la totalidad de marcadores enumerados en las Tablas 1-6, o un subconjunto de los mismos, como se explica más arriba, y se puede usar para monitorizar la expresión de marcadores de la misma forma que un biochip que contenga sólo los marcadores enumerados en las Tablas 1-6.
[0093] En otra materialización específica más, el biochip es un biochip de ADNc disponible en el mercado que comprende al menos cinco de los marcadores enumerados en las Tablas 1-6. Preferiblemente, dicho biochip de ADNc disponible en el mercado comprenderá todos los marcadores enumerados en las Tablas 1-6. No obstante, dicho biochip puede comprender 5, 10, 15, 25, 50, 100, 150, 250, 500, 1.000 o más marcadores en cualquiera de las Tablas 1-6, hasta el número máximo de marcadores de una Tabla, y puede comprender todos los marcadores de cualquier Tablas 1 a 6 y un subconjunto de otra de las Tablas 1-6, o subconjuntos de cada una, como se explica más arriba. En una materialización específica de los métodos en este documento, los marcadores que son todas o parte de Tablas 1-6 constituyen al menos el 50%, 60%, 70%, 80%, 90%, 95% o 98% de las sondas del biochip.
[0094] En las siguientes secciones se describen métodos generales concernientes a la construcción de biochips y que comprenden los conjuntos y/o subconjuntos de más arriba.
5.5.2.1 CONSTRUCCIÓN DE BIOCHIPS
[0095] Los biochips se preparan seleccionando sondas que comprenden una secuencia de polinucleótidos, para a continuación inmovilizar dichas sondas en un soporte o una superficie sólidos. Por ejemplo, las sondas pueden comprender secuencias de ADN, secuencias de ARN o secuencias de copolímeros de ADN y ARN. Las secuencias de polinucleótidos de las sondas pueden comprender también análogos de ADN y/o ARN, o combinaciones de los mismos. Por ejemplo, las secuencias de polinucleótidos de las sondas pueden estar llenas de fragmentos parciales de ADN genómico. Las secuencias de polinucleótidos de las sondas pueden ser también secuencias sintetizadas de nucleótidos, como las secuencias sintéticas de oligonucleótidos. Las secuencias de sondas pueden sintetizarse bien de manera enzimática, in vivo, enzimática in vitro (por ej., por PCR) o no enzimática in vitro.
[0096] La sonda o sondas usadas en los métodos de la invención estarán preferiblemente inmovilizadas en un soporte sólido que puede ser tanto poroso como no poroso. Por ejemplo, las sondas de la invención pueden ser secuencias de polinucleótidos que están sujetas a una membrana o filtro de nitrocelulosa o nailon por unión covalente por cualquiera de los dos extremos, 3’ o 5’, del polinucleótido. Tales sondas de hibridación son bien conocidas en la técnica (véase, por ej., Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989). Como alternativa, el soporte o superficie sólidos pueden ser una superficie de cristal o plástico. En una materialización especialmente preferida, los niveles de hibridación se miden con respecto a biochips de sondas que constan de una fase sólida en cuya superficie se halla inmovilizada una población de polinucleótidos, como una población de ADN o mímicos de ADN o, como alternativa, una población de ARN o mímicos de ARN. La fase sólida puede ser un material no poroso u opcionalmente poroso, como un gel
[0097] En la materializaciones preferidas, el biochip comprende un soporte o superficie con un despliegue ordenado de centros de unión (por ej., por hibridación) o “sondas”, cada una de las cuales representa uno de los marcadores descritos en este documento. Preferiblemente, los biochips serán despliegues direccionables y, más preferiblemente, despliegues de posición direccionable. Más concretamente, cada sonda del despliegue estará situada preferiblemente en una ubicación conocida y predeterminada en el soporte sólido de modo que la identidad (esto es, la secuencia) de cada sonda pueda determinarse a partir de su posición en el despliegue (esto es, en el soporte o superficie). En las materializaciones preferidas, cada prueba está fijada al soporte sólido por unión covalente por un solo punto.
[0098] Los biochips pueden hacerse de varias maneras, algunas de las cuales se describen a continuación. Independientemente de la forma en que se produzcan, los biochips comparten ciertas características. Los biochips son reproducibles, por lo que se puede producir múltiples copias de un biochip concreto y compararlas una con otra. Preferiblemente, los biochips estarán hechos de materiales que sean estables en condiciones de unión (por ej., hibridación del ácido nucleico). Los biochips serán preferiblemente pequeños, por ej., entre 1 cm2 y 25 cm2, entre 12 cm2 y 13 cm2, o 3 cm2. Sin embargo, también se contemplan biochips de mayor tamaño, que hasta pueden ser preferibles, por ej. para usarlos en despliegues de cribado. Preferiblemente, un centro de unión concreto o un único conjunto de centros de unión en el biochip se unirá (por ej., hibridará) específicamente al producto de un único gen en una célula (por ej., a un ARNm específico, o a un ADNm específico derivado del mismo). No obstante, en general, otras secuencias relacionadas o parecidas se vincularán a un determinado centro de unión por hibridación cruzada.
[0099] Los biochips de la presente invención incluyen una o más sondas de ensayo, cada una de las cuales tiene una secuencia polinucleótida que es complementaria con una subsecuencia de ARN o ADN que hay que detectar. Preferiblemente, se conocerá la ubicación de cada sonda en la superficie sólida. De hecho, los biochips serán preferiblemente despliegues de posición direccionable. En concreto, cada sonda del despliegue estará situada preferiblemente en una ubicación conocida y predeterminada del soporte sólido, de modo que la identidad (esto es, la secuencia) de cada sonda pueda determinarse a partir de su posición en el despliegue (esto es, en el soporte o superficie).
[0100] Según la invención, el biochip es un despliegue (esto es, una matriz) en el que cada posición representa uno de los marcadores descritos en este documento. Por ejemplo, cada posición puede contener un ADN o un análogo de ADN basado en el ADN genómico con el que puede hibridar específicamente un ARN o ADNc concretos transcritos del marcador genético. El ADN o análogo de ADN puede ser, por ej., un oligómero sintético
o un fragmento de gen. En una materialización, las sondas que representan cada uno de los marcadores están presentes en el despliegue. En una materialización preferida, el despliegue comprende los 550 de los 2.460 marcadores de categoría ER-, 70 de los marcadores BRCA1/esporádicos y el total de los 231 marcadores de pronóstico.
5.5.2.2 PREPARACIÓN DE SONDAS PARA BIOCHIPS
[0101] Como se indica más arriba, la “sonda” con la que según la invención se hibrida específicamente una molécula polinucleótida concreta contiene una secuencia polinucleótida genómica complementaria. Las sondas del biochip consistirán preferiblemente en secuencias nucleótidas de no más de 1.000 nucleótidos. En algunas materializaciones, las sondas deI despliegue consisten en secuencias nucleótidas de 10 a 1.000 nucleótidos. En una materialización preferida, las secuencias nucleótidas de las sondas son del orden de 10-200 nucleótidos de longitud y son secuencias genómicas de una especie de organismo, de modo que se halla presente una pluralidad de diferentes sondas, con secuencias complementarias y por lo tanto capaces de hibridar con el genoma de dicha especie u organismo, superpuestas en secuencia por todo o parte de dicho genoma. En otras materializaciones específicas, las sondas son del orden de 10-30 nucleótidos de longitud, del orden de 10-40 nucleótidos de longitud, del orden de 20-50 nucleótidos de longitud, del orden de 40-80 nucleótidos de longitud, del orden de 50-150 nucleótidos de longitud, del orden de 80-120 nucleótidos de longitud y, más preferiblemente, de 60 nucleótidos de longitud.
[0102] Las pruebas pueden comprender ADN o “mímicos” de ADN (por ej., derivados y análogos) correspondientes a una porción del genoma de un organismo. En otra materialización, las sondas del biochip son complementarios de ARN o mímicos de ARN. Los mímicos de ADN son polímeros compuestos de subunidades capaces de hibridación específica de tipo Watson-Crick con ADN, o de hibridación específica con ARN. Los ácidos nucleicos pueden modificarse en la fracción de base, en la fracción de azúcar o en el esqueleto del fosfato. Como ejemplo de mímicos de ADN se puede citar, por ej. los fosforotioatos.
[0103] El ADN se puede obtener, por ej., por reacción en cadena de polimerasa (PCR), por amplificación del ADN genómico o por secuencias clonadas. Los cebadores de PCR se elegirán preferiblemente sobre la base de una secuencia conocida del genoma, que resultará en la amplificación de fragmentos específicos de ADN genómico. Hay programas informáticos bien conocidos en la técnica que sirven para diseñar cebadores con la especificidad requerida y las propiedades óptimas de amplificación, como la versión 5.0 de Oligo (National Biosciences). Típicamente, cada sonda del despliegue estará entre 10 bases y 50.000 bases, normalmente entre 300 bases y 1.000 bases de longitud. Los métodos de PCR son bien conocidos en la técnica y se describen, por ejemplo, en Innis et al., eds., PCR PROTOCOLS: A GUIDE TO METHODS AND APPLICATIONS, Academic Press Inc., San Diego, CA (1990). Para los experimentados en la técnica resultará evidente que los sistemas robóticos de control son útiles para aislar y amplificar los ácidos nucleicos.
[0104] Un medio preferido alternativo para generar las sondas polinucleótidas del biochip lo constituye la síntesis de polinucleótidos u oligonucleótidos sintéticos, por ej., mediante químicas de N-fosfonato o fosforamidita (Froehler et al., Nucleic Acid Res. 14:5399-5407 (1986); McBride et al., Tetrahedron Lett. 24:246-248 (1983)).
Las secuencias sintéticas tienen típicamente de unas 10 a unas 500 bases de longitud, y más preferiblemente de unas 40 a unas 70 bases de longitud. En algunas materializaciones, los ácidos nucleicos sintéticos incluyen bases no naturales, como por ejemplo, pero en modo alguno limitadas a ella, la inosina. Como se indica más arriba, se pueden usar análogos de ácido nucleico como centros de unión para hibridación. Un ejemplo de ácido nucleico adecuado es el ácido nucleico péptido (véase por ej., Egholm et al., Nature 363:566-568 (1993); U.S. Patent No. 5,539,083). Las sondas se seleccionarán preferiblemente mediante un algoritmo que tiene en cuenta las energías de unión, la composición de la base, la complejidad de la secuencia, las energías de unión de la hibridación cruzada y la estructura secundaria (véase Friend et al., International Patent Publication WO 01/05935, publicado el 25 de enero de 2001; Hughes et al., Nat. Biotech. 19:342-7 (2001)).
[0105] Un operario experimentado advertirá también que las sondas de control positivo, por ej., las sondas de las que se sabe que son complementarias e hibridables con secuencias en las moléculas del polinucleótido destino y las sondas de control negativo, por ej. las sondas de las que se sabe que no son complementarias e hibridables con secuencias en las moléculas del polinucleótido destino, deben incluirse en el despliegue. En una materialización, los controles positivos se sintetizan a lo largo del perímetro del despliegue. En otra materialización, los controles positivos se sintetizan en franjas diagonales a través del despliegue. En otra materialización más, el complemento inverso para cada sonda se sintetiza junto a la posición de la sonda para que sirva de control negativo. Y en otra materialización más, se usan secuencias de otras especies de organismo como controles negativos y como controles “enclavados”.
5.5.2.3 SUJECCIÓN DE SONDAS A LA SUPERFICIE SÓLIDA
[0106] Las sondas se sujetan a un soporte o superficie sólidos, que pueden estar hechos por ej. de vidrio, de plástico (por ej. polipropileno, nailon), poliacrilamida, nitrocelulosa, gel u otro material poroso o no poroso. Un método preferido para sujetar los ácidos nucleicos a una superficie es imprimiendo en placas de vidrio, como se explica de modo general en Schena et al, Science 270:467-470 (1995). Este método es especialmente útil para preparar biochips de ADNc (véase también DeRisi et al, Nature Genetics 14:457-460 (1996); Shalon et al., Genome Res. 6:639-645 (1996); and Schena et al., Proc. Natl. Acad. Sci. U.S.A. 93:10539-11286 (1995)).
[0107] Un segundo método preferido para hacer biochips es hacer despliegues de alta densidad. Se conocen técnicas para producir despliegues que contienen miles de oligonucleótidos complementarios para secuencias definidas en ubicaciones definidas en una superficie mediante técnicas fotolitográficas para síntesis in situ (véase Fodor et al., 1991, Science 251:767-773; Pease et al., 1994, Proc. Natl. Acad. Sci. U.S.A. 91:5022-5026; Lockhart et al., 1996, Nature Biotechnology 14:1675; Patentes U.S. Nos. 5,578,832, 5,556,752 y 5,510,270) u otros métodos para síntesis y deposición rápidas de oligonucleótidos definidos (Blanchard et al., Biosensors & Bioelectronics 11:687-690). Cuando se usan estos métodos, los oligonucleótidos (por ej., 60-meros) de secuencia conocida se sintetizan directamente sobre una superficie tal como un portaobjeto de cristal derivatizado. Por lo general, el despliegue producido es redundante, con varias moléculas oligonucleótidas por cada ARN.
[0108] Se pueden usar otros métodos para hacer biochips, por ej. por enmascaramiento (Maskos and Southern, 1992, Nuc. Acids. Res. 20: 1679-1684). En principio, y como se indica más arriba, se puede usar cualquier tipo de despliegue, por ejemplo, borrones de puntos (dot blots) en una membrana de hibridación de nailon (véase Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)). No obstante, como advertirán los experimentados en la técnica, muchas veces son preferibles despliegues muy pequeños, ya que los volúmenes de hibridación serán menores.
[0109] En una materialización, los despliegues de la presente invención se preparan sintetizando sondas polinucleótidas en un soporte. En dicha materialización, las sondas polinucleótidas van sujetas al soporte por unión covalente por cualquiera de los dos extremos, 3’ o 5’, del polinucleótido.
[0110] En una materialización especialmente preferida, se fabrican biochips de la invención mediante un dispositivo de impresión por chorro de tinta para síntesis de oligonucleótidos, por ej. con los métodos y sistemas descritos por Blanchard en U.S. Pat. No. 6,028,189; Blanchard et al., 1996, Biosensors and Bioelectronics 11:687-690; Blanchard, 1998, in SYNTHETIC DNA ARRAY IN GENETIC ENGINEERING, Vol. 20, J.K. Setlow, Ed., Plenum Press, New York, páginas 111-123. Concretamente, las sondas polinucleótidas de dichos biochips se sintetizarán preferiblemente en despliegues, por ej. en un portaobjeto de cristal, depositando en serie bases nucleótidas individuales en “microgotitas” de un disolvente de alta tensión superficial, como el carbonato de propileno. Las microgotitas tienen un volumen muy pequeño (por ej. 100 pL o menos, más preferiblemente 50 pL
o menos) y están separadas unas de otras en el biochip (por ej. por dominios hidrófobos) para formar pozos de tensión de superficie circular que definen las posiciones de los elementos del despliegue (esto es, las diferentes sondas). Los biochips fabricados con este método de chorro de tinta suelen ser de alta densidad, preferiblemente con una densidad de al menos 2,500 diferentes sondas por cm2. Las sondas poliucleótidas están sujetas al soporte por unión covalente por cualquiera de los dos extremos, 3’ o 5’, del polinucleótido.
5.5.2.4 MOLÉCULAS POLINUCLEÓTIDAS DESTINO
[0111] Las moléculas polinucleótidas que pueden analizarse mediante la presente invención (las “moléculas polinucleótidas destino”) pueden ser de cualquier origen clínicamente relevante, pero se expresan como ARN o como un ácido nucleico derivado del mismo (por ej. ADNc o ARN amplificado derivado de ADNc que lleva incorporado un promotor de polimerasa de ARN), incluidas moléculas de ácido nucleico de generación natural, así como moléculas de ácido nucleico sintético. En una materialización, las moléculas polinucleótidas destino comprender ARN, incluyendo, pero sin limitarse en absoluto a ellos, ARN celular total, ARN mensajero poli(A)+ (ARNm) o fracción del mismo, ARNm citoplásmico o ARN transcrito de ADNc (esto es, ARNc, véase, por ej., Linsley & Schelter, U.S. Patent Application No. 09/411,074, registrada el 4 de octubre de 1999, o las Patentes
U.S. Nos. 5,545,522, 5,891,636, o 5,716,785). Los métodos para preparer ARN total y poli(A)+ son bien conocidos en la técnica y se describen de modo general en, por ej., Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989). En una materialización, se extrae ARN de células de los diversos tipos de interés de esta invención por lisis de tiocianato de guanidina seguida de centrifugado CsCl (Chirgwin et al., 1979, Biochemistry 18: 5294-5299). En otra materialización, se extrae ARN total mediante una columna de silicio con base de gel, comercializada por RNeasy (Qiagen, Valencia, California) y StrataPrep (Stratagene, La Jolla, California). En una materialización alternativa, que es preferida para S. cerevisiae, se extrae ARN de células mediante fenol y cloroformo, como se explica en Ausubel et al., eds., 1989, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Vol III, Green Publishing Associates, Inc., John Wiley & Sons, Inc., New York, págs. 13.12.1-13.12.5). El ARN Poli(A)+ puede seleccionarse, por ej., por selección con celulosa oligo-dT o, como alternativa, por transcripción inversa cebada de oligo-dT del ARN celular total. En una materialización, se puede fragmentar el ARN con métodos conocidos en la técnica, por ej., por incubación con ZnCl2, para generar fragmentos de ARN. En otra materialzación, las moléculas polinucleótidas analizadas por la invención comprenden ADNc, o productos PCR de ARN o ADNc amplificados.
[0112] En una materialización, el ARN total, el ARNm o los ácidos nucleicos derivados de los mismos son aislados de una muestra tomada de una persona aquejada de cáncer de mama. Las moléculas polinucleótidas destino que están pobremente expresadas en células concretas pueden enriquecerse mediante técnicas de normalización (Bonaldo et al., 1996, Genome Res. 6:791-806).
[0113] Como se explica más arriba, los polinucleótidos destino se etiquetan de forma detectable en uno o más nucleótidos. Cualquier método conocido en la técnica sirve para etiquetar de forma detectable los polinucleótidos destino. Preferiblemente, este etiquetado llevará incorporada uniformemente la etiqueta todo a lo largo del ARN y, más preferiblemente, el etiquetado se llevará a cabo con el mayor grado posible de eficacia. Una materialización usa para este etiquetado transcripción inversa cebada de oligo-dT para incorporar la etiqueta; sin embargo, los métodos convencionales de este método tienden a generar fragmentos con extremo de 3’. Por consiguiente, en una materialización preferida, se usan cebadores aleatorios (por ej. 9-meros) en transcripción inversa para incorporar uniformemente nucleótidos etiquetados todo a lo largo de los polinucleótidos destino. Como alternativa, los cebadores aleatorios pueden usarse en conjunción con métodos de PCR o métodos de transcripción in vitro basados en el promotor T7 para amplificar los polinucleótidos destino.
[0114] En una materialización preferida, la etiqueta detectable es una etiqueta luminiscente. En la presente invención se pueden usar, por ejemplo, etiquetas fluorescentes, etiquetas bioluminiscentes, etiquetas quimioluminiscentes y etiquetas colorimétricas. En una materialización particularmente preferida, la etiqueta es una etiqueta fluorescente, como una fluoresceína, un fósforo, una rodamina o un derivado de tintura de polimetina. Como ejemplos de etiquetas fluorescentes disponibles en el mercado están, entre otras, las fosforamiditas fluorescentes como FluorePrime (Amersham Pharmacia, Piscataway, N.J.), Fluoredite (Millipore, Bedford, Mass.), FAM (ABI, Foster City, Calif.), y Cy3 o Cy5 (Amersham Pharmacia, Piscataway, N.J.). En otra materialización, la etiqueta detectable es un nucleótido radiomarcado.
[0115] En otra materialización preferida, las moléculas polinucleótidas destino de la muestra de una paciente se etiquetan de modo diferente a las moléculas polinucleótidas destino de un patrón. El patrón puede comprender moléculas polinucleótidas destino de individuos normales (esto es, no aquejados de cáncer de mama). En una materialización especialmente preferida, el patrón comprende moléculas polinucleótidas destino reunidas a partir de muestras de individuos normales o muestras de tumores de individuos con tumores cancerosos de tipo esporádico. En otra materialización, las moléculas polinucleótidas destino proceden del mismo individuo, pero se toman en diferentes puntos temporales y de este modo indican la eficacia de un tratamiento por el cambio de expresión en los marcadores, o la ausencia del mismo, durante y después del curso del tratamiento (esto es, quimioterapia, radioterapia o crioterapia), en donde el paso en la expresión de los marcadores de un patrón de pronóstico deficiente a un patrón de buen pronóstico indica que el tratamiento es eficaz. En esta materialización, puntos temporales diferentes se etiquetan de forma diferente.
5.5.2.5 HIBRIDACIÓN CON BIOCHIPS
[0116] La hibridación del ácido nucleico y las condiciones de lavado se eligen de forma que las moléculas polinucleótidas destino se unan o hibriden específicamente con las secuencias polinucleótidas complementarias del despliegue, preferiblemente con un lugar de despliegue concreto donde esté situado su ADN complementario.
[0117] Los despliegues que contienen sondas de ADN de doble cadena situadas en los mismos se someterán preferiblemente a condiciones de desnaturalización para hacer el ADN de cadena simple antes de que entre en contacto con las moléculas polinucleótidas destino, por ej., eliminar estructuras en horquilla o dímeros que forman cuota con la secuencias autocomplementarias.
[0118] Las condiciones de hibridación óptimas dependerán de la longitud (por ej., oligómeros frente a polinucleótidos mayores de 200 bases) y del tipo (por ej., ARN o ADN) de los ácidos nucleicos destino y de sonda. Los experimentados en la materia advertirán que a medida que los oligonucleótidos se van haciendo más cortos, puede que sea necesario ajustar su longitud para conseguir una temperatura de fusión relativamente uniforme y por tanto unos resultados de hibridación satisfactorios. Los parámetros generales para las condiciones de hibridación específicas (esto es, rigurosas) de los ácidos nucleicos se describen en Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989), y en Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994). Las condiciones de hibridación típicas para los biochips de ADNc de Schena et al. son la hibridación en 5 X SSC más 0,2% SDS a 65˚C durante cuatro horas, seguida de lavados a 25˚ C en tampón de lavado de baja dureza (1 X SSC más 0,2% SDS), seguidos de 10 minutos a 25˚ C en tampón de lavado de mayor dureza (0,1 X SSC más 0.2% SDS) (Schena et al., Proc. Natl. Acad. Sci. U.S.A. 93:10614 (1993)). También son de gran utilidad las condiciones de hibridación suministradas en, por ej., Tijessen, 1993, HYBRIDIZATION WITH NUCLEIC ACID PROBES, Elsevier Science Publishers B.V.; y Kricka, 1992, NONISOTOPIC DNA PROBE TECHNIQUES, Academic Press, San Diego, CA.
[0119] Condiciones de hibridación especialmente preferidas son la hibridación de las sondas a la temperatura media de fusión, o cercana a ella (por ej., a no más de 5 ˚C, más preferiblemente a no más de 2 ˚C) en 1 M NaCl, 50 mM de tampón MES (pH 6.5), 0.5% de sarcosina de sodio y 30% de formamida.
5.5.2.6 SEÑAL DE DETECCION Y ANALISIS DE DATOS
[0120] Cuando se usan sondas con etiqueta fluorescente, las emisiones de fluorescencia en cada lugar de un biochip podrán detectarse, preferiblemente, mediante microscopia confocal de barrido láser. En una materalización se efectúa un barrido por separado, mediante la adecuada línea de excitación, para cada uno de los dos fluoróforos usados. Como alternativa, se puede usar un láser que permita iluminación de espécimen simultánea a longitudes de onda específicas a los dos fluoróforos y que las emisiones de los dos fluoróforos se puedan analizar simultáneamente (véase Shalon et al., 1996, "A DNA microarray system for analyzing complex DNA samples using two-color fluorescent probe hybridization", Genome Research 6:639-645. En una materialización preferida, los despliegues se escanean con un escáner de láser fluorescente con una fase X-Y controlada por ordenador y con objetivo microscópico. La excitación secuencial de los dos fluoróforos se lleva a cabo con un láser de gas mixto multilínea y la luz emitida se fracciona por longitud de onda y se detecta mediante dos tubos fotomultiplicadores. En Schena et al., Genome Res. 6:639-645 (1996), y en otras referencias citadas en el presente documento, se describen dispositivos de escaneo por láser fluorescente. Como alternativa, se puede usar el haz de fibra óptica descrito por Ferguson et al., Nature Biotech. 14:1681-1684 (1996), para monitorizar la abundancia de los niveles de mRNA en un gran número de lugares a la vez.
[0121] Las señales se graban y, en una materialización preferida, se analizan por ordenador, por ej. mediante una placa análoga a digital de 12 o 16 bits. En una materialización, se eliminan las intermitencias de la imagen escaneada mediante un programa de gráficos (por ej., Hijaak Graphics Suite) y a continuación se analiza mediante un programa de ploteado de imágenes que crea una hoja de cálculo de la hibridación media por cada longitud de onda en cada lugar. Si es necesario, se puede hacer una determinada corrección experimental para “producir diafonía” (superponer) entre los canales para los dos fluores. Para cualquier lugar concreto de hibridación del despliegue de transcripción se puede calcular un cociente de la emisión de los dos fluoróforos. El cociente es independiente de la expresión absoluta del gen afín, pero es útil para los genes cuya expresión se modula significativamente en asociación con los diferentes estados relacionados con el cáncer de mama.
5.6 ANÁLISIS ASISTIDO POR ORDENADOR
[0122] A continuación se describen kits que comprenden los conjuntos de marcadores de más arriba. En una materialización preferida, el kit contiene un biochip listo para hibridarse con moléculas polinucleótidas destino, más el software para los análisis de datos explicados más arriba.
[0123] Los métodos analíticos explicados en las anteriores secciones pueden ponerse en práctica mediante los siguientes sistemas informáticos y según los siguientes programas y métodos. El sistema informático comprende componentes internos conectados a componentes externos. Los componentes internos de un sistema informático típico incluyen un elemento procesador interconectado a una memoria principal. Por ejemplo, el sistema informático puede ser un Intel 8086-, 80386-, 80486-, Pentium™ o procesador basado en Pentium™ preferiblemente con 32 MB o más de memoria principal.
[0124] Los componentes externos pueden incluir almacenamiento masivo. Este almacenamiento masivo puede ser uno o más discos duros (que suele ir incluido en el mismo paquete que el procesador y la memoria). Dichos discos duros tendrán preferiblemente una capacidad de 1 GB o más de memoria. Los demás componentes externos son un dispositivo de interfaz de usuario, que puede ser un monitor, junto con un dispositivo de entrada, que puede ser un “ratón”, u otros dispositivos de entrada gráfica, y/o un teclado. También se le puede conectar al ordenador un dispositivo de impresión.
[0125] Típicamente, el sistema informático está conectado también a un enlace de red, que puede ser parte de un enlace de Ethernet con otros sistemas informáticos locales, sistemas informáticos remotos o redes de comunicación de gran amplitud, como Internet. Este enlace de red permite que el sistema informático comparta datos y tareas de procesado con otros sistemas informáticos.
[0126] Durante el funcionamiento de este sistema se cargan en la memoria varios componentes de software, que son a la vez estándares en la técnica y especiales en la presente invención. Estos componentes de software hacen colectivamente que el sistema informático funcione según los métodos de esta invención. Estos componentes de software están almacenados típicamente en el dispositivo de almacenamiento masivo. Un componente de software comprende el sistema operativo, que es responsable de la dirección del sistema informático y sus interconexiones. Este sistema operativo puede ser, por ejemplo, de la familia de Microsoft Windows®, como Windows 3.1, Windows 95, Windows 98, Windows 2000 o Windows NT. El componente de software representa lenguajes y funciones comunes convenientemente presentes en este sistema para ayudar a los programas a poner en práctica los métodos específicos de esta invención. Se pueden usar muchos lenguajes informáticos de nivel alto o bajo para programar los métodos analíticos de esta invención. Las instrucciones pueden interpretarse durante el periodo de funcionamiento o resumirse. Entre los lenguajes preferidos están C/ C++, FORTRAN y JAVA. Lo más preferible es que los métodos de esta invención se programen en paquetes de software matemático que permiten la entrada simbólica de ecuaciones y especificación de proceso de alto nivel, incluyendo algunos o todos los algoritmos que van a usarse, liberando de este modo al usuario de la necesidad de programar procesalmente ecuaciones individuales o algoritmos. Dentro de dichos paquetes están Mathlab de Mathworks (Natick, MA), Mathematica® de Wolfram Research (Champaign, IL), o S-Plus® de Math Soft (Cambridge, MA). Concretamente, el componente de software incluye los métodos analíticos de la invención tal como se programan en un lenguaje procesal o paquete simbólico.
[0127] El software que debe incluirse con el kit comprende los métodos de análisis de datos de la invención tal como se dan a conocer en el presente documento. Concretamente, el software puede incluir rutinas matemáticas para descubrimiento de marcadores, incluido el cálculo de coeficientes de correlación entre categorías clínicas (esto es, la categoría de ER) y la expresión de marcadores. El software también puede incluir rutinas matemáticas para calcular ña correlación entre expresión de marcadores de muestra y expresión de marcadores de control, mediante datos de la fluorescencia generada por el despliegue, para determinar la clasificación clínica de una muestra.
[0128] En una materialización modelo, para poner en práctica los métodos de la presente invención, primero el usuario carga datos experimentales en el sistema informático. Estos datos puede introducirlos directamente el usuario desde un monitor, un teclado u cualquier otro sistema informático conectado por conexión de red, o en un medio de almacenamiento amovible como un CD-ROM, un disquete (que no se muestra en las ilustraciones), una unidad de cinta magnética (que tampoco se muestra), una unidad de ZIP® drive (que tampoco se muestra) o a través de la red. A continuación el usuario procede a la ejecución del software de análisis del perfil de expresión que lleva a cabo los pasos de la presente invención.
[0129] En otra materialización modelo, primero el usuario carga datos experimentales y/o bases de datos en el sistema informático. Estos datos se cargan en la memoria desde los medios de almacenamiento o desde un ordenador remoto, preferiblemente desde un sistema dinámico de bases de datos de conjuntos de genes, a través de la red. A continuación el usuario procede a la ejecución del software que lleva a cabo los pasos de la presente invención.
[0130] A los experimentados en la técnica les resultarán evidentes sistemas informáticos y software alternativos para llevar a cabo los métodos analíticos de esta invención, que deben entenderse incluidos en las reivindicaciones anexas. Concretamente, es propósito de las reivindicaciones incluir las estructuras de programa alternativo para llevar a cabo los métodos de esta invención, cuya evidencia advertirán sin dificultad los experimentados en la técnica.
6. EJEMPLOS
Materiales y Métodos
[0131] Se recogieron 117 muestras de tumores de pacientes de cáncer de mama. A continuación se prepararon muestras de ARN y se trazó el perfil de cada una de dichas muestras mediante biochips impresos por chorro de tinta. Después se identificaron genes marcadores basándose en patrones de expresión; estos genes se usaron luego para las prácticas con clasificadores, que usaron estos genes marcadores para clasificar tumores en categorías de diagnóstico y pronóstico. Por último, estos genes marcadores se usaron para predecir el resultado del diagnóstico y del pronóstico en un grupo de individuos.
1. Recogida de muestras
[0132] Se seleccionó a 117 pacientes de cáncer de mama en tratamiento en el Instituto de Cáncer de los Países Bajos / Antoni van Leeuwenhoek Hospital, Amsterdam, Países Bajos, ateniéndose a los siguientes métodos clínicos (datos extraídos de las historias clínicas del Registro de Tumores NKI/AvL, Departamento de Biométrica).
[0133] El grupo 1 (n=97, 78 para prácticas, 19 para ensayos independientes) se clasificó según el método de:
(1) carcinoma de mama invasor primario <5 cm (T1 o T2); (2) ausencia de metástasis axilar (N0); (3) edad de diagnóstico <55 años; (4) periodo del diagnóstico 1983-1996, y (5) sin tumores malignos con anterioridad (excluyendo tumor cervical maligno in situ o carcinoma basocelular de la piel). A todas las pacientes se las trató con mastectomía radical modificada (n=34) o con tratamiento conservador de la mama (n=64) incluida la disección del ganglio linfático axilar. El tratamiento conservador de la mama consistió en la extirpación del tumor, seguida de la radiación de toda la mama en una dosis de 50 Gy, seguida de un refuerzo de 15 a 25 Gy. Cinco pacientes recibieron terapia sistémica coadyuvante consistente en quimioterapia (n=3) o terapia hormonal (n=2), ninguna de las demás pacientes recibió tratamiento adicional. Todas las pacientes tuvieron como mínimo un seguimiento anual durante un período de al menos 5 años. La investigación de las pacientes se extrajo del Registro de Tumores del Departamento de Biométrica.
[0134] Las integrantes del grupo 2 (n=20) se clasificaron en: (1) portadoras de una mutación germinal en BRCA1 o BRCA2; y (2) aquejadas de un carcinoma de mama invasor primario. No se hizo selección o exclusión alguna basándose en el tamaño del tumor, la categoría del ganglio linfático, la edad de diagnóstico, el año de la realización del diagnóstico ni otros tumores malignos. La clase de mutación germinal ya se conocía antes de realizar este protocolo de investigación.
[0135] La información sobre el individuo de quien se recogió muestras tumorales comprende: año de nacimiento; sexo; si el individuo es pre-menopáusico o pos-menopáusico; año del diagnóstico; número de ganglios linfáticos positivos y número total de ganglios; si hubo cirugía y, si fue así, si la cirugía fue conservadora de la mama o radical; si hubo radioterapia, quimioterapia o terapia hormonal. El tumor se graduó según la fórmula P=TNM, donde T es el tamaño del tumor (en una escala de 0-5); N es el número de ganglios que son positivos (en una escala de 0-4) y M es metástasis (0 = ausente, 1 = presente). El tumor también se clasificó según la fase, el tipo de tumor (in situ o invasor; lobular o ductal; el grado) y la presencia o ausencia de los receptores de estrógeno y progesterona. La progresión del cáncer se describió (donde correspondía) por: metástasis distante, año de la metástasis distante, año de fallecimiento, año del último seguimiento y genotipo de BRCA1.
2. Tumores
[0136] El ensayo de mutación germinal de BRCA1 y BRCA2 en el ADN aislado de linfocitos sanguíneos periféricos comprende un cribado de mutación mediante un Ensayo de Truncamiento de Proteínas (Protein Truncation Test, PTT) del exón 11 de BRCA1 y exon 10 y 11 de BRCA2, deleción PCR de BRCA1, deleción genómica de los exones 13 y 22, así como Electroforesis de Gel por Gradiente de Desnaturalización (Denaturing Gradient Gel Electrophoresis, DGGE) de los exones restantes. Todas las bandas aberrantes se confirmaron mediante secuenciación genómica analizada en un secuenciador automático ABI3700 y se confirmaron en una muestra independiente. De todo ello, el material tumoral material se sometió a congelación instantánea en nitrógeno líquido en la hora siguiente a la cirugía. Del material tumoral congelado se preparó una sección coloreada con H&E (hematoxilina-eosina) antes y después de cortar rodajas para el aislamiento del ARN. Se calcularon estas secciones de H&E congeladas para hallar el porcentaje de células tumorales; sólo se seleccionaron las muestras con >50% de células tumorales para su posterior estudio.
[0137] Para todos los tumores especímenes quirúrgicos fijados en formaldehído y recibidos con parafina se evaluaron con procedimientos histopatológicos estándar. Las secciones de parafina coloreadas con H&E se examinaron para calcular el tipo de tumor (por ej., ductal o lobular, según la clasificación WHO); para calcular el grado histológico según el método descrito por Elston y Ellis (grado 1-3); y para calcular la presencia de crecimiento linfangio-invasivo y la presencia de una infiltración linfocítica extensiva. Todos los factores histológicos fueron calculados independientemente por dos histólogos (MV y JL); se alcanzó un consenso sobre las diferencias examinando conjuntamente los portaobjetos. Se usó un portaobjeto representativo de cada tumor para coloreado inmunohistoquímico con anticuerpos dirigidos contra el receptor de estrógenos y progesterona con procedimientos estándar. El resultado del coloreado se registró como porcentaje de núcleos de coloración positiva (0%, 10%, 20%, etc., y así hasta 100%).
3. Amplificación, etiquetado e hibridación
[0138] El perfil de la producción de ácidos nucleicos derivados de marcadores y de la hibridación de los ácidos nucleicos con un biochip se muestra en la FIG. 2. Se usó un total de 30 secciones congeladas de 30 μM de grosor para el aislamiento total del ARN de cada espécimen tumoral sometido a congelación instantánea. El ARN total se aisló con RNAzol™ B (Campro Scientific, Veenendaal, Países Bajos) según el protocolo del fabricante, que incluye la homogeneización del tejido mediante un Polytron PT-MR2100 (Merck, Amsterdam, Países Bajos) y por último se disolvió en H2O sin ARNasa. Se calculó la calidad del ARN total mediante el cociente A260/A280 que tenía que estar entre 1,7 y 2,1, así como inspección visual del ARN en gel de agarosa, que debería indicar una banda de ARN de ribosomal 28S más fuerte en comparación con la banda de ARN de ribosomal 18S, posteriormente se trataron 25 μg de ARN total con DNasa mediante el kit Qiagen de DNasa sin RNasa y columnas de centrifugación (Qiagen Inc, GmbH, Germany) según el protocolo del fabricante. El ARN total tratado con DNasa se disolvió en H2O sin RNasa hasta llegar a una concentración final de 0,2 μg/μl.
[0139] Se usaron 5 μg de ARN total como entrada para síntesis de ARNc. Se usó un cebador oligo-dT que contenía una secuencia promotora de polimerasa de ARN T7 para cebar una síntesis de ADN de primera cadena y se usaron cebadores aleatorios (pdN6) para cebar una síntesis de ADNc mediante transcriptasa inversa de MMLV. Esta reacción produjo un ADN de doble cadena que contenía el promotor de polimerasa de ARN T7 (T7RNAP). A continuación el ADNc de doble cadena se transcribió a ARNc mediante el T7RNAP.
[0140] Se etiquetó ARNc con colorantes Cy3 o Cy5 mediante un proceso de dos fases. primero, se incorporaron enzimáticamente nucleótidos derivativos de alilamina a productos de ARNc. Para el etiquetado del ARNc, se sustituyó el UTP por una mezcla de 3:1 de 5-(3-aminoali)uridina 5’- trifosfato (Sigma) y UTP en la reacción de la transcripción in vitro (IVT). A continuación se hizo reaccionar los productos de ARNc derivados de alilamina con ésteres de N-hidroxi succinimida de Cy3 o Cy5 (CyDye, Amersham Pharmacia Biotech). Se mezcló 5mg de ARNc etiquetado con Cy5 de una paciente con cáncer de mama con la misma cantidad de producto etiquetado con Cy3 de una reserva de igual cantidad de ARNc de cada paciente esporádico individual.
[0141] Se hicieron por duplicado hibridaciones de biochip con inversiones de flúor. Antes de la hibridación, se fragmentaron los ARNc a un tamaño medio de -50-100nt calentándolos a 60 ˚C en presencia de 10 mM de ZnCl2. Se añadieron los ARNc fragmentados a un tampón de hibridación que contenía 1 M de NaCl, 0.5% de sarcosian de sodio y 50 mM de MES, pH 6.5, cuya dureza se reguló con la adición de formamida hasta una concentración final de 30%. Se llevaron a cabo hibridaciones en un volumen final de mls a 40 ˚C en la plataforma giratoria de un horno de hibridación (Robbins Scientific) durante 48 h. Tras la hibridación, se lavaron los portaobjetos y se escanearon mediante un barrido confocal de láser (Agilent Technologies). Las intensidades de fluorescencia de las imágenes escaneadas se cuantificaron, normalizaron y corrigieron.
4. Combinación de las muestras
[0142] Se formó una reserva de referencia de ARNc combinando igual cantidad de ARNc de cada paciente esporádica individual.
5.25K Biochip humano
[0143] Se sintetizaron oligonucleótidos unidos a la superficie siguiendo esencialmente lo propuesto por Blanchard et al., Biosens. Bioelectron. 6(7):687-690 (1996); véase también Hughes et al., Nature Biotech. 19(4):342-347 (2000). Como sustratos para síntesis de nucleótidos se usaron superficies hidrófobas de cristal (3 pulgadas x 3 pulgadas) que contenían grupos de hidroxilo expuestos. En las superficies de cristal se introdujeron monómeros de fosforamidita en posiciones definidas por ordenador mediante impresión por chorro de tinta. A continuación se eliminaron por lavado los monómeros no reaccionados y se les quitó la protección a los extremos de los oligonucleótidos extendidos. Para cada síntesis de nucleótidos que se deseaba se repitió este ciclo de acoplamiento, lavado y desprotección de los monómeros. Las secuencias de oligonucleótidos que debían imprimirse se especificaron mediante archivos informáticos.
[0144] Para este estudio se usaron biochips que contenían aproximadamente 25.000 secuencias de genes humanos (biochips Hu25K). Se seleccionaron secuencias para biochips de RefSeq (una colección de secuencias de ARNm no redundantes situadas en el sitio de Internet nlm.nih.gov/LocusLink/refseq.html) y Phil Green EST contigs, que es una colección de secuencias contiguas de EST reunida por el Dr. Phil Green et al en la Universidad de Washington (Ewing and Green, Nat. Genet. 25(2):232-4 (2000)), disponible en el sitio de Internet phrap.org/est_assembly/ index.html. Cada secuencia contigua de ARN o EST se representó en biochip Hu25K mediante un solo oligonucleótido 60-mero siguiendo esencialmente las explicaciones de Hughes et al., Nature Biotech. 19(4):342-347 y de la Publicación International WO01/06013, publicada el 25 de enero de 2001, y en la Publicación International WO01/05935, publicada el 25 de enero de 2001, con la diferencia de que se modificaron las reglas de oligocribado para eliminar los oligonucleótidos con más del 30% de C o con 6 o más
5 residuos contiguos de C.
Ejemplo 1: Conjuntos de genes regulados diferenciadamente y patrones generales de expresión de tumores de cáncer de mama
[0145] De las aproximadamente 25.000 secuencias representadas en el biochip se seleccionó un grupo de aproximadamente 5.000 genes que estaban significativamente regulados por todo el grupo de muestras. Se
10 determinó que un gen estaba regulado de manera significativamente diferenciada con el cáncer de mama si mostraba más del doble de cambios de transcripción en comparación con una reserva de tumores esporádicos y si el valor-p para la regulación (Hughes et al., Cell 102:109-126 (2000)) era inferior a 0,01, tanto hacia arriba como hacia abajo, en al menos cinco sobre 98 muestras tumorales.
[0146] Un logaritmo de agrupamiento no supervisado nos permitió agrupar pacientes sobre la base de sus
15 semejanzas medidas en este conjunto de -5.000 genes significativos. La medida de semejanza entre dos pacientes x e y se define como
Ecuación (5)
En la Ecuación (5), x e y son dos pacientes con componentes de cociente logarítmico xi yi , i= 1,..., N=5,100. A cada valor xi va asociado el error σxy . Cuanto menor sea el valor σxy más fiable será la medición.
es la media aritmética ponderada de error. El uso de la correlación como métrica de semejanza pone de relieve la importancia de la corregulación en el agrupamiento, más que la amplitud de las
[0147] El conjunto de aproximadamente 5.000 genes puede agruparse según sus semejanzas medidas en la totalidad del grupo de 98 muestras tumorales. La medida de semejanza entre dos genes se definió de la misma
25 forma que en la Ecuación (1), con la diferencia de que ahora por cada gen hay 98 componentes de mediciones de cociente logarítmico.
[0148] El resultado de dicho agrupamiento bidimensional aparece representado en la FIG.3. Del agrupamiento emergen dos patrones característicos. El primer patrón consiste en un grupo de pacientes en la parte inferior del diagrama cuyas regulaciones son muy diferentes de la reserva esporádica. El otro patrón lo constituye un grupo
30 de pacientes en la parte superior del diagrama cuyas expresiones están solo moderadamente reguladas en comparación con la reserva esporádica. Estos patrones dominantes sugieren que los tumores pueden dividirse de modo inequívoco en dos grupos tipos diferenciados basándose en dicho conjunto de -5.000 genes significativos.
[0149] Para facilitar la identificación de estos patrones, se asociaron los mismos a receptor de estrógeno (ER),
35 receptor de proestrógeno (PR), grado de tumor, presencia de infiltrado linfocítico y angioinvasión (FIG. 3). El grupo inferior de la FIG. 3, que constituye el patrón dominante, consta de 36 pacientes. De las 30 pacientes con ER negativo, 34 pacientes se concentran en este grupo. A partir de la FIG. 4 se observó que la expresión del gen alfa receptor de estrógeno ESR1 y un grupo numeroso de genes corregulados se ajustan a este patrón de expresión.
40 [0150] De la FIG. 3 y la FIG. 4 se sacó en conclusión que se pueden usar patrones de expresión para clasificar muestras tumorales en subgrupos de interés diagnóstico. Así pues, genes corregulados en un total de 98 muestras tumorales contienen información sobre la base molecular de cánceres de mama. La combinación de datos clínicos y abundancia de genes, medida en biochip, de ESR1 demuestra que los distintos tipos están relacionados con, o al menos indicados por, la categoría de ER.
45 Ejemplo 2: Identificación de marcadores genéticos que distinguen entre pacientes receptoras de estrógeno (+) y pacientes receptoras de estrógeno (-)
[0151] Los resultados descritos en este Ejemplo permiten la identificación de genes marcadores de expresión con los que se diferencian dos grupos principales de células tumorales: grupo “ER-negativo” y grupo “ERpositivo”. La diferenciación de muestras por categoría de ER(+) se realizó en tres etapas: (1) identificación de un conjunto de genes marcadores candidatos que se hallan en correlación con el nivel de ER; (2) ordenación jerárquica de estos genes candidatos por fuerza de correlación; (3) optimización del número de genes marcadores y (4) clasificación de muestras basándose en dichos genes marcadores.
1. Selección de genes discriminantes candidatos
[0152] En la primera etapa se identificó un conjunto de genes discriminantes candidatos basándose en los datos de expresión de genes de muestras para las prácticas. En concreto, se calcularon los coeficientes de correlación ρ entre los números de categoría o relación de nivel de ER y expresión logarítmica ř en la totalidad de las muestras para cada gen por separado.
El histograma de los coeficientes de correlación resultantes se representa en la FIG. 5A con línea gris. Aunque para la mayoría de los genes la amplitud de correlación o anticorrelación es pequeña, para algunos llega a 0,5. Los genes cuyos cocientes de expresión tengan buena correlación o buena anticorrelación con la categoría de diagnóstico de interés se usan como genes indicadores para la categoría.
[0153] Los genes con un coeficiente de correlación superior a 0,3 (“genes correlacionados”) o inferior a -0,3 (“genes anti-correlacionados”) se seleccionaron como genes indicadores. Se seleccionó el umbral de 0,3 basándose en la distribución de correlación para los casos en los que no se da una correlación real (se pueden usar las permutaciones para determinar esta distribución). Estadísticamente, esta anchura de distribución depende del número de muestras usadas en el cálculo de correlación. La anchura de distribución para casos de imagen1
control (sin correlación real) es aproximadamente
donde n = el número de muestras. En nuestro caso, n = 98. Por lo tanto, un umbral de 0,3 corresponde más o menos a 3 -σ en la distribución
[0154] Se descubrió que 2.460 de dichos genes reunían dichas condiciones. A fin de evaluar la relevancia del coeficiente de correlación de cada gen con el nivel de ER, se usó una técnica de remuestreo para generar datos Monte-Carlo que aleatorizaran la asociación entre los datos de expresión de genes de las muestras y sus categorías. La distribución de los coeficientes de correlación obtenidos de un ensayo Monte-Carlo aparece con línea discontinua en la FIG 5A. Para estimar la relevancia de los 2.460 genes marcadores como grupo, se generaron 10.000 ensayos Monte-Carlo. La colección de estos 10.000 ensayos Monte-Carlo forma la hipótesis nula. El número de genes que reúnen las mismas condiciones para los datos Monte-Carlo varía de un ensayo a otro. La distribución de frecuencia a partir de los 10.000 ensayos Monte-Carlo del número de genes con coeficientes de >0,3 o <-0,3 se muestra en la FIG. 5B. Tanto el valor máximo como el mínimo son mucho menores de 2.460. Por lo tanto, se estima que la relevancia de este grupo de genes como conjunto de genes discriminantes entre muestras de ER(+) y ER(-) es superior al 99,99%.
2. Ordenación jerárquica de los genes discriminantes candidatos
[0155] En la segunda etapa, se ordenaron jerárquicamente los genes de la lista de candidatos basándose en la relevancia de cada gen como gen discriminante. Los marcadores se ordenaron jerárquicamente bien por amplitud de correlación o bien usando una métrica similar a una estadística Fisher:
En la Ecuación (3), (x1) es la media ponderada de error del cociente logarítmico dentro del grupo de ER (-) y (x2) es la media ponderada de error del cociente logarítmico dentro del grupo de ER (+). σ1 es la varianza de cociente logarítmico dentro del grupo ER(-) y n1 es el número de muestras que tuvieron mediciones válidas de cocientes logarítmicos. σ2 es la varianza de cociente logarítmico dentro del grupo ER(+) y n2 es el número de muestras que tuvieron mediciones válidas de cocientes logarítmicos. El valor-t en la Ecuación (3) representa la diferencia de varianza compensada entre dos medios. El nivel de fiabilidad de cada gen en la lista de candidatos se estipuló con respecto a una hipótesis nula derivada del conjunto de datos reales mediante una técnica de remuestreo; esto es, se generaron muchos conjuntos de datos artificiales aleatorizando la asociación entre los datos clínicos y los datos de expresión de genes.
3. Optimización del número de genes marcadores
[0156] Para la validación cruzada se usó el método de “dejar uno fuera” a fin de optimizar los genes discriminantes. Un clasificador practicó con 97 ejemplos de un conjunto de genes marcadores extraído de la lista de candidatos por orden jerárquico y luego predijo la categoría de la muestra restante. Ese mismo procedimiento se repitió para cada uno de los ejemplos de la reserva y se contó el número de casos en que la predicción del que se había dejado fuera resultó errónea.
[0157] La evaluación del rendimiento de la validación cruzada de dejar uno fuera que se acaba de mencionar se repitió añadiendo sucesivamente más genes marcadores de la lista de candidatos. El rendimiento como función del número de genes marcadores se muestra en la FIG. 6. Las tasas de error para el tipo 1 y el tipo 2 variaron con el número de genes marcadores usados, pero las dos fueron mínimas mientras el número de genes marcadores se mantuvo en el orden de 550. Por lo tanto, estimamos que este conjunto de 550 genes debe considerarse el conjunto óptimo de genes marcadores que pueden usarse para clasificar los tumores de cáncer de mama en grupo “ER-negativo” y grupo “ER-positivo”. La FIG. 7 muestra la clasificación de pacientes en ER(+)
o ER(-) basándose en este conjunto de 550 marcadores. La FIG. 8 muestra la correlación de cada tumor con cada plantilla ER-negativa frente a la correlación de cada tumor con la plantilla ER-positiva.
4. Clasificación basada en genes marcadores
[0158] En la tercera etapa se calculó un conjunto de parámetros clasificadores para cada tipo de conjunto de datos de prácticas basándose en cualquiera de los métodos de ordenación de más arriba. Se generó una plantilla para el grupo ER(-) (ž1) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Igualmente, se generó una plantilla para el grupo ER(+) (llamada ž2) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Se definieron dos parámetros clasificadores (P1 y P12) basándose en la correlación o en la distancia. P1 mide la semejanza entre una muestra y la plantilla ER(-) ž1 en ese grupo de genes seleccionado. P2 mide la semejanza entre una muestra y la plantilla ER(+) ž2 en ese grupo de genes seleccionado. La correlación Pi se define como:
[0159] Se usó un método de "dejar uno fuera" para la validación cruzada basándose en los genes marcadores. En este método se reservó una muestra para la validación cruzada cada vez que actuaba un clasificador de prácticas. De un conjunto de 550 genes marcadores óptimos, el clasificador practicó con 97 de las 98 muestras y luego predijo la categoría de la muestra restante. Este procedimiento se repitió con cada una de las 98 pacientes. Se contó el número de casos en los que la predicción resultó errónea o acertada. Se determinó además que con subconjuntos de sólo -50 del total de 2.460 genes se pueden clasificar tumores en ER(+) o ER(-) casi igual de bien que usando el conjunto total.
[0160] En un pequeño número de casos hubo discordancia entre la clasificación mediante el conjunto de los 550 marcadores y la clasificación clínica. Al comparar el cociente logarítmico de expresión de ESR1 medida por biochip con la decisión binaria clínica (negativa o positiva) de la categoría de ER para cada paciente, se vio que la expresión medida concordaba con la categoría cualitativa de mediciones clínicas (mezcla de dos métodos) para la mayoría de tumores. Por ejemplo, dos pacientes a las que se diagnosticó clínicamente como ER(+) mostraron en realidad una baja expresión de ESR1 a partir de las mediciones con biochip y se las clasificó como ER negativas según los 550 genes marcadores. Asimismo, 3 pacientes a las que se diagnosticó clínicamente como ER(-) mostraron una alta expresión de ESR1 a partir de las mediciones con biochip y se las clasificó como ER(+) según los mismos 550 genes marcadores. Estadísticamente, sin embargo, la expresión de genes de ESR1 medida con biochip se ajusta más a los patrones dominantes que a la categoría de ER determinada clínicamente.
Ejemplo 3: Identificación de marcadores genéticos que distinguen entre tumores de BRCA1 y tumores esporádicos en pacientes de receptor de estrógeno (-)
[0161] La mutación del BRCA1 es una de las principales categorías clínicas en los tumores del cáncer de mama. Se determinó que, de los tumores de 38 pacientes del grupo ER(-), 17 mostraban la mutación del BRCA1, mientras que 21 eran tumores esporádicos. Por consiguiente, se desarrolló un método que hizo posible la diferenciación de los tumores de la mutación del BRCA1 a partir de los 21 tumores esporádicos del grupo ER(-).
1. Selección de genes discriminantes candidatos
[0162] En el primer paso, se identificó una serie de genes candidatos basándose en los patrones de expresión de genes de los dichos 38 ejemplos. En primer lugar calculamos la correlación entre el número de categoría de mutación de BRCA1 y el cociente de expresión en la totalidad de los 38 ejemplos para cada gen por separado mediante la Ecuación (2). La distribución de los coeficientes de correlación se representa como un histograma definido por línea continua en la FIG. 9A. Se observó que, aunque la mayoría de los genes no se hallaban en correlación con la categoría de la mutación de BRCA1, un pequeño grupo de los mismos sí se correspondían a niveles significativos. Es probable que los genes con mayores coeficientes de correlación sirvan como indicadores para distinguir a las portadoras de tumores de la mutación de BRCA1 de las de tumores esporádicos dentro del grupo ER(-).
[0163] A fin de evaluar la relevancia de cada coeficiente de correlación frente a una hipótesis nula de que dicho coeficiente de correlación pudiera hallarse de manera aleatoria, se usó una técnica de remuestreo para generar datos Monte-Carlo que aleatorizaran la asociación entre los datos de expresión de genes de las muestras y sus categorías. Se generaron 10.000 de dichos ensayos Monte-Carlo como control con el fin de estimar la relevancia de los genes marcadores como grupo. Se aplicó un umbral de 0,35 en la amplitud absoluta de coeficientes de correlación (o correlación o anticorrelación) tanto a los datos reales como a los datos Monte-Carlo. Siguiendo este método, se hallaron 430 genes que reunían estas condiciones para los datos experimentales. El valor-p de la relevancia, medido contra los 10.000 ensayos Monte-Carlo, es aproximadamente 0,0048 (FIG. 9B). Esto es, la probabilidad de que este conjunto de 430 genes contenga información útil sobre tumores de tipo BRCA1 frente a tumores esporádicos es de más del 99%.
2. Ordenación jerárquica de genes discriminantes candidatos
[0164] En el segundo paso, se ordenaron jerárquicamente los genes de la lista de candidatos basándose en la relevancia de cada gen como gen discriminador. Aquí se usó la amplitud absoluta de coeficientes de correlación para ordenar jerárquicamente los genes marcadores.
[0165] En el tercer paso, se usó para la clasificación un subconjunto de genes de los puestos más altos de la lista jerarquizada. Se definió una plantilla del grupo BRCA1 (llamada ž1) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Igualmente, se definió una plantilla del grupo noBRCA1 (llamada ž2) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Se definieron dos parámetros clasificadores (P1 y P2) basándose o en la correlación o en la distancia. P1 mide la semejanza entre una muestra y y la plantilla de BRCA1 ž1 en la totalidad del grupo de genes seleccionado. P2 mide la semejanza entre una muestra y y la plantilla de no-BRCA1 ž2 en la totalidad del grupo de genes seleccionado. Para la correlación, P1 y P2 se definieron de la misma forma que en la Ecuación (4).
[0166] Se usó el método de dejar uno fuera para validación cruzada a fin de optimizar los genes discriminantes como se explica en el Ejemplo 2. Para un conjunto de genes marcadores de la lista jerárquica de candidatos, el clasificador practicó con 37 ejemplos y predijo el restante. El procedimiento se repitió para todas las muestras de la reserva y se contó el número de casos en los que la predicción resultó errónea o acertada.
[0167] Para determinar el número de marcadores que constituyen un subconjunto viable, se repitió la ejecución de la anterior validación cruzada añadiendo acumulativamente más genes marcadores de la lista de candidatos. La ejecución como función del número de genes marcadores se muestra en la FIG. 10. Las tasas de error para el tipo 1 (falso negativo) y el tipo 2 (falso positivo) (Bendat & Piersol, RANDOM DATA ANALYSIS AND MEASUREMENT PROCEDURES, 2D ED., Wiley Interscience, p. 89) alcanzaron niveles óptimos cuando el número de los genes marcadores fue de aproximadamente 100. Por consiguiente, se considera que un conjunto de unos 100 genes es el conjunto óptimo de genes marcadores que pueden usarse para clasificar tumores en el grupo ER(-) tanto en tumores relacionados con BRCA1 como en tumores esporádicos.
[0168] Los resultados de clasificación usando los 100 genes óptimos se muestran en las FIGS. 11A y 11B. Como se ve en la FIG 11A, los patrones de corregulación de las pacientes esporádicas difieren de los de las pacientes BRCA1 sobre todo en la amplitud de regulación. Sólo se clasificó un tumor esporádico en el grupo de BRCA1. Las pacientes del grupo esporádico no son necesariamente negativas a la mutación de BRCA1; sin embargo, se estima que sólo un 5% aproximadamente de tumores esporádicos son portadores reales de mutación de BRCA1.
Ejemplo 4: Identificación de marcadores genéticos que distinguen las pacientes con tumor esporádico con >5 años de supervivencia frente a las de <5 años de supervivencia
[0169] Se usaron 78 tumores de pacientes de cáncer de mama para explorar predictores de pronóstico de datos de expresión de genes. De los 78 ejemplos de este grupo de cáncer de mama esporádico, se tenía constancia clínica de que 44 muestras no habían tenido metástasis distante dentro de los 5 años siguientes al diagnóstico inicial (“grupo sin metástasis distante”) y de que 34 muestras habían tenido metástasis distante dentro de los 5 años siguientes al diagnóstico inicial (“grupo con metástasis distante”). Se identificó un grupo de 231 marcadores, y dentro de él un grupo óptimo de 70 marcadores, que permitía la diferenciación entre los dos grupos de pacientes mencionados.
1. Selección de genes discriminantes candidatos
[0170] En el primer paso, se identificó un grupo de genes discriminantes candidatos basándose en los datos de expresión de genes de las dichas 78 muestras. Se calculó la correlación entre el número de categoría de pronóstico (metástasis distante frente a metástasis no distante) y el cociente de expresión logarítmica en todas las muestras para cada gen por separado mediante la Ecuación (2). La distribución de los coeficientes de correlación se representa con línea continua en la FIG. 12A. La FIG. 12A muestra también el resultado de un ensayo Monte-Carlo en línea discontinua. Se observó que aunque la mayoría de genes no están en correlación con las categorías de pronóstico, un pequeño grupo de genes sí lo está. Es probable que genes con mayores coeficientes de correlación sean más útiles como indicadores del pronóstico de interés – grupo de metástasis distante y grupo de metástasis no distante.
[0171] A fin de evaluar la relevancia de cada coeficiente de correlación frente a una hipótesis nula de que dicha correlación pueda hallarse de manera aleatoria, se usó una técnica de remuestreo para generar datos a partir de
10.000 ensayos Monte-Carlo como control (FIG. 12B). Luego se seleccionaron genes que o tenían un coeficiente de correlación mayor de 0,3 ("genes correlacionados") o menor de -0.3 ("genes anti-correlacionados"). Ese mismo criterio de selección se aplicó tanto a los datos reales como a los datos Monte-Carlo. Por medio de esta comparación se identificaron 231 marcadores que cumplían con ese requisito. La probabilidad de que dicho conjunto de genes para diferenciar pacientes del grupo de metástasis distante del grupo de metástasis no distante sea elegido por fluctuación aleatoria es aproximadamente de 0,003.
- 2.
- Ordenación jerárquica de genes discriminantes candidatos
[0172] En el segundo paso, se ordenaron los genes de la lista de candidatos basándose en la relevancia de cada gen como gen discriminante. Concretamente, se usó una métrica similar a una estadística “Fisher”, definida en la Ecuación (3), para la ordenación jerárquica. El nivel de fiabilidad de cada gen en la lista de candidatos se estimó frente a una hipótesis nula derivada del conjunto de datos reales mediante la técnica de remuestreo. Los genes de la lista de candidatos también pueden ordenarse por la amplitud de coeficientes de correlación.
- 3.
- Optimización de genes discriminantes
[0173] En el tercer paso, se seleccionó un subconjunto de 5 genes de los puestos más altos de esta lista jerarquizada para usarlos como genes discriminantes en la clasificación de 78 tumores como “grupo de metástasis distante” o “grupo de metástasis no distante”. Para la validación cruzada se usó el método de dejar uno fuera. Concretamente, 77 muestras definieron un clasificador basado en el conjunto de genes discriminantes seleccionados, los cuales se usaron para predecir la muestra restante. Se repitió este procedimiento hasta que se predijo cada una de las 78 muestras. Se contó el número de casos en los que las predicciones resultaron correctas o incorrectas. El rendimiento del clasificador se midió por las tasas de error del tipo 1 y del tipo 2 para este conjunto de genes seleccionado.
[0174] Se repitió el anterior procedimiento de evaluación del rendimiento añadiendo cada vez 5 genes marcadores más de los puestos más altos de la lista jerarquizada, hasta que se hubo usado el total de los 231 genes. Como se ve en la FIG. 13, el número de predicciones erróneas de errores de tipo 2 y tipo 2 cambia radicalmente según el número de genes marcadores empleados. La tasa combinada de error bajó al mínimo cuando no se usaron nunca los 70 genes de los puestos más altos de nuestra lista de candidatos. Por lo tanto, este conjunto de 70 genes es el conjunto de genes marcadores óptimo y preferido, que sirve para la clasificación de pacientes con tumores esporádicos en grupo de metástasis distante y grupo de metástasis no distante. Un número mayor o menor de marcadores también actúa como predictor, pero es menos eficiente, bien por las tasas de error más altas o bien por la introducción de ruido estadístico.
4. Curvas de probabilidad de recaída
[0175] Se predijo la clasificación de pronóstico de 78 pacientes con tumores esporádicos de cáncer de mama en dos subgrupos diferenciados basándose en su expresión de 70 genes marcadores óptimos (FIGS. 14 y 15).
[0176] Para evaluar la clasificación de pronóstico de pacientes esporádicas, se predijo el resultado de cada paciente por medio de un clasificador que practicó con los 77 pacientes restantes basándose en los 70 genes marcadores óptimos. En la FIG. 16 se muestra en diagrama la probabilidad de las metástasis distantes como función de tiempo desde el diagnóstico inicial para los dos grupos previstos. Hay una diferencia significativa entre estas dos curvas de recaída. Mediante la prueba χ2 (S-PLUS 2000 Guide to Statistics, vol. 2, MathSoft, p. 44), se estimó el valor-p en ~10-9. También se comparó la probabilidad de metástasis distante como función de tiempo desde el diagnóstico inicial entre individuos con ER(+) y ER(-) (FIG. 17), individuos con PR(+) y PR(-) (FIG. 18) y entre individuos con diferentes grados de tumor (FIGS. 19A, 19B). En comparación, los valores-p para las diferencias entre dos grupos de pronóstico basadas en datos clínicos son mucho menos significativas que las que se basan en datos de expresión de genes, que van de 10-3 a 1.
[0177] Para fijar los parámetros de la probabilidad de recaída como función de tiempo desde el diagnóstico inicial, se ajustó la curva a un tipo de modelo de supervivencia “normal”:
Para un α =1 fijado, hallamos que τ =125 meses para las pacientes del grupo de metástasis no distante y τ = 36
5 meses para las pacientes del grupo de metástasis distante. Usando grados de tumor, hallamos que τ = 100 meses para las pacientes con grados de tumor 1 y 2 y τ = 60 para las pacientes con grado de tumor 3. En la práctica clínica se admite que los grados de tumor son el mejor predictor de pronóstico de que se dispone. No obstante, la diferencia entre los dos grupos de pronóstico clasificados sobre la base de los 70 genes marcadores es mucho más significativa que la de los grupos clasificados mediante la mejor información clínica disponible.
10 5. Predicción de pronóstico para 19 tumores esporádicos independientes
[0178] Para confirmar el método de clasificación de pronóstico propuesto y para asegurar la reproducibilidad, robustez y potencia de predicción de los 70 genes marcadores de pronóstico, se aplicó el mismo clasificador a 19 muestras tumorales independientes tomadas de pacientes con cáncer de mama esporádico, preparadas por separado en el Instituto de Cáncer de los Países Bajos (NKI). Se usó la misma reserve de referencia.
15 [0179] Los resultados de la clasificación de 19 tumores esporádicos independientes se muestran en la Figura
20. La FIG. 20A muestra el cociente logarítmico de regulación de expresión de esos mismos 70 genes marcadores óptimos. Basándonos en nuestro modelo clasificador, esperábamos la clasificación errónea de 19*(6+7)/78 = 3,2 tumores. En consecuencia, (1+3) = 4 de 19 tumores se clasificaron erróneamente.
6. Parámetros clinicos como grupo frente a datos de biochip - Resultados de la regresión logística
20 [0180] En la sección anterior, la potencia de predicción de cada parámetro clínico por separado se comparó con la de los datos de expresión. Sin embargo, tiene más sentido combinar todos los parámetros clínicos como grupo y luego compararlos con los datos de expresión. Para ello se requiere una modelización multivariante; el método elegido fue la regresión logística. Este enfoque demuestra también la mejora que aporta el método de biochip a los resultados de los datos clínicos.
25 [0181] Los parámetros clínicos usados para la modelización multivariante fueron: (1) grado de tumor; (2) categoría de ER; (3) presencia o ausencia del receptor progestativo (PR); (4) tamaño del tumor; (5) edad de la paciente, y (6) presencia o ausencia de angionvasión. Para los datos de biochip se usaron dos coeficientes de correlación. Uno es la correlación con la media del grupo de buen pronóstico (C1) y el otro es la correlación con la media del grupo de pronóstico deficiente (C2). Cuando se calculan los coeficientes de correlación para una
30 paciente dada, a dicha paciente se la excluye de cualquiera de las dos medias.
[0182] La regresión logística optimiza el coeficiente de cada parámetro de entrada para predecir óptimamente el resultado de cada paciente. Una manera de juzgar la potencia de predicción de cada parámetro de entrada es cuánta desviación (parecida a ji-cuadrado en la regresión lineal, véase, por ejemplo, Hasomer & Lemeshow, APPLIED LOGISTIC REGRESSION, John Wiley & Sons, (2000)) es causante el parámetro. El mejor predictor
35 debería ser el causante de la mayoría de la desviación. Para calcular con precisión la potencia de predicción, se modeló cada parámetro por separado. Los parámetros del biochip explican la mayoría de la desviación y por consiguiente son predictores potentes.
[0183] A continuación los parámetros clínicos, y los dos parámetros del biochip, se monitorizaron como grupo. La desviación total explicada por los seis parámetros clínicos fue de
40 31,5 y la desviación total explicada por los parámetros del biochip fue de 39,4. No obstante, cuando se modelizaron primero los datos clínicos y luego se añadieron los dos parámetros del biochip, la desviación final fue causante del 57,0.
[0184] La regresión logística computa la probabilidad de que una paciente pertenezca al grupo de buen pronóstico o al del deficiente. Las FIGS. 21A y 21B muestran la sensibilidad frente a la (1-especificidad). Se 45 generaron diagramas variando el umbral en la probabilidad prevista del modelo. La curva que atraviesa la esquina superior izquierda es la mejor sensibilidad (alta sensibilidad con alta especificidad). El biochip superó los datos clínicos por un amplio margen. Por ejemplo, a una sensibilidad establecida de alrededor del 80%, la especificidad fue de ~80% de los datos del biochip y de ~65% de los datos clínicos para el grupo de buen pronóstico. Para el grupo de pronóstico deficiente, las especificidades correspondientes fueron ~80% y ~70%, 50 también a una sensibilidad establecida del 80%. La combinación de los datos del biochip con los datos clínicos mejoró los resultados. El resultado se puede mostrar también como la tasa total de error como función del umbral
en la FIG. 21C. En todos los umbrales posibles, la tasa de error del biochip fue siempre más pequeña que la de los datos clínicos. Al añadir los datos del biochip a los datos clínicos, la tasa de error se reduce más aún, como se puede ver en la Figura 21C.
[0185] Se pueden crear tablas de cocientes impares a partir de la predicción de la regresión logística. La
5 probabilidad de que una paciente esté en el grupo de buen pronóstico se calcula mediante la regresión logística basándose en diferentes combinaciones de parámetros de entrada (clínicos y/o de biochip). Las pacientes se dividen en los cuatro grupos siguientes según la predicción el resultado real: (1) predicción buena y en realidad buena; (2) predicción buena pero en realidad deficiente; (3) predicción deficiente pero en realidad buena y (4) predicción deficiente y en realidad deficiente. Los grupos (1) & (4) representan predicciones correctas, mientras
10 que los grupos (2) & (3) representan predicciones erróneas. La división para la predicción se establece en una probabilidad del 50%, aunque se pueden usar otros umbrales. Los resultados se enumeran en la Tabla 7. En la tabla 7 se ve claramente que el perfil de biochip (Tabla 7.3 & 7.10) supera a cualquier dato clínico simple (Tabla 7.4-7.9) y la combinación de los datos clínicos (Tabla 7.2). La añadidura del perfil de biochip, junto con los datos clínicos, da los mejores resultados (Tabla 7.1).
15 [0186] Para el perfil de biochip se puede hacer también una tabla parecida (Tabla 7.11) sin usar la regresión logística. En este caso, la predicción se basó simplemente en C1-C2 (mayor que 0 significa buen pronóstico, menor que 0 significa deficiente
. Ejemplo 5. Concepto de biochip a efectos diagnósticos.
- Tabla 7.1 Predicción por clínico+biochip
- Predicción buena
- Predicción deficiente
- en realidad buena
- 39 5
- en realidad deficiente
- 4 30
- Tabla 7.2 Predicción solo por clínico
- Predicción buena
- Predicción deficiente
- en realidad buena
- 34 10
- en realidad deficiente
- 12 22
- Tabla 7.3 Predicción por biochip
- Predicción buena
- Predicción deficiente
- en realidad buena
- 39 5
- en realidad deficiente
- 10 24
- Tabla 7.4 Predicción por grado
- Predicción buena
- Predicción deficiente
- en realidad buena
- 23 21
- en realidad deficiente
- 5 29
- Tabla 7.5 Predicción por ER
- Predicción buena
- Predicción deficiente
- en realidad buena
- 35 9
- en realidad deficiente
- 21 13
- Tabla 7.6 Predicción por PR
- Predicción buena
- Predicción deficiente
- en realidad buena
- 35 9
- Tabla 7.1 Predicción por clínico+biochip
- Predicción buena
- Predicción buena
- en realidad deficiente
- 18 16
- Tabla 7.7 Predicción por tamaño
- Predicción buena
- Predicción deficiente
- en realidad buena
- 35 9
- en realidad deficiente
- 13 21
- Tabla 7.8 Predicción por edad
- Predicción buena
- Predicción deficiente
- en realidad buena
- 33 11
- en realidad deficiente
- 15 19
- Tabla 7.9 Predicción por angioinvasión
- Predicción buena
- Predicción deficiente
- en realidad buena
- 37 7
- en realidad deficiente
- 19 15
- Tabla 7.10 Predicción por dC (C1-C2)
- Predicción buena
- Predicción deficiente
- en realidad buena
- 36 8
- en realidad deficiente
- 6 28
- Tabla 7.11 Sin regresión logística, simplemente juzgada por dC (C1-C2)
- Predicción buena
- Predicción deficiente
- en realidad buena
- 37 7
- en realidad deficiente
- 6 28
[0187] Todos los genes de la lista de genes marcadores a efectos de diagnóstico y pronóstico pueden sintetizarse en un biochip a pequeña escala mediante tecnología por chorro de tinta. Se puede hacer un biochip
5 con genes para diagnóstico y pronóstico respectiva o colectivamente. Cada gen de la lista está representado por sondas oligonucleótidas sencillas o múltiples, dependiendo de la unicidad de su secuencia en todo el genoma. Este biochip diseñado a medida, en combinación con el protocolo de preparación de muestras, puede usarse en clínicas como kit de diagnóstico/pronóstico.
Ejemplo 6. Relevancia biológica de los genes marcadores de diagnóstico
10 [0188] Se registró el dominio en busca de anotaciones funcionales disponibles para los 430 genes marcadores para la diagnosis de BRCA1 de la Tabla 3. Los 430 genes de la Tabla 3 pueden dividirse en dos grupos: (1) 196 genes cuyas expresiones están claramente expresadas en el grupo de tipo BRCA1, y (2) 234 genes cuyas expresiones están altamente expresadas como grupo esporádico. De los 196 genes del grupo BRCA1, 94 están anotados. De los 234 genes del grupo esporádico, 100 están anotados. Los términos "célula-T", "célula-B" o
15 "inmunoglobulina" están implicados en 13 de los 94 genes anotados y en 1 de los 100 genes anotados, respectivamente. De 24.479 genes representados en los biochips, hay hasta la fecha 7.586 genes con anotaciones. "Célula-T", "célula-B" e "inmunoglobulina" están presentes en 207 de estos 7.586 genes. En vista de ello, el valor-p de los 13 genes de "célula-T", "célula-B" o "inmunoglobulina" del grupo BRCA1 es muy relevante (valor-p =1,1x10-6). En comparación, la observación de 1 gen relacionado con "célula-T", "célula-B" o "inmunoglobulina" en el grupo esporádico no es relevante (valor-p = 0,18).
[0189] La observación de que las pacientes con BRCA1 tienen genes linfocitos altamente expresados (célula-T y célula-B) concuerda con lo que se ha visto en la patología, es decir, que el tumor de mama de BRCA1 está asociado a la alta infiltración linfocítica más a menudo que los casos esporádicos (Chappuis et al., 2000, Semin Surg Oncol 18:287-295).
Ejemplo 7. Relevancia biológica de los genes marcadores de pronóstico
[0190] Se realizó una búsqueda de anotaciones funcionales disponibles para los 231 genes marcadores de pronóstico (Tabla 5). Los marcadores se dividen en dos grupos: (1) 156 marcadores cuyas expresiones están altamente expresadas en el grupo de pronóstico deficiente, y (2) 75 genes cuyas expresiones están altamente expresadas en el grupo de buen pronóstico. De los 156 marcadores, 72 genes están anotados; de los 75 genes, 28 genes están anotados.
[0191] Doce de los 72 marcadores, pero ninguno de los 28 marcadores, son, o están asociados a, quinasas. Por contraste, de los 7.586 genes del biochip que hasta la fecha tienen anotaciones, sólo 471 tienen quinasas. Partiendo de esta base, es significativo el valor-p de que doce marcadores relacionados con la quinasa se hallen en el grupo de pronóstico (valor-p = 0,001). Las quinasas son importantes reguladores de los procedimientos de transducción por señal intracelular que intervienen en la proliferación, diferenciación y apoptosis de células. Normalmente, su actividad se controla y vigila estrechamente. La sobreexpresión de ciertas quinasas es bien conocida y está implicada en la oncogénesis, como receptor1 del factor de crecimiento endotelial vascular (VEGFR1 o FLT1), una quinasa de tirosina del grupo de pronóstico deficiente, que juega un papel muy importante en la angiogénesis tumoral. Curiosamente, el factor de crecimiento endotelial vascular (VEGF), ligando de VEGFR, se halla también en el grupo de pronóstico, lo que significa que tanto el ligando como el receptor son sobrerregulados en individuos con pronóstico deficiente por un mecanismo desconocido.
[0192] Igualmente, 16 de los 72 marcadores, y solo 2 de los 28 marcadores, son, o están asociados a, proteínas de enlace de ATP o de enlace de GTP. Por contraste, de los 7.586 genes del biochip que hasta la fecha tienen anotaciones, solo 714 y 153 implican enlace de ATP y enlace de GTP, respectivamente. Partiendo de esta base, es significativo el valor-p de que 16 marcadores relacionados con el enlace de GTP o de ATP se hallen en el grupo de pronóstico deficiente (valor-p 0,001 y 0,0038). Así pues, los marcadores relacionados con el enlace de GTP o de ATP dentro de los 72 marcadores pueden usarse como indicadores de pronóstico.
[0193] El cáncer se caracteriza por la proliferación desregulada de células. Al nivel más simple, esto requiere la división de la célula o mitosis. Buscando por palabra clave, hallamos “división de células” o “mitosis” incluida en las anotaciones de 7 genes respectivamente en los 72 marcadores anotados del total de los 156 marcadores de pronóstico deficiente, pero en ninguno de los 28 genes anotados del total de los 75 marcadores de buen pronóstico. De los 7.586 marcadores de biochip con anotaciones, hallamos "división de célula" en 62 anotaciones y "mitosis" en in 37 anotaciones. Basándose en estos hallazgos, se considera altamente significativo el valor-p de que siete marcadores relacionados con la división de célula o la mitosis se hallen en el grupo de buen pronóstico (valor-p = 3.5x10-5). En comparación, la ausencia de marcadores relacionados con la división de célula o la mitosis en el grupo de buen pronóstico no es significativa (valor-p = 0.69). Así pues, los siete marcadores relacionados con la división de célula o la mitosis pueden usarse como marcadores para el diagnóstico deficiente.
Ejemplo 8: Elaboración de una reserva de referencia artificial
[0194] La reserva de referencia para el perfil de expresión en los Ejemplos de más arriba se hizo usando igual cantidad de ARNcs de cada paciente individual del grupo esporádico. Para tener una gran cantidad de reserva de referencia fiable y fácil de hacer, se puede elaborar una reserva de referencia para el diagnóstico y el pronóstico de cáncer de mama mediante ácido nucleico sintético que represente, o que se derive de, cada gen marcador. La expresión de genes marcadores para muestra de paciente individual se monitoriza solo contra la reserva de referencia, no contra una reserva derivada de otras pacientes.
[0195] Para hacer la reserva de referencia, se sintetizan oligonucleótidos 60-meros según la secuencia 60mera de sonda de biochip por chorro de tinta para cada uno de los genes indicadores de diagnóstico/pronóstico, luego se bicatenan y clonan al vector pBluescript SK (Stratagene, La Jolla, CA), adyacente a la secuencia del promotor T7. Se aíslan los clones por separado y se verifican las secuencias de sus insertos mediante secuenciación de ADN. Para generar ARNs sintéticos, se linealizan con EcoRI y se lleva a cabo una reacción de transcripción in vitro (IVT) de T7 según el kit MegaScript kit (Ambion, Austin, TX). La IVT va seguida del tratamiento del producto con ADNasa. Se purifican ARNs sintéticos en columnas RNeasy (Qiagen, Valencia, CA). Dichos ARNs sintéticos se transcriben, amplifican, etiquetan y mezclan unos con otros para elaborar la reserva de referencia. La abundancia de esos ARNs sintéticos se ajusta a aproximadamente la abundancia de las correspondientes transcripciones derivadas de marcadores en la reserva de tumores reales.
Ejemplo 9: Uso de datos de un solo canal y una reserva de muestras representada por valores almacenados
1. Creación de una reserva de referencia de valores almacenados ("reserva matemática de muestras")
[0196] El uso de datos basados en cocientes en los Ejemplos 1-7 de más arriba requiere una muestra física de referencia. En dichos Ejemplos se usó una muestra de tumores esporádicos como referencia. El uso de dicha referencia, aunque permite predicciones de pronóstico y diagnóstico sólidas, puede causar problemas, ya que la reserva es típicamente un recurso limitado. Por lo tanto, se desarrolló un método clasificador que no requiere una reserva física de muestras, haciendo así la aplicación de esta técnica predictiva y de diagnóstico mucho más sencilla para las aplicaciones clínicas.
[0197] Para comprobar si se podían usar los datos de un solo canal, se desarrolló el siguiente procedimiento. Primero, se seleccionaron los datos de intensidad del canal único para los 70 genes óptimos, descrito en el Ejemplo 4, de las 78 muestras esporádicas para prácticas, descritas en los Materiales y Métodos, de los datos de muestra esporádica frente a los datos de hibridación de reserva de tumores. Las 78 muestras consistían en 44 muestras de pacientes con buen pronóstico y 34 muestras de pacientes con pronóstico deficiente. A continuación se normalizaron las intensidades de hibridación para estas muestras dividiendo por la mediana de intensidad de todas las manchas biológicas del mismo biochip. Allí donde se usaron múltiples biochips por muestra, se halló la media en todos los biochips. Se realizó una transformación logarítmica en los datos de intensidad para cada uno de los 70 genes, o para la intensidad media para cada uno de los 70 genes donde se hibrida más de un biochip, y se calculó una intensidad logarítmica media para cada gen en todas las 78 muestras esporádicas. Para cada muestra, las intensidades logarítmicas medias calculadas de este modo se restaron de la intensidad logarítmica de la muestra individual. Esta cifra, la media de intensidad logarítmica sustraída, se trató a continuación como el cociente logarítmico de dos colores para el clasificador por sustitución por la Ecuación (5). Para nuevas muestras, la intensidad logarítmica media se resta de la misma forma que se indica más arriba y se calcula una intensidad logarítmica sustraída media.
[0198] La creación de un conjunto de intensidades logarítmicas medias para cada gen hibridado crea a su vez una “reserva matemática de muestras” que sustituye la “reserva material de muestras”. Esta reserva matemática de muestras puede aplicarse entonces a cualquier muestra, incluidas las muestras actualmente disponibles y las que se obtengan en el futuro. Esta “reserva matemática de muestras” puede actualizarse a medida que se va disponiendo de más muestras.
2. Resultados
[0199] Para demostrar que la reserva matemática de muestras desempeña una función equivalente a la reserva de muestras de referencia, se ploteó la intensidad logarítmica sustraída media (datos de un solo canal relativos a la reserva matemática) frente al cociente logarítmico (hibridaciones relativas a la reserva de muestras) para los 70 genes marcadores óptimos en la totalidad de las 78 muestras esporádicas, como se ve en la FIG. 22. El cociente y las cantidades de un solo canal están en estrecha correlación, lo que indica que ambos tienen capacidad para informar de cambios relativos en la expresión de genes. A continuación se construyó un clasificador mediante la intensidad logarítmica sustraída media, siguiendo exactamente el mismo procedimiento que se usó para los datos de cociente, como en el Ejemplo 4.
[0200] Como se ve en las FIGS. 23A y 23B, con los datos de un solo canal se consiguió clasificar muestras basadas en patrones de expresión de genes. En la FIG. 23A se ven muestras agrupadas según el pronóstico mediante datos de hibridación de un solo canal. La línea blanca separa muestras de pacientes clasificados como de pronóstico deficiente (abajo) y de buen pronóstico (arriba). En la FIG. 23B se hace un diagrama de cada muestra según sus datos de expresión se hallen en correlación con el parámetro clasificador de pronóstico bueno (círculos abiertos) o deficiente (cuadrados rellenos). Mediante el método de validación cruzada de dejar uno fuera, el clasificador predijo 10 falsas positivas de un total de 44 muestras de pacientes con buen pronóstico y 6 falsas negativas de un total de 34 muestras de pacientes con pronóstico deficiente, donde un pronóstico deficiente se considera un “positivo”. Este resultado es comparable al uso del clasificador basado en cociente, que predijo 7 de 44 y 6 de 34, respectivamente.
[0201] En aplicaciones clínicas, es muy preferible tener pocos falsos positivos, lo que resulta en menos pacientes con infratratamiento. Para adecuar los resultados a esta preferencia, se construyó un clasificador ordenando jerárquicamente la muestra del paciente según su coeficiente de correlación con la plantilla de “buen pronóstico” y se eligió un umbral para este coeficiente de correlación que permitiera aproximadamente un 10% de falsos negativos, esto es, la clasificación de una muestra de un paciente con pronóstico deficiente como la de un paciente con buen pronóstico. De las 34 muestras de pronóstico deficiente usadas aquí, ello representa una tolerancia de 3 sobre 34 pacientes con pronóstico deficiente clasificadas incorrectamente. Este límite de tolerancia corresponde a un umbral de coeficiente umbral de 0,2727 de correlación con la plantilla de "buen pronóstico". Los resultados que usan este umbral se muestran en las FIGS. 24A y 24B. La FIG. 24A muestra datos de hibridación de un solo canal para muestras ordenadas jerárquicamente según los coeficientes de correlación con el clasificador de buen pronostico; las mezclas clasificadas como de “buen pronostico” se hallan por encima de la línea blanca, mientras que las clasificadas como de “mal pronostico” se hallan por debajo de la misma. La FIG. 24B muestra un diagrama de dispersión de coeficientes de correlación, con tres muestras clasificadas incorrectamente situadas a la derecha del valor del coeficiente de correlación umbral. Usando este umbral, el clasificador tuvo una tasa de falso positivo de 15 sobre 44 muestras de buen pronóstico. Este
5 resultado no es muy diferente si se compara con la tasa de error de 12 sobre 44 para el clasificador basado en el cociente.
[0202] En resumen, los 70 genes indicadores transmiten información consistente sobre el pronóstico; los datos de un solo canal pueden predecir el resultado del tumor casi tan bien como los datos basados en el cociente y a la vez son más convenientes en un entorno clínico.
10
Claims (40)
- REIVINDICACIONES1. Método para clasificar a un individuo aquejado de cáncer de mama como poseedor de buen pronósticoo pronóstico deficiente, en donde dicho individuo es un humano, en donde dicho pronóstico indica que se espera que dicho individuo no tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama y en donde dicho pronóstico deficiente indica que se espera que dicho individuo tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, que comprende(ia) calcular un primer parámetro clasificador entre un primer perfil de expresión y una plantilla de buen pronóstico, o(ib) calcular un segundo parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico y un tercer parámetro clasificador entre dicho primer perfil de expresión y una plantilla de pronóstico deficiente;comprendiendo dicho primer perfil de expresión los niveles de expresión de una primera pluralidad de genes en una muestra de células tomada del individuo,comprendiendo dicha plantilla de buen pronóstico, para cada gen en dicha primera pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que no tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama;y comprendiendo dicha plantilla de pronóstico deficiente, para cada gen en dicha primera pluralidad, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama;consistiendo dicha primera pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 5, y(iia) clasificar a dicho individuo como poseedor de buen pronóstico si dicho primer parámetro clasificador está por encima de un umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de buen pronóstico que a dicha plantilla de pronóstico deficiente, o(iib) clasificar a dicho individuo como poseedor de dicho pronóstico deficiente si dicho primer parámetro clasificador está por debajo de dicho umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de pronóstico deficiente que a dicha plantilla de buen pronóstico.
-
- 2.
- El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 20 de los genes cuyos marcadores se enumeran en la lista de la Tabla 5.
-
- 3.
- El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 100 de los genes cuyos marcadores se enumeran en la lista de la Tabla 5.
-
- 4.
- El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 150 de los genes cuyos marcadores se enumeran en la lista de la Tabla 5.
-
- 5.
- El método de la reivindicación 1, en donde dicha primera pluralidad consiste en cada uno de los genes cuyos marcadores se enumeran en la lista de la Tabla 5.
-
- 6.
- El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 70 de los genes cuyos marcadores se enumeran en la lista de la Tabla 6.
-
- 7.
- El método de la reivindicación 1, que además comprende los pasos de:
- (a)
- generar dicha plantilla de buen pronóstico por hibridación de ácidos nucleicos derivados de dicha pluralidad de pacientes que no tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama contra ácidos nucleicos derivados de una reserva de tumores de una pluralidad de pacientes que tengan cáncer de mama;
- (b)
- generar dicha plantilla de buen pronóstico por hibridación de ácidos nucleicos derivados de dicha pluralidad de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama contra ácidos nucleicos derivados de una reserva de tumores de dicha pluralidad de pacientes;
- (c)
- generar dicho primer perfil de expresión hibridando ácidos nucleicos derivados de dicha muestra de células tomada dicho individuo contra dicha reserva, y
- (d)
- calcular (d1) dicho segundo parámetro clasificador entre dicho primer perfil de expresión y la plantilla de buen pronóstico y (d2) dicho tercer parámetro clasificador entre dicho primer perfil de expresión y la plantilla de pronóstico deficiente, en donde si dicho primer perfil de expresión es más parecido a la plantilla de buen pronóstico que a la plantilla de pronóstico deficiente, se clasifica al individuo como poseedor de buen pronóstico, y si dicho perfil de expresión es más parecido a la plantilla de pronóstico deficiente que a la plantilla de buen pronóstico, se clasifica al individuo como poseedor de pronóstico deficiente.
-
- 8.
- El método de la reivindicación 1, que comprende además:
iv) clasificar a dicho individuo como ER(+) (receptor positivo de estrógeno) o ER(-) (receptor negativo de estrógeno) basándose en un segundo perfil de expresión que comprende los niveles de expresión de una segunda pluralidad de genes en una muestra de células tomada del individuo, consistiendo dicha segunda pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 1, en donde dicha clasificación de dicho individuo como ER(+) o como ER(-) se lleva a cabo con un método que comprende:a) calcular una primera medida de semejanza entre dicho segundo perfil de expresión y una plantilla de ER(+) y una segunda medida de semejanza entre dicho segundo perfil de expresión y una plantilla de ER (-);- (b)
- comprendiendo dicha plantilla de ER(+), para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes ER(+);
comprendiendo dicha plantilla de ER(-), para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes ER(-), y- (b)
- clasificar (b1) a dicho individuo como ER(+) si dicho segundo perfil de expresión tiene una mayor semejanza con dicha plantilla de ER(+) que con dicha plantilla de ER(-),
o (b2) como ER(-) si dicho segundo perfil de expresión tiene una menor semejanza con dicha plantilla de ER(+) que con dicha plantilla de ER(-). - 9. El método de la reivindicación 1, que comprende además:(iv) clasificar a dicho individuo como BRCA1 o esporádico basándose en un segundo perfil de expresión que comprende los niveles de expresión de una segunda pluralidad de genes en una muestra de células tomada del individuo, consistiendo dicha segunda pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 3, en donde dicha clasificación de dicho individuo como BRCA1 o esporádico se lleva a cabo con un método que comprende:(a) calcular una primera medida de semejanza entre dicho segundo perfil de expresión y una plantilla de BRCA1 y una segunda medida de semejanza entre dicho segundo perfil de expresión y una plantilla de no-BRCA1;comprendiendo dicha plantilla de BRCA1, para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes BRCA1;comprendiendo dicha plantilla de no-BRCA1, para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes no-BRCA1,y(b) clasificar (b1) a dicho individuo como BRCA1 si dicho segundo perfil de expresión tiene una mayor semejanza con dicha plantilla de BRCA1 que con dicha plantilla de no-BRCA1 , o (b2) como esporádico si dicho segundo perfil de expresión tiene una menor semejanza con dicha plantilla de BRCA1 que con dicha plantilla de no-BRCA1.
-
- 10.
- El método de la reivindicación 1, en donde dicho nivel de expresión de cada gen de dicho primer perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia.
-
- 11.
- El método de la reivindicación 10, en donde dicha reserva de referencia procede de una línea celular de cáncer de mama.
-
- 12.
- El método de la reivindicación 10, en donde dicha reserva de referencia procede de una línea celular de una mama normal.
-
- 13.
- El método de la reivindicación 10, en donde dicho nivel relativo de expresión se representa como cociente logarítmico.
-
- 14.
- El método de la reivindicación 1, en donde dicho paso (i) comprende calcular dicho primer parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico, y dicho paso (ii) comprende clasificar a dicho individuo como poseedor de buen pronóstico si dicho primer parámetro clasificador se halla por encima de un umbral elegido.
-
- 15.
- El método de la reivindicación 14, en donde dicha media es una media ponderada de error del cociente logarítmico.
-
- 16.
- El método de la reivindicación 14, en donde dicho nivel de expresión de cada gen en dicho primer perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico, y en donde el nivel medio de expresión de cada gen en dicha primera pluralidad de genes en dicha plantilla de buen pronóstico es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una de dicha pluralidad de pacientes que no tienen metástasis distante en los cinco años siguientes al diagnóstico inicial de cáncer de mama frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico que es una media de los cocientes logarítmicos para dicho gen en dicha pluralidad de pacientes que no tienen metástasis distante en los cinco años siguientes al diagnóstico inicial de cáncer de mama.
-
- 17.
- El método de la reivindicación 14, en donde dicho primer parámetro clasificador es un coeficiente de correlación entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico.
-
- 18.
- El método de la reivindicación 1, que comprende además determinar dicho primer perfil de expresión midiendo los niveles de expresión de dicha primera pluralidad de genes en dicha muestra de células de dicho individuo.
-
- 19.
- El método de la reivindicación 8, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen frente al nivel de expresión de dicho gen en una reserva de referencia.
-
- 20.
- El método de la reivindicación 19, en donde dicha reserva de referencia procede de una línea celular de una mama normal.
-
- 21.
- El método de la reivindicación 19, en donde dicha reserva de referencia procede de una línea celular de un cáncer de mama.
-
- 22.
- El método de la reivindicación 19, en donde dicho nivel relativo de expresión se representa como cociente logarítmico.
-
- 23.
- El método de la reivindicación 8, en donde dicha media es una media ponderada de error del cociente logarítmico.
-
- 24.
- El método de la reivindicación 8, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico; en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en dicha plantilla de ER (+) es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una paciente de dicha pluralidad de pacientes ER(+) frente al nivel de expresión de dicho gen en una reserva de referencia, representada como cociente logarítmico que es una media de los cocientes logarítmicos para dicho gen en dicha pluralidad de pacientes ER/+), y en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en ficha plantilla de ER(-) es una media de los niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una de dicha pluralidad de pacientes ER(-) con respecto al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico que es una media de los cocientes logarítmicos para dicho gen en dicha pluralidad de pacientes ER(-).
-
- 25.
- El método de la reivindicación 8, en donde dicha primera medida de semejanza entre dicho segundo perfil de expresión y dicha plantilla de ER(+) es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(+), en donde dicha segunda medida de semejanza entre dicho segundo perfil de expresión y dicha plantilla de ER(-) es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(-) y en donde de dicho segundo perfil de expresión se dice que tiene una semejanza mayor con dicha plantilla de ER(+) que con dicha plantilla de ER(-) si
dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(+) es mayor que dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(-), o del que se dice que tiene una semejanza menor con dicha plantilla de ER(+) que con dicha plantilla de ER(-) si dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(+) es menor que dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(-). -
- 26.
- El método de la reivindicación 8, que comprende además determinar dicho segundo perfil de expresión midiendo los niveles de expresión de dicha segunda pluralidad de genes en dicha muestra de células de dicho individuo.
-
- 27.
- El método de la reivindicación 9, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia.
-
- 28.
- El método de la reivindicación 27, en donde dicha reserva de referencia procede de una línea celular de una mama normal.
-
- 29.
- El método de la reivindicación 27, en donde dicha reserva de referencia procede de una línea celular de cáncer de mama.
-
- 30.
- El método de la reivindicación 27, en donde dicho nivel relativo de expresión se representa como cociente logarítmico.
-
- 31.
- El método de la reivindicación 9, en donde cada una de dichas medias es una media ponderada de error del cociente logarítmico.
- 32. El método de la reivindicación 9, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico; en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en dicha plantilla de BRCA1 es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una paciente de dicha pluralidad de pacientes BRCA1 frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico que es una media de cocientes logarítmicos de dicho gen en dicha pluralidad de pacientes BRCA1 y en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en dicha plantilla de no BRCA1 es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una paciente de dicha pluralidad de pacientes no-BRCA1 frente al nivel de expresión de dicho gen en una reserva de referencia, representado como un cociente logarítmico que es una media de cocientes logarítmicos de dicho gen en dicha pluralidad de pacientes no-BRCA1.
-
- 33.
- El método de la reivindicación 32, en donde dicha primera medida de semejanza entre dicho segundo perfil de expresión y dicha plantilla de BRCA1 es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de BRCA1, en donde dicha segunda medida de semejanza entre segundo perfil de expresión y dicha plantilla de no-BRCA1 es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de no-BRCA1 y en donde de dicho segundo perfil de expresión se dice que tiene una semejanza mayor con dicha plantilla de BRCA1 que con dicha plantilla de no-BRCA1 si dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de de BRCA1 es mayor que dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de no-BRCA1, o del que se dice que tiene una semejanza menor con dicha plantilla de no-BRCA1 que con dicha plantilla de BRCA1 si dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de BRCA1 es menor que el coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de no-BRCA1.
-
- 34.
- El método de la reivindicación 9, que comprende además determinar dicho segundo perfil de expresión midiendo los niveles de expresión de dicha segunda pluralidad de genes en dicha muestra de células de dicho individuo.
-
- 35.
- El método de cualquiera de las reivindicaciones 10-14, 15 y 16, en donde dicha pluralidad consiste en al menos 20 de los genes cuyos marcadores se enumeran en la Tabla 5.
-
- 36.
- El método de cualquiera de las reivindicaciones 10-14, 15 y 16, en donde dicha pluralidad consiste en al menos 50 de los genes cuyos marcadores se enumeran en la Tabla 5.
-
- 37.
- El método de cualquiera de las reivindicaciones 10-14, 15 y 16, en donde dicha pluralidad consiste en al menos 75 de los genes cuyos marcadores se enumeran en la Tabla 5.
-
- 38.
- El método de cualquiera de las reivindicaciones 1-6, en donde dicho paso (i) comprende calcular dicho segundo parámetro clasificador entre dicho segundo perfil de expresión y dicha plantilla de buen pronóstico y dicho tercer parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de pronóstico deficiente, consistente dicho paso (ii) en clasificar a dicho individuo como poseedor de buen
5 pronóstico si dicho primer perfil de expresión es más parecido a dicha plantilla de buen pronóstico que a dicha plantilla de pronóstico deficiente, o clasificar a dicho individuo como poseedor de pronóstico deficiente si dicho primer perfil de expresión es más parecido a dicha plantilla de pronóstico deficiente que a dicha plantilla de buen pronóstico. - 39. El método de la reivindicación 38, en donde dicho segundo parámetro clasificador es un coeficiente de10 correlación entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico y en donde dicho tercer parámetro clasificador es un coeficiente de correlación entre dicho primer perfil de expresión y dicha plantilla de pronóstico deficiente.
- 40. El método de cualquiera de las reivindicaciones 1-6 y 14, en donde dicho cáncer de mama es cáncer de mama esporádico.15 41. El método de la reivindicación 38, en donde dicho cáncer de mama es cáncer de mama esporádico.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US29891801P | 2001-06-18 | 2001-06-18 | |
| US298918P | 2001-06-18 | ||
| US380710P | 2002-05-14 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2366178T3 true ES2366178T3 (es) | 2011-10-18 |
Family
ID=44681548
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES02746538T Expired - Lifetime ES2366178T3 (es) | 2001-06-18 | 2002-06-14 | Diagnóstico y pronóstico del cáncer de mama en pacientes. |
Country Status (1)
| Country | Link |
|---|---|
| ES (1) | ES2366178T3 (es) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190287644A1 (en) * | 2018-02-15 | 2019-09-19 | Northeastern University | Correlation Method To Identify Relevant Genes For Personalized Treatment Of Complex Disease |
-
2002
- 2002-06-14 ES ES02746538T patent/ES2366178T3/es not_active Expired - Lifetime
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190287644A1 (en) * | 2018-02-15 | 2019-09-19 | Northeastern University | Correlation Method To Identify Relevant Genes For Personalized Treatment Of Complex Disease |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7514209B2 (en) | Diagnosis and prognosis of breast cancer patients | |
| US7171311B2 (en) | Methods of assigning treatment to breast cancer patients | |
| US8019552B2 (en) | Classification of breast cancer patients using a combination of clinical criteria and informative genesets | |
| JP6351112B2 (ja) | 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験 | |
| JP6140202B2 (ja) | 乳癌の予後を予測するための遺伝子発現プロフィール | |
| ES2504242T3 (es) | Pronóstico de cáncer de mama | |
| AU2005267756A1 (en) | Prognosis of breast cancer patients | |
| WO2017215230A1 (zh) | 一组胃癌基因的应用 | |
| CN101743327A (zh) | 黑色素瘤的预后预测 | |
| JP2008536094A (ja) | 乳癌患者における化学療法反応性を予測する方法 | |
| US20150344962A1 (en) | Methods for evaluating breast cancer prognosis | |
| EP2333112B1 (en) | Breast cancer prognostics | |
| TW201741915A (zh) | 基因表現圖譜以及將其應用於乳癌醫療之方法 | |
| WO2011009908A2 (en) | A method for predicting clinical outcome of patients with breast carcinoma | |
| ES2366178T3 (es) | Diagnóstico y pronóstico del cáncer de mama en pacientes. | |
| Chen | A cancer proliferation gene signature supervised by Ki-67 strata specific to luminal A, estrogen receptor-positive, and HER2-negative ductal carcinomas | |
| EP1682896A2 (en) | Method for distinguishing aml subtypes with aberrant and prognostically intermediate karyotypes |