[go: up one dir, main page]

ES2292467T3 - Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados. - Google Patents

Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados. Download PDF

Info

Publication number
ES2292467T3
ES2292467T3 ES00960208T ES00960208T ES2292467T3 ES 2292467 T3 ES2292467 T3 ES 2292467T3 ES 00960208 T ES00960208 T ES 00960208T ES 00960208 T ES00960208 T ES 00960208T ES 2292467 T3 ES2292467 T3 ES 2292467T3
Authority
ES
Spain
Prior art keywords
domesticated
sequence
sequences
organism
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00960208T
Other languages
English (en)
Inventor
Walter Messier
James M. Sikela
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evolutionary Genomics LLC
Original Assignee
Evolutionary Genomics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/368,810 external-priority patent/US6274319B1/en
Priority claimed from PCT/US1999/020209 external-priority patent/WO2000012764A1/en
Priority claimed from US09/591,435 external-priority patent/US6280953B1/en
Application filed by Evolutionary Genomics LLC filed Critical Evolutionary Genomics LLC
Application granted granted Critical
Publication of ES2292467T3 publication Critical patent/ES2292467T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1037Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicinal Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

Procedimiento para identificar una secuencia de polinucleótido que codifica para un polipéptido de un organismo domesticado, en el que dicho polipéptido puede estar asociado con un rasgo estética o comercialmente relevante que es único, está potenciado o alterado en el organismo domesticado en comparación con un ancestro de tipo natural de dicho organismo domesticado, que comprende: (a) comparar secuencias de nucleótidos que codifican para proteínas de dicho organismo domesticado con secuencias de nucleótidos que codifican para proteínas de dicho ancestro de tipo natural; y (b) seleccionar una secuencia de polinucleótido que codifica para proteínas en el organismo domesticado que contiene un cambio de nucleótido que es significativo desde el punto de vista evolutivo en comparación con una secuencia correspondiente en el ancestro de tipo natural, tal como se define mediante una razón (Ka/Ks) de la tasa de sustitución no sinónima (Ka) con respecto a la tasa de sustitución sinónima (Ks), en la secuencia de polinucleótido que codifica para proteínas parcial o completa, de >= 0, 75.

Description

Procedimientos para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleótidos y de polipéptidos en plantas y animales domesticados.
Campo técnico
La presente invención se refiere a utilizar técnicas moleculares y evolutivas para identificar secuencias de polinucleótidos y de polipéptidos que corresponden a rasgos estética o comercialmente relevantes en plantas y animales domesticados.
Antecedentes de la técnica
Los seres humanos han cultivado plantas y han criado animales durante miles de años, seleccionando ciertos rasgos comercialmente valiosos y/o estéticos. Las plantas domesticadas difieren de sus ancestros de tipo natural en rasgos tales como el rendimiento, floración de día de duración corta, contenido en proteínas y/o en aceite, facilidad de recolección, sabor, resistencia a la enfermedad y resistencia a la sequía. Los animales domesticados difieren de sus ancestros de tipo natural en rasgos tales como el contenido en grasas y/o en proteínas, producción de leche, docilidad, fecundidad y tiempo hasta el pleno desarrollo. En la actualidad, la mayoría de los genes subyacentes a las diferencias anteriores no se conocen, ni tan poco lo son, con la misma importancia, los cambios específicos que han evolucionado en estos genes para proporcionar estas capacidades. El entendimiento de la base de estas diferencias entre plantas y animales domesticados y sus ancestros de tipo natural proporcionará información útil para mantener y potenciar estos rasgos. En el caso de las plantas de cultivo, la identificación de los genes específicos que controlan los rasgos deseados permitirá una mejora rápida y directa de una manera no posible anteriormente.
Aunque la comparación de proteínas o genes homólogos entre especies domesticadas y sus ancestros de tipo natural puede proporcionar información útil con respecto a las secuencias moleculares conservadas y las rasgos distintivos funcionales, este enfoque es de uso limitado para identificar genes cuyas secuencias han cambiado debido a presiones selectivas impuestas por el ser humano. Con la llegada de procedimientos analíticos y algoritmos sofisticados, puede sacarse mucha más información de los cambios en la secuencia de ADN en lo que respecta a qué genes se han seleccionado positivamente. El más potente de estos procedimientos, "K_{A}/K_{S}," implica comparaciones por parejas entre secuencias de nucleótidos alineadas que codifican para proteínas de las razones de
\frac{\text{sustituciones de nucleótido no sinónimas por sitio no sinónimo} \ (K_{A})}{\text{sustituciones sinónimas por sitio sinónimo} \ (K_{S})}
(en las que no sinónimas significa sustituciones que cambian el aminoácido codificado y sinónimas significa sustituciones que no cambian el aminoácido codificado). Los "procedimientos de tipo K_{A}/K_{S}" incluyen éste y procedimientos similares.
Estos procedimientos ya se han usado para demostrar la aparición de una selección darwiniana (es decir, natural) positiva a nivel molecular, que da como resultado diferencias de aminoácido en proteínas homólogas. Varios grupos han usado tales procedimientos para documentar que una proteína particular ha evolucionado más rápidamente que la tasa de sustitución neutra, y por tanto apoya la existencia de una selección darwiniana positiva a nivel molecular. Por ejemplo, McDonald y Kreitman (1991) Nature 351:652-654, proponen una prueba estadística de hipótesis de evolución proteica neutra basada en la comparación del número de sustituciones con reemplazo de aminoácido con respecto a sustituciones sinónimas en la región codificante de un locus. Cuando aplican esta prueba al locus Adh de tres especies de Drosophila, concluyen que entonces se muestra que el locus ha experimentado una fijación adaptativa de mutaciones selectivamente ventajosas y que la fijación selectiva de mutaciones adaptativas puede ser una alternativa viable a la acumulación con precisión de reloj de mutaciones neutras como una explicación para la evolución de la mayoría de las proteínas. Jenkins et al. (1995) Proc. R. Soc. Lond. B 261:203-207 usan la prueba de McDonald y Kreitman para investigar si se produce una evolución adaptativa en secuencias que controlan la transcripción (secuencias no codificantes).
Nakashima et al. (1995) Proc. Natl. Acad. Sci USA 92:5606-5609, usan el procedimiento de Miyata y Yasunaga para llevar a cabo comparaciones por parejas de las secuencias de nucleótidos de diez genes de isozima de PLA2 de dos especies de serpiente; este procedimiento implica comparar el número de sustituciones de nucleótido por sitio para las regiones no codificantes incluyendo los intrones (K_{N}) y las K_{A} y K_{S}. Concluyen que las regiones que codifican para proteínas han evolucionado a tasas mucho mayores que las regiones no codificantes incluyendo los intrones. La tasa de sustitución sumamente acelerada es responsable de la evolución darwiniana a nivel molecular de los genes de isozima de PLA2 para producir nuevas actividades fisiológicas que deben haber proporcionado una fuerte ventaja selectiva para cazar presas o para la defensa frente a depredadores. Endo et al. (1996) Mol. Biol. Evol. 13(5):685-690 usan el procedimiento de Nei y Gojobori, en el que d_{N} es el número de sustituciones no sinónimas y d_{S} es el número de sustituciones sinónimas, para el fin de identificar genes candidatos en los que funciona la selección positiva natural. Metz y Palumbi (1996) Mol. Biol. Evol. 13(2):397-406 usan la prueba de McDonald y Kreitman (citada anteriormente) así como un procedimiento atribuido a Nei y Gojobori, Nei y Jin, y Kumar, Tamura, y Nei; que examina las proporciones promedio de P_{n}, las sustituciones con reemplazo por sitio de reemplazo, y P_{s}, las sustituciones silenciosas por sitio silencioso, para buscar pruebas de la selección positiva en genes de unión en erizos marinos para investigar si han evolucionado rápidamente como un preludio de la formación de especie. Goodwin et al. (1996) Mol. Biol. Evol. 13(2):346-358 usan procedimientos similares para examinar la evolución de una familia de genes murinos particular y concluyen que los procedimientos proporcionan una comprensión fundamental importante sobre cómo la selección dirige la divergencia genética en un sistema experimentalmente manipulable. Edwards et al. (1995) usan cebadores degenerados para extraer locus del MHC de varias especies de pájaros y un especie de caimán, que entonces se analizan mediante los procedimientos de Nei y Gojobori (razones d_{N}:d_{S}) para extender los estudios de MHC a vertebrados no mamíferos. Whitfield et al. (1993) Nature 364:713-715 usan el análisis de K_{A}/K_{S} para buscar la selección direccional en las regiones que flanquean una región conservada en el gen SRY (que determina el sexo masculino). Sugieren que la rápida evolución de SRY podría ser una causa significativa del aislamiento reproductor, conduciendo a nuevas especies. Wettsetin et al. (1996) Mol. Biol. Evol. 13(1):56-66 aplican el programa MEGA de Kumar, Tamura y Nei y el análisis filogenético para investigar la diversificación de genes de MHC de clase I en ardillas y roedores relacionados. Parham y Ohta (1996) Science 272:67-74 establecen que se requiere un enfoque de la biología poblacional, que incluye pruebas para la selección así como para la conversión génica y la deriva neutra para analizar la generación y el mantenimiento del polimorfismo de MHC de clase I humano. Hughes (1997) Mol. Biol. Evol. 14(1):1-5 comparó más de cien dominios C2 de inmunoglobulina ortólogos entre seres humanos y roedores, usando el procedimiento de Nei y Gojobori (razones d_{N}:d_{S}) para someter a prueba la hipótesis de que las proteínas expresadas en células del sistema inmunológico de vertebrados evolucionan de una manera inusualmente rápida. Swanson y Vacquier (1998) Science 281:710-712 usan razones d_{N}:d_{S} para demostrar la evolución coordinada entre la lisina y el receptor para la lisina del huevo y tratan el papel de tal evolución coordinada en la formación de nuevas especias (especiación). Messier y Stewart (1997) Nature 385:151-154, usaron K_{A}/K_{S} para demostrar la selección positiva en lisozimas
de primates.
Los cambios genéticos asociados con la domesticación se han investigado de la manera más extensa en el maíz (Dorweiler (1993) Science 262:232-235). Para el maíz, (Zea ssp. mays mays), aparentemente un número menor de cambios de un único gen explica todas las diferencias entre nuestra planta de maíz domesticada presente y su ancestro de tipo natural, teosinte (Zea mays ssp paruiglumis) (Dorweiler, 1993). El análisis QTL (locus de rasgo cuantitativo) ha demostrado (Doebley (1990) PNAS USA 87:9888-9892) que no más de quince genes controlan los rasgos de interés en el maíz y explican la enorme diferencia en la morfología entre el maíz y el teosinte (Wang (1999) Nature 398:236-239).
De manera importante, un número similarmente menor de genes puede controlar los rasgos de interés en otras plantas de cultivo derivadas de las gramíneas, incluyendo el arroz, trigo, mijo y sorgo (Paterson (1995) Science 269:1714-1718). En efecto, para la mayoría de estos genes relevantes en el maíz, el gen homólogo puede controlar rasgos similares en otras plantas de cultivo derivadas de las gramíneas (Paterson, 1995). Por tanto, la identificación de estos genes en el maíz facilitaría la identificación de genes homólogos en el arroz, trigo, mijo y sorgo.
Tal como puede observarse de los artículos citados anteriormente, pueden aplicarse procedimientos analíticos de evolución molecular para identificar genes que evolucionan rápidamente (procedimientos de tipo K_{A}/K_{S}) para conseguir muchos fines diferentes, lo más común para confirmar la existencia de una selección darwiniana positiva a nivel molecular, pero también para evaluar la frecuencia de la selección darwiniana positiva a nivel molecular, para entender las relaciones filogenéticas, para aclarar mecanismos mediante los cuales se forman nuevas especias o para establecer un único origen o múltiples orígenes para polimorfismos génicos específicos. Lo que está claro de los artículos citados anteriormente y otros en la bibliografía es que ninguno de los autores aplicó procedimientos del tipo K_{A}/K_{S} para identificar cambios evolutivos en plantas y animales domesticados provocados por presiones selectivas artificiales. Aunque Turcich et al. (1996) Sexual Plant Reproduction 9:65-74, describe el uso del análisis de K_{S} en genes de plantas, se cree que nadie ha usado el análisis de tipo K_{A}/K_{S} como una herramienta sistemática para identificar en plantas y animales domesticados aquellos genes que contienen cambios de secuencia significativos desde el punto de vista evolutivo que pueden aprovecharse para el desarrollo, el mantenimiento o la potenciación de rasgos comerciales o estéticos deseables.
La identificación en especies domesticadas de genes que han evolucionado para conferir funciones únicas, potenciadas o alteradas en comparación con genes ancestrales homólogos pudo usarse para desarrollar agentes para modular estas funciones. La identificación de los genes subyacentes de especies domesticadas y los cambios de nucleótido específicos que han evolucionado, y la caracterización adicional de los cambios físicos y bioquímicos en las proteínas codificadas por estos genes evolucionados, pudo proporcionar información valiosa sobre los mecanismos subyacentes al rasgo deseado. Esta información valiosa pudo aplicarse para desarrollar agentes que potencian adicionalmente la función de las proteínas diana. Alternativamente, una modificación adicional de los genes responsables pudo modificar o aumentar el rasgo deseado. Adicionalmente, pudo encontrarse que los genes identificados desempeñan un papel en el control de los rasgos de interés en otras plantas domesticadas. Un proceso similar puede identificar genes para los rasgos de interés en animales domésticos.
Doebley, Trends in Genetics, volumen 8, nº 9, septiembre de 1992, páginas 302-307 describe la aplicación de análisis genéticos usando marcadores moleculares para el mapeado de genes que controlan los rasgos morfológicos en el maíz y su progenitor de tipo natural el teosinte. Mediante el desarrollo de mapas de unión saturada usando polimorfismos de la longitud de los fragmentos de restricción (RFLP) y nuevos procedimientos estadísticos para mapear y caracterizar locus de rasgos cuantitativos (QTL) se identificaron cinco regiones del genoma que se dice que controlan la mayoría de las diferencias entre el maíz y el teosinte.
El documento EP 0 120 658 A2 da a conocer un procedimiento de caracterización de una especie de organismo desconocido que comprende determinar la posición de secuencias conservadas desde el punto de vista evolutivo en el material genético del organismo con respecto a una posición conocida de sitios de escisión de endonucleasa de restricción en dicho material genético con el fin de obtener una caracterización genética de identificación de dicho organismo desconocido, y comparar dicha caracterización con información de por lo menos dos conjuntos de caracterizaciones genéticas de identificación derivadas de las mismas secuencias conservadas, definiendo cada uno de dichos conjuntos una especie de organismo conocido.
Exposición de la invención
La presente invención proporciona procedimientos para identificar secuencias de polinucleótido y polipéptido que presentan cambios significativos desde el punto de vista evolutivo, que están asociadas con rasgos comerciales o estéticos en organismos domesticados incluyendo plantas y animales. La invención usa genómica comparativa para identificar cambios de gen específico que pueden estar asociados con, y por tanto ser responsables de, condiciones estructurales, bioquímicas o fisiológicas, tales como rasgos estética o comercialmente relevantes, y usar la información obtenida a partir de estos rasgos para desarrollar organismos domesticados con rasgos de interés potenciados.
En una forma de realización preferida, un polinucleótido o polipéptido de una planta o animal domesticado ha experimentado una selección artificial que dio como resultado un cambio significativo desde el punto de vista evolutivo presente en la especie domesticada que no está presente en el ancestro de tipo natural. Un ejemplo de esta forma de realización es que el polinucleótido o polipéptido puede estar asociado con un rendimiento de cultivo potenciado en comparación con el ancestro. Otros ejemplos incluyen la floración de día de duración corta (es decir, floración sólo si el periodo diario de luz es más corto que cierta duración crítica), contenido en proteínas, contenido en aceite, facilidad de recolección, sabor, resistencia a la sequía y resistencia a la enfermedad. Por tanto la presente invención puede ser útil para llegar a comprender los mecanismos moleculares que subyacen a las funciones o los rasgos en organismos domesticados. Esta información puede ser útil para diseñar el polinucleótido de modo que se potencia adicionalmente la función o el rasgo. Por ejemplo, un polinucleótido que se ha determinado que es responsable del rendimiento de cultivo mejorado puede someterse a mutagénesis al azar o dirigida, seguida por pruebas de los genes mutantes para identificar aquellos que potencian adicionalmente el rasgo.
Por consiguiente, en un aspecto, se proporcionan procedimientos para identificar una secuencia de polinucleótido que codifica para un polipéptido de un organismo domesticado (por ejemplo, una planta o un animal), en los que el polipéptido puede estar asociado con un rasgo estética o comercialmente relevante que es único, está potenciado o alterado en el organismo domesticado en comparación con el ancestro de tipo natural del organismo domesticado, comprendiendo las etapas siguientes: a) comparar secuencias de nucleótidos que codifican para proteínas de dicho organismo domesticado con secuencias de nucleótidos que codifican para proteínas de dicho ancestro de tipo natural; y b) seleccionar una secuencia de polinucleótido en el organismo domesticado que contiene un cambio de nucleótido en comparación con una secuencia correspondiente en el ancestro de tipo natural, en el que dicho cambio es significativo desde el punto de vista evolutivo.
En otro aspecto de la invención, se proporcionan procedimientos para identificar un cambio significativo desde el punto de vista evolutivo en una secuencia de nucleótidos que codifica para proteínas de un organismo domesticado (por ejemplo, una planta o un animal), comprendiendo las etapas siguientes: a) comparar secuencias de nucleótidos que codifican para proteínas de organismo domesticado con secuencias correspondientes de un ancestro de tipo natural del organismo domesticado; y b) seleccionar una secuencia de polinucleótido en dicho organismo domesticado que contiene un cambio de nucleótido en comparación con la secuencia correspondiente de ancestro de tipo natural, en el que el cambio es significativo desde el punto de vista evolutivo.
En algunas formas de realización, el cambio de nucleótido identificado por cualquiera de los procedimientos descritos en la presente memoria es una sustitución no sinónima. En algunas realizaciones, la significación evolutiva del cambio de nucleótido se determina según la tasa de sustitución no sinónima (K_{A}) de la secuencia de nucleótidos. En algunas realizaciones, los cambios significativos desde el punto de vista evolutivo se evalúan mediante la determinación de la razón K_{A}/K_{S} entre el polinucleótido del organismo domesticado y el polinucleótido ancestral correspondiente. Preferentemente la razón es de por lo menos aproximadamente 0,75, o con preferencia creciente, la razón es de por lo menos aproximadamente 1,25, 1,50 y 2,00.
En otro aspecto, la invención proporciona un procedimiento de identificación de un agente que puede modular el rasgo relevante en el organismo domesticado, comprendiendo dicho procedimiento poner en contacto por lo menos un agente candidato con una célula, sistema modelo o animal no humano o planta transgénica que expresa la secuencia de polinucleótido que presenta el cambio significativo desde el punto de vista evolutivo, en el que el agente se identifica por su capacidad para modular la función del polipéptido.
También se proporciona un procedimiento para la comparación de secuencias a gran escala entre secuencias de nucleótidos que codifican para proteínas de un organismo domesticado y secuencias que codifican para proteínas de un ancestro de tipo natural, comprendiendo dicho procedimiento: a) alinear las secuencias de organismo domesticado con secuencias correspondientes de ancestro de tipo natural según la homología de las secuencias; y b) identificar cualquier cambio de nucleótido dentro de las secuencias de organismo domesticado en comparación con las secuencias homólogas de primate ancestral de tipo natural.
En otro aspecto, la invención objeto proporciona un procedimiento para correlacionar un cambio de nucleótido significativo desde el punto de vista evolutivo con un rasgo estética o comercialmente relevante que es único, está potenciado o alterado en un organismo domesticado, que comprende: a) identificar una secuencia de nucleótidos que presenta un cambio significativo desde el punto de vista evolutivo según los procedimientos descritos en la presente memoria; y b) analizar el efecto funcional de la presencia o ausencia de la secuencia identificada en el organismo domesticado o en un sistema modelo.
Las plantas domesticadas usadas en los procedimientos objeto pueden ser maíz, arroz, tomates, patatas o cualquier planta domesticada para la que existe y se conoce el ancestro de tipo natural. Por ejemplo, el ancestro del maíz es teosinte; los ancestros del trigo son Triticum monococcum, T. speltoides y Aegilops tauschii; y los ancestros del arroz son Oryza nivora y O. rufipogon. El rasgo relevante puede ser cualquier rasgo estética o comercialmente relevante tal como rendimiento, floración de día de duración corta, contenido en proteínas, contenido en aceite, resistencia a la sequía, sabor, facilidad de recolección o resistencia a la enfermedad.
Los animales domesticados usados en los procedimientos objeto pueden ser cualquier animal domesticado para el que está disponible un ancestro incluyendo cerdos, ganado, caballos, perros y gatos. Por ejemplo, un ancestro del caballo es el caballo de Pryzewalskii; y los ancestros de ganado incluyen algunas razas indias. El rasgo relevante podría ser, por ejemplo, el contenido en grasas, contenido en proteínas, la producción de leche, tiempo hasta el pleno desarrollo, fecundidad, docilidad o resistencia a la enfermedad y sensibilidad frente a la enfermedad.
Descripción detallada de la invención
La presente invención utiliza la genómica comparativa para identificar cambios génicos específicos que están asociados con, y por tanto pueden contribuir a o ser responsable de, rasgos estética o comercialmente relevantes en organismos domesticados (por ejemplo, plantas y animales).
En una forma de realización preferida, los procedimientos descritos en la presente memoria pueden aplicarse para identificar los genes que controlan rasgos de interés en plantas domesticadas importantes en la agricultura. Los seres humanos han cultivado plantas domesticadas durante varios miles de años sin conocimiento de los genes que controlan estos rasgos. El conocimiento de los mecanismos genéticos específicos implicados permitiría una intervención mucho más rápida y directa a nivel molecular para crear plantas con rasgos deseables o potenciados.
Los seres humanos, mediante la selección artificial, han proporcionado presiones de selección intensas sobre las plantas de cultivo. Esta presión se refleja en cambios significativos desde el punto de vista evolutivo entre genes homólogos de organismos domesticados y sus ancestros de tipo natural. Se ha encontrado que sólo unos pocos genes, por ejemplo, 10-15 por especie, controlan los rasgos de interés comercial en plantas de cultivo domesticadas. Estos pocos genes han sido extremadamente difíciles de identificar mediante procedimientos convencionales de biología molecular vegetal. Los análisis de K_{A}/K_{S} y relacionados descritos en la presente memoria pueden identificar los genes que controlan los rasgos de interés si esos genes han experimentado cambios en la región que codifica para proteínas.
Para cualquier planta de cultivo de interés, pueden construirse bibliotecas de ADNc a partir de las especies o subespecies domesticadas y su ancestro de tipo natural. Tal como se describe en el documento USSN 09/240.915, presentado el 29 de enero de 1999, la bibliotecas de ADNc de cada una se "comparan con BLAST" entre sí para identificar polinucleótidos homólogos. Alternativamente, el experto en la materia puede acceder a bases de datos de ADNc o genómicas comercial y/o públicamente disponibles tales como las que se encuentran en:
www.central.edu/homepages/liedlb/geneticas/gene-site.html;
www.ornl.gov/Techresources/Human-Genome/geneticas.html; y
www.mcb.harvard.edu/Biolinks/Sequences.htm
www.ncbi.nlm.gov/Web/Genbank/index.html
en vez de construir bibliotecas de ADNc. A continuación, se lleva a cabo un análisis de K_{A}/K_{S} o relacionado para identificar genes seleccionados que han evolucionado rápidamente bajo presión selectiva. Entonces se evalúan estos genes usando procedimientos de plantas transgénicas y moleculares convencionales para determinar si desempeñan un papel en los rasgos de interés comercial o estético. Entonces se manipulan los genes de interés mediante, por ejemplo, mutagénesis al azar o dirigida al sitio, para desarrollar nuevas variedades, subespecies, cepas o cultivos mejorados.
De manera similar, los procedimientos descritos en la presente memoria pueden aplicarse a animales domesticados incluyendo cerdos, ganado, caballos, perros, gatos y otros animales domesticados para los que está disponible un ancestro de tipo natural. El ganado y los caballos, especialmente, representan intereses comerciales importantes. Al igual que con las plantas, los seres humanos han criado animales durante miles de años, y esas presiones de selección intensas se reflejarán en tasas de K_{A}/K_{S} elevadas para genes de interés que han evolucionado rápidamente. De nuevo, para identificar polinucleótidos homólogos, pueden compararse con BLAST bibliotecas de ADNc de animales domesticados y sus ancestros de tipo natural entre sí, y/o puede accederse a bases de datos de ADNc o genómicas públicas o privadas disponibles. Para las secuencias homólogas, puede llevarse a cabo análisis de K_{A}/K_{S} o relacionados, que identificarán los polinucleótidos que han evolucionado rápidamente bajo la presión selectiva artificial. Estos genes se evalúan entonces usando procedimientos de animales transgénicos no humanos y moleculares convencionales determinar si desempeñan un papel en los rasgos de interés comercial o estético. Entonces pueden manipularse esos genes para desarrollar nuevas variedades o subespecies de animales mejoradas.
La puesta en práctica de la presente invención emplea, a menos que se indique lo contrario, técnicas convencionales de biología molecular, genética y evolución molecular, que están dentro de la habilidad de la materia. Tales técnicas se explican con detalle en la bibliografía, tal como: "Molecular Cloning: A Laboratory Manual", segunda edición (Sambrook et al., 1989); "Oligonucleotide Synthesis" (M. J. Gait, ed., 1984); "Current Protocols-in Molecular Biology" (F. M. Ausubel et al., eds., 1987); "PCR: The Polymerase Chain Reaction", (Mullis et al., eds., 1994); "Molecular Evolution", (Li, 1997).
\vskip1.000000\baselineskip
Definiciones
Tal como se usa en la presente memoria, un "polinucleótido" se refiere a una forma polimérica de nucleótidos de cualquier longitud, ya sean ribonucleótidos o desoxirribonucleótidos, o análogos de los mismos. Este término se refiere a la estructura primaria de la molécula, y por tanto incluye ADN de cadena doble y sencilla, así como ARN de cadena doble y sencilla. También incluye polinucleótidos modificados tales como polinucleótidos metilados y/o de extremos ocupados. Los términos "polinucleótido" y "secuencia de nucleótidos" se usan de manera intercambiable.
Tal como se usa en la presente memoria, un "gen" se refiere a un polinucleótido o una parte de un polinucleótido que comprende una secuencia que codifica para una proteína. Es bien conocido en la técnica que un gen también comprende secuencias no codificantes, tales como secuencias flanqueantes 5' y 3' (tales como promotores, potenciadores, represores y otras secuencias reguladoras) así como intrones.
Los términos "polipéptido", "péptido" y "proteína" se usan de manera intercambiable en la presente memoria para hacer referencia a polímeros de aminoácidos de cualquier longitud. Estos términos incluyen también proteínas que se modifican tras la traducción mediante reacciones que incluyen la glucosilación, acetilación y fosforilación.
La expresión "organismo domesticado" se refiere a un organismo vivo individual o población del mismo, una especie, subespecie, variedad, cultivo o cepa, que se ha sometido a presión de selección artificial y ha desarrollado un rasgo estética o comercialmente relevante. En algunas realizaciones preferidas, el organismo domesticado es una planta seleccionada del grupo que está constituido por maíz, trigo, arroz, sorgo, tomate o patata, o cualquier otra planta domesticada de interés comercial, de la que se conoce un ancestro. En otras realizaciones preferidas, el organismo domesticado es un animal seleccionado del grupo que está constituido por ganado, caballos, cerdos, gatos y perros. Un organismo domesticado y su ancestro pueden estar relacionados como diferentes especies, subespecies, variedades, cultivos o cepas o cualquier combinación de los mismos.
La expresión "ancestro de tipo natural" o el término "ancestro" significa un organismo, especie, subespecie, variedad, cultivo o cepa precursor o predecesor a partir del que ha evolucionado un organismo domesticado, especie, subespecie, variedad, cultivo o cepa. Un organismo domesticado puede tener uno o más de un ancestro. Normalmente, las plantas domesticadas pueden tener uno o una pluralidad de ancestros, mientras que los animales domesticados normalmente tienen sólo un único ancestro.
La expresión "rasgo estética o comercialmente relevante" se usa en la presente memoria para hacer referencia a rasgos que existen en organismos domesticados tales como plantas o animales cuyo análisis podría proporcionar información (por ejemplo, datos físicos o bioquímicos) relevantes para el desarrollo de agentes que pueden modular el polipéptido responsable del rasgo. El rasgo estética o comercialmente relevante puede ser único, estar potenciado o alterado en relación al ancestro. Por "alterado," se quiere decir que el rasgo relevante difiere cualitativa o cuantitativamente de los rasgos observados en el ancestro.
La expresión "procedimientos de tipo K_{A}/K_{S}" significa procedimientos que evalúan las diferencias, con frecuencia (pero no siempre) mostradas como una razón, entre el número de sustituciones no sinónimas y sustituciones sinónimas en genes homólogos (incluyendo los procedimientos más rigurosos que determinan los sitios no sinónimos y sinónimos). Estos procedimientos se designan usando varios sistemas de nomenclatura, incluyendo pero sin limitarse a K_{A}/K_{S}, d_{N}/d_{S}, D_{N}/D_{S}.
Las expresiones "cambio significativo desde el punto de vista evolutivo" y "cambio evolutivo adaptativo" se refieren a uno o más cambios de secuencia de nucleótidos o péptidos entre dos organismos, especies, subespecies, variedades, cultivos y/o cepas que pueden atribuirse a una presión selectiva positiva. Un procedimiento para determinar la presencia de un cambio significativo desde el punto de vista evolutivo es aplicar un procedimiento analítico de tipo K_{A}/K_{S}, tal como medir una razón K_{A}/K_{S}. Normalmente, una razón K_{A}/K_{S} de por lo menos aproximadamente 0,75, más preferentemente de por lo menos aproximadamente 1,0, más preferentemente de por lo menos aproximadamente 1,25, más preferentemente de por lo menos aproximadamente 1,5 y lo más preferentemente de por lo menos aproximadamente 2,0 indica la acción de selección positiva y se considera que es un cambio significativo desde el punto de vista evolutivo.
La expresión "cambio significativo desde el punto de vista evolutivo positivo" significa un cambio significativo desde el punto de vista evolutivo en un organismo, especie, subespecie, variedad, cultivo o cepa particular que da como resultado un cambio adaptativo que es positivo en comparación con otros organismos relacionados. Un ejemplo de un cambio significativo desde el punto de vista evolutivo positivo es un cambio que ha dado como resultado un rendimiento potenciado en plantas de cultivo.
El término "resistente" significa que un organismo presenta una capacidad para evitar, o disminuir la magnitud de un estado de enfermedad y/o desarrollo de la enfermedad, preferentemente en comparación con organismos no resistentes.
El término "sensibilidad" significa que un organismo no puede evitar, o disminuir la magnitud de un estado de enfermedad y/o desarrollo del estado de enfermedad, preferentemente en comparación con un organismo que se conoce que es resistente.
Se entiende que la resistencia y la sensibilidad varían de entre individuos, y que, para los fines de esta invención, estos términos se aplican también a un grupo de individuos dentro de una especie, y las comparaciones de resistencia y sensibilidad se refieren generalmente a diferencias promedio globales entre especies, aunque puede usarse comparaciones intraespecíficas.
El término "homólogo" o "un/el homólogo" o "un/el ortólogo" se conoce y se entiende bien en la técnica y se refiere a secuencias relacionadas que comparten un ancestro común y se determina basándose en el grado de identidad de las secuencias. Estos términos describen la relación entre un gen encontrado en una especie, subespecie, variedad, cultivo o cepa y el gen equivalente o correspondiente en otra especie, subespecie, variedad, cultivo o cepa. Para los fines de esta invención se comparan secuencias homólogas. Se piensa, se cree o se sabe que las "secuencias homólogas" o los "homólogos" u "ortólogos" están relacionados funcionalmente. Una relación funcional puede estar indicada de cualquiera de varias maneras, incluyendo, pero sin limitarse a, (a) el grado de identidad de las secuencias; (b) función biológica idéntica o similar. Preferentemente, se indican tanto (a) y (b). El grado de identidad de las secuencias puede variar, pero es preferentemente de por lo menos el 50% (cuando se usan programas de alineación de secuencias convencionales conocidos en la técnica), más preferentemente de por lo menos el 60%, más preferentemente de por lo menos aproximadamente el 75%, más preferentemente de por lo menos aproximadamente el 85%. La homología puede determinarse usando programas de software fácilmente disponibles en la técnica, tales como aquellos tratados en Current Protocols in Molecular Biology (F. M. Ausubel et al., eds., 1987) suplemento 30, sección 7.718, tabla 7.71. Programas de alineación preferidos son MacVector (Oxford Molecular Ltd, Oxford, R.U.) y ALIGN Plus (Scientific and Educational Software, Pensilvania). Otro programa de alineación preferido es Sequencher (Gen Codes, Ann Arbor, Michigan), usando los parámetros por defecto.
La expresión "cambio de nucleótido" se refiere a una sustitución, deleción y/o inserción de nucleótido, tal como es bien conocido en la técnica.
"Genes de mantenimiento" es una expresión bien conocida en la técnica y se refiere a aquellos genes asociados con una función celular general, incluyendo pero sin limitarse al crecimiento, la división, la estasis, el metabolismo y/o la muerte. Los genes "de mantenimiento" generalmente realizan una función que se encuentra en más de un tipo de célula. Por el contrario, los genes específicos de célula realizan generalmente funciones en una clase y/o tipo de célula particular.
El término "agente", tal como se usa en la presente memoria, significa a compuesto biológico o químico tal como una molécula orgánica o inorgánica simple o compleja, un péptido, una proteína o un oligonucleótido que modula la función de un polinucleótido o polipéptido. Puede sintetizarse una amplia serie de compuestos, por ejemplo oligómeros, tales como oligopéptidos y oligonucleótidos, y compuestos sintéticos orgánicos e inorgánicos basados en diversas estructuras centrales, y éstos se incluyen también en el término "agente". Además, diversas fuentes naturales pueden proporcionar compuestos para la selección, tales como extractos vegetales o animales y similares. Los compuestos pueden someterse a prueba individualmente o en combinación entre sí.
La expresión "para modular la función" de un polinucleótido o un polipéptido significa que se altera la función del polinucleótido o polipéptido en comparación con no añadir un agente. La modulación puede producirse a cualquier nivel que afecte a la función. Una función de polinucleótido o polipéptido puede ser directa o indirecta, y medirse directa o indirectamente.
Una "función de un polinucleótido" incluye, pero no se limita a, patrón/patrones de replicación; traducción; expresión. Una función de polinucleótido también incluye funciones asociadas con un polipéptido codificado dentro del polinucleótido. Por ejemplo, se considera que un agente que actúa sobre un polinucleótido y afecta a la expresión, conformación, plegado (u otras características físicas), unión a otros restos (tales como ligandos), actividad (u otras características funcionales), regulación de proteínas y/u otros aspectos de la estructura o función de la proteína ha modulado la función del polinucleótido.
Una "función de un polipéptido" incluye, pero no se limita a, conformación, plegado (u otras características físicas), unión a otros restos (tales como ligandos), actividad (u otras características funcionales) y/u otros aspectos de la estructura o funciones de la proteína. Por ejemplo, se considera que un agente que actúa sobre un polipéptido y afecta a su conformación, plegado (u otras características físicas), unión a otros restos (tales como ligandos), actividad (u otras características funcionales) y/u otros aspectos de la estructura o funciones de la proteína ha modulado la función del polipéptido. Las maneras en las que puede actuar un agente eficaz para modular la función de un polipéptido incluyen, pero no se limitan a 1) cambiar la conformación, plegado u otras características físicas; 2) cambiar la fuerza de unión a su ligando natural o cambiar la especificidad de unión a ligandos; y 3) alterar la actividad del polipéptido.
La expresión "sitio diana" significa una ubicación en un polipéptido que puede ser un único aminoácido y/o es una parte de un motivo estructural y/o funcional, por ejemplo, un sitio de unión, un dominio de dimerización o un sitio activo catalítico. Los sitios diana pueden ser útiles para la interacción directa o indirecta con un agente, tal como un agente terapéutico.
La expresión "diferencia molecular" incluye cualquier diferencia estructural y/o funcional. En la presente memoria se describen procedimientos para detectar tales diferencias, así como ejemplos de tales diferencias.
Un "efecto funcional" es una expresión bien conocida en la técnica, y significa cualquier efecto que se muestra en cualquier nivel de actividad, ya sea directo o indirecto.
La expresión "facilidad de recolección" se refiere rasgos distintivos o características de plantas que facilitan la recolección manual o automática de estructuras o partes (por ejemplo, frutas, hojas, raíces) para el consumo u otro tratamiento comercial.
Procedimientos generales conocidos en la técnica
Para los fines de esta invención, la fuente del polinucleótido de la planta o animal domesticado o su ancestro puede ser cualquier fuente adecuada, por ejemplo, secuencias genómicas o secuencias de ADNc. Preferentemente, se comparan secuencias de ADNc. Pueden obtenerse secuencias que codifican para proteínas de bases de datos privadas, públicas y/o comerciales disponibles tales como las descritas en la presente memoria. Estas bases de datos sirven como depósitos de los datos de secuencia molecular generados por los esfuerzos de investigación en curso. Alternativamente, pueden obtenerse secuencias que codifican para proteínas de, por ejemplo, la secuenciación de ADNc sometido a transcripción inversa a partir de ARNm expresado en células, o tras amplificación mediante PCR, según procedimientos bien conocidos en la técnica. Alternativamente, pueden usarse secuencias genómicas para la comparación de secuencias. Pueden obtenerse secuencias genómicas de bases de datos públicas, privadas y/o comerciales disponibles o de una secuenciación de bibliotecas de ADN genómico disponibles comercialmente o de ADN genómico, tras PCR.
En algunas formas de realización, el ADNc se prepara a partir de ARNm obtenido a partir de un tejido en una fase de desarrollo determinada, o un tejido obtenido tras someter el organismo a ciertas condiciones ambientales. Las bibliotecas de ADNc usadas para la comparación de secuencias de la presente invención pueden construirse usando técnicas de construcción de bibliotecas de ADNc convencionales que se explican completamente en la bibliografía de la materia. Se usan ARNm totales como moldes para someter ADNc a transcripción inversa. Los ADNc transcritos se subclonan en vectores apropiados para establecer una biblioteca de ADNc. La biblioteca de ADNc establecida puede maximizarse para el contenido de ADNc de longitud completa, aunque pueden usarse ADNc de longitud menor a la completa. Además, la frecuencia de la secuencia puede normalizarse según, por ejemplo, Bonaldo et al. (1996) Genome Research 6:791-806. Los clones de ADNc seleccionados al azar de la biblioteca de ADNc construida pueden secuenciarse usando técnicas de secuenciación automáticas convencionales. Preferentemente, se usan clones de ADNc de longitud completa para la secuenciación. Pueden secuenciarse o bien todos o bien una gran parte de los clones de ADNc de una biblioteca de ADNc, aunque también es posible poner en práctica algunas realizaciones de la invención secuenciando tan solo un único ADNc, o varios clones de ADNc.
En una forma de realización preferida de la presente invención, los clones de ADNc que van a secuenciarse pueden preseleccionarse según su especificidad de expresión. Con el fin de seleccionar ADNc correspondientes a genes activos que se expresan específicamente, los ADNc pueden someterse a hibridación sustractiva usando ARNm obtenidos de otros órganos, tejidos o células del mismo animal. En ciertas condiciones de hibridación con concentración y rigurosidad apropiada, aquellos ADNc que hibridan con ARNm no específicos de tejido y por tanto probablemente representan genes "de mantenimiento" se excluirán de la reserva de ADNc. Por consiguiente, es más probable que los ADNc restantes que van a secuenciarse estén asociados con funciones específicas de tejido. Para el fin de la hibridación sustractiva, pueden obtenerse ARNm no específicos de tejido de un órgano, o preferentemente de una combinación de diferentes órganos y células. La cantidad de ARNm no específicos de tejido se maximiza para saturar los ADNc específicos de tejido.
Alternativamente, puede usarse información de bases de datos en línea para seleccionar o dar prioridad a ADNc que es más probable que estén asociados con funciones específicas. Por ejemplo, pueden seleccionarse los candidatos de ADNc de organismo ancestral para la secuenciación mediante PCR usando cebadores diseñados a partir de secuencias de ADNc de un organismo domesticado candidato. Las secuencias de ADNc de organismo domesticado candidato, por ejemplo, aquellas que sólo se encuentran en un tejido específico, tal como músculo esquelético, o que corresponden a genes que es probable que sean importante en la función específica. Tales secuencias de ADNc específicas de tejido pueden obtenerse buscando en bases de datos de secuencias en línea en las que puede especificarse información con respecto al perfil de expresión y/o la actividad biológica para secuencias de ADNc.
Pueden obtenerse secuencias de homólogo(s) de organismo ancestral con respecto a un gen de organismo domesticado conocido usando procedimientos convencionales en la técnica, tales como procedimientos de PCR (usando, por ejemplo, termocicladores GeneAmp PCR System 9700 (Applied Biosystems, Inc.)). Por ejemplo, pueden seleccionarse candidatos de ADNc de organismo ancestral para la secuenciación mediante PCR usando cebadores diseñados a partir de secuencias de ADNc de organismo domesticado candidato. Para la PCR, pueden prepararse cebadores a partir de las secuencias de organismo domesticado usando procedimientos convencionales en al materia, incluyendo programas de diseño de cebadores públicamente disponibles tales como PRIMER® (Whitehead Institute). La secuencia de organismo ancestral amplificada puede secuenciarse entonces usando procedimientos y equipos convencionales en la técnica, tales como secuenciadores automáticos (Applied Biosystems, Inc.).
\vskip1.000000\baselineskip
Procedimientos generales de la invención
El procedimiento general de la invención es tal como sigue. Brevemente, se obtienen secuencias de nucleótidos a partir de un organismo domesticado y un ancestro de tipo natural. Las secuencias de nucleótidos del organismo domesticado y del ancestro se comparan entre sí para identificar secuencias que son homólogas. Se analizan las secuencias homólogas para identificar aquellas que presentan diferencias de secuencia de ácidos nucleicos entre el organismo domesticado y el ancestro. Entonces se lleva a cabo un análisis de evolución molecular para evaluar cuantitativa y cualitativamente la significación evolutiva de las diferencias. Para los genes que se han seleccionado positivamente, pueden realizarse análisis de grupo externo para identificar aquellos genes que se han seleccionado positivamente en el organismo domesticado (a diferencia del ancestro). A continuación, se caracteriza la secuencia en cuanto a la identidad molecular/genética y la función biológica. Finalmente, puede usarse la información para identificar agentes que pueden modular la función biológica del polipéptido codificado por el gen.
Los procedimientos generales de la invención conllevan comparar secuencias de nucleótidos que codifican para proteínas de organismos domesticados y ancestrales. Se aplica la bioinformática a la comparación y se seleccionan las secuencias que contienen un cambio o cambios de nucleótido que es/son un(os) cambio(s) significativo(s) desde el punto de vista evolutivo. La invención posibilita la identificación de genes que han evolucionado para conferir alguna ventaja evolutiva y la identificación de los cambios evolucionados específicos.
Se comparan secuencias que codifican para proteínas de un organismo domesticado y su ancestro para identificar secuencias homólogas. Esta invención contempla cualquier mecanismo apropiado para completar esta comparación. La alineación puede llevarse a cabo manualmente o mediante un software (ejemplos de programas de alineación adecuados son conocidos en la técnica). Preferentemente, se comparan secuencias que codifican para proteínas de un ancestro con las secuencias de especies domesticadas por medio de búsquedas en bases de datos, búsquedas en BLAST. Las "correspondencias" de alta puntuación, es decir, secuencias que muestran una similitud significativa tras análisis BLAST, se recuperarán y se analizarán. Las secuencias que muestran una similitud significativa pueden ser aquellas que presentan por lo menos aproximadamente el 60%, por lo menos aproximadamente el 75%, por lo menos aproximadamente el 80%, por lo menos aproximadamente el 85%, o por lo menos aproximadamente el 90% de identidad de secuencia. Preferentemente, las secuencias que muestran más de aproximadamente el 80% de identidad se analizan adicionalmente. Las secuencias homólogas identificadas por medio de la búsqueda en bases de datos pueden alinearse en su totalidad usando programas y procedimientos de alineación de secuencias que se conocen y están disponibles en la técnica, tales como el sencillo programa de alineación usado comúnmente CLUSTAL V de Higgins et al. (1992) CABIOS 8:189-191.
Alternativamente, la secuenciación y la comparación de homología de secuencias que codifican para proteínas entre el organismo domesticado y su ancestro pueden llevarse a cabo simultáneamente usando la tecnología de chip de secuenciación desarrollada recientemente. Véase, por ejemplo, Rava et al. patente US nº 5.545.531.
Las secuencias alineadas que codifican para proteínas de organismo domesticado y ancestro se analizan para identificar diferencias de secuencia de nucleótidos en sitios particulares. De nuevo, esta invención contempla cualquier procedimiento adecuado para conseguir este análisis. Si no hay diferencias de secuencia de nucleótidos, normalmente no se analiza adicionalmente la secuencia que codifica para proteínas de ancestro. Los cambios de secuencia detectados se comprueban inicialmente de manera general, y preferible, para determinar su precisión. Preferentemente, la comprobación inicial comprende llevar a cabo una o más de las siguientes etapas, todas y cada una de las cuales se conocen en la técnica: (a) hallar los puntos en los que hay cambios entre las secuencias de ancestro y de organismo domesticado; (b) comprobar el fluorograma (cromatograma) de secuencia para determinar si las bases que parecen ser únicas para el ancestro u organismo domesticado corresponden a señales claras, fuertes, específicas para la base en cuestión; (c) comprobar las correspondencias del organismo domesticado para observar si hay más de una secuencia de organismo domesticado que corresponde a un cambio de secuencia. Múltiples entradas de secuencia de organismo domesticado para el mismo gen que presentan el mismo nucleótido en una posición en la que hay un nucleótido diferente en una secuencia de ancestro proporcionan un apoyo independiente de que la secuencia de organismo domesticado es precisa, y que el cambio es significativo. Tales cambios se examinan usando información de bases de datos y el código genético para determinar si estos cambios de secuencia de nucleótidos dan como resultado un cambio en la secuencia de aminoácidos de la proteína codificada. Tal como aclara la definición de "cambio de nucleótido", la presente invención abarca el cambio de por lo menos un nucleótido, ya sea una sustitución, una deleción o una inserción, en una secuencia de polinucleótido que codifica para proteínas de un organismo domesticado en comparación con una secuencia correspondiente del ancestro. Preferentemente, el cambio es una sustitución de nucleótido. Más preferentemente, hay más de una sustitución presentes en la secuencia identificada y se someten a análisis de evolución molecular.
Puede emplearse cualquiera de los diversos análisis de evolución molecular diferentes o procedimientos de tipo K_{A}/K_{S} para evaluar cuantitativa y cualitativamente la significación evolutiva de los cambios de nucleótido identificados entre secuencias de genes de especies domesticadas y aquellas de ancestros correspondientes. Kreitman y Akashi (1995) Annu. Rev. Ecol. Syst. 26: 403-422; Li, Molecular Evolution, Sinauer Associates, Sunderland, MA, 1997. Por ejemplo, la selección positiva en proteínas (es decir, evolución adaptativa a nivel molecular) puede detectarse en genes que codifican para proteínas mediante comparaciones por parejas de las razones de sustituciones de nucleótido no sinónimas por sitio no sinónimo (K_{A}) con respecto a sustituciones sinónimas por sitio sinónimo (K_{S}) (Li et al., 1985; Li, 1993). Puede usarse cualquier comparación de K_{A} y K_{S}, aunque es particularmente conveniente y lo más eficaz comparar estas dos variables como una razón. Se identifican secuencias mostrando una diferencia estadísticamente significativa entre K_{A} y K_{S} usando procedimientos estadísticos convencionales.
Preferentemente, se usa el análisis de K_{A}/K_{S} de Li et al. para llevar a cabo la presente invención, aunque también pueden usarse otros programas de análisis que pueden detectar genes seleccionados positivamente entre especies. Li et al. (1985) Mol. Biol. Evol. 2:150-174; Li (1993); véase también J. Mol. Evol. 36:96-99; Messier y Stewart (1997) Nature 385:151-154; Nei (1987) Molecular Evolutionary Genetics (Nueva York, Columbia University Press). El procedimiento de K_{A}/K_{S}, que comprende una comparación de la tasas de sustituciones no sinónimas por sitio no sinónimo con la tasa de sustituciones sinónimas por sitio sinónimo entre la región que codifica para proteínas homóloga de genes en cuanto a una razón, se usa para identificar sustituciones de secuencia que pueden provocarse por selecciones adaptativas a diferencia de selecciones neutras durante la evolución. Una sustitución sinónima ("silenciosa") es una que, debido la degeneración del código genético, no realiza ningún cambio en la secuencia de aminoácidos codificada; una sustitución no sinónima da como resultado un reemplazo de aminoácido. La magnitud de cada tipo de cambio puede estimarse como K_{A} y K_{S}, respectivamente, los números de sustituciones sinónimas por sitio sinónimo y las sustituciones no sinónimas por sitio no sinónimo. Los cálculos de K_{A}/K_{S} pueden llevarse a cabo manualmente o usando un software. Un ejemplo de un programa adecuado es MEGA (Molecular Genetics Institute, Pennsylvania State University).
Para el fin de estimar K_{A} y K_{S}, se usan secuencias o bien completas o bien parciales que codifican para proteínas para calcular los números totales de sustituciones sinónimas y no sinónimas, así como sitios no sinónimos y sinónimos. La longitud de la secuencia de polinucleótido analizada puede ser cualquier longitud apropiada. Preferentemente, se compara toda la secuencia codificante, con el fin de determinar todos y cada uno de los cambios significativos. Pueden usarse programas informáticos disponibles públicamente, tales como Li93 (Li (1993) J. Mol. Evol. 36:96-99) o INA, para calcular los valores de K_{A} y K_{S} para todas las comparaciones por parejas. Este análisis puede adaptarse además para examinar secuencias en un modo de "ventana deslizante" de tal manera que números pequeños de cambios importantes no resulten enmascarados por la secuencia completa. "Ventana deslizante" se refiere a una exploración de subsecciones consecutivas, solapantes, del gen (las subsecciones pueden ser de cualquier longitud).
La comparación de las tasas de sustitución no sinónima y sinónima se representa mediante la razón K_{A}/K_{S}. Se ha demostrado que K_{A}/K_{S} es un reflejo del grado en el que se ha producido la evolución adaptativa en la secuencia en estudio. Pueden usarse segmentos de longitud completa o parcial de una secuencia codificante para el análisis de K_{A}/K_{S}. Cuanto mayor sea la razón K_{A}/K_{S}, más probable será que una secuencia haya experimentado una evolución adaptativa y que las sustituciones no sinónimas sean significativas desde el punto de vista evolutivo. Véase, por ejemplo, Messier y Stewart (1997). Preferentemente, la razón K_{A}/K_{S} es de por lo menos aproximadamente 0,75, más preferentemente de por lo menos aproximadamente 1,0, más preferentemente de por lo menos aproximadamente 1,25, más preferentemente de por lo menos aproximadamente 1,50, o más preferentemente de por lo menos aproximadamente 2,00. Preferentemente, se lleva a cabo un análisis estadístico en todas las razones K_{A}/K_{S} elevadas, incluyendo, pero sin limitarse a, procedimientos convencionales tales como la prueba de la t de Student y pruebas de razón de probabilidad descritos por Yang (1998) Mol. Biol Evol. 37:441-456.
Para una comparación por parejas de secuencias homólogas, las razones K_{A}/K_{S} significativamente mayores que la unidad sugieren fuertemente que la selección positiva ha fijado un mayor número de reemplazos de aminoácido de lo que puede esperarse como resultado del azar solo, y está en contraste con el patrón observado comúnmente en el que la razón es menor o igual a uno. Nei (1987); Hughes y Hei (1988) Nature 335:167-170; Messier y Stewart (1994) Current Biol. 4:911-913; Kreitman y Akashi (1995) Ann. Rev. Ecol. Syst. 26:403-422; Messier y Stewart (1997). Las razones inferiores a uno significan generalmente el papel de una selección negativa, o purificante: hay una fuerte presión sobre la estructura primaria de proteínas funcionales, eficaces para seguir inalteradas.
Todos los procedimientos para calcular la razones K_{A}/K_{S} se basan en una comparación por parejas del número de sustituciones no sinónimas por sitio no sinónimo con respecto al número de sustituciones sinónimas por sitio sinónimo para las regiones que codifican para proteínas de genes homólogos del ancestro y de organismos domesticados. Cada procedimiento pone en práctica diferentes correcciones para estimar "correspondencias múltiples" (es decir, sustitución de más de un nucleótido en el mismo sitio). Cada procedimiento también usa diferentes modelos para cómo cambian las secuencias de ADN durante el tiempo de evolución. Por tanto, preferentemente, se usa una combinación de resultados de diferentes algoritmos para aumentar el nivel de sensibilidad para la detección de genes seleccionados positivamente y la confianza en el resultado.
Preferentemente, las razones K_{A}/K_{S} deben calcularse para pares de genes ortólogos, a diferencia de pares de genes parálogos (es decir, un gen que resulta de la especiación, a diferencia de un gen que es el resultado de duplicación génica) Messier y Stewart (1997). Esta distinción puede realizarse llevando a cabo comparaciones adicionales con otros ancestros, lo que permite la construcción de un árbol filogenético. Los genes ortólogos cuando se usan en la construcción de árbol darán el "árbol de la especie" conocido, es decir, producirán un árbol que cumple con el árbol biológico conocido. Por el contrario, los genes parálogos darán árboles que no cumplen con el árbol biológico conocido.
Se entiende que los procedimientos descritos en la presente memoria pueden conducir a la identificación de secuencias de polinucleótido de organismo domesticado o ancestro que están funcionalmente relacionadas con las secuencias que codifican para proteínas. Tales secuencias pueden incluir, pero no se limitan a, secuencias no codificantes o secuencias codificantes que no codifican para proteínas. Estas secuencias relacionadas pueden ser, por ejemplo, físicamente adyacentes a las secuencias que codifican para proteínas en el genoma, tales como intrones o secuencias flanqueantes en 5' y 3' (incluyendo elementos de control tales como promotores y potenciadores). Estas secuencias relacionadas pueden obtenerse realizando búsquedas en bases de datos de genoma públicas, privadas y/o comerciales disponibles o, alternativamente, realizando selecciones y secuenciaciones de la biblioteca genómica del organismo con una secuencia que codifica para proteínas como sonda. Un experto en la materia conoce bien procedimientos y técnicas para obtener secuencias no codificantes usando una secuencia codificante relacionada.
Los cambios de nucleótido significativos desde el punto de vista evolutivo, que se detectan mediante análisis de evolución molecular tal como el análisis de K_{A}/K_{S}, pueden evaluarse adicionalmente para determinar su aparición única en el organismo domesticado o la magnitud en la que estos cambios son únicos en el organismo domesticado. Por ejemplo, pueden someterse a prueba los cambios identificados en el gen de organismo domesticado para determinar la presencia/ausencia en otras secuencias de especies, subespecies u otros organismos relacionados que presentan un ancestro común con el organismo domesticado. Esta comparación ("análisis de grupo externo") permite la determinación de si el gen positivamente seleccionado se selecciona positivamente para el organismo domesticado en cuestión (a diferencia del ancestro).
Las secuencias con por lo menos un cambio significativo desde el punto de vista evolutivo entre un organismo domesticado y su ancestro pueden usarse como cebadores para análisis mediante PCR de otras secuencias que codifican para proteínas de ancestro, y los polinucleótidos resultantes se secuencian para ver si el mismo cambio está presente en otros ancestros. Estas comparaciones permiten una discriminación adicional en cuanto a si los cambios evolutivos adaptativos son únicos para el linaje domesticado en comparación con otros ancestros o si el cambio adaptativo es único para el ancestro en comparación con la especie domesticada y otros ancestros. Un cambio de nucleótido que se detecta en un organismo domesticado pero no en otros ancestros representa más probablemente un cambio evolutivo adaptativo en el organismo domesticado. Alternativamente, un cambio de nucleótido que se detecta en un ancestro que no se detecta en el organismo domesticado u otros ancestros representa probablemente un cambio evolutivo adaptativo del ancestro. Otros ancestros usados para la comparación pueden seleccionarse basándose en sus relaciones filogenéticas con el organismo domesticado. Puede determinarse la significación estadística de tales comparaciones usando programas disponibles establecidos, por ejemplo, la prueba de la t tal como se usa por Messier y Stewart (1997) Nature 385:151-154. Es muy probable que aquellos genes que muestran razones K_{A}/K_{S} estadísticamente elevadas hayan experimentado evolución adaptativa.
Pueden usarse secuencias con cambios significativos como sondas en genomas a partir de diferentes poblaciones domesticadas para ver si los cambios de secuencia se comparten por más de una población domesticada. Las secuencias de genes de diferentes poblaciones domesticadas pueden obtenerse a partir de bases de datos o, alternativamente, a partir de la secuenciación directa de ADN amplificado mediante PCR de varias poblaciones domesticadas diversas, no relacionadas. La presencia de los cambios identificados en diferentes poblaciones domesticadas indicará adicionalmente la significación evolutiva de los cambios.
Pueden caracterizarse adicionalmente secuencias con cambios significativos entre especies en cuanto a sus identidades moleculares/genéticas y las funciones biológicas, usando procedimientos y técnicas conocidos por los expertos ordinarios en la materia. Por ejemplo, pueden localizarse las secuencias genética y físicamente dentro del genoma del organismo usando programas bioinformáticos públicamente disponibles. Los cambios significativos recientemente identificados dentro de la secuencia de nucleótidos pueden sugerir un posible papel del gen en la evolución del organismo y una posible asociación con capacidades funcionales únicas, potenciadas o alteradas. El supuesto gen con las secuencias identificadas puede caracterizarse adicionalmente, por ejemplo, mediante búsqueda de homólogos. La homología compartida del supuesto gen con un gen conocido puede indicar una función o papel biológico similar. Otro procedimiento a modo de ejemplo de caracterización de una supuesta secuencia de gen es basándose en motivos de secuencia conocidos. Se sabe que ciertos patrones de secuencia codifican para regiones de proteínas que presentan características biológicas específicas tales como secuencias señal, dominios de unión a ADN o dominios transmembrana.
Las secuencias identificadas con cambios significativos también pueden evaluarse adicionalmente observando dónde se expresa el gen en cuanto a la especificidad de tejido o tipo de célula. Por ejemplo, pueden usarse las secuencias codificantes identificadas como sondas para llevar a cabo la hibridación de ARNm in situ que revelará los patrones de expresión de las secuencias. Los genes que se expresan en ciertos tejidos pueden ser mejores candidatos para estar asociados con funciones importantes asociadas con ese tejido, por ejemplo, tejido del músculo esquelético. También puede determinarse el momento de la expresión del gen durante cada fase de desarrollo de un miembro de la especie.
Como otro procedimiento a modo de ejemplo de caracterización de secuencias, pueden evaluarse los papeles funcionales de secuencias de nucleótidos identificadas con cambios significativos realizando ensayos funcionales para diferentes alelos de un gen identificado en el organismo domesticado transfectado, por ejemplo, en la planta o animal transgénico.
Como otro procedimiento a modo de ejemplo de caracterización de secuencias, el uso de programas informáticos permite la modelización y visualización de la estructura tridimensional de las proteínas homólogas de un organismo domesticado o ancestro. El conocimiento específico y exacto de qué aminoácidos se han reemplazado en la(s) proteí-
na(s) del ancestro permite la detección de cambios estructurales que pueden asociarse con diferencias funcionales. Por tanto, el uso de técnicas de modelización está estrechamente asociado con la identificación de papeles funcionales tratada en el párrafo anterior. El uso de técnicas individuales o combinaciones de estas técnicas constituye parte de la presente invención.
Un gen de organismo domesticado identificado mediante el procedimiento objeto puede usarse para identificar genes homólogos en otras especies que comparten un ancestro común. Por ejemplo, maíz, arroz, trigo, mijo y sorgo comparten un ancestro común, y genes identificados en el maíz pueden conducir directamente a genes homólogos en estas otras gramíneas. Igualmente, los tomates y las patatas comparten un ancestro común, y se espera que los genes identificados en los tomates mediante el procedimiento objeto presenten homólogos en las patatas.
Estas secuencias identificadas mediante los procedimientos descritos en la presente memoria pueden usarse para identificar agentes que son útiles en la modulación de capacidades funcionales alteradas, potenciadas o únicas en un organismo domesticado y/o la corrección de defectos en estas capacidades usando estas secuencias. Estos procedimientos emplean, por ejemplo, técnicas de selección conocidas en la técnica, tales como sistemas in vitro, sistemas de expresión basados en células y plantas y animales transgénicos no humanos. El enfoque proporcionado por la presente invención no sólo identifica genes que han evolucionado rápidamente, sino que indica modulaciones que pueden realizarse a la proteína que pueden no ser demasiado tóxicas porque existen en otras especies.
Procedimientos de selección
La presente invención también proporciona procedimientos de selección que usan los polinucleótidos y polipéptidos identificados y caracterizados usando los procedimientos descritos anteriormente. Estos procedimientos de selección son útiles para identificar agentes que pueden modular la(s) función/funciones de los polinucleótidos o polipéptidos de una manera que sería útil para potenciar o reducir una característica en un organismo domesticado. Generalmente, los procedimientos conllevan poner en contacto por lo menos un agente que va a someterse a prueba con o bien un organismo transgénico o bien una célula que se ha transfectado con una secuencia de polinucleótido identificada mediante los procedimientos descritos anteriormente, o una preparación del polipéptido codificado por tal secuencia de polinucleótido, en el que un agente se identifica por su capacidad para modular la función o bien de la secuencia de polinucleótido o bien del polipéptido. Por ejemplo, un agente puede ser un compuesto que se aplica o se pone en contacto con una planta o animal domesticado para inducir la expresión del gen identificado en un momento deseado. Específicamente con respecto a plantas, puede usarse un agente para inducir la floración en un momento apropiado.
Tal como se usa en la presente memoria, el término "agente" significa un compuesto biológico o químico tal como una molécula orgánica o inorgánica sencilla o compleja, un péptido, una proteína o un oligonucleótido. Puede sintetizarse una amplia serie de compuestos, por ejemplo oligómeros, tales como oligopéptidos y oligonucleótidos, y compuestos sintéticos orgánicos e inorgánicos basados en diversas estructuras centrales, y éstos se incluyen también en el término "agente". Además, diversas fuentes naturales pueden proporcionar compuestos para la selección, tales como extractos vegetales o animales, y similares. Los compuestos pueden someterse a prueba individualmente o en combinación entre sí.
"Modular la función" de un polinucleótido o un polipéptido significa que se altera la función del polinucleótido o polipéptido en comparación con no añadir un agente. La modulación puede producirse a cualquier nivel que afecte a la función. La función de un polinucleótido o polipéptido puede ser directa o indirecta, y medirse directa o indirectamente. Una "función" de un polinucleótido incluye, pero no se limita a, patrón/patrones de replicación, traducción y expresión. Una función de un polinucleótido también incluye funciones asociadas con un polipéptido codificado dentro del polinucleótido. Por ejemplo, se considera que un agente que actúa sobre un polinucleótido y afecta a la expresión, conformación, plegado (u otras características físicas), unión a otros restos (tales como ligandos), actividad (u otras características funcionales), regulación de proteínas y/u otros aspectos de la estructura o función de la proteína ha modulado una función de polinucleótido. Las formas en las que un agente eficaz puede actuar para modular la expresión de un polinucleótido incluyen, pero no se limitan a, 1) modificar la unión de un factor de transcripción a un elemento sensible al factor de transcripción en el polinucleótido; 2) modificar la interacción entre dos factores de transcripción necesarios para la expresión del polinucleótido; 3) alterar la capacidad de un factor de transcripción necesario para que la expresión del polinucleótido entre en el núcleo; 4) inhibir la activación de un factor de transcripción implicado en la transcripción del polinucleótido; 5) modificar un receptor de superficie celular que interacciona normalmente con un ligando y cuya unión del ligando da como resultado la expresión del polinucleótido; 6) inhibir la inactivación de un componente de la cascada de transducción de señales que conduce a la expresión del polinucleótido; y 7) potenciar la activación de un factor de transcripción implicado en la transcripción del polinucleótido.
Una "función" de un polipéptido incluye, pero no se limita a, conformación, plegado (u otras características físicas), unión a otros restos (tales como ligandos), actividad (u otras características funcionales) y/u otros aspectos de las funciones o estructura de la proteína. Por ejemplo, se considera que un agente que actúa sobre un polipéptido y afecta a su conformación, plegado (u otras características físicas), unión a otros restos (tales como ligandos), actividad (u otras características funcionales) y/u otros aspectos de las funciones o estructura de la proteína ha modulado una función de polipéptido. Las formas en las que un agente eficaz puede actuar para modular la función de un polipéptido incluyen, pero no se limitan a, 1) cambiar la conformación, plegado u otras características físicas; 2) cambiar la fuerza de unión a su ligando natural o cambiar la especificidad de unión a ligandos; y 3) alterar la actividad del poli-
péptido.
Generalmente, la elección de agentes que van a seleccionarse está gobernada por diversos parámetros, tales como la diana de polinucleótido o polipéptido particular, su función percibida, su estructura tridimensional (si se conoce o se supone), y otros aspectos del diseño racional de fármacos. También pueden usarse técnicas de química combinatoria para generar numerosas permutaciones de candidatos. Los expertos en la materia pueden idear y/u obtener agentes adecuados para las pruebas.
Los ensayos de selección in vivo descritos en la presente memoria pueden presentar diversas ventajas con respecto a los ensayos de selección de fármacos convencionales: 1) si un agente debe entrar en una célula para lograr un efecto terapéutico deseado, un ensayo in vivo puede dar una indicación sobre si el agente puede entrar en una célula; 2) un ensayo de selección in vivo puede identificar agentes que, en el estado en el que se añaden al sistema de ensayo, son ineficaces para provocar por lo menos una característica que está asociada con la modulación de la función de polinucleótido o polipéptido, pero que se modifican por los componentes celulares una vez dentro de una célula de tal manera que se vuelven agentes eficaces; 3) de la manera más importante, un sistema de ensayo in vivo permite la identificación de agentes que afectan a cualquier componente de una ruta que finalmente da como resultado características que están asociadas con la función de polinucleótido o polipéptido.
En general, la selección puede llevarse a cabo añadiendo un agente a una muestra de células apropiadas que se han transfectado con un polinucleótido identificado usando los procedimientos de la presente invención, y monitorizando el efecto, es decir, la modulación de una función del polinucleótido o del polipéptido codificado dentro del polinucleótido. El experimento incluye preferentemente una muestra control que no recibe agente candidato. Entonces se comparan las células tratadas y sin tratar mediante cualquier criterio fenotípico adecuado, incluyendo, pero sin limitarse a, análisis con microscopio, pruebas de viabilidad, capacidad para replicarse, examen histológico, el nivel de un polipéptido o ARN particular asociado con las células, el nivel de actividad enzimática expresado por las células o lisados celulares, las interacciones de las células cuando se exponen a agentes infecciosos, y la capacidad de las células para interaccionar con otras células o compuestos. Las diferencias entre células tratadas y sin tratar indican efectos atribuibles al agente candidato. De manera óptima, el agente presenta un efecto mayor sobre las células experimentales que sobre las células control. Las células huésped apropiadas incluye, pero no se limitan a, células eucariotas, preferentemente células de mamíferos. La elección de la célula dependerá por lo menos parcialmente de la naturaleza del ensayo contemplado.
Para realizar pruebas para detectar agentes que regulan por incremento la expresión de un polinucleótido, se pone en contacto una célula huésped adecuada transfectada con un polinucleótido de interés, de tal manera que se expresa el polinucleótido (tal como se usa en la presente memoria, la expresión incluye transcripción y/o traducción), con un agente que va a someterse a prueba. Se someterá a prueba un agente para determinar su capacidad para dar como resultado un aumento de la expresión de ARNm y/o polipéptido. En la técnica, son bien conocidos procedimientos para preparar vectores y realizar la transfección. "Transfección" abarca cualquier procedimiento de introducción de la secuencia exógena, incluyendo, por ejemplo, lipofección, transducción, infección o electroporación. El polinucleótido exógeno puede mantenerse en un vector no integrado (tal como un plásmido) o puede integrarse dentro del genoma del huésped.
Para identificar agentes que activan específicamente la transcripción, pueden unirse regiones reguladoras de la transcripción a un gen indicador y añadirse el constructo a una célula huésped apropiada. Tal como se usa en la presente memoria, el término "gen indicador" significa un gen que codifica para un producto génico que puede identificarse (es decir, una proteína indicadora). Genes indicadores incluyen, pero no se limitan a, fosfatasa alcalina, cloramfenicol acetiltransferasa, \beta-galactosidasa, luciferasa y proteína fluorescente verde (GFP). Procedimientos de identificación para los productos de genes indicadores incluyen, pero no se limitan a, ensayos enzimáticos y ensayos fluorimétricos. En la técnica, son bien conocidos genes indicadores y ensayos para detectar sus productos y se describen, por ejemplo, en Ausubel et al. (1987) y actualizaciones periódicas. También hay genes indicadores, ensayos de genes indicadores y kits de reactivos fácilmente disponibles a partir de fuentes comerciales. Ejemplos de células apropiadas incluyen, pero no se limitan a, células fúngicas, de levadura, de mamífero y otras células eucariotas. Un experto ordinario en la materia estará al corriente de las técnicas para transfectar células eucariotas, incluyendo la preparación de un vector adecuado, tal como un vector viral; transportar el vector al interior de la célula, tal como mediante electroporación; y seleccionar células que se han transformado, tal como usando un elemento indicador o de sensibilidad a fármaco. El efecto de un agente sobre la transcripción de la región reguladora en estos constructos se evaluará mediante la actividad del producto de gen indicador.
Además del aumento en la expresión en condiciones mencionadas anteriormente en las que normalmente está reprimida, puede reducirse la expresión cuando normalmente se expresaría. Un agente puede lograr esto mediante una reducción de la tasa de transcripción y el sistema de gen indicador descrito anteriormente sería un medio para someter esto a ensayo. Sería necesario para someter a ensayo tales agentes que las células huésped sean permisivas para la expresión.
Pueden usarse células que transcriben ARNm (del polinucleótido de interés) para identificar agentes que modulan específicamente la semivida de ARNm y/o la traducción de ARNm. Tales células también se usarán para someter a ensayo el efecto de un agente sobre el tratamiento y/o modificación tras la traducción del polipéptido. Un agente puede modular la cantidad de polipéptido en una célula modificando la renovación (es decir, aumento o reducción de la semivida) del polipéptido. La especificidad del agente en lo que respecta al ARNm y polipéptido se determinará examinando los productos en ausencia del agente y examinando los productos de ARNm y polipéptidos no relacionados. Los expertos en la materia conocen bien procedimientos para examinar la semivida de ARNm, tratamiento de proteínas y renovación de proteínas.
Los procedimientos de selección in vivo también pueden ser útiles en la identificación de agentes que modulan la función de polipéptido directamente mediante la interacción con el polipéptido. Tales agentes pueden bloquear las interacciones normales polipéptido-ligando, si las hay, o pueden potenciar o estabilizar tales interacciones. Tales agentes también pueden alterar una conformación del polipéptido. El efecto del agente puede determinarse usando reacciones de inmunoprecipitación. Se usarán anticuerpos apropiados para precipitar el polipéptido y cualquier proteína estrechamente asociada con el mismo. Comparando los polipéptidos inmunoprecipitados de células tratadas y de células sin tratar, puede identificarse un agente que aumenta o inhibe las interacciones polipéptido-ligando, si las hay. También pueden evaluarse las interacciones polipéptido-ligando usando reactivos de reticulación que convierten una interacción estrecha, pero no covalente, entre polipéptidos en una interacción covalente. Los expertos en la materia conocen bien técnicas para examinar las interacciones proteína-proteína. Los expertos en la materia también conocen bien técnicas para evaluar la conformación de la proteína.
También se entiende que los procedimientos de selección pueden implicar procedimientos in vitro, tales como sistemas de transcripción o traducción libres de células. En esos sistemas, se deja que se produzca la transcripción o traducción, y se somete a prueba un agente para determinar su capacidad para modular la función. Para cualquier ensayo que determine si un agente modula la traducción de ARNm o un polinucleótido, puede usarse un sistema de transcripción/traducción in vitro. Estos sistemas están comercialmente disponibles y proporcionan medios in vitro para producir ARNm correspondiente a una secuencia de polinucleótido de interés. Tras preparar el ARNm, puede traducirse in vitro y compararse los productos de traducción. La comparación de los productos de traducción entre un sistema de expresión in vitro que no contiene ningún agente (control negativo) con un sistema de expresión in vitro que contiene un agente indica si el agente está afectando a la traducción. La comparación de los productos de traducción entre polinucleótidos control y de prueba indica si el agente, si actúa a este nivel, está afectando de manera selectiva a la traducción (a diferencia de afectar a la traducción de un modo general, no selectivo y no específico). La modulación de la función del polipéptido puede lograrse de muchas maneras incluyendo, pero sin limitarse a, los ensayos in vivo e in vitro enumerados anteriormente así como en ensayos in vitro que usan preparaciones de proteínas. Pueden extraerse y/o purificarse polipéptidos a partir de fuentes naturales o recombinantes para crear preparaciones de proteínas. Puede añadirse un agente a una muestra de una preparación de proteínas y monitorizarse el efecto; es decir si el agente actúa sobre un polipéptido y afecta, y cómo lo hace, a su conformación, plegado (u otras características físicas), unión a otros restos (tales como ligandos), actividad (u otras características funcionales) y/u otros aspectos de las funciones o estructura de la proteína, se considera que ha modulado la función del polipéptido.
En un ejemplo para un ensayo para detectar un agente que se une a un polipéptido codificado por un polinucleótido identificado mediante los procedimientos descritos en la presente memoria, en primer lugar se expresa de manera recombinante un polipéptido en un sistema de expresión procariota o eucariota como una proteína nativa o de fusión en la que se conjuga un polipéptido (codificado por un polinucleótido identificado tal como se describió anteriormente) con una proteína o epítopo bien caracterizado. Entonces se purifica el polipéptido recombinante, por ejemplo, mediante inmunoprecipitación usando anticuerpos apropiados o anticuerpos anti-epítopo o mediante unión a ligando inmovilizado del conjugado. Entonces se usa una columna de afinidad preparada con polipéptido o proteína de fusión para examinar una mezcla de compuestos que se han marcado apropiadamente con etiquetas. Etiquetas adecuadas incluyen, pero no se limitan a, fluorocromos, radioisótopos, enzimas y compuestos quimioluminiscentes. Pueden separarse los compuestos unidos y no unidos mediante lavados usando diversas condiciones (por ejemplo alto contenido en sal, detergente) que se emplean de manera rutinaria por los expertos en la materia. Puede minimizarse la unión no específica a la columna de afinidad mediante un aclaramiento previo de la mezcla de compuestos usando una columna de afinidad que contiene simplemente el conjugado o el epítopo. Pueden usarse procedimientos similares para seleccionar un(os) agente(s) que compiten para la unión a polipéptidos. Además de la cromatografía por afinidad, hay otras técnicas tales como medir el cambio de la temperatura de fusión o la anisotropía de fluorescencia de una proteína que cambiará al unirse a otra molécula. Por ejemplo, puede llevarse a cabo un ensayo BIAcore usando un chip detector (suministrado por Pharmacia Biosensor, Stitt et al. (1995) Cell 80: 661-670) que está covalentemente acoplado al polipéptido para determinar la actividad de unión de diferentes agentes.
También se entiende que los procedimientos de selección in vitro de esta invención incluyen el diseño de fármacos estructural o racional en el que la secuencia de aminoácidos, estructura atómica tridimensional u otra propiedad (o propiedades) de un polipéptido proporcionan una base para diseñar un agente que se espera que se una a un polipéptido. Generalmente, el diseño y/o elección de agentes en este contexto está gobernado por varios parámetros, tales como comparación en paralelo de las estructuras de los polipéptidos ancestrales homólogos y los de un organismo domesticado, la función percibida de la diana de polipéptido, su estructura tridimensional (si se conoce o se supone), y otros aspectos del diseño de fármacos racional. También pueden usarse técnicas de química combinatoria para generar numerosas permutaciones de agentes candidatos.
\global\parskip0.900000\baselineskip
También se contempla en los procedimientos de selección de la invención los sistemas de plantas y animales transgénicos no humanos, que se conocen en la técnica.
Los procedimientos de selección descritos anteriormente representan selecciones primarias, diseñadas para detectar cualquier agente que puede mostrar actividad que modula la función de un polinucleótido o polipéptido. El experto en la materia reconocerá que probablemente serán necesarias pruebas secundarias con el fin de evaluar adicionalmente un agente. Por ejemplo, una selección secundaria puede comprender someter a prueba el/los agente(s) en un ensayo de infectividad usando ratones y otros modelos animales (tales como rata), que se conocen en la técnica o la propia planta o animal domesticado. Además, se realizará un ensayo de citotoxicidad como corroboración adicional de que un agente que dio positivo en la prueba en una selección primaria será adecuado para su utilización en organismos vivos. Cualquier ensayo para determinar la citotoxicidad será adecuado para este fin, incluyendo, por ejemplo el ensayo MTT (Promega).
La invención también incluye agentes identificados mediante los procedimientos de selección descritos en la presente memoria.
Se proporcionan los siguientes ejemplos para ayudar adicionalmente a los expertos ordinarios en la materia. Se pretende que tales ejemplos sean ilustrativos y por tanto no deben considerarse como limitativos de la invención. Se describen varias modificaciones y variaciones a modo de ejemplo en esta solicitud y otras resultarán evidentes para los expertos en la materia. Se considera que tales variaciones entran dentro del alcance de la invención tal como se describe y reivindica en la presente memoria.
Ejemplos Ejemplo 1 Construcción de una biblioteca de ADNc
Se construye una biblioteca de ADNc de planta o animal domesticado usando un tejido apropiado a partir de la planta o animal. Un experto ordinario en la materia conocerá el tejido apropiado para analizar según el rasgo de interés. Alternativamente, puede usarse el organismo entero. Por ejemplo, se sabe que las plantas de semillero de 1 día de edad expresan la mayor parte de los genes de la planta.
Se extrae ARN total del tejido (kit RNeasy, Quiagen; kit de ARN total rápido libre de ARNasa, 5 Prime - -3 Prime, Inc.) y se determinan la integridad y pureza del ARN según procedimientos de clonación molecular convencionales. Se aísla ARN poli A+ (Mini-columnas de centrifugación de oligo(dT)celulasa, 5 Prime - -3 Prime, Inc.) y se usa como molde para la transcripción inversa de ADNc con oligo(dT) como cebador. Se trata el ADNc sintetizado y se modifica para la clonación usando kits comercialmente disponibles. Entonces se empaquetan los recombinantes y se propagan en una línea de célula huésped. Se amplifican las partes de las mezclas de empaquetamiento y se conserva el resto antes de la amplificación. Puede normalizarse la biblioteca y se determinan los números de recombinantes independientes en la biblioteca.
Ejemplo 2 Comparación de secuencias
Se preparan cebadores adecuados basados en un gen de organismo domesticado candidato y se usan para la amplificación mediante PCR de ADNc de ancestro o bien de una biblioteca de ADNc o bien de ADNc preparado a partir de ARNm. Se secuencian los clones de ADNc de ancestro seleccionados de la biblioteca de ADNc usando un secuenciador automático, tal como un instrumento ABI 377. Se usan cebadores usados comúnmente en el vector de clonación tales como los cenadores M13 universal e inverso para llevar a cabo la secuenciación. Para los insertos que no están completamente secuenciados mediante secuenciación final, pueden usarse cebadores a medida o terminadores marcados con etiqueta de colorante para completar los huecos restantes.
Inicialmente se comprueban las diferencias de secuencia detectadas para determinar la precisión, por ejemplo, hallando los puntos en los que hay diferencias entre las secuencias de organismo domesticado y ancestro; comprobando el fluorograma (cromatograma) de la secuencia para determinar si las bases que parecen únicas para el organismo domesticado corresponden a señales fuertes, claras específicas para la base en cuestión; comprobando las correspondencias del organismo domesticado para ver si hay más de una secuencia que corresponde a un cambio de secuencia; y otros procedimientos conocidos en la técnica, según se necesite. Múltiples entradas de secuencia de organismo domesticado para el mismo gen que presentan el mismo nucleótido en una posición en la que hay un nucleótido de ancestro diferente proporcionan apoyo independiente de que la secuencia de organismo domesticado sea precisa, y de que la diferencia domesticado/ancestro es real. Tales cambios se examinan usando información de bases de datos públicas o comerciales y el código genético para determinar si estos cambios de secuencia de ADN dan como resultado un cambio en la secuencia de aminoácidos de la proteína codificada. Las secuencias también pueden examinarse mediante secuenciación directa de la proteína codificada.
\global\parskip1.000000\baselineskip
Ejemplo 3 Análisis de evolución molecular
Se someten las secuencias de planta o animal domesticado y ancestro de tipo natural en comparación a un análisis de K_{A}/K_{S}. En este análisis, se usan programas informáticos pública o comercialmente disponibles, tales como Li 93 e INA, para determinar el número de cambios no sinónimos por sitio (K_{A}) dividido por el número de cambios sinónimos por sitio (K_{S}) para cada secuencia en estudio tal como se describió anteriormente. Pueden usarse regiones codificantes de longitud completa o segmentos parciales de una región codificante. Cuanto mayor sea la razón K_{A}/K_{S}, más probable es que una secuencia haya experimentado una evolución adaptativa. La significación estadística de los valores de K_{A}/K_{S} se determina usando procedimientos estadísticos establecidos y programas disponibles tales como la prueba de la t.
Para proporcionar adicionalmente apoyo a la significación de una razón K_{A}/K_{S} elevada, la secuencia de organismo domesticado en estudio puede compararse con otra especie próxima desde un punto de vista evolutivo. Estas comparaciones permiten una discriminación adicional en cuanto a si los cambios evolutivos adaptativos son únicos para el linaje de la planta o animal domesticado en comparación con otras especies estrechamente relacionadas. También pueden examinarse las secuencias mediante secuenciación directa del gen de interés a partir de representantes de diversas poblaciones domesticadas para evaluar hasta qué grado se conserva la secuencia en la planta o animal domesticado.
\vskip1.000000\baselineskip
Ejemplo 4 Construcción de una biblioteca de ADNc
Se construye una biblioteca de ADNc de teosinte usando plantas de semillero de 1 día de edad de teosinte enteras, u otros tejidos apropiados de la planta. Se extrae ARN total del tejido de las plantas de semillero y se determinan la integridad y pureza del ARN según procedimientos de clonación molecular convencionales. Se selecciona ARN poli A+ y se usa como molde para la transcripción inversa de ADNc con oligo(dT) como cebador. Se trata el ADNc sintetizado y se modifica para su clonación usando kits comercialmente disponibles. Entonces se empaquetan los recombinantes y se propagan en una línea de célula huésped. Se amplifican las partes de las mezclas de empaquetamiento y se conserva el resto antes de la amplificación. Se usa el ADN recombinante para transfectar células huésped de E. coli, usando procedimientos establecidos. Puede normalizarse la biblioteca y se determinan los números de recombinantes independientes en la biblioteca.
\vskip1.000000\baselineskip
Ejemplo 5 Comparación de secuencias
Se secuencian clones de ADNc de plantas de semillero de teosinte seleccionadas aleatoriamente a partir de la biblioteca de ADNc usando un secuenciador automático, tal como el instrumento ABI 377. Se usan cebadores comúnmente utilizados en el vector de clonación tales como los cebadores M13 universal e inverso para llevar a cabo la secuenciación. Para los insertos que no están completamente secuenciados mediante secuenciación final, se usan terminadores marcados con etiqueta de colorante para completar los huecos restantes.
Se comparan las secuencias de teosinte resultantes con secuencias de maíz domesticado mediante búsquedas en bases de datos. Hay bases de datos de genomas pública o comercialmente disponibles para varias especies, incluyendo el maíz. Un ejemplo de una base de datos del maíz puede encontrarse en www.central.edu/homepages/liedlb/-genetics/gene-site.hml. Otras bases de datos apropiadas de EST (etiqueta de secuencia expresada) del maíz son de mantenimiento y dominio privado. Se recuperan y analizan las "correspondencias" con alta puntuación, es decir, secuencias que muestran una similitud significativa (por ejemplo, >80%) tras el análisis de homología. Entonces se alinean las dos secuencias homólogas usando el programa de alineación CLUSTAL V desarrollado por Higgins et al. Mediante la alineación puede detectarse y registrarse cualquier divergencia de secuencia, incluyendo sustitución, inserción y deleción de nucleótidos.
Inicialmente se comprueban las diferencias de secuencia detectadas para determinar la precisión hallando los puntos en los que hay diferencias entre las secuencias de teosinte y maíz; comprobando el fluorograma (cromatograma) de la secuencia para determinar si las bases que parecen únicas para el maíz corresponden a señales fuertes, claras específicas para la base en cuestión; comprobando las correspondencias del maíz para observar si hay más de una secuencia de maíz que corresponde a un cambio de secuencia; y otros procedimientos conocidos en la técnica, según se necesite. Múltiples entradas de secuencia de maíz para el mismo gen que presentan el mismo nucleótido en una posición en la que hay un nucleótido de teosinte diferente proporcionan apoyo independiente de que la secuencia de maíz es precisa, y de que la diferencia maíz/teosinte es real. Tales cambios se examinan usando información de bases de datos públicas/comerciales y el código genético para determinar si estos cambios de secuencia de ADN dan como resultado un cambio en la secuencia de aminoácidos de la proteína codificada. Las secuencias también pueden examinarse mediante secuenciación directa de la proteína codificada.
Ejemplo 6 Análisis de evolución molecular
Se someten las secuencias de teosinte y maíz en comparación a un análisis de K_{A}/K_{S}. En este análisis, se usan programas informáticos pública o comercialmente disponibles, tales como Li 93 e INA, para determinar el número de cambios no sinónimos por sitio (K_{A}) dividido por el número de cambios sinónimos por sitio (K_{S}) para cada secuencia en estudio tal como se describió anteriormente. Se ha demostrado que esta razón, K_{A}/K_{S}, es un reflejo del grado en el que se ha producido evolución adaptativa, es decir selección positiva, en la secuencia en estudio. Normalmente se han usado regiones codificantes de longitud completa en estos análisis comparativos. Sin embargo, también pueden usarse eficazmente segmentos parciales de una región codificante. Cuanto mayor sea la razón K_{A}/K_{S}, más probable es que una secuencia haya experimentado una evolución adaptativa. La significación estadística de los valores de K_{A}/K_{S} se determina usando procedimientos estadísticos establecidos y programas disponibles tales como la prueba de la t. Es muy probable que aquellos genes que muestran razones K_{A}/K_{S} estadísticamente elevadas entre genes de teosinte y maíz hayan experimentado evolución adaptativa.
Para proporcionar adicionalmente apoyo a la significación de una razón K_{A}/K_{S} elevada, la secuencia en estudio puede compararse en otra especie de maíz ancestral. Estas comparaciones permiten una discriminación adicional en cuanto a si los cambios evolutivos adaptativos son únicos para el linaje de maíz domesticado en comparación con otros ancestros. También pueden examinarse las secuencias mediante secuenciación directa del gen de interés a partir de repre-
sentantes de diversas poblaciones de maíz para evaluar hasta qué grado se conserva la secuencia en la especie de maíz.
Ejemplo 7 Aplicación del procedimiento de K_{A}/K_{S} a secuencias homólogas de maíz y teosinte obtenidas a partir de una base de datos
La comparación de secuencias de teosinte y maíz domesticado y disponibles en Genbank (www.ncbi.nlm.gov/Web/
Genbank/index.html) reveló por lo menos cuatro genes homólogos: ceroso, A1*, A1 y globulina. Se compararon todas las secuencias disponibles para estos genes tanto de maíz como de teosinte. Se determinaron las razones K_{A}/K_{S} usando Li93 y/o INA:
1
Aunque se anticipó que el polimorfismo (múltiples copias alélicas) y/o poliploidía (más de 2 conjuntos de cromosomas por célula) observados en el maíz podrían hacer complejo o difícil el análisis de K_{A}/K_{S}, se encontró que no era el caso.
Aunque los valores anteriores de K_{A}/K_{S} indican que estos genes no se seleccionan positivamente este ejemplo ilustra que el procedimiento de K_{A}/K_{S} puede aplicarse a secuencias de maíz y teosinte obtenidas de una base de datos.
Ejemplo 8 Estudio de la función de la proteína usando una planta transgénica
Pueden evaluarse los papeles funcionales de un gen de maíz positivamente seleccionado obtenido según los procedimientos de los ejemplos 4-7 realizando evaluaciones de cada alelo del gen en una planta de maíz transgénico. Puede crearse una planta transgénica usando una adaptación del procedimiento descrito en Peng et al. (1999) Nature 400:256-261. La exploración fisiológica, morfológica y/o bioquímica de la planta transgénica o extractos de proteína de la misma permitirá la asociación de cada alelo con un fenotipo particular.
Ejemplo 9 Mapeo de genes positivamente seleccionados en QTL
El análisis de QTL (locus de rasgo cuantitativo) ha definido regiones cromosómicas que contienen los genes que controlan varios rasgos fenotípicos de interés en el maíz, incluyendo la altura de la planta y el contenido en aceite. Mapeando cada gen positivamente seleccionado mediante este procedimiento en uno de los QTL conocidos, puede identificarse de manera rápida y conclusiva el rasgo específico controlado por cada gen positivamente seleccionado.
Aunque la invención anterior se ha descrito en cierto detalle a título ilustrativo y ejemplificativo para mejorar la claridad y la comprensión, resultará evidente para los expertos ordinarios en la materia que pueden ponerse en práctica ciertos cambios y modificaciones. Por tanto, la descripción y los ejemplos no deben interpretarse como limitativos del alcance de la invención, que se describe mediante las reivindicaciones adjuntas.

Claims (12)

1. Procedimiento para identificar una secuencia de polinucleótido que codifica para un polipéptido de un organismo domesticado, en el que dicho polipéptido puede estar asociado con un rasgo estética o comercialmente relevante que es único, está potenciado o alterado en el organismo domesticado en comparación con un ancestro de tipo natural de dicho organismo domesticado, que comprende:
(a)
comparar secuencias de nucleótidos que codifican para proteínas de dicho organismo domesticado con secuencias de nucleótidos que codifican para proteínas de dicho ancestro de tipo natural; y
(b)
seleccionar una secuencia de polinucleótido que codifica para proteínas en el organismo domesticado que contiene un cambio de nucleótido que es significativo desde el punto de vista evolutivo en comparación con una secuencia correspondiente en el ancestro de tipo natural, tal como se define mediante una razón (Ka/Ks) de la tasa de sustitución no sinónima (Ka) con respecto a la tasa de sustitución sinónima (Ks), en la secuencia de polinucleótido que codifica para proteínas parcial o completa, de \geq 0,75.
2. Procedimiento según la reivindicación 1, que comprende asimismo caracterizar la secuencia seleccionada en cuanto a las identidades moleculares/genéticas y la función biológica.
3. Procedimiento según la reivindicación 1 ó 2, en el que el organismo domesticado es una planta domesticada cuyo ancestro de tipo natural es conocido.
4. Procedimiento según la reivindicación 3, en el que el rasgo es rendimiento, floración de día de duración corta, contenido en proteína o en aceite, sabor, facilidad de recolección o resistencia a la enfermedad o a la sequía.
5. Procedimiento según la reivindicación 3 ó 4, en el que la planta domesticada es maíz, arroz, tomate o patata.
6. Procedimiento según la reivindicación 5, en el que la planta domesticada es maíz y el ancestro de tipo natural es teosinte.
7. Procedimiento según la reivindicación 1 ó 2, en el que el organismo domesticado es un animal domesticado cuyo ancestro de tipo natural es conocido.
8. Procedimiento según la reivindicación 7, en el que el rasgo es el contenido en grasa o en proteína, la producción de leche, tiempo hasta el pleno desarrollo, docilidad, fecundidad o resistencia a la enfermedad.
9. Procedimiento según la reivindicación 7 u 8, en el que el animal domesticado es un cerdo, animal de ganado, caballo, perro o gato.
10. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que las secuencias comparadas son de ADNc.
11. Procedimiento de identificación de un agente que puede modular el rasgo según la reivindicación 1, comprendiendo dicho procedimiento poner en contacto por lo menos un agente candidato con una célula o un organismo transgénico no humano que expresa la secuencia de polinucleótido identificada en la reivindicación 1, en el que el agente se identifica por su capacidad para modular la función del polipéptido codificado por el polinucleótido identificado en la reivindicación 1.
12. Procedimiento para correlacionar un cambio de nucleótido significativo desde el punto de vista evolutivo con el rasgo según la reivindicación 1, que comprende:
(a)
identificar una secuencia de nucleótidos según la reivindicación 1; y
(b)
analizar el efecto funcional de la presencia o ausencia de la secuencia identificada en el organismo domesticado.
ES00960208T 1999-08-05 2000-08-01 Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados. Expired - Lifetime ES2292467T3 (es)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US09/368,810 US6274319B1 (en) 1999-01-29 1999-08-05 Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
US368810 1999-08-05
PCT/US1999/020209 WO2000012764A1 (en) 1998-09-02 1999-09-01 Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions
WOPCT/US99/20209 1999-09-01
US15282599P 1999-09-07 1999-09-07
US591435 2000-06-09
US09/591,435 US6280953B1 (en) 1998-01-30 2000-06-09 Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions
PCT/US2000/040517 WO2001011088A2 (en) 1999-08-05 2000-08-01 Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals

Publications (1)

Publication Number Publication Date
ES2292467T3 true ES2292467T3 (es) 2008-03-16

Family

ID=27387327

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00960208T Expired - Lifetime ES2292467T3 (es) 1999-08-05 2000-08-01 Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados.

Country Status (9)

Country Link
EP (1) EP1250449B1 (es)
JP (1) JP2004500036A (es)
AT (1) ATE374834T1 (es)
AU (1) AU784869B2 (es)
CA (1) CA2390094A1 (es)
DE (1) DE60036645T2 (es)
DK (1) DK1250449T3 (es)
ES (1) ES2292467T3 (es)
WO (1) WO2001011088A2 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003217221B2 (en) * 2002-01-16 2008-11-27 Evolutionary Genomics, Inc. Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
JP2009297039A (ja) * 2002-01-16 2009-12-24 Evolutionary Genomics Inc 栽培用植物および家畜化動物中のポリヌクレオチドおよびポリペプチド配列における進化的に有意の変化を同定するための方法
CA2512110A1 (en) 2002-12-31 2004-07-22 Mmi Genomics, Inc. Compositions, methods, and systems for inferring bovine breed
KR20080063296A (ko) * 2005-09-02 2008-07-03 에보류셔너리 제노믹스 인크 Eg8798과 eg9703 폴리뉴클레오티드 및 그것의 용도
CN114300050A (zh) * 2021-12-29 2022-04-08 南京农业大学 一种鉴定谱系特异性扩增基因家族的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1984003716A1 (en) * 1983-03-21 1984-09-27 John A Webster Jr Method for identifying and characterizing organisms

Also Published As

Publication number Publication date
CA2390094A1 (en) 2001-02-15
EP1250449A2 (en) 2002-10-23
WO2001011088A3 (en) 2001-12-13
JP2004500036A (ja) 2004-01-08
DK1250449T3 (da) 2007-11-05
EP1250449B1 (en) 2007-10-03
DE60036645T2 (de) 2008-07-17
DE60036645D1 (de) 2007-11-15
ATE374834T1 (de) 2007-10-15
AU7139900A (en) 2001-03-05
WO2001011088A2 (en) 2001-02-15
AU784869B2 (en) 2006-07-13

Similar Documents

Publication Publication Date Title
Morgil et al. Single Nucleotide Polymorphisms (SNPs) in Plant Genetics and
Lind et al. Genome of the Komodo dragon reveals adaptations in the cardiovascular and chemosensory systems of monitor lizards
Singh et al. Marker-assisted plant breeding: principles and practices
Yang et al. Review on the development of genotyping methods for assessing farm animal diversity
Emmrich et al. A draft genome of grass pea (Lathyrus sativus), a resilient diploid legume
Naqvi Application of molecular genetic technologies in livestock production: potentials for developing countries
US10337072B2 (en) Copy number detection and methods
Blitz et al. A catalog of Xenopus tropicalis transcription factors and their regional expression in the early gastrula stage embryo
US6274319B1 (en) Methods to identify evolutionarily significant changes in polynucleotide and polypeptide sequences in domesticated plants and animals
Poczai et al. Genomics meets biodiversity: advances in molecular marker development and their applications in plant genetic diversity assessment
AU769931B2 (en) Methods to identify polynucleotide and polypeptide sequences which may be associated with physiological and medical conditions
Miller et al. The gene pool concept applied to crop wild relatives: An evolutionary perspective
ES2292467T3 (es) Procedimiento para identificar cambios significativos desde el punto de vista evolutivo en secuencias de polinucleotidos y de polipeptidos en plantas y animales domesticados.
Gajewska et al. Forward genetics approach reveals a mutation in bHLH transcription factor-encoding gene as the best candidate for the root hairless phenotype in barley
US20240294968A1 (en) Systems and methods for verifying biological samples with whole genome sequencing
Dida Molecular markers in breeding of crops: recent progress and advancements
Geigl Palaeogenetics of cattle domestication: Methodological challenges for the study of fossil bones preserved in the domestication centre in Southwest Asia
TW201606084A (zh) 預測或判定作物表現型之方法
Deng Functional genomics of blood pressure determination: Dissecting and assembling a polygenic trait by experimental genetics
Borlay et al. Molecular characterization of doum palm (Hyphaene compressa) from selected regions of Kenya using chloroplast simple sequence repeats (cpSSR) markers
BRPI0614050A2 (pt) métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador
Ahmed et al. An introduction to DNA technologies and their role in livestock production: a review.
US20250040501A1 (en) Methods and assays for identifying, creating, and cultivating disease-resistant peanut lines
US20050234654A1 (en) Detection of evolutionary bottlenecking by dna sequencing as a method to discover genes of value
Nuraga et al. The genotypic and genetic diversity of enset (Ensete ventricosum) landraces used in traditional medicine is similar to the diversity found in starchy landraces