[go: up one dir, main page]

BRPI0619242A2 - protein, methods for increasing seed production and / or increasing plant growth rate and growth rate, plant cell construction, and methods for producing a transgenic plant to improve plant growth characteristics and growth characteristics relative to corresponding wild type plants, to increase crop yield, plant seed count and plant seed yield - Google Patents

protein, methods for increasing seed production and / or increasing plant growth rate and growth rate, plant cell construction, and methods for producing a transgenic plant to improve plant growth characteristics and growth characteristics relative to corresponding wild type plants, to increase crop yield, plant seed count and plant seed yield Download PDF

Info

Publication number
BRPI0619242A2
BRPI0619242A2 BRPI0619242-4A BRPI0619242A BRPI0619242A2 BR PI0619242 A2 BRPI0619242 A2 BR PI0619242A2 BR PI0619242 A BRPI0619242 A BR PI0619242A BR PI0619242 A2 BRPI0619242 A2 BR PI0619242A2
Authority
BR
Brazil
Prior art keywords
seq
plant
nucleic acid
polypeptide
increased
Prior art date
Application number
BRPI0619242-4A
Other languages
Portuguese (pt)
Inventor
Valerie Frankard
Christophe Reuzeau
Molinero Ana Isabel Sanz
Christian Dammann
Original Assignee
Cropdesign Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cropdesign Nv filed Critical Cropdesign Nv
Priority claimed from PCT/US2006/045721 external-priority patent/WO2007064724A2/en
Publication of BRPI0619242A2 publication Critical patent/BRPI0619242A2/en

Links

Landscapes

  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

PROTEìNA, MéTODOS PARA AUMENTAR PRODUçãO DE SEMENTE E/OU AUMENTAR TAXA DE CRESCIMENTO DE PLANTAS E TAXA DE CRESCIMENTO, CéLULA VEGETAL, CONSTRUçãO, E, MéTODOS PARA PRODUZIR UMA PLANTA TRANSGeNICA, PARA MELHORAR CARACTERìSTICAS DE CRESCIMENTO DE PLANTAS E CARACTERìSTICAS DE CRESCIMENTO EM RELAçãO A CORRESPONDENTES PLANTAS DO TIPO SELVAGEM, PARA AUMENTAR PRODUçãO VEGETAL, NúMERO DE SEMENTES EM PLANTAS E PRODUçãO DE SEMENTE EM PLANTAS. A presente invenção geralmente se refere ao campo de biologia molecular e se relaciona a um método para melhorar várias características de crescimento vegetal modulando expressão em uma planta de um ácido nucleico codificando uma GRP (Proteína Relacionada a Crescimento). A presente invenção também se relaciona a plantas tendo expressão modulada de um ácido nucleico codificando uma GRP, cujas plantas tem características de crescimento melhoradas em relação a correspondentes plantas do tipo selvagem ou outras plantas de controle. A invenção também fornece construções úteis nos métodos da invenção. A GRP pode ser uma das seguintes: Regulador de Produção de Sementes (SYR), FG- GAP, CYP90B, CDC27, fatores de transcrição AT-hook, fatores de transcrição DOF e Inibidores de Quinase Dependentes de Ciclina (CKIs).PROTEIN, METHODS TO INCREASE SEED PRODUCTION AND / OR INCREASE PLANT GROWTH RATE AND GROWTH RATE, PLANT CELL, CONSTRUCTION, AND METHODS TO PRODUCE A TRANSGENIC PLANT, TO IMPROVE CHARACTERISTIC CHARACTERISTICS OF CHARACTERISTICS. CORRESPONDENT WILD TYPE PLANTS, TO INCREASE VEGETABLE PRODUCTION, NUMBER OF SEEDS IN PLANTS AND SEED PRODUCTION IN PLANTS. The present invention generally relates to the field of molecular biology and relates to a method for improving various plant growth characteristics by modulating expression in a plant of a nucleic acid encoding a GRP (Growth-Related Protein). The present invention also relates to plants having modulated expression of a nucleic acid encoding a GRP, whose plants have improved growth characteristics compared to corresponding wild-type plants or other control plants. The invention also provides constructs useful in the methods of the invention. GRP can be one of the following: Seed Production Regulator (SYR), FG-GAP, CYP90B, CDC27, AT-hook transcription factors, DOF transcription factors and Cycline Dependent Kinase Inhibitors (CKIs).

Description

"PROTEÍNA, MÉTODOS PARA AUMENTAR PRODUÇÃO DE SEMENTE E/OU AUMENTAR TAXA DE CRESCIMENTO DE PLANTAS E TAXA DE CRESCIMENTO, CÉLULA VEGETAL, CONSTRUÇÃO, E, MÉTODOS PARA PRODUZIR UMA PLANTA TRANSGÊNICA, PARA MELHORAR CARACTERÍSTICAS DE CRESCIMENTO DE PLANTAS E CARACTERÍSTICAS DE CRESCIMENTO EM RELAÇÃO A CORRESPONDENTES PLANTAS DO TIPO SELVAGEM, PARA AUMENTAR PRODUÇÃO VEGETAL, NÚMERO DE SEMENTES EM PLANTAS E PRODUÇÃO DE SEMENTE EM PLANTAS""PROTEIN, METHODS FOR INCREASING SEED PRODUCTION AND / OR INCREASING PLANT GROWTH RATE AND GROWTH RATE, VEGETABLE CELL, CONSTRUCTION, AND METHODS FOR PRODUCING A TRANSGENIC PLANT FEATURES OF CROSS GROWTH CHARACTERISTIC CHARACTERISTICS MATCHING WILD TYPE PLANTS TO INCREASE VEGETABLE PRODUCTION, NUMBER OF PLANT SEEDS AND PLANT SEED PRODUCTION "

A presente invenção geralmente se refere ao campo de biologia molecular e se relaciona a um método para melhorar várias^ características de crescimento vegetal modulando expressão em uma planta, dê ^IifflT ácido nucleico codificando uma GRP (Proteína Relacionada a Crescimento).The present invention generally relates to the field of molecular biology and relates to a method for enhancing various plant growth characteristics by modulating expression in a plant by providing nucleic acid encoding a GRP (Growth Related Protein).

A presente invenção também se relaciona a plantas tendo expressão modulada de um ácido nucleico codificando uma GRP, cujas plantas têm características de crescimento melhoradas em relação a plantas tipo selvagem correspondentes ou outras plantas de controle. A invenção também fornece construções úteis nos métodos da invenção.The present invention also relates to plants having modulated expression of a GRP-encoding nucleic acid whose plants have improved growth characteristics over corresponding wild-type plants or other control plants. The invention also provides constructs useful in the methods of the invention.

Dada a sempre crescente população mundial, e a área diminuída de terra disponível para agricultura, permanece como um principal objetivo de pesquisa melhorar a eficiência de agricultura e melhorar a diversidade de plantas em horticultura. Meios convencionais para melhoramentos culturais e horticulturais utilizam técnicas de melhoramento seletivo para identificar plantas tendo características desejáveis. Entretanto, tais técnicas de melhoramento seletivo têm diversas desvantagens, em outras palavras que estas técnicas são tipicamente de trabalho intensivo e resultam em plantas que freqüentemente contêm complementos genéticos heterogêneos que podem nem sempre resultar na característica desejável sendo passada adiante a partir de plantas parentais. Avanços em biologia molecular permitiram ao ser humano manipular o germoplasma de animais e plantas. Engenharia genética de plantas exige o isolamento e manipulação de material genético (tipicamente na forma de DNA ou RNA) e a subseqüente introdução de tal material; genético em uma planta. Tal tecnologia levou ao desenvolvimento de plantas tendo várias características econômicas, agronômicas ou horticulturais melhoradas. Característica de particular interesse econômico são características de crescimento tal como alta produção. Produção normalmente é definida como a produção mensurável de valor econômico de uma safra. Isto pode ser definido em termos de quantidade e/ou qualidade. Produção é diretamente dependente de diversos fatores, por exemplo, o número e tamanho dos órgãos, arquitetura vegetal (por exemplo, o número de galhos), produção de sementes e mais. Desenvolvimento de raiz, absorção de nutrientes e tolerância a estresse também podem ser fatores importantes para determinar produção.Given the ever-growing world population, and the diminished land area available for agriculture, remains a major research objective to improve agricultural efficiency and improve plant diversity in horticulture. Conventional means for cultural and horticultural breeding use selective breeding techniques to identify plants having desirable characteristics. However, such selective breeding techniques have several disadvantages, in other words that these techniques are typically labor intensive and result in plants that often contain heterogeneous genetic complements that may not always result in the desirable trait being passed on from parent plants. Advances in molecular biology have allowed humans to manipulate the germplasm of animals and plants. Plant genetic engineering requires the isolation and manipulation of genetic material (typically in the form of DNA or RNA) and the subsequent introduction of such material; genetic in a plant. Such technology has led to the development of plants having various improved economic, agronomic or horticultural characteristics. Characteristics of particular economic interest are growth characteristics such as high production. Production is usually defined as the measurable economic value production of a crop. This can be defined in terms of quantity and / or quality. Yield is directly dependent on several factors, for example organ number and size, plant architecture (eg number of branches), seed yield and more. Root development, nutrient absorption and stress tolerance can also be important factors in determining yield.

Produção de sementes é uma característica particularmente importante, uma vez que as sementes de muitas plantas são importantes para nutrição humana e animal. Safras tal como, milho, arroz, trigo, canola e soja respondem por mais da metade do consumo calórico humano total, quer através de consumo das próprias sementes ou através de consumo de produtos de carne criados com sementes processadas. Elas também são uma fonte de açúcares, óleos e muitos tipos de metabólitos usados em processos industriais. Sementes contêm um embrião (a fonte de novos brotos e raízes) e um endosperma (a fonte de nutrientes para crescimento de embrião durante germinação e durante crescimento precoce de plântulas). O desenvolvimento de uma semente envolve muitos genes, e requer a transferência de metabólitos das raízes, folhas e caules para a semente em desenvolvimento. O endosperma, em particular, assimila os precursores metabólicos de carboidratos, óleos e proteínas e sintetiza estes em macromoléculas de armazenamento para preencher o grão.Seed production is a particularly important feature, since the seeds of many plants are important for human and animal nutrition. Crops such as corn, rice, wheat, canola and soya account for more than half of total human caloric consumption, either through consumption of their own seeds or through consumption of meat products created from processed seeds. They are also a source of sugars, oils and many types of metabolites used in industrial processes. Seeds contain an embryo (the source of new shoots and roots) and an endosperm (the source of nutrients for embryo growth during germination and during early seedling growth). Seed development involves many genes, and requires the transfer of metabolites from the roots, leaves and stems to the developing seed. Endosperm, in particular, assimilates the metabolic precursors of carbohydrates, oils and proteins and synthesizes them into storage macromolecules to fill the grain.

Outra importante característica para muitas safras é vigor precoce. Melhorar vigor precoce é um importante objetivo de programas modernos de melhoramento de arroz tanto em cultivares de arroz temperados como tropicais. Raízes longas são importantes para ancoramento apropriado ao solo em arroz semeado em água. Onde arroz é semeado diretamente em campos alagados, e onde plantas devem emergir rapidamente através de água, brotos maiores estão associados com vigor. Onde sementeira em sulcos é praticada, mesocótilos e coleóptilos maiores são importantes para boa emergência de plântula. Vigor precoce também pode resultar de aptidão vegetal aumentado devido a, por exemplo, as plantas serem melhor adaptadas ao seu ambiente (i.e. sendo mais capazes de lidar com vários fatores de estresse abiótico ou biótico). Plantas tendo vigor precoce também mostram melhor estabelecimento da safra (com a safra crescendo de uma maneira mais uniforme, i.e. com a maioria das plantas atingindo os vários estágios de desenvolvimento substancialmente ao mesmo tempo), e mostram melhor crescimento e freqüentemente melhor produção.Another important feature for many crops is early vigor. Improving early vigor is an important objective of modern rice breeding programs in both temperate and tropical rice cultivars. Long roots are important for proper ground anchorage in water-sown rice. Where rice is sown directly in flooded fields, and where plants must emerge rapidly through water, larger shoots are associated with vigor. Where furrow sowing is practiced, larger mesocotyls and coleoptils are important for good seedling emergence. Early vigor can also result from increased plant fitness because, for example, plants are better adapted to their environment (i.e. being better able to cope with various abiotic or biotic stressors). Plants having early vigor also show better crop establishment (with the crop growing more evenly, i.e. with most plants reaching various stages of development at substantially the same time), and show better growth and often better yield.

Uma característica importante adicional é aquela de tolerância melhorada a estresse abiótico. Estresse abiótico é uma causa primária de perda de safra ao redor do mundo, reduzindo produções médias para a maioria das principais cultivares em mais do que 50% (Wang et ai, Planta (2003) 218: 1-14). Estresses abióticos podem ser causados por seca, salinidade, extremos de temperatura, toxicidade química e estresse oxidativo. A capacidade de melhorar tolerância vegetal a estresse abiótico seria de grande vantagem econômica para fazendeiros ao redor do mundo e iria permitir o cultivo de safras durante condições adversas e em territórios onde cultivo de safras pode não ser possível de outra maneira.An additional important feature is that of improved abiotic stress tolerance. Abiotic stress is a primary cause of crop loss around the world, reducing average yields for most major cultivars by more than 50% (Wang et al, Planta (2003) 218: 1-14). Abiotic stresses can be caused by drought, salinity, temperature extremes, chemical toxicity and oxidative stress. The ability to improve plant tolerance to abiotic stress would be of great economic advantage to farmers around the world and would allow crop cultivation during adverse conditions and in territories where crop cultivation may not otherwise be possible.

Produção de safra portanto pode ser aumentada otimizando um dos fatores mencionados acima.Crop yield can therefore be increased by optimizing one of the factors mentioned above.

Dependendo da utilização, a modificação de certas características de produção pode ser favorecida sobre outras. Por exemplo para aplicações tal como produção de forragem ou madeira, ou recurso de biocombustível, um aumento nas partes folhosas de uma planta pode ser desejável, e para aplicações tal como produção de trigo, amido ou óleo, um aumento em parâmetros de semente pode ser particularmente desejável. Mesmo entre os parâmetros de semente, alguns podem ser favorecidos sobre outros, dependendo da aplicação. Vários mecanismos podem contribuir para aumentar produção de sementes, quer isto seja na forma de tamanho de semente aumentado ou número de sementes aumentado.Depending on use, modification of certain production characteristics may be favored over others. For example for applications such as forage or wood production, or biofuel resource, an increase in the leafy parts of a plant may be desirable, and for applications such as wheat, starch or oil production, an increase in seed parameters may be desirable. particularly desirable. Even among seed parameters, some may be favored over others, depending on the application. Various mechanisms can contribute to increased seed yield, either in the form of increased seed size or increased seed number.

Uma abordagem para aumentar produção (de sementes) em plantas pode ser através de modificação dos mecanismos de crescimento inerentes de uma planta. Um tal mecanismo é o ciclo celular.One approach to increasing (seed) production in plants may be by modifying the inherent growth mechanisms of a plant. One such mechanism is the cell cycle.

Foi verificado agora que várias características de crescimento podem ser melhoradas em plantas modulando expressão em uma planta de um ácido nucleico codificando uma GRP (Proteína Relacionada a Crescimento) em uma planta. A GRP pode ser uma das seguintes: Regulador de Produção de Sementes (SYR), FG-GAP, CYP90B, CDC27, fatores de transcrição AT- hook, fatores de transcrição DOF e Inibidores de Quinase Dependentes de Ciclina (CKIs).It has now been found that various growth traits can be improved in plants by modulating expression in a plant of a nucleic acid encoding a GRP (Growth Related Protein) in a plant. GRP can be one of the following: Seed Production Regulator (SYR), FG-GAP, CYP90B, CDC27, AT-hook transcription factors, DOF transcription factors, and Cycline Dependent Kinase Inhibitors (CKIs).

FUNDAMENTOS Regulador de Produção de Sementes (SYR)BACKGROUND Seed Production Regulator (SYR)

Existe uma necessidade contínua de encontrar novos genes para estimulação de produção de sementes e diversas abordagens foram usadas até agora, por exemplo através de manipulação de níveis de hormônios vegetais (WO 03/050287), através de manipulação do ciclo celular (WO 2005/061702), através de manipulação de genes envolvidos em resposta a estresse salino (WO 2004/058980) entre outras estratégias.There is a continuing need to find new genes for seed production stimulation and several approaches have been used so far, for example through manipulation of plant hormone levels (WO 03/050287), through cell cycle manipulation (WO 2005/061702 ) by manipulating genes involved in response to saline stress (WO 2004/058980) among other strategies.

SYR é uma proteína nova que até agora não foi caracterizada. SYR mostra alguma homologia (cerca de 48% de identidade de seqüência no nível de DNA, cerca de 45% no nível de proteína) com uma proteína de Arabidopsis chamada ARGOS (Hu et al, Plant Cell 15, 1951-1961, 2003; Patente Norte-Americana 2005/0108793). Hu et al. postularam que ARGOS é uma proteína de função exclusiva e é codificada por um único gene. Os principais fenótipos de superexpressão de ARGOS em Arabidopsis são biomassa de folhas aumentada e florescimento atrasado. FG-GAPSYR is a new protein that has not been characterized so far. SYR shows some homology (about 48% DNA level sequence identity, about 45% protein level) with an Arabidopsis protein called ARGOS (Hu et al, Plant Cell 15, 1951-1961, 2003; Patent 2005/0108793). Hu et al. postulated that ARGOS is a protein of exclusive function and is encoded by a single gene. The main phenotypes of ARGOS overexpression in Arabidopsis are increased leaf biomass and delayed flowering. FG-GAP

Proteínas FG-GAP são proteínas transmembrana putativas. Elas são caracterizadas pela presença de um ou mais domínios FG-GAP (Pfam número de acesso PFO1839) e pela presença de um peptídeo sinal N- terminal e um domínio transmembrana na metade C-terminal da proteína.FG-GAP proteins are putative transmembrane proteins. They are characterized by the presence of one or more FG-GAP domains (Pfam accession number PFO1839) and the presence of an N-terminal signal peptide and a transmembrane domain in the C-terminal half of the protein.

Uma tal proteína, DEX1, foi isolada de Arabidopsis e foi relatada desempenhando um papel durante desenvolvimento de pólen (Paxson-Sowders et al. Plant physiol. 127, 1739-1749, 2001). Plantas Dexl mutantes mostram ser defeituosas em formação padrão de parede de pólen. O gene DEXl codifica uma proteína de 896 aminoácidos que é predita localizar a membrana plasmática, com resíduos 1 até 860 sendo localizados fora da célula, resíduos 880 até 895 no lado citoplasmático da membrana, e aminoácidos 861 até 879 representando um domínio transmembrana potencial. Doze sítios potenciais de N-glicosilação estão presentes em DEXl. Portanto, a proteína tem o potencial de ser fortemente modificada e interagir com vários componentes da parede celular. DEXl mostra a maior similaridade de seqüência com uma proteína tipo hemolisina de V. cholerae, ao passo que um segmento de aproximadamente 200 aminoácidos de DEXl (aminoácidos 439-643) também mostra similaridade limitada com o domínio de ligação de cálcio de alfa-integrinas. Nesta região estão pelo menos dois conjuntos de ligantes putativos de ligação de cálcio que também estão presentes em uma proteína calmodulina de Arabidopsis prevista (AC009853). Portanto, parece que DEXl pode ser uma proteína de ligação de cálcio. DEXl parece ser uma proteína vegetal exclusiva; homólogos não estão presentes em bactérias, fungos, ou animais.One such protein, DEX1, has been isolated from Arabidopsis and has been reported to play a role during pollen development (Paxson-Sowders et al. Plant physiol. 127, 1739-1749, 2001). Mutant Dexl plants are found to be defective in standard pollen wall formation. The DEX1 gene encodes an 896 amino acid protein that is predicted to localize the plasma membrane, with residues 1 to 860 being located outside the cell, residues 880 to 895 on the cytoplasmic side of the membrane, and amino acids 861 to 879 representing a potential transmembrane domain. Twelve potential N-glycosylation sites are present in DEX1. Therefore, the protein has the potential to be strongly modified and to interact with various cell wall components. DEX1 shows the greatest sequence similarity to a V. cholerae hemolysin-like protein, whereas an approximately 200 amino acid segment of DEX1 (amino acids 439-643) also shows limited similarity to the alpha-integrin calcium binding domain. In this region are at least two sets of putative calcium binding binders that are also present in a predicted Arabidopsis calmodulin protein (AC009853). Therefore, it appears that DEX1 may be a calcium binding protein. DEXl appears to be a unique plant protein; counterparts are not present in bacteria, fungi, or animals.

As alterações observadas em plantas dexl, assim como a estrutura prevista de DEX1, geram diversas possibilidades para o papel da proteína em formação de parede de pólen (Paxson-Sowders et al., 2001):The changes observed in dexl plants, as well as the predicted structure of DEX1, generate several possibilities for the role of protein in pollen wall formation (Paxson-Sowders et al., 2001):

(a) DEXl pode ser uma proteína ligante. Ela pode estar associada com a membrana de micrósporo e participar em acoplamento ou da primexina ou esporopolenina à membrana plasmática. Ausência da proteína da superfície de micrósporo pode resultar em alterações estruturais na primexina. S numerosos sítios potenciais de N-glicosilação são consistentes com acoplamento de DEXl à parede de calose, à intina, ou ambas.(a) DEX1 may be a protein ligand. It may be associated with the microspore membrane and participate in coupling of either primexin or sporopolenin to the plasma membrane. Absence of microspore surface protein may result in structural changes in primexin. Numerous potential N-glycosylation sites are consistent with DEX1 coupling to the callose wall, the intin, or both.

(b) DEXl pode ser um componente da matriz de primexina e desempenha um papel na polimerização inicial da primexina. Mudanças em concentrações de íon Ca+2 parecem ser importantes para síntese de parede de pólen; beta-glucana sintase é ativada por concentrações micromolares de Ca+2 durante formação de parede de calose.(b) DEX1 may be a component of the primexin matrix and plays a role in the initial polymerization of primexin. Changes in Ca + 2 ion concentrations appear to be important for pollen wall synthesis; Beta-glucan synthase is activated by micromolar Ca + 2 concentrations during callose wall formation.

(c) DEXl pode ser parte do ER bruto e pode estar envolvido em processamento e/ou transporte de precursores de primexina para a membrana. O aparecimento atrasado e alterações gerais na primexina são consistentes com uma ausência geral de precursores de primexina. A matriz de primexina é inicialmente composta de polissacarídeos, proteínas, e celulose, seguido pela incorporação de materiais mais resistentes. Portanto, DEXl pode participar na formação ou transporte de qualquer número de componentes diferentes.(c) DEX1 may be part of the crude ER and may be involved in processing and / or transport of primexin precursors to the membrane. Delayed onset and general changes in primexin are consistent with a general absence of primexin precursors. The primexin matrix is initially composed of polysaccharides, proteins, and cellulose, followed by incorporation of more resistant materials. Therefore, DEX1 may participate in forming or transporting any number of different components.

CYP90BCYP90B

Brassinoesteróides (BRs) são uma classe de hormônios vegetais que são importantes para promover crescimento, divisão e desenvolvimento vegetal. O termo BR coletivamente se refere a mais do que quarenta derivados de esterol poli-hidroxilado naturalmente ocorrentes, com similaridade estrutural com hormônios esteróides animais. Dentre estes, brassinolide mostrou ser o mais ativo biologicamente (para revisão, Clouse (2002) Brassinosteroids. The Arabidopsis Book: 1-23).Brassinosteroids (BRs) are a class of plant hormones that are important for promoting plant growth, division and development. The term BR collectively refers to more than forty naturally occurring polyhydroxylated sterol derivatives with structural similarity to animal steroid hormones. Of these, brassinolide was found to be the most biologically active (for review, Clouse (2002) Brassinosteroids. The Arabidopsis Book: 1-23).

A via biossintética de BR foi elucidada usando análises bioquímicas e mutacionais. BRs são sintetizados através de pelo menos duas vias bioquímicas ramificadas começando a partir do mesmo precursor inicial, campesterol (Fujioka et al. (1997) physiol Plant 100:710-715). Os genes verificados de biossíntese de BR foram encontrados codificando principalmente monooxigenases de citocromo P450 (CYP) (Bishop and Yokota (2001) Plant Cell physiol 42:114-120). Superfamília CYP de enzimas catalisa oxidação de muitos produtos químicos, e no presente caso mais especificamente catalisa reações oxidativas essenciais na biossíntese de BRs. Uma das etapas importantes identificadas consiste na hidroxilação da cadeia lateral esteróide de intermediários de BR campestanol e 6-oxocampestanol para formar 6-deoxocatasterona e catasterona respectivamente. Estas duas etapas oxidativas paralelas também são coletivamente chamadas da etapa inicial de alfa-hidroxilação de esteróide C-22 (Choe et al. (1998) Plant Cell 10: 231-243). Em Arabidopsis, uma enzima CYP específica, CYP90B1 ou DWF4, realiza esta etapa (para referência geral em nomenclatura de CYP vegetal, Nelson et al. (2004) Plant pH ys 135: 756-772). Plantas mutantes de Arabidopsis carecendo de atividade de alfa hidroxilase de esteróide 22 devido à inserção de um T-DNA no locus de DWF4 apresentaram um fenótipo definhado devido à carência de prolongamento celular (Choe et al. (1998) Plant Cell 10: 231-243). Estudos bioquímicos de alimentação com intermediários de biossíntese de BR mostraram que todos os compostos anteriores resgataram o fenótipo, ao passo que os precursores conhecidos fracassaram ao fazer isto.The BR biosynthetic pathway was elucidated using biochemical and mutational analyzes. BRs are synthesized through at least two branched biochemical pathways starting from the same initial precursor, campesterol (Fujioka et al. (1997) physiol Plant 100: 710-715). The verified BR biosynthesis genes were found mainly encoding cytochrome P450 monooxygenases (CYP) (Bishop and Yokota (2001) Plant Cell physiol 42: 114-120). CYP superfamily of enzymes catalyzes oxidation of many chemicals, and in the present case more specifically catalyzes essential oxidative reactions in BRs biosynthesis. One of the important steps identified is the steroid side chain hydroxylation of campestanol and 6-oxocampestanol BR intermediates to form 6-deoxocatasterone and catasterone respectively. These two parallel oxidative steps are also collectively called the initial C-22 steroid alpha-hydroxylation step (Choe et al. (1998) Plant Cell 10: 231-243). In Arabidopsis, a specific CYP enzyme, CYP90B1 or DWF4, performs this step (for general reference in nomenclature of plant CYP, Nelson et al. (2004) Plant pH ys 135: 756-772). Arabidopsis mutant plants lacking steroidal alpha hydroxylase 22 activity due to insertion of a T-DNA into the DWF4 locus showed a withered phenotype due to lack of cell prolongation (Choe et al. (1998) Plant Cell 10: 231-243 ). Biochemical feeding studies with BR biosynthesis intermediates showed that all of the above compounds rescued the phenotype, while known precursors failed to do so.

Foram geradas plantas transgênicas de Arabidopsis e tabaco, ambas dicotiledôneas, que superexpressaram ectopicamente um fragmento genômico DWF4 de Arabidopsis, usando o promotor 35S de vírus do mosaico da couve-flor (Choe et al. (2001) Plant J 26(6): 573-582). Caracterização fenotípica das plantas mostrou que o comprimento de hipocótilo, altura de planta em maturidade, número total de galhos e número total de sementes foram aumentados nas transgênicas comparado com plantas de controle. Choe et al. encontrou que a produção aumentada de sementes foi devido a um maior número de sementes por planta, aumento de tamanho de semente estando dentro do intervalo de desvio padrão. Estes experimentos são adicionalmente descritos em WOOO/47715.Transgenic Arabidopsis and tobacco plants, both dicotyledons, were generated, which ectopically overexpressed an Arabidopsis DWF4 genomic fragment using the cauliflower mosaic virus 35S promoter (Choe et al. (2001) Plant J 26 (6): 573 -582). Phenotypic characterization of the plants showed that the hypocotyl length, plant height at maturity, total number of branches and total number of seeds were increased in transgenic plants compared to control plants. Choe et al. found that increased seed yield was due to a higher number of seeds per plant, increased seed size being within the standard deviation range. These experiments are further described in WOOO / 47715.

Patente Norte-Americana 6.545.200 se refere a fragmentos de ácidos nucleicos isolados codificando genes biossintéticos de esterol, e mais especificamente reivindica uma seqüência de nucleotídeos codificando um polipeptídeo tendo atividade de C-8,7 esterol isomerase. Seqüências de nucleotídeos parciais codificando DWF4 são descritas.U.S. Patent 6,545,200 refers to isolated nucleic acid fragments encoding sterol biosynthetic genes, and more specifically claims a nucleotide sequence encoding a polypeptide having C-8.7 sterol isomerase activity. Partial nucleotide sequences encoding DWF4 are described.

Patente Norte-Americana 2004/0060079 se refere a um método de produzir uma planta monocotiledônea modificada tendo uma característica desejada. É fornecido um exemplo no qual a seqüência de nucleotídeos codificando DWF4 de arroz (referida ou como OsDWF4 ou CYP90B2) é colocada sob o controle de um promotor constitutivo, o promotor de actina de arroz. Quatorze das trinta e seis plantas transgênicas de arroz expressando a construção quimérica mostram um número aumentado de sementes por estaca se comparadas com plantas de controle não transformadas. De acordo com os requerentes, o aumento de produção nas transgênicas comparadas com os tipos selvagens é devido a um aumento em número total de sementes, pois nenhuma diferença significante é encontrada no "peso de 10 grãos".U.S. Patent 2004/0060079 refers to a method of producing a modified monocotyledonous plant having a desired trait. An example is provided in which the nucleotide sequence encoding rice DWF4 (referred to as either OsDWF4 or CYP90B2) is placed under the control of a constitutive promoter, the rice actin promoter. Fourteen of the thirty-six transgenic rice plants expressing the chimeric construct show an increased number of seeds per stake compared to untransformed control plants. According to the applicants, the yield increase in GMOs compared to wild type is due to an increase in the total number of seeds, as no significant difference is found in the "weight of 10 grains".

CDC27CDC27

Dependendo da utilização, a modificação de certas características de produção pode ser favorecida sobre outras. Por exemplo para aplicações tal como produção de forragem ou madeira, ou recurso de biocombustível, um aumento nas partes folhosas de uma planta pode ser desejável, e para aplicações tal como produção de trigo, amido ou óleo, um aumento em parâmetros de semente pode ser particularmente desejável. Mesmo entre os parâmetros de semente, alguns podem ser favorecidos sobre outros, dependendo da aplicação. Vários mecanismos podem contribuir para aumentar produção de sementes, quer isto seja na forma de tamanho de semente aumentado ou número de sementes aumentado. Um tal mecanismo é o ciclo celular.Depending on use, modification of certain production characteristics may be favored over others. For example for applications such as forage or wood production, or biofuel resource, an increase in the leafy parts of a plant may be desirable, and for applications such as wheat, starch or oil production, an increase in seed parameters may be desirable. particularly desirable. Even among seed parameters, some may be favored over others, depending on the application. Various mechanisms can contribute to increased seed yield, either in the form of increased seed size or increased seed number. One such mechanism is the cell cycle.

Progressão através do ciclo celular é fundamental para o crescimento e desenvolvimento de todos os organismos multicelulares e é crucial para proliferação celular. Os principais componentes do ciclo celular são altamente conservados em levedura, mamíferos, e plantas. O ciclo celular é tipicamente dividido nas seguintes fases seqüenciais: G0 - Gl - S - G2 - M. Replicação ou síntese de DNA geralmente ocorre durante a fase S ("S" é para síntese de DNA) e segregação mitótica dos cromossomos ocorre durante a fase M (o "M" é para mitose), com fases de intervalos intervenientes, Gl (durante a qual células crescem antes de replicação de DNA) e G2 (um período depois de replicação de DNA durante o qual a célula se prepara para divisão). Divisão celular é completada depois de citocinese, a última etapa da fase Μ. Células que saíram do ciclo celular e se tornaram quiescentes são ditas estarem na fase GO. Células nesta fase podem ser estimuladas para manter o ciclo celular na fase Gl. O "G" em Gl, G2 e GO representa "intervalo". Conclusão do processo de ciclo celular permite que cada célula filha durante divisão celular receba uma cópia completa do genoma parental.Progression through the cell cycle is critical to the growth and development of all multicellular organisms and is crucial to cell proliferation. The major components of the cell cycle are highly conserved in yeast, mammals, and plants. The cell cycle is typically divided into the following sequential phases: G0 - Gl - S - G2 - M. DNA replication or synthesis usually occurs during S phase ("S" is for DNA synthesis) and mitotic segregation of chromosomes occurs during phase M (the "M" is for mitosis), with intervening interval phases, Gl (during which cells grow before DNA replication) and G2 (a period after DNA replication during which the cell prepares for division ). Cell division is completed after cytokinesis, the last stage of phase Μ. Cells that have come out of the cell cycle and become quiescent are said to be in the GO phase. Cells in this phase can be stimulated to maintain the cell cycle in the Gl phase. The "G" in Gl, G2 and GO represents "range". Completion of the cell cycle process allows each daughter cell during cell division to receive a complete copy of the parental genome.

Divisão celular é controlada por dois eventos principais de ciclo celular, em outras palavras início de síntese de DNA e início de mitose. Cada transição para cada um destes eventos chave é controlada por um ponto de verificação representado por complexos protéicos específicos (envolvidos em replicação e divisão de DNA). A expressão de genes necessários para síntese de DNA no limite de Gl/S é regulada pela família E2F de fatores de transcrição em mamíferos e células vegetais (La Thangue, 1994; Muller et ai., 2001; De Veylder et ai, 2002). Entrada no ciclo celular é regulada/desencadeada por um complexo E2F/Rb que integra sinais e permite ativação de transcrição de genes de ciclo celular. A transição entre as diferentes fases do ciclo celular, e portanto progressão através do ciclo celular, é dirigida pela formação e ativação de diferentes proteínas quinases heterodiméricas de serina/treonina, geralmente referidas como quinases dependentes de ciclina (CDKs). Um pré-requisito para atividade destas quinases é a associação física com uma ciclina específica, o momento de ativação sendo amplamente dependente de expressão de ciclina. Ligação de ciclina induz mudanças conformacionais no lobo N-terminal do CDK associante e contribui para a localização e especificidade de substrato do complexo. CDKs monoméricos são ativados quando eles estão associados com ciclinas e assim têm uma atividade de quinase. Níveis protéicos de ciclina flutuam no ciclo celular e portanto representam um fator principal para determinar momento de ativação de CDK. A ativação periódica destes complexos contendo ciclinas e CDK durante ciclo celular media a regulação temporal de transições de ciclo celular (momentos de verificação). Mecanismos existem para assegurar que replicação de DNA ocorra apenas uma vez durante o ciclo celular. Por exemplo, proteínas CDC16, CDC23 e CDC27 são parte de um complexo de alto peso molecular conhecido como o complexo promotor de anáfase (APC) ou ciclossomo, (veja Romanowski and Madine, Trends in Cell Biology 6, 184-188, 1996, e Wuarin and Nurse, Cell 85, 785-787 (1996). O complexo em levedura é composto de pelo menos oito proteínas, das proteínas contendo TPR (repetição de tetratricopeptídeo) CDC16, CDC23 e CDC27, e cinco outras subunidades chamadas APC1, APC2, APC4, APC5 e APC7 (Peters et al. 1996, Science 274, 1199-1201). O APC direciona seus substratos para degradação proteolítica catalisando a ligação de moléculas de ubiquitina a estes substratos. Proteólise dependente de APC é requerida para a separação das cromátides-irmãs em transição de metáfase para anáfase e para a saída final de mitose Entre os substratos de APC estão a proteína inibidora de anáfase Pdslp e ciclinas mitóticas tal como ciclina B, respectivamente (Ciosk et al. 1998, Cell 93, 1067-1076; Cohen-Fix et al. 1996, Genes Dev 10, 3081-3093; Sudakin et al. 1995, Mol Biol Cell 6, 185-198; Jorgensen et al. 1998, Mol Cell Biol 18, 468-476; Townsley and Ruderman 1998, Trends Cell Biol 8, 238-244). Para se tornarem ativos como uma ligase de ubiquitina, pelo menos CDC16, CDC23 e CDC27 necessitam ser fosforilados na fase M (Ollendorf and Donoghue 1997, J Biol Chem 272, 32011-32018). APC ativado persiste ao longo de Gl do ciclo celular subseqüente para prevenir aparecimento prematuro de ciclinas tipo Β, o que iria resultar em uma entrada incontrolada na fase S (Irniger and Nasmyth 1997, J Cell Sci 110, 1523-1531). Foi demonstrado em levedura que mutações em qualquer de pelo menos dois dos componentes de APC, CDC16 e CDC27, pode resultar em super-replicação de DNA sem passagens intervenientes através de fases M (Heichman and Roberts 1996, Cell 85, 39-48). Este processo de replicação de DNA nuclear sem subseqüente mitose e divisão celular é chamado endoreduplicação de DNA, e leva a tamanho celular aumentado.Cell division is controlled by two major cell cycle events, in other words beginning of DNA synthesis and beginning of mitosis. Each transition to each of these key events is controlled by a checkpoint represented by specific protein complexes (involved in DNA replication and division). The expression of genes required for DNA synthesis at the Gl / S limit is regulated by the E2F family of transcription factors in mammals and plant cells (La Thangue, 1994; Muller et al., 2001; De Veylder et al, 2002). Cell cycle entry is regulated / triggered by an E2F / Rb complex that integrates signals and enables transcription activation of cell cycle genes. The transition between the different phases of the cell cycle, and hence progression through the cell cycle, is driven by the formation and activation of different serine / threonine heterodimeric protein kinases, commonly referred to as cyclin dependent kinases (CDKs). A prerequisite for activity of these kinases is their physical association with a specific cyclin, the timing of activation being largely dependent on cyclin expression. Cyclin binding induces conformational changes in the associative CDK N-terminal lobe and contributes to the localization and substrate specificity of the complex. Monomeric CDKs are activated when they are associated with cyclins and thus have kinase activity. Cyclin protein levels fluctuate in the cell cycle and therefore represent a major factor in determining CDK activation time. Periodic activation of these cyclin and CDK-containing complexes during cell cycle mediates the temporal regulation of cell cycle transitions (checkpoints). Mechanisms exist to ensure that DNA replication occurs only once during the cell cycle. For example, CDC16, CDC23 and CDC27 proteins are part of a high molecular weight complex known as the anaphase promoter (APC) or cyclosome complex, (see Romanowski and Madine, Trends in Cell Biology 6, 184-188, 1996, and Wuarin and Nurse, Cell 85, 785-787 (1996) The yeast complex is made up of at least eight proteins, TPR (tetratricopeptide repeat) containing proteins CDC16, CDC23 and CDC27, and five other subunits called APC1, APC2, APC4, APC5 and APC7 (Peters et al. 1996, Science 274, 1199-1201) APC directs its substrates for proteolytic degradation by catalyzing the binding of ubiquitin molecules to these substrates APC-dependent proteolysis is required for chromid separation sisters in transition from metaphase to anaphase and to final mitosis output. Among the APC substrates are the anaphase inhibitory protein Pdslp and mitotic cyclins such as cyclin B, respectively (Ciosk et al. 1998, Cell 93, 10 Cohen-Fix et al 1996, Genes Dev 10, 3081-3093; Sudakin et al. 1995, Mol Biol Cell 6, 185-198; Jorgensen et al. 1998, Mol Cell Biol 18, 468-476; Townsley and Ruderman 1998, Trends Cell Biol 8, 238-244). To become active as an ubiquitin ligase, at least CDC16, CDC23 and CDC27 need to be phosphorylated at phase M (Ollendorf and Donoghue 1997, J Biol Chem 272, 32011-32018). Activated APC persists throughout Gl of the subsequent cell cycle to prevent premature appearance of tipo-type cyclins, which would result in uncontrolled S-phase entry (Irniger and Nasmyth 1997, J Cell Sci 110, 1523-1531). It has been shown in yeast that mutations in any of at least two of the APC components, CDC16 and CDC27, can result in DNA over-replication without intervening M-phase passages (Heichman and Roberts 1996, Cell 85, 39-48). This process of nuclear DNA replication without subsequent mitosis and cell division is called DNA endoreduplication, and leads to increased cell size.

CDC16, CDC23 e CDC27 são todas proteínas contendo repetições de tetratricopeptídeo (TPR; 34 aminoácidos de comprimento). Uma seqüência consenso mínima sugerida do motivo TPR é como segue: X3-W- X2-L-G-X2-Y-Xg-A-X3-F-X2-A-X4-P-X2, onde X é qualquer aminoácido (Lamb et ai. 1994, EMBO J 13, 4321-4328). Os resíduos consenso podem exibir degenerescência significante e pouca ou nenhuma homologia está presente em resíduos não consenso. É a hidrofobicidade e o tamanho dos resíduos consenso, ao invés de sua identidade, que parece ser de importância. Motivos TPR estão presentes em uma ampla variedade de proteínas funcionais em levedura e eucariotos superiores em mitose (incluindo os componentes de proteínas APC CDC16, CDC23 e CDC27), transcrição, processamento, importação de proteínas e neurogênese (Goebl and Yanagida 1991, Trends Biochem Sci 16, 173-177). O TPR forma uma estrutura a- helicoidal; repetições em tandem se organizam em uma estrutura super- helicoidais idealmente adequada como interfaces para reconhecimento de proteínas (Groves and Barford 1999, Curr Opin Struct Biol 9, 383-389). Dentro da a—hélice, dois domínios anfipáticos estão normalmente presentes, um na região NH2 terminal e o outro perto da região COOH terminal (Sikorski et al. 1990, Cell 60, 307-317).CDC16, CDC23 and CDC27 are all proteins containing tetratricopeptide repeats (TPR; 34 amino acids in length). A suggested minimum consensus sequence of the TPR motif is as follows: where X is any amino acid (Lamb et al.) (X3-W-X2-LG-X2-Y-Xg-A-X2-A-X4-P-X2). 1994, EMBO J 13, 4321-4328). Consensus residues may exhibit significant degeneracy and little or no homology is present in non-consensus residues. It is the hydrophobicity and size of the consensus waste, rather than its identity, that seems to be of importance. TPR motifs are present in a wide variety of yeast functional proteins and higher mitosis eukaryotes (including the APC protein components CDC16, CDC23 and CDC27), transcription, processing, protein importation and neurogenesis (Goebl and Yanagida 1991, Trends Biochem Sci 16, 173-177). TPR forms a helical structure; Tandem repeats are organized into a superhelical structure ideally suited as interfaces for protein recognition (Groves and Barford 1999, Curr Opin Struct Biol 9, 383-389). Within the α-helix, two amphipathic domains are usually present, one in the terminal NH2 region and the other near the terminal COOH region (Sikorski et al. 1990, Cell 60, 307-317).

CDC27 (também conhecido como Hobbit; outros nomes incluem CDC27, BimA, Nuc2 ou makos) foi isolado de vários organismos, incluindo Aspergillus nidulans, levedura, drosófila, humano e várias plantas (tal como Arabidopsis thaliana e Oryza sativa). O gene codificando CDC27 está presente como uma cópia única na maioria de genomas, mas duas cópias podem ser excepcionalmente encontradas dentro do mesmo genoma, por exemplo em Arabidopsis thaliana. Os dois genes codificando proteínas CDC27 foram nomeados CDC27A e CDC27B (referências MIPS At3gl6320 e At2g20000 respectivamente). Pedido de patente Internacional publicado, WOO1/02430 descreve seqüências de CDC27A (CDC27A1 e CDC27A2) e CDC27B. Também descrita neste documento é uma seqüência de aminoácidos truncada de CDC27B na qual 161 aminoácidos estão ausentes da região NH2 terminal. Referência é feita neste documento a número de acesso de GenBank AC006081 para o gene CDC27B codificando um polipeptídeo CDC27B truncado na região NH2 terminal. O documento relata a região NH2 terminal como sendo conservada em homólogos de CDC27 de diferente origem. As seqüências de CDC27 mencionadas em WO01/02430 são descritas como sendo úteis para modificar endoreduplicação.CDC27 (also known as Hobbit; other names include CDC27, BimA, Nuc2 or makos) has been isolated from various organisms including Aspergillus nidulans, yeast, drosophila, human and various plants (such as Arabidopsis thaliana and Oryza sativa). The gene encoding CDC27 is present as a single copy in most genomes, but two copies can be exceptionally found within the same genome, for example in Arabidopsis thaliana. The two genes encoding CDC27 proteins were named CDC27A and CDC27B (MIPS references At3gl6320 and At2g20000 respectively). Published International Patent Application WOO1 / 02430 describes sequences of CDC27A (CDC27A1 and CDC27A2) and CDC27B. Also described herein is a truncated CDC27B amino acid sequence in which 161 amino acids are absent from the terminal NH2 region. Reference is made herein to GenBank accession number AC006081 for the CDC27B gene encoding a truncated CDC27B polypeptide in the terminal NH2 region. The document reports the terminal NH2 region as being conserved in CDC27 homologs of different origin. The CDC27 sequences mentioned in WO01 / 02430 are described as being useful for modifying endoreduplication.

Endoreduplicação de DNA ocorre naturalmente em plantas florescendo, por exemplo durante desenvolvimento de sementes. Endoreduplicação leva a núcleos aumentados com elevado teor de DNA. Foi sugerido que o aumentado teor de DNA durante endoreduplicação pode sustentar expressão gênica aumentada durante desenvolvimento de endosperma e enchimento de sementes, uma vez que ele coincide com atividade enzimática aumentada e acumulação protéica neste momento (Kowles et al., (1992) Genet. Eng. 14:65-88). Em espécies de cereal, o endosperma celular armazena as reservas da semente durante a fase marcada por endoreduplicação. A magnitude de endoreduplicação de DNA é altamente correlacionada com peso fresco de endosperma, o que implica um importante papel de endoreduplicação de DNA na determinação de massa de endosperma (Engelen-Eigles et al. (2000) Plant Cell Environ. 23:657-663). Em milho por exemplo, o endosperma constitui 70 a 90% de massa de semente; assim, fatores que mediam desenvolvimento de endosperma em um grande grau também determinam produção de grãos de milho, através de peso de semente individual. Endoreduplicação aumentada é portanto tipicamente indicativa de biomassa de semente aumentada mas não é de maneira nenhuma relacionada a número de sementes aumentado. Fator de transcrição AT-hookDNA enduplication occurs naturally in flowering plants, for example during seed development. Endoreduplication leads to enlarged nuclei with high DNA content. It has been suggested that increased DNA content during endoreduplication may support increased gene expression during endosperm development and seed filling, since it coincides with increased enzyme activity and protein accumulation at this time (Kowles et al., (1992) Genet. Eng 14: 65-88). In cereal species, cellular endosperm stores seed reserves during the endoreduplication phase. The magnitude of DNA endoreduplication is highly correlated with fresh endosperm weight, which implies an important role of DNA endoreduplication in determining endosperm mass (Engelen-Eigles et al. (2000) Plant Cell Environ. 23: 657-663 ). In maize, for example, endosperm constitutes 70 to 90% of seed mass; Thus, factors that mediate endosperm development to a large degree also determine maize grain yield through individual seed weight. Increased enduplication is therefore typically indicative of increased seed biomass but is by no means related to increased seed number. AT-hook transcription factor

Um domínio AT-hook é encontrado em polipeptídeos pertencendo a uma família de fatores de transcrição associados com remodelagem de Cromatina. O motivo AT-hook é constituído de 13 ou mais (algumas vezes cerca de 9) aminoácidos que participam em ligação de DNA e que têm uma preferência por regiões ricas em A/T. Em Arabidopsis existem pelo menos 34 proteínas contendo domínios AT-hook. Estas proteínas compartilham homologia ao longo da maioria da seqüência, com o domínio AT-hook sendo uma região particularmente altamente conservada.An AT-hook domain is found in polypeptides belonging to a family of transcription factors associated with Chromatin remodeling. The AT-hook motif consists of 13 or more (sometimes about 9) amino acids that participate in DNA binding and have a preference for A / T-rich regions. In Arabidopsis there are at least 34 proteins containing AT-hook domains. These proteins share homology throughout most of the sequence, with the AT-hook domain being a particularly highly conserved region.

Pedido de Patente Internacional WO 2005/030966 descreve diversos fatores de transcrição vegetais compreendendo domínios AT-hook e o uso destes fatores de transcrição para produzir plantas tendo biomassa aumentada e tolerância a estresse aumentada. O pedido se relaciona a membros do ciado G1073 de fatores de transcrição e states que, "Uso de promotores tecido específicos ou induzíveis mitiga efeitos morfológicos indesejáveis que podem estar associados com superexpressão constitutiva de membros de ciado Gl073 (e.g., quando tamanho aumentado é indesejável)." Os dados fornecidos neste pedido se referem a plantas dicotiledôneas. Em contraste com estas instruções, foi verificado agora que expressão em uma planta monocotiledônea (monocotiledônea) de um ácido polinucleico codificando um fator de transcrição AT-hook compreendendo um domínio DUF296 (o qual inclui membros de ciado Gl073), gera plantas tendo pouco ou nenhum aumento em biomassa comparada com plantas de controle adequadas, independentemente de se tal expressão é dirigida por um promotor constitutivo ou de uma maneira tecido específica. Isto sugere que instruções referentes à expressão de tais fatores de transcrição em dicotiledôneas podem não ser prontamente aplicáveis para monocotiledôneas. Também foi encontrado agora que o grau ou natureza de qualquer aumento em produção de sementes obtido é dependente do promotor tecido específico usado.International Patent Application WO 2005/030966 describes various plant transcription factors comprising AT-hook domains and the use of these transcription factors to produce plants having increased biomass and increased stress tolerance. The application relates to G1073 members of transcription factors and states that, "Use of specific or inducible tissue promoters mitigates undesirable morphological effects that may be associated with constitutive overexpression of Gl073 members (eg, when increased size is undesirable). . " The data provided in this application refer to dicotyledonous plants. In contrast to these instructions, it has now been found that expression in a monocotyledonous plant of a polynucleic acid encoding an AT-hook transcription factor comprising a DUF296 domain (which includes Gl073 cedium members), generates plants having little or no increase in biomass compared with suitable control plants, regardless of whether such expression is driven by a constitutive promoter or in a tissue specific manner. This suggests that instructions regarding the expression of such transcription factors in dicotyledons may not be readily applicable for monocotyledons. It has now also been found that the degree or nature of any increase in seed yield obtained is dependent on the specific tissue promoter used.

Fatores de transcrição DOFDOF transcription factors

Proteínas de domínio Dof são fatores de transcrição planta específicos com um domínio de ligação de DNA altamente conservado com um único dedo de zinco C2-C2. Durante a última década, numerosas proteínas de domínio Dof foram identificadas tanto em monocotiledôneas como dicotiledôneas incluindo milho, cevada, trigo, arroz, tabaco, Arabidopsis, abóbora, batata e ervilha. Proteínas de domínio Dof mostraram funcionar como ativadores ou repressores transcricionais em diversos processos biológicos planta específicos.Dof domain proteins are plant specific transcription factors with a highly conserved single-finger zinc C2-C2 DNA binding domain. Over the past decade, numerous Dof domain proteins have been identified in both monocotyledon and dicotyledonous including maize, barley, wheat, rice, tobacco, Arabidopsis, squash, potatoes, and peas. Dof domain proteins have been shown to function as transcriptional activators or repressors in various plant specific biological processes.

Inibidores de Quinase Dependentes de Ciclina (CKT)Cycline Dependent Kinase Inhibitors (CKT)

A capacidade de aumentar produção de sementes de plantas, quer através de número de sementes, biomassa de semente, desenvolvimento de semente, enchimento de semente ou qualquer outra característica relacionada a sementes teria muitas aplicações em agricultura, e mesmo muitos usos não agrícolas tal como na produção biotecnológica de substâncias tal como produtos farmacêuticos, anticorpos ou vacinas. Uma abordagem para aumentar produção de sementes em plantas pode ser através de modificação dos mecanismos de crescimento inerentes de uma planta.The ability to increase plant seed production, whether by seed number, seed biomass, seed development, seed filling or any other seed-related trait, would have many applications in agriculture, and even many non-agricultural uses as in biotechnological production of substances such as pharmaceuticals, antibodies or vaccines. One approach to increasing seed production in plants may be by modifying the inherent growth mechanisms of a plant.

Os mecanismos de crescimento inerentes de uma planta residem em uma seqüência altamente ordenada de eventos coletivamente conhecida como o 'ciclo celular'. Progressão através do ciclo celular é fundamental para o crescimento e desenvolvimento de todos os organismos multicelulares e é crucial para proliferação celular. Os principais componentes do ciclo celular são altamente conservados em levedura, mamíferos, e plantas. O ciclo celular é tipicamente dividido nas seguintes fases seqüenciais: GO - Gl — S - G2 - M. Replicação ou síntese de DNA geralmente ocorre durante a fase S ("S" é para síntese de DNA) e segregação mitótica dos cromossomos ocorre durante a fase M (o "M" é para mitose), com fases de intervalos intervenientes, Gl (durante a qual células crescem antes de replicação de DNA) e G2 (um período depois de replicação de DNA durante o qual a célula se prepara para divisão). Divisão celular é completada depois de citocinese, a última etapa da fase M. Células que saíram do ciclo celular e que se tornaram quiescentes são ditas estarem na fase GO. Células nesta fase podem ser estimuladas para manter o ciclo celular na fase Gl. O "G" em Gl, G2 e GO representa "lacuna". Conclusão do processo de ciclo celular permite que cada célula filha durante divisão celular receba uma cópia completa do genoma parental.The inherent growth mechanisms of a plant reside in a highly ordered sequence of events collectively known as the 'cell cycle'. Progression through the cell cycle is critical to the growth and development of all multicellular organisms and is crucial to cell proliferation. The major components of the cell cycle are highly conserved in yeast, mammals, and plants. The cell cycle is typically divided into the following sequential phases: GO - Gl - S - G2 - M. DNA replication or synthesis usually occurs during S phase ("S" is for DNA synthesis) and mitotic segregation of chromosomes occurs during phase M (the "M" is for mitosis), with intervening interval phases, Gl (during which cells grow before DNA replication) and G2 (a period after DNA replication during which the cell prepares for division ). Cell division is completed after cytokinesis, the last stage of the M phase. Cells that have left the cell cycle and become quiescent are said to be in the GO phase. Cells in this phase can be stimulated to maintain the cell cycle in the Gl phase. The "G" in Gl, G2 and GO represents "gap". Completion of the cell cycle process allows each daughter cell during cell division to receive a complete copy of the parental genome.

Divisão celular é controlada por dois eventos principais de ciclo celular, em outras palavras início de síntese de DNA e início de mitose. Cada transição para cada um destes eventos chave é controlada por um ponto de verificação representado por complexos protéicos específicos (envolvidos em replicação e divisão de DNA). A expressão de genes necessários para síntese de DNA no limite de Gl/S é regulada pela família E2F de fatores de transcrição em mamíferos e células vegetais (La Thangue, 1994; Muller et al., 2001; De Veylder et al., 2002). Entrada no ciclo celular é regulada/desencadeada por um complexo E2F/Rb que integra sinais e permite ativação de transcrição de genes de ciclo celular. A transição entre as diferentes fases do ciclo celular, e portanto progressão através do ciclo celular, é dirigida pela formação e ativação de diferentes proteínas quinases heterodiméricas de serina/treonina, geralmente referidas como quinases dependentes de ciclina (CDKs). Um pré-requisito para atividade destas quinases é a associação física com uma ciclina específica, o momento de ativação sendo amplamente dependente de expressão de ciclina. Ligação de ciclina induz mudanças conformacionais no lobo N-terminal do CDK associante e contribui para a localização e especificidade de substrato do complexo. CDKs monoméricos são ativados quando eles estão associados com ciclinas e assim têm uma atividade de quinase. Níveis protéicos de ciclina normalmente flutuam no ciclo celular e portanto representam um fator principal para determinar momento de ativação de CDK. A ativação periódica destes complexos contendo ciclinas e CDK durante ciclo celular media a regulação temporal de transições de ciclo celular (momentos de verificação).Cell division is controlled by two major cell cycle events, in other words beginning of DNA synthesis and beginning of mitosis. Each transition to each of these key events is controlled by a checkpoint represented by specific protein complexes (involved in DNA replication and division). Gene expression required for DNA synthesis at the Gl / S limit is regulated by the E2F family of transcription factors in mammals and plant cells (La Thangue, 1994; Muller et al., 2001; De Veylder et al., 2002) . Cell cycle entry is regulated / triggered by an E2F / Rb complex that integrates signals and enables transcription activation of cell cycle genes. The transition between the different phases of the cell cycle, and hence progression through the cell cycle, is driven by the formation and activation of different serine / threonine heterodimeric protein kinases, commonly referred to as cyclin dependent kinases (CDKs). A prerequisite for activity of these kinases is their physical association with a specific cyclin, the timing of activation being largely dependent on cyclin expression. Cyclin binding induces conformational changes in the associative CDK N-terminal lobe and contributes to the localization and substrate specificity of the complex. Monomeric CDKs are activated when they are associated with cyclins and thus have kinase activity. Cyclin protein levels typically fluctuate in the cell cycle and therefore represent a major factor in determining CDK activation timing. Periodic activation of these cyclin and CDK-containing complexes during cell cycle mediates the temporal regulation of cell cycle transitions (checkpoints).

Outros fatores regulando atividade de CDK incluem Inibidores de Quinase Dependentes de Ciclina (CKIs ou ICKs, KIPs, CIPs, INKs), quinases que ativam CDK (CAKs), uma CDK fosfatase (Cdc25) e uma subunidade de CDK (CKS) (Mironov et al. 1999; Reed 1996).Other factors regulating CDK activity include Cycline Dependent Kinase Inhibitors (CKIs or ICKs, KIPs, CIPs, INKs), CDK Activating Kinases (CAKs), a CDK Phosphatase (Cdc25), and a CDK Subunit (CKS) (Mironov et al. 1999, Reed 1996).

A existência de um inibidor de CDKs mitóticos foi inferida a partir de experimentos com endosperma de semente de milho (Grafi and Larkins (1995) Science 269, 1262-1264). Desde então, diversos CKIs foram identificados em várias espécies vegetais, tal como Arabidopsis (Wang et ai. (1997) Nature 386(6624): 451-2; De Veylder et al. (2001) Plant Cell 13: 1653-1668; Lui et al. (2000) Plant J 21: 379-385), tabaco (Jasinski et al. (2002) Plant physiol 2002 130(4): 871-82), Chenopodium rubrum (Fountain et al. (1999) Plant pH ys 120: 339) ou milho (Coelho et al. (2005) Plant physiol 138: 2323-2336). As proteínas codificadas são caracterizadas por um trecho de aproximadamente 45 aminoácidos carbóxi-terminais mostrando homologia com o domínio de ligação amino-terminal de ciclina/Cdk de CKIs animais dos tipos p21Cipl/p27Kipl/p57Kip2. For a desta região carbóxi-terminal, CKIs vegetais mostram pouca homologia.The existence of a mitotic CDK inhibitor was inferred from experiments with corn seed endosperm (Grafi and Larkins (1995) Science 269, 1262-1264). Since then, several CKIs have been identified in various plant species, such as Arabidopsis (Wang et al. (1997) Nature 386 (6624): 451-2; De Veylder et al. (2001) Plant Cell 13: 1653-1668; Lui et al. (2000) Plant J 21: 379-385), tobacco (Jasinski et al. (2002) Plant physiol 2002 130 (4): 871-82), Chenopodium rubrum (Fountain et al. (1999) Plant pH ys 120: 339) or corn (Coelho et al. (2005) Plant physiol 138: 2323-2336). The encoded proteins are characterized by a stretch of approximately 45 carboxy terminal amino acids showing homology to the cyclin / Cdk amino terminal binding domain of p21Cipl / p27Kipl / p57Kip2 animal CKIs. Outside this carboxy-terminal region, plant CKIs show little homology.

Pedido de patente Internacional publicado WO 2005/007829 no nome de Monsanto Technology LLC descreve várias moléculas de ácidos nucleicos isolados codificando polipeptídeos tendo atividade de inibidor de quinase dependente de ciclina.Published International Patent Application WO 2005/007829 in the name of Monsanto Technology LLC describes various isolated nucleic acid molecules encoding polypeptides having cyclin-dependent kinase inhibitor activity.

Pedidos de patentes Internacionais publicados, WO 02/28893 e WO 99/14331, ambos no nome de CropDesign N.V., descrevem vários Inibidores de Quinase Dependentes de Ciclina vegetais. O uso destes inibidores para aumentar produção é mencionado nestes pedidos. SUMÁRIO DA INVENÇÃOPublished International Patent Applications, WO 02/28893 and WO 99/14331, both in the name of CropDesign N.V., describe various plant Cycline Dependent Kinase Inhibitors. The use of these inhibitors to increase production is mentioned in these applications. SUMMARY OF THE INVENTION

Foi surpreendentemente verificado agora que aumentar atividade de uma proteína SYR e/ou expressão de um ácido nucleico codificando uma proteína SYR em plantas resulta em plantas tendo produção aumentada de sementes e ou taxa de crescimento aumentada, em relação a plantas tipo selvagem correspondentes. Também foi surpreendentemente verificado agora que superexpressão de SYR em camundongos aumenta primariamente produção de sementes, ao passo que biomassa de folhas e tempo de florescimento não são obviamente afetados (em contraste com os principais fenótipos de superexpressão de ARGOS em Arabidopsis, que mostraram ter biomassa de folhas aumentada e florescimento atrasado (Hu et al., Plant Cell 15, 1951-1961, 2003; US 2005/0108793)).It has now surprisingly been found that increasing activity of a SYR protein and / or expression of a nucleic acid encoding a SYR protein in plants results in plants having increased seed production and or increased growth rate relative to corresponding wild type plants. It has also been surprisingly found now that SYR overexpression in mice primarily increases seed yield, whereas leaf biomass and flowering time are obviously not affected (in contrast to the major ARGOS overexpression phenotypes in Arabidopsis, which have been shown to have biomass of increased leaves and delayed flowering (Hu et al., Plant Cell 15, 1951-1961, 2003; US 2005/0108793)).

De acordo com uma forma de realização da presente invenção é fornecido um método para aumentar produção de semente e/ou taxa de crescimento de uma planta compreendendo aumentar atividade de um polipeptídeo SYR ou um homólogo deste em uma planta e/ou expressão de um ácido nucleico codificando uma tal proteína; e opcionalmente selecionar plantas tendo características de crescimento melhoradas.According to one embodiment of the present invention there is provided a method for increasing seed production and / or growth rate of a plant comprising increasing activity of a SYR polypeptide or homologue thereof on a plant and / or expression of a nucleic acid. encoding such a protein; and optionally selecting plants having improved growth characteristics.

Vantajosamente, desempenho dos métodos da invenção na medida em que eles se relacionam a SYR, resulta em plantas tendo uma variedade de características de crescimento melhoradas, tal como produção de sementes aumentada sem efeito na biomassa de partes vegetativas de planta, quando comparada com plantas de controle correspondentes, e um ciclo de vida comparável a plantas de controle correspondentes, sem atraso em época de florescimento. Ademais vantajosamente, desempenho dos métodos de acordo com a presente invenção resulta em plantas tendo tolerância melhorada para estresse abiótico em relação a plantas tipo selvagem correspondente (ou outro controle).Advantageously, performance of the methods of the invention insofar as they relate to SYR results in plants having a variety of improved growth characteristics, such as increased seed yield without effect on plant vegetative biomass when compared to plants of matched control plants, and a comparable life cycle to matched control plants without delay in flowering season. Further advantageously, performance of the methods according to the present invention results in plants having improved tolerance for abiotic stress relative to corresponding wild type (or other control) plants.

Foi surpreendentemente verificado agora que modular atividade de uma proteína FG-GAP e/ou expressão de um ácido nucleico codificando uma proteína FG-GAP em plantas resulta em plantas tendo características de crescimento melhoradas, e em particular produção aumentada, em relação a plantas tipo selvagem correspondentes.It has now surprisingly been found that modulating activity of an FG-GAP protein and / or expression of a nucleic acid encoding an FG-GAP protein in plants results in plants having improved growth characteristics, and in particular increased yield, relative to wild type plants. corresponding.

De acordo com outra forma de realização da presente invenção é fornecido um método para melhorar características de crescimento de uma planta compreendendo modular atividade de um polipeptídeo FG-GAP ou um homólogo deste e/ou modular expressão de um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo deste em uma planta e opcionalmente selecionar plantas tendo características de crescimento melhoradas.According to another embodiment of the present invention there is provided a method for enhancing plant growth characteristics comprising modulating activity of an FG-GAP polypeptide or homologue thereof and / or modulating expression of a nucleic acid encoding an FG-GAP polypeptide or a homologue thereof on a plant and optionally select plants having improved growth characteristics.

Vantajosamente, desempenho dos métodos de acordo com a presente invenção, na medida em que eles se relacionam a um polipeptídeo FG-GAP ou um homólogo deste, resulta em plantas tendo uma variedade de características de crescimento melhoradas, tal como crescimento melhorado, produção melhorada, biomassa melhorada, arquitetura melhorada ou divisão celular melhorada, cada em relação a plantas tipo selvagem correspondentes. Preferivelmente, as características de crescimento melhoradas compreendem pelo menos produção aumentada em relação a plantas tipo selvagem correspondentes.Advantageously, performance of the methods according to the present invention, as they relate to an FG-GAP polypeptide or homologue thereof, results in plants having a variety of improved growth characteristics, such as improved growth, improved yield, improved biomass, improved architecture, or improved cell division, each relative to corresponding wild type plants. Preferably, the improved growth characteristics comprise at least increased yield over corresponding wild type plants.

Foi surpreendentemente verificado agora que aumentar expressão não constitutiva em uma planta de um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste gera plantas tendo produção aumentada em relação a plantas de controle adequadas.It has now surprisingly been found that increasing non-constitutive expression in a plant of a nucleic acid encoding a CYP90B polypeptide or a homologue thereof generates plants having increased production relative to appropriate control plants.

De acordo com uma forma de realização adicional da presente invenção, é fornecido um método para aumentar produção vegetal compreendendo aumentar expressão não constitutiva em uma planta de um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste.According to a further embodiment of the present invention, there is provided a method for enhancing plant yield comprising increasing non-constitutive expression in a plant of a nucleic acid encoding a CYP90B polypeptide or homologue thereof.

Foi verificado agora que aumentar preferencialmente expressão no tecido de meristema apical de broto de plantas de um ácido nucleico codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo gera plantas tendo número de sementes aumentado em relação a plantas de controle adequadas.It has now been found that preferentially increasing expression in plant bud apical meristem tissue of a nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the terminal NH2 region of the polypeptide generates plants having increased number of seeds relative to control plants. appropriate.

A invenção portanto fornece um método para aumentar o número de sementes de plantas em relação àquele de plantas de controle adequadas, compreendendo aumentar preferencialmente expressão em tecido de meristema apical de broto vegetal de um ácido nucleico codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo.The invention therefore provides a method for increasing the number of plant seeds over that of suitable control plants, comprising preferably increasing tissue expression of plant shoot apical meristem of a nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain. in the NH2 terminal region of the polypeptide.

Foi verificado agora que aumentar preferencialmente expressão de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 em tecido de endosperma de uma planta monocotiledônea gera plantas tendo produção aumentada de sementes em relação a plantas de controle adequadas.It has now been found that preferentially enhancing expression of a polypeptide-encoding nucleic acid comprising an AT-hook domain and a DUF296 domain in endosperm tissue of a monocotyledonous plant generates plants having increased seed yield over appropriate control plants.

Uma forma de realização adicional da presente invenção portanto fornece um método para aumentar produção de semente em plantas monocotiledôneas em relação a plantas de controle adequadas, compreendendo aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296.A further embodiment of the present invention therefore provides a method for increasing seed production in monocotyledonous plants over suitable control plants, comprising preferably increasing endosperm tissue expression of a monocotyledonous plant encoding a polypeptide domain comprising a domain. AT-hook is a DUF296 domain.

Foi verificado agora que aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF gera plantas tendo produção aumentada em relação a plantas de controle adequadas.It has now been found that increasing expression in a plant of a nucleic acid encoding a DOF transcription factor polypeptide generates plants having increased production relative to appropriate control plants.

De acordo com uma forma de realização adicional da presente invenção, é fornecido um método para aumentar produção vegetal compreendendo aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF. Foi verificado agora que redução preferencial em expressão de um gene CKI endógeno em tecido de endosperma de uma planta gera plantas com melhor produção de sementes do que produção de sementes em plantas onde não existe redução preferencial em expressão de um gene CKI endógeno em tecido de endosperma de planta. A presente invenção portanto fornece um método para aumentar produção de semente em plantas em relação a plantas de controle adequadas, compreendendo reduzir preferencialmente expressão de um gene CKI endógeno em tecido de endosperma de uma planta.According to a further embodiment of the present invention, there is provided a method for enhancing plant production comprising increasing expression in a plant of a nucleic acid encoding a DOF transcription factor polypeptide. It has now been found that preferential reduction in expression of an endogenous CKI gene in endosperm tissue of a plant generates plants with better seed yield than seed production in plants where there is no preferential reduction in expression of an endogenous CKI gene in endosperm tissue. of plant. The present invention therefore provides a method for increasing plant seed production over suitable control plants, comprising preferably reducing expression of an endogenous CKI gene in endosperm tissue of a plant.

DESCRIÇÃO DETALHADA DA INVENÇÃODETAILED DESCRIPTION OF THE INVENTION

O termo "produção aumentada" como definido neste lugar é adotado para significar um aumento em biomassa (peso) de uma ou mais partes de uma planta (particularmente partes aptas à colheita) em relação a tipo selvagem correspondente ou outras plantas de controle, cujo aumento em biomassa pode ser acima da terra ou subterrâneo. Um aumento em biomassa subterrânea pode ser devido a um aumento na biomassa de partes vegetais, tal como tubérculos, rizomas, bulbos etc. Particularmente preferido é um aumento em qualquer um ou mais dos seguintes: biomassa de raiz aumentada, volume de raiz aumentado, número de raiz aumentado, diâmetro de raiz aumentado e comprimento de raiz aumentado. O termo produção aumentado também abrange um aumento em produção de sementes.The term "increased yield" as defined herein is taken to mean an increase in biomass (weight) of one or more parts of a plant (particularly harvestable parts) relative to corresponding wild type or other control plants whose increase in biomass can be above ground or underground. An increase in underground biomass may be due to an increase in biomass of plant parts such as tubers, rhizomes, bulbs etc. Particularly preferred is an increase in any one or more of the following: increased root biomass, increased root volume, increased root number, increased root diameter, and increased root length. The term increased production also encompasses an increase in seed production.

O termo "produção aumentada de sementes" como definido neste lugar é adotado para significar um aumento em qualquer um ou mais dos seguintes, cada em relação a plantas tipo selvagem correspondentes: (i) produção total de sementes aumentada, o que inclui um aumento em biomassa de semente (peso de semente) e que pode ser um aumento no peso de semente por planta ou em uma base de semente individual; (ii) número aumentado de flores ("floretes") por panícula (iii) número aumentado de sementes cheias; (iv) tamanho de semente aumentado; (v) volume de semente aumentado; (vi) área de semente individual aumentada; (vii) comprimento e/ou largura de semente individual aumentada; (viii) índice de colheita aumentado, que é expresso como uma proporção da produção de partes aptas à colheita, tal como sementes, pela biomassa total; (ix) taxa de enchimento aumentada, (que é o número de grãos cheios dividido pelo número total de sementes e multiplicado por 100); e (x) peso de mil sementes (TKW) aumentado, que é extrapolado a partir do número de grãos cheios contado e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente aumentado e/ou peso de semente. Um TKW aumentado pode resultar de um aumento em tamanho de embrião e/ou tamanho de endosperma.The term "increased seed production" as defined herein is taken to mean an increase in any or more of the following, each relative to corresponding wild type plants: (i) increased total seed production, which includes an increase in seed biomass (seed weight) and which may be an increase in seed weight per plant or on an individual seed basis; (ii) increased number of flowers ("rapiers") per panicle (iii) increased number of full seeds; (iv) increased seed size; (v) increased seed volume; (vi) increased individual seed area; (vii) increased individual seed length and / or width; (viii) increased harvest index, which is expressed as a proportion of the production of harvestable parts, such as seeds, by total biomass; (ix) increased fill rate, (which is the number of full grains divided by the total number of seeds and multiplied by 100); and (x) increased thousand seed weight (TKW), which is extrapolated from the number of full grains counted and their total weight. An increased TKW may result from increased seed size and / or seed weight. An increased TKW may result from an increase in embryo size and / or endosperm size.

Tomando milho como um exemplo, um aumento de produção pode ser manifestado como um ou mais dos seguintes: um aumento no número de orelhas por planta, um aumento no número de fileiras, número de sementes por fileira, peso de semente, TKW, comprimento/diâmetro de espiga, entre outros. Tomando arroz como um exemplo, um aumento de produção pode ser manifestado por um aumento em um ou mais dos seguintes: número de panícuias por planta, número de espiguilhas por panícula, número de flores por panícula, aumento na taxa de enchimento de sementes, aumento em TKW, entre outros. Um aumento em produção também pode resultar em arquitetura modificada, ou pode ocorrer como um resultado de arquitetura modificada.Taking corn as an example, an increase in yield may be manifested as one or more of the following: an increase in the number of ears per plant, an increase in number of rows, number of seeds per row, seed weight, TKW, length / ear diameter, among others. Taking rice as an example, an increase in yield may be manifested by an increase in one or more of the following: number of panicuias per plant, number of spikelets per panicle, number of flowers per panicle, increase in seed fill rate, increase in TKW, among others. An increase in production may also result in modified architecture, or may occur as a result of modified architecture.

As características de crescimento melhoradas obtidas realizando os métodos da invenção, na medida em que eles se relacionam a uso de CDC27, resultam em plantas tendo número de sementes aumentado. Um número de sementes aumentado abrange um aumento no número total de sementes e/ou no número de grãos cheios e/ou um aumento na taxa de enchimento de sementes (que é o número de grãos cheios dividido pelo número total de sementes e multiplicado por 100), cada em relação a plantas de controle adequadas, cujo aumento pode ser por planta e/ou por hectare ou acre. Tomando milho como um exemplo, um aumento no número de sementes é manifestado tipicamente por um aumento no número de orelhas por planta, um aumento no número de fileiras, número de sementes por fileira, aumento na taxa de enchimento de sementes, entre outros. Tomando arroz como um exemplo, um aumento no número de sementes é manifestado tipicamente por um aumento em número de panículas por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de sementes.The improved growth characteristics obtained by carrying out the methods of the invention as they relate to the use of CDC27 result in plants having increased seed numbers. An increased seed number includes an increase in the total number of seeds and / or the number of full grains and / or an increase in the seed fill rate (which is the number of full grains divided by the total number of seeds multiplied by 100 ) each in relation to appropriate control plants, the increase of which may be per plant and / or per hectare or acre. Taking maize as an example, an increase in seed numbers is typically manifested by an increase in the number of ears per plant, an increase in number of rows, number of seeds per row, increase in seed fill rate, among others. Taking rice as an example, an increase in seed numbers is typically manifested by an increase in panicles per plant, number of spikelets per panicle, number of flowers (rapiers) per panicle (which is expressed as a proportion of the number of grains filled by the number of primary panicles), increased seed filling rate.

A invenção portanto fornece um método para aumentar o número de sementes de plantas em relação àquele de plantas de controle adequadas, compreendendo aumentar preferencialmente expressão em tecido de meristema apical de broto vegetal de um ácido nucleico codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo.The invention therefore provides a method for increasing the number of plant seeds over that of suitable control plants, comprising preferably increasing tissue expression of plant shoot apical meristem of a nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain. in the NH2 terminal region of the polypeptide.

Na medida em que os métodos da invenção se relacionam a SYR, preferivelmente desempenho dos métodos resulta em plantas tendo produção aumentada de sementes. Ainda preferivelmente, a produção aumentada de sementes compreende um aumento em um ou mais de número de grãos (cheios), peso total de semente, tamanho de semente, peso de mil sementes, taxa de enchimento e índice de colheita, cada em relação a plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar produção de sementes de planta, cujo método compreende aumentar atividade de um polipeptídeo SYR e/ou expressão em uma planta de um ácido nucleico codificando um polipeptídeo SYR ou um homólogo deste.To the extent that the methods of the invention relate to SYR, preferably performance of the methods results in plants having increased seed yield. Even more preferably, the increased seed yield comprises an increase in one or more of (full) number of grains, total seed weight, seed size, thousand seed weight, fill rate and crop index, each relative to plants. of control. Therefore, according to the present invention there is provided a method for increasing plant seed production, which method comprises increasing activity of a SYR polypeptide and / or expression in a plant of a nucleic acid encoding a SYR polypeptide or homologue thereof.

Na medida em que os métodos da invenção se relacionam a FG-GAP, preferivelmente desempenho dos métodos resulta em plantas tendo produção aumentada e, mais particularmente, biomassa aumentada e/ou produção aumentada de sementes. Preferivelmente, a produção aumentada de sementes compreende um aumento em um ou mais de número de grãos (cheios), total peso de semente, tamanho de semente, peso de mil sementes e índice de colheita, cada em relação a plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar produção vegetal, particularmente, biomassa aumentada e/ou produção aumentada de sementes, cujo método compreende modular atividade de um polipeptídeo FG-GAP e/ou expressão em uma planta de um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo deste.To the extent that the methods of the invention relate to FG-GAP, preferably performance of the methods results in plants having increased yield and, more particularly, increased biomass and / or increased seed yield. Preferably, the increased seed yield comprises an increase in one or more of (full) grain number, total seed weight, seed size, thousand seed weight and harvest index, each relative to control plants. Therefore, according to the present invention there is provided a method for increasing crop yield, particularly increased biomass and / or increased seed yield, which method comprises modulating activity of an FG-GAP polypeptide and / or expression in a plant of a nucleic acid encoding an FG-GAP polypeptide or homologue thereof.

Na medida em que os métodos da invenção se relacionam a CYP90B, preferivelmente a produção aumentada inclui um ou mais dos seguintes: HI aumentado, TKW aumentado, área de semente aumentada e comprimento de semente aumentado, cada em relação a plantas de controle adequadas. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar produção vegetal, particularmente produção de sementes, em relação a plantas de controle adequadas, cujo método compreende aumentar expressão não constitutiva em uma planta de um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste.To the extent that the methods of the invention relate to CYP90B, preferably increased yield includes one or more of the following: increased HI, increased TKW, increased seed area and increased seed length, each relative to suitable control plants. Therefore, according to the present invention there is provided a method for increasing plant yield, particularly seed yield, relative to suitable control plants, which method comprises increasing non-constitutive expression in a plant of a nucleic acid encoding a CYP90B polypeptide or a counterpart of this.

Na medida em que os métodos da invenção se relacionam a fatores de transcrição AT-hook, produção de sementes em plantas monocotiledôneas é aumentada. Portanto é fornecido um método para aumentar produção de semente em plantas monocotiledôneas em relação a plantas de controle adequadas, compreendendo aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT- hook e um domínio DUF296.As the methods of the invention relate to AT-hook transcription factors, seed production in monocotyledonous plants is increased. Therefore, a method for increasing seed production in monocotyledonous plants over suitable control plants is provided, preferably comprising increasing endosperm tissue expression of a monocotyledonous plant of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. .

Na medida em que os métodos da invenção se relacionam a fatores de transcrição DOF, preferivelmente a produção aumentada é produção aumentada de sementes. De acordo com uma característica preferida da presente invenção, é fornecido um método para aumentar produção de sementes de planta em relação à produção de sementes de plantas de controle adequadas, cujo método compreende aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF.To the extent that the methods of the invention relate to DOF transcription factors, preferably increased yield is increased seed yield. According to a preferred feature of the present invention, there is provided a method for increasing plant seed production over suitable control plant seed production, the method of which comprises increasing expression in a plant of a nucleic acid encoding a factor polypeptide. DOF transcript.

Na medida em que os métodos da invenção se relacionam a CKIs, a característica de crescimento melhorada é produção aumentada de sementes. A presente invenção portanto fornece um método para aumentar produção de semente em plantas em relação a plantas de controle adequadas, compreendendo reduzir preferencialmente expressão de um gene CKI endógeno em tecido de endosperma de uma planta.To the extent that the methods of the invention relate to CKIs, the improved growth characteristic is increased seed yield. The present invention therefore provides a method for increasing plant seed production over suitable control plants, comprising preferably reducing expression of an endogenous CKI gene in endosperm tissue of a plant.

Uma vez que as plantas melhoradas de acordo com a presente invenção têm produção aumentada (produção de sementes), é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte de seu ciclo de vida), em relação à taxa de crescimento de plantas tipo selvagem correspondentes em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes ou tipos de células de uma planta (incluindo sementes), ou pode ser ao longo de substancialmente toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta é adotado para significar o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta produziu sementes maduras secas, similar ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor precoce, taxa de crescimento, tempo de florescimento e velocidade de maturação de sementes. Um aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente todo o ciclo de vida de planta. Taxa de crescimento aumentada durante os estágios precoces no ciclo de vida de uma planta pode refletir vigor estimulado. O aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que seria de outra maneira possível. Se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura de sementes adicionais da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de arroz adicionais todas dentro de um período de crescimento convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir a semeadura adicional de sementes de espécie de planta diferente (por exemplo a semeadura e colheita de plantas de arroz seguido por, por exemplo, a semeadura e colheita opcional de soja, batatas ou qualquer outra planta adequada). Momentos adicionais de colheita do mesmo porta-enxerto no caso de algumas plantas também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento em produção de biomassa anual por acre (devido a um aumento no número de vezes (diga em um ano) que qualquer planta particular pode ser crescida e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica maior do que suas contrapartes tipo selvagem, uma vez que as limitações territoriais para crescer uma safra são freqüentemente determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de crescimento plotando experimentos de crescimento, tais parâmetros podem ser: T-Mid (the tempo levado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo levado por plantas para atingir 90% de seu tamanho máximo), entre outros. O termo "tempo de florescimento" como usado neste lugar deve significar o período de tempo entre o início de germinação de semente e o início de florescimento.Since the improved plants according to the present invention have increased yield (seed yield), it is likely that these plants will exhibit increased growth rate (over at least part of their life cycle) relative to the growth rate. corresponding wild-type plants at a corresponding stage in their life cycle. The increased growth rate may be specific to one or more parts or cell types of a plant (including seeds), or may be throughout the entire plant. Plants having an increased growth rate may have a shorter life cycle. The life cycle of a plant is adopted to mean the time required to grow from a dry mature seed to the stage where the plant produced dry mature seeds, similar to the initial material. This life cycle can be influenced by factors such as early vigor, growth rate, flowering time and seed maturation speed. An increase in growth rate can occur at one or more stages in a plant's life cycle or during substantially the entire plant life cycle. Increased growth rate during the early stages of a plant's life cycle may reflect stimulated vigor. Increasing growth rate can alter a plant's harvest cycle by allowing plants to be sown later and / or harvested earlier than otherwise possible. If the growth rate is sufficiently increased, it can allow additional seeds to be sown from the same plant species (eg sowing and harvesting rice plants followed by sowing and harvesting additional rice plants all within a conventional growing period). ). Similarly, if the growth rate is sufficiently increased, it may allow additional sowing of seeds of different plant species (for example sowing and harvesting of rice plants followed by, for example, optional sowing and harvesting of soybeans, potatoes or any other suitable plant). Additional harvest times from the same rootstock for some plants may also be possible. Changing the harvest cycle of a plant can lead to an increase in annual biomass production per acre (due to an increase in the number of times (say in a year) that any particular plant can be grown and harvested). An increase in growth rate may also allow the cultivation of transgenic plants in a larger geographical area than their wild type counterparts, as the territorial limitations to growing a crop are often determined by adverse environmental conditions or at the time of planting. early) or at the time of harvest (late cycle). Such adverse conditions can be avoided if the harvest cycle is shortened. Growth rate can be determined by deriving various parameters from growth curves by plotting growth experiments, such parameters can be: T-Mid (the time taken by plants to reach 50% of their maximum size) and T-90 (time taken by plants to reach 90% of their maximum size), among others. The term "flowering time" as used herein shall mean the time period between the onset of seed germination and the onset of flowering.

Desempenho dos métodos da invenção gera plantas tendo uma taxa de crescimento aumentada. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, cujo método compreende aumentar atividade em uma planta de um polipeptídeo SYR ou um homólogo deste e/ou expressão de um ácido nucleico codificando uma tal proteína.Performance of the methods of the invention generates plants having an increased growth rate. Therefore, according to the present invention there is provided a method for increasing plant growth rate, which method comprises increasing activity on a plant of a SYR polypeptide or homologue thereof and / or expression of a nucleic acid encoding such a protein. .

De acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, cujo método compreende modular (preferivelmente aumentar) atividade em uma planta de um polipeptídeo FG-GAP ou um homólogo deste e/ou modular (preferivelmente aumentar) expressão de um ácido nucleico codificando tal proteína.According to the present invention there is provided a method for increasing plant growth rate, which method comprises modulating (preferably increasing) activity on a plant of an FG-GAP polypeptide or a homologue thereof and / or modulating (preferably increasing) expression of a nucleic acid encoding such a protein.

De acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas cujo método compreende aumentar expressão não constitutiva em uma planta de um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste.In accordance with the present invention, there is provided a method for increasing plant growth rate which method comprises increasing non-constitutive expression in a plant of a nucleic acid encoding a CYP90B polypeptide or homologue thereof.

De acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, cujo método compreende aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF.In accordance with the present invention there is provided a method for increasing plant growth rate, which method comprises increasing expression in a plant of a nucleic acid encoding a DOF transcription factor polypeptide.

De acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas em relação a plantas de controle adequadas, cujo método compreende reduzir preferencialmente expressão de um gene endógeno de Inibidor de Quinase Dependente de Çiclina (CKI) em tecido de endosperma de uma planta.According to the present invention, there is provided a method for increasing the plant growth rate relative to suitable control plants, which method comprises preferably reducing expression of an endogenous Cyclin Dependent Kinase (CKI) Inhibitor gene in human tissue. endosperm of a plant.

Um aumento em produção e/ou produção de sementes e/ou taxa de crescimento ocorre se a planta está em condições sem estresse ou se a planta é exposta a vários estresses comparado com plantas de controle. Plantas tipicamente respondem à exposição a estresse crescendo mais lentamente. Em condições de estresse severo, a planta pode mesmo parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta na planta parando de crescer no geral sem a capacidade de reiniciar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticida) estresses severos não são freqüentemente encontrados em cultivares cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável para agricultura. Estresses brandos são os estresses típicos aos quais uma planta pode ser exposta. Estes estresses podem ser os estresses bióticos e/ou abióticos (ambientais) cotidianos aos quais uma planta é exposta. Estresses abióticos ou ambientais típicos incluem estresses por temperatura causados por calor atípico ou temperaturas frias/congelantes; estresse salino; estresse hídrico (seca ou água em excesso), estresse anaeróbico, toxicidade química e estresse oxidativo. O estresse abiótico pode ser um estresse osmótico causado por um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Produtos químicos também podem causar estresses abióticos (por exemplo concentrações muito altas ou muito baixas de minerais ou nutrientes). Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos. O termo "condições sem estresse" como usado neste lugar são aquelas condições ambientais que não vão significantemente além das condições climáticas cotidianas e outras condições abióticas que plantas podem encontrar, e que permitem crescimento ótimo da planta. Pessoas versadas na técnica têm consciência de condições de solo e condições climáticas normais para uma dada localização geográfica.An increase in seed yield and / or seed yield and / or growth rate occurs if the plant is under stress free conditions or if the plant is exposed to various stresses compared to control plants. Plants typically respond to more slowly growing stress exposure. Under conditions of severe stress, the plant may even stop growing in general. Mild stress on the other hand is defined here as any stress to which a plant is exposed that does not result in the plant stopping to grow overall without the ability to restart growth. Mild stress in the sense of the invention leads to a reduction in stressed plant growth of less than 40%, 35% or 30%, preferably less than 25%, 20% or 15%, more preferably less than 14%. %, 12%, 11% or 10% or less compared to the control plant under stress free conditions. Due to advances in agricultural practices (irrigation, fertilization, pesticide treatments) severe stresses are not often encountered in cultivated cultivars. As a consequence, compromised growth induced by mild stress is often an undesirable feature for agriculture. Mild stresses are the typical stresses to which a plant can be exposed. These stresses can be the everyday biotic and / or abiotic (environmental) stresses to which a plant is exposed. Typical abiotic or environmental stresses include temperature stresses caused by atypical heat or cold / freezing temperatures; salt stress; water stress (drought or excess water), anaerobic stress, chemical toxicity and oxidative stress. Abiotic stress can be osmotic stress caused by water stress (particularly due to drought), saline stress, oxidative stress, or ionic stress. Chemicals can also cause abiotic stresses (eg very high or very low concentrations of minerals or nutrients). Biotic stresses are typically those caused by pathogens such as bacteria, viruses, fungi and insects. The term "stress free conditions" as used herein are those environmental conditions that do not go significantly beyond the daily climatic conditions and other abiotic conditions that plants may encounter, and which allow optimal plant growth. People skilled in the art are aware of normal soil conditions and weather conditions for a given geographical location.

Na medida em que os métodos da invenção se relacionam a SYR3 desempenho dos métodos resulta em plantas tendo tolerância aumentada para estresse abiótico. Como relatado em Wang et ai. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente crescimento e produtividade vegetal. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por serem interconectados e podem induzir crescimento e lesão celular através de mecanismos similares. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando no rompimento de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse por seca pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, aumento de antioxidantes, acumulação de solutos compatíveis e interrupção de crescimento.To the extent that the methods of the invention relate to SYR3 performance of the methods results in plants having increased tolerance for abiotic stress. As reported in Wang et al. (Planta (2003) 218: 1-14), abiotic stress leads to a series of morphological, physiological, biochemical and molecular changes that adversely affect plant growth and yield. Drought, salinity, extreme temperatures and oxidative stress are known to be interconnected and can induce cell growth and damage through similar mechanisms. For example, drought and / or salinization are primarily manifested as osmotic stress, resulting in disruption of homeostasis and ionic distribution in the cell. Oxidative stress, which often accompanies high or low temperature, salinity or drought stress can cause functional and structural protein denaturation. As a consequence, these various environmental stresses often activate cellular signaling pathways and similar cellular responses, such as stress protein production, increased antioxidants, compatible solute accumulation, and growth arrest.

Uma vez que diversos estresses ambientais ativam vias similares, a exemplifícação da presente invenção com estresse por seca (na medida em que a invenção se relaciona ao uso de polipeptídeos SYR e seus ácidos nucleicos de codificação) não deve ser vista como uma limitação a estresse por seca, mas mais como uma separação para indicar o envolvimento de polipeptídeos SYR ou homólogos destes em estresses abióticos em geral. Além disso, os métodos da presente invenção podem ser realizados em condições sem estresse ou em condições de seca branda para gerar plantas tendo características de crescimento melhoradas (particularmente produção aumentada) em relação a tipo selvagem correspondente ou outras plantas de controle.Since several environmental stresses activate similar pathways, the exemplification of the present invention with drought stress (insofar as the invention relates to the use of SYR polypeptides and their coding nucleic acids) should not be construed as limiting stress by dry, but more as a separation to indicate the involvement of SYR polypeptides or homologues thereof in general abiotic stresses. In addition, the methods of the present invention may be performed under stress free conditions or under mild dry conditions to generate plants having improved growth characteristics (particularly increased yield) over corresponding wild type or other control plants.

Um grau particularmente alto de "interferência" é relatado entre estresse por seca e estresse por alta salinidade (Rabbani et ai. (2003) Plant physiol 133: 1755-1767). Portanto, seria perceptível que um polipeptídeo SYR ou um homólogo deste, junto com sua utilidade para conferir tolerância à seca em plantas, também iria encontrar uso para proteger a planta contra vários outros estresses abióticos. Similarmente, seria perceptível que uma proteína SYR (como definido neste lugar), junto com sua utilidade para conferir tolerância a sal em plantas, também iria encontrar uso para proteger a planta contra vários outros estresses abióticos. Além disso, Rabbani et ai. (2003, Plant physiol 133: 1755-1767) relatam que mecanismos moleculares de tolerância a estresse e respostas similares existem entre dicotiledôneas e monocotiledôneas. Os métodos da invenção portanto são vantajosamente aplicáveis a qualquer planta.A particularly high degree of "interference" is reported between drought stress and high salinity stress (Rabbani et al. (2003) Plant physiol 133: 1755-1767). Therefore, it would be apparent that a SYR polypeptide or a counterpart thereof, along with its usefulness in conferring drought tolerance on plants, would also find use to protect the plant against various other abiotic stresses. Similarly, it would be apparent that a SYR protein (as defined herein), along with its utility for conferring salt tolerance on plants, would also find use to protect the plant against various other abiotic stresses. In addition, Rabbani et al. (2003, Plant physiol 133: 1755-1767) report that molecular stress tolerance mechanisms and similar responses exist between dicotyledons and monocotyledons. The methods of the invention are therefore advantageously applicable to any plant.

O termo "estresse abiótico" como definido neste lugar é adotado para significar qualquer um ou mais de: estresse hídrico (devido à seca ou água em excesso), estresse anaeróbico, estresse salino, estresse por temperatura (devido a calor, frio ou temperaturas congelantes), estresse por toxicidade química e estresse oxidativo. De acordo com um aspecto da invenção, o estresse abiótico é um estresse osmótico, selecionado a partir de estresse hídrico, estresse salino, estresse oxidativo e estresse iônico. Preferivelmente, o estresse hídrico é estresse por seca. O termo estresse salino não é restrito a sal comum (NaCl), mas pode ser qualquer um ou mais de: NaCl, KCl, LiCl, MgCl2, CaCl2, entre outros.The term "abiotic stress" as defined herein is used to mean any or more of: water stress (due to drought or excess water), anaerobic stress, saline stress, temperature stress (due to heat, cold or freezing temperatures). ), chemical toxicity stress and oxidative stress. According to one aspect of the invention, abiotic stress is an osmotic stress, selected from water stress, saline stress, oxidative stress, and ionic stress. Preferably, water stress is drought stress. The term salt stress is not restricted to common salt (NaCl), but can be any or more of: NaCl, KCl, LiCl, MgCl2, CaCl2, among others.

Tolerância aumentada para estresse abiótico é manifestada por produção vegetal aumentada em condições de estresse abiótico. Na medida em que a invenção se relaciona ao uso de polipeptídeos SYR e seus ácidos nucleicos de codificação, tal produção aumentada pode incluir um ou mais dos seguintes: número aumentado de sementes cheias, produção total de sementes aumentada, número aumentado de flores por panícula, taxa aumentada de enchimento de sementes, índice de colheita aumentado, peso de mil sementes aumentado, comprimento de raiz aumentado ou diâmetro de raiz aumentado, cada em relação a plantas tipo selvagem correspondentes.Increased tolerance for abiotic stress is manifested by increased crop yield under abiotic stress conditions. To the extent that the invention relates to the use of SYR polypeptides and their encoding nucleic acids, such increased yield may include one or more of the following: increased number of full seeds, increased total seed production, increased number of flowers per panicle, increased seed filling rate, increased harvest index, increased one thousand seed weight, increased root length or increased root diameter, each relative to corresponding wild type plants.

Desempenho dos métodos da invenção gera plantas tendo tolerância aumentada para estresse abiótico. Desempenho dos métodos da invenção gera plantas crescidas em condições sem estresse ou em condições de seca branda com características de crescimento melhoradas (particularmente produção aumentada e/ou vigor de emergência aumentado (ou vigor precoce)) em relação a plantas tipo selvagem correspondentes ou outras plantas de controle crescidas em condições comparáveis.Performance of the methods of the invention generates plants having increased tolerance for abiotic stress. Performance of the methods of the invention generates plants grown under stress free conditions or under mild drought conditions with improved growth characteristics (particularly increased yield and / or increased emergency vigor (or early vigor)) over corresponding wild type plants or other plants. grown under comparable conditions.

De acordo com a presente invenção, é fornecido um método para aumentar tolerância a estresse abiótico em plantas cujo método compreende modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo SYR ou um homólogo deste. De acordo com um aspecto da invenção, o estresse abiótico é estresse osmótico, selecionado a partir de um ou mais dos seguintes: estresse hídrico, estresse salino, estresse oxidativo e estresse iônico. Preferivelmente, o estresse hídrico é estresse por seca.In accordance with the present invention, there is provided a method for increasing abiotic stress tolerance in plants whose method comprises modulating expression in a plant of a nucleic acid encoding a SYR polypeptide or homologue thereof. According to one aspect of the invention, abiotic stress is osmotic stress, selected from one or more of the following: water stress, saline stress, oxidative stress, and ionic stress. Preferably, water stress is drought stress.

A presente invenção também fornece um método para melhorar tolerância a estresse abiótico em plantas, compreendendo aumentar atividade em uma planta de uma proteína SYR ou um homólogo desta.The present invention also provides a method for improving abiotic stress tolerance in plants, comprising increasing plant activity of a SYR protein or a homologue thereof.

Na medida em que os métodos da invenção se relacionam a fatores de transcrição DOF, os métodos podem ser realizados em condições de seca branda para gerar plantas tendo produção aumentada em relação a plantas de controle adequadas. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente crescimento e produtividade vegetal. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por serem interconectados e podem induzir crescimento e lesão celular através de mecanismos similares. Rabbani et al. (Plant physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de "interferência" entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando no rompimento de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, aumento de antioxidantes, acumulação de solutos compatíveis e interrupção de crescimento.To the extent that the methods of the invention relate to DOF transcription factors, the methods may be performed under mildly dry conditions to generate plants having increased yields over suitable control plants. As reported in Wang et al. (Planta (2003) 218: 1-14), abiotic stress leads to a series of morphological, physiological, biochemical and molecular changes that adversely affect plant growth and yield. Drought, salinity, extreme temperatures and oxidative stress are known to be interconnected and can induce cell growth and damage through similar mechanisms. Rabbani et al. (Plant physiol (2003) 133: 1755-1767) describes a particularly high degree of "interference" between drought stress and high salinity stress. For example, drought and / or salinization are primarily manifested as osmotic stress, resulting in disruption of homeostasis and ionic distribution in the cell. Oxidative stress, which often accompanies high or low temperature, salinity or drought stress, can cause functional and structural protein denaturation. As a consequence, these various environmental stresses often activate cellular signaling pathways and similar cellular responses, such as stress protein production, increased antioxidants, compatible solute accumulation, and growth arrest.

Desempenho dos métodos da invenção gera plantas crescidas em condições de seca branda com produção aumentada em relação a plantas de controle adequadas crescidas em condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar produção em plantas crescidas em condições de seca branda, cujo método compreende aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF.Performance of the methods of the invention generates plants grown under mild dry conditions with increased yield over suitable control plants grown under comparable conditions. Therefore, according to the present invention there is provided a method for increasing production in plants grown under mild dry conditions, which method comprises increasing expression in a plant of a nucleic acid encoding a DOF transcription factor polypeptide.

As características de crescimento melhoradas mencionadas acima vantajosamente podem ser melhoradas em qualquer planta. Na medida em que os métodos da invenção se relacionam ao uso de fatores de transcrição AT-hook, os métodos são aplicáveis a plantas monocotiledôneas.The improved growth characteristics mentioned above can advantageously be improved on any plant. To the extent that the methods of the invention relate to the use of AT-hook transcription factors, the methods are applicable to monocotyledonous plants.

O termo "planta" como usado neste lugar abrange plantas inteiras, ancestrais e progênie das plantas e partes vegetais, incluindo sementes, brotos, caules, folhas, raízes (incluindo tubérculos), flores, e tecidos e órgãos, caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse ou a modificação genética no gene/ácido nucleico de interesse. O termo "planta" também abrange células vegetais, safras em suspensão, tecido de calo, embriões, regiões meristemáticas, gametófitos, esporófitos, pólen e micrósporos, de novo caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse.The term "plant" as used herein encompasses whole plants, ancestors and progeny of plants and plant parts, including seeds, buds, stems, leaves, roots (including tubers), flowers, and tissues and organs, characterized by the fact that each one of the above mentioned comprises the gene / nucleic acid of interest or the genetic modification in the gene / nucleic acid of interest. The term "plant" also encompasses plant cells, suspension crops, callus tissue, embryos, meristematic regions, gametophytes, sporophytes, pollen and microspores, again characterized by the fact that each of the above comprises the gene / nucleic acid of interest.

Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes de forragem, plantas ornamentais, cultivos alimentares, árvores ou arbustos selecionados a partir da lista compreendendo Acer spp., Actinidia spp., Abelmoschus spp., Agropyron spp., Allium spp., Amaranthus spp., Ananas eomosus, Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagus officinalis, Avena spp. (e.g. Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa earambola, Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassiea spp. (e.g. Brassiea napus, Brassiea rapa ssp. [canola, colza, nabo]), Cadaba farinosa, Camellia sinensis, Canna indica, Capsicum spp., Carex elata, Caricapapaya, Carissa maerocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cucurbita spp., Cucumis spp., Cynara spp., Daucus earota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospyros spp., Echinochloa spp., Elaeis (e.g. Elaeis guineensis, Elaeis oleifera), Eleusine coraeana, Eriobotrya japonica, Eugenia uniflora, Fagopyrum spp., Fagus spp., Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp. (e.g. Glycine max, Soja hispida ou Soja max), Gossypium hirsutum, Helianthus spp. (e.g. Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. (e.g. Hordeum vulgaré), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens culinaris, Linum usitatissimum, Litehi chinensis, Lotus spp., Luffa acutangula, Lupinus spp., Luzula sylvatica, Lyeopersieon spp. (e.g. Lycopersicon esculentum, Lyeopersieon lycopersicum, Lyeopersieon pyriformé), Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (e.g. Oryza sativa, Oryza latifolia), Panicum miliaceum, Passiflora edulis, Pastinaea sativa, Persea spp., Petroselinum crispum, pH aseolus spp., pH oenix spp., pH ysalis spp., Pinus spp., Pistaeia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Punica granatum, Pyrus communis, Quereus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Ricinus communis, Rubus spp., Saecharum spp., Sambucus spp., Secale cereale, Sesamum spp., Sinapis sp., Solanum spp. (e.g. Solanum tuberosum, Solanum integrifolium ou Solanum lycopersieum), Sorghum bicolor, Spinacia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Triticum spp. (e.g. Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum ou Triticum vulgaré), Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Vicia spp., Vigna spp., Viola odor ata, Vitis spp., Zea mays, Zizania palustris, Ziziphus spp., entre outros.Plants which are particularly useful in the methods of the invention include all plants belonging to the Viridiplantae superfamily, in particular monocotyledonous and dicotyledonous plants including fodder or forage vegetables, ornamental plants, food crops, trees or shrubs selected from the list comprising Acer spp. , Actinidia spp., Abelmoschus spp., Agropyron spp., Allium spp., Amaranthus spp., Ananas eomosus, Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagus officinalis, Avena spp. (e.g. Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa earambola, Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassiea spp. (eg Brassiea napus, Brassiea rapa ssp. [canola, rapeseed, turnip]), Cadaba farinosa, Camellia sinensis, Canna indica, Capsicum spp. Carex elata, Caricapapaya, Carissa maerocarpa, Carya spp., Carthamus tinctorius, Castanea spp. Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cucurbita spp. Cynara spp., Daucus earota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospyros spp., Echinochloa spp., Elaeis (eg Elaeis guineensis, Elaeis oleifera), Eleusine korea Fagus spp., Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp. (e.g. Glycine max, Soya hispida or Soy max), Gossypium hirsutum, Helianthus spp. (e.g. Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. (e.g. Hordeum vulgaré), Ipomoea potatoes, Juglans spp., Lactuca sativa, Lathyrus spp., Lens culinaris, Linum usitatissimum, Litehi chinensis, Lotus spp., Luffa acutangula, Lupinus spp., Luzula sylvatica, Lyeopersieon spp. (eg Lycopersicon esculentum, Lyeopersieon lycopersicum, Lyeopersieon pyriformé), Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Maniif spp., Manilhotara spp. , Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (eg Oryza sativa, Oryza latifolia), Panicum miliaceum, Passiflora edulis, Pastinaea sativa, Persea spp., Petroselinum crispum, pH aseolus spp., pH ysalis spp., Pinus spp., Pistaeia vera, Pisum spp. , Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Punica granatum, Pyrus communis, Quereus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Ricinus communis, Rubus spp., Saecharum spp. ., Sambucus spp., Secale cereale, Sesamum spp., Sinapis sp., Solanum spp. (e.g. Solanum tuberosum, Solanum integrifolium or Solanum lycopersieum), Sorghum bicolor, Spinacia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Triticum spp. (eg Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum or Triticum vulgaré), Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Vicia spp. Zea mays, Zizania palustris, Ziziphus spp., Among others.

Preferivelmente, a planta é uma planta cultivável tal como soja, girassol, canola, alfafa, colza, algodão, tomate, batata ou tabaco. Ainda preferivelmente, a planta é uma planta monocotiledônea, tal como cana-de- açúcar. Mais preferivelmente a planta é um cereal, tal como arroz, milho, trigo, cevada, milheto, centeio, sorgo ou aveia.Preferably, the plant is a cultivable plant such as soybean, sunflower, canola, alfalfa, rapeseed, cotton, tomato, potato or tobacco. Even more preferably, the plant is a monocot plant, such as sugar cane. More preferably the plant is a cereal, such as rice, corn, wheat, barley, millet, rye, sorghum or oats.

Onde os métodos da invenção se relacionam a uso de um fator de transcrição AT-hook, a planta monocotiledônea é um cereal, tal como arroz, milho, cana-de-açúcar, trigo, cevada, milheto, centeio, sorgo, gramíneas ou aveia.Where the methods of the invention relate to the use of an AT-hook transcription factor, the monocot plant is a cereal such as rice, corn, sugar cane, wheat, barley, millet, rye, sorghum, grass or oats. .

DEFINIÇÕESDEFINITIONS

Polipeptídeo Os termos "polipeptídeo" e "proteína" são usados permutavelmente neste lugar e se referem a aminoácidos em uma forma polimérica de qualquer comprimento. Os termos "polinucleotídeo(s)", "seqüência(s) de ácidos nucleicos", "seqüência(s) de nucleotídeos" são usados permutavelmente neste lugar e se referem a nucleotídeos, ou ribonucleotídeos ou desoxirribonucleotídeos ou uma combinação de ambos, em uma forma polimérica de qualquer comprimento.Polypeptide The terms "polypeptide" and "protein" are used interchangeably herein and refer to amino acids in a polymeric form of any length. The terms "polynucleotide (s)", "nucleic acid sequence (s)", "nucleotide sequence (s)" are used interchangeably herein and refer to nucleotides, or ribonucleotides or deoxyribonucleotides or a combination of both, in a polymeric form of any length.

Planta de ControleControl Plant

A escolha de plantas de controle adequadas é uma parte de rotina de uma estrutura experimental e pode incluir plantas tipo selvagem correspondentes ou plantas correspondentes sem o gene de interesse. A planta de controle é tipicamente da mesma espécie de planta ou mesmo a mesma variedade do que a planta a ser verificada. A planta de controle também pode ser um nulizigoto da planta a ser verificada. Uma "planta de controle" como usado neste lugar se refere não apenas a plantas inteiras, mas também a partes vegetais, incluindo sementes e partes de sementes.The choice of suitable control plants is a routine part of an experimental structure and may include corresponding wild type plants or corresponding plants without the gene of interest. The control plant is typically of the same plant species or even the same variety as the plant to be verified. The control plant can also be a nullizigote of the plant to be verified. A "control plant" as used herein refers not only to whole plants, but also to plant parts, including seeds and parts of seeds.

Aumento, MelhoraIncrease, Improve

Os termos "aumento", "melhorando" ou "melhora" são usados permutavelmente neste lugar e são adotados para significar pelo menos a 5%, 6%, 7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, mais preferivelmente 25%, 30%, 35% ou 40% mais de produção e/ou crescimento em comparação com tipo selvagem correspondente ou outras plantas de controle como definido neste lugar.The terms "increase", "improving" or "improvement" are used interchangeably here and are adopted to mean at least 5%, 6%, 7%, 8%, 9% or 10%, preferably at least 15% or 20%, more preferably 25%, 30%, 35% or 40% more production and / or growth compared to corresponding wild type or other control plants as defined herein.

HibridizaçãoHybridization

O termo "hibridização" como definido neste lugar é um processo caracterizado pelo fato de que seqüências de nucleotídeos complementares substancialmente homólogas se anelam uma a outra. O processo de hibridização pode ocorrer inteiramente em solução, i.e. ambos ácidos nucleicos complementares estão em solução. O processo de hibridização também pode ocorrer com um dos ácidos nucleicos complementares imobilizado a uma matriz tal como microesferas magnéticas, microesferas de Sepharose ou qualquer outra resina. O processo de hibridização além disso pode ocorrer com um dos ácidos nucleicos complementares imobilizado a um suporte sólido tal como a nitrocelulose ou membrana de náilon ou imobilizado por e.g. fotolitografía a, por exemplo, um suporte de vidro silicioso (o último conhecido como arranjos ou microarranjos de ácido nucleico ou como circuitos integrados de ácido nucleico). A fim de permitir que hibridização ocorra, as moléculas de ácidos nucleicos geralmente são termalmente ou quimicamente desnaturadas para derreter uma dupla fita em duas fitas simples e/ou para remover estruturas em grampo ou outras estruturas secundárias de ácidos nucleicos de fita simples. A estringência de hibridização é influenciada por condições tal como temperatura, concentração salina, força iônica e composição de tampão de hibridização.The term "hybridization" as defined herein is a process characterized by the fact that substantially homologous complementary nucleotide sequences anneal each other. The hybridization process may occur entirely in solution, i.e. both complementary nucleic acids are in solution. The hybridization process may also occur with one of the complementary nucleic acids immobilized to a matrix such as magnetic microspheres, Sepharose microspheres or any other resin. The hybridization process may further occur with one of the complementary nucleic acids immobilized to a solid support such as nitrocellulose or nylon membrane or immobilized by eg photolithography to, for example, a silicon glass support (the latter known as arrays or microarrays). nucleic acid or as nucleic acid integrated circuits). In order to allow hybridization to occur, nucleic acid molecules are generally thermally or chemically denatured to melt a double strand into two single strands and / or to remove staple structures or other secondary strands of single stranded nucleic acids. Hybridization stringency is influenced by conditions such as temperature, salt concentration, ionic strength and hybridization buffer composition.

"Condições de hibridização estringentes" e "condições de lavagem de hibridização estringentes" no contexto de experimentos de hibridização de ácido nucleico tal como hibridizações Southern e Northern são dependentes de seqüência e são diferentes em parâmetros ambientais diferentes. O artesão versado está ciente de vários parâmetros que podem ser alterados durante hibridização e lavagem e que irão ou manter ou mudar as condições de estringência."Stringent hybridization conditions" and "Stringent hybridization wash conditions" in the context of nucleic acid hybridization experiments such as Southern and Northern hybridizations are sequence dependent and are different in different environmental parameters. The skilled artisan is aware of various parameters which may be changed during hybridization and washing and which will either maintain or change stringency conditions.

A Tm é a temperatura em força iônica e pH definidos, ba qual 50% da seqüência alvo hibridiza com uma sonda perfeitamente compatível. A Tm é dependente das condições de solução e ad composição de base e comprimento da sonda. Por exemplo, seqüências maiores hibridizam especificamente em temperaturas superiores. A taxa máxima de hibridização é obtida a partir de cerca de 16°C até 32°C abaixo de Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsão eletrostática entre as duas fitas de ácidos nucleicos com isso promovendo formação de híbrido; este efeito é visível para concentrações de sódio de até 0,4M. Formamida reduz a temperatura de fusão de duplexes DNA-DNA e DNA-RNA com 0,6 a 0,7°C para cada formamida percentual, e adição de 50% de formamida permite que hibridização seja realizada a 30 a 45°C, embora a taxa de hibridização seja diminuída. Pareamento incorreto de bases reduz a taxa de hibridização e a estabilidade térmica dos duplexes. Em média e para sondas grandes, a Tm diminui cerca de 1°C por% de pareamento incorreto de bases. A Tm pode ser calculada usando as seguintes equações, dependendo dos tipos de híbridos:Tm is the set ion temperature and pH at which 50% of the target sequence hybridizes to a perfectly matched probe. Tm is dependent on solution conditions and ad base composition and probe length. For example, larger sequences hybridize specifically at higher temperatures. The maximum hybridization rate is obtained from about 16 ° C to 32 ° C below Tm. The presence of monovalent cations in the hybridization solution reduces electrostatic repulsion between the two nucleic acid strands thereby promoting hybrid formation; This effect is visible at sodium concentrations up to 0.4M. Formamide reduces the fusion temperature of DNA-DNA and DNA-RNA duplexes by 0.6 to 0.7 ° C for each percent formamide, and addition of 50% formamide allows hybridization to be performed at 30 to 45 ° C, although the hybridization rate is decreased. Incorrect base pairing reduces the hybridization rate and thermal stability of the duplexes. On average and for large probes, Tm decreases by about 1 ° C by% mismatch. Tm can be calculated using the following equations, depending on the types of hybrids:

• Híbridos de DNA-DNA (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):• DNA-DNA Hybrids (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):

Tm= 81,5°C+16,6xlog[Na+]a+0,41x%[G/C"b]-500x[L"c]-1-0,6lx% de formamidaTm = 81.5 ° C + 16.6xlog [Na +] at + 0.41x% [G / C "b] -500x [L" c] -1-0.61x% formamide

• Híbridos de DNA-RNA ou RNA-RNA:• DNA-RNA or RNA-RNA hybrids:

Tm= 79,8+18,5(log10[Na+]a)+0,58(%G/C"b)+11,8(%G/C"b)2-820/L"cTm = 79.8 + 18.5 (log10 [Na +] a) +0.58 (% G / C "b) + 11.8 (% G / C" b) 2-820 / L "c

• Híbridos de oligo-DNA ou oligo-RNA"d:• Oligo-DNA or oligo-RNA "d hybrids:

Para <20 nucleotídeos: Tm=2 (ln)For <20 nucleotides: Tm = 2 (ln)

Para 20-35 nucleotídeos: Tm=22 + 1,46 (ln) a ou para outro cátion monovalente, mas apenas acurado no intervalo 0,01-0,4 M.For 20-35 nucleotides: Tm = 22 + 1.46 (ln) a or for another monovalent cation, but only accurate in the range 0.01-0.4 M.

b apenas acurado para%GC no intervalo de 30% a 75%.b only accurate for% GC in the range of 30% to 75%.

c L = comprimento de duplex em pares de bases.c L = base pair duplex length.

d Oligo, oligonucleotídeo; ln, comprimento efetivo de iniciador = (no. de G/C)+(no. de A/T).d Oligo, oligonucleotide; ln, effective primer length = (G / C no.) + (A / T no.).

Nota: para cada 1% de formamida, a Tm é reduzida em cerca de 0,6 a 0,7°C, enquanto que a presença de 6M de uréia reduz a Tm em cerca de 30°CNote: for every 1% formamide, Tm is reduced by about 0.6 to 0.7 ° C, while the presence of 6M urea reduces Tm by about 30 ° C.

Especificidade de hibridização é tipicamente a função de lavagens pós-hibridização. Para remover antecedentes resultando de hibridização não específica, amostras são lavadas com soluções salinas diluídas. Fatores críticos de tais lavagens incluem a força iônica e temperatura da solução de lavagem final: quanto menor a concentração salina e maior a temperatura de lavagem, maior é a estringência da lavagem. Condições de lavagem são tipicamente realizadas em ou abaixo de estringência de hibridização. Geralmente, condições estringentes adequadas para ensaios de hibridização de ácidos nucleicos ou procedimentos de detecção de amplificação de gene são como expostos acima. Condições mais ou menos estringentes também podem ser selecionadas. Geralmente, condições de baixa estringência são selecionadas para ser cerca de 5O0C menores do que o ponto de fusão térmica (Tm) para a seqüência específica em uma força iônica e pH definidos. Condições de média estringência são quando a temperatura é 20°C abaixo de Tm, e condições de alta estringência são quando a temperatura é 10°C abaixo de Tm. Por exemplo, condições estringentes são aquelas que são pelo menos tão estringentes como, por exemplo, condições A-L; e condições de estringência reduzida são pelo menos tão estringentes como, por exemplo, condições M-R. Ligação não específica pode ser controlada usando qualquer uma das diversas técnicas conhecidas tal como, por exemplo, bloqueando a membrana com soluções contendo proteína, adições de RNA, DNA heterólogos, e SDS ao tampão de hibridização, e tratamento com Rnase.Hybridization specificity is typically the function of posthybridization washes. To remove background resulting from nonspecific hybridization, samples are washed with dilute saline. Critical factors of such washes include the ionic strength and temperature of the final wash: the lower the salt concentration and the higher the wash temperature, the greater the stringency of the wash. Washing conditions are typically performed at or below hybridization stringency. Generally, stringent conditions suitable for nucleic acid hybridization assays or gene amplification detection procedures are as set forth above. More or less stringent conditions may also be selected. Generally, low stringency conditions are selected to be about 50 ° C lower than the thermal melting point (Tm) for the specific sequence at a defined ionic strength and pH. Medium stringency conditions are when the temperature is 20 ° C below Tm, and high stringency conditions are when the temperature is 10 ° C below Tm. For example, stringent conditions are those that are at least as stringent as, for example, conditions A-L; and reduced stringency conditions are at least as stringent as, for example, M-R conditions. Non-specific binding can be controlled using any of several known techniques such as, for example, blocking the membrane with protein-containing solutions, RNA additions, heterologous DNA, and SDS to the hybridization buffer, and Rnase treatment.

Exemplos de condições de hibridização e lavagem são listados em Tabela 1:Examples of hybridization and wash conditions are listed in Table 1:

Tabela 1:Table 1:

<table>table see original document page 39</column></row><table> <table>table see original document page 40</column></row><table><table> table see original document page 39 </column> </row> <table> <table> table see original document page 40 </column> </row> <table>

* O "Comprimento de Híbrido" é o comprimento antecipado para o ácido nucleico hibridizante. Quando ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento de híbrido pode ser determinado alinhando as seqüências e identificando as regiões conservadas descritas neste lugar.* "Hybrid Length" is the anticipated length for hybridizing nucleic acid. When nucleic acids of known sequence are hybridized, the hybrid length can be determined by aligning the sequences and identifying the conserved regions described herein.

+ SSPE (lxSSPE é 0,15M de NaCl, IOmM de NaH2PO4, e l,25mM de EDTA, pH 7,4) pode ser substituído por SSC (1 *SSC é 0,15M de NaCl e 15mM de citrato de sódio) nos tampões de hibridização e lavagem; lavagens são realizadas por 15 minutos depois de hibridização estar completa. As hibridizações e lavagens podem incluir adicionalmente 5 χ de reagente de Denhardt, 0,5-1,0% de SDS, 100 μg/ml de DNA de esperma de salmão fragmentado desnaturado, 0,5% de pirofosfato de sódio, e até 50% de formamida.+ SSPE (1xSSPE is 0.15M NaCl, 10mM NaH2PO4, 1, 25mM EDTA, pH 7.4) can be replaced by SSC (1 * SSC is 0.15M NaCl and 15mM sodium citrate) in buffers. hybridization and washing; washes are performed for 15 minutes after hybridization is complete. Hybridizations and washes may additionally include 5 χ Denhardt reagent, 0.5-1.0% SDS, 100 μg / ml shredded salmon sperm DNA, 0.5% sodium pyrophosphate, and up to 50 % formamide.

* Tb-Tr: A temperatura de hibridização para híbridos antecipada para serem menores do que 50 pares de bases de comprimento deve ser 5-10°C menor do que a temperatura de fusão Tm dos híbridos; a Tm é determinada de acordo com as equações mencionadas acima.* Tb-Tr: The hybridization temperature anticipated for hybrids to be less than 50 base pairs in length must be 5-10 ° C lower than the melt temperature Tm of hybrids; Tm is determined according to the equations mentioned above.

± A presente invenção também abrange a substituição de qualquer um, ou mais parceiros de híbrido de DNA ou RNA ou com um PNA, ou um ácido nucleico modificado.The present invention also encompasses the replacement of any one or more DNA or RNA hybrid partners or a PNA, or a modified nucleic acid.

Para os propósitos de definir o nível de estringência, referência pode ser convenientemente feita a Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, New York ou to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989).For purposes of defining the stringency level, reference may conveniently be made to Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York or to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989).

Identificação por Ativação de T-DNAT-DNA Activation Identification

Identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353) envolve inserção de T-DNA, normalmente contendo um promotor (também pode ser um estimulador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb antes ou depois da região de codificação de um gene em uma configuração de forma que o promotor dirige expressão do gene dirigido. Tipicamente, regulação de expressão do gene dirigido por seu promotor natural é interrompida e o gene cai sob o controle do promotor recentemente introduzido. O promotor é tipicamente embebido em um T-DNA. Este T-DNA é aleatoriamente inserido no genoma vegetal, por exemplo, através de infecção por Agrobacterium e leva a superexpressão de genes perto do T-DNA inserido. As plantas transgênicas resultantes mostram fenótipos dominantes devido a superexpressão de genes perto do promotor introduzido. O promotor a ser introduzido pode ser qualquer promotor capaz de direcionar expressão de um gene no organismo desejado, neste caso uma planta. Por exemplo, promotores constitutivos, preferidos por tecido, preferidos por tipo celular e induzíveis são todos adequados para uso em ativação de T-DNA. TILLINGT-DNA activation identification (Hayashi et al. Science (1992) 1350-1353) involves insertion of T-DNA, usually containing a promoter (may also be a translation enhancer or intron), into the genomic region of the interest or 10 kb before or after the coding region of a gene in a configuration such that the promoter drives expression of the directed gene. Typically, expression regulation of the gene driven by its natural promoter is disrupted and the gene falls under the control of the newly introduced promoter. The promoter is typically embedded in a T-DNA. This T-DNA is randomly inserted into the plant genome, for example through Agrobacterium infection and leads to overexpression of genes near the inserted T-DNA. The resulting transgenic plants show dominant phenotypes due to overexpression of genes near the introduced promoter. The promoter to be introduced may be any promoter capable of directing expression of a gene in the desired organism, in this case a plant. For example, constitutive, tissue preferred, cell type preferred and inducible promoters are all suitable for use in T-DNA activation. TILLING

TILLING (Lesões Locais Induzidas Dirigidas em Genomas) é uma tecnologia de mutagênese útil para gerar e/ou identificar e/ou para eventualmente isolar ácidos nucleicos de variante mutagenizada. TILLING também permite seleção de plantas carregando tais variantes mutantes. Estas variantes mutantes podem ainda exibir maior atividade do que aquela exibida pelo gene em sua forma natural. TILLING combina mutagênese dê alta densidade com métodos de triagem rápida. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP and Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e combinação de indivíduos; (c) amplificação por PCR de uma região de interesse; (d) desnaturação e anelamento para permitir formação de heteroduplexes; (e) DHPLC, onde a presença de um heteroduplex em uma combinação é detectada como um pico extra no cromatograma; (f) identificação do indivíduo mutante; e (g) seqüenciamento do produto de PCR mutante. Métodos para TLLLINiG são bem conhecidos na técnica (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisto por Stemple (2004) Nat Rev Genet 5(2): 145-50).TILLING is a mutagenesis technology useful for generating and / or identifying and / or eventually isolating mutagenized variant nucleic acids. TILLING also allows selection of plants carrying such mutant variants. These mutant variants may still exhibit greater activity than that exhibited by the gene in its natural form. TILLING combines high density mutagenesis with rapid screening methods. The steps typically followed in TILLING are: (a) EMS mutagenesis (Redei GP and Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16- 82; Feldmann et al. (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez- Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) DNA preparation and combination of individuals; (c) PCR amplification of a region of interest; (d) denaturation and annealing to allow heteroduplex formation; (e) DHPLC, where the presence of a heteroduplex in a combination is detected as an extra peak in the chromatogram; (f) identification of the mutant individual; and (g) sequencing of the mutant PCR product. Methods for TLLLINiG are well known in the art (McCallum et al., (2000) Nat Biotechnol 18: 455-457; reviewed by Stemple (2004) Nat Rev Genet 5 (2): 145-50).

Mutagênese sítio dirigidaSite directed mutagenesis

Mutagênese sítio dirigida pode ser usada para gerar variantes de ácidos nucleicos SYR. Estão disponíveis diversos métodos para atingir mutagênese sítio dirigida; o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds. http://www.4ulr.com/products/currentprotocols/index.html).Site directed mutagenesis can be used to generate SYR nucleic acid variants. Several methods are available to achieve site directed mutagenesis; the most common being PCR-based methods (Current Protocols in Molecular Biology. Wiley Eds. http://www.4ulr.com/products/currentprotocols/index.html).

Mutagênese por transposonTransposon mutagenesis

Mutagênese por transposon é uma técnica de mutagênese baseada na inserção de transposons em genes, o que freqüentemente resulta em nocaute de gene. A técnica foi usada para diversas espécies de plantas, incluindo arroz (Greco et al., Plant physiol, 125, 1175-1177, 2001), milho (McCarty et al., Plant J. 44, 52-61, 2005) e Arabidopsis (Parinov and Sundaresan, Curr. Opin. Biotechnol. 11, 157-161, 2000).Transposon mutagenesis is a mutagenesis technique based on the insertion of transposons in genes, which often results in gene knockout. The technique has been used for several plant species, including rice (Greco et al., Plant physiol, 125, 1175-1177, 2001), corn (McCarty et al., Plant J. 44, 52-61, 2005) and Arabidopsis. (Parinov and Sundaresan, Curr. Opin. Biotechnol. 11, 157-161, 2000).

Evolução diretaDirect evolution

Evolução direta ou embaralhamento de gene consiste de repetições de embaralhamento de DNA seguido por triagem e/ou seleção apropriada para gerar ácidos nucleicos variantes ou porções destes, ou polipeptídeos ou homólogos destes tendo uma atividade biológica modificada (Castle et al., (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).Direct gene evolution or shuffling consists of DNA scrambling repeats followed by appropriate screening and / or selection to generate variant nucleic acids or portions thereof, or polypeptides or homologues thereof having a modified biological activity (Castle et al., (2004) Science 304 (5674): 1151-4; U.S. Patent Nos. 5,811,238 and 6,395,547).

Recombinação homólogaYear Recombination

Recombinação homóloga permite introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida. Recombinação homóloga é uma tecnologia padrão usada rotineiramente em ciências biológicas para organismos inferiores tal como levedura ou o musgo pH yscomitrella. Métodos para realizar recombinação homóloga em plantas foram descritos não apenas para plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84) mas também para cultivares, por exemplo arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida and Terada (2004) Curr Opin Biotech 15(2): 132-8). O ácido nucleico a ser dirigido (que pode ser qualquer dos ácidos nucleicos ou variantes definidos neste lugar) precisa ser dirigido para o locus gênico particular. O ácido nucleico a ser dirigido pode ser um alelo melhorado usado para substituir o gene endógeno ou pode ser introduzido em adição ao gene endógeno.Homologous recombination allows introduction into a genome of a selected nucleic acid at a defined selected position. Homologous recombination is a standard technology routinely used in the life sciences for lower organisms such as yeast or pH yscomitrella moss. Methods for performing homologous recombination on plants have been described not only for model plants (Offringa et al. (1990) EMBO J 9 (10): 3077-84) but also for cultivars, for example rice (Terada et al. (2002) Nat. Biotech 20 (10): 1030-4; Iida and Terada (2004) Curr Opin Biotech 15 (2): 132-8). The nucleic acid to be targeted (which may be any of the nucleic acids or variants defined herein) must be directed to the particular gene locus. The nucleic acid to be targeted may be an improved allele used to replace the endogenous gene or may be introduced in addition to the endogenous gene.

HomólogosCounterparts

"Homólogos" de uma proteína abrangem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições, deleções e/ou inserções de aminoácidos em relação à proteína não modificada em questão e tendo atividade biológica e funcional similar à proteína não modificada da qual eles são derivados. Para produzir tais homólogos, aminoácidos da proteína podem ser substituídos por outros aminoácidos tendo propriedades similares (tal como similar hidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ou quebrar estruturas helicoidais α ou estruturas de folha β). Tabelas de Substituição Conservativa são bem conhecidas na técnica (veja por exemplo Creighton (1984) Proteins. W.H. Freeman and Company e Tabela 2 abaixo)."Protein homologues" include peptides, oligopeptides, polypeptides, proteins and enzymes having amino acid substitutions, deletions and / or insertions with respect to the unmodified protein in question and having similar biological and functional activity to the unmodified protein from which they are derived. . To produce such homologues, amino acids of the protein may be substituted for other amino acids having similar properties (such as similar hydrophobicity, hydrophilicity, antigenicity, propensity to form or break α-helical structures or β-leaf structures). Conservative substitution tables are well known in the art (see for example Creighton (1984) Proteins. W.H. Freeman and Company and Table 2 below).

Ortólogos e ParálogosOrthologists and Paralogues

Abrangidas pelo termo "homólogos" são seqüências ortólogas e seqüências parálogas, duas formas especiais de homologia que abrangem conceitos evolutivos usados para descrever relações ancestrais de genes.Covered by the term "homologues" are orthologous sequences and paralog sequences, two special forms of homology that encompass evolutionary concepts used to describe ancestral gene relationships.

O termo "parálogos" se refere a duplicações de gene dentro do genoma de uma espécie levando a genes parálogos. Parálogos podem ser facilmente identificados realizando uma análise BLAST contra um conjunto de seqüências da mesma espécie que a seqüência de consulta.The term "paralogs" refers to gene duplications within the genome of a species leading to paralog genes. Paralogues can be easily identified by performing a BLAST analysis against a set of sequences of the same kind as the query sequence.

O termo "ortólogos" se refere a genes homólogos em organismos diferentes devido à especiação. Ortólogos em, por exemplo, espécies de plantas dicotiledôneas podem ser facilmente encontrados realizando uma assim chamada busca blast recíproca. Isto pode ser feito por um primeiro blast envolvendo sobrecarregar uma seqüência de consulta (por exemplo, SEQ ID NO: 1 ou SEQ ID NO: 2) contra qualquer banco de dados de seqüências, tal como o banco de dados de NCBI publicamente disponível que pode ser encontrado em: http://www.ncbi.nlm.nih.gov. BLASTN ou TBLASTX (usando valores pré-determinados padrão) podem ser usados quando iniciando a partir de uma seqüência de nucleotídeos e BLASTP ou TBLASTN (usando valores pré-determinados padrão) podem ser usados quando iniciando a partir de uma seqüência de proteínas. Os resultados de BLAST opcionalmente podem ser filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: 1 ou SEQ ID NO: 2 o segundo blast iria portanto ser contra seqüências de Oryza sativa). Os resultados do primeiro e segundo BLASTs são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do segundo blast é da mesma espécie de qual a seqüência de consulta é derivada; um ortólogo é identificado se um acerto de alto ranqueamento não é da mesma espécie de qual a seqüência de consulta é derivada. Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante o escore (ou em outras palavras menor a probabilidade de que o acerto seja encontrado ao acaso). Computação do valor E é bem conhecida na técnica. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos.The term "orthologs" refers to homologous genes in different organisms due to speciation. Orthologists in, for example, dicotyledonous plant species can be easily found by performing a so-called reciprocal blast search. This can be done by a first blast involving overloading a query string (for example, SEQ ID NO: 1 or SEQ ID NO: 2) against any sequence database, such as the publicly available NCBI database that can be found at: http://www.ncbi.nlm.nih.gov. BLASTN or TBLASTX (using default default values) can be used when starting from a nucleotide sequence and BLASTP or TBLASTN (using default default values) can be used when starting from a protein sequence. BLAST results can optionally be filtered. Full length sequences of either filtered or unfiltered results are then BLASTed back (according to BLAST) against sequences from the organism from which the query sequence is derived (where the query sequence is SEQ ID NO: 1 or SEQ ID NO : 2 the second blast would therefore be against Oryza sativa sequences). The results of the first and second BLASTs are then compared. A paralog is identified if a high-ranking second blast hit is of the same kind from which the query sequence is derived; An ortholog is identified if a high ranking hit is not of the same kind from which the query sequence is derived. High ranking hits are those with a low E value. The lower the E value, the more significant the score (or in other words, the lower the chance that the hit will be found at random). E-value computing is well known in the art. For large families, ClustalW can be used, followed by a neighboring tree to help visualize related gene grouping and to identify orthologs and paralogues.

Um homólogo pode estar na forma de uma "variante substitucional" de uma proteína, i.e. onde pelo menos um resíduo em uma seqüência de aminoácidos foi removido e um resíduo diferente inserido em seu lugar. Substituições de aminoácidos tipicamente são de resíduos únicos, mas podem ser agrupadas dependendo de restrições funcionais colocadas no polipeptídeo; inserções normalmente serão da ordem de cerca de 1 a 10 resíduos de aminoácidos. Preferivelmente, substituições de aminoácidos compreendem substituições conservativas de aminoácidos. Substituições menos conservativas podem ser feitas no caso das propriedades de aminoácidos mencionadas acima não serem tão críticas. Tabelas de Substituição Conservativa estão prontamente disponíveis na técnica. A Tabela abaixo fornece exemplos de substituições conservadas de aminoácidos.A homolog may be in the form of a "substitutional variant" of a protein, i.e. where at least one residue in an amino acid sequence has been removed and a different residue inserted in its place. Amino acid substitutions typically are from single residues, but may be grouped depending on functional restrictions placed on the polypeptide; Insertions will usually be on the order of about 1 to 10 amino acid residues. Preferably, amino acid substitutions comprise conservative amino acid substitutions. Less conservative substitutions may be made in case the amino acid properties mentioned above are not so critical. Conservative replacement tables are readily available in the art. The Table below provides examples of conservative amino acid substitutions.

Tabela 2: Exemplos de substituições conservadas de aminoácidos:Table 2: Examples of conserved amino acid substitutions:

<table>table see original document page 45</column></row><table><table> table see original document page 45 </column> </row> <table>

Um homólogo também pode estar na forma de uma "variante insercional" de uma proteína, i.e. onde um ou mais resíduos de aminoácidos são introduzidos em um sítio pré-determinado em uma proteína. Inserções podem compreender fusões N-terminais e/ou C-terminais assim como inserções intra-seqüência de aminoácidos únicos ou múltiplos. Geralmente, inserções dentro da seqüência de aminoácidos serão menores do que fusões N- ou C-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos de proteínas ou peptídeos de fusão N- ou C-terminais incluem o domínio de ligação ou domínio de ativação de um ativador transcricional como usado no sistema de dois híbridos de levedura, proteínas de revestimento de fago, etiqueta de (histidina)-6, etiqueta de glutationa S-transferase, proteína A, proteína de ligação de maltose, diidrofolato redutase, epítopo Etiqueta· 100, epítopo c-myc, epítopo FLAG®, IacZ, CMP (peptídeo de ligação calmodulina), epítopo HA, epítopo de proteína C e epítopo VSV.A homolog may also be in the form of an "insertional variant" of a protein, i.e. where one or more amino acid residues are introduced at a predetermined site in a protein. Insertions may comprise N-terminal and / or C-terminal fusions as well as single or multiple intra-sequence amino acid insertions. Generally, insertions within the amino acid sequence will be smaller than N- or C-terminal fusions of the order of about 1 to 10 residues. Examples of N- or C-terminal fusion proteins or peptides include the binding domain or activation domain of a transcriptional activator as used in the yeast two hybrid system, phage coat proteins, (histidine) -6 label, glutathione S-transferase tag, protein A, maltose binding protein, dihydrofolate reductase, epitope Tag · 100, c-myc epitope, FLAG® epitope, IacZ, CMP (calmodulin binding peptide), HA epitope, protein C epitope and VSV epitope.

Homólogos na forma de "variantes de deleção" de uma proteína são caracterizados pela remoção de um ou mais aminoácidos de uma proteína.Homologs in the form of "deletion variants" of a protein are characterized by the removal of one or more amino acids from a protein.

Variantes de aminoácidos de uma proteína podem ser prontamente feitos usando técnicas de peptídeo sintético bem conhecidas na técnica, tal como síntese de peptídeo em fase sólida e os semelhantes, ou por manipulações de DNA recombinante. Métodos para a manipulação de seqüências de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidos na técnica. Por exemplo, técnicas para fazer mutações por substituição em sítios pré-determinados em DNA são bem conhecidas por aqueles versados na técnica e incluem mutagênese Ml3, mutagênese in vitro T7-Gen (USB, Cleveland, OH), mutagênese sítio dirigida QuickChange (Stratagene, San Diego, CA), mutagênese sítio dirigida mediada por PCR ou outros protocolos de mutagênese sítio dirigida.Amino acid variants of a protein can be readily made using synthetic peptide techniques well known in the art, such as solid phase peptide synthesis and the like, or by recombinant DNA manipulations. Methods for manipulating DNA sequences to produce substitution, insertion, or deletion variants of a protein are well known in the art. For example, techniques for making substitution mutations at predetermined DNA sites are well known to those skilled in the art and include M13 mutagenesis, T7-Gen in vitro mutagenesis (USB, Cleveland, OH), QuickChange site-directed mutagenesis (Stratagene, San Diego, CA), PCR-mediated site-directed mutagenesis or other site-directed mutagenesis protocols.

DerivadosDerivatives

"Derivados" são polipeptídeos ou proteínas que podem compreender resíduos de aminoácidos naturalmente modificados e/ou não naturalmente modificados comparados com a seqüência de aminoácidos de uma forma naturalmente ocorrente (isto é não tendo passado por modificações pós-traducionais) da proteína, por exemplo, como apresentada em SEQ ID NO: 2. "Derivados" de uma proteína abrangem polipeptídeos ou proteínas que podem compreender resíduos de aminoácidos naturalmente ocorrentes alterados, glicosilados, acilados, prenilados ou resíduos de aminoácidos não naturalmente ocorrentes comparado com a seqüência de aminoácidos de uma forma naturalmente ocoirente do polipeptídeo. Um derivado também pode compreender um ou mais substituintes não aminoácidos comparado com a seqüência de aminoácidos da qual ele é derivado, por exemplo uma molécula repórter ou outro ligante, covalentemente ou não covalentemente ligado à seqüência de aminoácidos, tal como uma molécula repórter que é ligada para facilitar sua detecção, e resíduos de aminoácidos não naturalmente ocorrentes em relação à seqüência de aminoácidos de uma proteína não naturalmente ocorrente."Derivatives" are polypeptides or proteins which may comprise naturally modified and / or unnaturally modified amino acid residues compared to the amino acid sequence in a naturally occurring (i.e. not post-translationally modified) form of the protein, for example, as set forth in SEQ ID NO: 2. "Derivatives" of a protein encompass polypeptides or proteins which may comprise altered naturally occurring amino acid residues, glycosylated, acylated, prenylated or non-naturally occurring amino acid residues compared to the amino acid sequence of one form. naturally occuring of the polypeptide. A derivative may also comprise one or more non-amino acid substituents compared to the amino acid sequence from which it is derived, for example a reporter molecule or other linker, covalently or non-covalently linked to the amino acid sequence, such as a reporter molecule that is linked. for ease of detection, and unnaturally occurring amino acid residues relative to the amino acid sequence of a non-naturally occurring protein.

Variantes de união AlternativasAlternative union variants

O termo "variante de união alternativa" como usado neste lugar abrange variantes de uma seqüência de ácidos nucleicos nas quais íntrons e/ou éxons selecionados foram cortados, substituídos ou adicionados, ou nas quais íntrons foram encurtados ou alongados. Tais variantes serão umas nas quais a atividade biológica da proteína é mantida, o que pode ser atingido mantendo seletivamente segmentos funcionais da proteína. Tais variantes de união podem ser encontradas na natureza ou podem ser feitas pelo homem. Métodos para fazer tais variantes de união são conhecidos na técnica.The term "alternative joining variant" as used herein encompasses variants of a nucleic acid sequence in which selected introns and / or exons have been cut, substituted or added, or in which introns have been shortened or lengthened. Such variants will be ones in which the biological activity of the protein is maintained, which can be achieved by selectively maintaining functional protein segments. Such union variants may be found in nature or may be man-made. Methods for making such joint variants are known in the art.

Variante aléiicaAllelic variant

Variantes alélicas existem na natureza, e abrangido dentro dos métodos da presente invenção é o uso destes alelos naturais. Variantes alélicas abrangem Polimorflsmos de Nucleotídeos Únicos (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs normalmente é menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de seqüência em linhagens polimórficas naturalmente ocorrentes da maioria dos organismos.Allelic variants exist in nature, and encompassed within the methods of the present invention is the use of these natural alleles. Allelic variants include Single Nucleotide Polymorphisms (SNPs) as well as Small Insert / Deletion Polymorphisms (INDELs). The size of INDELs is typically less than 100 bp. SNPs and INDELs form the largest set of sequence variants in naturally occurring polymorphic strains of most organisms.

PromotorDistrict Attorney

Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e devem ser adotados em um amplo contexto para se referir a seqüências reguladoras de ácidos nucleicos capazes de efetuar expressão das seqüências aos quais eles são ligados. Abrangidas pelos termos mencionados acima são seqüências reguladoras transcricionais derivadas de um gene genômico eucariótico clássico (incluindo a caixa TATA que é requerida para iniciação acurada de transcrição, com ou sem uma seqüência de caixa CCAAT) e elementos reguladores adicionais (i.e. seqüências situadas acima dos promotores gênicos, estimuladores e silenciadores) que alteram expressão gênica em resposta a desenvolvimento e/ou estímulos externos, ou de uma maneira tecido específica. Também incluída dentro do termo é uma seqüência reguladora transcricional de um gene procariótico clássico, em cujo caso ela pode incluir uma seqüência de caixa -35 e/ou seqüências reguladoras adicionais de caixa -10. O termo "elemento regulador" também abrange uma molécula de fusão sintética ou derivado que confere, ativa ou estimula expressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão. O termo "operavelmente ligado" como usado neste lugar se refere a uma ligação funcional entre a seqüência de promotor e o gene de interesse, de forma que a seqüência de promotor é capaz de iniciar transcrição do gene de interesse.The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably herein and should be adopted in a broad context to refer to nucleic acid regulatory sequences capable of expressing the sequences to which they are linked. . Covered by the terms mentioned above are transcriptional regulatory sequences derived from a classic eukaryotic genomic gene (including the TATA box that is required for accurate transcription initiation, with or without a CCAAT box sequence) and additional regulatory elements (ie sequences above the promoters). stimulants and silencers) that alter gene expression in response to development and / or external stimuli, or in a specific tissue manner. Also included within the term is a transcriptional regulatory sequence of a classic prokaryotic gene, in which case it may include a -35 box sequence and / or additional -10 box regulatory sequences. The term "regulatory element" also encompasses a synthetic or derivative fusion molecule that confers, activates or stimulates expression of a nucleic acid molecule in a cell, tissue or organ. The term "operably linked" as used herein refers to a functional link between the promoter sequence and the gene of interest, such that the promoter sequence is capable of initiating transcription of the gene of interest.

O promotor pode ser um promotor induzível, i.e. tendo iniciação de transcrição induzida ou aumentada em resposta a um desenvolvimento, estímulo químico, ambiental ou físico.The promoter may be an inducible promoter, i.e. having induced or enhanced transcription initiation in response to a development, chemical, environmental or physical stimulus.

Um promotor preferido por tecido ou tecido específico é um que é capaz de iniciar preferencialmente transcrição em certos tecidos, tal como as folhas, raízes, tecido de semente etc, ou mesmo em células específicas.A preferred tissue or tissue specific promoter is one that is capable of preferentially initiating transcription in certain tissues, such as leaves, roots, seed tissue etc, or even specific cells.

O termo "constitutivo" como definido neste lugar se refere a um promotor que é expresso predominantemente em pelo menos um tecido ou órgão e predominantemente em qualquer estágio de vida da planta. Preferivelmente o promotor é expresso predominantemente ao longo de toda a planta.The term "constitutive" as defined herein refers to a promoter that is predominantly expressed in at least one tissue or organ and predominantly at any stage of plant life. Preferably the promoter is expressed predominantly throughout the plant.

Exemplos de outros promotores constitutivos são mostrados em Tabela 3 abaixo.Examples of other constitutive promoters are shown in Table 3 below.

Tabela 3: Exemplos de promotores constitutivosTable 3: Examples of constitutive promoters

<table>table see original document page 49</column></row><table><table> table see original document page 49 </column> </row> <table>

Tabela 4: Exemplos de promotores não constitutivosTable 4: Examples of non-constitutive promoters

<table>table see original document page 49</column></row><table> <table>table see original document page 50</column></row><table><table> table see original document page 49 </column> </row> <table> <table> table see original document page 50 </column> </row> <table>

Tabela 5: Exemplos de promotores de meristema apical de broto precoceTable 5: Examples of early sprout apical meristem promoters

<table>table see original document page 50</column></row><table><table> table see original document page 50 </column> </row> <table>

Tabela 6: Exemplos de promotores endosperma específicos para uso na presente invençãoTable 6: Examples of specific endosperm promoters for use in the present invention.

<table>table see original document page 50</column></row><table> <table>table see original document page 51</column></row><table><table> table see original document page 50 </column> </row> <table> <table> table see original document page 51 </column> </row> <table>

Tabela 7: Exemplos de promotores semente específicos para uso na presente invençãoTable 7: Examples of specific seed promoters for use in the present invention.

<table>table see original document page 51</column></row><table> <table>table see original document page 52</column></row><table><table> table see original document page 51 </column> </row> <table> <table> table see original document page 52 </column> </row> <table>

Seqüência TerminadoraTerminator Sequence

O termo "terminador" abrange a seqüência de controle que é uma seqüência de DNA na extremidade de uma unidade transcricional que sinaliza processamento 3' e poliadenilação de um transcrito primário e término de transcrição. Elementos reguladores adicionais podem incluir estimuladores transcricionais assim como traducionais. Aqueles versados na técnica estarão cientes de seqüências terminadoras e estimuladoras que podem ser adequadas para uso para realizar a invenção. Tais seqüências seriam conhecidas ou podem ser prontamente obtidas por uma pessoa versada na técnica.The term "terminator" encompasses the control sequence which is a DNA sequence at the end of a transcriptional unit that signals 3 'processing and polyadenylation of a primary transcript and transcription termination. Additional regulatory elements may include transcriptional as well as translational enhancers. Those skilled in the art will be aware of terminator and enhancer sequences that may be suitable for use in carrying out the invention. Such sequences would be known or readily obtainable by one of ordinary skill in the art.

Marcador SelecionávelSelectable Marker

O termo "gene marcador selecionável" como referido neste lugar inclui qualquer gene que confere um fenótipo em uma célula na qual ele é expresso para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com uma construção de ácidos nucleicos da invenção. Marcadores adequados podem ser selecionados a partir de marcadores que conferem resistência a antibiótico ou herbicida, que introduzem uma nova característica metabólica ou que permitem seleção visual. Exemplos de genes marcadores selecionáveis incluem genes conferindo resistência a antibióticos (tal como nptll que fosforila neomicina e canamicina, ou hpt, fosforilando higromicina), a herbicidas (por exemplo bar que fornece resistência a Basta™; aroA ou gox fornecendo resistência contra glifosato), ou genes que fornecem uma característica metabólica (tal como manA que permite que plantas usem manose como única fonte de carbono). Genes marcadores visuais resultam na formação de cor (por exemplo β- glucuronidase, GUS), luminescência (tal como luciferase) ou fluorescência (Proteína Fluorescente Verde, GFP, e derivados destas).The term "selectable marker gene" as referred to herein includes any gene that confers a phenotype on a cell in which it is expressed to facilitate identification and / or selection of cells that are transfected or transformed with a nucleic acid construct of the invention. Suitable markers can be selected from markers that confer antibiotic or herbicide resistance, introduce a new metabolic trait, or allow visual selection. Examples of selectable marker genes include genes conferring antibiotic resistance (such as npt11 which phosphorylates neomycin and kanamycin, or hpt, phosphorylating hygromycin), herbicides (e.g. bar that provides resistance to Basta ™; aroA or gox providing resistance to glyphosate), or genes that provide a metabolic trait (such as manA that allows plants to use mannose as their sole carbon source). Visual marker genes result in color formation (e.g. β-glucuronidase, GUS), luminescence (such as luciferase) or fluorescence (Green Fluorescent Protein, GFP, and derivatives thereof).

TransformaçãoTransformation

O termo "transformação" como referido neste lugar abrange a transferência de um polinucleotídeo exógeno para uma célula hospedeira, independente do método usado para transferência. Tecido vegetal capaz de subseqüente propagação clonal, quer por organogênese ou embriogênese, pode ser transformado com uma construção genética da presente invenção e uma planta inteira regenerada a partir daí. O tecido particular escolhido irá variar dependendo dos sistemas de propagação clonal disponíveis para, e melhor adequados para, a espécie particular sendo transformada. Alvos de tecido exemplares incluem discos foliares, pólen, embriões, cotilédones, hipocótilos, megagametófltos, tecido de calo, tecido meristemático existente (e.g., meristema apical, gemas axilares, e meristemas de raiz), e tecido de meristema induzido (e.g., meristema de cotilédone e meristema de hipocótilo). O polinucleotídeo pode ser transientemente ou estavelmente introduzido em uma célula hospedeira e pode ser mantido não integrado, por exemplo, como um plasmídeo. Alternativamente, ele pode ser integrado no genoma. hospedeiro A célula vegetal transformada resultante pode então ser usada para regenerar uma planta transformada de uma maneira conhecida por pessoas versadas na técnica.The term "transformation" as referred to herein encompasses the transfer of an exogenous polynucleotide to a host cell, regardless of the method used for transfer. Plant tissue capable of subsequent clonal propagation, either by organogenesis or embryogenesis, can be transformed with a genetic construct of the present invention and an entire plant regenerated therefrom. The particular tissue chosen will vary depending on the clonal propagation systems available for and best suited for the particular species being transformed. Exemplary tissue targets include leaf discs, pollen, embryos, cotyledons, hypocotyls, megagametophils, callus tissue, existing meristematic tissue (eg, apical meristem, axillary buds, and root meristems), and induced meristem tissue (eg, meristem of cotyledon and hypocotyl meristem). The polynucleotide may be transiently or stably introduced into a host cell and may be kept unintegrated, for example, as a plasmid. Alternatively, it can be integrated into the genome. host The resulting transformed plant cell can then be used to regenerate a transformed plant in a manner known to those skilled in the art.

Transformação de espécies vegetais é agora uma técnica bastante rotineira. Vantajosamente, qualquer dos diversos métodos de transformação pode ser usado para introduzir o gene de interesse em uma célula ancestral adequada. Métodos de transformação incluem o uso de lipossomos, eletroporação, produtos químicos que aumentam absorção de DNA livre, injeção do DNA diretamente na planta, bombardeamento por pistola de partícula, transformação usando vírus ou pólen e microprojeção. Métodos podem ser selecionados a partir do método de cálcio/polietilenoglicol para protoplastos (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); eletroporação de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1102); microinjeção em material vegetal (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeamento de partícula revestida de DNA ou RNA (Klein TM et al., (1987) Nature 327: 70) infecção com (não integrativa) vírus e os semelhantes. Plantas transgênicas de arroz preferivelmente são produzidas através de transformação mediada por Agrobacterium usando qualquer dos métodos bem conhecidos para transformação de arroz, tal como descrito em qualquer dos seguintes: pedido de patente Européia publicado 1198985 Al, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), cujas descrições são incorporadas por referência neste lugar como se completamente expostas. No caso de transformação de milho, o método preferido é como descrito ou em Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou Frame et al. (Plant physiol 129(1): 13-22, 2002), cujas descrições são incorporadas por referência neste lugar como se completamente expostas.Transformation of plant species is now a fairly routine technique. Advantageously any of the various transformation methods may be used to introduce the gene of interest into a suitable ancestral cell. Transformation methods include the use of liposomes, electroporation, chemicals that increase free DNA absorption, DNA injection directly into the plant, particle gun bombardment, virus or pollen transformation, and microprojection. Methods can be selected from the calcium / polyethylene glycol method for protoplasts (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); protoplast electroporation (Shillito R.D. et al. (1985) Bio / Technol 3, 1099-1102); microinjection in plant material (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); DNA or RNA coated particle bombardment (Klein TM et al., (1987) Nature 327: 70) infection with (non-integrative) viruses and the like. Transgenic rice plants are preferably produced by Agrobacterium-mediated transformation using any of the well-known rice transformation methods as described in any of the following: European Patent Application published 1198985 Al, Aldemita and Hodges (Plant 199: 612-617 , 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), the descriptions of which are incorporated by reference herein as if fully exposed. In the case of corn processing, the preferred method is as described or in Ishida et al. (Nat. Biotechnol 14 (6): 745-50, 1996) or Frame et al. (Plant physiol 129 (1): 13-22, 2002), the descriptions of which are incorporated by reference herein as if fully exposed.

Geralmente depois de transformação, células vegetais ou agrupamentos celulares são selecionados para a presença de um ou mais marcadores que são codificados por genes exprimíveis em plantas co- transferidos com o gene de interesse, seguindo o que o material transformado é regenerado em uma planta inteira.Generally after transformation, plant cells or cell clusters are selected for the presence of one or more markers that are encoded by expressible genes in plants co-transferred with the gene of interest, following which the transformed material is regenerated into an entire plant.

Seguindo transferência de DNA e regeneração, plantas putativamente transformadas podem ser avaliadas, por exemplo usando análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ambas técnicas sendo bem conhecidas por pessoas tendo habitual verso na técnica.Following DNA transfer and regeneration, putatively transformed plants can be evaluated, for example using Southern analysis, for the presence of the gene of interest, copy number and / or genomic organization. Alternatively or additionally, newly introduced DNA expression levels may be monitored using Northern and / or Western analysis, both techniques being well known to those of ordinary skill in the art.

As plantas transformadas geradas podem ser propagadas por uma variedade de maneiras, tal como por propagação clonal ou técnicas clássicas de melhoramento. Por exemplo, uma planta transformada de primeira geração (ou TI) pode ser reproduzida vegetativamente e transformantes homozigotos de segunda geração (ou T2) selecionados, e as plantas T2 podem então ser adicionalmente propagadas através de técnicas clássicas de criação.The generated transformed plants can be propagated in a variety of ways, such as by clonal propagation or classical breeding techniques. For example, a first generation (or TI) transformed plant can be vegetatively reproduced and second generation (or T2) homozygous transformants selected, and T2 plants can then be further propagated by classical breeding techniques.

Os organismos transformados gerados podem adotar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e.g., todas as células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um porta- enxerto transformado enxertado para um descendente não transformado). Regulador de Produção de Sementes (SYR) de Descrição DetalhadaGenerated transformed organisms can take a variety of forms. For example, they may be chimeras of transformed cells and untransformed cells; clonal transformants (e.g., all cells transformed to contain the expression drawer); transformed and unprocessed tissue grafts (e.g., in plants, a transformed rootstock grafted to an unprocessed offspring). Detailed Description Seed Production Regulator (SYR)

A atividade de uma proteína SYR pode ser aumentada por níveis crescentes do polipeptídeo SYR. Alternativamente, atividade também pode ser aumentada quando não existem mudanças em níveis de uma SYR, ou mesmo quando existe uma redução em níveis de uma proteína SYR. Isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo são alteradas, por exemplo, produzindo um mutante ou selecionando uma variante que é mais ativa do que o tipo selvagem.The activity of a SYR protein may be increased by increasing levels of the SYR polypeptide. Alternatively, activity may also be increased when there are no changes in levels of a SYR, or even when there is a reduction in levels of a SYR protein. This can occur when the intrinsic properties of the polypeptide are altered, for example by producing a mutant or selecting a variant that is more active than wild type.

O termo "proteína SYR ou homólogo desta" como definido neste lugar se refere a um polipeptídeo de cerca de 65 a cerca de 200 aminoácidos, compreendendo (i) um domínio rico em leucina que parece um zíper de leucina na metade C-terminal da proteína, cujo domínio rico em leucina é (ii) precedido por um tripeptídeo com a seqüência YFS (motivo conservado la, SEQ ID NO: 6), ou YFT (motivo conservado lb, SEQ ID NO: 7), ou YFG (motivo conservado lc, SEQ ID NO: 8) ou YLG (motivo conservado ld, SEQ ID NO: 9), e (iii) seguido por a motivo conservado 2 ((V/A/I)LAFMP(T/S), SEQ ID NO: 10). Preferivelmente5 o motivo conservado 2 é (A/V)LAFMP(T/S), o mais preferivelmente, o motivo conservado é VLAFMPT. A "proteína SYR ou homólogo desta" preferivelmente também tem um peptídeo de término C conservado terminando com o motivo conservado 3 (SYL ou PYL5 SEQ ID NO: 11).The term "SYR protein or homologue thereof" as defined herein refers to a polypeptide of about 65 to about 200 amino acids, comprising (i) a leucine-rich domain that looks like a leucine zipper on the C-terminal half of the protein. , whose leucine-rich domain is (ii) preceded by a tripeptide with the sequence YFS (conserved motif la, SEQ ID NO: 6), or YFT (conserved motif lb, SEQ ID NO: 7), or YFG (conserved motif lc , SEQ ID NO: 8) or YLG (conserved motif ld, SEQ ID NO: 9), and (iii) followed by the conserved motif 2 ((V / A / I) LAFMP (T / S), SEQ ID NO: 10). Preferably the conserved motif 2 is (A / V) LAFMP (T / S), most preferably the conserved motif is VLAFMPT. The "SYR protein or homologue thereof" preferably also has a conserved C-terminus peptide ending with conserved motif 3 (SYL or PYL5 SEQ ID NO: 11).

Domínio rico em leucina da proteína SYR ou seu homólogo é de cerca de 38 a 48 aminoácidos de comprimento, começando imediatamente atrás do motivo conservado 1 e parando imediatamente antes do motivo conservado 2, e compreende pelo menos 30% de leucina. O domínio rico em Leu preferivelmente tem um motivo que parece o motivo Zíper de Leucina (L-X6- L-X6-L-X6-L, caracterizado pelo fato de que X6 é uma seqüência de 6 aminoácidos consecutivos). Um exemplo preferido de uma proteína SYR é representado por SEQ ID NO: 2, uma visão geral de seus domínios é dada em Figura 1. Deve ser observado que o termo "proteína SYR ou homólogo desta" não abrange a proteína ARGOS de Arabidopsis thaliana (SEQ ID NO: 26).The leucine-rich domain of the SYR protein or homologue thereof is about 38 to 48 amino acids in length, starting just behind the conserved motif 1 and stopping just before the conserved motif 2, and comprises at least 30% leucine. The Leu-rich domain preferably has a motif resembling the Leucine Zipper motif (L-X6-L-X6-L-X6-L, characterized by the fact that X6 is a sequence of 6 consecutive amino acids). A preferred example of a SYR protein is represented by SEQ ID NO: 2, an overview of its domains is given in Figure 1. It should be noted that the term "SYR protein or homologue thereof" does not encompass Arabidopsis thaliana ARGOS protein ( SEQ ID NO: 26).

Ainda preferivelmente, proteínas SYR têm dois domínios transmembrana, com a parte N-terminal e parte C-terminal da proteína localizadas dentro e a parte entre os domínios transmembrana localizada fora.Even more preferably, SYR proteins have two transmembrane domains, with the N-terminal part and C-terminal part of the protein located within and the part between the transmembrane domains located outside.

Alternativamente, o homólogo de uma proteína SYR tem em ordem crescente de preferência pelo menos 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identidade total de seqüência com o aminoácido representado por SEQ ID NO: 2, contanto que a proteína homóloga compreenda os motivos conservados 1 (a, b, c ou d), 2 e 3, e domínio rico em leucina como descrito acima. A identidade total de seqüência é determinada usando um algoritmo de alinhamento global, tal como o algoritmo de Needleman Wunsch no programa GAP (GCG Wisconsin Package, Accelrys), preferivelmente com parâmetros padrão.Alternatively, the counterpart of a SYR protein has in ascending order preferably at least 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38 %, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71% 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88 %, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% total amino acid sequence identity represented by SEQ ID NO: 2 as long as the homologous protein comprises conserved motifs 1 (a, b, c or d), 2 and 3, and leucine rich domain as described above. Total sequence identity is determined using a global alignment algorithm, such as the Needleman Wunsch algorithm in the GCG Wisconsin Package, Accelrys (GAP) program, preferably with default parameters.

Os vários domínios estruturais em uma proteína SYR podem ser identificados usando bancos de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http://www.ebi.ac.uk/interpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R, Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), http://www.expasy.org/prosite/) ou Pfam (Bateman et al., Nucleic Acids Research 30(l):276-280 (2002), http://www.sanger.ac.uk/Software/Pfam/).The various structural domains in a SYR protein can be identified using specialized databases eg SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http: //www.ebi .ac.uk / interpro /), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Altman R, Brutlag D., Karp P., Lathrop R., Searls D., Eds., Pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids Res. 32: D134-D137, (2004), http://www.expasy.org/prosite/) or Pfam (Bateman et al., Nucleic Acids Research 30 (l): 276-280 (2002), http://www.sanger.ac. uk / Software / Pfam /).

Métodos para a busca e identificação de homólogos de SYR estariam bem dentro do âmbito de pessoas versadas na técnica. Tais métodos compreendem comparação das seqüências representadas por SEQ ID NO: 1 ou 2, em um formato legível por computador, com seqüências que estão disponíveis em bancos de dados públicos tal como MIPS (http://mips.gsf.de/), GenBank (http://www.ncbi.nlm.nih.gov/Genbank/index.html) ou Banco de Dados de Seqüência de Nucleotídeos de EMBL (http://www.ebi.ac.uk/embl/index.html), usando algoritmos bem conhecidos na técnica para o alinhamento ou comparação de seqüências, tal como GAP (Needleman and Wunsch, J. Mol. Biol. 48; 443-453 (1970)), BESTFIT (usando o algoritmo de homologia local de Smith and Waterman (Advances in Applied Mathematics 2; 482-489 (1981))), BLAST (Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J., J. Mol. Biol. 215:403-410 (1990)), FASTA e TFASTA (W. R. Pearson and D. J. Lipman Proc.Natl.Acad.Sci. USA 85:2444- 2448 (1988)). O aplicativo computacional para realizar análise BLAST está publicamente disponível através de National Centre for Biotechnology Information (NCBI).Methods for searching and identifying SYR homologs would be well within the skill of the art. Such methods include comparison of sequences represented by SEQ ID NO: 1 or 2, in a computer readable format, with sequences that are available in public databases such as MIPS (http://mips.gsf.de/), GenBank. (http://www.ncbi.nlm.nih.gov/Genbank/index.html) or EMBL Nucleotide Sequence Database (http://www.ebi.ac.uk/embl/index.html) , using algorithms well known in the art for sequence alignment or comparison, such as GAP (Needleman and Wunsch, J. Mol. Biol. 48; 443-453 (1970)), BESTFIT (using the Smith and Smith local homology algorithm). Waterman (Advances in Applied Mathematics 2; 482-489 (1981))), BLAST (Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ, J. Mol. Biol. 215: 403 -410 (1990)), FASTA and TFASTA (WR Pearson and DJ Lipman Proc.Natl.Acad.Sci. USA 85: 2444-2448 (1988)). The computer application for performing BLAST analysis is publicly available through the National Center for Biotechnology Information (NCBI).

Domínios transmembrana são de cerca de 15 a 30 aminoácidos de comprimento e normalmente são compostos de resíduos hidrofóbicos que formam uma alfa hélice. Eles normalmente são previstos na base de hidrofobicidade (por exemplo Klein et ai., Biochim. Biophys. Acta 815, 468, 1985; ou Sonnhammer et al., In J. Glasgow, T. Littlejohn, F. Major, R. Lathrop, D. Sankoff, and C. Sensen, editores, Proceedings of the Sixth International Conference on Intelligent Systems for Molecular Biology, páginas 175-182, Menlo Park, CA, 1998. AAAI Press.).Transmembrane domains are about 15 to 30 amino acids in length and are usually composed of hydrophobic residues that form an alpha helix. They are usually predicted on the basis of hydrophobicity (e.g. Klein et al., Biochim. Biophys. Acta 815, 468, 1985; or Sonnhammer et al., In J. Glasgow, T. Littlejohn, F. Major, R. Lathrop, D. Sankoff, and C. Sensen, editors, Proceedings of the Sixth International Conference on Intelligent Systems for Molecular Biology, pages 175-182, Menlo Park, CA, 1998. AAAI Press.).

Exemplos de proteínas caindo sob a definição de "polipeptídeo SYR ou um homólogo deste" são listados em Tabela A de Exemplo 1 e incluem seqüências de várias plantas monocotiledôneas, tal como arroz (SEQ ID NO: 2, SEQ ID NO: 12 e SEQ ID NO: 13), milho (SEQ ID NO: 14 e SEQ ID NO: 44), trigo (SEQ ID NO: 15), cevada (SEQ ID NO: 16), cana-de- açúcar (SEQ ID NO: 17 e SEQ ID NO: 18), sorgo (SEQ ID NO: 19); e de plantas dicotiledôneas tal como Arabidopsis (SEQ ID NO: 20 e SEQ ID NO: 21), uva (SEQ ID NO: 22), citros (SEQ ID NO: 23) ou tomate (SEQ ID NO: 24 e SEQ ID NO: 25). E contemplado que o domínio rico em Leu é importante para a função da proteína, portanto proteínas com o domínio rico em Leu mas sem os motivos conservados 1 ou 2 podem ser úteis também nos métodos da presente invenção; exemplos de tais proteínas são dados em SEQ ID NO: 34 e 35.Examples of proteins falling under the definition of "SYR polypeptide or a homologue thereof" are listed in Table A of Example 1 and include sequences from various monocot plants such as rice (SEQ ID NO: 2, SEQ ID NO: 12 and SEQ ID NO: 13), maize (SEQ ID NO: 14 and SEQ ID NO: 44), wheat (SEQ ID NO: 15), barley (SEQ ID NO: 16), sugar cane (SEQ ID NO: 17 and SEQ ID NO: 18), sorghum (SEQ ID NO: 19); and dicotyledonous plants such as Arabidopsis (SEQ ID NO: 20 and SEQ ID NO: 21), grape (SEQ ID NO: 22), citrus (SEQ ID NO: 23) or tomato (SEQ ID NO: 24 and SEQ ID NO) : 25). It is contemplated that the Leu rich domain is important for protein function, so proteins with the Leu rich domain but without the conserved motifs 1 or 2 may also be useful in the methods of the present invention; Examples of such proteins are given in SEQ ID NO: 34 and 35.

Deve ser entendido que o termo "polipeptídeo SYR ou um homólogo deste" não deve ser limitado à seqüência representada por SEQ LD NO: 2 ou aos homólogos listados como SEQ ID NO: 12 a SEQ ID NO: 25, mas que qualquer polipeptídeo de cerca de 65 a cerca de 200 aminoácidos reunindo os critérios de compreender um domínio rico em leucina como definido acima, precedido pelo motivo conservado de tripeptídeo 1 (a, b, c ou d) e seguido pelo motivo conservado 2 e preferivelmente também pelo motivo conservado 3; ou tendo pelo menos 38% de identidade de seqüência com a seqüência de SEQ ID NO: 2, pode ser adequado para uso nos métodos da invenção.It should be understood that the term "SYR polypeptide or homologue thereof" should not be limited to the sequence represented by SEQ LD NO: 2 or to homologues listed as SEQ ID NO: 12 to SEQ ID NO: 25, but that any polypeptide of about from 65 to about 200 amino acids meeting the criteria of comprising a leucine rich domain as defined above, preceded by the conserved tripeptide motif 1 (a, b, c or d) and followed by the conserved motif 2 and preferably also the conserved motif 3 ; or having at least 38% sequence identity to the sequence of SEQ ID NO: 2, may be suitable for use in the methods of the invention.

Em outra forma de realização, a presente invenção fornece uma proteína SYR selecionada a partir do grupo consistindo de:In another embodiment, the present invention provides a SYR protein selected from the group consisting of:

(a) um polipeptídeo como dado em SEQ ID NO 44,(a) a polypeptide as given in SEQ ID NO 44,

(b) um polipeptídeo com uma seqüência de aminoácidos que tem pelo menos, em ordem crescente de preferência, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência com a seqüência de aminoácidos como dada em SEQ ID NO 44,(b) a polypeptide having an amino acid sequence having at least, in ascending order of preference, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 95%, 96%, 97%, 98% or 99% sequence identity to amino acid sequence as given in SEQ ID NO 44,

(c) um derivado de uma proteína como definido em (a) ou (b).(c) a derivative of a protein as defined in (a) or (b).

A seqüência representada por SEQ ID NO: 43 era até agora desconhecida como um gene codificando SYR. Portanto é fornecida uma seqüência isolada de ácidos nucleicos compreendendo:The sequence represented by SEQ ID NO: 43 was hitherto unknown as a gene encoding SYR. Therefore an isolated nucleic acid sequence is provided comprising:

(i) uma seqüência de ácidos nucleicos representada por SEQ ID NO: 43, ou a fita complementar desta;(i) a nucleic acid sequence represented by SEQ ID NO: 43, or the complementary ribbon thereof;

(ii) uma seqüência de ácidos nucleicos codificando a seqüência de aminoácidos representada por SEQ ID NO: 44;(ii) a nucleic acid sequence encoding the amino acid sequence represented by SEQ ID NO: 44;

(iii)uma seqüência de ácidos nucleicos capaz de hibridizar (preferivelmente em condições estringentes) com uma seqüência de ácidos nucleicos de (i) ou (ii) acima, cuja seqüência hibridizante codifica preferivelmente uma proteína SYR; (iv)um ácido nucleico que é uma variante alélica para as seqüências de ácidos nucleicos de acordo com (i) ou (ii);(iii) a nucleic acid sequence capable of hybridizing (preferably under stringent conditions) to a nucleic acid sequence of (i) or (ii) above, whose hybridizing sequence preferably encodes a SYR protein; (iv) a nucleic acid which is an allelic variant for nucleic acid sequences according to (i) or (ii);

(v) um ácido nucleico que é uma variante de união para as seqüências de ácidos nucleicos de acordo com (i) ou (ii);(v) a nucleic acid which is a splice variant for nucleic acid sequences according to (i) or (ii);

(vi) uma seqüência de ácidos nucleicos que tem 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência com a seqüência definida em (i) ou (ii).(vi) a nucleic acid sequence that has 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% sequence identity with the sequence defined in (i) or (ii).

A atividade de uma proteína SYR ou homólogo desta pode ser ensaiada expressando a proteína SYR ou homólogo desta sob controle de um promotor GOS2 em Oryza sativa, o que resulta em plantas com produção aumentada de sementes sem um atraso em tempo de florescimento quando comparada com plantas tipo selvagem correspondentes. Este aumento em produção de sementes pode ser medido de diversas maneiras, por exemplo como um aumento de peso total de semente, número de grãos cheios ou índice de colheita.The activity of a SYR protein or homologue thereof can be assayed by expressing the SYR protein or homologue thereof under control of a GOS2 promoter in Oryza sativa, which results in increased seed yields without a delay in flowering time compared to plants. corresponding wild type. This increase in seed yield can be measured in a number of ways, for example as an increase in total seed weight, number of full grains or harvest index.

Uma proteína SYR ou homólogo desta é codificada por um ácido nucleico/gene SYR. Portanto o termo "ácido nucleico/gene SYR" como definido neste lugar é qualquer ácido nucleico/gene codificando uma proteína SYR ou um homólogo deste como definido acima.A SYR protein or homologue thereof is encoded by a nucleic acid / SYR gene. Therefore the term "nucleic acid / gene SYR" as defined herein is any nucleic acid / gene encoding a SYR protein or homologue thereof as defined above.

Exemplos de ácidos nucleicos SYR incluem mas não são limitados àqueles representados por qualquer um de SEQ ID NO: 1, SEQ ID NO: 27 a SEQ ID NO: 32, SEQ ID NO: 36 a 42 e SEQ ID NO: 44. Veja também a lista de ácidos nucleicos mencionados em Tabela A de Exemplo 1.Examples of SYR nucleic acids include but are not limited to those represented by any of SEQ ID NO: 1, SEQ ID NO: 27 to SEQ ID NO: 32, SEQ ID NO: 36 to 42 and SEQ ID NO: 44. See also the list of nucleic acids mentioned in Table A of Example 1.

Ácidos nucleicos /genes SYR e variantes destes podem ser adequados para praticar os métodos da invenção. Ácidos nucleicos!genes SYR variantes incluem porções de um ácido nucleico/gene SYR e/ou ácidos nucleicos capazes de hibridizar com um ácido nucleico/gene SYR.Nucleic acids / SYR genes and variants thereof may be suitable for practicing the methods of the invention. Variant SYR Nucleic Acids Genes include portions of a nucleic acid / SYR gene and / or nucleic acids capable of hybridizing to a nucleic acid / SYR gene.

O termo porção como definido neste lugar se refere a um pedaço de DNA codificando um polipeptídeo de cerca de 65 a cerca de 200 aminoácidos, compreendendo um domínio rico em leucina como definido acima, precedido pelo motivo conservado de tripeptídeo 1 (a, b, c ou d) e seguido pelo motivo conservado 2 e preferivelmente também pelo motivo conservado 3. Preferivelmente, a porção compreende um ou mais dos motivos conservados definidos acima. Uma porção pode ser preparada, por exemplo, fazendo uma ou mais deleções para um ácido nucleico SYR. As porções podem ser usadas em forma isolada ou elas podem ser fundidas a outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combina diversas atividades. Quando fundido a outras seqüências de codificação, o polipeptídeo resultante produzido em tradução pode ser maior do que aquele previsto para o fragmento SYR. Preferivelmente, a porção é uma porção de um ácido nucleico como representado por qualquer um de SEQ ID NO: 1, SEQ ID NO: 27 a SEQ ID NO: 32, SEQ ID NO: 36 a SEQ ID NO: 42 e SEQ ID NO: 44. Mais preferivelmente a porção de um ácido nucleico é como representada por SEQ ID NO: 1.The term portion as defined herein refers to a piece of DNA encoding a polypeptide of about 65 to about 200 amino acids, comprising a leucine-rich domain as defined above, preceded by the conserved tripeptide motif 1 (a, b, c or d) and followed by the conserved motif 2 and preferably also the preserved motif 3. Preferably, the portion comprises one or more of the conserved motifs defined above. A portion may be prepared, for example, by making one or more deletions for a SYR nucleic acid. The portions may be used in isolation or they may be fused to other coding (or non-coding) sequences to, for example, produce a protein that combines various activities. When fused to other coding sequences, the resulting polypeptide produced in translation may be larger than predicted for the SYR fragment. Preferably, the portion is a portion of a nucleic acid as represented by any one of SEQ ID NO: 1, SEQ ID NO: 27 to SEQ ID NO: 32, SEQ ID NO: 36 to SEQ ID NO: 42 and SEQ ID NO 44. More preferably the portion of a nucleic acid is as represented by SEQ ID NO: 1.

Outra variante de um ácido nucleico/gene SYR é um ácido nucleico capaz de hibridizar em condições de estringência reduzida, preferivelmente em condições estringentes, com um ácido nucleico/gene SYR como definido acima, cuja seqüência hibridizante codifica um polipeptídeo de cerca de 65 a cerca de 200 aminoácidos, compreendendo um domínio rico em leucina como definido acima, precedido pelo motivo conservado de tripeptídeo 1 (a, b, c ou d) e seguido pelo motivo conservado 2 e preferivelmente também pelo motivo conservado 3; ou tendo pelo menos 38% de identidade de seqüência com a seqüência de SEQ ID NO: 2.Another variant of a SYR nucleic acid / gene is a nucleic acid capable of hybridizing under reduced stringency conditions, preferably under stringent conditions, to a nucleic acid / SYR gene as defined above, whose hybridizing sequence encodes a polypeptide from about 65 to about of 200 amino acids, comprising a leucine rich domain as defined above, preceded by the conserved tripeptide motif 1 (a, b, c or d) and followed by the conserved motif 2 and preferably also by the conserved motif 3; or having at least 38% sequence identity with the sequence of SEQ ID NO: 2.

Preferivelmente, a seqüência hibridizante é um que é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 1, SEQ ID NO: 27 a SEQ ID NO: 32, SEQ ID NO: 36 a SEQ ID NO: 42 e SEQ ID NO: 44, ou com uma porção de qualquer das seqüências mencionadas acima. Mais preferivelmente a seqüência hibridizante é capaz de hibridizar com SEQ ID NO: 1. O termo "hibridização" é como definido neste lugar.Preferably, the hybridizing sequence is one that is capable of hybridizing to a nucleic acid as represented by SEQ ID NO: 1, SEQ ID NO: 27 to SEQ ID NO: 32, SEQ ID NO: 36 to SEQ ID NO: 42 and SEQ ID NO: 44, or with a portion of any of the sequences mentioned above. More preferably the hybridizing sequence is capable of hybridizing to SEQ ID NO: 1. The term "hybridization" is as defined herein.

O ácido nucleico SYR ou variante deste pode ser derivado de qualquer fonte natural ou artificial. O ácido nucleico/gene ou variante deste pode ser isolado de uma fonte microbiana, tal como levedura ou fungos, ou de uma fonte vegetal, algal ou animal (incluindo humano). Este ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana deliberada. O ácido nucleico é preferivelmente de origem vegetal, quer da mesma espécie de planta (por exemplo que aquela na qual ele é introduzido) ou quer de uma espécie diferente de planta. O ácido nucleico pode ser isolado de uma espécie monocotiledônea, preferivelmente da família Poaceae, ainda preferivelmente de Oryza sativa. Mais preferivelmente, o ácido nucleico SYR é isolado de Oryza sativa e é representado por SEQ ID NO: 1, e a seqüência de aminoácidos SYR é como representada por SEQID NO: 2.SYR nucleic acid or variant thereof may be derived from any natural or artificial source. The nucleic acid / gene or variant thereof may be isolated from a microbial source, such as yeast or fungi, or from a plant, algal or animal (including human) source. This nucleic acid may be modified from its native form in genomic composition and / or environment through deliberate human manipulation. The nucleic acid is preferably of plant origin, either from the same plant species (for example that into which it is introduced) or from a different plant species. The nucleic acid may be isolated from a monocot species, preferably from the Poaceae family, still preferably from Oryza sativa. More preferably, the nucleic acid SYR is isolated from Oryza sativa and is represented by SEQ ID NO: 1, and the amino acid sequence SYR is as represented by SEQID NO: 2.

A expressão de um ácido nucleico codificando um polipeptídeo SYR ou um homólogo deste pode ser modulada introduzindo uma modificação genética (preferivelmente no locus de um gene SYR). O locus de um gene como definido neste lugar é adotado para significar uma região genômica, a qual inclui o gene de interesse e 10 kb antes ou depois da região de codificação.Expression of a nucleic acid encoding a SYR polypeptide or homologue thereof can be modulated by introducing a genetic modification (preferably at the locus of a SYR gene). The locus of a gene as defined herein is adopted to mean a genomic region which includes the gene of interest and 10 kb before or after the coding region.

A modificação genética pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLING, mutagênese sítio dirigida, mutagênese por transposon, evolução direta e recombinação homóloga ou introduzindo e expressando em uma planta um ácido nucleico codificando um polipeptídeo SYR ou um homólogo deste. Os métodos mencionados acima são definidos neste lugar na seção intitulada "Definições". Seguindo introdução da modificação genética, segue uma etapa de selecionar para expressão modificada de um ácido nucleico codificando um polipeptídeo SYR ou um homólogo deste, cuja modificação em expressão gera plantas tendo produção aumentada de sementes.Genetic modification may be introduced, for example, by any (or more) of the following methods: T-DNA activation, TILLING, site-directed mutagenesis, transposon mutagenesis, direct evolution and homologous recombination, or by introducing and expressing in a plant a nucleic acid encoding a SYR polypeptide or homologue thereof. The methods mentioned above are defined here in the section titled "Definitions". Following introduction of genetic modification, there follows a step of selecting for modified expression of a nucleic acid encoding a SYR polypeptide or homologue thereof, whose modification in expression generates plants having increased seed production.

Ativação de T-DNA5 TILLING, mutagênese sítio dirigida, mutagênese por transposon e evolução direta são exemplos de tecnologias que possibilitam a geração de novos alelos e variantes SYR.T-DNA5 TILLING activation, site-directed mutagenesis, transposon mutagenesis, and direct evolution are examples of technologies that enable the generation of new SYR alleles and variants.

Um método preferido para introduzir uma modificação genética (que neste caso não precisa ser no locus de um gene SYR) é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídeo SYR ou um homólogo deste, como definido neste lugar. O ácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico de comprimento completo ou pode ser uma porção ou uma seqüência hibridizante como definido acima.A preferred method for introducing a genetic modification (which in this case need not be at the locus of a SYR gene) is to introduce and express into a plant a nucleic acid encoding a SYR polypeptide or homologue thereof, as defined herein. The nucleic acid to be introduced into a plant may be a full length nucleic acid or may be a hybridizing moiety or sequence as defined above.

"Homólogos" de uma proteína são definidos neste lugar na seção intitulada "Definições". O polipeptídeo SYR ou homólogo deste pode ser um derivado. Para uma definição do termo "derivado" veja a seção neste lugar intitulada "Definições"."Homologs" of a protein are defined here in the section titled "Definitions". The SYR polypeptide or homologue thereof may be a derivative. For a definition of the term "derivative" see the section in this place titled "Definitions".

O polipeptídeo SYR ou homólogo deste pode ser codificado por uma variante de união alternativa de um ácido nucleico/gene SYR. O termo "variante de união alternativa" é definido na seção "Definições". Variantes de união preferidas são variantes de união do ácido nucleico codificando um polipeptídeo de cerca de 65 a cerca de 200 aminoácidos, compreendendo um domínio rico em leucina como definido acima, precedido pelo motivo conservado de tripeptídeo 1 (a, b, c ou d) e seguido pelo motivo conservado 2 e preferivelmente também pelo motivo conservado 3; ou tendo pelo menos 38% de identidade de seqüência com a seqüência de SEQ ID NO: 2. Ainda preferidas são variantes de união representadas por SEQ ID NO: 1, SEQ ID NO: 27 a SEQ ID NO: 32, SEQ ID NO: 36 a SEQ ID NO: 42 e SEQ ID NO: 44. A mais preferida é a variante de união representada por SEQ ID NO: 1. O homólogo também pode ser codificado por uma variante alélica de um ácido nucleico codificando um polipeptídeo SYR ou um homólogo deste, preferivelmente uma variante alélica de um ácido nucleico codificando um polipeptídeo de cerca de 65 a cerca de 200 aminoácidos, compreendendo um domínio rico em leucina como definido acima, precedido pelo motivo conservado de tripeptídeo 1 (a, b, c ou d) e seguido pelo motivo conservado 2 e preferivelmente também pelo motivo conservado 3; ou tendo pelo menos 38% de identidade de seqüência com a seqüência de SEQ ID NO: 2. Ainda preferivelmente, a variante alélica codificando o polipeptídeo SYR é representada por qualquer uma de SEQ ID NO: 1, ou SEQ ID NO: 12 a SEQ ID NO: 25. Mais preferivelmente, a variante alélica codificando o polipeptídeo SYR é como representada por SEQ ID NO: 1. O termo "variante alélica" é definido na seção "Definições".The SYR polypeptide or homologue thereof can be encoded by an alternative nucleic acid / SYR gene splice variant. The term "alternate union variant" is defined in the "Definitions" section. Preferred splice variants are nucleic acid splice variants encoding a polypeptide of about 65 to about 200 amino acids, comprising a leucine-rich domain as defined above, preceded by the conserved tripeptide motif 1 (a, b, c or d) and followed by the conserved motif 2 and preferably also by the conserved motif 3; or having at least 38% sequence identity with the sequence of SEQ ID NO: 2. Still preferred are union variants represented by SEQ ID NO: 1, SEQ ID NO: 27 to SEQ ID NO: 32, SEQ ID NO: 36 to SEQ ID NO: 42 and SEQ ID NO: 44. Most preferred is the splice variant represented by SEQ ID NO: 1. The homologue may also be encoded by an allelic variant of a nucleic acid encoding a SYR polypeptide or a homologous thereof, preferably an allelic variant of a nucleic acid encoding a polypeptide of about 65 to about 200 amino acids, comprising a leucine-rich domain as defined above, preceded by the conserved tripeptide motif 1 (a, b, c or d) and followed by conserved motif 2 and preferably also by conserved motif 3; or having at least 38% sequence identity to the sequence of SEQ ID NO: 2. Still preferably, the allelic variant encoding the SYR polypeptide is represented by any one of SEQ ID NO: 1, or SEQ ID NO: 12 to SEQ. More preferably, the allelic variant encoding the SYR polypeptide is as represented by SEQ ID NO: 1. The term "allelic variant" is defined in the "Definitions" section.

De acordo com um aspecto preferido da presente invenção, expressão aumentada do ácido nucleico SYR ou variante deste é contemplada. Métodos para aumentar expressão de genes ou produtos de gene são bem documentados na técnica e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de estimuladores de transcrição ou estimuladores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou estimuladores podem ser introduzido em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico SYR ou variante deste. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte- Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene. Métodos para reduzir a expressão de genes ou produtos de gene são bem documentados na técnica. Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer outro gene eucariótico.According to a preferred aspect of the present invention, increased expression of the SYR nucleic acid or variant thereof is contemplated. Methods for enhancing gene expression or gene products are well documented in the art and include, for example, overexpression directed by appropriate promoters, the use of transcriptional enhancers or translation enhancers. Isolated nucleic acids serving as promoter or enhancer elements may be introduced at an appropriate (typically before) position in a non-heterologous form of a polynucleotide in order to enhance expression of a SYR nucleic acid or variant thereof. For example, endogenous promoters may be altered in vivo by mutation, deletion, and / or substitution (see, Kmiec, U.S. Patent No. 5,565,350; Zarling et al., PCT / US93 / 03868), or isolated promoters. be introduced into a plant cell at the appropriate orientation and distance of a gene of the present invention to control gene expression. Methods for reducing gene expression or gene products are well documented in the art. If polypeptide expression is desired, it is generally desirable to include a polyadenylation region at the 3 'end of a polynucleotide coding region. The polyadenylation region may be derived from the natural gene, a variety of other plant genes, or T-DNA. The 3 'end sequence to be added may be derived, for example, from the nopaline synthase or octopine synthase genes, or alternatively from another plant gene, or less preferably from any other eukaryotic gene.

Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citossol. Inclusão de um íntron processável na unidade de transcrição tanto em construções vegetais como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes, Buchman and Berg, Mol. Cell biol. 8:4395-4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987). Tal estimulação intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na técnica. Veja geralmente, The Maize Handbook, capítulo 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).An intronic sequence can also be added to the untranslated 5 'region or coding sequence of the partial coding sequence to increase the amount of mature message that accumulates in the cytosol. Inclusion of a processable intron in the transcriptional unit in both plant and animal constructs has been shown to increase gene expression at both mRNA and protein levels by up to 1000-fold, Buchman and Berg, Mol. Cell biol. 8: 4395-4405 (1988); Callis et al., Genes Dev. 1: 1183-1200 (1987). Such intronic stimulation of gene expression is typically greater when placed near the 5 'end of the transcription unit. Using the introns of Adhl-S 1, 2, and 6 intron maize, the Bronze-I intron are known in the art. See generally, The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.The invention also provides genetic constructs and vectors to facilitate introduction and / or expression of nucleotide sequences useful in the methods according to the invention.

Portanto, é fornecida uma construção gênica compreendendo:Therefore, a gene construct is provided comprising:

(i) um ácido nucleico SYR ou variante deste, como definido acima;(i) a nucleic acid SYR or variant thereof as defined above;

(ii) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i); e opcionalmente(ii) one or more control sequences capable of directing expression of the nucleic acid sequence of (i); and optionally

(iii) uma seqüência de término de transcrição; com a condição de que a construção gênica não compreenda uma seqüência de ácidos nucleicos codificando a proteína de SEQ ID NO: 26.(iii) a transcription termination sequence; provided that the gene construct does not comprise a nucleic acid sequence encoding the protein of SEQ ID NO: 26.

Construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando tecnologia de DNA recombinante bem conhecida por pessoas versadas na técnica. As construções gênicas podem ser inseridas em vetores, que podem estar comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas.Constructs useful in the methods according to the present invention may be constructed using recombinant DNA technology well known to those skilled in the art. Gene constructs may be inserted into commercially available vectors suitable for plant transformation and suitable for expression of the gene of interest in transformed cells.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo SYR ou homólogo deste). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e são definidos neste lugar na seção intitulada "Definições".Plants are transformed with a vector comprising the sequence of interest (i.e., a nucleic acid encoding a SYR polypeptide or homologue thereof). The sequence of interest is operably linked to one or more control sequences (at least one promoter). The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably in this place and are defined here in the section titled "Definitions".

Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão da seqüência de ácidos nucleicos. Preferivelmente, o ácido nucleico SYR ou variante funcional deste é operavelmente ligado a um promotor constitutivo. Preferivelmente, o promotor constitutivo capaz de expressar preferencialmente o ácido nucleico ao longo de toda a planta tem um perfil de expressão comparável a um promotor GOS2. Mais preferivelmente, o promotor constitutivo tem o mesmo perfil de expressão do que o promotor GOS2 de arroz, o mais preferivelmente, o promotor capaz de expressar preferencialmente o ácido nucleico ao longo de toda a planta é o promotor GOS2 de arroz (SEQ ID NO: 5).Advantageously, any type of promoter may be used to direct expression of the nucleic acid sequence. Preferably, the SYR nucleic acid or functional variant thereof is operably linked to a constitutive promoter. Preferably, the constitutive promoter capable of preferentially expressing nucleic acid throughout the plant has an expression profile comparable to a GOS2 promoter. More preferably, the constitutive promoter has the same expression profile as the rice GOS2 promoter, most preferably, the promoter capable of preferentially expressing nucleic acid throughout the plant is the rice GOS2 promoter (SEQ ID NO: 5).

Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico SYR representado por SEQ ID NO: 1, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico SYR quando dirigida por um promotor GOS2. Um promotor constitutivo alternativo que é útil nos métodos da presente invenção é o promotor de Proteína de Grupo de Alta Mobilidade (HMGP) (SEQ ID NO: 33). Exemplos de outros promotores constitutivos que também podem ser usados para dirigir expressão de um ácido nucleico SYR são mostrados em Tabela 3 na seção intitulada "Definições".It should be clear that the applicability of the present invention is not restricted to the SYR nucleic acid represented by SEQ ID NO: 1, nor is the applicability of the invention restricted to the expression of a SYR nucleic acid when directed by a GOS2 promoter. An alternative constitutive promoter that is useful in the methods of the present invention is the High Mobility Group Protein (HMGP) promoter (SEQ ID NO: 33). Examples of other constitutive promoters that may also be used to direct expression of a SYR nucleic acid are shown in Table 3 in the section entitled "Definitions".

Opcionalmente, uma ou mais seqüências terminadoras também podem ser usadas na construção introduzida em uma planta. O termo "terminador" é definido na seção "Definições".Optionally, one or more terminator sequences may also be used in the construction introduced into a plant. The term "terminator" is defined in the "Definitions" section.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colEl.The genetic constructs of the invention may additionally include an origin of replication sequence that is required for maintenance and / or replication in a specific cell type. An example is when a genetic construct is required to be maintained in a bacterial cell as an episomal genetic element (e.g., plasmid or cosmid molecule). Preferred sources of replication include, but are not limited to, fl-ori and colEl.

A construção genética pode compreender opcionalmente um gene marcador selecionável, como definido na seção "Definições".The genetic construct may optionally comprise a selectable marker gene as defined in the "Definitions" section.

A presente invenção também abrange plantas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas obteníveis pelo método de acordo com a presente invenção, cujas plantas têm introduzido nelas um ácido nucleico SYR ou variante deste, como definido acima.The present invention also encompasses plants obtainable by the methods according to the present invention. The present invention therefore provides plants obtainable by the method according to the present invention, which plants have introduced into them a nucleic acid SYR or variant thereof as defined above.

A invenção também fornece um método para a produção de plantas transgênicas tendo produção aumentada de sementes, compreendendo introdução e expressão em uma planta de um ácido nucleico SYR ou uma variante deste como definido acima.The invention also provides a method for producing transgenic plants having increased seed production comprising introducing and expressing in a plant a SYR nucleic acid or a variant thereof as defined above.

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo produção aumentada de sementes, cujo método compreende: (i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico SYR ou variante deste, eMore specifically, the present invention provides a method for producing transgenic plants having increased seed production, which method comprises: (i) introducing and expressing into a plant or plant cell a SYR nucleic acid or variant thereof, and

(ii) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal;(ii) cultivate the plant cell under conditions promoting plant growth and development;

com a condição de que o ácido nucleico SYR ou variante deste não seja uma seqüência de ácidos nucleicos codificando a proteína de SEQ ID NO: 26.provided that the nucleic acid SYR or variant thereof is not a nucleic acid sequence encoding the protein of SEQ ID NO: 26.

O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação. O termo "transformação" é definido na seção "Definições".Nucleic acid can be introduced directly into a plant cell or into the plant itself (including introduction into a tissue, organ or any other part of a plant). According to a preferred feature of the present invention, the nucleic acid is preferably introduced into a plant by transformation. The term "transformation" is defined in the "Definitions" section.

A presente invenção claramente se estende a qualquer célula vegetal ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes vegetais e propágulos destas. A presente invenção adicionalmente de estende para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção. A invenção também inclui células hospedeiras contendo um ácido nucleico SYR isolado ou variante deste. Células hospedeiras preferidas de acordo com a invenção são células vegetais. A invenção também se estende a partes aptas à colheita de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores, safras de caule, rizomas, tubérculos e bulbos. A invenção além disso se refere a produtos diretamente derivados de uma parte apta à colheita de uma tal planta, tal como pelotas secas ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.The present invention clearly extends to any plant cell or plant produced by any of the methods described herein, and to all plant parts and seedlings thereof. The present invention further extends to encompass the progeny of a transformed or transfected primary cell, tissue, organ or whole plant that has been produced by any of the methods mentioned above, the sole requirement being that the progeny exhibit the same (s) genotypic and / or phenotypic trait (s) than those produced by the ancestor in the methods according to the invention. The invention also includes host cells containing an isolated or variant SYR nucleic acid. Preferred host cells according to the invention are plant cells. The invention also extends to harvestable parts of a plant such as, but not limited to seeds, leaves, fruits, flowers, stem crops, rhizomes, tubers and bulbs. The invention further relates to products directly derived from a harvestable part of such a plant, such as dried pellets or powders, oil, fat and fatty acids, starch or proteins.

A presente invenção também abrange uso de ácidos nucleicos SYR ou variantes destes e uso de polipeptídeos SYR ou homólogos destes.The present invention also encompasses use of SYR nucleic acids or variants thereof and use of SYR polypeptides or homologues thereof.

Um tal uso se refere a melhorar as características de crescimento de plantas, em particular para melhorar produção de sementes. A produção de sementes pode incluir um ou mais dos seguintes: peso total aumentado de sementes, número aumentado de sementes cheias, taxa de enchimento e índice de colheita aumentado.One such use relates to improving plant growth characteristics, in particular to improve seed production. Seed production may include one or more of the following: increased total seed weight, increased number of full seeds, filling rate and increased harvest index.

Ácidos nucleicos SYR ou variantes destes, ou polipeptídeos SYR ou homólogos destes podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene SYR ou variante deste. Os ácidos nucleicos/genes SYR ou variantes destes, ou polipeptídeos SYR ou homólogos destes podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo produção aumentada de sementes. O gene SYR ou variante deste, por exemplo, pode ser um ácido nucleico como representado por qualquer um de SEQ ID NO: 1, SEQ ID NO: 27 a SEQ ID NO: 32, SEQ ID NO: 36 a SEQ ID NO: 42 e SEQ ID NO: 44.SYR nucleic acids or variants thereof, or SYR polypeptides or homologues thereof may find use in breeding programs in which a DNA marker that can be genetically linked to a SYR gene or variant thereof is identified. SYR nucleic acids / genes or variants thereof, or SYR polypeptides or homologues thereof may be used to define a molecular marker. This DNA or protein marker can then be used in breeding programs to select plants having increased seed yield. The SYR gene or variant thereof, for example, may be a nucleic acid as represented by any one of SEQ ID NO: 1, SEQ ID NO: 27 to SEQ ID NO: 32, SEQ ID NO: 36 to SEQ ID NO: 42 and SEQ ID NO: 44.

Variantes alélicas de um ácido nucleico/gene SYR também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem "natural" causada não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que gera produção aumentada de sementes. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão, por exemplo, variantes alélicas diferentes de qualquer uma de SEQ ID NO: 1, SEQ ID NO: 27 a SEQ ID NO: 32, SEQ ID NO: 36 a SEQ ID NO: 42 e SEQ ID NO: 44. Desempenho de crescimento pode ser monitorado em uma casa de vegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantas, nas quais a variante alélica superior foi identificada, com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.Allelic variants of a nucleic acid / SYR gene may also find use in marker-assisted breeding programs. Such breeding programs sometimes require introduction of allelic variation by mutagenic treatment of plants, using for example EMS mutagenesis; alternatively, the program may start with a collection of allelic variants of the so-called "natural" origin caused unintentionally. Identification of allelic variants then occurs, for example, by PCR. This is followed by a step for selecting superior allelic variants of the sequence in question and generating increased seed yield. Selection is typically performed by monitoring plant growth performance containing different allelic variants of the sequence in question, for example, allelic variants different from any of SEQ ID NO: 1, SEQ ID NO: 27 to SEQ ID NO: 32, SEQ ID NO : 36 to SEQ ID NO: 42 and SEQ ID NO: 44. Growth performance can be monitored in a greenhouse or in the field. Additional optional steps include crossing plants in which the superior allelic variant has been identified with another plant. This can be used, for example, to make a combination of interesting phenotypic characteristics.

Um ácido nucleico SYR ou variante deste também pode ser usado como sondas para mapear geneticamente e fisicamente os genes dos quais eles são uma parte de, e como marcadores para características ligadas a estes genes. Tal informação pode ser útil em melhoramento vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos SYR ou variantes destes requer apenas uma seqüência de ácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos SYR ou variantes destes podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição pode ser sondado com os ácidos nucleicos SYR ou variantes destes. Os padrões de bandeamento resultantes então podem ser sujeitos a análises genéticas usando programas de computador tal como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição do ácido nucleico SYR ou variante deste no mapa genético obtido previamente usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331).A SYR nucleic acid or variant thereof may also be used as probes to genetically and physically map the genes of which they are a part of, and as markers for traits linked to these genes. Such information may be useful in plant breeding in order to develop strains with desired phenotypes. Such use of SYR nucleic acids or variants thereof requires only a nucleic acid sequence of at least 15 nucleotides in length. SYR nucleic acids or variants thereof may be used as restriction fragment length polymorphism (RFLP) markers. Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) of restriction digested plant genomic DNA can be probed with SYR nucleic acids or variants thereof. The resulting banding patterns can then be subjected to genetic analysis using computer programs such as MapMaker (Lander et al. (1987) Genomics 1: 174-181) in order to construct a genetic map. In addition, nucleic acids can be used to probe Southern blots containing restriction endonuclease-treated genomic DNAs from a set of individuals representing ancestor and progeny of a defined genetic crossover. Segregation of DNA polymorphisms is observed and used to calculate the position of SYR nucleic acid or variant on the genetic map previously obtained using this population (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331) .

A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético são descritos em Bernatzky and Tanksley (GENETICS 112 (4): 887-898, 1986). Numerosas publicações descrevem mapeamento genético de clones de cDNA específicos usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens isogênicas próximas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica.The production and use of plant gene derived probes for use in genetic mapping are described in Bernatzky and Tanksley (GENETICS 112 (4): 887-898, 1986). Numerous publications describe genetic mapping of specific cDNA clones using the methodology described above or variations thereof. For example, F2 crossover populations, inbreeding populations, randomly crossed populations, nearby isogenic strains, and other sets of individuals may be used for mapping. Such methodologies are well known to those skilled in the art.

As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., localização de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas aí).Nucleic acid probes may also be used for physical mapping (ie, location of sequences in physical maps; see Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, and references cited there).

Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et ai. (1995) Genome Res. 5:13-20), melhoramentos em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.In another embodiment, nucleic acid probes may be used in direct mapping by fluorescence in situ hybridization (FISH) (Trask (1991) Trends Genet. 7: 149-154). Although current FISH mapping methods favor use of large clones (several kb to several hundred kb; see Laan et al. (1995) Genome Res. 5: 13-20), sensitivity improvements may allow FISH mapping performance using smaller probes.

Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser realizada usando os ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para projetar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. O projeto de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os ancestrais do cruzamento de mapeamento na região correspondente à seqüência imediata de ácidos nucleicos. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.A variety of nucleic acid amplification based methods for genetic and physical mapping can be performed using nucleic acids. Examples include allele-specific amplification (Kazazian (1989) J. Lab. Clin. Med. 11: 95-96), PCR amplified fragment polymorphism (CAPS; Sheffield et al. (1993) Genomics 16: 325-332), allele binding specific (Landegren et al. (1988) Science 241: 1077-1080), nucleotide extension reactions (Sokolov (1990) Nucleic Acid Res. 18: 3671), Radiation Hybrid Mapping (Walter et al. (1997) Nat Genet. 7: 22-28) and Appropriate Mapping (Dear and Cook (1989) Nucleic Acid Res. 17: 6795-6807). For these methods, the nucleic acid sequence is used to design and produce primer pairs for use in the amplification reaction or primer extension reactions. The design of such initiators is well known to those skilled in the art. In methods employing PCR-based genetic mapping, it may be necessary to identify DNA sequence differences between the mapping ancestors in the region corresponding to the immediate sequence of nucleic acids. This, however, is generally not required for mapping methods.

Os métodos de acordo com a presente invenção resultam em plantas tendo produção aumentada de sementes, como descrito acima. Estas características de crescimento vantajosas também podem ser combinadas com outras características economicamente vantajosas, tal como adicionalmente características que estimulam produção, tolerância a vários estresses em adição à resistência a estresse abiótico, características modificando vários atributos arquitetônicos e/ou atributos bioquímicos e/ou fisiológicos.The methods according to the present invention result in plants having increased seed production as described above. These advantageous growth characteristics may also be combined with other economically advantageous characteristics, such as additionally features that stimulate production, tolerance to various stresses in addition to abiotic stress resistance, characteristics modifying various architectural attributes and / or biochemical and / or physiological attributes.

FG-GAP de Descrição DetalhadaFG-GAP Detailed Description

A atividade de uma proteína FG-GAP pode ser modulada modulando níveis do polipeptídeo FG-GAP. Alternativamente, atividade também pode ser modulada quando não existem mudanças em níveis de uma FG-GAP. Isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo são alteradas, por exemplo, produzindo um mutante ou selecionando uma variante que é mais ativa ou menos ativa do que o tipo selvagem.The activity of a FG-GAP protein can be modulated by modulating levels of the FG-GAP polypeptide. Alternatively, activity can also be modulated when there are no changes in levels of an FG-GAP. This can occur when the intrinsic properties of the polypeptide are altered, for example by producing a mutant or by selecting a variant that is more active or less active than wild type.

O termo "proteína FG-GAP ou homólogo desta" como definido neste lugar se refere a um polipeptídeo compreendendo (i) um peptídeo sinal de secreção N-terminal, (ii) um ou mais domínios FG-GAP seguido por (iii) um domínio transmembrana na metade C-terminal da proteína. Um exemplo é dado em Figura 6.The term "FG-GAP protein or homologue thereof" as defined herein refers to a polypeptide comprising (i) an N-terminal secretion signal peptide, (ii) one or more FG-GAP domains followed by (iii) a domain transmembrane in the C-terminal half of the protein. An example is given in Figure 6.

Peptídeos sinal são típicos para proteínas que são dirigidas para a via secretora. A presença de um sinal de secreção pode ser facilmente prevista usando algoritmos computacionais (por exemplo SignalP 3.0, Bendtsen et al., J. Mol. Biol., 340:783-795, 2004). Um sinal de secreção típico consiste de uma η-região carregada positivamente, seguido por uma n- região hidrofóbica e uma polar c-região polar neutra. Além disso, os resíduos de aminoácidos em posição -3 e -1 em relação ao sítio de clivagem normalmente são pequenos e neutros.Signal peptides are typical for proteins that are directed to the secretory pathway. The presence of a secretion signal can easily be predicted using computational algorithms (eg SignalP 3.0, Bendtsen et al., J. Mol. Biol., 340: 783-795, 2004). A typical secretion signal consists of a positively charged η-region, followed by a hydrophobic n-region and a neutral polar c-region. In addition, amino acid residues at position -3 and -1 relative to the cleavage site are usually small and neutral.

Domínios transmembrana são de cerca de 15 a 30 aminoácidos de comprimento e normalmente são compostos de resíduos hidrofóbicos que formam uma alfa hélice. Eles normalmente são previstos na base de hidrofobicidade (por exemplo Klein et al., Biochim. Biophys. Acta 815, 468, 1985; ou Sonnhammer et al., In J. Glasgow, T. Littlejohn, F. Major, R. Lathrop, D. Sankoff, and C. Sensen, editores, Proceedings of the Sixth International Conference on Intelligent Systems for Molecular Biology, pages 175-182, Menlo Park, CA, 1998. AAAI Press.).Transmembrane domains are about 15 to 30 amino acids in length and are usually composed of hydrophobic residues that form an alpha helix. They are usually predicted on the basis of hydrophobicity (eg Klein et al., Biochim. Biophys. Acta 815, 468, 1985; or Sonnhammer et al., In J. Glasgow, T. Littlejohn, F. Major, R. Lathrop, D. Sankoff, and C. Sensen, editors, Proceedings of the Sixth International Conference on Intelligent Systems for Molecular Biology, pages 175-182, Menlo Park, CA, 1998. AAAI Press.).

O domínio FG-GAP (número de acesso de Pfam PFO1839, INTERPRO entrada IPR000413) tipicamente é encontrado em integrinas onde ele está presente como uma repetição (até 7 cópias) na parte extracelular da proteína. Até agora, apenas integrinas de origem animal foram bem caracterizadas. A seqüência consenso para o domínio FG-GAP é dada em SEQ ID NO: 53:The FG-GAP domain (Pfam accession number PFO1839, INTERPRO entry IPR000413) is typically found in integrins where it is present as a repeat (up to 7 copies) in the extracellular part of the protein. So far, only animal integrins have been well characterized. The consensus sequence for the FG-GAP domain is given in SEQ ID NO: 53:

fgssvaagDlnGDGrpDlvvgaPgadggtdgsvyll, caracterizada pelo fato de que as letras maiúsculas representam o código de aminoácido de única letra para aminoácidos altamente conservados e as outras letras representam o código de aminoácido de única letra para aminoácidos menos conservados. O domínio freqüentemente compreende um motivo Phe- Gly-Xn-Gly-Ala-Pro caracterizado pelo fato de que Xn representa um número variável de aminoácidos. Devido ao fato desta seqüência consenso ser derivada de proteínas animais, ela não é inteiramente compatível com as seqüências de domínio FG-GAP vegetal. Por exemplo, o hexapeptídeo "Pgadgg" pode não estar presente em domínios FG-GAP vegetais. Portanto, o termo "domínio FG-GAP" como usado neste lugar abrange SEQ ID NO: 53 e seqüências que têm pelo menos 40% de similaridade de seqüência com SEQ ID NO: 53, sob alinhamento de SEQ ID NO: 53 e a seqüência compatível correspondente, usando o algoritmo de Needleman & Wunsch com uma penalidade de abertura de lacuna de 10 com uma penalidade de extensão de lacuna de 0,5.fgssvaagDlnGDGrpDlvvgaPgadggtdgsvyll, characterized in that the capital letters represent the single letter amino acid code for highly conserved amino acids and the other letters represent the single letter amino acid code for less conserved amino acids. The domain often comprises a Phe-Gly-Xn-Gly-Ala-Pro motif characterized by the fact that Xn represents a variable number of amino acids. Because this consensus sequence is derived from animal proteins, it is not fully compatible with plant FG-GAP domain sequences. For example, the hexapeptide "Pgadgg" may not be present in plant FG-GAP domains. Therefore, the term "FG-GAP domain" as used herein encompasses SEQ ID NO: 53 and sequences that have at least 40% sequence similarity to SEQ ID NO: 53, under alignment of SEQ ID NO: 53 and the sequence corresponding match, using the Needleman & Wunsch algorithm with a gap opening penalty of 10 with a gap length penalty of 0.5.

O domínio FG-GAP também pode compreender um sítio de ligação de Ca2+.The FG-GAP domain may also comprise a Ca2 + binding site.

Preferivelmente, a proteína FG-GAP também compreende umPreferably, the FG-GAP protein also comprises a

motivo 1 FDGYLYLI(D/E)G (SEQ ID NO: 50). Mais preferivelmente, o motivo conservado 1 é FDGYLYLIDG.Motif 1 FDGYLYLI (D / E) G (SEQ ID NO: 50). More preferably, conserved motif 1 is FDGYLYLIDG.

Adicionalmente e/ou alternativamente, a proteína FG-GAP pode compreender um ou mais motivos DGXX(D/E) (motivo conservado 2, SEQ ID NO: 51), caracterizado pelo fato de que X pode ser qualquer aminoácido. Este motivo conservado pode ser parte de um motivo maior DXDXDGXX(D/E) (motivo conservado 3, SEQ ID NO: 52), caracterizado pelo fato de que X pode ser qualquer aminoácido. Assim, a proteína FG-GAP preferivelmente compreende uma ou mais cópias do motivo conservado 3.Additionally and / or alternatively, the FG-GAP protein may comprise one or more DGXX (D / E) motifs (conserved motif 2, SEQ ID NO: 51), characterized in that X may be any amino acid. This conserved motif may be part of a larger DXDXDGXX (D / E) motif (conserved motif 3, SEQ ID NO: 52), characterized in that X can be any amino acid. Thus, the FG-GAP protein preferably comprises one or more copies of the conserved motif 3.

Alternativamente, o homólogo de uma proteína FG-GAP tem em ordem crescente de preferência 50%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identidade total de seqüência com o aminoácido representado por SEQ ID NO: 46, contanto que a proteína homóloga compreenda uma seqüência de peptídeo sinal, um ou mais domínios FG-GAP, e um domínio transmembrana na metade C-terminal da proteína, e preferivelmente também um ou mais dos motivos conservados 1, 2 ou 3. A identidade total de seqüência é determinada usando um algoritmo de alinhamento global, tal como o algoritmo de Needleman Wunsch no programa GAP (GCG Wisconsin Package, Accelrys), preferivelmente com parâmetros padrão e seqüências protéicas de comprimento completo.Alternatively, the homologue of an FG-GAP protein is in increasing order preferably 50%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65. %, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% , or 99% total sequence identity with the amino acid represented by SEQ ID NO: 46, provided that the homologous protein comprises a signal peptide sequence, one or more FG-GAP domains, and a transmembrane domain in the C-terminal half of preferably one or more of the conserved motifs 1, 2, or 3. The total sequence identity is determined using a global alignment algorithm, such as the Needleman Wunsch algorithm in the GAP (GCG Wisconsin Package, Accelrys) program, preferably with standard parameters and full length protein sequences.

Os vários domínios estruturais em uma proteína FG-GAP podem ser identificados usando bancos de dados especializados e.g. SMART (Schultz et al (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al (2002) Nucleic Acids Res 30, 242-244;), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318;), Prosite (Bucher and Bairoch (1994), A generalized profíle syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp. 53-61, AAAIPress, Menlo Park; Hulo et al, Nucl. Acids. Res. 32:D134-D137, (2004),) ou Pfam (Bateman et al., Nucleic Acids Research 30(l):276-280 (2002),).The various structural domains in an FG-GAP protein can be identified using specialized databases eg SMART (Schultz et al (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al (2002) Nucleic Acids Res 30, 242-244;), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318;), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds. 53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids Res. 32: D134-D137 (2004)) or Pfam (Bateman et al., Nucleic Acids Research 30 (1): 276-280 (2002),).

Métodos para a busca e identificação de homólogos de FG- GAP estariam bem dentro do âmbito de pessoas versadas na técnica. Tais métodos compreendem comparação das seqüências representadas por SEQ ID NO: 45 ou 46, em um formato legível por computador, com seqüências que estão disponíveis em bancos de dados públicos tal como MIPS, GenBank ou Banco de Dados de Seqüências de Nucleotídeos de EMBL, usando algoritmos bem conhecidos na técnica para o alinhamento ou comparação de seqüências, tal como GAP (Needleman and Wunsch, J. Mol. Biol. 48; 443-453 (1970)), BESTFIT (usando o algoritmo de homologia local de Smith and Waterman (Advances in Applied Mathematics 2; 482-489 (1981))), BLAST (Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J., J. Mol. Biol. 215:403-410 (1990)), FASTA e TFASTA (W. R. Pearson and D. J. Lipman Proc.Natl.Acad.Sci. USA 85:2444- 2448 (1988)). O aplicativo computacional para realizar análise BLAST está publicamente disponível através de National Centre for Biotechnology Information (NCBI).Methods for searching and identifying FG-GAP counterparts would be well within the scope of those skilled in the art. Such methods comprise comparing sequences represented by SEQ ID NO: 45 or 46, in a computer readable format, with sequences that are available in public databases such as MIPS, GenBank or EMBL Nucleotide Sequence Database, using algorithms well known in the art for sequence alignment or comparison, such as GAP (Needleman and Wunsch, J. Mol. Biol. 48; 443-453 (1970)), BESTFIT (using the Smith and Waterman local homology algorithm ( Advances in Applied Mathematics 2; 482-489 (1981))), BLAST (Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ, J. Mol. Biol. 215: 403-410 (1990)), FASTA and TFASTA (WR Pearson and DJ Lipman Proc. Natl.Acad.Sci. USA 85: 2444-2448 (1988)). The computer application for performing BLAST analysis is publicly available through the National Center for Biotechnology Information (NCBI).

Exemplos de proteínas caindo sob a definição de "polipeptídeo FG-GAP ou um homólogo deste" incluem uma proteína de Arabidopsis (SEQ ID NO: 55) e duas proteínas de arroz (SEQ ID NO: 57 e 59). A presença de proteínas FG-GAP também foi demonstrada em outras espécies de planta das Magnoliophyta, incluindo Triticum aestivum, Zea mays, Solanum tuberosum, Aquilegia sp., Brassica napus, Citrus sinensis, Asparagus officinalis, Populus sp., Euphorbia esula e também em outros taxa vegetais tal como samambaias (Ceratopteris richardii) ou em Welwitschia mirabilis. Uma lista não limitante de exemplos de EST's codificando proteínas FG-GAP é dada em Tabela 8:Examples of proteins falling under the definition of "FG-GAP polypeptide or a homologue thereof" include one Arabidopsis protein (SEQ ID NO: 55) and two rice proteins (SEQ ID NO: 57 and 59). The presence of FG-GAP proteins has also been demonstrated in other Magnoliophyta plant species, including Triticum aestivum, Zea mays, Solanum tuberosum, Aquilegia sp., Brassica napus, Citrus sinensis, Asparagus officinalis, Populus sp., Euphorbia esula. other plant taxa such as ferns (Ceratopteris richardii) or Welwitschia mirabilis. A non-limiting list of examples of ESTs encoding FG-GAP proteins is given in Table 8:

Tabela 8:Table 8:

<table>table see original document page 76</column></row><table><table> table see original document page 76 </column> </row> <table>

As proteínas codificadas pelos genes dos quais estas EST's são derivadas também são úteis para praticar os métodos da presente invenção e caem dentro do escopo desta invenção. Uma pessoa versada na técnica pode ser capaz de isolar a seqüência de codificação de comprimento completo destes genes usando métodos padrão.Proteins encoded by the genes from which these ESTs are derived are also useful for practicing the methods of the present invention and fall within the scope of this invention. One skilled in the art may be able to isolate the full length coding sequence of these genes using standard methods.

A invenção além disso fornece uma proteína FG-GAP isolada selecionada a partir do grupo consistindo de:The invention further provides an isolated FG-GAP protein selected from the group consisting of:

(a) uma proteína codificada pelo ácido nucleico de SEQ ID NO: 72;(a) a nucleic acid encoded protein of SEQ ID NO: 72;

(b) uma proteína compreendendo uma seqüência sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C-terminal da proteína, caracterizado pelo fato de que dita proteína compreende pelo menos uma de SEQ ID NO: 73 a SEQ ID NO: 72;(b) a protein comprising a signal sequence, one or more FG-GAP domains and a transmembrane domain located at the C-terminal half of the protein, characterized in that said protein comprises at least one of SEQ ID NO: 73 to SEQ ID NO: 72;

(c) um fragmento ativo de uma seqüência de aminoácidos como definido em (a) ou (b), cujo fragmento ativo compreende uma seqüência sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C-terminal da proteína.(c) an active fragment of an amino acid sequence as defined in (a) or (b), whose active fragment comprises a signal sequence, one or more FG-GAP domains, and a transmembrane domain located at the C-terminal half of the protein.

Deve ser entendido que o termo "polipeptídeo FG-GAP ou um homólogo deste" não deve ser limitado à seqüência representada por SEQ ID NO: 46 ou aos homólogos listados como SEQ ID NO: 55, 57 e 59, mas que qualquer polipeptídeo reunindo os critérios de compreendendo um peptídeo sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C-terminal da proteína, e preferivelmente também um ou mais dos motivos conservados de SEQ ID NO: 50 a 52; ou tendo pelo menos 50% de identidade de seqüência com a seqüência de SEQ ID NO: 46, pode ser adequado para uso nos métodos da invenção.It should be understood that the term "FG-GAP polypeptide or a homologue thereof" should not be limited to the sequence represented by SEQ ID NO: 46 or the homologues listed as SEQ ID NO: 55, 57 and 59, but that any polypeptide assembling the criteria comprising a signal peptide, one or more FG-GAP domains and a transmembrane domain located at the C-terminal half of the protein, and preferably also one or more of the conserved motifs of SEQ ID NO: 50 to 52; or having at least 50% sequence identity with the sequence of SEQ ID NO: 46, may be suitable for use in the methods of the invention.

Proteínas FG-GAP vegetais desempenham um papel durante desenvolvimento de pólen (Paxson-Sowders et al. 2001). Em plantas mutantes dexl, deposição de primexina é atrasada e significantemente reduzida. A ondulação normal da membrana plasmática e produção de espaçadores observados em plantas tipo selvagem também é ausente no mutante. Proteínas FG-GAP são capazes de complementar esta mutação e de restaurar o fenótipo normal.Plant FG-GAP proteins play a role during pollen development (Paxson-Sowders et al. 2001). In dexl mutant plants, primexin deposition is delayed and significantly reduced. Normal plasma membrane ripple and spacer production observed in wild-type plants is also absent in the mutant. FG-GAP proteins are able to complement this mutation and restore the normal phenotype.

Alternativamente, a atividade de uma proteína FG-GAP ou homólogo desta pode ser ensaiada expressando a proteína FG-GAP ou homólogo desta sob controle de um promotor constitutivo em Oryza sativa, o que resulta em plantas com biomassa acima da terra aumentada e/ou produção aumentada de sementes comparado com plantas tipo selvagem correspondentes. Este aumento em produção de sementes pode ser medido de diversas maneiras, por exemplo como um aumento de total peso de semente, número de grãos cheios ou número total de sementes.Alternatively, the activity of an FG-GAP protein or homologue thereof may be assayed by expressing the FG-GAP protein or homologue thereof under control of a constitutive promoter in Oryza sativa, which results in plants with increased above ground biomass and / or yield. compared to corresponding wild type plants. This increase in seed yield can be measured in a number of ways, for example as an increase in total seed weight, number of full grains or total number of seeds.

Uma proteína FG-GAP ou homólogo desta é codificada por um ácido nucleico/gene FG-GAP. Portanto o termo "ácido nucleico/gene FG- GAP" como definido neste lugar é qualquer ácido nucleico/gene codificando uma proteína FG-GAP ou um homólogo deste como definido acima.An FG-GAP protein or homologue thereof is encoded by a FG-GAP nucleic acid / gene. Therefore the term "FG-GAP nucleic acid / gene" as defined herein is any nucleic acid / gene encoding an FG-GAP protein or homologue thereof as defined above.

Exemplos de ácidos nucleicos FG-GAP incluem mas não são limitados àqueles representados por qualquer um de SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56 ou SEQ ID NO: 58. Exemplos de ácidos nucleicos FG-GAP parciais são listados em Tabela 8.Examples of FG-GAP nucleic acids include but are not limited to those represented by any of SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56 or SEQ ID NO: 58. Examples of partial FG-GAP nucleic acids are listed in Table 8.

A invenção também fornece um ácido nucleico isolado codificando uma proteína FG-GAP, selecionado a partir do grupo consistindo de:The invention also provides an isolated nucleic acid encoding an FG-GAP protein selected from the group consisting of:

(i) o ácido nucleico como representado em SEQ ID NO: 72;(i) nucleic acid as represented in SEQ ID NO: 72;

(ii) um ácido nucleico codificando uma proteína como definido em (a) a (c) acima;(ii) a nucleic acid encoding a protein as defined in (a) to (c) above;

(iii)uma seqüência de ácidos nucleicos capaz de hibridizar (preferivelmente em condições estringentes) com uma seqüência de ácidos nucleicos de (i) ou (ii) acima, cuja seqüência hibridizante preferivelmente codifica uma proteína compreendendo um peptídeo sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C- terminal da proteína;(iii) a nucleic acid sequence capable of hybridizing (preferably under stringent conditions) to a nucleic acid sequence of (i) or (ii) above, whose hybridizing sequence preferably encodes a protein comprising a signal peptide, one or more FG domains -GAP is a transmembrane domain located at the C-terminal half of the protein;

(iv)um ácido nucleico que é uma variante alélica para as seqüências de ácidos nucleicos de acordo com (i) a (iii);(iv) a nucleic acid which is an allelic variant for nucleic acid sequences according to (i) to (iii);

(v) um ácido nucleico que é uma variante alternativa de união para as seqüências de ácidos nucleicos de acordo com (i) a (iii);(v) a nucleic acid which is an alternative splice variant for nucleic acid sequences according to (i) to (iii);

(vi) uma porção de uma seqüência de ácidos nucleicos de acordo com qualquer de (i) a (v) acima, cuja porção preferivelmente codifica uma proteína compreendendo um peptídeo sinal, um ou mais domínios FG- GAP e um domínio transmembrana localizado na metade C-terminal da proteína.(vi) a portion of a nucleic acid sequence according to any of (i) to (v) above, which portion preferably encodes a protein comprising a signal peptide, one or more FG-GAP domains, and a half-transmembrane domain C-terminal protein.

Ácidos nucleicos/genes FG-GAP e variantes destes podem ser adequados para praticar os métodos da invenção. Ácidos nucleicos/genes FG- GAP variantes incluem porções de um ácido nucleico/gene FG-GAP, variantes alélicas, variantes de união e/ou ácidos nucleicos capazes de hibridizar com um ácido nucleico/gene FG-GAP.FG-GAP nucleic acids / genes and variants thereof may be suitable for practicing the methods of the invention. Variant FG-GAP nucleic acids / genes include portions of a FG-GAP nucleic acid / gene, allelic variants, splice variants and / or nucleic acids capable of hybridizing to a FG-GAP nucleic acid / gene.

O termo porção como definido neste lugar se refere a um pedaço de DNA codificando um polipeptídeo compreendendo um peptídeo sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C-terminal da proteína, e preferivelmente também um ou mais dos motivos conservados de SEQ ID NO: 50 a 52. Preferivelmente, a porção compreende um ou mais dos motivos conservados definidos acima. Uma porção pode ser preparada, por exemplo, fazendo uma ou mais deleções para um ácido nucleico FG-GAP. As porções podem ser usadas em forma isolada ou elas podem ser fundidas a outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combina diversas atividades. Quando fundido a outras seqüências de codificação, o polipeptídeo resultante produzido em tradução pode ser maior do que aquele previsto para o fragmento FG-GAP. Preferivelmente, a porção é uma porção de um ácido nucleico como representado por qualquer um de SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58 ou SEQ ID NO: 72. A porção também pode ser uma porção das seqüências de codificação das quais as seqüências de Tabela 8 são derivadas. Mais preferivelmente a porção de um ácido nucleico é como representada por SEQ ID NO: 45.The term portion as defined herein refers to a piece of DNA encoding a polypeptide comprising a signal peptide, one or more FG-GAP domains and a transmembrane domain located at the C-terminal half of the protein, and preferably also one or more of the motifs. SEQ ID NO: 50 to 52. Preferably, the portion comprises one or more of the conserved motifs defined above. A portion may be prepared, for example, by making one or more deletions to an FG-GAP nucleic acid. The portions may be used in isolation or they may be fused to other coding (or non-coding) sequences to, for example, produce a protein that combines various activities. When fused to other coding sequences, the resulting translation produced polypeptide may be larger than predicted for the FG-GAP fragment. Preferably, the portion is a portion of a nucleic acid as represented by any of SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58 or SEQ ID NO: 72. The portion also can be a portion of the coding sequences from which the sequences in Table 8 are derived. More preferably the portion of a nucleic acid is as represented by SEQ ID NO: 45.

Outra variante de um ácido nucleico/gene FG-GAP é um ácido nucleico capaz de hibridizar em condições de estringência reduzida, preferivelmente em condições estringentes, com um ácido nucleico/gene FG- GAP como definido acima, cuja seqüência hibridizante codifica um polipeptídeo compreendendo um peptídeo sinal, um ou mais domínios FG- GAP e um domínio transmembrana localizado na metade C-terminal da proteína, e preferivelmente também um ou mais dos motivos conservados de SEQ ID NO: 50 a 52.Another variant of a FG-GAP nucleic acid / gene is a nucleic acid capable of hybridizing under reduced stringency conditions, preferably under stringent conditions, to a FG-GAP nucleic acid / gene as defined above, whose hybridizing sequence encodes a polypeptide comprising a signal peptide, one or more FG-GAP domains and a transmembrane domain located at the C-terminal half of the protein, and preferably also one or more of the conserved motifs of SEQ ID NO: 50 to 52.

Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58 ou SEQ ID NO: 72, ou com uma porção de qualquer das seqüências mencionadas acima, incluindo as EST's listadas em Tabela 8. Mais preferivelmente a seqüência hibridizante é capaz de hibridizar com SEQ ID NO: 45. O termo "hibridização" é como definido na seção intitulada "Definições".Preferably, the hybridizing sequence is one that is capable of hybridizing to a nucleic acid as represented by SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, or SEQ ID NO: 72, or with a portion of any of the sequences mentioned above, including the ESTs listed in Table 8. More preferably the hybridizing sequence is capable of hybridizing to SEQ ID NO: 45. The term "hybridization" is as defined in the section entitled "Definitions".

O ácido nucleico FG-GAP ou variante deste pode ser derivado de qualquer fonte natural ou artificial. O ácido nucleico/gene ou variante deste pode ser isolado de uma fonte microbiana, tal como levedura ou fungos, ou de uma fonte vegetal, algal ou animal (incluindo humano). Este ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana deliberada. O ácido nucleico é preferivelmente de origem vegetal, quer da mesma espécie de planta (por exemplo que aquela na qual ele é introduzido) ou quer de uma espécie diferente de planta. O ácido nucleico pode ser isolado de uma espécie dicotiledônea, preferivelmente da família Brassicaceae, ainda preferivelmente de Arabidopsis thaliana. Mais preferivelmente, o ácido nucleico FG-GAP é isolado de Arabidopsis thaliana e é representado por SEQ ID NO: 45, e a seqüência de aminoácidos FG-GAP é como representada por SEQ ID NO: 46. A expressão de um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo deste pode ser modulada introduzindo uma modificação genética (preferivelmente no locus de um gene FG-GAP). O locus de um gene como definido neste lugar é adotado para significar uma região genômica, a qual inclui o gene de interesse e 10 kb antes ou depois da região de codificação.FG-GAP nucleic acid or variant thereof may be derived from any natural or artificial source. The nucleic acid / gene or variant thereof may be isolated from a microbial source, such as yeast or fungi, or from a plant, algal or animal (including human) source. This nucleic acid may be modified from its native form in genomic composition and / or environment through deliberate human manipulation. The nucleic acid is preferably of plant origin, either from the same plant species (for example that into which it is introduced) or from a different plant species. The nucleic acid may be isolated from a dicotyledonous species, preferably from the Brassicaceae family, still preferably from Arabidopsis thaliana. More preferably, the FG-GAP nucleic acid is isolated from Arabidopsis thaliana and is represented by SEQ ID NO: 45, and the FG-GAP amino acid sequence is as represented by SEQ ID NO: 46. The expression of a nucleic acid encoding a FG-GAP polypeptide or a homologue thereof can be modulated by introducing a genetic modification (preferably at the locus of an FG-GAP gene). The locus of a gene as defined herein is adopted to mean a genomic region which includes the gene of interest and 10 kb before or after the coding region.

A modificação genética pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLING, mutagênese sítio dirigida, mutagênese por transposon, evolução direta e recombinação homóloga ou introduzindo e expressando em uma planta um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo deste. Estes métodos são definidos na seção intitulada "Definições". Seguindo introdução da modificação genética, segue uma etapa de selecionar para expressão modificada de um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo deste, cuja modificação em expressão gera plantas tendo produção aumentada.Genetic modification may be introduced, for example, by any (or more) of the following methods: T-DNA activation, TILLING, site-directed mutagenesis, transposon mutagenesis, direct evolution and homologous recombination, or by introducing and expressing in a plant a nucleic acid encoding an FG-GAP polypeptide or homologue thereof. These methods are defined in the section titled "Definitions". Following introduction of genetic modification, there follows a step of selecting for modified expression of a nucleic acid encoding an FG-GAP polypeptide or homologue thereof, whose modification in expression generates plants having increased yield.

Ativação de T-DNA, TILLING, mutagênese sítio dirigida, mutagênese por transposon e evolução direta são exemplos de tecnologias que possibilitam a geração de novos alelos e variantes de FG-GAP.T-DNA activation, TILLING, site-directed mutagenesis, transposon mutagenesis, and direct evolution are examples of technologies that enable the generation of new FG-GAP alleles and variants.

Um método preferido para introduzir uma modificação genética (que neste caso não precisa ser no locus de um gene FG-GAP) é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo deste, como definido acima. O ácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico de comprimento completo ou pode ser uma porção ou uma seqüência hibridizante como definido acima. Preferivelmente, a planta na qual a modificação genética é introduzida não é uma planta mutante dexl, na qual o gene DEXl não é funcional (Paxson-Sowders et al. 2001).A preferred method for introducing a genetic modification (which in this case need not be at the locus of an FG-GAP gene) is to introduce and express into a plant a nucleic acid encoding an FG-GAP polypeptide or homologue thereof as defined above. The nucleic acid to be introduced into a plant may be a full length nucleic acid or may be a hybridizing moiety or sequence as defined above. Preferably, the plant into which the genetic modification is introduced is not a dexl mutant plant in which the DEX1 gene is not functional (Paxson-Sowders et al. 2001).

"Homólogos" de uma proteína são definidos na seção intitulada "Definições". O polipeptídeo FG-GAP ou homólogo deste pode ser um derivado, como definido na seção "Definições"."Homologs" of a protein are defined in the section entitled "Definitions". The FG-GAP polypeptide or homologue thereof may be a derivative as defined in the "Definitions" section.

O polipeptídeo FG-GAP ou homólogo desta pode ser codificado por uma variante de união alternativa de um ácido nucleico/gene FG-GAP. O termo "variante de união alternativa" é como definido neste lugar. São preferidas variantes de união do ácido nucleico codificando um polipeptídeo compreendendo um peptídeo sinal, um ou mais domínios FG- GAP e um domínio transmembrana localizado na metade C-terminal da proteína, e preferivelmente também um ou mais dos motivos conservados de SEQ ID NO: 50 a 52. Ainda preferidas são variantes de união representadas por SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56 ou SEQ ID NO: 58, ou uma variante de união do ácido nucleico representado por SEQ ID NO: 72, ou uma variante de união de um dos genes dos quais as seqüências em Tabela 8 são derivadas. A mais preferida é a variante de união representada por SEQ ID NO: 45.The FG-GAP polypeptide or homologue thereof can be encoded by an alternative nucleic acid / FG-GAP gene splice variant. The term "alternative joining variant" is as defined herein. Nucleic acid binding variants encoding a polypeptide comprising a signal peptide, one or more FG-GAP domains and a transmembrane domain located at the C-terminal half of the protein, and preferably also one or more of the conserved motifs of SEQ ID NO: are preferred. 50 to 52. Still preferred are binding variants represented by SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56 or SEQ ID NO: 58, or a nucleic acid binding variant represented by SEQ ID NO: 72, or a splice variant of one of the genes from which the sequences in Table 8 are derived. Most preferred is the joint variant represented by SEQ ID NO: 45.

O homólogo também pode ser codificado por uma variante alélica de um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo deste, preferivelmente uma variante alélica de um ácido nucleico codificando um polipeptídeo compreendendo um peptídeo sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C- terminal da proteína, e preferivelmente também um ou mais dos motivos conservados de SEQ ID NO: 50 a 52. Ainda preferivelmente, a variante alélica codificando o polipeptídeo FG-GAP é representada por qualquer uma de SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56 ou SEQ ID NO: 58. Mais preferivelmente, a variante alélica codificando o polipeptídeo FG-GAP é como representado por SEQ ID NO: 45. Variantes alélicas são definidas na seção "Definições".The homologue may also be encoded by an allelic variant of a nucleic acid encoding an FG-GAP polypeptide or a homologue thereof, preferably an allelic variant of a nucleic acid encoding a polypeptide comprising a signal peptide, one or more FG-GAP domains and a transmembrane domain located at the C-terminal half of the protein, and preferably also one or more of the conserved motifs of SEQ ID NO: 50 to 52. Still preferably, the allelic variant encoding the FG-GAP polypeptide is represented by any one of SEQ ID NO. : 45, SEQ ID NO: 54, SEQ ID NO: 56 or SEQ ID NO: 58. More preferably, the allelic variant encoding the FG-GAP polypeptide is as represented by SEQ ID NO: 45. Allelic variants are defined in the " Definitions".

De acordo com um aspecto preferido da presente invenção, expressão modulada do ácido nucleico FG-GAP ou variante deste é contemplada. Preferivelmente, a expressão modulada é superexpressão. Métodos para superexpressão de genes ou produtos de gene são bem documentados na técnica e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de estimuladores de transcrição ou estimuladores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou estimuladores podem ser introduzidos em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico FG- GAP ou variante deste. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene. Métodos para reduzir a expressão de genes ou produtos de gene também são bem documentados na técnica.In a preferred aspect of the present invention, modulated expression of the FG-GAP nucleic acid or variant thereof is contemplated. Preferably, the modulated expression is overexpression. Methods for overexpression of genes or gene products are well documented in the art and include, for example, overexpression directed by appropriate promoters, the use of transcription enhancers or translation enhancers. Isolated nucleic acids serving as promoter or enhancer elements may be introduced at an appropriate (typically before) position in a nonheterologous form of a polynucleotide in order to enhance expression of a FG-GAP nucleic acid or variant thereof. For example, endogenous promoters may be altered in vivo by mutation, deletion, and / or substitution (see, Kmiec, U.S. Patent No. 5,565,350; Zarling et al., PCT / US93 / 03868), or isolated promoters. be introduced into a plant cell at the appropriate orientation and distance of a gene of the present invention to control gene expression. Methods for reducing gene expression or gene products are also well documented in the art.

Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer outro gene eucariótico.If polypeptide expression is desired, it is generally desirable to include a polyadenylation region at the 3 'end of a polynucleotide coding region. The polyadenylation region may be derived from the natural gene, a variety of other plant genes, or T-DNA. The 3 'end sequence to be added may be derived, for example, from the nopaline synthase or octopine synthase genes, or alternatively from another plant gene, or less preferably from any other eukaryotic gene.

Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citossol. Inclusão de um íntron processável na unidade de transcrição tanto em construções vegetais como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes, Buchman and Berg, Mol. Cell biol. 8:4395-4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987). Tal estimulação intrônica de expressão gênica tipicamente é maior quando localizada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adh1-S 1, 2, e 6, o íntron Bronze-1 são conhecidos na técnica. Veja geralmente, The Maize Handbook, capítulo 116, Freeling and Walbot, Eds., Springer, Ν. Υ. (1994).An intronic sequence can also be added to the untranslated 5 'region or coding sequence of the partial coding sequence to increase the amount of mature message that accumulates in the cytosol. Inclusion of a processable intron in the transcriptional unit in both plant and animal constructs has been shown to increase gene expression at both mRNA and protein levels by up to 1000-fold, Buchman and Berg, Mol. Cell biol. 8: 4395-4405 (1988); Callis et al., Genes Dev. 1: 1183-1200 (1987). Such intronic stimulation of gene expression is typically greater when located near the 5 'end of the transcription unit. Using the introns of Adh1-S 1, 2, and 6 intron maize, the Bronze-1 intron are known in the art. See generally, The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, Ν. Υ (1994).

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.The invention also provides genetic constructs and vectors to facilitate introduction and / or expression of nucleotide sequences useful in the methods according to the invention.

Portanto, é fornecida uma construção gênica compreendendo:Therefore, a gene construct is provided comprising:

(i) um ácido nucleico FG-GAP ou variante deste, como definido acima;(i) an FG-GAP nucleic acid or variant thereof as defined above;

(ii) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i); e opcionalmente(ii) one or more control sequences capable of directing expression of the nucleic acid sequence of (i); and optionally

(iii)uma seqüência de término de transcrição; com a condição de que a construção gênica não é uma construção gênica tipo pPZP como descrito por Hajdukiewicz et al. (Plant Mol. BioL 25, 989-994) e Paxson-Sowders (2001).(iii) a transcription termination sequence; provided that the gene construct is not a pPZP-type gene construct as described by Hajdukiewicz et al. (Plant Mol. BioL 25, 989-994) and Paxson-Sowders (2001).

Construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando tecnologia de DNA recombinante bem conhecida por pessoas versadas na técnica. As construções gênicas podem ser inseridas em vetores, que podem estar comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas.Constructs useful in the methods according to the present invention may be constructed using recombinant DNA technology well known to those skilled in the art. Gene constructs may be inserted into commercially available vectors suitable for plant transformation and suitable for expression of the gene of interest in transformed cells.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo FG-GAP ou homólogo desta). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e são definidos na seção intitulada "Definições".Plants are transformed with a vector comprising the sequence of interest (i.e., a nucleic acid encoding an FG-GAP polypeptide or homologue thereof). The sequence of interest is operably linked to one or more control sequences (at least one promoter). The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably in this place and are defined in the section entitled "Definitions".

Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão da seqüência de ácidos nucleicos. Preferivelmente, o ácido nucleico FG-GAP ou variante funcional deste é operavelmente ligado a um promotor constitutivo. O termo "constitutivo" é como definido neste lugar. Preferivelmente, o promotor constitutivo capaz de expressar preferencialmente o ácido nucleico ao longo de toda a planta tem um perfil de expressão comparável a um promotor GOS2. Mais preferivelmente, o promotor constitutivo tem o mesmo perfil de expressão do que o promotor GOS2 de arroz, o mais preferivelmente, o promotor capaz de expressar preferencialmente o ácido nucleico ao longo de toda a planta é o promotor GOS2 de arroz (nucleotídeos 1 a 2193 da seqüência representada em SEQ ID NO: 49). Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico FG-GAP representado por SEQ ID NO: 45, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico FG-GAP quando dirigida por um promotor GOS2. Exemplos de outros promotores constitutivos que também podem ser usados para dirigir expressão de um ácido nucleico FG-GAP são mostrados em Tabela 3 na seção "Definições".Advantageously, any type of promoter may be used to direct expression of the nucleic acid sequence. Preferably, the FG-GAP nucleic acid or functional variant thereof is operably linked to a constitutive promoter. The term "constitutive" is as defined herein. Preferably, the constitutive promoter capable of preferentially expressing nucleic acid throughout the plant has an expression profile comparable to a GOS2 promoter. More preferably, the constitutive promoter has the same expression profile as the rice GOS2 promoter, most preferably, the promoter capable of preferentially expressing the entire plant nucleic acid is the rice GOS2 promoter (nucleotides 1 to 2193 of the sequence represented in SEQ ID NO: 49). It should be clear that the applicability of the present invention is not restricted to the FG-GAP nucleic acid represented by SEQ ID NO: 45, nor is the applicability of the invention restricted to the expression of an FG-GAP nucleic acid when directed by a GOS2 promoter. Examples of other constitutive promoters that may also be used to direct expression of an FG-GAP nucleic acid are shown in Table 3 in the "Definitions" section.

Opcionalmente, uma ou mais seqüências terminadoras também podem ser usadas na construção introduzida em uma planta. O termo "terminador" sendo definido na seção "Definições".Optionally, one or more terminator sequences may also be used in the construction introduced into a plant. The term "terminator" being defined in the "Definitions" section.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colEl.The genetic constructs of the invention may additionally include an origin of replication sequence that is required for maintenance and / or replication in a specific cell type. An example is when a genetic construct is required to be maintained in a bacterial cell as an episomal genetic element (e.g., plasmid or cosmid molecule). Preferred sources of replication include, but are not limited to, fl-ori and colEl.

A construção genética pode compreender opcionalmente um gene marcador selecionável como definido na seção "Definições" neste lugar.The genetic construct may optionally comprise a selectable marker gene as defined in the "Definitions" section herein.

A presente invenção também abrange plantas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas obteníveis pelo método de acordo com a presente invenção, cujas plantas têm introduzido nelas um ácido nucleico FG-GAP ou variante deste, como definido acima.The present invention also encompasses plants obtainable by the methods according to the present invention. The present invention therefore provides plants obtainable by the method according to the present invention, which plants have introduced into them an FG-GAP nucleic acid or variant thereof as defined above.

A invenção também fornece um método para a produção de plantas transgênicas tendo produção aumentada, compreendendo introdução e expressão em uma planta de um ácido nucleico FG-GAP ou uma variante deste como definido acima.The invention also provides a method for producing transgenic plants having increased production comprising introducing and expressing in a plant an FG-GAP nucleic acid or a variant thereof as defined above.

Mais especificamente, a presente invenção fornece a método para a produção de plantas transgênicas tendo produção aumentada, cujo método compreende:More specifically, the present invention provides the method for producing transgenic plants having increased yield, which method comprises:

(i) introduzir e expressar em a planta ou célula vegetal um ácido nucleico FG-GAP ou variante deste; e(i) introducing and expressing into the plant or plant cell an FG-GAP nucleic acid or variant thereof; and

(ii) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.(ii) cultivate the plant cell under conditions promoting plant growth and development.

O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.Nucleic acid can be introduced directly into a plant cell or into the plant itself (including introduction into a tissue, organ or any other part of a plant). According to a preferred feature of the present invention, the nucleic acid is preferably introduced into a plant by transformation.

O termo "transformação" é como definido na seção "Definições".The term "transformation" is as defined in the "Definitions" section.

A presente invenção claramente se estende a qualquer célula vegetal ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes vegetais e propágulos destas. A presente invenção adicionalmente de estende para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção. A invenção também inclui células hospedeiras contendo um ácido nucleico FG-GAP isolado ou variante deste. Células hospedeiras preferidas de acordo com a invenção são células vegetais. A invenção também se estende a partes aptas à colheita de uma planta tal como, mas não limitada a sementes, folhas, frutos, flores, safras de caule, rizomas, tubérculos e bulbos. A invenção além disso se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte apta à colheita de uma tal planta, tal como pelotas secas ou pós, óleo, gordura e ácidos graxos, amido e proteínas.The present invention clearly extends to any plant cell or plant produced by any of the methods described herein, and to all plant parts and seedlings thereof. The present invention further extends to encompass the progeny of a transformed or transfected primary cell, tissue, organ or whole plant that has been produced by any of the methods mentioned above, the sole requirement being that the progeny exhibit the same (s) genotypic and / or phenotypic trait (s) than those produced by the ancestor in the methods according to the invention. The invention also includes host cells containing an isolated or variant FG-GAP nucleic acid. Preferred host cells according to the invention are plant cells. The invention also extends to harvestable parts of a plant such as, but not limited to seeds, leaves, fruits, flowers, stem crops, rhizomes, tubers and bulbs. The invention furthermore relates to products derived from, preferably directly derived from, a harvestable part of such a plant, such as dried pellets or powders, oil, fat and fatty acids, starch and proteins.

A presente invenção também abrange uso de ácidos nucleicos FG-GAP ou variantes destes e uso de polipeptídeos FG-GAP ou homólogos destes.The present invention also encompasses use of FG-GAP nucleic acids or variants thereof and use of FG-GAP polypeptides or homologues thereof.

Um tal uso se refere a melhorar as características de crescimento de plantas, em particular para melhorar produção, especialmente produção de sementes. A produção de sementes pode incluir um ou mais dos seguintes: peso total aumentado de sementes, número aumentado de sementes cheias e número total aumentado de sementes.Such use refers to improving plant growth characteristics, in particular to improve yields, especially seed yields. Seed production may include one or more of the following: increased total seed weight, increased number of full seeds and increased total number of seeds.

Ácidos nucleicos FG-GAP ou variantes destes, ou polipeptídeos FG-GAP ou homólogos destes podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene FG-GAP ou variante deste. Os ácidos nucleicos/genes FG-GAP ou variantes destes, ou polipeptídeos FG- GAP ou homólogos destes pode ser usado para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo produção aumentada. O gene FG-GAP ou variante deste, por exemplo, pode ser um ácido nucleico como representado por qualquer um de SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, e SEQ ID NO: 72, ou genes dos quais as seqüências listadas em Tabela 8 foram derivadas.FG-GAP nucleic acids or variants thereof, or FG-GAP polypeptides or homologues thereof may find use in breeding programs in which a DNA marker that can be genetically linked to an FG-GAP gene or variant thereof is identified. FG-GAP nucleic acids / genes or variants thereof, or FG-GAP polypeptides or homologues thereof may be used to define a molecular marker. This DNA or protein marker can then be used in breeding programs to select plants having increased yield. The FG-GAP gene or variant thereof, for example, may be a nucleic acid as represented by any of SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, and SEQ ID NO: 72, or genes from which the sequences listed in Table 8 were derived.

Variantes alélicas de um ácido nucleico/gene FG-GAP também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem "natural" causada não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que gera produção aumentada. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão, por exemplo, variantes alélicas diferentes de qualquer um de SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, e SEQ ID NO: 72, ou de uma das seqüências de codificação de quais as seqüências listadas em Tabela 8 foram derivadas. Desempenho de crescimento pode ser monitorado em uma casa de vegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantas, nas quais a variante alélica superior foi identificada, com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.Allelic variants of a FG-GAP nucleic acid / gene may also find use in marker-assisted breeding programs. Such breeding programs sometimes require introduction of allelic variation by mutagenic treatment of plants, using for example EMS mutagenesis; alternatively, the program may start with a collection of allelic variants of the so-called "natural" origin caused unintentionally. Identification of allelic variants then occurs, for example, by PCR. This is followed by a step for selecting superior allelic variants of the sequence in question and generating increased production. Selection is typically performed by monitoring growth performance of plants containing different allelic variants of the sequence in question, for example, allelic variants different from any of SEQ ID NO: 45, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO : 58, and SEQ ID NO: 72, or one of the coding sequences from which the sequences listed in Table 8 were derived. Growth performance can be monitored in a greenhouse or in the field. Additional optional steps include crossing plants in which the superior allelic variant has been identified with another plant. This can be used, for example, to make a combination of interesting phenotypic characteristics.

Um ácido nucleico FG-GAP ou variante deste também pode ser usado como sondas para mapear geneticamente e fisicamente os genes dos quais eles são uma parte de, e como marcadores para características ligadas a estes genes. Tal informação pode ser útil em melhoramento vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos FG-GAP ou variantes destes requer apenas uma seqüência de ácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos FG- GAP ou variantes destes podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição pode ser sondado com os ácidos nucleicos FG-GAP ou variantes destes. Os padrões de bandeamento resultantes então podem ser sujeitos a análises genéticas usando programas de computador tal como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição do ácido nucleico FG-GAP ou variante deste no mapa genético obtido previamente usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331).An FG-GAP nucleic acid or variant thereof can also be used as probes to genetically and physically map the genes of which they are a part of, and as markers for traits linked to these genes. Such information may be useful in plant breeding in order to develop strains with desired phenotypes. Such use of FG-GAP nucleic acids or variants thereof requires only a nucleic acid sequence of at least 15 nucleotides in length. FG-GAP nucleic acids or variants thereof may be used as restriction fragment length polymorphism (RFLP) markers. Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) of restriction digested plant genomic DNA can be probed with FG-GAP nucleic acids or variants thereof. The resulting banding patterns can then be subjected to genetic analysis using computer programs such as MapMaker (Lander et al. (1987) Genomics 1: 174-181) in order to construct a genetic map. In addition, nucleic acids can be used to probe Southern blots containing restriction endonuclease-treated genomic DNAs from a set of individuals representing ancestor and progeny of a defined genetic crossover. Segregation of DNA polymorphisms is observed and used to calculate the position of FG-GAP nucleic acid or variant on the genetic map previously obtained using this population (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314- 331).

A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético são descritos em Bernatzky and Tanksley (Plant Mol. Biol. Repórter 4: 37-41, 1986). Numerosas publicações descrevem mapeamento genético de clones de cDNA específicos usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens isogênicas próximas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica.The production and use of plant gene derived probes for use in genetic mapping are described in Bernatzky and Tanksley (Plant Mol. Biol. Reporter 4: 37-41, 1986). Numerous publications describe genetic mapping of specific cDNA clones using the methodology described above or variations thereof. For example, F2 crossover populations, inbreeding populations, randomly crossed populations, nearby isogenic strains, and other sets of individuals may be used for mapping. Such methodologies are well known to those skilled in the art.

As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., localização de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas aí).Nucleic acid probes may also be used for physical mapping (ie, location of sequences in physical maps; see Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, and references cited there).

Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoramentos em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.In another embodiment, nucleic acid probes may be used in direct mapping by fluorescence in situ hybridization (FISH) (Trask (1991) Trends Genet. 7: 149-154). Although current FISH mapping methods favor the use of large clones (several kb to several hundred kb; see Laan et al. (1995) Genome Res. 5: 13-20), sensitivity improvements may allow FISH mapping performance using probes. smaller ones.

Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser realizada usando os ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para projetar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. O projeto de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os ancestrais do cruzamento de mapeamento na região correspondente à seqüência imediata de ácidos nucleicos. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.A variety of nucleic acid amplification based methods for genetic and physical mapping can be performed using nucleic acids. Examples include allele-specific amplification (Kazazian (1989) J. Lab. Clin. Med. 11: 95-96), PCR amplified fragment polymorphism (CAPS; Sheffield et al. (1993) Genomics 16: 325-332), allele binding specific (Landegren et al. (1988) Science 241: 1077-1080), nucleotide extension reactions (Sokolov (1990) Nucleic Acid Res. 18: 3671), Radiation Hybrid Mapping (Walter et al. (1997) Nat Genet. 7: 22-28) and Appropriate Mapping (Dear and Cook (1989) Nucleic Acid Res. 17: 6795-6807). For these methods, the nucleic acid sequence is used to design and produce primer pairs for use in the amplification reaction or primer extension reactions. The design of such initiators is well known to those skilled in the art. In methods employing PCR-based genetic mapping, it may be necessary to identify DNA sequence differences between the mapping ancestors in the region corresponding to the immediate sequence of nucleic acids. This, however, is generally not required for mapping methods.

Os métodos de acordo com a presente invenção resultam em plantas tendo produção aumentada, como descrito acima. Estas características de crescimento vantajosas também podem ser combinadas com outras características economicamente vantajosas, tal como características adicionais que estimulam produção, tolerância a vários estresses, características modificando vários atributos arquitetônicos e/ou atributos bioquímicos e/ou fisiológicos.The methods according to the present invention result in plants having increased yield as described above. These advantageous growth characteristics may also be combined with other economically advantageous characteristics, such as additional characteristics that stimulate production, tolerance to various stresses, characteristics modifying various architectural attributes and / or biochemical and / or physiological attributes.

CYP90B de Descrição DetalhadaCYP90B Detailed Description

O termo "polipeptídeo CYP90B ou homólogo desta" como definido neste lugar se refere a um polipeptídeo compreendendo os seguintes: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição.The term "CYP90B polypeptide or homologue thereof" as defined herein refers to a polypeptide comprising the following: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position.

Além disso, o polipeptídeo CYP90B ou homólogo desta pode compreender adicionalmente (i) uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78 e (ii) atividade enzimática de esteróide 22 alfa hidroxilase.In addition, the CYP90B polypeptide or homologue thereof may further comprise (i) a sequence with more than 50% identity to SEQ ID NO: 78 and (ii) steroid 22 alpha hydroxylase enzymatic activity.

Exemplos de um polipeptídeo CYP90B como definido acima são dados em Tabela 9a neste lugar.Examples of a CYP90B polypeptide as defined above are given in Table 9a herein.

Um polipeptídeo CYP90B ou homólogo deste é codificado por um ácido nucleico/gene CYP90B. Portanto o termo "ácido nucleico/gene CYP90B" como definido neste lugar é qualquer ácido nucleico/gene codificando um polipeptídeo CYP90B ou um homólogo deste como definido acima.A CYP90B polypeptide or homologue thereof is encoded by a CYP90B nucleic acid / gene. Therefore the term "CYP90B nucleic acid / gene" as defined herein is any nucleic acid / gene encoding a CYP90B polypeptide or homologue thereof as defined above.

Os vários domínios estruturais encontrados na superfamília CYP de proteínas, incluindo em polipeptídeos CYP90B da presente invenção, são bem conhecidos na técnica e podem ser identificados usando bancos de dados gerais e.g. SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et ai, (2003) Nucl. Acids. Res. 31, 315-318; http://www.ebi.ac.uk/interpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation, in ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAI Press, Menlo Park; Hulo et ai., Nucl. Acids. Res. 32.-D134-D137, (2004), http://www.expasy.org/prosite/) ou Pfam (Bateman et ai, Nucleic Acids Research 30(l):276-280 (2002), http://www.sanger.ac.uk/Sofitware/Pfam/}.The various structural domains found in the CYP superfamily of proteins, including CYP90B polypeptides of the present invention, are well known in the art and can be identified using general databases eg SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al. (2003) Nucl. Acids 31, 315-318; http://www.ebi.ac.uk/interpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequence motifs and its funetion in automatic sequence interpretation, in ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAI Press, Menlo Park; Hulo et al., Nucl. Acids Res. 32.-D134-D137, (2004), http://www.expasy.org/prosite/) or Pfam (Bateman et al., Nucleic Acids Research 30 (l): 276 -280 (2002), http: // www.sanger.ac.uk/Sofitware/Pfam/}.

Bancos de dados especializados também podem ser procurados em http://arabidopsis-P450.biotec.uiuc.edu/cgi-bin/p450.pl para Arabidopsis, ou mais geralmente na Página da Internet de CYP http://drnelson.utmem.edu/CytochromeP450.html. Domínios estruturais típicos encontrados em CYP podem ser os quatro domínios AaD como descrito originalmente por Kalb & Loper ((1988) Proc Natl Acad Sci 85: 7221-7225). O domínio A (também chamado hélice I) compreende a seqüência consenso Ala/Gly-Gly-X-Asp/Glu-Thr-Thr/Ser, e é proposto se ligar a dioxigênio. O domínio B é o domínio de ligação de esteróide. O domínio D corresponde ao domínio de ligação heme e compreende a mais característica seqüência consenso de aminoácidos CYP (Phe-X-X-Gly-X-Arg- X-Cys-X-Gly) (Figuras 10 e 13).Specialized databases can also be searched at http://arabidopsis-P450.biotec.uiuc.edu/cgi-bin/p450.pl for Arabidopsis, or more generally on the CYP Website http://drnelson.utmem. edu / CytochromeP450.html. Typical structural domains found in CYP may be the four AaD domains as originally described by Kalb & Loper ((1988) Proc Natl Acad Sci 85: 7221-7225). Domain A (also called Helix I) comprises the consensus sequence Ala / Gly-Gly-X-Asp / Glu-Thr-Thr / Ser, and is proposed to bind to dioxigen. Domain B is the steroid binding domain. The D domain corresponds to the heme binding domain and comprises the most characteristic CYP amino acid consensus sequence (Phe-X-X-Gly-X-Arg-X-Cys-X-Gly) (Figures 10 and 13).

A presença de seqüências consenso pode ser identificada usando métodos para o alinhamento de seqüências para comparação como descrito acima. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca. Por exemplo usando BLAST, o limiar de significância estatística (chamado valor "esperado") para relatar identidades contra seqüências de banco de dados pode ser aumentado para mostrar identidades menos estringentes. Desta maneira, identidades curtas praticamente exatas podem ser identificadas. A seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser dentro do domínio A do polipeptídeo CYP90B (compreendendo a seqüência consenso Ala/Gly-Gly-X-Asp/Glu- Thr-Thr/Ser como definida acima) como definido neste lugar pode ser identificada desta maneira, como uma pessoa versada na técnica deve estar bem ciente.The presence of consensus sequences can be identified using methods for sequence alignment for comparison as described above. In some instances, the default parameters may be adjusted to modify the search stringency. For example using BLAST, the threshold of statistical significance (called the "expected" value) for reporting identities against database sequences can be increased to show less stringent identities. In this way, practically exact short identities can be identified. The Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence within domain A of the CYP90B polypeptide (comprising the Ala / Gly-Gly-X-Asp / Glu- Thr-Thr / Ser consensus sequence as defined above) ) as defined herein can be identified in this manner, as a person skilled in the art should be well aware.

Outro domínio identificado em proteínas CYP P450, e em particular no polipeptídeo CYP90B da invenção, pode ser o domínio âncora no término N da proteína para direcionamento de membrana, rico em resíduos hidrofóbicos tal como Leu, lie, Vai, pH e Ala. O domínio âncora N-terminal é tipicamente entre 20 a 40 aminoácidos de comprimento, mas pode ser menor (até 10 aminoácidos) ou maior (até 100 aminoácidos). O domínio âncora N- terminal é separado do resto da proteína (domínio globular) por um domínio de transição compreendendo um agrupamento de resíduos básicos (pelo menos dois, ou Lys ou Arg, chamado o sinal de interrupção de transferência) precedendo um agrupamento de prolina que forma uma dobradiça entre o domínio âncora mencionado acima e o domínio globular da proteína. Uma seqüência consenso típica para o domínio de transição é Lys/Arg-Lys/Arg- (X)3-9-Pro-Pro-Gly (Figuras 10 e 13). Uma tal seqüência consenso pode ser identificada como mencionado acima.Another domain identified in CYP P450 proteins, and in particular the CYP90B polypeptide of the invention, may be the N-terminus anchor domain of the membrane-targeting protein rich in hydrophobic residues such as Leu, Ile, Val, pH and Ala. The N-terminal anchor domain is typically between 20 and 40 amino acids in length, but may be smaller (up to 10 amino acids) or larger (up to 100 amino acids). The N-terminal anchor domain is separated from the rest of the protein (globular domain) by a transition domain comprising a grouping of basic residues (at least two, or Lys or Arg, called the transfer interrupt signal) preceding a proline grouping. forming a hinge between the anchor domain mentioned above and the globular domain of the protein. A typical consensus sequence for the transition domain is Lys / Arg-Lys / Arg- (X) 3-9-Pro-Pro-Gly (Figures 10 and 13). Such a consensus sequence can be identified as mentioned above.

A presença de um domínio âncora hidrofóbico N-terminal pode ser prontamente identificada. Composição primária de aminoácidos (em%) para determinar se um domínio de polipeptídeo é rico em aminoácidos específicos pode ser calculada usando programas de aplicativos computacionais do servidor ExPASy, em particular a ferramenta ProtParam (Gasteiger E et al. (2003) ExPASy: o servidor de proteômicos para conhecimento e análise detalhada de proteína. Nucleic Acids Res 31:3784- 3788). A composição da proteína de interesse pode ser então comparada com a composição média de aminoácidos (em%) no banco de dados Swiss-Prot Protein Sequence. Dentro deste banco de dados, a adição das médias de Leu (L), Ile (I), Val (V), pH e (F) e Ala (A) é de 34,04%. Como um exemplo, o domínio âncora hidrofóbico N-terminal de SEQ ID NO: 78 contém 62,5% dos mesmos resíduos hidrofóbicos. Como definido neste lugar, um domínio âncora hidrofóbico N-terminal tem um conteúdo de aminoácidos hidrofóbicos (em termos de%) acima do que aquele na composição média de aminoácidos (em termos de%) das proteínas no banco de dados Swiss-Prot Protein Sequence.The presence of an N-terminal hydrophobic anchor domain can be readily identified. Primary amino acid composition (in%) to determine if a polypeptide domain is rich in specific amino acids can be calculated using ExPASy server computer application programs, in particular the ProtParam tool (Gasteiger E et al. (2003) ExPASy: the server of proteomics for knowledge and detailed protein analysis (Nucleic Acids Res 31: 3784-3788). The protein composition of interest can then be compared to the average amino acid composition (in%) in the Swiss-Prot Protein Sequence database. Within this database, the mean addition of Leu (L), Ile (I), Val (V), pH e (F) and Ala (A) is 34.04%. As an example, the N-terminal hydrophobic anchor domain of SEQ ID NO: 78 contains 62.5% of the same hydrophobic residues. As defined herein, an N-terminal hydrophobic anchor domain has a hydrophobic amino acid content (in terms of%) higher than that in the average amino acid composition (in terms of%) of proteins in the Swiss-Prot Protein Sequence database. .

Aplicativos computacionais especiais tal como ProtScale (Gasteiger et al. (2005) Protein Identification and Analysis Tools on the ExPASy Server. In John M. Walker, ed: The Proteomics Protocols Handbook, Humana Press pp. 571-607) computam e representam o perfil produzido por qualquer escala de aminoácidos em uma proteína selecionada. Uma escala de aminoácidos é definida por um valor numérico assinalado a cada tipo de aminoácido. As escalas mais freqüentemente usadas são as escalas de hidrofobicidade ou hidrofilicidade e as escalas de parâmetros conformacionais de estrutura secundária. Uma das mais freqüentemente usadas escalas de hidrofobicidade de aminoácidos foi produzida por Kyte & Doolittle ((1982) J. Mol. Biol. 157:105-132), na qual aminoácidos hidrofóbicos tiveram num número positivo atribuído, e aminoácidos hidrofílicos um número negativo.Special computational applications such as ProtScale (Gasteiger et al. (2005) Protein Identification and Analysis Tools on the ExPASy Server. In John M. Walker, ed: The Proteomics Protocols Handbook, Humana Press pp. 571-607) compute and represent the profile. produced by any scale of amino acids in a selected protein. An amino acid scale is defined by a numerical value assigned to each type of amino acid. The most frequently used scales are hydrophobicity or hydrophilicity scales and secondary structure conformational parameter scales. One of the most frequently used amino acid hydrophobicity scales was produced by Kyte & Doolittle ((1982) J. Mol. Biol. 157: 105-132), in which hydrophobic amino acids were assigned a positive number, and hydrophilic amino acids a negative number.

Por exemplo, o perfil de resultado de ProtScale para hidrofobicidade do polipeptídeo CYP90B da invenção mostra claramente que aproximadamente os 34 primeiros aminoácidos N-terminais representam um domínio hidrofóbico, pois estes estão localizados acima da linha delimitando zero (Figura 12). Esta região corresponde ao domínio âncora N-terminal. Uma pessoa versada na técnica deve estar bem ciente de tais análises.For example, the ProtScale result profile for hydrophobicity of the CYP90B polypeptide of the invention clearly shows that approximately the first 34 N-terminal amino acids represent a hydrophobic domain as they are located above the zero delimiting line (Figure 12). This region corresponds to the N-terminal anchor domain. A person skilled in the art should be well aware of such analyzes.

Polipeptídeos CYP90B ou homólogos destes podem ser prontamente identificados usando técnicas de rotina bem conhecidas na técnica, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas que maximiza o número de identidades e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através de National Centre for Biotechnology Information. Homólogos de CYP90B compreendendo uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78 podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83) disponível em http://clustalw.genome.jp/sit-bin/nph-ClustalW, com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Edição manual secundária pode ser realizada para otimizar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na técnica.CYP90B polypeptides or homologues thereof can be readily identified using routine techniques well known in the art, such as by sequence alignment. Methods for sequence alignment for comparison are well known in the art, such methods include GAP, BESTFIT, BLAST, FASTA and TFASTA. GAP uses the algorithm of Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) to find the alignment of two complete sequences that maximizes the number of identities and minimizes the number of gaps. The BLAST algorithm (Altschul et al. (1990) J Mol Biol 215: 403-10) calculates percent sequence identity and performs a statistical analysis of similarity between the two sequences. The computer application for performing BLAST analysis is publicly available through the National Center for Biotechnology Information. CYP90B homologues comprising a sequence with more than 50% identity with SEQ ID NO: 78 can be readily identified using, for example, the ClustalW multiple sequence alignment algorithm (version 1.83) available at http://clustalw.genome .jp / sit-bin / nph-ClustalW, with the standard paired alignment parameters, and a percentage scoring method. Secondary manual editing can be performed to optimize alignment between retained subjects, as should be apparent to a person skilled in the art.

Exemplos de polipeptídeos CYP90B ou homólogos destes (codificados por seqüência de polinucleotídeos número de acesso em parênteses) são dados em Tabela 9a. Tabela 9b sustenta seqüências CYP90B parciais codificando quadros de leitura aberta (ORF) CYP90B parciais.Examples of or homologous CYP90B polypeptides (encoded by accession number polynucleotide sequence in parentheses) are given in Table 9a. Table 9b supports partial CYP90B sequences encoding partial CYP90B open reading frames (ORF).

Tabela 9: a) Exemplos de homólogos de CYP90BTable 9: a) Examples of CYP90B homologues

<table>table see original document page 95</column></row><table> Tabela 9: b) Exemplos de CYP90B com um quadro aberto de leitura (ORF) parcial<table> table see original document page 95 </column> </row> <table> Table 9: b) Examples of CYP90B with a partial open reading frame (ORF)

<table>table see original document page 96</column></row><table><table> table see original document page 96 </column> </row> <table>

* Processamento manual a partir de clone genômico* Manual processing from genomic clone

** Agrupamento de seqüências compilado a partir de diversos acessos EST (os principais mostrados); qualidade de seqüenciamento de EST sendo normalmente inferior, umas poucas substituições de aminoácidos podem ser esperadas.** Sequence grouping compiled from several EST accesses (the main ones shown); If EST sequencing quality is usually inferior, a few amino acid substitutions can be expected.

Deve ser entendido que seqüências caindo sob a definição de "polipeptídeo CYP90B ou homólogo desta" não devem ser limitadas às seqüências representadas por SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88 ou SEQ ID NO: 90, mas que qualquer polipeptídeo compreendendo os seguintes: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly- His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição pode ser adequado para uso em desempenho da invenção.It should be understood that sequences falling under the definition of "CYP90B polypeptide or homologue thereof" should not be limited to the sequences represented by SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88 or SEQ ID NO: 90, but any polypeptide comprising the following: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position may be suitable for use in performance of the invention.

As seqüências caindo sob a definição de "polipeptídeo CYP90B ou homólogo desta" podem compreender adicionalmente (i) uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78 e (ii) atividade enzimática de esteróide 22 alfa hidroxilase.Sequences falling under the definition of "CYP90B polypeptide or homologue thereof" may additionally comprise (i) a sequence with more than 50% identity to SEQ ID NO: 78 and (ii) steroid 22 alpha hydroxylase enzymatic activity.

Polipeptídeos CYP90B ou homólogos destes têm atividade enzimática de 22-alfa hidroxilase, a qual pode ser determinado por teste de complementação usando plantas tendo uma mutação em DWF4. Tais plantas mutantes são descritas em Arabidopsis (dw/4 mutante) por Choe et ai. ((1998) Plant Cell 10:231-243) e em arroz (Tos2091 mutante) por Tanaka et al (US2004/0060079). O tamanho destas plantas mutantes é diversas vezes menor do que aquele de seus tipo selvagens correspondentes, i.e., as plantas mutantes são super definhadas. O polipeptídeo isolado é colocado sob o controle de um promotor capaz de expressar este polipeptídeo em plantas, em um vetor de DNA recombinante adequado para transformação vegetal. As plantas mutantes são então transformada com este vetor, usando técnicas que são bem conhecidas na técnica. Se as plantas transformadas não apresentam mais o fenótipo super definhado que é indicativo de que o polipeptídeo isolado é capaz de apresentar atividade enzimática de 22-alfa hidroxilase. Um tal polipeptídeo pode ser adequado para uso em desempenho dos métodos da invenção.CYP90B polypeptides or homologues thereof have 22-alpha hydroxylase enzymatic activity, which can be determined by complementation testing using plants having a DWF4 mutation. Such mutant plants are described in Arabidopsis (dw / 4 mutant) by Choe et al. ((1998) Plant Cell 10: 231-243) and in rice (Tos2091 mutant) by Tanaka et al (US2004 / 0060079). The size of these mutant plants is several times smaller than that of their corresponding wild type, i.e., the mutant plants are overgrown. The isolated polypeptide is placed under the control of a promoter capable of expressing this polypeptide in plants in a recombinant DNA vector suitable for plant transformation. The mutant plants are then transformed with this vector using techniques that are well known in the art. If the transformed plants no longer have the over-wasted phenotype, it is indicative that the isolated polypeptide is capable of enzymatic 22-alpha hydroxylase activity. Such a polypeptide may be suitable for use in performing the methods of the invention.

Exemplos de ácidos nucleicos CYP90B incluem mas não são limitados àqueles representado por qualquer um de SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 ou SEQ ID NO: 89. Ácidos nucleicos/genes CYP90B e variantes destes podem ser adequados para praticar os métodos da invenção. Variantes de ácidos nucleicos/genes CYP90B incluem porções de um ácido nucleico/gene CYP90B e/ou ácidos nucleicos capazes de hibridizar com um ácido nucleico/gene CYP90B. O termo porção como definido neste lugar se refere a um pedaço de DNA codificando um polipeptídeo compreendendo os seguintes: (a) domínios CYP P450 AaD; (b) um domínio âncora hidrofóbico N- terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição. Uma porção pode ser preparada, por exemplo, fazendo uma ou mais deleções para um ácido nucleico CYP90B. As porções podem ser usadas em forma isolada ou elas podem ser fundidas a outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combina diversas atividades. Quando fundido a outras seqüências de codificação, o polipeptídeo resultante produzido em tradução pode ser maior do que aquele previsto para a porção CYP90B. Preferivelmente, a porção é uma porção de um ácido nucleico como representado por qualquer um de SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 e SEQ ID NO: 89. Mais preferivelmente a porção é uma porção de um ácido nucleico como representada por SEQ ID NO: 77.Examples of CYP90B nucleic acids include but are not limited to those represented by any of SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 or SEQ ID NO: 89. Nucleic acids / CYP90B genes and variants thereof may be suitable for practicing the methods of the invention. Nucleic acid / CYP90B gene variants include portions of a CYP90B nucleic acid / gene and / or nucleic acids capable of hybridizing to a CYP90B nucleic acid / gene. The term portion as defined herein refers to a piece of DNA encoding a polypeptide comprising the following: (a) CYP P450 AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position. A portion may be prepared, for example, by making one or more deletions to a CYP90B nucleic acid. The portions may be used in isolation or they may be fused to other coding (or non-coding) sequences to, for example, produce a protein that combines various activities. When fused to other coding sequences, the resulting translation produced polypeptide may be larger than that predicted for the CYP90B moiety. Preferably, the portion is a portion of a nucleic acid as represented by any of SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO. : 87 and SEQ ID NO: 89. More preferably the portion is a portion of a nucleic acid as represented by SEQ ID NO: 77.

Outra variante de um ácido nucleico/gene CYP90B é um ácido nucleico capaz de hibridizar em condições de estringência reduzida, preferivelmente em condições estringentes, com um ácido nucleico/gene CYP90B como definido acima, cuja seqüência hibridizante codifica um polipeptídeo compreendendo os seguintes: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser- Ser, admitindo uma mudança de aminoácido em qualquer posição. Preferivelmente, a seqüência hibridizante é um que é capaz de hibridizar com um ácido nucleico como representado por qualquer um de SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 e SEQ ID NO: 89, ou com uma porção de qualquer das seqüências mencionadas acima como definido acima. Mais preferivelmente a seqüência hibridizante é uma que é capaz de hibridizar com um ácido nucleico como representado por SEQ LD NO: 77. O termo "hibridização" é como definido neste lugar na seção "Definições".Another variant of a CYP90B nucleic acid / gene is a nucleic acid capable of hybridizing under reduced stringency conditions, preferably under stringent conditions, to a CYP90B nucleic acid / gene as defined above, whose hybridizing sequence encodes a polypeptide comprising the following: ) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, allowing an amino acid change at any position. Preferably, the hybridizing sequence is one that is capable of hybridizing to a nucleic acid as represented by any of SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 and SEQ ID NO: 89, or with a portion of any of the sequences mentioned above as defined above. More preferably the hybridizing sequence is one which is capable of hybridizing to a nucleic acid as represented by SEQ LD NO: 77. The term "hybridization" is as defined herein in the "Definitions" section.

O ácido nucleico CYP90B ou variante deste pode ser derivado de qualquer fonte natural ou artificial. O ácido nucleico/gene ou variante deste pode ser isolado de uma fonte microbiana, tal como levedura ou fungos, ou de uma fonte vegetal, algal ou animal (incluindo humano). Este ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana deliberada. O ácido nucleico é preferivelmente de origem vegetal, quer da mesma espécie de planta (por exemplo que aquela na qual ele é introduzido) ou quer de uma espécie diferente de planta. O ácido nucleico pode ser isolado de uma espécie monocotiledônea, preferivelmente da família Poaceae, ainda preferivelmente de gênero Oryza, o mais preferivelmente de Oryza sativa. Mais preferivelmente, o ácido nucleico CYP90B isolado de Oryza sativa é representado por SEQ ID NO: 77 e a seqüência de aminoácidos CYP90B é como representado por SEQ ID NO: 78.CYP90B nucleic acid or variant thereof may be derived from any natural or artificial source. The nucleic acid / gene or variant thereof may be isolated from a microbial source, such as yeast or fungi, or from a plant, algal or animal (including human) source. This nucleic acid may be modified from its native form in genomic composition and / or environment through deliberate human manipulation. The nucleic acid is preferably of plant origin, either from the same plant species (for example that into which it is introduced) or from a different plant species. The nucleic acid may be isolated from a monocot species, preferably from the Poaceae family, still preferably from the genus Oryza, most preferably from Oryza sativa. More preferably, the CYP90B nucleic acid isolated from Oryza sativa is represented by SEQ ID NO: 77 and the amino acid sequence CYP90B is as represented by SEQ ID NO: 78.

A invenção além disso fornece uma proteína CYP90B isolada selecionada a partir do grupo consistindo de:The invention further provides an isolated CYP90B protein selected from the group consisting of:

(a) uma proteína codificada pelo ácido nucleico de SEQ ID NO: 117;(a) a protein encoded by the nucleic acid of SEQ ID NO: 117;

(b) uma proteína compreendendo os seguintes: (i) domínios CYP AaD; (ii) um domínio âncora hidrofóbico N-terminal; (iii) um domínio de transição; e (iv) dentro do domínio A, a seqüência consenso Phe-Ala-Gly- His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, e tendo em ordem crescente de preferência pelo menos 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade com a seqüência de aminoácidos de SEQ ID NO: 118. A invenção também fornece um ácido nucleico isolado codificando uma proteína CYP90B, selecionado a partir do grupo consistindo de:(b) a protein comprising the following: (i) CYP AaD domains; (ii) an N-terminal hydrophobic anchor domain; (iii) a transition domain; and (iv) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, and in ascending order of preference at least 85%. %, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identity with the amino acid sequence of SEQ ID NO: 118. The invention also provides an isolated nucleic acid encoding a CYP90B protein selected from the group consisting of:

(i) um ácido nucleico como representado por SEQ ID NO: 117;(i) a nucleic acid as represented by SEQ ID NO: 117;

(ii) um ácido nucleico codificando uma proteína como definido em (a) e (b) acima;(ii) a nucleic acid encoding a protein as defined in (a) and (b) above;

(iii)um ácido nucleico tendo em ordem crescente de preferência pelo menos 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade com o ácido nucleico representado por SEQ ID NO: 117;(iii) a nucleic acid having in ascending order preferably at least 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more nucleic acid identity represented by SEQ ID NO: 117;

(iv) uma seqüência de ácidos nucleicos capaz de hibridizar em condições estringentes com uma seqüência de ácidos nucleicos de (i) a (iii) acima, cuja seqüência hibridizante codifica uma proteína compreendendo (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe- Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, e tendo em ordem crescente de preferência pelo menos 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade com a seqüência de aminoácidos de SEQ ID NO: 118;(iv) a nucleic acid sequence capable of hybridizing under stringent conditions to a nucleic acid sequence of (i) to (iii) above, whose hybridizing sequence encodes a protein comprising (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, and preferably in increasing order of at least 85%. %, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more of the amino acid sequence identity of SEQ ID NO: 118;

(v) um ácido nucleico que é uma variante alélica ou uma variante de união das seqüências de ácidos nucleicos de acordo com (i) a (iv);(v) a nucleic acid which is an allelic variant or a splice variant of nucleic acid sequences according to (i) to (iv);

(vi) uma porção de uma seqüência de ácidos nucleicos de acordo com qualquer de (i) a (v) acima, cuja porção codifica uma proteína compreendendo: (i) domínios CYP AaD; (ii) um domínio âncora hidrofóbico N-terminal; (iii) um domínio de transição; e (iv) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, e tendo em ordem crescente de preferência pelo menos 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% com a seqüência de aminoácidos de SEQ ID NO: 118.(vi) a portion of a nucleic acid sequence according to any of (i) to (v) above, which portion encodes a protein comprising: (i) CYP AaD domains; (ii) an N-terminal hydrophobic anchor domain; (iii) a transition domain; and (iv) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, and preferably ascending at least 85%. %, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% with the amino acid sequence of SEQ ID NO: 118

Além disso, o polipeptídeo CYP90B ou homólogo deste pode compreender adicionalmente (i) uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78 e (ii) atividade enzimática de esteróide 22 alfa hidroxilase.In addition, the CYP90B polypeptide or homologue thereof may further comprise (i) a sequence of greater than 50% identity to SEQ ID NO: 78 and (ii) steroid 22 alpha hydroxylase enzymatic activity.

A expressão de um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste pode ser aumentada não constitutiva introduzindo uma modificação genética (preferivelmente no locus de um gene CYP90B). O locus de um gene como definido neste lugar é adotado para significar uma região genômica, a qual inclui o gene de interesse e 10 kb antes ou depois da região de codificação.Expression of a nucleic acid encoding a CYP90B polypeptide or homologue thereof can be increased non-constitutively by introducing a genetic modification (preferably at the locus of a CYP90B gene). The locus of a gene as defined herein is adopted to mean a genomic region which includes the gene of interest and 10 kb before or after the coding region.

A modificação genética pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLING, mutagênese sítio dirigida, evolução direta e recombinação homóloga ou introduzindo e expressando em uma planta um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste. Os métodos mencionados acima são definidos na seção "Definições". Seguindo introdução da modificação genética, segue uma etapa de selecionar para expressão não constitutiva aumentada de um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste, cujo aumento em expressão não constitutiva gera plantas tendo produção aumentada.Genetic modification may be introduced, for example, by any one or more of the following methods: T-DNA activation, TILLING, site-directed mutagenesis, direct evolution and homologous recombination, or by introducing and expressing a nucleic acid encoding a plant. CYP90B polypeptide or a homologue thereof. The methods mentioned above are defined in the "Definitions" section. Following introduction of genetic modification, a step of selecting for increased non-constitutive expression of a nucleic acid encoding a CYP90B polypeptide or homologue thereof, whose increase in non-constitutive expression generates plants having increased yield, follows a step of selecting for genetic non-constitutive expression.

Ativação de T-DNA, TILLING, mutagênese sítio dirigida e evolução direta são exemplos de tecnologias que possibilitam a geração de novos alelos e variantes de CYP90B.T-DNA activation, TILLING, site-directed mutagenesis, and direct evolution are examples of technologies that enable the generation of new CYP90B alleles and variants.

Um método preferido para introduzir uma modificação genética (que neste caso não precisa ser no locus de um gene CYP90B) é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste. Um polipeptídeo CYP90B ou um homólogo deste é definido como polipeptídeo compreendendo os seguintes: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N- terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição. O ácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico de comprimento completo ou pode ser uma porção ou uma seqüência hibridizante como definido acima. Além disso, o ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste pode compreender adicionalmente (i) uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78 e (ii) atividade enzimática de esteróide 22 alfa hidroxilase.A preferred method for introducing a genetic modification (which in this case need not be at the locus of a CYP90B gene) is to introduce and express into a plant a nucleic acid encoding a CYP90B polypeptide or a homologue thereof. A CYP90B polypeptide or homologue thereof is defined as polypeptide comprising the following: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position. The nucleic acid to be introduced into a plant may be a full length nucleic acid or may be a hybridizing moiety or sequence as defined above. In addition, the nucleic acid encoding a CYP90B polypeptide or homologue thereof may further comprise (i) a sequence with more than 50% identity to SEQ ID NO: 78 and (ii) steroid 22 alpha hydroxylase enzymatic activity.

"Homólogos" de uma proteína são definidos neste lugar na seção "Definições". O polipeptídeo CYP90B ou homólogo deste pode ser um derivado, como definido na seção "Definições"."Protein homologues" are defined here in the "Definitions" section. The CYP90B polypeptide or homologue thereof may be a derivative as defined in the "Definitions" section.

O polipeptídeo CYP90B ou homólogo deste pode ser codificado por uma variante de união alternativa de um ácido nucleico/gene CYP90B. O termo "variante de união alternativa" é definido na seção "Definições". Variantes de união preferidas são variantes de união do ácido nucleico codificando um polipeptídeo compreendendo os seguintes: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe- Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição. Adicionalmente, o polipeptídeo CYP90B ou um homólogo deste pode compreender adicionalmente (i) uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78 e (ii) atividade enzimática de esteróide 22 alfa hidroxilase. Ainda preferidas são variantes de união de seqüências de ácidos nucleicos representadas por SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 e SEQ ED NO: 89. A mais preferida é uma variante de união de uma seqüência de ácidos nucleicos como representada por SEQ ID NO: 77.The CYP90B polypeptide or homologue thereof may be encoded by an alternate binding variant of a CYP90B nucleic acid / gene. The term "alternate union variant" is defined in the "Definitions" section. Preferred splice variants are nucleic acid splice variants encoding a polypeptide comprising the following: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, allowing an amino acid change at any position. Additionally, the CYP90B polypeptide or a homologue thereof may further comprise (i) a sequence with more than 50% identity to SEQ ID NO: 78 and (ii) steroid 22 alpha hydroxylase enzymatic activity. Still preferred are nucleic acid sequence splice variants represented by SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 and SEQ ED NO: 89. Most preferred is a splice variant of a nucleic acid sequence as represented by SEQ ID NO: 77.

O homólogo também pode ser codificado por uma variante alélica de um ácido nucleico codificando um polipeptídeo CYP90B ou um homólogo deste, preferivelmente uma variante alélica do ácido nucleico codificando um polipeptídeo compreendendo os seguintes: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His- Glu-Thr-Ser-Ser5 admitindo uma mudança de aminoácido em qualquer posição. Adicionalmente, o polipeptídeo CYP90B ou um homólogo deste pode compreender adicionalmente (i) uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78 e (ii) atividade enzimática de esteróide 22 alfa hidroxilase. Ainda preferidas são variantes alélicas de seqüências de ácidos nucleicos representadas por SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 e SEQ ID NO: 89. A mais preferida é uma variante alélica de uma seqüência de ácidos nucleicos como representada por SEQ ID NO: 77. Variantes alélicas também são definidas na seção "Definições".The homologue may also be encoded by an allelic variant of a nucleic acid encoding a CYP90B polypeptide or a homologue thereof, preferably an allelic variant of nucleic acid encoding a polypeptide comprising the following: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser5 consensus sequence assuming an amino acid change at any position. Additionally, the CYP90B polypeptide or a homologue thereof may further comprise (i) a sequence with more than 50% identity to SEQ ID NO: 78 and (ii) steroid 22 alpha hydroxylase enzymatic activity. Still preferred are allelic variants of nucleic acid sequences represented by SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 and SEQ ID Most preferred is an allelic variant of a nucleic acid sequence as represented by SEQ ID NO: 77. Allelic variants are also defined in the "Definitions" section.

De acordo com um aspecto preferido da presente invenção, expressão não constitutiva aumentada do ácido nucleico CYP90B ou variante deste é contemplada. Métodos para aumentar expressão de genes ou produtos de gene são bem documentados na técnica e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de estimuladores de transcrição ou estimuladores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou estimuladores podem ser introduzidos em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico CYP90B ou variante deste. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et ai, PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene. Métodos para reduzir a expressão de genes ou produtos de gene são bem documentados na técnica.In a preferred aspect of the present invention, increased non-constitutive expression of the CYP90B nucleic acid or variant thereof is contemplated. Methods for enhancing gene expression or gene products are well documented in the art and include, for example, overexpression directed by appropriate promoters, the use of transcriptional enhancers or translation enhancers. Isolated nucleic acids serving as promoter or enhancer elements may be introduced at an appropriate (typically before) position in a nonheterologous form of a polynucleotide in order to increase expression of a CYP90B nucleic acid or variant thereof. For example, endogenous promoters may be altered in vivo by mutation, deletion, and / or substitution (see, Kmiec, U.S. Patent No. 5,565,350; Zarling et al, PCT / US93 / 03868), or isolated promoters may be introduced into a plant cell at the appropriate orientation and distance of a gene of the present invention to control gene expression. Methods for reducing gene expression or gene products are well documented in the art.

Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer outro gene eucariótico.If polypeptide expression is desired, it is generally desirable to include a polyadenylation region at the 3 'end of a polynucleotide coding region. The polyadenylation region may be derived from the natural gene, a variety of other plant genes, or T-DNA. The 3 'end sequence to be added may be derived, for example, from the nopaline synthase or octopine synthase genes, or alternatively from another plant gene, or less preferably from any other eukaryotic gene.

Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citossol. Inclusão de um íntron processável na unidade de transcrição tanto em construções vegetais como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et ai. (1987) Genes Dev 1:1183- 1200). Tal estimulação intrônica de expressão gênica tipicamente é maior quando localizada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na técnica. Veja geralmente, The Maize Handbook, capítulo 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).An intronic sequence can also be added to the untranslated 5 'region or coding sequence of the partial coding sequence to increase the amount of mature message that accumulates in the cytosol. Inclusion of a processable intron in the transcription unit in both plant and animal constructs has been shown to increase gene expression at both mRNA and protein levels by up to 1000-fold (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et (1987) Genes Dev 1: 1183-1200). Such intronic stimulation of gene expression is typically greater when located near the 5 'end of the transcription unit. Using the introns of Adhl-S 1, 2, and 6 intron maize, the Bronze-I intron are known in the art. See generally, The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.The invention also provides genetic constructs and vectors to facilitate introduction and / or expression of nucleotide sequences useful in the methods according to the invention.

Portanto, é fornecida uma construção gênica compreendendo: (i) Um ácido nucleico CYP90B ou variante deste, como definido acima;Therefore, a gene construct is provided comprising: (i) A CYP90B nucleic acid or variant thereof as defined above;

(ii) Uma ou mais seqüências de controle capazes de dirigir expressão não constitutiva da seqüência de ácidos nucleicos de (i); e opcionalmente(ii) One or more control sequences capable of directing non-constitutive expression of the nucleic acid sequence of (i); and optionally

(iii) Uma seqüência de término de transcrição.(iii) A transcription termination sequence.

Construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando tecnologia de DNA recombinante bem conhecida por pessoas versadas na técnica. As construções gênicas podem ser inseridas em vetores, que podem estar comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção portanto fornece uso de uma construção gênica como definido acima nos métodos da invenção.Constructs useful in the methods according to the present invention may be constructed using recombinant DNA technology well known to those skilled in the art. Gene constructs may be inserted into commercially available vectors suitable for plant transformation and suitable for expression of the gene of interest in transformed cells. The invention therefore provides use of a gene construct as defined above in the methods of the invention.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo CYP90B ou homólogo deste). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e são definidos na seção "Definições".Plants are transformed with a vector comprising the sequence of interest (i.e., a nucleic acid encoding a CYP90B polypeptide or homologue thereof). The sequence of interest is operably linked to one or more control sequences (at least one promoter). The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably in this place and are defined in the "Definitions" section.

Vantajosamente, qualquer tipo não constitutivo de promotor pode ser usado para dirigir expressão da seqüência de ácidos nucleicos. O promotor não constitutivo pode ser um promotor induzível, i.e. tendo iniciação de transcrição induzida ou aumentada em resposta a um desenvolvimento, estímulo químico, ambiental ou físico. Um exemplo de um promotor induzível sendo um promotor induzível por estresse, i.e. um promotor ativado quando uma planta é exposta a várias condições de estresse. O promotor não constitutivo pode ser um promotor preferido por tecido, i.e. um que é capaz de iniciar preferencialmente transcrição em certos tecidos, tal como as folhas, raízes, tecido de semente etc. Promotores capazes de iniciar transcrição em certos tecidos são referidos neste lugar apenas como "tecido específicos".Advantageously, any non-constitutive type of promoter may be used to direct expression of the nucleic acid sequence. The non-constitutive promoter may be an inducible promoter, i.e. having induced or enhanced transcription initiation in response to a developmental, chemical, environmental or physical stimulus. An example of an inducible promoter being a stress-inducible promoter, i.e. a promoter activated when a plant is exposed to various stress conditions. The non-constitutive promoter may be a tissue preferred promoter, i.e. one which is capable of preferentially initiating transcription in certain tissues, such as leaves, roots, seed tissue, etc. Promoters capable of initiating transcription in certain tissues are referred to herein as "tissue specific" only.

De acordo com os métodos da invenção, o ácido nucleico CYP90B ou variante deste é operavelmente ligado a um promotor não constitutivo. Um promotor não constitutivo é transcricionalmente ativo apenas durante algumas fases de crescimento e desenvolvimento vegetal e não é ubiqüitariamente expresso. O promotor não constitutivo pode ser por exemplo um promotor semente específico, ou um promotor raiz específico. O promotor semente específico pode ser um promotor endosperma específico e/ou embrião/aleurona específico, i.e., transcricionalmente ativo no endosperma de semente e/ou embrião e aleurona de semente, respectivamente. O promotor endosperma específico é preferivelmente um promotor de proteína de armazenamento de semente, ainda preferivelmente o promotor endosperma específico é um promotor de prolamina, mais preferivelmente o promotor endosperma específico é um promotor de prolamina RP6 de arroz, ainda mais preferivelmente o promotor endosperma específico é representado por uma seqüência de ácidos nucleicos substancialmente similar a SEQ ID NO: 109, o mais preferivelmente o promotor endosperma específico é como representado por SEQ ID NO: 109.In accordance with the methods of the invention, CYP90B nucleic acid or variant thereof is operably linked to a non-constitutive promoter. A non-constitutive promoter is transcriptionally active only during some phases of plant growth and development and is not ubiquitously expressed. The non-constitutive promoter may be for example a specific seed promoter, or a specific root promoter. The specific seed promoter may be a specific endosperm promoter and / or embryo / specific aleurone, i.e. transcriptionally active in the seed endosperm and / or embryo and seed aleurone, respectively. The specific endosperm promoter is preferably a seed storage protein promoter, yet preferably the specific endosperm promoter is a prolamine promoter, more preferably the specific endosperm promoter is a rice RP6 prolamine promoter, even more preferably the specific endosperm promoter is. represented by a nucleic acid sequence substantially similar to SEQ ID NO: 109, most preferably the specific endosperm promoter is as represented by SEQ ID NO: 109.

O promotor embrião/aleurona específico é preferivelmente um promotor de proteína de armazenamento de semente, ainda preferivelmente o promotor embrião/aleurona específico é um promotor de oleosina, mais preferivelmente o promotor embrião/aleurona específico é um promotor de 18 kDa de oleosina de arroz, ainda mais preferivelmente o promotor embrião/aleurona específico é representado por uma seqüência de ácidos nucleicos substancialmente similar a SEQ ID NO: 110, o mais preferivelmente o promotor embrião/aleurona específico é como representado por SEQ ID NO: 110. O promotor raiz específico é preferivelmente um promotor Rcc3, o promotor raiz específico é preferivelmente um promotor Rcc3 de arroz (Xu et al. (1995) Plant Mol Biol 27(2):237-48).The embryo / specific aleurone promoter is preferably a seed storage protein promoter, yet preferably the embryo / specific aleurone promoter is an oleosin promoter, more preferably the embryo / specific aleurone promoter is an 18 kDa rice oleosin promoter, even more preferably the embryo / specific aleurone promoter is represented by a nucleic acid sequence substantially similar to SEQ ID NO: 110, most preferably the embryo / specific aleurone promoter is as represented by SEQ ID NO: 110. The specific root promoter is preferably an Rcc3 promoter, the specific root promoter is preferably a rice Rcc3 promoter (Xu et al. (1995) Plant Mol Biol 27 (2): 237-48).

Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico CYP90B representado por SEQ ID NO: 77, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico CYP90B quando dirigida por um promotor de prolamina RP6 ou oleosina de 18 kDa. Exemplos de outros promotores não constitutivos que também podem ser usados para realizar os métodos da invenção são mostrados em Tabela 4 na seção "Definições".It should be clear that the applicability of the present invention is not restricted to the CYP90B nucleic acid represented by SEQ ID NO: 77, nor is the applicability of the invention restricted to the expression of a CYP90B nucleic acid when directed by a PRP6 or oleosin promoter. kDa. Examples of other non-constitutive promoters that may also be used to perform the methods of the invention are shown in Table 4 in the "Definitions" section.

Em contraste com os promotores descritos acima, um promotor constitutivo é transcricionalmente ativo durante a maioria das fases de crescimento e desenvolvimento vegetal e é substancialmente ubiqüitariamente expresso na planta. Tais promotores constitutivos devem ser excluídos para desempenho dos métodos da invenção. Exemplos de tais promotores também podem ser encontrados na seção "Definições" (veja Tabela 3).In contrast to the promoters described above, a constitutive promoter is transcriptionally active during most stages of plant growth and development and is substantially ubiquitously expressed in the plant. Such constitutive promoters should be excluded for performance of the methods of the invention. Examples of such promoters can also be found in the "Definitions" section (see Table 3).

Opcionalmente, uma ou mais seqüências terminadoras também podem ser usadas na construção introduzida em uma planta. O termo "terminador" é definido na seção "Definições".Optionally, one or more terminator sequences may also be used in the construction introduced into a plant. The term "terminator" is defined in the "Definitions" section.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl -ori e colEl.The genetic constructs of the invention may additionally include an origin of replication sequence that is required for maintenance and / or replication in a specific cell type. An example is when a genetic construct is required to be maintained in a bacterial cell as an episomal genetic element (e.g., plasmid or cosmid molecule). Preferred sources of replication include, but are not limited to, fl -ori and colEl.

A construção genética pode compreender opcionalmente um gene marcador selecionável como definido na seção "Definições".The genetic construct may optionally comprise a selectable marker gene as defined in the "Definitions" section.

Em uma forma de realização preferida, é fornecida uma construção gênica compreendendo: (i) Um ácido nucleico CYP90B ou variante deste, como definido acima;In a preferred embodiment, a gene construct is provided comprising: (i) A CYP90B nucleic acid or variant thereof as defined above;

(ii) Um promotor capaz de dirigir expressão não constitutiva da seqüência de ácidos nucleicos de (i); e opcionalmente(ii) A promoter capable of directing non-constitutive expression of the nucleic acid sequence of (i); and optionally

(iii) Uma seqüência de término de transcrição.(iii) A transcription termination sequence.

O promotor não constitutivo é preferivelmente um promotor semente específico. O promotor semente específico pode ser um promotor endosperma específico e/ou embrião/aleurona específico, i.e., transcricionalmente ativo no endosperma de semente e/ou embrião e aleurona de semente, respectivamente. O promotor endosperma específico é preferivelmente um promotor de proteína de armazenamento de semente, ainda preferivelmente o promotor endosperma específico é um promotor de prolamina, mais preferivelmente o promotor endosperma específico é um promotor de prolamina RP6 de arroz, mais preferivelmente o promotor endosperma específico é representado por uma seqüência de ácidos nucleicos substancialmente similar a SEQ ID NO: 109, o mais preferivelmente o promotor endosperma específico é como representado por SEQ ID NO: 109. O promotor embrião/aleurona específico é preferivelmente um promotor de proteína de armazenamento de semente, ainda preferivelmente o promotor embrião/aleurona específico é um promotor de oleosina, mais preferivelmente o promotor embrião/aleurona específico é um promotor de 18 kDa de oleosina de arroz, mais preferivelmente o promotor embrião/aleurona específico é representado por uma seqüência de ácidos nucleicos substancialmente similar a SEQ ID NO: 110, o mais preferivelmente o promotor embrião/aleurona específico é como representado por SEQ ID NO: 110. A invenção adicionalmente fornece uso de uma construção como definido acima nos métodos da invenção.The non-constitutive promoter is preferably a specific seed promoter. The specific seed promoter may be a specific endosperm promoter and / or embryo / specific aleurone, i.e. transcriptionally active in the seed endosperm and / or embryo and seed aleurone, respectively. The specific endosperm promoter is preferably a seed storage protein promoter, yet preferably the specific endosperm promoter is a prolamine promoter, more preferably the specific endosperm promoter is a rice RP6 prolamine promoter, more preferably the specific endosperm promoter is represented. by a nucleic acid sequence substantially similar to SEQ ID NO: 109, most preferably the specific endosperm promoter is as represented by SEQ ID NO: 109. The embryo / specific aleurone promoter is preferably a seed storage protein promoter, yet preferably the embryo / specific aleurone promoter is an oleosin promoter, more preferably the embryo / specific aleurone promoter is an 18 kDa rice oleosin promoter, more preferably the embryo / specific aleurone promoter is represented by a substantially similar nucleic acid sequenceSEQ ID NO: 110, most preferably the embryo / specific aleurone promoter is as represented by SEQ ID NO: 110. The invention further provides use of a construct as defined above in the methods of the invention.

A presente invenção também abrange plantas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas, partes vegetais ou células vegetais destas obteníveis pelo método de acordo com a presente invenção, cujas plantas ou partes ou células destas compreendem um ácido nucleico CYP90B transgênico ou variante deste.The present invention also encompasses plants obtainable by the methods according to the present invention. The present invention therefore provides plants, plant parts or plant cells thereof obtainable by the method according to the present invention, which plants or parts or cells thereof comprise a transgenic CYP90B nucleic acid or variant thereof.

A invenção também fornece um método para a produção de plantas transgênicas tendo produção aumentada em relação a plantas de controle adequadas compreendendo introdução e expressão não constitutiva em uma planta de um ácido nucleico CYP90B ou uma variante deste.The invention also provides a method for producing transgenic plants having increased yield over suitable control plants comprising introducing and non-constitutive expression into a plant of a CYP90B nucleic acid or a variant thereof.

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo produção aumentada cujo método compreende:More specifically, the present invention provides a method for producing transgenic plants having increased yield which method comprises:

(i) introduzir e expressar não constitutivamente em uma planta, parte vegetal ou célula vegetal um ácido nucleico CYP90B ou variante deste; e(i) introducing and constitutively expressing in a plant, plant part or plant cell a nucleic acid CYP90B or variant thereof; and

(ii) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.(ii) cultivate the plant cell under conditions promoting plant growth and development.

O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.Nucleic acid can be introduced directly into a plant cell or into the plant itself (including introduction into a tissue, organ or any other part of a plant). According to a preferred feature of the present invention, the nucleic acid is preferably introduced into a plant by transformation.

O termo "transformação" é como definido na seção "Definições".The term "transformation" is as defined in the "Definitions" section.

A presente invenção claramente se estende a qualquer célula vegetal ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes vegetais e propágulos destas. A presente invenção adicionalmente de estende para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.The present invention clearly extends to any plant cell or plant produced by any of the methods described herein, and to all plant parts and seedlings thereof. The present invention further extends to encompass the progeny of a transformed or transfected primary cell, tissue, organ or whole plant that has been produced by any of the methods mentioned above, the sole requirement being that the progeny exhibit the same (s) genotypic and / or phenotypic trait (s) than those produced by the ancestor in the methods according to the invention.

A invenção também inclui células hospedeiras contendo um ácido nucleico CYP90B isolado ou variante deste, expresso não constitutivãmente. Células hospedeiras preferidas de acordo com a invenção são células vegetais.The invention also includes host cells containing a single or non-constitutively expressed CYP90B nucleic acid expressed or variant thereof. Preferred host cells according to the invention are plant cells.

A invenção também se estende a partes aptas à colheita de uma planta tal como, mas não limitada a sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção além disso se refere a produtos derivados de uma parte apta à colheita de uma tal planta, tal como pelotas secas ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.The invention also extends to harvestable parts of a plant such as, but not limited to seeds, leaves, fruits, flowers, stems, rhizomes, tubers and bulbs. The invention furthermore relates to products derived from a harvestable part of such a plant, such as dried pellets or powders, oil, fat and fatty acids, starch or proteins.

A presente invenção também abrange uso de ácidos nucleicos CYP90B ou variantes destes e uso de polipeptídeos CYP90B ou homólogos destes. Tais usos se referem a aumentar produção vegetal como definido acima nos métodos da invenção.The present invention also encompasses use of CYP90B nucleic acids or variants thereof and use of CYP90B polypeptides or homologues thereof. Such uses refer to increasing crop yield as defined above in the methods of the invention.

Ácidos nucleicos CYP90B ou variantes destes, ou polipeptídeos CYP90B ou homólogos destes podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene CYP90B ou variante deste. Os ácidos nucleicos/genes CYP90B ou variantes destes, ou polipeptídeos CYP90B ou homólogos destes podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo produção aumentada como definido acima nos métodos da invenção. O gene CYP90B ou variante deste, por exemplo, pode ser um ácido nucleico como representado por qualquer um de SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 e SEQ ID NO: 89.CYP90B nucleic acids or variants thereof, or CYP90B polypeptides or homologues thereof may find use in breeding programs in which a DNA marker that can be genetically linked to a CYP90B gene or variant thereof is identified. Nucleic acids / CYP90B genes or variants thereof, or CYP90B polypeptides or homologues thereof may be used to define a molecular marker. This DNA or protein marker can then be used in breeding programs to select plants having increased yield as defined above in the methods of the invention. The CYP90B gene or variant thereof, for example, may be a nucleic acid as represented by any one of SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85 , SEQ ID NO: 87 and SEQ ID NO: 89.

Variantes alélicas de um ácido nucleico/gene CYP90B também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem "natural" causada não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que gera produção aumentada. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão, por exemplo, variantes alélicas diferentes de qualquer uma de SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87 e SEQ ID NO: 89. Desempenho de crescimento pode ser monitorado em uma casa de vegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.Allelic variants of a CYP90B nucleic acid / gene may also find use in marker-assisted breeding programs. Such breeding programs sometimes require introduction of allelic variation by mutagenic treatment of plants, using for example EMS mutagenesis; alternatively, the program may start with a collection of allelic variants of the so-called "natural" origin caused unintentionally. Identification of allelic variants then occurs, for example, by PCR. This is followed by a step for selecting superior allelic variants of the sequence in question and generating increased production. Selection is typically performed by monitoring plant growth performance containing different allelic variants of the sequence in question, for example, allelic variants different from any of SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ ID NO : 83, SEQ ID NO: 85, SEQ ID NO: 87 and SEQ ID NO: 89. Growth performance can be monitored in a greenhouse or in the field. Additional optional steps include crossing plants in which the upper allelic variant has been identified with another plant. This can be used, for example, to make a combination of interesting phenotypic characteristics.

Um ácido nucleico CYP90B ou variante deste também pode ser usado como sondas para mapear geneticamente e fisicamente os genes dos quais eles são uma parte de, e como marcadores para características ligadas a estes genes. Tal informação pode ser útil em melhoramento vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos CYP90B ou variantes destes requer apenas uma seqüência de ácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos CYP90B ou variantes destes podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição pode ser sondado com os ácidos nucleicos CYP90B ou variantes destes. Os padrões de bandeamento resultantes então podem ser sujeitos a análises genéticas usando programas de computador tal como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição do ácido nucleico CYP90B ou variante deste no mapa genético obtido previamente usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).A CYP90B nucleic acid or variant thereof may also be used as probes to genetically and physically map the genes of which they are a part of, and as markers for traits linked to these genes. Such information may be useful in plant breeding in order to develop strains with desired phenotypes. Such use of CYP90B nucleic acids or variants thereof requires only a nucleic acid sequence of at least 15 nucleotides in length. CYP90B nucleic acids or variants thereof may be used as restriction fragment length polymorphism (RFLP) markers. Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) of restriction digested plant genomic DNA can be probed with CYP90B nucleic acids or variants thereof. The resulting banding patterns can then be subjected to genetic analysis using computer programs such as MapMaker (Lander et al. (1987) Genomics 1: 174-181) in order to construct a genetic map. In addition, nucleic acids can be used to probe Southern blots containing restriction endonuclease-treated genomic DNAs from a set of individuals representing ancestor and progeny of a defined genetic crossover. Segregation of DNA polymorphisms is observed and used to calculate the position of CYP90B nucleic acid or variant on the genetic map previously obtained using this population (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331) .

A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético são descritos em Bematzky and Tanksley (1986) (GENETICS 112 (4): 887-898). Numerosas publicações descrevem mapeamento genético de clones de cDNA específicos usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens isogênicas próximas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica.The production and use of plant gene derived probes for use in genetic mapping are described in Bematzky and Tanksley (1986) (GENETICS 112 (4): 887-898). Numerous publications describe genetic mapping of specific cDNA clones using the methodology described above or variations thereof. For example, F2 crossover populations, inbreeding populations, randomly crossed populations, nearby isogenic strains, and other sets of individuals may be used for mapping. Such methodologies are well known to those skilled in the art.

As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., localização de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas aí).Nucleic acid probes may also be used for physical mapping (ie, location of sequences in physical maps; see Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, and references cited there).

Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones maiores (diversos kb a diversas centenas kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoramentos em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.In another embodiment, nucleic acid probes may be used in direct mapping by fluorescence in situ hybridization (FISH) (Trask (1991) Trends Genet. 7: 149-154). Although current FISH mapping methods favor the use of larger clones (several kb to several hundred kb; see Laan et al. (1995) Genome Res. 5: 13-20), sensitivity improvements may allow FISH mapping performance using probes. smaller ones.

Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser realizada usando os ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para projetar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. O projeto de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os ancestrais do cruzamento de mapeamento na região correspondente à seqüência imediata de ácidos nucleicos. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.A variety of nucleic acid amplification based methods for genetic and physical mapping can be performed using nucleic acids. Examples include allele-specific amplification (Kazazian (1989) J. Lab. Clin. Med. 11: 95-96), PCR amplified fragment polymorphism (CAPS; Sheffield et al. (1993) Genomics 16: 325-332), allele binding specific (Landegren et al. (1988) Science 241: 1077-1080), nucleotide extension reactions (Sokolov (1990) Nucleic Acid Res. 18: 3671), Radiation Hybrid Mapping (Walter et al. (1997) Nat Genet. 7: 22-28) and Appropriate Mapping (Dear and Cook (1989) Nucleic Acid Res. 17: 6795-6807). For these methods, the nucleic acid sequence is used to design and produce primer pairs for use in the amplification reaction or primer extension reactions. The design of such initiators is well known to those skilled in the art. In methods employing PCR-based genetic mapping, it may be necessary to identify DNA sequence differences between the mapping ancestors in the region corresponding to the immediate sequence of nucleic acids. This, however, is generally not required for mapping methods.

Os métodos de acordo com a presente invenção resultam em plantas tendo produção aumentada, como descrito acima. Esta produção aumentada também pode ser combinada com outras características economicamente vantajosas, tal como características adicionais que estimulam produção, tolerância a outros estresses abióticos e bióticos, características modificando vários atributos arquitetônicos e/ou atributos bioquímicos e/ou fisiológicos.The methods according to the present invention result in plants having increased yield as described above. This increased yield can also be combined with other economically advantageous features, such as additional features that stimulate yield, tolerance to other abiotic and biotic stresses, features modifying various architectural attributes and / or biochemical and / or physiological attributes.

CDC27 de Descrição DetalhadaDetailed Description CDC27

Polipeptídeos CDC27 são bem conhecidos na técnica e são facilmente identificáveis pela presença de uma região NH2 terminal conservada (veja Figura 16) e de pelo menos 5 domínios TPR com pelo menos um domínio TPR na região NH2 terminal. Além disso, o polipeptídeo CDC27 pode compreender adicionalmente uma seqüência com mais do que 30% de identidade com SEQ ID NO: 130.CDC27 polypeptides are well known in the art and are readily identifiable by the presence of a conserved NH2 terminal region (see Figure 16) and at least 5 TPR domains with at least one TPR domain in the NH2 terminal region. In addition, the CDC27 polypeptide may further comprise a sequence with more than 30% identity with SEQ ID NO: 130.

Motivos TPR estão presentes em uma ampla variedade de proteínas funcionais em levedura e eucariotos superiores em mitose (incluindo os componentes de proteínas APC CDC16, CDC23 e CDC27), transcrição, processamento, importação de proteínas e neurogênese (Goebl and Yanagida 1991, Trends Biochem Sci 16, 173-177). Uma seqüência consenso mínima sugerida do motivo TPR é: X3-W-X2-L-G-X2-Y-Xs-A-X3- F-X2-A-X4-P-X2, onde X = qualquer aminoácido (Lamb et al. 1994, EMBO J 13, 4321-4328). Os resíduos consenso podem exibir degenerescência significante e os resíduos não consenso exibem pouca ou nenhuma homologia. É a hidrofobicidade e o tamanho dos resíduos consenso, ao invés de sua identidade, que parece ser importante. Em uma proteína CDC27 nativa, o TPR forma uma estrutura α-helicoidal, repetições em tandem se organizam em uma estrutura super-helicoidal idealmente adequada como interfaces para reconhecimento de proteínas (Groves and Barford 1999, Curr Opin Struct Biol 9, 383-389). Dentro da α-hélice, dois domínios anfipáticos estão normalmente presentes, um na região NH2 terminal e o outro perto da região COOH-terminal (Sikorski et al. 1990, Cell 60, 307-317). Também motivos TPR individuais podem estar dispersos ao longo da seqüência protéica.TPR motifs are present in a wide variety of yeast functional proteins and higher mitosis eukaryotes (including the APC protein components CDC16, CDC23 and CDC27), transcription, processing, protein importation and neurogenesis (Goebl and Yanagida 1991, Trends Biochem Sci 16, 173-177). A suggested minimum consensus sequence of the TPR motif is: X3-W-X2-LG-X2-Y-Xs-A-X3-F-X2-A-X4-P-X2, where X = any amino acid (Lamb et al. 1994, EMBO J 13, 4321-4328). Consensus residues may exhibit significant degeneration and non-consensus residues exhibit little or no homology. It is the hydrophobicity and size of the consensus waste, rather than its identity, that seems to be important. In a native CDC27 protein, TPR forms an α-helical structure, tandem repeats organize into a superhelical structure ideally suited as protein recognition interfaces (Groves and Barford 1999, Curr Opin Struct Biol 9, 383-389) . Within the α-helix, two amphipathic domains are usually present, one in the NH2 terminal region and the other near the COOH-terminal region (Sikorski et al. 1990, Cell 60, 307-317). Also individual TPR motifs may be scattered throughout the protein sequence.

Um CDC27 nativo de comprimento completo tipicamente compreende pelo menos 5 TPRs, preferivelmente 6 TPRs, mais preferivelmente 7 TPRs, a maioria destes TPRs sendo localizada na região COOH terminal. Como mostrado em Figura 16, existe tipicamente um domínio TPR na região NH2 terminal de um polipeptídeo CDC27 nativo, embora seqüências variantes de CDC27 possam existir ou possam ser criadas para compreender mais do que um TPR na região NH2 terminal. Qualquer polipeptídeo CDC27 pode ser tornado útil nos métodos da invenção por inativação de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo. Métodos para inativação são bem conhecidos na técnica e incluem: remoção ou substituição de aminoácidos, neste caso, remoção ou substituição de aminoácidos de pelo menos um domínio TPR na região NH2 terminal; ou técnicas de mutação, tal como substituir aminoácidos conservados por alanina ou substituir aminoácidos fosforiláveis (tal como serina, treonina ou tirosina) por aminoácidos não fosforiláveis ou vice versa (dependendo se a proteína fosforilada está ativa ou inativa); ou qualquer outro método para inativação.A full length native CDC27 typically comprises at least 5 TPRs, preferably 6 TPRs, more preferably 7 TPRs, most of these TPRs being located in the terminal COOH region. As shown in Figure 16, there is typically a TPR domain in the terminal NH2 region of a native CDC27 polypeptide, although CDC27 variant sequences may exist or may be created to comprise more than one TPR in the terminal NH2 region. Any CDC27 polypeptide may be made useful in the methods of the invention by inactivating at least one TPR domain in the terminal NH2 region of the polypeptide. Methods for inactivation are well known in the art and include: amino acid removal or substitution, in this case amino acid removal or substitution of at least one TPR domain in the terminal NH2 region; or mutation techniques, such as replacing alanine-conserved amino acids or substituting phosphorylable amino acids (such as serine, threonine or tyrosine) with non-phosphorylatable amino acids or vice versa (depending on whether the phosphorylated protein is active or inactive); or any other method for inactivation.

Para os propósitos deste pedido, a região NH2 terminal de uma proteína CDC27 é considerada como sendo a primeira metade de uma seqüência CDC27 de comprimento completo (de NH2 terminal para COOH terminal) (veja Figura 16); preferivelmente a região NH2 terminal de uma proteína CDC27 é considerada como sendo o primeiro terço de uma seqüência CDC27 de comprimento completo (de NH2 terminal para COOH terminal); e de acordo com outra característica preferida da presente invenção, a região N-terminal de uma proteína CDC27 é considerada como sendo os primeiros 166 aminoácidos (de NH2 terminal para COOH terminal) de uma seqüência CDC27 de comprimento completo.For the purposes of this application, the terminal NH2 region of a CDC27 protein is considered to be the first half of a full length CDC27 sequence (from terminal NH2 to terminal COOH) (see Figure 16); preferably the terminal NH2 region of a CDC27 protein is considered to be the first third of a full length CDC27 sequence (from terminal NH2 to terminal COOH); and according to another preferred feature of the present invention, the N-terminal region of a CDC27 protein is considered to be the first 166 amino acids (from terminal NH2 to terminal COOH) of a full length CDC27 sequence.

Um exemplo de um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal é o polipeptídeo representado por SEQ ID NO: 130, com seqüência de ácidos nucleicos de codificação representada por SEQ ID NO: 129.An example of a CDC27 polypeptide having at least one inactive TPR domain in the terminal NH2 region is the polypeptide represented by SEQ ID NO: 130, with the encoding nucleic acid sequence represented by SEQ ID NO: 129.

Tabela 10 abaixo fornece alguns exemplos de seqüências CDC27; estas seqüências podem ser tornadas úteis nos métodos da invenção por inativação de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo, por exemplo usando qualquer dos métodos de inativação discutidos acima. Tabela 10: Exemplos de polipeptídeos CDC27Table 10 below provides some examples of CDC27 sequences; These sequences may be made useful in the methods of the invention by inactivating at least one TPR domain in the terminal NH2 region of the polypeptide, for example using any of the inactivation methods discussed above. Table 10: Examples of CDC27 Polypeptides

<table>table see original document page 116</column></row><table><table> table see original document page 116 </column> </row> <table>

* Agrupamento de seqüências compilado a partir de diversos acessos de EST (os principais mostrados); qualidade de seqüenciamento de EST sendo normalmente inferior, umas poucas substituições de ácidos nucleicos podem ser esperadas.Sequence grouping compiled from several EST accesses (the main ones shown); If EST sequencing quality is usually inferior, a few nucleic acid substitutions can be expected.

As seqüências descritas em Tabela 10 são dadas como forma de Exemplo apenas. Exemplos adicionais são dados em Figura 19, codificando polipeptídeos ou de comprimento completo ou parciais (que podem ser usados para obter a seqüência de comprimento completo usando métodos de rotina). Deve ser entendido que qualquer seqüência de polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, ou um ácido nucleico/gene codificando um tal polipeptídeo, pode ser adequado para uso para realizar os métodos da invenção.The sequences described in Table 10 are given by way of example only. Additional examples are given in Figure 19, encoding either full length or partial polypeptides (which can be used to obtain the full length sequence using routine methods). It should be understood that any CDC27 polypeptide sequence having at least one inactive TPR domain in the terminal NH2 region of the polypeptide, or a nucleic acid / gene encoding such a polypeptide, may be suitable for use to perform the methods of the invention.

Outros polipeptídeos CDC27 podem ser prontamente identificados usando técnicas de rotina bem conhecidas na técnica, tal como por alinhamento de seqüências. Seqüências assim identificadas podem ser subseqüentemente tornadas úteis nos métodos da invenção por inativação de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo, por exemplo usando qualquer dos métodos de inativação discutidos acima. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas que maximiza o número de identidades e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através de National Centre for Biotechnology Information. Homólogos de um CDC27 podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83) disponível em http://clustalw.genome.jp/sit-bin/nph-ClustalW, com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Edição manual secundária pode ser realizada para otimizar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na técnica.Other CDC27 polypeptides may be readily identified using routine techniques well known in the art, such as by sequence alignment. Sequences thus identified may subsequently be made useful in the methods of the invention by inactivating at least one TPR domain in the terminal NH2 region of the polypeptide, for example using any of the inactivation methods discussed above. Methods for sequence alignment for comparison are well known in the art, such methods include GAP, BESTFIT, BLAST, FASTA and TFASTA. GAP uses the algorithm of Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) to find the alignment of two complete sequences that maximizes the number of identities and minimizes the number of gaps. The BLAST algorithm (Altschul et al. (1990) J Mol Biol 215: 403-10) calculates percent sequence identity and performs a statistical analysis of similarity between the two sequences. The computer application for performing BLAST analysis is publicly available through the National Center for Biotechnology Information. CDC27 homologs can be readily identified using, for example, the ClustalW multiple sequence alignment algorithm (version 1.83) available at http://clustalw.genome.jp/sit-bin/nph-ClustalW, with the default parameters of paired alignment, and a percentage scoring method. Secondary manual editing can be performed to optimize alignment between retained subjects, as should be apparent to a person skilled in the art.

Vários domínios estruturais em uma proteína CDC27, tal como domínios TPR, podem ser identificados usando bancos de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nueleie Aeids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http://www.ebi.ae.uk/interpro/), Prosite (Bucher and Bairoeh (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conferenee on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32.-D134-D137, (2004), http://www.expasy.org/prosite/), Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002), http://www.sanger.ac.uk/Software/Pfam/) ou ProDom (Servant F, Bru C, Carrère S, Courcelle E, Gouzy J, Peyruc D, Kahn D (2002) ProDom:Several structural domains in a CDC27 protein, such as TPR domains, can be identified using specialized databases eg SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nueleie Aeids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids Res. 31, 315-318; http: //www.ebi.ae.uk/interpro/), Prosite (Bucher and Bairoeh (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conferenee on Intelligent Systems for Molecular Biology Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids Res. 32.-D134-D137, (2004), http://www.expasy.org/prosite/), Pfam (Bateman et al., Nucleic Acids Research 30 (1): 276-280 (2002), http: / /www.sanger.ac.uk/Software/Pfam/) or ProDom (Servant F, Bru C, Carrère S, Courcelle E, Gouzy J, Peyruc D, Kahn D (2002) ProDom:

Automated clustering of homologous domains. Briefings in Bioinformatics. vol 3, no 3:246-251).Automated clustering of homologous domains. Briefings in Bioinformatics. vol 3, no 3: 246-251).

As seqüências mencionadas em Tabela IOe Figura 19 podem ser consideradas homólogos de um polipeptídeo CDC27. "Homólogos" de uma proteína são definidos na seção "Definições" neste lugar. Homólogos preferidos são seqüências de aminoácidos tendo em ordem crescente de preferência pelo menos 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% ou mais de identidade de seqüência com a proteína CDC27 de comprimento completo representada por SEQ ID NO: 132.The sequences mentioned in Table 10 and Figure 19 can be considered homologous to a CDC27 polypeptide. "Counterparts" of a protein are defined in the "Definitions" section in this place. Preferred homologues are amino acid sequences having in ascending order preferably at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% or more sequence identity to the full length CDC27 protein represented by SEQ ID NO: 132.

Homólogos, ortólogos e parálogos podem ser tornados úteis nos métodos da invenção por inativação de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo, por exemplo usando qualquer dos métodos de inativação discutidos acima.Homologs, orthologs and paralogs may be made useful in the methods of the invention by inactivating at least one TPR domain in the terminal NH2 region of the polypeptide, for example using any of the inactivation methods discussed above.

Polipeptídeos CDC27 humanos e de levedura mostraram interagir com duas outras proteínas do complexo APC, CDC16 e CDC23, in vivo através de análise de dois híbridos de levedura, e in vitro através de co- imunoprecipitação (Lam et al. (1994) EMBO J 13(18): 4321-4328; Ollendorf & Donoghue (1997) J Biol Chem 272(51): 32011-32018). Uma tal interação pode ser útil para identificar polipeptídeos CDC27 a serem tornados úteis nos métodos da invenção por inativação de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo, por exemplo usando qualquer dos métodos de inativação discutidos acimaHuman and yeast CDC27 polypeptides have been shown to interact with two other APC complex proteins, CDC16 and CDC23, in vivo by analysis of two yeast hybrids, and in vitro by co-immunoprecipitation (Lam et al. (1994) EMBO J 13 (18): 4321-4328; Ollendorf & Donoghue (1997) J Biol Chem 272 (51): 32011-32018). Such an interaction may be useful for identifying CDC27 polypeptides to be made useful in the methods of the invention by inactivating at least one TPR domain in the NH2 terminal region of the polypeptide, for example using any of the inactivation methods discussed above.

Um polipeptídeo CDC27 tendo pelo menos um domínio TRP inativo na região NH2 terminal do polipeptídeo é codificado por um assim chamado ácido nucleico/gene CDC27 modificado. Portanto, o termo "ácido nucleico/gene CDC27 modificado" como definido neste lugar é qualquer ácido nucleico/gene codificando um polipeptídeo CDC27 tendo pelo menos um domínio TRP inativo na região NH2 terminal do polipeptídeo.A CDC27 polypeptide having at least one inactive TRP domain in the NH2 terminal region of the polypeptide is encoded by a so-called nucleic acid / modified CDC27 gene. Therefore, the term "modified CDC27 nucleic acid / gene" as defined herein is any nucleic acid / gene encoding a CDC27 polypeptide having at least one inactive TRP domain in the NH2 terminal region of the polypeptide.

O ácido nucleico CDC27 ou ácido nucleico/gene CDC27 modificado pode ser derivado de qualquer fonte natural ou artificial. O ácido nucleico/gene pode ser isolado de uma fonte microbiana, tal como levedura ou fungos, ou de uma fonte vegetal, algal ou animal. Este ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana deliberada. O ácido nucleico é preferivelmente de origem vegetal, quer da mesma espécie de planta (por exemplo que aquela na qual ele é introduzido) ou quer de uma espécie diferente de planta. O ácido nucleico pode ser isolado de uma espécie dicotiledônea, preferivelmente da família Brassicaceae, ainda preferivelmente de Arabidopsis thaliana. Mais preferivelmente, o ácido nucleico CDC27 modificado isolado de Arabidopsis thaliana é representado por SEQ ID NO: 129 e o CDC27 tendo pelo menos um TPR inativo na região NH2 terminal do aminoácido é como representado por SEQ ID NO: 130.The CDC27 nucleic acid or modified CDC27 nucleic acid / gene may be derived from any natural or artificial source. The nucleic acid / gene may be isolated from a microbial source, such as yeast or fungi, or from a plant, algal or animal source. This nucleic acid may be modified from its native form in genomic composition and / or environment through deliberate human manipulation. The nucleic acid is preferably of plant origin, either from the same plant species (for example that into which it is introduced) or from a different plant species. The nucleic acid may be isolated from a dicotyledonous species, preferably from the Brassicaceae family, still preferably from Arabidopsis thaliana. More preferably, the modified CDC27 nucleic acid isolated from Arabidopsis thaliana is represented by SEQ ID NO: 129 and the CDC27 having at least one inactive TPR in the amino acid terminal NH2 region is as represented by SEQ ID NO: 130.

Um ácido nucleico/gene CDC27 é um ácido nucleico capaz de hibridizar em condições de estringência reduzida, preferivelmente em condições estringentes, com um ácido nucleico/gene CDC27 como representado por qualquer um de SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137 ou SEQ ID NO: 141. Mais preferivelmente a seqüência hibridizante é uma que é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 129 ou SEQ ID NO: 131. Tais seqüências hibridizantes podem ser tornadas úteis nos métodos da invenção por inativação de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos de inativação discutidos acima.A CDC27 nucleic acid / gene is a nucleic acid capable of hybridizing under reduced stringency conditions, preferably under stringent conditions, to a CDC27 nucleic acid / gene as represented by any of SEQ ID NO: 129, SEQ ID NO: 131, SEQ SEQ ID NO: 135, SEQ ID NO: 137 or SEQ ID NO: 141. More preferably the hybridizing sequence is one which is capable of hybridizing to a nucleic acid as represented by SEQ ID NO: 129 or SEQ ID NO: 131. Such hybridizing sequences may be made useful in the methods of the invention by inactivating at least one TPR domain in the NH2 terminal region of the encoded polypeptide, for example using any of the inactivation methods discussed above.

O termo "hibridização" é como definido neste lugar na seção "Definições".The term "hybridization" is as defined here in the "Definitions" section.

O ácido nucleico CDC27 ou ácido nucleico/gene CDC27 modificado pode estar na forma de uma variante de união alternativa. Uma variante de união alternativa é definida na seção "Definições". São preferidas variantes de união de qualquer das seqüências de ácidos nucleicos CDC27 mencionadas acima, em outras palavras SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137 ou SEQ ID NO: 141. A mais preferida é uma variante de união de uma seqüência de ácidos nucleicos como representada por SEQ ID NO: 129 ou SEQ ID NO: 131. Tais variantes de união podem ser tornadas úteis nos métodos de inativação da invenção de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo CDC27 codificado, por exemplo usando qualquer dos métodos de inativação discutidos acima.The CDC27 nucleic acid or modified CDC27 nucleic acid / gene may be in the form of an alternative splicing variant. An alternative union variant is defined in the "Definitions" section. Splice variants of any of the above mentioned CDC27 nucleic acid sequences are preferred, in other words SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137 or SEQ Most preferred is a splice variant of a nucleic acid sequence as represented by SEQ ID NO: 129 or SEQ ID NO: 131. Such splice variants may be made useful in inactivation methods of the invention of at least at least one TPR domain in the NH2 terminal region of the encoded CDC27 polypeptide, for example using any of the inactivation methods discussed above.

O ácido nucleico CDC27 ou ácido nucleico/gene CDC27 modificado pode estar na forma de uma variante alélica de um ácido nucleico codificando um polipeptídeo CDC27 truncado compreendendo pelo menos um domínio TPR inativado na região NH2 terminal. São preferidas variantes alélicas de seqüências de ácidos nucleicos representadas por SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137 ou SEQ ID NO: 141. A mais preferida é uma variante alélica de uma seqüência de ácidos nucleicos como representada por SEQ ID NO: 129 ou SEQ ID NO: 131. Variantes alélicas existem na natureza, e abrangido dentro dos métodos da presente invenção é o uso destes alelos naturais. Variantes alélicas abrangem Polimorfismos de Nucleotídeo Unico (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs normalmente é menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de seqüência em linhagens polimórficas naturalmente ocorrentes da maioria dos organismos. Tais variantes alélicas podem ser tornadas úteis nos métodos de inativação da invenção de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo CDC27 codificado, por exemplo usando qualquer dos métodos de inativação discutidos acima.The CDC27 nucleic acid or modified CDC27 nucleic acid / gene may be in the form of an allelic variant of a nucleic acid encoding a truncated CDC27 polypeptide comprising at least one inactivated TPR domain in the terminal NH2 region. Allelic variants of nucleic acid sequences represented by SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137 or SEQ ID NO: 141 are preferred. is an allelic variant of a nucleic acid sequence as represented by SEQ ID NO: 129 or SEQ ID NO: 131. Allelic variants exist in nature, and encompassed within the methods of the present invention is the use of these natural alleles. Allelic variants include Single Nucleotide Polymorphisms (SNPs), as well as Small Insert / Deletion Polymorphisms (INDELs). The size of INDELs is typically less than 100 bp. SNPs and INDELs form the largest set of sequence variants in naturally occurring polymorphic strains of most organisms. Such allelic variants may be made useful in the inactivation methods of the invention of at least one TPR domain in the NH2 terminal region of the encoded CDC27 polypeptide, for example using any of the inactivation methods discussed above.

O ácido nucleico CDC27 ou ácido nucleico/gene CDC27 modificado pode ser gerado por mutagênese sítio dirigida. Estão disponíveis diversos métodos para atingir mutagênese sítio dirigida, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology, Wiley Eds http://www.4ulr.com/products/currentprotocols/index.html).The CDC27 nucleic acid or modified CDC27 nucleic acid / gene may be generated by site directed mutagenesis. Several methods are available to achieve site directed mutagenesis, the most common being PCR-based methods (Current Protocols in Molecular Biology, Wiley Eds http://www.4ulr.com/products/currentprotocols/index.html).

O ácido nucleico CDC27 ou ácido nucleico/gene CDC27 modificado também pode ser gerado por evolução direta (veja seção "Definições" para detalhes adicionais).CDC27 nucleic acid or modified nucleic acid / CDC27 gene can also be generated by direct evolution (see section "Definitions" for further details).

Tais variantes produzidas por mutagênese sítio dirigida ou por evolução direta podem ser tornadas úteis nos métodos de inativação da invenção de pelo menos um domínio TPR na região NH2 terminal do polipeptídeo CDC27 codificado, por exemplo usando qualquer dos métodos de inativação discutidos acima.Such variants produced by site-directed mutagenesis or direct evolution may be made useful in the inactivation methods of the invention of at least one TPR domain in the NH2 terminal region of the encoded CDC27 polypeptide, for example using any of the inactivation methods discussed above.

A expressão de um ácido nucleico/gene CDC27 modificado codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo pode ser aumentada introduzindo uma modificação genética (preferivelmente no locus de um gene CDC27). O locus de um gene como definido neste lugar é adotado para significar uma região genômica, a qual inclui o gene de interesse e 10 KB antes ou depois da região de codificação.Expression of a modified CDC27 nucleic acid / gene encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide may be enhanced by introducing a genetic modification (preferably at the locus of a CDC27 gene). The locus of a gene as defined herein is adopted to mean a genomic region, which includes the gene of interest and 10 KB before or after the coding region.

A modificação genética é preferivelmente introduzida introduzindo e expressando em uma planta um ácido nucleico codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo. Seguindo introdução da modificação genética, segue uma etapa adicional de selecionar para expressão aumentada (em tecido de meristema apical de broto) de um ácido nucleico modificado codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, cujo aumento em expressão gera plantas tendo produção aumentada.Genetic modification is preferably introduced by introducing and expressing into a plant a nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the terminal NH2 region of the polypeptide. Following introduction of the genetic modification, an additional step of selecting for increased expression (in apical bud meristem tissue) of a modified nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the terminal NH2 region of the polypeptide, the increase of which is increased. expression generates plants having increased yield.

De acordo com um aspecto preferido da presente invenção, expressão aumentada do ácido nucleico CDC27 é contemplada. Métodos para aumentar expressão de genes ou produtos de gene são bem documentados na técnica e incluem, superexpressão dirigida por promotores apropriados, o uso de estimuladores de transcrição ou estimuladores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou estimuladores podem ser introduzidos em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico CDC27. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção para controlar a expressão do gene.According to a preferred aspect of the present invention, increased expression of CDC27 nucleic acid is contemplated. Methods for enhancing gene expression or gene products are well documented in the art and include, overexpression directed by appropriate promoters, the use of transcription enhancers or translation enhancers. Isolated nucleic acids serving as promoter or enhancer elements may be introduced at an appropriate (typically before) position in a nonheterologous form of a polynucleotide in order to enhance expression of a CDC27 nucleic acid. For example, endogenous promoters may be altered in vivo by mutation, deletion, and / or substitution (see, Kmiec, U.S. Patent No. 5,565,350; Zarling et al., PCT / US93 / 03868), or isolated promoters. be introduced into a plant cell at the appropriate orientation and distance of a gene of the present invention to control gene expression.

Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer outro gene eucariótico.If polypeptide expression is desired, it is generally desirable to include a polyadenylation region at the 3 'end of a polynucleotide coding region. The polyadenylation region may be derived from the natural gene, a variety of other plant genes, or T-DNA. The 3 'end sequence to be added may be derived, for example, from the nopaline synthase or octopine synthase genes, or alternatively from another plant gene, or less preferably from any other eukaryotic gene.

Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citossol. Inclusão de um íntron processável na unidade de transcrição tanto em construções vegetais como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183- 1200). Tal estimulação intrônica de expressão gênica tipicamente é maior quando localizada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-1 são conhecidos na técnica. Veja geralmente, The Maize Handbook, capítulo 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).An intronic sequence can also be added to the untranslated 5 'region or coding sequence of the partial coding sequence to increase the amount of mature message that accumulates in the cytosol. Inclusion of a processable intron in the transcription unit in both plant and animal constructs has been shown to increase gene expression at both mRNA and protein levels by up to 1000-fold (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et (1987) Genes Dev 1: 1183-1200). Such intronic stimulation of gene expression is typically greater when located near the 5 'end of the transcription unit. Using the introns of maize Adhl-S 1, 2, and 6, the Bronze-1 intron are known in the art. See generally, The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.The invention also provides genetic constructs and vectors to facilitate introduction and / or expression of nucleotide sequences useful in the methods according to the invention.

Portanto, é fornecida uma construção gênica compreendendo:Therefore, a gene construct is provided comprising:

(i) Um ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativado na região NH2 terminal do polipeptídeo;(i) A CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactivated TPR domain in the NH2 terminal region of the polypeptide;

(ii) Uma ou mais seqüências de controle capazes de dirigir preferencialmente expressão da seqüência de ácidos nucleicos de (i) em tecido de meristema apical de broto; e opcionalmente(ii) One or more control sequences capable of preferentially directing expression of the nucleic acid sequence of (i) in bud apical meristem tissue; and optionally

(iii) Uma seqüência de término de transcrição.(iii) A transcription termination sequence.

Tais construções genéticas podem ser construídas usando tecnologia de DNA recombinante bem conhecida por pessoas versadas na técnica. As construções gênicas podem ser inseridas em vetores, que podem estar comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção portanto fornece uso de uma construção gênica como definido acima nos métodos da invenção.Such genetic constructs can be constructed using recombinant DNA technology well known to those skilled in the art. Gene constructs may be inserted into commercially available vectors suitable for plant transformation and suitable for expression of the gene of interest in transformed cells. The invention therefore provides use of a gene construct as defined above in the methods of the invention.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor) capaz de dirigir preferencialmente expressão em tecido de meristema apical de broto de uma planta. Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e são definidos na seção "Definições".Plants are transformed with a vector comprising the sequence of interest (i.e., a nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide). The sequence of interest is operably linked to one or more control sequences (at least one promoter) capable of preferentially directing expression in plant apical bud meristem tissue. The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably in this place and are defined in the "Definitions" section.

O ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo ou variante é operavelmente ligado a um promotor de meristema apical de broto, preferivelmente a um promotor de meristema apical de broto precoce. Um "promotor de meristema apical de broto precoce" como definido neste lugar é um promotor que é transcricionalmente ativo no meristema apical de broto do estágio de embrião globular até o estágio de plântula jovem, estes estágios sendo bem conhecidos por pessoas versadas na técnica. Referência neste lugar a aumentar preferencialmente expressão em tecido de meristema apical de broto é adotada para significar aumentar expressão em tecido de meristema apical de broto substancialmente para a exclusão de expressão em qualquer outro lugar na planta, sem considerar qualquer expressão residual devido a promotores permeáveis. Preferivelmente, o promotor de meristema apical de broto precoce é um promotor OSHl (de arroz; SEQ ID NO: 151 (Matsuoka et al., (1993) Plant Cell 5: 1039-1048; Sato et al., (1996) Proc Natl Acad Sci U S A 93(15): 8117-22)). Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico CDC27 modificado representado por SEQ ID NO: 129, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico CDC27 modificado quando dirigida por um promotor OSHl. Exemplos de outros promotores de meristema apical de broto precoce são mostrados em Tabela 5 na seção "Definições". Estes são membros de homeobox de classe 1 da família KNOX, de genes parálogos ou ortólogos. Deve ser entendido que a lista abaixo não é exaustiva.The CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the terminal NH2 region of the polypeptide or variant is operably linked to a bud apical meristem promoter, preferably to an early bud apical meristem promoter. An "early bud apical meristem promoter" as defined herein is a promoter that is transcriptionally active on the bud apical meristem from the globular embryo stage to the young seedling stage, these stages being well known to those skilled in the art. Reference herein to preferentially increasing expression in bud apical meristem tissue is adopted to mean increasing expression in bud apical meristem tissue substantially to the exclusion of expression elsewhere in the plant, without considering any residual expression due to permeable promoters. Preferably, the early sprout apical meristem promoter is a rice OSH1 promoter; SEQ ID NO: 151 (Matsuoka et al., (1993) Plant Cell 5: 1039-1048; Sato et al., (1996) Proc Natl). Acad Sci USA 93 (15): 8117-22)). It should be clear that the applicability of the present invention is not restricted to the modified CDC27 nucleic acid represented by SEQ ID NO: 129, nor is the applicability of the invention restricted to the expression of a modified CDC27 nucleic acid when directed by an OSH1 promoter. Examples of other early bud apical meristem promoters are shown in Table 5 in the "Definitions" section. These are members of class 1 homeobox of the KNOX family, of paralogue genes or orthologs. It should be understood that the list below is not exhaustive.

Opcionalmente, uma ou mais seqüências terminadoras também podem ser usadas na construção introduzida em uma planta. O termo "terminador" é definido neste lugar na seção "Definições".Optionally, one or more terminator sequences may also be used in the construction introduced into a plant. The term "terminator" is defined here in the "Definitions" section.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colEl.The genetic constructs of the invention may additionally include an origin of replication sequence that is required for maintenance and / or replication in a specific cell type. An example is when a genetic construct is required to be maintained in a bacterial cell as an episomal genetic element (e.g., plasmid or cosmid molecule). Preferred sources of replication include, but are not limited to, fl-ori and colEl.

A construção genética pode compreender opcionalmente um gene marcador selecionável como definido na seção "Definições".The genetic construct may optionally comprise a selectable marker gene as defined in the "Definitions" section.

A presente invenção também abrange plantas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas ou partes destas, incluindo células vegetais, obteníveis pelo método de acordo com a presente invenção, cujas plantas ou partes vegetais compreendem um ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo e cujo ácido nucleico é operavelmente ligado a um promotor de meristema apical de broto.The present invention also encompasses plants obtainable by the methods according to the present invention. The present invention therefore provides plants or parts thereof, including plant cells, obtainable by the method according to the present invention, which plants or plant parts comprise a CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the terminal NH2 region of the polypeptide and whose nucleic acid is operably linked to a bud apical meristem promoter.

A invenção também fornece um método para a produção de plantas transgênicas tendo número de sementes aumentado em relação a plantas de controle adequadas, compreendendo introdução e expressão em uma planta de um ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, cujo ácido nucleico CDC27 está sob o controle de um promotor de meristema apical de broto.The invention also provides a method for producing transgenic plants having increased seed numbers relative to suitable control plants, comprising introducing and expressing in a plant a CDC27 nucleic acid encoding a CDC27 polypeptide having at least one TPR domain inactive in the region. Terminal NH2 of the polypeptide, whose CDC27 nucleic acid is under the control of a bud apical meristem promoter.

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo número de sementes aumentado em relação a plantas de controle adequadas, cujo método compreende:More specifically, the present invention provides a method for the production of transgenic plants having increased number of seeds over suitable control plants, which method comprises:

(i) introduzir e expressar em a planta, parte vegetal ou célula vegetal um ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, cujo ácido nucleico está sob o controle de um promotor de meristema apical de broto; e(i) introducing and expressing into the plant, plant part or plant cell a CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide, whose nucleic acid is under the control of an apical meristem promoter. sprout; and

(ii) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.(ii) cultivate the plant cell under conditions promoting plant growth and development.

O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.Nucleic acid can be introduced directly into a plant cell or into the plant itself (including introduction into a tissue, organ or any other part of a plant). According to a preferred feature of the present invention, the nucleic acid is preferably introduced into a plant by transformation.

O termo "transformação" é definido na seção "Definições".The term "transformation" is defined in the "Definitions" section.

A presente invenção claramente se estende a qualquer célula vegetal ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes vegetais e propágulos destas. A presente invenção adicionalmente de estende para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.The present invention clearly extends to any plant cell or plant produced by any of the methods described herein, and to all plant parts and seedlings thereof. The present invention further extends to encompass the progeny of a transformed or transfected primary cell, tissue, organ or whole plant that has been produced by any of the methods mentioned above, the sole requirement being that the progeny exhibit the same (s) genotypic and / or phenotypic trait (s) than those produced by the ancestor in the methods according to the invention.

A invenção também inclui células hospedeiras contendo um ácido nucleico CDC27 isolado codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo e cujo ácido nucleico está sob o controle de um promotor de meristema apical de broto. Células hospedeiras preferidas de acordo com a invenção são células vegetais.The invention also includes host cells containing an isolated CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide and whose nucleic acid is under the control of a bud apical meristem promoter. Preferred host cells according to the invention are plant cells.

A invenção também se estende a partes aptas à colheita de uma planta tal como, mas não limitada a sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção além disso se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte apta à colheita de uma tal planta, tal como pelotas secas ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.The invention also extends to harvestable parts of a plant such as, but not limited to seeds, leaves, fruits, flowers, stems, rhizomes, tubers and bulbs. The invention further relates to products derived, preferably directly derived, from a crop-fit part of such a plant, such as dried pellets or powders, oil, fat and fatty acids, starch or proteins.

A presente invenção também abrange uso de ácidos nucleicos CDC27 codificando polipeptídeos CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, cujos ácidos nucleicos estão sob o controle de um promotor de meristema apical de broto. Tais usos se referem a aumentar produção vegetal como definida acima nos métodos da invenção.The present invention also encompasses use of CDC27 nucleic acids encoding CDC27 polypeptides having at least one inactive TPR domain in the terminal NH2 region of the polypeptide, whose nucleic acids are under the control of a bud apical meristem promoter. Such uses refer to increasing crop yield as defined above in the methods of the invention.

Desempenho dos métodos de acordo com a presente invenção resulta em plantas tendo número de sementes aumentado em relação a plantas de controle adequadas. Este aumento em número de sementes também pode ser combinado com outras características economicamente vantajosas, tal como características adicionais que estimulam produção, tolerância a outros estresses abióticos e bióticos, características modificando vários atributos arquitetônicos e/ou atributos bioquímicos e/ou fisiológicos. AT-hook de Descrição DetalhadaPerformance of the methods according to the present invention results in plants having increased seed numbers relative to suitable control plants. This increase in seed number can also be combined with other economically advantageous features, such as additional features that stimulate yield, tolerance to other abiotic and biotic stresses, features modifying various architectural attributes and / or biochemical and / or physiological attributes. AT-hook Detailed Description

Domínios AT-hook são bem conhecidos na técnica e são tipicamente encontrados em polipeptídeos pertencendo a uma família de fatores de transcrição associados com remodelagem de Cromatina. O motivo AT-hook é constituído de 13 ou mais (algumas vezes cerca de 9) aminoácidos que participam em ligação de DNA e que têm uma preferência por regiões ricas em A/T. Em Arabidopsis existem pelo menos 34 proteínas contendo domínios AT-hook. Estas proteínas compartilham homologia ao longo da maioria da seqüência, com o domínio AT-hook sendo uma região particularmente altamente conservada. O domínio AT-hook é ilustrado em Figura 23 e Tabela lia seguir; veja também a anotação apropriada de SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169 e SEQ ID NO: 171 onde a posição do domínio AT-hook é especificada. Como mostrado no alinhamento de Figura 23, alguma variação dentro do domínio AT-hook é permitida. Tipicamente, um ou dois domínios AT-hook precedem o domínio DUF296. Referência neste lugar a um domínio AT-hook é adotada para significar uma seqüência de polipeptídeos tendo em ordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90% ou 95% de identidade com o domínio AT-hook de SEQ ID NO: 153, que é repetido aqui para conveniência: RRPRGRPAGSKNK (domínio AT-hook de SEQ ID NO: 153).AT-hook domains are well known in the art and are typically found on polypeptides belonging to a family of transcription factors associated with Chromatin remodeling. The AT-hook motif consists of 13 or more (sometimes about 9) amino acids that participate in DNA binding and have a preference for A / T-rich regions. In Arabidopsis there are at least 34 proteins containing AT-hook domains. These proteins share homology throughout most of the sequence, with the AT-hook domain being a particularly highly conserved region. The AT-hook domain is illustrated in Figure 23 and Table II below; see also the appropriate notation of SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169 and SEQ ID NO: 171 where the position of the AT-hook domain is specified. As shown in the alignment of Figure 23, some variation within the AT-hook domain is allowed. Typically, one or two AT-hook domains precede the DUF296 domain. Reference herein to an AT-hook domain is adopted to mean a sequence of polypeptides having in ascending order of preference at least 70%, 75%, 80%, 85%, 90% or 95% identity with the AT-hook domain. of SEQ ID NO: 153, which is repeated here for convenience: RRPRGRPAGSKNK (AT-hook domain of SEQ ID NO: 153).

Domínios DUF296 (referidos em Interpro como IPR005175) também são bem conhecidos na técnica. O domínio DUF296 é ilustrado em Figura 23 e Tabela lia seguir; veja também a anotação apropriada de SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169 and SEQ ID NO: 171, onde a posição do domínio DUF296 é especificada. Como mostrado no alinhamento de Figura 23, variação dentro do domínio DUF296 é permitida enquanto que ainda sendo facilmente identificado como um domínio DUF296 devido à presença de alguns resíduos de aminoácidos altamente conservados. Tipicamente, o domínio DUF296 é precedido por um ou dois domínios AT-hook.DUF296 domains (referred to in Interpro as IPR005175) are also well known in the art. The domain DUF296 is illustrated in Figure 23 and Table II below; see also the appropriate notation of SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169 and SEQ ID NO: 171, where the domain position DUF296 is specified. As shown in the alignment of Figure 23, variation within the DUF296 domain is allowed while still being easily identified as a DUF296 domain due to the presence of some highly conserved amino acid residues. Typically, the DUF296 domain is preceded by one or two AT-hook domains.

De acordo com uma característica preferida da presente invenção, polipeptídeos compreendendo um domínio AT-hook e um domínio DUF296 adicionalmente compreendem um dos seguintes motivos:According to a preferred feature of the present invention, polypeptides comprising an AT-hook domain and a DUF296 domain further comprise one of the following reasons:

Motivo 1 (SEQ ID NO: 190): QGQ V/I GG; ouReason 1 (SEQ ID NO: 190): QGQ V / I GG; or

Motivo 2 (SEQ ID NO: 191): ILSLSGSFLPPPAPP; ouReason 2 (SEQ ID NO: 191): ILSLSGSFLPPPAPP; or

Motivo 3 (SEQ ID NO: 192): NATYERLP; ouReason 3 (SEQ ID NO: 192): NATYERLP; or

Motivo 4 (SEQ ID NO: 193): SFTNVAYERLPL com nenhuma ou uma mudança de aminoácido em qualquer posição; ouReason 4 (SEQ ID NO: 193): SFTNVAYERLPL with none or an amino acid change at any position; or

Motivo 5 (SEQ ID NO: 194): GRFEILSLTGSFLPGPAPPGSTGLTIYLAGGQGQWGGSVVG com nenhuma, uma ou duas mudança de aminoácido em qualquer posição.Reason 5 (SEQ ID NO: 194): GRFEILSLTGSFLPGPAPPGSTGLTIYLAGGQGQWGGSVVG with no, one or two amino acid changes at any position.

De acordo com uma característica preferida da presente invenção, seqüências adequadas para uso nos métodos da invenção são polipeptídeos compreendendo um domínio AT-hook (como definido acima) e um domínio DUF296 (como definido acima) e Motivo 2 (como definido acima), ou ácidos nucleicos codificando tais polipeptídeos.According to a preferred feature of the present invention, sequences suitable for use in the methods of the invention are polypeptides comprising an AT-hook domain (as defined above) and a DUF296 domain (as defined above) and Reason 2 (as defined above), or nucleic acids encoding such polypeptides.

Deve ser entendido que as seqüências detalhadas em Tabela 1 e aquelas mostradas no alinhamento de Figura 23 são apenas exemplos de seqüências úteis nos métodos da invenção e que qualquer polipeptídeo tendo um domínio AT-hook e um domínio DUF296, ou qualquer ácido nucleico codificando o mesmo, pode ser adequado para uso para realizar os métodos da invenção.It should be understood that the sequences detailed in Table 1 and those shown in the alignment of Figure 23 are only examples of sequences useful in the methods of the invention and that any polypeptide having an AT-hook domain and a DUF296 domain, or any nucleic acid encoding the same. may be suitable for use to perform the methods of the invention.

Tabela 11: Exemplos de seqüências de aminoácidos compreendendo um domínio AT-hook e um domínio DUF296 com detalhes das seqüências destes domínios e suas respectivas posiçõesTable 11: Examples of amino acid sequences comprising an AT-hook domain and a DUF296 domain with details of the sequences of these domains and their respective positions.

<table>table see original document page 129</column></row><table> <table>table see original document page 130</column></row><table> <table>table see original document page 131</column></row><table><table> table see original document page 129 </column> </row> <table> <table> table see original document page 130 </column> </row> <table> <table> table see original document page 131 < / column> </row> <table>

Uma pessoa versada na técnica será prontamente capaz de identificar polipeptídeos compreendendo um domínio AT-hook e um domínio DUF296 usando técnicas e ferramentas bem conhecidas na técnica. Tal identificação pode ser por alinhamento de seqüências para comparação de seqüências usando GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas que maximiza o número de identidades e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através de National Centre for Biotechnology Information. Polipeptídeos compreendendo um domínio AT-hook e um domínio DUF296 podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83) disponível em http://clustalw.genome.jp/sit-bin/nph-ClustalW, com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Edição manual secundária pode ser realizada para otimizar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na técnica.One skilled in the art will readily be able to identify polypeptides comprising an AT-hook domain and a DUF296 domain using techniques and tools well known in the art. Such identification may be by sequence alignment for sequence comparison using GAP, BESTFIT, BLAST, FASTA and TFASTA. GAP uses the algorithm of Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) to find the alignment of two complete sequences that maximizes the number of identities and minimizes the number of gaps. The BLAST algorithm (Altschul et al. (1990) J Mol Biol 215: 403-10) calculates percent sequence identity and performs a statistical analysis of similarity between the two sequences. The computer application for performing BLAST analysis is publicly available through the National Center for Biotechnology Information. Polypeptides comprising an AT-hook domain and a DUF296 domain can be readily identified using, for example, the ClustalW multiple sequence alignment algorithm (version 1.83) available at http://clustalw.genome.jp/sit-bin/nph- ClustalW, with the standard paired alignment parameters, and a percentage scoring method. Secondary manual editing can be performed to optimize alignment between retained subjects, as should be apparent to a person skilled in the art.

O domínio AT-hook e o domínio DUF296 podem ser identificados usando bancos de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http://www.ebi.ac.uk/interpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), http://www.expasy.org/prosite/) ou Pfam (Bateman et al., Nucleic Acids Research 30(l):276-280 (2002), http://www.sanger.ac.uk/Software/Pfam/).The AT-hook domain and the DUF296 domain can be identified using specialized databases eg SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids Res. 31, 315-318; http: // www. ebi.ac.uk/interpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequence motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., Pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids Res. 32: D134- D137, (2004), http://www.expasy.org/prosite/) or Pfam (Bateman et al., Nucleic Acids Research 30 (1): 276-280 (2002), http: //www.sanger. ac.uk/Software/Pfam/).

As seqüências mencionadas em Tabela 11, ou como identificadas usando as técnicas mencionadas acima (tal como alinhamento de seqüências), podem ser consideradas homólogos de um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, cujos homólogos também compreendem um domínio AT-hook e um domínio DUF296 mas que podem variar em qualquer outro lugar na seqüência. "Homólogos" de uma proteína são definidos na seção "Definições" neste lugar. Homólogos preferidos são seqüências de aminoácidos tendo em ordem crescente de preferência pelo menos 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% ou mais de identidade de seqüência com uma seqüência de aminoácidos representada por SEQ ED NO: 153, cujos homólogos compreendem um domínio AT-hook e um domínio DUF296 e ainda preferivelmente compreendem Motivo 2.The sequences mentioned in Table 11, or as identified using the techniques mentioned above (such as sequence alignment), may be considered homologous to a polypeptide comprising an AT-hook domain and a DUF296 domain, whose homologues also comprise an AT-hook domain. and a domain DUF296 but which may vary anywhere else in the sequence. "Counterparts" of a protein are defined in the "Definitions" section in this place. Preferred homologues are amino acid sequences having in ascending order preferably at least 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% or more of sequence identity with an amino acid sequence represented by SEQ ED NO: 153, which homologues comprise an AT-hook domain and a DUF296 domain and still preferably comprise Motive 2.

O polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, ou um homólogo de tal polipeptídeo, pode ser um derivado, como definido na seção "Definições" neste lugar.The polypeptide comprising an AT-hook domain and a DUF296 domain, or a homologue of such a polypeptide, may be a derivative as defined in the "Definitions" section herein.

Qualquer ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 pode ser adequado para uso nos métodos da invenção. Exemplos de tais seqüências incluem aquelas seqüências de nucleotídeos representadas por SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 e SEQ ID NO: 170.Any nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain may be suitable for use in the methods of the invention. Examples of such sequences include those nucleotide sequences represented by SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO. : 164, SEQ ID NO: 166, SEQ ID NO: 168 and SEQ ID NO: 170.

Variantes de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 também podem ser adequadas para uso para praticar os métodos da invenção contanto que as variantes codifiquem polipeptídeos compreendendo um domínio AT- hook e um domínio DUF296. Tais variantes de ácidos nucleicos podem ser porções de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 e/ou ácidos nucleicos capazes de hibridizar com um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296.Variants of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain may also be suitable for use to practice the methods of the invention as long as variants encode polypeptides comprising an AT-hook domain and a DUF296 domain. Such nucleic acid variants may be portions of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain and / or nucleic acids capable of hybridizing to a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. .

Uma porção pode ser preparada, por exemplo, fazendo uma ou mais deleções para um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296. As porções podem ser usadas em forma isolada ou elas podem ser fundidas a outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combina diversas atividades. Quando fundido a outras seqüências de codificação, o polipeptídeo resultante produzido em tradução pode ser maior do que aquele previsto para a porção. Preferivelmente, a porção é uma porção de um ácido nucleico como representada por qualquer um de SEQ ID NO: 152, SEQID NO: 154, SEQID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 e SEQ ID NO: 170. Mais preferivelmente a porção é uma porção de um ácido nucleico como representada por SEQ ID NO: 152, cuja porção codifica um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 e ainda preferivelmente compreende Motivo 2.A portion may be prepared, for example, by making one or more deletions to a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. The portions may be used in isolation or they may be fused to other coding (or non-coding) sequences to, for example, produce a protein that combines various activities. When fused to other coding sequences, the resulting translation-produced polypeptide may be larger than that predicted for the portion. Preferably, the moiety is a portion of a nucleic acid as represented by any one of SEQ ID NO: 152, SEQID NO: 154, SEQID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162 SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 and SEQ ID NO: 170. More preferably the portion is a portion of a nucleic acid as represented by SEQ ID NO: 152, which portion encodes a polypeptide. comprising an AT-hook domain and a DUF296 domain and further preferably comprising Reason 2.

Outra variante de ácido nucleico é um ácido nucleico capaz de hibridizar em condições de estringência reduzida, preferivelmente em condições estringentes, com um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296. Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com um ácido nucleico como representado por qualquer um de SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 e SEQ ID NO: 170, ou com uma porção de qualquer das seqüências mencionadas acima como definido acima. Mais preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 152, cuja seqüência hibridizante codifica um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 e ainda preferivelmente compreende Motivo 2.Another nucleic acid variant is a nucleic acid capable of hybridizing under reduced stringency conditions, preferably under stringent conditions, to a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. Preferably, the hybridizing sequence is one which is capable of hybridizing to a nucleic acid as represented by any of SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 and SEQ ID NO: 170, or with a portion of any of the sequences mentioned above as defined above. More preferably, the hybridizing sequence is one that is capable of hybridizing to a nucleic acid as represented by SEQ ID NO: 152, whose hybridizing sequence encodes a polypeptide comprising an AT-hook domain and a DUF296 domain and still preferably comprises Motive 2.

O termo "hibridização" é como definido neste lugar na seçãoThe term "hybridization" is as defined here in the section

"Definições"."Definitions".

Outra variante de ácido nucleico é uma variante de união alternativa, como definido na seção "Definições". São preferidas variantes de união de seqüências de ácidos nucleicos representadas por SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 e SEQ ID NO: 170. A mais preferida é uma variante de união de uma seqüência de ácidos nucleicos como representada por SEQ ID NO: 152, cuja variante de união codifica um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 e ainda preferivelmente compreendendo Motivo 2.Another nucleic acid variant is an alternative splice variant as defined in the "Definitions" section. Nucleic acid sequence splice variants represented by SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 162, SEQ ID are preferred. NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 and SEQ ID NO: 170. Most preferred is a splice variant of a nucleic acid sequence as represented by SEQ ID NO: 152, whose splice variant encodes a polypeptide comprising an AT-hook domain and a DUF296 domain and still preferably comprising Motive 2.

Outra variante de ácido nucleico é uma variante alélica como definido na seção "Definições". São preferidas variantes alélicas de seqüências de ácidos nucleicos representadas por SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168 e SEQ ID NO: 170. A mais preferida é uma variante alélica de uma seqüência de ácidos nucleicos como representada por SEQ ID NO: 152, cuja variante alélica codifica um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 e ainda preferivelmente compreende Motivo 2.Another nucleic acid variant is an allelic variant as defined in the "Definitions" section. Allelic variants of nucleic acid sequences represented by SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO are preferred. : 164, SEQ ID NO: 166, SEQ ID NO: 168 and SEQ ID NO: 170. Most preferred is an allelic variant of a nucleic acid sequence as represented by SEQ ID NO: 152, whose allelic variant encodes a polypeptide comprising an AT-hook domain and a DUF296 domain and further preferably comprises Reason 2.

Variantes de ácidos nucleicos também podem ser obtidas através de evolução direta (veja seção "Definições").Nucleic acid variants can also be obtained through direct evolution (see section "Definitions").

Mutagênese sítio dirigida também pode ser usada para gerar variantes de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296. Veja seção "Definições".Site directed mutagenesis can also be used to generate variants of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. See section "Definitions".

O ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 pode ser derivado de qualquer fonte natural ou artificial. O ácido nucleico/gene ou variante deste pode ser isolado de uma fonte microbiana, tal como levedura ou fungos, ou de uma fonte vegetal, algal ou animal. Este ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana deliberada. O ácido nucleico é preferivelmente de origem vegetal, quer da mesma espécie de planta (por exemplo que aquela na qual ele é introduzido) ou quer de uma espécie diferente de planta. O ácido nucleico pode ser isolado de uma espécie dicotiledônea, preferivelmente de uma espécie monocotiledônea tal como arroz. Mais preferivelmente, o ácido nucleico de arroz codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 é representado por SEQ ID NO: 152 e o polipeptídeo codificado é como representado por SEQ ID NO: 153.Nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain may be derived from any natural or artificial source. The nucleic acid / gene or variant thereof may be isolated from a microbial source, such as yeast or fungi, or from a plant, algal or animal source. This nucleic acid may be modified from its native form in genomic composition and / or environment through deliberate human manipulation. The nucleic acid is preferably of plant origin, either from the same plant species (for example that into which it is introduced) or from a different plant species. The nucleic acid may be isolated from a dicotyledonous species, preferably from a monocotyledonous species such as rice. More preferably, rice nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain is represented by SEQ ID NO: 152 and the encoded polypeptide is as represented by SEQ ID NO: 153.

A expressão de um ácido nucleico codificando AT-hook pode ser modulada introduzindo uma modificação genética (preferivelmente no locus de um gene codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296). O locus de um gene como definido neste lugar é adotado para significar uma região genômica, a qual inclui o gene de interesse and 10 kb antes ou depois da região de codificação.Expression of a nucleic acid encoding AT-hook may be modulated by introducing a genetic modification (preferably at the locus of a gene encoding a polypeptide comprising an AT-hook domain and a DUF296 domain). The locus of a gene as defined herein is adopted to mean a genomic region, which includes the gene of interest and 10 kb before or after the coding region.

A modificação genética pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLING, recombinação homóloga e introduzindo e expressando em uma planta monocotiledônea um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296. Veja a seção "Definições" para detalhes de ativação de T-DNA, TILLING e recombinação homóloga. Seguindo introdução da modificação genética, pode seguir uma etapa de selecionar para expressão aumentada em tecido de endosperma de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, cuja expressão direcionada gera plantas tendo produção aumentada de sementes.Genetic modification may be introduced, for example, by any (or more) of the following methods: T-DNA activation, TILLING, homologous recombination and introducing and expressing into a monocot plant a nucleic acid encoding a polypeptide comprising an AT- domain. hook is a DUF296 domain. See the "Definitions" section for details of T-DNA activation, TILLING, and homologous recombination. Following introduction of genetic modification, a step of selecting for increased expression in endosperm tissue of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain, whose targeted expression generates plants having increased seed production, can be followed.

A escolha de promotor para identificação por ativação de T- DNA no caso da presente invenção pode ser qualquer promotor capaz de dirigir preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea.The choice of promoter for identification by T-DNA activation in the case of the present invention may be any promoter capable of preferentially directing expression in endosperm tissue of a monocotyledonous plant.

Ativação de T-DNA e TILLING são exemplos de tecnologias que possibilitam a geração de novos alelos e variantes de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296.T-DNA activation and TILLING are examples of technologies that enable the generation of novel alleles and variants of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain.

Um método preferido para introduzir uma modificação genética (que neste caso não precisa ser no locus de um ácido nucleico/gene codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296) é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296. O ácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico de comprimento completo ou pode ser uma porção ou qualquer outro ácido nucleico variante contanto que o ácido nucleico variante codifique um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296.A preferred method for introducing a genetic modification (which in this case need not be at the locus of a polypeptide-encoding nucleic acid / gene comprising an AT-hook domain and a DUF296 domain) is to introduce and express into a plant a polypeptide-encoding nucleic acid comprising an AT-hook domain and a DUF296 domain. The nucleic acid to be introduced into a plant may be a full length nucleic acid or may be a portion or any other variant nucleic acid as long as the variant nucleic acid encodes a polypeptide comprising an AT-hook domain and a DUF296 domain.

Os métodos da presente invenção recorrem a aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296. Isto pode ser atingido por superexpressão dirigida por promotores apropriados, o uso de estimuladores de transcrição ou estimuladores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou estimuladores podem ser introduzidos em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um gene/ácido nucleico ou variante deste codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção para controlar expressão do gene.The methods of the present invention resort to preferentially increasing endosperm tissue expression of a monocotyledonous plant of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. This can be achieved by overexpression directed by appropriate promoters, the use of transcription enhancers or translation enhancers. Isolated nucleic acids serving as promoter or enhancer elements may be introduced at an appropriate (typically before) position in a nonheterologous form of a polynucleotide in order to enhance expression of a gene / nucleic acid or variant thereof encoding a polypeptide comprising an AT domain -hook and a domain DUF296. For example, endogenous promoters may be altered in vivo by mutation, deletion, and / or substitution (see, Kmiec, U.S. Patent No. 5,565,350; Zarling et al., PCT / US93 / 03868), or isolated promoters. be introduced into a plant cell at the appropriate orientation and distance of a gene of the present invention to control gene expression.

Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer outro gene eucariótico.If polypeptide expression is desired, it is generally desirable to include a polyadenylation region at the 3 'end of a polynucleotide coding region. The polyadenylation region may be derived from the natural gene, a variety of other plant genes, or T-DNA. The 3 'end sequence to be added may be derived, for example, from the nopaline synthase or octopine synthase genes, or alternatively from another plant gene, or less preferably from any other eukaryotic gene.

Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citossol. Inclusão de um íntron processável na unidade de transcrição tanto em construções vegetais como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et ai. (1987) Genes Dev 1:1183- 1200). Tal estimulação intrônica de expressão gênica tipicamente é maior quando localizada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na técnica. Veja geralmente, The Maize Handbook, capítulo 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).An intronic sequence can also be added to the untranslated 5 'region or coding sequence of the partial coding sequence to increase the amount of mature message that accumulates in the cytosol. Inclusion of a processable intron in the transcription unit in both plant and animal constructs has been shown to increase gene expression at both mRNA and protein levels by up to 1000-fold (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et (1987) Genes Dev 1: 1183-1200). Such intronic stimulation of gene expression is typically greater when located near the 5 'end of the transcription unit. Using the introns of Adhl-S 1, 2, and 6 intron maize, the Bronze-I intron are known in the art. See generally, The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.The invention also provides genetic constructs and vectors to facilitate introduction and / or expression of nucleotide sequences useful in the methods according to the invention.

Portanto, é fornecida uma construção gênica compreendendo:Therefore, a gene construct is provided comprising:

(i) Um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296;(i) A nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain;

(ii) Uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i) em tecido de endosperma de uma planta monocotiledônea; e opcionalmente(ii) One or more control sequences capable of directing expression of the nucleic acid sequence of (i) in endosperm tissue of a monocotyledonous plant; and optionally

(iii)Uma seqüência de término de transcrição. A invenção também fornece uso de uma construção como definido acima em métodos para aumentar produção de sementes de uma planta monocotiledônea.(iii) A transcription termination sequence. The invention also provides use of a construct as defined above in methods for increasing seed production of a monocot plant.

Construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando tecnologia de DNA recombinante bem conhecida por pessoas versadas na técnica. As construções gênicas podem ser inseridas em vetores, que podem estar comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fornece uso de uma construção como definido acima em métodos para aumentar produção de sementes em uma planta monocotiledônea.Constructs useful in the methods according to the present invention may be constructed using recombinant DNA technology well known to those skilled in the art. Gene constructs may be inserted into commercially available vectors suitable for plant transformation and suitable for expression of the gene of interest in transformed cells. The invention also provides use of a construct as defined above in methods for increasing seed yield in a monocot plant.

Plantas monocotiledôneas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor) capaz de aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea. Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e são definidos na seção "Definições".Monocotyledonous plants are transformed with a vector comprising the sequence of interest (i.e., a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain). The sequence of interest is operably linked to one or more control sequences (at least one promoter) capable of preferentially increasing expression in endosperm tissue of a monocotyledonous plant. The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably in this place and are defined in the "Definitions" section.

Um promotor endosperma específico se refere a qualquer promotor capaz de dirigir preferencialmente expressão do gene de interesse em tecido de endosperma. Referência neste lugar para aumentar preferencialmente expressão em tecido de endosperma é adotada para significar aumentar expressão em tecido de endosperma substancialmente para a exclusão de expressão em qualquer outro lugar na planta, sem considerar qualquer expressão residual devido a promotores permeáveis. Por exemplo, o promotor de prolamina mostra forte expressão no endosperma, com permeabilidade em meristema, mais especificamente o meristema de broto e/ou centro de discriminação no meristema. Preferivelmente, o promotor endosperma específico é um promotor isolado de um gene de prolamina, tal como um promotor de prolamina RP6 de arroz (Wen et ai, (1993) Plant physiol 101(3): 1115-6) como representado por SEQ ID NO: 195 ou um promotor de força similar e/ou um promotor com um padrão de expressão similar que o promotor de prolamina de arroz. Força similar e/ou padrão de expressão similar podem ser analisados, por exemplo, acoplando os promotores a um gene repórter e verificando a função do gene repórter em tecidos da planta. Um gene repórter bem conhecido é beta-glucuronidase e o corante colorimétrico GUS usado para visualizar atividade de beta-glucuronidase em tecido vegetal. Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico representado por SEQ ID NO: 152, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico codificando um domínio AT-hook e um domínio DUF296 quando dirigida por um promotor de prolamina. Exemplos de outros promotores endosperma específicos que também podem ser usados para realizar os métodos da invenção são mostrados em Tabela 6 na seção "Definições".A specific endosperm promoter refers to any promoter capable of preferentially directing expression of the gene of interest in endosperm tissue. Reference herein to preferentially increase endosperm tissue expression is adopted to mean increasing endosperm tissue expression substantially to the exclusion of expression elsewhere in the plant, without considering any residual expression due to permeable promoters. For example, the prolamine promoter shows strong endosperm expression with meristem permeability, more specifically the bud meristem and / or center of discrimination in the meristem. Preferably, the specific endosperm promoter is an isolated promoter of a prolamine gene, such as a rice RP6 prolamine promoter (Wen et al, (1993) Plant physiol 101 (3): 1115-6) as represented by SEQ ID NO. : 195 or a similar strength promoter and / or a promoter with a similar expression pattern as the rice prolamine promoter. Similar force and / or similar expression pattern can be analyzed, for example, by coupling promoters to a reporter gene and by checking reporter gene function in plant tissues. A well-known reporter gene is beta-glucuronidase and the GUS colorimetric dye used to visualize beta-glucuronidase activity in plant tissue. It should be clear that the applicability of the present invention is not restricted to the nucleic acid represented by SEQ ID NO: 152, nor is the applicability of the invention restricted to the expression of a nucleic acid encoding an AT-hook domain and a DUF296 domain when directed by a prolamine promoter. Examples of other specific endosperm promoters that may also be used to carry out the methods of the invention are shown in Table 6 in the "Definitions" section.

Opcionalmente, uma ou mais seqüências terminadoras também podem ser usadas na construção introduzida em uma planta. O termo "terminador" é definido na seção "Definições".Optionally, one or more terminator sequences may also be used in the construction introduced into a plant. The term "terminator" is defined in the "Definitions" section.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colE1.The genetic constructs of the invention may additionally include an origin of replication sequence that is required for maintenance and / or replication in a specific cell type. An example is when a genetic construct is required to be maintained in a bacterial cell as an episomal genetic element (e.g., plasmid or cosmid molecule). Preferred sources of replication include, but are not limited to, fl-ori and colE1.

A construção genética pode compreender opcionalmente um gene marcador selecionável como definido neste lugar. Em uma forma de realização preferida, é fornecida uma construção gênica compreendendo:The genetic construct may optionally comprise a selectable marker gene as defined herein. In a preferred embodiment, a gene construct is provided comprising:

(i) Um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296;(i) A nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain;

(ii) Um promotor de prolamina capaz de dirigir preferencialmente expressão da seqüência de ácidos nucleicos de (i) em tecido de endosperma de uma planta monocotiledônea; e opcionalmente (iii) Uma seqüência de término de transcrição.(ii) A prolamine promoter capable of preferentially directing nucleic acid sequence expression of (i) in endosperm tissue of a monocotyledonous plant; and optionally (iii) A transcription termination sequence.

A presente invenção também abrange plantas monocotiledôneas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas monocotiledôneas, partes destas (incluindo células vegetais) obteníveis pelos métodos de acordo com a presente invenção, cujas plantas ou partes destas compreendem um transgene codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 operavelmente ligado a um promotor endosperma específico, preferivelmente a um promotor de prolamina.The present invention also encompasses monocotyledonous plants obtainable by the methods according to the present invention. The present invention therefore provides monocotyledonous plants, parts thereof (including plant cells) obtainable by the methods according to the present invention, which plants or parts thereof comprise a transgene encoding a polypeptide comprising an AT-hook domain and a DUF296 domain operably linked to a specific endosperm promoter, preferably to a prolamine promoter.

A invenção também fornece um método para a produção de plantas monocotiledôneas transgênicas tendo produção aumentada de sementes em relação a plantas de controle adequadas, compreendendo introdução e expressão em uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, caracterizado pelo fato de que dita expressão é preferencialmente aumentada em tecido de endosperma de uma planta monocotiledônea.The invention also provides a method for producing transgenic monocotyledonous plants having increased seed yield over suitable control plants, comprising introducing and expressing into a monocotyledonous plant a nucleic acid encoding a polypeptide comprising an AT-hook domain and a domain. DUF296, characterized in that said expression is preferably increased in endosperm tissue of a monocotyledonous plant.

Mais especificamente, a presente invenção fornece um método para a produção de plantas monocotiledôneas transgênicas tendo produção aumentada de sementes cujo método compreende:More specifically, the present invention provides a method for producing transgenic monocotyledonous plants having increased seed production which method comprises:

(i) introduzir e aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296; e(i) preferably introducing and increasing endosperm tissue expression of a monocotyledonous plant of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain; and

(ii) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.(ii) cultivate the plant cell under conditions promoting plant growth and development.

O ácido nucleico pode ser introduzido diretamente em uma célula vegetal de uma planta monocotiledônea ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.Nucleic acid can be introduced directly into a plant cell of a monocot plant or in the plant itself (including introduction into a tissue, organ or any other part of a plant). According to a preferred feature of the present invention, the nucleic acid is preferably introduced into a plant by transformation.

O termo "transformação" é definido na seção "Definições" neste lugar.The term "transformation" is defined in the "Definitions" section in this place.

A presente invenção claramente se estende a qualquer célula vegetal ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes vegetais e propágulos destas. A presente invenção adicionalmente de estende para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.The present invention clearly extends to any plant cell or plant produced by any of the methods described herein, and to all plant parts and seedlings thereof. The present invention further extends to encompass the progeny of a transformed or transfected primary cell, tissue, organ or whole plant that has been produced by any of the methods mentioned above, the sole requirement being that the progeny exhibit the same (s) genotypic and / or phenotypic trait (s) than those produced by the ancestor in the methods according to the invention.

A invenção também inclui células hospedeiras contendo um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT- hook e um domínio DUF296 operavelmente ligado a um promotor endosperma específico. Células hospedeiras preferidas de acordo com a invenção são células de planta monocotiledônea.The invention also includes host cells containing a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain operably linked to a specific endosperm promoter. Preferred host cells according to the invention are monocotyledonous plant cells.

A invenção também se estende a partes aptas à colheita de uma planta monocotiledônea tal como, mas não limitada a sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção além disso se refere a produtos derivados de, preferivelmente diretamente derivados de, uma parte apta à colheita de uma tal planta, tal como pelotas secas ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.The invention also extends to harvestable parts of a monocotyledonous plant such as, but not limited to seeds, leaves, fruits, flowers, stems, rhizomes, tubers and bulbs. The invention furthermore relates to products derived from, preferably directly derived from, a harvestable part of such a plant, such as dried pellets or powders, oil, fat and fatty acids, starch or proteins.

A presente invenção também abrange uso de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 para aumentar produção de sementes de uma planta monocotiledônea usando os métodos da invenção.The present invention also encompasses use of a polypeptide-encoding nucleic acid comprising an AT-hook domain and a DUF296 domain to increase seed production of a monocotyledonous plant using the methods of the invention.

Fatores de transcrição DOF de Descrição DetalhadaDetailed Description DOF Transcription Factors

O termo "polipeptídeo de fator de transcrição DOF" como definido neste lugar se refere a qualquer polipeptídeo compreendendo característica (i) como segue, e adicionalmente ou característica (ii) ou (iii) como seguem:The term "DOF transcription factor polypeptide" as defined herein refers to any polypeptide comprising feature (i) as follows, and additionally or feature (ii) or (iii) as follows:

(i) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e(i) in ascending order of preference at least 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and

(ii) em ordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou(ii) in ascending order of preference at least 70%, 75%, 80%, 85%, 90% or 95% sequence identity with the DOF domain represented by SEQ ID NO: 200; or

(iii)Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou(iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

Motivo II: DDPGDCLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição.Reason II: DDPGDCLFGKTIPF (SEQ ID NO: 230) with no change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position.

Adicionalmente, polipeptídeos compreendendo característica (i) e característica (iii) acima podem compreender qualquer um, quaisquer dois ou todos os três dos seguintes motivos:Additionally, polypeptides comprising feature (i) and feature (iii) above may comprise any, any two or all of the following motifs:

- Motivo III: SPTLGKHSRDE (SEQ ID NO: 231) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou- Reason III: SPTLGKHSRDE (SEQ ID NO: 231) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

- Motivo IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em- Reason IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) without any change; or with one or more conservative changes in

qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ouany position; or with one, two or three non-conservative change (s) at any position; and / or

- Motivo V: KGEGCLWVPKTLRID DPDEAAKSSIWT TLGIK (SEQ ID NO: 233) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas, três, quatro ou cinco mudança(s) não-conservativa(s) em qualquer posição.- Reason V: KGEGCLWVPKTLRID DPDEAAKSSIWT TLGIK (SEQ ID NO: 233) without any change; or with one or more conservative changes in any position; or with one, two, three, four or five non-conservative change (s) in any position.

Um polipeptídeo preferido compreendendo característica (i) e característica (iii) acima compreende tanto Motivo I como II.A preferred polypeptide comprising feature (i) and feature (iii) above comprises both Reason I and II.

Além disso, polipeptídeos de fator de transcrição DOF (pelo menos na sua forma nativa) tipicamente têm atividade de ligação de DNA e têm um domínio de ativação. A presença de um domínio de ativação e atividade de ligação de DNA pode ser facilmente determinada por uma pessoa versada na técnica usando técnicas e procedimentos de rotina.In addition, DOF transcription factor polypeptides (at least in their native form) typically have DNA binding activity and have an activation domain. The presence of a domain of activation and DNA binding activity can easily be determined by one of ordinary skill in the art using routine techniques and procedures.

SEQ ID NO: 199 (codificada por SEQ ID NO: 198) é um exemplo de um polipeptídeo de fator de transcrição DOF compreendendo características (i) e (ii) como definido acima, i.e. pelo menos 60% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e pelo menos 70% de identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200. Exemplos adicionais de polipeptídeos de fator de transcrição DOF compreendendo características (i) e (ii) como definido acima são dados em SEQ ID NO: 202 (codificada por SEQ ID NO: 201), SEQ ID NO: 204 (codificada por SEQ ID NO: 203), SEQ ID NO: 206 (codificada por SEQ ID NO: 205), SEQ ID NO: 208 (codificada por SEQ ID NO: 207), SEQ ID NO: 210 (codificada por SEQ ID NO: 209), SEQ ID NO: 212 (codificada por SEQ ID NO: 211), SEQ ID NO: 214 (codificada por SEQ ID NO: 213), SEQ ID NO: 216 (codificada por SEQ ID NO: 215), SEQ ID NO: 218 (codificada por SEQ ID NO: 217), SEQ ID NO: 220 (codificada por SEQ ID NO: 219), SEQ ID NO: 222 (codificada por SEQ ID NO: 221).SEQ ID NO: 199 (encoded by SEQ ID NO: 198) is an example of a DOF transcription factor polypeptide comprising characteristics (i) and (ii) as defined above, ie at least 60% sequence identity or with DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and at least 70% sequence identity to the DOF domain represented by SEQ ID NO: 200. Additional examples of DOF transcription factor polypeptides comprising characteristics (i) and (ii) as defined above are given in SEQ ID NO: 202 (encoded by SEQ ID NO: 201), SEQ ID NO: 204 (encoded by SEQ ID NO: 203), SEQ ID NO: 206 (encoded by SEQ ID NO: 205), SEQ ID NO: 208 (encoded by SEQ ID NO: 207), SEQ ID NO: 210 (encoded by SEQ ID NO: 209), SEQ ID NO: 212 (encoded by SEQ ID NO: 211), SEQ ID NO: 214 (encoded by SEQ ID NO: 213), SEQ ID NO: 216 (encoded by SEQ ID NO: 215), SEQ ID NO: 218 (encoded by SEQ ID NO: 217), SEQ ID NO: 220 (encoded by SEQ ID NO: 219), SEQ ID NO: 222 (encoded by SEQ ID NO: 221).

SEQ ID NO: 227 (codificada por SEQ ID NO: 226) é um exemplo de um polipeptídeo de fator de transcrição DOF compreendendo características (i) e (iii) como definido acima, i.e. pelo menos 60% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e Motivo I e/ou Motivo II como definido acima. Exemplos adicionais de polipeptídeos de fator de transcrição DOF compreendendo características (i) e (iii) como definido acima são dados em SEQ ID NO: 235 (codificada por SEQ ID NO: 234), SEQ ID NO: 237 (codificada por SEQ ID NO: 236), SEQ ED NO: 239 (codificada por SEQ ID NO: 238), SEQ ID NO: 241 (codificada por SEQ ID NO: 240), SEQ ID NO: 243 (codificada por SEQ ID NO: 242), SEQ ID NO: 245 (codificada por SEQ ID NO: 244), SEQ ID NO: 247 (codificada por SEQ ID NO: 246), SEQ ID NO: 249 (codificada por SEQ ID NO: 248), SEQ ID NO: 251 (codificada por SEQ ID NO: 250), SEQ ID NO: 253 (codificada por SEQ ID NO: 252), SEQ ID NO: 255 (codificada por SEQ ID NO: 254).SEQ ID NO: 227 (encoded by SEQ ID NO: 226) is an example of a DOF transcription factor polypeptide comprising characteristics (i) and (iii) as defined above, ie at least 60% sequence identity or with DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and Reason I and / or Reason II as defined above. Additional examples of DOF transcription factor polypeptides comprising features (i) and (iii) as defined above are given in SEQ ID NO: 235 (encoded by SEQ ID NO: 234), SEQ ID NO: 237 (encoded by SEQ ID NO : 236), SEQ ID NO: 239 (encoded by SEQ ID NO: 238), SEQ ID NO: 241 (encoded by SEQ ID NO: 240), SEQ ID NO: 243 (encoded by SEQ ID NO: 242), SEQ ID NO: 245 (encoded by SEQ ID NO: 244), SEQ ID NO: 247 (encoded by SEQ ID NO: 246), SEQ ID NO: 249 (encoded by SEQ ID NO: 248), SEQ ID NO: 251 ( encoded by SEQ ID NO: 250), SEQ ID NO: 253 (encoded by SEQ ID NO: 252), SEQ ID NO: 255 (encoded by SEQ ID NO: 254).

Os exemplos adicionais representados por SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222 são exemplos de "homólogos" de um polipeptídeo de fator de transcrição DOF representado por SEQ ID NO: 199.Additional examples represented by SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO : 216, SEQ ID NO: 218, SEQ ID NO: 220, SEQ ID NO: 222 are examples of "homologues" of a DOF transcription factor polypeptide represented by SEQ ID NO: 199.

Os exemplos adicionais representados por SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255 são exemplos de "homólogos" de um polipeptídeo de fator de transcrição DOF representado por SEQ ID NO: 227.Additional examples represented by SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO : 249, SEQ ID NO: 251, SEQ ID NO: 253, SEQ ID NO: 255 are examples of "homologues" of a DOF transcription factor polypeptide represented by SEQ ID NO: 227.

"Homólogos" de uma proteína são como definido neste lugar na seção "Definições"."Protein homologues" are as defined here in the "Definitions" section.

O polipeptídeo de fator de transcrição DOF ou homólogo deste pode ser um derivado. "Derivados" são definidos na seção "Definições" neste lugar.The DOF or homologue transcription factor polypeptide thereof may be a derivative. "Derivatives" are defined in the "Definitions" section here.

Os vários domínios estruturais em uma proteína de fator de transcrição DOF, tal como o domínio DOF, podem ser identificados usando bancos de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http://www.ebi.ac.uk/interpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), http://www.expasy.org/prosite/) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002), http://www.sanger.ac.uk/Software/Pfam/).The various structural domains in a DOF transcription factor protein, such as the DOF domain, can be identified using specialized databases eg SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857- 5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al. (2003) Nucl Acids Res. 31, 315-318; http://www.ebi.ac.uk/interpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequence motifs and its funetion in automatic sequence interpretation. (In) ISMB- 94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., Pp53-61, AAAIPress, Menlo Park; Hulo et al. Nucl. Acids Res. 32: D134-D137, (2004), http://www.expasy.org/prosite/) or Pfam (Bateman et al., Nucleic Acids Research 30 (1): 276-280 (2002 ), http://www.sanger.ac.uk/Software/Pfam/).

Exemplos de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF (e homólogos destes) incluem aqueles representados por qualquer um de: SEQ ID NO: 198, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 226, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 e SEQ ID NO: 254. Variantes de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF podem ser adequadas para uso nos métodos da invenção. Variantes adequadas incluem porções de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF e/ou ácidos nucleicos capazes de hibridizar com ácidos nucleicos/genes codificando polipeptídeos de fator de transcrição DOF. Variantes adicionais incluem variantes de união e variantes alélicas de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF (e homólogos destes).Examples of nucleic acids encoding DOF transcription factor polypeptides (and homologues thereof) include those represented by any of: SEQ ID NO: 198, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 217, SEQ ID NO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 226, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 and SEQ ID NO: 254. Nucleic acid variants encoding DOF transcription factor polypeptides may be suitable for use in the methods of the invention. Suitable variants include nucleic acid moieties encoding DOF transcription factor polypeptides and / or nucleic acids capable of hybridizing to nucleic acids / genes encoding DOF transcription factor polypeptides. Additional variants include splice variants and allelic nucleic acid variants encoding DOF transcription factor polypeptides (and homologs thereof).

O termo "porção" como definido neste lugar se refere a um pedaço de DNA codificando um polipeptídeo compreendendo característica (i) como segue, e adicionalmente ou característica (ii) ou (iii) como seguem:The term "portion" as defined herein refers to a piece of DNA encoding a polypeptide comprising feature (i) as follows, and additionally or feature (ii) or (iii) as follows:

(i) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e(i) in ascending order of preference at least 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and

(ii) em ordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou(ii) in ascending order of preference at least 70%, 75%, 80%, 85%, 90% or 95% sequence identity with the DOF domain represented by SEQ ID NO: 200; or

(iii)Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou(iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

Motivo II: DDPGIKLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição.Reason II: DDPGIKLFGKTIPF (SEQ ID NO: 230) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position.

Adicionalmente característica (iii) acima pode compreender qualquer um, quaisquer dois ou todos os três dos seguintes motivos:Additionally feature (iii) above may comprise any, any two or all three of the following reasons:

- Motivo III: SPTLGKHSRDE (SEQ ID NO: 231) sem nenhuma mudança; ou uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou- Reason III: SPTLGKHSRDE (SEQ ID NO: 231) without any change; or one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

- Motivo IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou- Reason IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

- Motivo V: KGEGCLWVPKTLRIDDPDE AAKSSIWTTL GIK (SEQ ID NO: 233) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas, três, quatro ou cinco mudança(s) não-conservativa(s) em qualquer posição.- Reason V: KGEGCLWVPKTLRIDDPDE AAKSSIWTTL GIK (SEQ ID NO: 233) without any change; or with one or more conservative changes in any position; or with one, two, three, four or five non-conservative change (s) in any position.

Uma porção pode ser preparada, por exemplo, fazendo uma ou mais deleções para um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF. As porções podem ser usadas em forma isolada ou elas podem ser fundidas a outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combina diversas atividades.A portion may be prepared, for example, by making one or more deletions to a nucleic acid encoding a DOF transcription factor polypeptide. The portions may be used in isolation or they may be fused to other coding (or non-coding) sequences to, for example, produce a protein that combines various activities.

Quando fundido a outras seqüências de codificação, o polipeptídeo resultante produzido em tradução pode ser maior do que aquele previsto para a porção de fator de transcrição DOF.When fused to other coding sequences, the resulting translation produced polypeptide may be larger than predicted for the DOF transcription factor portion.

Porções de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) e (ii) como definido acima são preferivelmente porções de um ácido nucleico como representado por qualquer um de: SEQ ID NO: 198, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 e SEQ ID NO: 221.Nucleic acid moieties encoding DOF transcription factor polypeptides comprising features (i) and (ii) as defined above are preferably portions of a nucleic acid as represented by any of: SEQ ID NO: 198, SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO : 219 and SEQ ID NO: 221.

Porções de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) e (iii) como definido acima são preferivelmente porções de um ácido nucleico como representado por qualquer um de: SEQ ID NO: 226, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 e SEQ ID NO: 254.Nucleic acid moieties encoding DOF transcription factor polypeptides comprising features (i) and (iii) as defined above are preferably portions of a nucleic acid as represented by any of: SEQ ID NO: 226, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO : 252 and SEQ ID NO: 254.

Outra variante de um ácido nucleico/gene de fator de transcrição DOF é um ácido nucleico capaz de hibridizar em condições de estringência reduzida, preferivelmente em condições estringentes, com um ácido nucleico/gene de fator de transcrição DOF como definido acima, cuja seqüência hibridizante codifica um polipeptídeo compreendendo característica (i) como segue e adicionalmente ou característica (ii) ou (iii) como seguem:Another variant of a DOF transcription factor gene / nucleic acid is a nucleic acid capable of hybridizing under reduced stringency conditions, preferably under stringent conditions, with a nucleic acid / DOF transcription factor gene as defined above, whose hybridizing sequence encodes a polypeptide comprising feature (i) as follows and additionally or feature (ii) or (iii) as follows:

(i) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e(i) in ascending order of preference at least 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and

(ii) em ordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou(ii) in ascending order of preference at least 70%, 75%, 80%, 85%, 90% or 95% sequence identity with the DOF domain represented by SEQ ID NO: 200; or

(iii) Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou(iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

Motivo II: DDPGIKLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição.Reason II: DDPGIKLFGKTIPF (SEQ ID NO: 230) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position.

Adicionalmente característica (iii) acima pode compreender qualquer um, quaisquer dois ou todos os três dos seguintes motivos:Additionally feature (iii) above may comprise any, any two or all three of the following reasons:

- Motivo III: SPTLGKHSRDE (SEQ ID NO: 231) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou- Reason III: SPTLGKHSRDE (SEQ ID NO: 231) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

- Motivo IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou- Reason IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

- Motivo V: KGEGCLWVPKTLRIDDPDEAAK SSIWTTL GIK (SEQ ID NO: 233) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas, três, quatro ou cinco mudança(s) não-conservativa(s) em qualquer posição.- Reason V: KGEGCLWVPKTLRIDDPDEAAK SSIWTTL GIK (SEQ ID NO: 233) without any change; or with one or more conservative changes in any position; or with one, two, three, four or five non-conservative change (s) in any position.

Preferivelmente, a seqüência hibridizante codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) e (ii) como definido acima é uma seqüência capaz de hibridizar com um ácido nucleico como representado por qualquer um de: SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 e SEQ ID NO: 221.Preferably, the hybridizing sequence encoding DOF transcription factor polypeptides comprising characteristics (i) and (ii) as defined above is a sequence capable of hybridizing to a nucleic acid as represented by any of: SEQ ID NO: 201, SEQ ID NO : 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 and SEQ ID NO: 221.

Preferivelmente, a seqüência hibridizante codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) e (iii) como definido acima é uma seqüência capaz de hibridizar com um ácido nucleico como representado por qualquer um de: SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 e SEQ ID NO: 254.Preferably, the hybridizing sequence encoding DOF transcription factor polypeptides comprising characteristics (i) and (iii) as defined above is a sequence capable of hybridizing to a nucleic acid as represented by any of: SEQ ID NO: 234, SEQ ID NO : 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 and SEQ ID NO: 254.

O termo "hibridização" é como definido neste lugar na seção "Definições".The term "hybridization" is as defined here in the "Definitions" section.

O polipeptídeo de fator de transcrição DOF pode ser codificado por uma variante de união alternativa. O termo "variante de união alternativa" é como definido na seção "Definições" neste lugar.The DOF transcription factor polypeptide may be encoded by an alternative binding variant. The term "alternate union variant" is as defined in the "Definitions" section here.

Variantes de união preferidas são variantes de união do ácido nucleico codificando um polipeptídeo compreendendo característica (i) como segue e adicionalmente ou característica (ii) ou (iii) como seguem: (i) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; ePreferred splice variants are nucleic acid splice variants encoding a polypeptide comprising feature (i) as follows and additionally or feature (ii) or (iii) as follows: (i) in ascending order preferably at least 60%, 65% , 70%, 75%, 80%, 85%, 90% or 95% of sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and

(ii) em ordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência com o domínio DOF representado por SEQID NO: 200; ou(ii) in ascending order of preference at least 70%, 75%, 80%, 85%, 90% or 95% sequence identity with the DOF domain represented by SEQID NO: 200; or

(iii) Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou(iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

Motivo II: DDPGDCLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição.Reason II: DDPGDCLFGKTIPF (SEQ ID NO: 230) with no change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position.

Variantes de união preferidas de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) ePreferred nucleic acid splice variants encoding DOF transcription factor polypeptides comprising features (i) and

(ii) como definido acima são variantes de união de um ácido nucleico como representado por qualquer um de: SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID(ii) as defined above are splice variants of a nucleic acid as represented by any of: SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209 , SEQ ID NO: 211, SEQ ID

NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 e SEQ ID NO: 221.NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 and SEQ ID NO: 221.

Variantes de união preferidas de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) ePreferred nucleic acid splice variants encoding DOF transcription factor polypeptides comprising features (i) and

(iii) como definido acima são preferivelmente variantes de união de um ácido nucleico como representado por qualquer um de: SEQ ID NO: 234, SEQ ID(iii) as defined above are preferably splice variants of a nucleic acid as represented by any of: SEQ ID NO: 234, SEQ ID

NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 e SEQ ID NO: 254.NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 and SEQ ID NO: 254.

O polipeptídeo de fator de transcrição DOF também pode ser codificado por uma variante alélica, que também são definidas na seção "Definições" neste lugar.The DOF transcription factor polypeptide can also be encoded by an allelic variant, which are also defined in the "Definitions" section here.

Variantes alélicas preferidas são variantes alélicas do ácido nucleico codificando um polipeptídeo compreendendo característica (i) como segue e adicionalmente ou característica (ii) ou (iii) como seguem:Preferred allelic variants are allelic variants of the nucleic acid encoding a polypeptide comprising feature (i) as follows and additionally or feature (ii) or (iii) as follows:

(i) em ordem crescente de preferência pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e(i) in ascending order of preference at least 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and

(ii) em ordem crescente de preferência pelo menos 70%, 75%, 80%, 85%, 90% ou 95% de identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou(ii) in ascending order of preference at least 70%, 75%, 80%, 85%, 90% or 95% sequence identity with the DOF domain represented by SEQ ID NO: 200; or

(iii) Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou(iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or

Motivo II: DDPGIKLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição.Reason II: DDPGIKLFGKTIPF (SEQ ID NO: 230) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position.

Variantes alélicas preferidas de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) e (ii) como definido acima são variantes de união de um ácido nucleico como representado por qualquer um de: SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 e SEQ ID NO: 221.Preferred allelic variants of nucleic acids encoding DOF transcription factor polypeptides comprising features (i) and (ii) as defined above are splice variants of a nucleic acid as represented by any of: SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO: 219 and SEQ ID NO: 221.

Variantes alélicas preferidas de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF compreendendo características (i) e (iii) como definido acima são preferivelmente porções de um ácido nucleico como representado por qualquer um de: SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ LD NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252 e SEQ ID NO: 254.Preferred allelic variants of nucleic acids encoding DOF transcription factor polypeptides comprising features (i) and (iii) as defined above are preferably portions of a nucleic acid as represented by any of: SEQ ID NO: 234, SEQ ID NO: 236 , SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, and SEQ ID NO: 254.

Variantes adicionais de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF como definido acima podem ser geradas usando, por exemplo, mutagênese sítio dirigida como definido na seção "Definições" neste lugar.Additional variants of nucleic acids encoding DOF transcription factor polypeptides as defined above may be generated using, for example, site-directed mutagenesis as defined in the "Definitions" section herein.

Evolução direta (ou embaralhamento de gene) também pode ser usada para gerar variantes de ácidos nucleicos codificando polipeptídeos de fator de transcrição DOF. Veja seção "definições".Direct evolution (or gene shuffling) can also be used to generate nucleic acid variants encoding DOF transcription factor polypeptides. See section "definitions".

Polipeptídeos de fator de transcrição DOF são planta específicos. Ácidos nucleicos codificando os mesmos podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico ou variante deste pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de manipulação humana deliberada. Preferivelmente o ácido nucleico de fator de transcrição DOF ou variante deste é de uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae, mais preferivelmente o ácido nucleico é de Arabidopsis thaliana.DOF transcription factor polypeptides are plant specific. Nucleic acids encoding them may be derived from any natural or artificial source. The nucleic acid or variant thereof may be modified from its native form in genomic composition and / or environment by deliberate human manipulation. Preferably the DOF transcription factor nucleic acid or variant thereof is from a dicotyledonous plant, still preferably from the Brassicaceae family, more preferably the nucleic acid is from Arabidopsis thaliana.

A expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF pode ser aumentada introduzindo uma modificação genética (preferivelmente no locus de um gene de fator de transcrição DOF). O locus de um gene como definido neste lugar é adotado para significar uma região genômica, a qual inclui o gene de interesse e 10 KB antes ou depois da região de codificação.The expression of a nucleic acid encoding a DOF transcription factor polypeptide can be increased by introducing a genetic modification (preferably at the locus of a DOF transcription factor gene). The locus of a gene as defined herein is adopted to mean a genomic region, which includes the gene of interest and 10 KB before or after the coding region.

A modificação genética pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLING e recombinação homóloga ou introduzindo e expressando em uma planta um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF. Os métodos de ativação de T-DNA5 TILLING e recombinação homóloga são como definidos na seção "Definições" neste lugar. Seguindo introdução da modificação genética, segue uma etapa adicional de selecionar para expressão aumentada de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF5 cuja expressão aumentada gera plantas tendo produção aumentada.Genetic modification may be introduced, for example, by any (or more) of the following methods: T-DNA activation, TILLING and homologous recombination or by introducing and expressing into a plant a nucleic acid encoding a DOF transcription factor polypeptide. T-DNA5 TILLING activation and homologous recombination methods are as defined in the "Definitions" section here. Following introduction of genetic modification, there is an additional step of selecting for increased expression of a nucleic acid encoding a DOF5 transcription factor polypeptide whose increased expression generates plants having increased yield.

Ativação de T-DNA e TILLING são exemplos de tecnologias que possibilitam a geração de novos alelos e variantes de fator de transcrição DOF.T-DNA activation and TILLING are examples of technologies that enable the generation of new alleles and DOF transcription factor variants.

Um método preferido para introduzir uma modificação genética (que neste caso não precisa ser no locus de um gene de fator de transcrição DOF) é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF como definido acima. O ácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico de comprimento completo ou pode ser uma porção ou uma seqüência hibridizante ou outra variante de ácido nucleico como definido acima.A preferred method for introducing a genetic modification (which in this case need not be at the locus of a DOF transcription factor gene) is to introduce and express into a plant a nucleic acid encoding a DOF transcription factor polypeptide as defined above. The nucleic acid to be introduced into a plant may be a full length nucleic acid or may be a hybridizing portion or sequence or other nucleic acid variant as defined above.

Os métodos da invenção recorrem à expressão aumentada de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF. Métodos para aumentar expressão de genes ou produtos de gene são bem documentados na técnica e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de estimuladores de transcrição ou estimuladores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou estimuladores podem ser introduzidos em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et ai., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.The methods of the invention employ increased expression of a nucleic acid encoding a DOF transcription factor polypeptide. Methods for enhancing gene expression or gene products are well documented in the art and include, for example, overexpression directed by appropriate promoters, the use of transcriptional enhancers or translation enhancers. Isolated nucleic acids serving as promoter or enhancer elements may be introduced at an appropriate (typically prior) position in a nonheterologous form of a polynucleotide in order to enhance expression of a nucleic acid encoding a DOF transcription factor polypeptide. For example, endogenous promoters may be altered in vivo by mutation, deletion, and / or substitution (see, Kmiec, U.S. Patent No. 5,565,350; Zarling et al., PCT / US93 / 03868), or isolated promoters. be introduced into a plant cell at the appropriate orientation and distance of a gene of the present invention to control gene expression.

Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer outro gene eucariótico.If polypeptide expression is desired, it is generally desirable to include a polyadenylation region at the 3 'end of a polynucleotide coding region. The polyadenylation region may be derived from the natural gene, a variety of other plant genes, or T-DNA. The 3 'end sequence to be added may be derived, for example, from the nopaline synthase or octopine synthase genes, or alternatively from another plant gene, or less preferably from any other eukaryotic gene.

Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citossol. Inclusão de um íntron processável na unidade de transcrição tanto em construções vegetais como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et ai. (1987) Genes Dev 1:1183- 1200). Tal estimulação intrônica de expressão gênica tipicamente é maior quando localizada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adh1-S 1, 2, e 6, o íntron Bronze-I são conhecidos na técnica. Para informação geral veja: The Maize Handbook, Capítulo 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).An intronic sequence can also be added to the untranslated 5 'region or coding sequence of the partial coding sequence to increase the amount of mature message that accumulates in the cytosol. Inclusion of a processable intron in the transcription unit in both plant and animal constructs has been shown to increase gene expression at both mRNA and protein levels by up to 1000-fold (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et (1987) Genes Dev 1: 1183-1200). Such intronic stimulation of gene expression is typically greater when located near the 5 'end of the transcription unit. Using the introns of Adh1-S 1, 2, and 6 intron maize, the Bronze-I intron are known in the art. For general information see: The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.The invention also provides genetic constructs and vectors to facilitate introduction and / or expression of nucleotide sequences useful in the methods according to the invention.

Portanto, é fornecida uma construção gênica compreendendo:Therefore, a gene construct is provided comprising:

(i) Um ácido nucleico ou variante deste codificando um polipeptídeo de fator de transcrição DOF como definido acima;(i) A nucleic acid or variant thereof encoding a DOF transcription factor polypeptide as defined above;

(ii) Uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i); e opcionalmente(ii) One or more control sequences capable of directing expression of the nucleic acid sequence of (i); and optionally

(iii) Uma seqüência de término de transcrição.(iii) A transcription termination sequence.

Construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando tecnologia de DNA recombinante bem conhecida por pessoas versadas na técnica. As construções gênicas podem ser inseridas em vetores, que podem estar comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção portanto fornece uso de uma construção gênica como definido acima nos métodos da invenção.Constructs useful in the methods according to the present invention may be constructed using recombinant DNA technology well known to those skilled in the art. Gene constructs may be inserted into commercially available vectors suitable for plant transformation and suitable for expression of the gene of interest in transformed cells. The invention therefore provides use of a gene construct as defined above in the methods of the invention.

Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e são definidos na seção "Definições" neste lugar.Plants are transformed with a vector comprising the sequence of interest (i.e., a nucleic acid encoding a DOF transcription factor polypeptide). The sequence of interest is operably linked to one or more control sequences (at least one promoter). The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably in this place and are defined in the "Definitions" section in this place.

Vantajosamente, qualquer tipo de promotor, quer natural ou sintético, pode ser usado para dirigir expressão da seqüência de ácidos nucleicos.Advantageously, any type of promoter, whether natural or synthetic, may be used to direct expression of the nucleic acid sequence.

De acordo com uma característica preferida da invenção, o ácido nucleico de fator de transcrição DOF ou variante deste é operavelmente ligado a um promotor constitutivo como definido na seção "Definições" neste lugar. O promotor constitutivo é preferivelmente um promotor G0S2, mais preferivelmente o promotor constitutivo é um promotor G0S2 de arroz, ainda preferivelmente o promotor constitutivo é representado por uma seqüência de ácidos nucleicos substancialmente similar a SEQ ID NO: 225, o mais preferivelmente o promotor constitutivo é como representado por SEQ ID NO: 225. É preferido o uso de um promotor constitutivo para dirigir expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF compreendendo características (i) e (ii) como definido acima, i.e. pelo menos 60% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e pelo menos 70% de identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200.According to a preferred feature of the invention, the transcription factor DOF nucleic acid or variant thereof is operably linked to a constitutive promoter as defined in the "Definitions" section herein. The constitutive promoter is preferably a G0S2 promoter, more preferably the constitutive promoter is a rice G0S2 promoter, yet preferably the constitutive promoter is represented by a nucleic acid sequence substantially similar to SEQ ID NO: 225, most preferably the constitutive promoter is as represented by SEQ ID NO: 225. It is preferred to use a constitutive promoter to direct expression of a nucleic acid encoding a DOF transcription factor polypeptide comprising characteristics (i) and (ii) as defined above, ie at least 60%. sequence identity or DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and at least 70% sequence identity with the DOF domain represented by SEQ ID NO: 200.

Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico de fator de transcrição DOF representado por SEQ ID NO: 198, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico de fator de transcrição DOF quando dirigida por um promotor GOS2. Exemplos de outros promotores constitutivos que também podem ser usados para realizar os métodos da invenção são mostrados em Tabela 3 na seção "Definições" neste lugar.It should be clear that the applicability of the present invention is not restricted to the DOF transcription factor nucleic acid represented by SEQ ID NO: 198, nor is the applicability of the invention restricted to the expression of a DOF transcription factor nucleic acid when directed by a GOS2 promoter. Examples of other constitutive promoters that may also be used to carry out the methods of the invention are shown in Table 3 in the "Definitions" section herein.

De acordo com outra característica preferida da invenção, o ácido nucleico codificando um polipeptídeo de fator de transcrição DOF é operavelmente ligado a um promotor semente específico, i.e. um promotor que é expresso predominantemente em tecido de semente, mas que pode ter expressão residual em qualquer outro lugar na planta devido à expressão de promotor permeável. Ainda preferivelmente, o promotor semente específico é isolado de um gene codificando uma proteína de armazenamento de semente, especialmente um promotor endosperma específico. Mais preferivelmente o promotor endosperma específico é isolado de um gene de prolamina, tal como um promotor de prolamina RP6 de arroz (Wen et al., (1993) Plant physiol 101(3): 1115-6) como representado por SEQ ID NO: 258, ou um promotor de força similar e/ou um promotor com um padrão de expressão similar que o promotor de prolamina de arroz. Força similar e/ou padrão de expressão similar podem ser analisados, por exemplo, acoplando os promotores a um gene repórter e verificando a função do gene repórter em tecidos da planta. Um gene repórter bem conhecido é beta-glucuronidase e o corante colorimétrico GUS usado para visualizar atividade de beta-glucuronidase em tecido vegetal. O promotor de prolamina mostra forte expressão no endosperma, com permeabilidade em meristema, mais especificamente o meristema de broto e/ou centro de discriminação no meristema.According to another preferred feature of the invention, the nucleic acid encoding a DOF transcription factor polypeptide is operably linked to a specific seed promoter, ie a promoter that is predominantly expressed in seed tissue, but which may have residual expression in any other. place in the plant due to permeable promoter expression. Even more preferably, the specific seed promoter is isolated from a gene encoding a seed storage protein, especially a specific endosperm promoter. More preferably the specific endosperm promoter is isolated from a prolamine gene, such as a rice RP6 prolamine promoter (Wen et al., (1993) Plant physiol 101 (3): 1115-6) as represented by SEQ ID NO: 258, or a similar strength promoter and / or a promoter with a similar expression pattern as the rice prolamine promoter. Similar force and / or similar expression pattern can be analyzed, for example, by coupling promoters to a reporter gene and by checking reporter gene function in plant tissues. A well-known reporter gene is beta-glucuronidase and the GUS colorimetric dye used to visualize beta-glucuronidase activity in plant tissue. The prolamine promoter shows strong endosperm expression with meristem permeability, more specifically the bud meristem and / or meristem discrimination center.

Preferido de acordo com a invenção é o uso de um promotor semente específico, especialmente um promotor endosperma específico, para dirigir expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF compreendendo características (i) e (iii) como definido acima, i.e. pelo menos 60% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e Motivo I e/ou Motivo II.Preferred according to the invention is the use of a specific seed promoter, especially a specific endosperm promoter, to direct expression of a nucleic acid encoding a DOF transcription factor polypeptide comprising features (i) and (iii) as defined above, ie at least 60% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and Reason I and / or Reason II.

Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico de fator de transcrição DOF representado por SEQ ID NO: 226, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico de fator de transcrição DOF quando dirigida por um promotor de prolamina.It should be clear that the applicability of the present invention is not restricted to the DOF transcription factor nucleic acid represented by SEQ ID NO: 226, nor is the applicability of the invention restricted to the expression of a DOF transcription factor nucleic acid when directed by a prolamine promoter.

Exemplos de promotores semente específicos são apresentados em Tabela 7 na seção "Definições" neste lugar, cujos promotores ou derivados destes são úteis para realizar os métodos da presente invenção.Examples of specific seed promoters are presented in Table 7 in the "Definitions" section herein, whose promoters or derivatives thereof are useful for carrying out the methods of the present invention.

Opcionalmente, uma ou mais seqüências terminadoras também podem ser usadas na construção introduzida em uma planta. O termo "terminador" é como definido na seção "Definições" neste lugar.Optionally, one or more terminator sequences may also be used in the construction introduced into a plant. The term "terminator" is as defined in the "Definitions" section here.

As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colEl.The genetic constructs of the invention may additionally include an origin of replication sequence that is required for maintenance and / or replication in a specific cell type. An example is when a genetic construct is required to be maintained in a bacterial cell as an episomal genetic element (e.g., plasmid or cosmid molecule). Preferred sources of replication include, but are not limited to, fl-ori and colEl.

A construção genética pode compreender opcionalmente um gene marcador selecionável como definido neste lugar na seção "Definições".The genetic construct may optionally comprise a selectable marker gene as defined herein in the "Definitions" section.

A presente invenção também abrange plantas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas, partes vegetais ou células vegetais destas obteníveis pelo método de acordo com a presente invenção, cujas plantas ou partes ou células destas compreendem um ácido nucleico transgene (ou variante deste como definido acima) codificando um polipeptídeo de fator de transcrição DOF.The present invention also encompasses plants obtainable by the methods according to the present invention. The present invention therefore provides plants, plant parts or plant cells thereof obtainable by the method according to the present invention, which plants or parts or cells thereof comprise a transgene nucleic acid (or variant thereof as defined above) encoding a transcription factor polypeptide. DOF.

A invenção também fornece um método para a produção de plantas transgênicas tendo produção aumentada em relação a plantas de controle adequadas, compreendendo introdução e expressão em uma planta de um ácido nucleico ou uma variante deste codificando um polipeptídeo de fator de transcrição DOF.The invention also provides a method for producing transgenic plants having increased production over suitable control plants, comprising introducing and expressing into a plant a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide.

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo produção aumentada cujo método compreende:More specifically, the present invention provides a method for producing transgenic plants having increased yield which method comprises:

(i) introduzir e expressar em uma planta, parte vegetal ou célula vegetal um ácido nucleico ou variante deste codificando um polipeptídeo de fator de transcrição DOF; e(i) introducing and expressing into a plant, plant part or plant cell a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide; and

(ii) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.(ii) cultivate the plant cell under conditions promoting plant growth and development.

O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.Nucleic acid can be introduced directly into a plant cell or into the plant itself (including introduction into a tissue, organ or any other part of a plant). According to a preferred feature of the present invention, the nucleic acid is preferably introduced into a plant by transformation.

O termo "transformação" é como definido neste lugar na seção "Definições".The term "transformation" is as defined here in the "Definitions" section.

A presente invenção claramente se estende a qualquer célula vegetal ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes vegetais e propágulos destas. A presente invenção adicionalmente de estende para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.The present invention clearly extends to any plant cell or plant produced by any of the methods described herein, and to all plant parts and seedlings thereof. The present invention further extends to encompass the progeny of a transformed or transfected primary cell, tissue, organ or whole plant that has been produced by any of the methods mentioned above, the sole requirement being that the progeny exhibit the same (s) genotypic and / or phenotypic trait (s) than those produced by the ancestor in the methods according to the invention.

A invenção também inclui células hospedeiras contendo um ácido nucleico isolado ou variante deste codificando um polipeptídeo de fator de transcrição DOF. Células hospedeiras preferidas de acordo com a invenção são células vegetais.The invention also includes host cells containing an isolated nucleic acid or variant thereof encoding a DOF transcription factor polypeptide. Preferred host cells according to the invention are plant cells.

A invenção também se estende a partes aptas à colheita de uma planta tal como, mas não limitada a sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção além disso se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte apta à colheita de uma tal planta, tal como pelotas secas ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.The invention also extends to harvestable parts of a plant such as, but not limited to seeds, leaves, fruits, flowers, stems, rhizomes, tubers and bulbs. The invention further relates to products derived, preferably directly derived, from a crop-fit part of such a plant, such as dried pellets or powders, oil, fat and fatty acids, starch or proteins.

A presente invenção também abrange uso de ácidos nucleicos ou variantes destes codificando polipeptídeos de fator de transcrição DOF e uso de polipeptídeos de fator de transcrição DOF para aumentar produção vegetal como definido acima nos métodos da invenção.The present invention also encompasses use of nucleic acids or variants thereof encoding DOF transcription factor polypeptides and use of DOF transcription factor polypeptides to increase plant yield as defined above in the methods of the invention.

Ácidos nucleicos ou variantes destes codificando polipeptídeos de fator de transcrição DOF, ou polipeptídeos de fator de transcrição DOF, podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene de fator de transcrição DOF ou variante deste. Os ácidos nucleicos/genes ou variantes destes, ou os polipeptídeos de fator de transcrição DOF podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo produção aumentada como definido acima nos métodos da invenção.Nucleic acids or variants thereof encoding DOF transcription factor polypeptides, or DOF transcription factor polypeptides, may find use in breeding programs in which a DNA marker is identified that can be genetically linked to a DOF transcription factor gene or variant of this. Nucleic acids / genes or variants thereof, or DOF transcription factor polypeptides may be used to define a molecular marker. This DNA or protein marker can then be used in breeding programs to select plants having increased yield as defined above in the methods of the invention.

Variantes alélicas de um ácido nucleico/gene de fator de transcrição DOF também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem "natural" causada não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que gera produção aumentada. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma casa de vegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.Allelic variants of a nucleic acid / DOF transcription factor gene may also find use in marker-assisted breeding programs. Such breeding programs sometimes require introduction of allelic variation by mutagenic treatment of plants, using for example EMS mutagenesis; alternatively, the program may start with a collection of allelic variants of the so-called "natural" origin caused unintentionally. Identification of allelic variants then occurs, for example, by PCR. This is followed by a step for selecting superior allelic variants of the sequence in question and generating increased production. Selection is typically performed by monitoring plant growth performance containing different allelic variants of the sequence in question. Growth performance can be monitored in a greenhouse or in the field. Additional optional steps include crossing plants in which the upper allelic variant has been identified with another plant. This can be used, for example, to make a combination of interesting phenotypic characteristics.

Um ácido nucleico ou variante deste codificando um polipeptídeo de fator de transcrição DOF também pode ser usado como sondas para mapear geneticamente e fisicamente os genes dos quais eles são uma parte de, e como marcadores para características ligadas a estes genes. Tal informação pode ser útil em melhoramento vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos de fator de transcrição DOF ou variantes destes requer apenas uma seqüência de ácidos nucleicos de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos de fator de transcrição DOF ou variantes destes podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição podem ser sondados com os ácidos nucleicos de fator de transcrição DOF ou variantes destes. Os padrões de bandeamento resultantes então podem ser sujeitos a análises genéticas usando programas de computador tal como MapMaker (Lander et aí. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição do ácido nucleico de fator de transcrição DOF ou variante deste no mapa genético obtido previamente usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).A nucleic acid or variant thereof encoding a DOF transcription factor polypeptide may also be used as probes to genetically and physically map the genes of which they are a part of, and as markers for traits linked to these genes. Such information may be useful in plant breeding in order to develop strains with desired phenotypes. Such use of DOF transcription factor nucleic acids or variants thereof requires only a nucleic acid sequence of at least 15 nucleotides in length. DOF transcription factor nucleic acids or variants thereof can be used as restriction fragment length polymorphism (RFLP) markers. Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) of restriction digested plant genomic DNA can be probed with the DOF transcription factor nucleic acids or variants thereof. The resulting banding patterns can then be subjected to genetic analysis using computer programs such as MapMaker (Lander et al. (1987) Genomics 1: 174-181) in order to construct a genetic map. In addition, nucleic acids can be used to probe Southern blots containing restriction endonuclease-treated genomic DNAs from a set of individuals representing ancestor and progeny of a defined genetic crossover. Segregation of DNA polymorphisms is observed and used to calculate the position of the DOF transcription factor nucleic acid or variant on the genetic map previously obtained using this population (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331).

A produção e uso de sondas derivadas de gene vegetal para uso em mapeamento genético são descritos em Bematzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones de cDNA específicos usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens isogênicas próximas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na técnica.The production and use of plant gene derived probes for use in genetic mapping are described in Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41. Numerous publications describe genetic mapping of specific cDNA clones using the methodology described above or variations thereof. For example, F2 crossover populations, inbreeding populations, randomly crossed populations, nearby isogenic strains, and other sets of individuals may be used for mapping. Such methodologies are well known to those skilled in the art.

As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., localização de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas aí).Nucleic acid probes may also be used for physical mapping (ie, location of sequences in physical maps; see Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, and references cited there).

Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoramentos em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.In another embodiment, nucleic acid probes may be used in direct mapping by fluorescence in situ hybridization (FISH) (Trask (1991) Trends Genet. 7: 149-154). Although current FISH mapping methods favor the use of large clones (several kb to several hundred kb; see Laan et al. (1995) Genome Res. 5: 13-20), sensitivity improvements may allow FISH mapping performance using probes. smaller ones.

Uma variedade de métodos baseados em amplificação de ácido nucleico para mapeamento genético e físico pode ser realizada usando os ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para projetar e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. O projeto de tais iniciadores é bem conhecido por aqueles versados na técnica. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os ancestrais do cruzamento de mapeamento na região correspondente à seqüência imediata de ácidos nucleicos. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.A variety of nucleic acid amplification based methods for genetic and physical mapping can be performed using nucleic acids. Examples include allele-specific amplification (Kazazian (1989) J. Lab. Clin. Med. 11: 95-96), PCR amplified fragment polymorphism (CAPS; Sheffield et al. (1993) Genomics 16: 325-332), allele binding specific (Landegren et al (1988) Science 241: 1077-1080), nucleotide extension reactions (Sokolov (1990) Nucleic Acid Res. 18: 3671), Radiation Hybrid Mapping (Walter et al. (1997) Nat. Genet. 7: 22-28) and Appropriate Mapping (Dear and Cook (1989) Nucleic Acid Res. 17: 6795-6807). For these methods, the nucleic acid sequence is used to design and produce primer pairs for use in the amplification reaction or primer extension reactions. The design of such initiators is well known to those skilled in the art. In methods employing PCR-based genetic mapping, it may be necessary to identify DNA sequence differences between the mapping ancestors in the region corresponding to the immediate sequence of nucleic acids. This, however, is generally not required for mapping methods.

Os métodos de acordo com a presente invenção resultam em plantas tendo produção aumentada, como descrito acima. Esta produção aumentada também pode ser combinada com outras características economicamente vantajosas, tal como características adicionais que estimulam produção, tolerância a outros estresses abióticos e bióticos, características modificando vários atributos arquitetônicos e/ou atributos bioquímicos e/ou fisiológicos.The methods according to the present invention result in plants having increased yield as described above. This increased yield can also be combined with other economically advantageous features, such as additional features that stimulate yield, tolerance to other abiotic and biotic stresses, features modifying various architectural attributes and / or biochemical and / or physiological attributes.

CKI de Descrição Detalhada Referência neste lugar a uma "redução" preferencial em expressão de um gene CKI endógeno em tecido de endosperma de uma planta é adotada para significar uma redução ou eliminação substancial de expressão de um gene CKI endógeno (em tecido de endosperma) em relação a níveis de expressão de gene CKI endógeno encontrados em tecido de endosperma de plantas tipo selvagem. Esta redução ou eliminação substancial de expressão de gene CKI endógeno pode resultar em níveis protéicos de CKI e/ou atividade em tecido de endosperma de uma planta reduzidos ou substancialmente eliminados.Detailed Description CKI Reference herein to a preferred "reduction" in expression of an endogenous CKI gene in endosperm tissue of a plant is adopted to mean a substantial reduction or deletion of expression of an endogenous CKI gene (in endosperm tissue) in of endogenous CKI gene expression levels found in endosperm tissue of wild type plants. This substantial reduction or elimination of endogenous CKI gene expression may result in reduced or substantially eliminated CKI protein levels and / or activity in endosperm tissue of a plant.

Referência neste lugar a um gene CKI "endógeno" não se refere apenas a genes CKI como encontrado em uma planta em sua forma natural (i.e., sem haver qualquer intervenção humana), mas também se refere a genes CKI isolados subseqüentemente introduzidos em uma planta. Por exemplo, uma planta transgênica contendo um transgene CKI pode encontrar uma redução ou eliminação substancial do transgene CKI e/ou uma redução ou eliminação substancial de um gene CKI endógeno (em tecido de endosperma).Reference herein to an "endogenous" CKI gene not only refers to CKI genes as found in a plant in its natural form (i.e. without any human intervention), but also refers to isolated CKI genes subsequently introduced into a plant. For example, a transgenic plant containing a CKI transgene may encounter a substantial reduction or deletion of the CKI transgene and / or a substantial reduction or deletion of an endogenous CKI gene (in endosperm tissue).

Esta redução (ou eliminação substancial) de expressão de gene CKI endógeno pode ser atingida usando qualquer um ou mais de diversos métodos de silenciamento de genes bem conhecidos. "Silenciamento de genes" ou "diminuição" de expressão, como usado neste lugar, se refere a uma redução ou à eliminação substancial de expressão gênica de CKI e/ou níveis de polipeptídeo CKI e/ou atividade de polipeptídeo CKLThis reduction (or substantial elimination) of endogenous CKI gene expression can be achieved using any one or more of several well known gene silencing methods. "Gene silencing" or "decreased" expression as used herein refers to a substantial reduction or elimination of CKI gene expression and / or CKI polypeptide levels and / or CKL polypeptide activity.

Um tal método para redução ou eliminação substancial de expressão de gene CKI endógeno é regulação negativa mediada por RNA de expressão gênica (silenciamento de RNA). Silenciamento neste caso é desencadeado em uma planta por uma molécula de RNA de dupla fita (dsRNA) que é substancialmente homóloga a um gene CKI alvo. Este dsRNA é adicionalmente processado pela planta em cerca de 21 a cerca de 26 nucleotídeos chamado RNAs de baixa interferência (siRNAs). Estes siRNAs são incorporados em um complexo de silenciamento induzido por (RISC) que cliva o mRNA de um gene CKI alvo, com isso reduzindo ou substancialmente eliminando o número de mRNAs de CKI a serem traduzidos em uma proteína CKLOne such method for substantially reducing or eliminating endogenous CKI gene expression is RNA-mediated downregulation of gene expression (RNA silencing). Silencing in this case is triggered in a plant by a double-stranded RNA (dsRNA) molecule that is substantially homologous to a target CKI gene. This dsRNA is further processed by the plant at about 21 to about 26 nucleotides called low interference RNAs (siRNAs). These siRNAs are incorporated into a (RISC) induced silencing complex that cleaves the mRNA of a target CKI gene, thereby reducing or substantially eliminating the number of CKI mRNAs to be translated into a CKL protein.

Um exemplo de um método de silenciamento de RNA envolve a introdução de seqüências de codificação ou partes destas em uma orientação sentido em uma planta. "Orientação sentido" se refere a DNA que é homólogo a um transcrito de mRNA deste. Deve ser introduzido em uma planta portanto pelo menos uma cópia adicional (completa ou em parte) de um gene CKI já presente na planta hospedeira. O gene adicional, ou parte deste, irá silenciar um gene CKI endógeno, gerando um fenômeno conhecido como co-supressão. A redução de expressão gênica de CKI será mais pronunciada se diversas cópias adicionais são introduzidas na planta, pois existe uma correlação positiva entre altos níveis de transcritos e o desencadeamento de co-supressão.An example of an RNA silencing method involves introducing coding sequences or parts of these in a sense orientation into a plant. "Sense orientation" refers to DNA that is homologous to an mRNA transcript thereof. Therefore, at least one additional copy (complete or in part) of a CKI gene already present in the host plant must be introduced into a plant. The additional gene, or part of it, will silence an endogenous CKI gene, generating a phenomenon known as co-suppression. Reduction of CKI gene expression will be more pronounced if several additional copies are introduced into the plant as there is a positive correlation between high transcript levels and co-suppression triggering.

Outro exemplo de um método de silenciamento de RNA envolve o uso de seqüências de ácidos nucleicos CKI anti-sentido. Um ácido nucleico "anti-sentido" compreende uma seqüência de nucleotídeos que é complementar a um ácido nucleico "sentido" codificando uma proteína, e.g., complementar à fita de codificação de uma molécula de cDNA dupla fita ou complementar a uma seqüência de mRNA. Por conseguinte, um ácido nucleico anti-sentido pode ser ligado por ponte de hidrogênio a um ácido nucleico sentido. O ácido nucleico anti-sentido pode ser complementar a uma fita de codificação inteira de CKI ou apenas a uma porção desta. A molécula de ácido nucleico anti-sentido pode ser anti-sentido para uma "região de codificação" ou anti-sentido para uma "região não codificante" da fita de codificação de uma seqüência de nucleotídeos codificando CKL O termo "região de codificação" se refere à região da seqüência de nucleotídeos compreendendo códons que são traduzidos em resíduos de aminoácidos. O termo "região não codificante" se refere a seqüências 5' e 3' que flanqueiam a região de codificação que não são traduzidas em aminoácidos (i.e., também referidas como regiões 5' e 3' não traduzidas).Another example of an RNA silencing method involves the use of antisense CKI nucleic acid sequences. An "antisense" nucleic acid comprises a nucleotide sequence that is complementary to a "sense" nucleic acid encoding a protein, e.g., complementary to the coding strand of a double stranded cDNA molecule or complementary to an mRNA sequence. Accordingly, an antisense nucleic acid may be bridged to a sense nucleic acid. Antisense nucleic acid may be complementary to an entire CKI coding tape or to a portion thereof. The antisense nucleic acid molecule may be antisense to a "coding region" or antisense to a "non-coding region" of the coding strand of a CKL coding nucleotide sequence. refers to the region of the nucleotide sequence comprising codons that are translated into amino acid residues. The term "non-coding region" refers to 5 'and 3' sequences flanking the coding region that are not translated into amino acids (i.e., also referred to as 5 'and 3' untranslated regions).

Ácidos nucleicos anti-sentido podem ser projetados de acordo com as regras de pareamento de bases de Watson e Crick. A molécula de ácido nucleico anti-sentido pode ser complementar à região de codificação inteira de mRNA de CKI, mas é preferivelmente um oligonucleotídeo que é anti-sentido para apenas uma porção da região de codificação ou não codificante de mRNA de CKI. Por exemplo, o oligonucleotídeo anti-sentido pode ser complementar à região ao redor do sítio de início de tradução de mRNA de CKI. O comprimento de um oligonucleotídeo anti-sentido adequado deve ser conhecido na técnica e pode começar de cerca de 20 nucleotídeos de comprimento ou menos. Um ácido nucleico anti-sentido da invenção pode ser construído usando síntese química e reações de ligação enzimática usando procedimentos conhecidos na técnica. Por exemplo, um ácido nucleico anti-sentido (e.g., um oligonucleotídeo anti-sentido) pode ser quimicamente sintetizado usando nucleotídeos naturalmente ocorrentes ou nucleotídeos variadamente modificados projetados para aumentar a estabilidade biológica das moléculas ou para aumentar a estabilidade física do duplex formado entre os ácidos nucleicos anti-sentido e sentido, e.g., derivados de fosforotioato e nucleotídeos de acridina substituídos podem ser usados. Exemplos de nucleotídeos modificados que podem ser usados para gerar o ácido nucleico anti-sentido são bem conhecidos na técnica.Antisense nucleic acids can be designed according to the Watson and Crick base pairing rules. The antisense nucleic acid molecule may be complementary to the entire CKI mRNA coding region, but is preferably an oligonucleotide that is antisense to only a portion of the CKI mRNA coding or non-coding region. For example, the antisense oligonucleotide may be complementary to the region around the CKI mRNA translation initiation site. The length of a suitable antisense oligonucleotide should be known in the art and may start from about 20 nucleotides in length or less. An antisense nucleic acid of the invention may be constructed using chemical synthesis and enzymatic binding reactions using procedures known in the art. For example, an antisense nucleic acid (eg, an antisense oligonucleotide) may be chemically synthesized using naturally occurring nucleotides or variously modified nucleotides designed to increase the biological stability of the molecules or to increase the physical stability of the duplex formed between acids. antisense and sense nucleicides, eg, phosphorothioate derivatives and substituted acridine nucleotides may be used. Examples of modified nucleotides that can be used to generate antisense nucleic acid are well known in the art.

Outras modificações de nucleotídeos conhecidas incluem metilação, ciclização e 'caps' e substituição de um ou mais dos nucleotídeos naturalmente ocorrentes por um análogo tal como inosina. Outras modificações de nucleotídeos são bem conhecidas por uma pessoa versada na técnica. Alternativamente, o ácido nucleico anti-sentido pode ser produzido biologicamente usando um vetor de expressão no qual um ácido nucleico foi subclonado em uma orientação anti-sentido (i. e., RNA transcrito do ácido nucleico inserido será de uma orientação anti-sentido para um ácido nucleico alvo de interesse, descrito posteriormente na subseção seguinte). Preferivelmente, produção de ácidos nucleicos anti-sentido em plantas ocorre por meio de um transgene estavelmente integrado compreendendo um promotor operativo para expressão preferencial em plantas com tecido de endosperma, um oligonucleotídeo anti-sentido, e um terminador.Other known nucleotide modifications include methylation, cyclization and caps and replacement of one or more of the naturally occurring nucleotides with an analog such as inosine. Other nucleotide modifications are well known to one of ordinary skill in the art. Alternatively, antisense nucleic acid may be biologically produced using an expression vector in which a nucleic acid has been subcloned in an antisense orientation (ie, RNA transcribed from the inserted nucleic acid will be from an antisense orientation to a nucleic acid of interest, described later in the following subsection). Preferably, production of antisense nucleic acids in plants occurs by a stably integrated transgene comprising an operative promoter for preferential expression in endosperm tissue plants, an antisense oligonucleotide, and a terminator.

Um método preferido para redução ou eliminação substancial de expressão de gene CKI endógeno através de silenciamento de RNA é usando um vetor de expressão no qual um gene CKI ou fragmento deste foi clonado como uma repetição invertida (em parte ou completamente), separado por um espaçador (DNA não codificante). Depois de transcrição da repetição invertida, um RNA quimérico de CKI com uma estrutura autocomplementar é formado (parcial ou completo). Esta estrutura de RNA dupla fita é referida como o RNA de estrutura em grampo (hpRNA). O hpRNA é processado pela planta em siRNAs que são incorporados em um RISC. O RISC posteriormente cliva o mRNA de um gene CKI alvo, com isso reduzindo ou substancialmente eliminando o número de mRNAs de CKI a serem traduzidos em uma proteína CKL Veja por exemplo, Grierson et ai. (1998) WO 98/53083; Waterhouse et al (1999) WO 99/53050).A preferred method for substantially reducing or eliminating endogenous CKI gene expression through RNA silencing is by using an expression vector in which a CKI gene or fragment thereof has been cloned as an inverted repeat (in part or completely), separated by a spacer (Non-coding DNA). After transcription of the inverted repeat, a chimeric CKI RNA with a self-complementing structure is formed (partial or complete). This double stranded RNA structure is referred to as the stapled RNA structure (hpRNA). HpRNA is processed by the plant into siRNAs that are incorporated into a RISC. RISC subsequently cleaves mRNA from a target CKI gene, thereby reducing or substantially eliminating the number of CKI mRNAs to be translated into a CKL protein. See for example, Grierson et al. (1998) WO 98/53083; Waterhouse et al (1999) WO 99/53050).

As moléculas de ácidos nucleicos usadas para silenciamento nos métodos da invenção (quer introduzidas em uma planta ou geradas in situ) hibridizam com ou se ligam a mRNA celular e/ou DNA genômico codificando uma proteína CKI para com isso inibir expressão da proteína, e.g., inibindo transcrição e/ou tradução. A hibridização pode ser por complementaridade convencional de nucleotídeos para formar um duplex estável, ou, por exemplo, no caso de uma molécula de ácido nucleico anti- sentido que se liga a duplexes de DNA, através de interações específicas na principal fenda da dupla hélice. Moléculas de ácido nucleico anti-sentido podem ser introduzidas em uma planta por transformação ou injeção direta em um sítio de tecido específico. Alternativamente, moléculas de ácido nucleico anti-sentido podem ser modificadas para direcionar células selecionadas e então sistematicamente administradas. Por exemplo, para administração sistêmica, moléculas anti-sentido podem ser modificadas de forma que elas se liguem especificamente a receptores ou antígenos expressos em uma superfície celular selecionada, e.g., ligando as moléculas de ácido nucleico anti-sentido a peptídeos ou anticorpos que se ligam a receptores ou antígenos de superfície celular. As moléculas de ácido nucleico anti-sentido também podem ser liberadas para células usando os vetores descritos neste lugar.Nucleic acid molecules used for silencing in the methods of the invention (whether introduced into a plant or generated in situ) hybridize to or bind to cellular mRNA and / or genomic DNA encoding a CKI protein to thereby inhibit protein expression, eg. inhibiting transcription and / or translation. Hybridization may be by conventional nucleotide complementarity to form a stable duplex, or, for example, in the case of an antisense nucleic acid molecule that binds to DNA duplexes, through specific interactions in the main double strand slit. Antisense nucleic acid molecules can be introduced into a plant by transformation or direct injection into a specific tissue site. Alternatively, antisense nucleic acid molecules may be modified to target selected cells and then systematically administered. For example, for systemic administration, antisense molecules may be modified so that they specifically bind to receptors or antigens expressed on a selected cell surface, eg, by binding antisense nucleic acid molecules to peptides or antibodies that bind. to cell surface receptors or antigens. Antisense nucleic acid molecules can also be released into cells using the vectors described herein.

De acordo com um aspecto adicional, o ácido nucleico anti- sentido é uma molécula de ácido nucleico a-anomérica. Uma molécula de ácido nucleico a-anomérica forma híbridos dupla fita específicos com RNA complementar nos quais, ao contrário das unidades b usuais, as fitas correm paralelas uma a outra (Gaultier et ai. (1987) Nucleic Aeids. Res. 15:6625- 6641). A molécula de ácido nucleico anti-sentido também pode compreender um 2'-o-metilribonucleotídeo (Inoue et ai. (1987) Nueleie Aeids Res. 15:6131- 6148) ou um análogo quimérico de RNA-DNA (Inoue et al. (1987) FEBS Lett. 215:327-330).In a further aspect, the antisense nucleic acid is an α-anomeric nucleic acid molecule. An α-anomeric nucleic acid molecule forms complementary RNA-specific double strand hybrids in which, unlike the usual b-units, strands run parallel to each other (Gaultier et al. (1987) Nucleic Aeids. Res. 15: 6625- 6641). The antisense nucleic acid molecule may also comprise a 2'-o-methylribonucleotide (Inoue et al. (1987) Nueleie Aeids Res. 15: 6131-6148) or a chimeric RNA-DNA analog (Inoue et al. ( 1987) FEBS Lett 215: 327-330).

Em ainda outra forma de realização, um ácido nucleico anti- sentido da invenção é uma ribozima. Ribozimas são moléculas catalíticas de RNA com atividade de ribonuclease que são capazes de clivar um ácido nucleico de fita simples, tal como um mRNA, ao qual eles têm uma região complementar. Assim, ribozimas (e.g., ribozimas cabeça-de-martelo (descritas em Haselhoff and Gerlach (1988) Nature 334:585-591)) podem ser usadas para clivar cataliticamente transcritos de mRNA de CKI para com isso inibir tradução de mRNA de CKL Uma ribozima tendo especificidade para um ácido nucleico codificando CKI pode ser projetada baseado na seqüência de nucleotídeos de um cDNA de CKL Por exemplo, pode ser construído um derivado de um RNA de Tetrahymena L-19 LVS no qual a seqüência de nucleotídeos do sítio ativo é complementar à seqüência de nucleotídeos a ser clivada em um mRNA codificando CKL Veja5 e.g., Cech et ai. Patente Norte- Americana No. 4.987.071; e Cech et ai. Patente Norte-Americana No. 5.116.742. Alternativamente, mRNA de CKI pode ser usado para selecionar um RNA catalítico tendo uma atividade específica de ribonuclease a partir de um conjunto de moléculas de RNA. Veja, e.g., Bartel, D. and Szostak, J.W. (1993) Science 261:1411-1418. O uso de ribozimas para silenciamento de genes em plantas é conhecido na técnica (e.g., Atkins et al. (1994) WO 94/00012; Lenne et al. (1995) WO 95/03404; Lutziger et al. (2000) WO 00/00619; Prinsen et al. (1997) WO 97/13865 e Scott et al. (1997) WO 97/38116).In yet another embodiment, an antisense nucleic acid of the invention is a ribozyme. Ribozymes are ribonuclease activity catalytic RNA molecules that are capable of cleaving a single stranded nucleic acid, such as an mRNA, to which they have a complementary region. Thus, ribozymes (eg, hammerhead ribozymes (described in Haselhoff and Gerlach (1988) Nature 334: 585-591)) can be used to catalytically cleave CKI mRNA transcripts to thereby inhibit CKL mRNA translation. ribozyme having specificity for a CKI-encoding nucleic acid can be designed based on the nucleotide sequence of a CKL cDNA. For example, a derivative of a Tetrahymena L-19 LVS RNA can be constructed in which the nucleotide sequence of the active site is complementary. to the nucleotide sequence to be cleaved into a mRNA encoding CKL See 5 eg, Cech et al. U.S. Patent No. 4,987,071; and Cech et al. U.S. Patent No. 5,116,742. Alternatively, CKI mRNA can be used to select a catalytic RNA having ribonuclease specific activity from a set of RNA molecules. See, e.g., Bartel, D. and Szostak, J.W. (1993) Science 261: 1411-1418. The use of plant gene silencing ribozymes is known in the art (eg, Atkins et al. (1994) WO 94/00012; Lenne et al. (1995) WO 95/03404; Lutziger et al. (2000) WO 00 Prinsen et al (1997) WO 97/13865 and Scott et al (1997) WO 97/38116).

Silenciamento de genes também pode ser atingido por mutagênese por inserção (por exemplo, inserção de T-DNA ou inserção de transposon) ou por estratégias de silenciamento de genes como descrito por, entre outros, Angell and Baulcombe 1998 (Amplicon VIGS WO 98/36083); Baulcombe (WO 99/15682).Gene silencing can also be achieved by insertion mutagenesis (eg, T-DNA insertion or transposon insertion) or by gene silencing strategies as described by, among others, Angell and Baulcombe 1998 (Amplicon VIGS WO 98/36083 ); Baulcombe (WO 99/15682).

Silenciamento de genes também pode ocorrer se existe uma mutação no gene CKI endógeno e/ou uma mutação em um gene CKI isolado subseqüentemente introduzido em uma planta. A redução ou eliminação substancial de expressão de CKI pode ser causada por um CKI não funcional. CKI se liga tanto a CDK como ciclinas (Verkest et al., (2005) Plant Cell 17: 1723-1736). Por exemplo, mutação do sítio de ligação de ciclina dentro de um CKI, sustenta um CKI que ainda pode se ligar a um CDK mas que não pode inibir o complexo ativo de CDK-ciclina.Gene silencing can also occur if there is a mutation in the endogenous CKI gene and / or a mutation in an isolated CKI gene subsequently introduced into a plant. Substantial reduction or elimination of CKI expression may be caused by a non-functional CKI. CKI binds to both CDK and cyclins (Verkest et al., (2005) Plant Cell 17: 1723-1736). For example, mutation of the cyclin binding site within a CKI supports a CKI that can still bind to a CDK but cannot inhibit the active CDK-cyclin complex.

Uma abordagem adicional para silenciamento de genes é direcionando seqüências de nucleotídeos complementares à região reguladora do CKI (e.g., o promotor e/ou estimuladores de CKI) para formar estruturas de tripla hélice que previnem transcrição do gene CKI em células alvo. Veja Helene, C. (1991) Anticancer Drug Des. 6(6): 569-84; Helene, C. et al. (1992) Ann. N.Y. Aead. Sei. 660:21-36-, and Maher, LJ. (1992) Bioassays 14(12): 807-15.An additional approach to gene silencing is by directing complementary nucleotide sequences to the CKI regulatory region (e.g., the CKI promoter and / or enhancers) to form triple helix structures that prevent transcription of the CKI gene into target cells. See Helene, C. (1991) Anticancer Drug Des. 6 (6): 569-84; Helene, C. et al. (1992) Ann. N.Y. Aead. Know. 660: 21-36-, and Maher, LJ. (1992) Bioassays 14 (12): 807-15.

São descritos acima exemplos de vários métodos para silenciamento de genes (para a redução ou eliminação substancial de expressão de gene CKI endógeno). Os métodos da invenção se baseiam na redução preferencial de expressão de um gene CKI endógeno em tecido de endosperma de uma planta. Uma pessoa versada na técnica deve ser prontamente capaz de adaptar os métodos mencionados acima para silenciamento de forma a atingir silenciamento preferencial de genes em tecido de endosperma, através do uso de um promotor apropriado, por exemplo.Examples of various methods for gene silencing (for the substantial reduction or elimination of endogenous CKI gene expression) are described above. The methods of the invention are based on preferential reduction of expression of an endogenous CKI gene in endosperm tissue of a plant. One of ordinary skill in the art should readily be able to adapt the abovementioned methods for silencing to achieve preferential gene silencing in endosperm tissue through the use of an appropriate promoter, for example.

Deve ser observado que a essência da presente invenção reside nos resultados vantajosos e surpreendentes encontrados mediante redução ou eliminação substancial de expressão de gene CKI endógeno em tecido de endosperma de uma planta, e não é limitada a qualquer método particular para tal redução ou eliminação substancial de expressão de gene CKI endógeno. Outros tais métodos serão conhecidos pelo homem versado.It should be noted that the essence of the present invention resides in the advantageous and surprising results found by substantially reducing or eliminating endogenous CKI gene expression in endosperm tissue of a plant, and is not limited to any particular method for such substantial reduction or elimination of CKI. endogenous CKI gene expression. Other such methods will be known to the skilled man.

Para desempenho ótimo, as técnicas de silenciamento de genes usadas para a redução ou eliminação substancial de expressão de gene CKI endógeno requerem o uso de seqüências de ácidos nucleicos CKI de plantas monocotiledôneas para transformação em plantas monocotiledôneas. Preferivelmente, um ácido nucleico de CKI de qualquer espécie vegetal dada é introduzido naquela mesma espécie. Por exemplo, um ácido nucleico de CKI de arroz (seja ele uma seqüência CKI de comprimento completo ou um fragmento) é transformado em uma planta de arroz. O ácido nucleico CKI não precisa ser introduzido na mesma variedade de planta.For optimal performance, gene silencing techniques used for the substantial reduction or elimination of endogenous CKI gene expression require the use of CKI nucleic acid sequences from monocotyledonous plants for transformation into monocotyledonous plants. Preferably, a CKI nucleic acid of any given plant species is introduced into that same species. For example, a rice CKI nucleic acid (be it a full length CKI sequence or a fragment) is transformed into a rice plant. CKI nucleic acid need not be introduced into the same plant variety.

Referência neste lugar a um "gene CKI" ou um ácido nucleico de CKI" é adotada para significar uma forma polimérica de um desoxiribonucleotídeo ou um polímero de ribonucleotídeo de qualquer comprimento, ou de dupla fita ou fita simples, ou análogos destes, que têm as características essenciais de um ribonucleotídeo natural com as quais eles podem hibridizar com ácidos nucleicos de uma maneira similar a polinucleotídeos naturalmente ocorrentes. Um "gene CKI" ou um ácido nucleico de CKI" se refere a um comprimento suficiente de nucleotídeos substancialmente contíguos de um gene codificando CKI para realizar silenciamento de genes; isto pode ser tão pouco quanto 20 ou menos nucleotídeos. Um gene codificando uma proteína (funcional) não é um requerimento para os vários métodos discutidos acima para a redução ou eliminação substancial de expressão de um gene CKI endógeno.Reference herein to a "CKI gene" or CKI nucleic acid "is adopted to mean a polymeric form of a deoxyribonucleotide or ribonucleotide polymer of any length, or double stranded or single stranded, or analogs thereof, having the following characteristics: essential characteristics of a natural ribonucleotide with which they can hybridize to nucleic acids in a manner similar to naturally occurring polynucleotides. A "CKI gene" or a CKI nucleic acid "refers to a sufficient length of substantially contiguous nucleotides of a gene encoding CKI to perform gene silencing; This can be as little as 20 or less nucleotides. A gene encoding a (functional) protein is not a requirement for the various methods discussed above for substantially reducing or eliminating expression of an endogenous CKI gene.

Os métodos da invenção podem ser realizados usando um comprimento suficiente de nucleotídeos substancialmente contíguos de um gene/ácido nucleico CKI, o que pode consistir de 20 ou menos nucleotídeos, o que pode ser de qualquer parte do gene/ácido nucleico CKI, tal como a extremidade 3' da região de codificação que é bem conservada dentro da família de genes CKI.The methods of the invention may be performed using a sufficient length of substantially contiguous nucleotides of a CKI gene / nucleic acid, which may consist of 20 or fewer nucleotides, which may be from any part of the CKI gene / nucleic acid, such as 3 'end of the coding region that is well conserved within the CKI gene family.

Genes CKI são bem conhecidos na técnica e úteis nos métodos da invenção são nucleotídeos substancialmente contíguos de qualquer dos genes/ácidos nucleicos CKI vegetais descritos em pedido de patente Internacional publicado WO 2005/007829 no nome de Monsanto Technology LLC e Pedidos de patente Internacional publicados, WO 02/28893 e WO 99/14331 no nome de CropDesign N.V, cujos genes/seqüências de nucleotídeos CKI são incorporados neste lugar como se completamente expostos.CKI genes are well known in the art and useful in the methods of the invention are substantially contiguous nucleotides of any of the plant CKI genes / nucleic acids described in published International patent application WO 2005/007829 in the name of Monsanto Technology LLC and Published International Patent Applications, WO 02/28893 and WO 99/14331 in the name of CropDesign NV, whose CKI nucleotide genes / sequences are incorporated herein as if fully exposed.

Outros genes/seqüências de ácidos nucleicos CKI também podem ser usados nos métodos da invenção, e podem ser prontamente identificados por uma pessoa versada na técnica. Polipeptídeos CKI podem ser identificados pela presença de um ou mais de diversas características bem conhecidas (veja abaixo). Mediante identificação de um polipeptídeo CKI, uma pessoa versada na técnica pode facilmente derivar, usando técnicas de rotina, a seqüência de ácidos nucleicos de codificação correspondente e usar um comprimento suficiente de nucleotídeos contíguos da mesma para realizar qualquer um ou mais dos métodos de silenciamento de genes descritos acima (para a redução ou eliminação substancial de expressão de um gene CKI endógeno, no endosperma).Other CKI nucleic acid genes / sequences may also be used in the methods of the invention, and may be readily identified by one of ordinary skill in the art. CKI polypeptides may be identified by the presence of one or more of several well known characteristics (see below). Upon identification of a CKI polypeptide, one skilled in the art can readily derive, using routine techniques, the corresponding coding nucleic acid sequence and use a sufficient length of contiguous nucleotides thereof to perform any one or more of the silencing methods. genes described above (for the substantial reduction or elimination of expression of an endogenous CKI gene in the endosperm).

Uma característica diferenciada de um polipeptídeo CKI é uma região C-terminal compreendendo entre cerca de 40 e cerca de 55 aminoácidos altamente conservados. Como uma orientação, polipeptídeos compreendendo em ordem crescente de preferência pelo menos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade com a região C-terminal de um CKI como representado por SEQ ID NO: 262 podem ser considerados como sendo homólogos de CKI. Uma pessoa versada na técnica pode facilmente derivar o ácido nucleico correspondente codificando tais homólogos, e usar um comprimento suficiente de nucleotídeos contíguos do mesmo para realizar qualquer um ou mais dos métodos de silenciamento de genes descritos acima (para a redução ou eliminação substancial de expressão de um gene CKI endógeno).A distinguishing feature of a CKI polypeptide is a C-terminal region comprising from about 40 to about 55 highly conserved amino acids. As a guideline, polypeptides preferably comprising in ascending order at least 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62 %, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95% 96%, 97%, 98%, 99% C-terminal region identity of a CKI as represented by SEQ ID NO: 262 can be considered to be CKI homologs. One skilled in the art can readily derive the corresponding nucleic acid encoding such homologs, and use a sufficient length of contiguous nucleotides thereof to perform any one or more of the gene silencing methods described above (for the substantial reduction or elimination of expression of an endogenous CKI gene).

Uma pessoa versada na técnica estará ciente do que é pretendido por um "C-terminal" de uma proteína; para os propósitos deste pedido, a região C-terminal de um CKI pode ser considerada como sendo a segunda metade (de N-terminal para C-terminal) de um polipeptídeo CKI de comprimento completo.One skilled in the art will be aware of what is meant by a "C-terminus" of a protein; For purposes of this application, the C-terminal region of a CKI may be considered to be the second half (from N-terminal to C-terminal) of a full-length CKI polypeptide.

Homólogos, como definido acima, i.e. polipeptídeos compreendendo pelo menos 50% de identidade com a região C-terminal de um CKI como representado por SEQ ID NO: 262, podem ser prontamente identificados usando técnicas de rotina bem conhecidas na técnica, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas que maximiza o número de identidades e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através de National Centre for Biotechnology Information. Seqüências homólogas podem ser prontamente identificadas usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83) disponível em http://clustalw.genome.jp/sit-bin/nph-ClustalW, com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Edição manual secundária pode ser realizada para otimizar alinhamento entre motivos conservados (veja abaixo), como deve ser perceptível para uma pessoa versada na técnica.Homologs as defined above, ie polypeptides comprising at least 50% C-terminal region identity of a CKI as represented by SEQ ID NO: 262, can be readily identified using routine techniques well known in the art, such as by alignment. of sequences. Methods for sequence alignment for comparison are well known in the art, such methods include GAP, BESTFIT, BLAST, FASTA and TFASTA. GAP uses the algorithm of Needleman and Wunsch ((1970) J Mol Biol 48: 443-453) to find the alignment of two complete sequences that maximizes the number of identities and minimizes the number of gaps. The BLAST algorithm (Altschul et al. (1990) J Mol Biol 215: 403-10) calculates percent sequence identity and performs a statistical analysis of similarity between the two sequences. The computer application for performing BLAST analysis is publicly available through the National Center for Biotechnology Information. Homologous sequences can be readily identified using, for example, the ClustalW multiple sequence alignment algorithm (version 1.83) available at http://clustalw.genome.jp/sit-bin/nph-ClustalW, with standard paired alignment parameters. , and a percentage scoring method. Secondary manual editing can be performed to optimize alignment between retained subjects (see below), as should be apparent to one of ordinary skill in the art.

Polipeptídeos CKI vegetais também podem ser identificados pela presença de certos motivos conservados (veja Tabela 12 abaixo). A presença destes motivos conservados pode ser identificada usando métodos para o alinhamento de seqüências para comparação como descrito acima. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca. Por exemplo usando BLAST, o limiar de significância estatística (chamado valor "esperado") para relatar identidades contra seqüências de banco de dados pode ser aumentado para mostrar identidades menos estringentes. Desta maneira, identidades curtas praticamente exatas podem ser identificadas. Mediante identificação de um polipeptídeo CKI pela presença destes motivos, uma pessoa versada na técnica pode facilmente derivar o ácido nucleico correspondente codificando o polipeptídeo compreendendo os motivos relevantes, e usar um comprimento suficiente de nucleotídeos contíguos dos mesmos para realizar qualquer um ou mais dos métodos de silenciamento de genes descritos acima (para a redução ou eliminação substancial de expressão de um gene CKI endógeno).Plant CKI polypeptides can also be identified by the presence of certain conserved motifs (see Table 12 below). The presence of these conserved motifs can be identified using methods for sequence alignment for comparison as described above. In some instances, the default parameters may be adjusted to modify the search stringency. For example using BLAST, the threshold of statistical significance (called the "expected" value) for reporting identities against database sequences can be increased to show less stringent identities. In this way, practically exact short identities can be identified. Upon identification of a CKI polypeptide by the presence of these motifs, one skilled in the art can readily derive the corresponding nucleic acid encoding the polypeptide comprising the relevant motifs, and use a sufficient length of contiguous nucleotides thereof to perform any one or more of the methods of gene silencing described above (for the substantial reduction or elimination of expression of an endogenous CKI gene).

Tipicamente, a presença de pelo menos um dos motivos 1 a 5 (por exemplo motivo 2 é particularmente bem conservado) deve ser suficiente para identificar qualquer seqüência de consulta como um CKI, entretanto para certeza aumentada, a presença de pelo menos Motivos 1, 2 e 3 é preferida. A seqüência consenso fornecida é baseada nas seqüências apresentadas em Tabela 12 abaixo. Uma pessoa versada na técnica deve estar bem ciente de que a seqüência consenso pode variar de alguma maneira se seqüências adicionais ou diferentes foram usadas para comparação.Typically, the presence of at least one of reasons 1 to 5 (for example reason 2 is particularly well maintained) should be sufficient to identify any query sequence as a CKI, however for increased certainty, the presence of at least Reasons 1, 2 and 3 is preferred. The consensus sequence provided is based on the sequences presented in Table 12 below. One skilled in the art should be well aware that the consensus sequence may vary somewhat if additional or different sequences were used for comparison.

Motivo 1:FXXKYNFD (SEQ ID NO: 261), caracterizado pelo fato de que X é qualquer aminoácidoReason 1: FXXKYNFD (SEQ ID NO: 261), characterized in that X is any amino acid

Motivo 2: [P/L]LXGRYEW (SEQ ID NO: 262), caracterizado pelo fato de que X é qualquer aminoácido e [P/L] significa que ou uma prolina ou uma leucina aparecem na posição indicadaReason 2: [P / L] LXGRYEW (SEQ ID NO: 262), characterized in that X is any amino acid and [P / L] means that either a proline or a leucine appears in the position indicated.

Motivo 3: EXE[D/E]FFXXXE (SEQ ID NO: 263), caracterizado pelo fato de que X é qualquer aminoácido e [D/E] significa que ou um aspartato ou um glutamato aparecem na posição indicadaReason 3: EXE [D / E] FFXXXE (SEQ ID NO: 263), characterized in that X is any amino acid and [D / E] means that either an aspartate or a glutamate appears in the position indicated.

Motivo 4: YXQLRSRR (SEQ ID NO: 264), caracterizado pelo fato de que X é qualquer aminoácidoReason 4: YXQLRSRR (SEQ ID NO: 264), characterized in that X is any amino acid

Motivo 5: MGKY[M/I][K/R]KX[K/R] (SEQ ID NO: 265), caracterizado pelo fato de que X é qualquer aminoácido, [M/I] significa que ou uma metionina ou uma isoleucina aparecem na posição indicada, e [K/R] significa que ou uma lisina ou uma arginina aparecem na posição indicadaReason 5: MGKY [M / I] [K / R] KX [K / R] (SEQ ID NO: 265), characterized in that X is any amino acid, [M / I] means that either a methionine or a isoleucine appear at the indicated position, and [K / R] means that either a lysine or arginine appear at the indicated position

Motivo 6: SXGVRTRA (SEQ ID NO: 266), caracterizado pelo fato de que X é qualquer aminoácidoReason 6: SXGVRTRA (SEQ ID NO: 266), characterized in that X is any amino acid

Motivos 1, 2, e 3 são tipicamente encontrados na região carboxil-terminal de proteínas CKI vegetais. Acredita-se que esta região esteja envolvida na interação de CKIs tanto com CDKs como ciclinas (Chen et al. (1996) MolCellBiol 16, 4673-4682, Matsuoka et al. (1995) Genes Dev. 9, 650-662, e Nakayama and Nakayama (1998) Bioessays 20, 1020-1029). Motivos 4, 5, e 6 são tipicamente encontrados na região amino-terminal de proteínas CKI vegetais.Motifs 1, 2, and 3 are typically found in the carboxyl terminal region of plant CKI proteins. This region is believed to be involved in the interaction of CKIs with both CDKs and cyclins (Chen et al. (1996) MolCellBiol 16, 4673-4682, Matsuoka et al. (1995) Genes Dev. 9, 650-662, and Nakayama and Nakayama (1998) Bioessays 20, 1020-1029). Motifs 4, 5, and 6 are typically found in the amino terminal region of plant CKI proteins.

Proteínas CKI de plantas monocotiledôneas, particularmente arroz, são caracterizadas por extensivos trechos α-helicoidais especialmente entre motivos 5 e 6 e entre motivos 6 e 4.CKI proteins from monocotyledonous plants, particularly rice, are characterized by extensive α-helical stretches especially between motifs 5 and 6 and between motifs 6 and 4.

Tabela 12. Motivos conservados em proteínas CKI vegetais. CKI1 a CKI7 denotam CKIs de Arabidopsis thaliana. Os: Oryza sativa, Zm: Zea mays, Sb: Sorghum bicolorTable 12. Reasons conserved in vegetable CKI proteins. CKI1 through CKI7 denote Arabidopsis thaliana CKIs. Os: Oryza sativa, Zm: Zea mays, Sb: Sorghum bicolor

<table>table see original document page 175</column></row><table> <table>table see original document page 176</column></row><table><table> table see original document page 175 </column> </row> <table> <table> table see original document page 176 </column> </row> <table>

Em adição às características mencionadas acima, uma proteína CKI também pode compreender qualquer um ou mais dos seguintes: uma caixa Cy, uma seqüência de localização nuclear e uma seqüência PEST.In addition to the features mentioned above, a CKI protein may also comprise any or more of the following: a Cy box, a nuclear localization sequence, and a PEST sequence.

O termo "Caixa Cy" se refere a uma seqüência de aminoácidos de cerca de 5 resíduos de aminoácidos de comprimento tendo a seqüência consenso RXHuF, caracterizada pelo fato de que X é qualquer aminoácido e Hu é um aminoácido não carregado hidrofóbico, tal como Μ, I, L ou V. Caixas Cy tipicamente estão envolvidas na interação de CKIs com ciclinas.The term "Box Cy" refers to an amino acid sequence of about 5 amino acid residues in length having the consensus sequence RXHuF, characterized in that X is any amino acid and Hu is a hydrophobic uncharged amino acid such as Μ, I, L or V. Cy boxes are typically involved in the interaction of CKIs with cyclins.

A "seqüência de localização nuclear" se refere a uma seqüência de aminoácidos de cerca de 4-20 resíduos de aminoácidos de comprimento, que serve para dirigir uma proteína para o núcleo. Tipicamente, a seqüência de localização nuclear é rica em aminoácidos básicos, tal como arginina (R) e lisina (K). Sinais de localização nuclear são descritos em, por exemplo, Gorlich D. (1998) EMBO 5.17:2721-7. A proteína Os CKI4 compreende múltiplas seqüências de localização nuclear.The "nuclear localization sequence" refers to an amino acid sequence of about 4-20 amino acid residues in length, which serves to direct a protein to the nucleus. Typically, the nuclear localization sequence is rich in basic amino acids, such as arginine (R) and lysine (K). Nuclear localization signals are described in, for example, Gorlich D. (1998) EMBO 5.17: 2721-7. The CKI4 protein comprises multiple nuclear localization sequences.

Uma "seqüência PEST" se refere a uma seqüência de aminoácidos que é enriquecida nos resíduos de aminoácidos prolina (P), glutamato (E), serina (S) e treonina (T) e que está presente em proteínas com uma alta taxa de renovação proteolítica. Seqüências PEST são descritas em, por exemplo, Rogers et al. (1986) Science 234, 364-368.A "PEST sequence" refers to an amino acid sequence that is enriched in the proline (P), glutamate (E), serine (S), and threonine (T) amino acid residues and is present in proteins with a high turnover rate. proteolytic. PEST sequences are described in, for example, Rogers et al. (1986) Science 234, 364-368.

Os vários domínios estruturais em uma proteína CKI podem ser identificados usando bancos de dados especializados e.g. SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http://www.ebi.ac.ukyinterpro/), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its fiinction in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), http://www.expasy.org/prosite/) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002),The various structural domains in a CKI protein can be identified using specialized databases eg SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244; http://smart.embl-heidelberg.de/), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318; http: //www.ebi .ac.ukyinterpro /), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its fiinction in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., Pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids Res. 32: D134-D137, ( 2004), http://www.expasy.org/prosite/) or Pfam (Bateman et al., Nucleic Acids Research 30 (1): 276-280 (2002),

http://www.sanger.ac.uk/Software/Pfam/).http://www.sanger.ac.uk/Software/Pfam/).

Além disso, uma proteína CKI também pode ser identificável por sua capacidade de inibir a atividade de uma Quinase Dependente de Ciclina (CDK), e.g., uma CDK vegetal. CDKs são um grupo de quinases de serina/treonina que regulam a progressão do ciclo celular em eucariotos, e.g., plantas. CDKs tipicamente são complexadas com ciclinas formando um complexo enzimático, CDK sendo a subunidade catalítica e ciclina sendo a subunidade reguladora do complexo enzimático (Wang, H. (1997) The Plant Journal 15(4): 501-510).In addition, a CKI protein may also be identifiable by its ability to inhibit the activity of a Cyclin Dependent Kinase (CDK), e.g., a plant CDK. CDKs are a group of serine / threonine kinases that regulate cell cycle progression in eukaryotes, e.g., plants. CDKs are typically complexed with cyclins forming an enzyme complex, CDK being the catalytic subunit and cyclin being the regulatory subunit of the enzyme complex (Wang, H. (1997) The Plant Journal 15 (4): 501-510).

Portanto mediante identificação de um polipeptídeo CKI usando uma ou diversas das características descritas acima, uma pessoa versada na técnica pode facilmente derivar o ácido nucleico correspondente codificando o polipeptídeo, e usar um comprimento suficiente de nucleotídeos substancialmente contíguos do mesmo para realizar qualquer um ou mais dos métodos de silenciamento de genes descritos acima (para a redução ou eliminação substancial de expressão de um gene CKI endógeno).Therefore by identifying a CKI polypeptide using one or more of the characteristics described above, one skilled in the art can readily derive the corresponding nucleic acid encoding the polypeptide, and use a sufficient length of substantially contiguous nucleotides thereof to perform any one or more of the above. gene silencing methods described above (for substantially reducing or eliminating expression of an endogenous CKI gene).

Preferido para uso nos métodos da invenção é um comprimento suficiente de nucleotídeos substancialmente contíguos de SEQ ID NO: 267 (OsCKI4), ou o uso de um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácidos nucleicos codificando um ortólogo ou parálogo de OsCKI4 (SEQ ID NO: 267). Exemplos de tais ortólogos e parálogos de OsCKI4 são fornecidos emPreferred for use in the methods of the invention is a sufficient length of substantially contiguous nucleotides of SEQ ID NO: 267 (OsCKI4), or the use of a sufficient length of substantially contiguous nucleotides of a nucleic acid sequence encoding an OsCKI4 ortholog or paralog ( SEQ ID NO: 267). Examples of such OsCKI4 orthologs and paralogues are provided in

Tabela 13 abaixo.Table 13 below.

Ortólogos e parálogos são homólogos que abrangem conceitos evolutivos usados para descrever relações ancestrais de genes. Parálogos são genes dentro da mesma espécie que se originaram através de duplicação de um gene ancestral e ortólogos são genes de organismos diferentes que se originaram através de especiação.Orthologs and paralogues are homologues that encompass evolutionary concepts used to describe ancestral gene relationships. Paralogues are genes within the same species that originate through duplication of an ancestral gene and orthologs are genes from different organisms that originate through speciation.

Ortólogos em, por exemplo, espécies de plantas monocotiledôneas podem ser facilmente encontrados realizando uma assim chamada busca blast recíproca. Isto pode ser feito por um primeiro blast envolvendo blasting uma seqüência de consulta (por exemplo, SEQ ID NO: 267 ou SEQ ID NO: 268) contra qualquer banco de dados de seqüências, tal como o banco de dados NCBI publicamente disponível que pode ser encontrado em: http://www.ncbi.nlm.nih.gov. BLASTN ou TBLASTX (usando valores pré-determinados padrão) podem ser usados quando iniciando a partir de uma seqüência de nucleotídeos e BLASTP ou TBLASTN (usando valores pré-determinados padrão) podem ser usados quando iniciando a partir de uma seqüência de proteínas. Os resultados de BLAST opcionalmente podem ser filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: 267 ou SEQ ID NO: 268 o segundo blast portanto deve ser contra seqüências de arroz). Os resultados do primeiro e segundo BLASTs são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do segundo blast é da mesma espécie de qual a seqüência de consulta é derivada; um ortólogo é identificado se um acerto de alto ranqueamento não é da mesma espécie de qual a seqüência de consulta é derivada. Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante é o escore (ou em outras palavras menor a chance de que o acerto tenha sido encontrado ao acaso). Computação do valor E é bem conhecida na técnica. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos.Orthologists in, for example, monocotyledonous plant species can be easily found by performing a so-called reciprocal blast search. This can be done by first blasting involving blasting a query string (for example, SEQ ID NO: 267 or SEQ ID NO: 268) against any sequence database, such as the publicly available NCBI database that may be found at: http://www.ncbi.nlm.nih.gov. BLASTN or TBLASTX (using default default values) can be used when starting from a nucleotide sequence and BLASTP or TBLASTN (using default default values) can be used when starting from a protein sequence. BLAST results can optionally be filtered. Full length sequences of either the filtered results or unfiltered results are then BLASTed back (according to BLAST) against sequences from the organism from which the query sequence is derived (where the query sequence is SEQ ID NO: 267 or SEQ ID NO. : 268 the second blast should therefore be against rice strings). The results of the first and second BLASTs are then compared. A paralog is identified if a high-ranking second blast hit is of the same kind from which the query sequence is derived; An ortholog is identified if a high ranking hit is not of the same kind from which the query sequence is derived. High ranking hits are those with a low E value. The lower the E value, the more significant the score (or in other words the lower the chance that the hit was found at random). E-value computing is well known in the art. For large families, ClustalW can be used, followed by a neighboring tree to help visualize related gene grouping and to identify orthologs and paralogues.

Tabela 13 Ortólogos e parálogos de OsCKI4 (SEQ ID NO: 267 e 268)Table 13 OsCKI4 Orthologs and Paralogues (SEQ ID NO: 267 and 268)

<table>table see original document page 179</column></row><table><table> table see original document page 179 </column> </row> <table>

A fonte dos nucleotídeos substancialmente contíguos de um gene/ácido nucleico CKI pode ser qualquer fonte vegetal ou fonte artificial.The source of substantially contiguous nucleotides of a CKI gene / nucleic acid can be any plant source or artificial source.

Para desempenho ótimo, as técnicas de silenciamento de genes usadas para a redução ou eliminação substancial de expressão de gene CKI endógeno requerem o uso de seqüências CKI de plantas monocotiledôneas para transformação em plantas monocotiledôneas. Preferivelmente, seqüências CKI da família Poaceae são transformadas em plantas da família Poaceae.For optimal performance, gene silencing techniques used for the substantial reduction or elimination of endogenous CKI gene expression require the use of monocotyledon plant CKI sequences for transformation into monocotyledonous plants. Preferably, CKI sequences of the Poaceae family are transformed into plants of the Poaceae family.

Ainda preferivelmente, um ácido nucleico de CKI de arroz (seja ele uma seqüência CKI de comprimento completo ou um fragmento) é transformado em uma planta de arroz. O ácido nucleico CKI não precisa ser introduzido na mesma variedade de planta. Mais preferivelmente, o ácido nucleico CKI de arroz é um comprimento suficiente de nucleotídeos substancialmente contíguos de SEQ ID NO: 267 (OsCKI4) ou um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácidos nucleicos codificando um ortólogo ou parálogo de OsCKI4 (SEQ ID NO: 267). Como mencionado acima, uma pessoa versada na técnica deve estar bem ciente do que deve constituir um comprimento suficiente de nucleotídeos substancialmente contíguos para realizar qualquer dos métodos de silenciamento de genes definidos acima, isto pode ser tão pouco quanto 20 ou menos nucleotídeos substancialmente contíguos em alguns casos.Still preferably, a rice CKI nucleic acid (be it a full length CKI sequence or a fragment) is transformed into a rice plant. CKI nucleic acid need not be introduced into the same plant variety. More preferably, the rice CKI nucleic acid is a sufficient length of substantially contiguous nucleotides of SEQ ID NO: 267 (OsCKI4) or a sufficient length of substantially contiguous nucleotides of a nucleic acid sequence encoding an OsCKI4 ortholog or paralog (SEQ ID NO: 267). As mentioned above, one of ordinary skill in the art should be well aware of what should constitute a sufficient length of substantially contiguous nucleotides to perform any of the above defined gene silencing methods, this may be as little as 20 or fewer substantially contiguous nucleotides in some. cases.

A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de nucleotídeos úteis nos métodos de acordo com a invenção.The invention also provides genetic constructs and vectors to facilitate introduction and / or expression of nucleotide sequences useful in the methods according to the invention.

Portanto, é fornecida uma construção gênica compreendendo uma ou mais seqüências de controle capaz de dirigir preferencialmente expressão de uma seqüência de ácidos nucleicos CKI sentido e/ou anti-sentido em tecido de endosperma de planta de forma a silenciar um gene CKI endógeno em tecido de endosperma de uma planta; e opcionalmente uma seqüência de término de transcrição.Therefore, a gene construct comprising one or more control sequences capable of preferentially directing expression of a sense and / or antisense CKI nucleic acid sequence in plant endosperm tissue is provided to silence an endogenous CKI gene in human tissue. endosperm of a plant; and optionally a transcription termination sequence.

Uma construção preferida para silenciamento de genes é uma compreendendo uma repetição invertida de um gene CKI ou fragmento deste, preferivelmente capaz de formar uma estrutura em grampo, cuja repetição invertida está sob o controle de um promotor endosperma específico.A preferred gene silencing construct is one comprising an inverted repeat of a CKI gene or fragment thereof, preferably capable of forming a staple structure, whose inverted repeat is under the control of a specific endosperm promoter.

Construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando tecnologia de DNA recombinante bem conhecida por pessoas versadas na técnica. As construções gênicas podem ser inseridas em vetores, que podem estar comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção portanto fornece uso de uma construção gênica como definido acima nos métodos da invenção.Constructs useful in the methods according to the present invention may be constructed using recombinant DNA technology well known to those skilled in the art. Gene constructs may be inserted into commercially available vectors suitable for plant transformation and suitable for expression of the gene of interest in transformed cells. The invention therefore provides use of a gene construct as defined above in the methods of the invention.

A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor) capaz de aumentar preferencialmente expressão em tecido de endosperma de uma planta. Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e são definidos na seção "Definições" neste lugar.The sequence of interest is operably linked to one or more control sequences (at least one promoter) capable of preferentially enhancing expression in plant endosperm tissue. The terms "regulatory element", "control sequence" and "promoter" are all used interchangeably in this place and are defined in the "Definitions" section in this place.

Um promotor endosperma específico se refere a qualquer promotor capaz de dirigir preferencialmente expressão do gene de interesse em tecido de endosperma. Referência neste lugar a dirigir "preferencialmente" expressão em tecido de endosperma é adotada para significar dirigir expressão de qualquer seqüência operavelmente ligada a este em tecido de endosperma substancialmente para a exclusão de dirigir expressão em qualquer outro lugar na planta, sem considerar qualquer expressão residual devido à expressão de promotor permeável. Por exemplo, o promotor de prolamina mostra forte expressão no endosperma, com permeabilidade em meristema, mais especificamente o meristema de broto e/ou centro de discriminação no meristema.A specific endosperm promoter refers to any promoter capable of preferentially directing expression of the gene of interest in endosperm tissue. Reference herein to "preferentially" directing expression in endosperm tissue is adopted to mean directing expression of any sequence operably linked to it in endosperm tissue substantially to the exclusion of directing expression elsewhere in the plant, without regard to any residual expression due to to permeable promoter expression. For example, the prolamine promoter shows strong endosperm expression with meristem permeability, more specifically the bud meristem and / or center of discrimination in the meristem.

Preferivelmente, o promotor endosperma específico é um promotor isolado de um gene de prolamina, tal como um promotor de prolamina RP6 de arroz (Wen et ai., (1993) Plant physiol 101(3): 1115-6) como representado por SEQ ID NO: 281 ou um promotor de força similar e/ou um promotor com um padrão de expressão similar que o promotor de prolamina de arroz. Força similar e/ou padrão de expressão similar podem ser analisados, por exemplo, acoplando os promotores a um gene repórter e verificando a função do gene repórter em tecidos da planta. Um gene repórter bem conhecido é beta-glucuronidase e o corante colorimétrico GUS usado para visualizar atividade de beta-glucuronidase em tecido vegetal. Exemplos de outros promotores endosperma específicos que também podem ser usados para realizar os métodos da invenção são mostrados em Tabela 6 na seção "Definições" neste lugar.Preferably, the specific endosperm promoter is a promoter isolated from a prolamine gene, such as a rice RP6 prolamine promoter (Wen et al., (1993) Plant physiol 101 (3): 1115-6) as represented by SEQ ID. NO: 281 or a similar strength promoter and / or a promoter with a similar expression pattern as the rice prolamine promoter. Similar force and / or similar expression pattern can be analyzed, for example, by coupling promoters to a reporter gene and by checking reporter gene function in plant tissues. A well-known reporter gene is beta-glucuronidase and the GUS colorimetric dye used to visualize beta-glucuronidase activity in plant tissue. Examples of other specific endosperm promoters that may also be used to perform the methods of the invention are shown in Table 6 in the "Definitions" section herein.

Opcionalmente, uma ou mais seqüências terminadoras também podem ser usadas na construção introduzida em uma planta. O termo "terminador" é como definido neste lugar na seção "Definições". As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo celular específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colE1.Optionally, one or more terminator sequences may also be used in the construction introduced into a plant. The term "terminator" is as defined here in the "Definitions" section. The genetic constructs of the invention may additionally include an origin of replication sequence that is required for maintenance and / or replication in a specific cell type. An example is when a genetic construct is required to be maintained in a bacterial cell as an episomal genetic element (e.g., plasmid or cosmid molecule). Preferred sources of replication include, but are not limited to, fl-ori and colE1.

A construção genética pode compreender opcionalmente um gene marcador selecionável como definido neste lugar na seção "Definições".The genetic construct may optionally comprise a selectable marker gene as defined herein in the "Definitions" section.

A presente invenção também abrange plantas incluindo partes vegetais obteníveis pelos métodos de acordo com a presente invenção tendo produção aumentada de sementes em relação a plantas de controle adequadas e que têm expressão reduzida ou substancialmente eliminada de um gene CKI endógeno em tecido de endosperma de planta.The present invention also encompasses plants including plant parts obtainable by the methods according to the present invention having increased seed production relative to suitable control plants and which have reduced or substantially eliminated expression of an endogenous CKI gene in plant endosperm tissue.

A invenção também fornece um método para a produção de plantas transgênicas tendo produção aumentada de sementes em relação a plantas de controle adequadas, cujas plantas transgênicas têm expressão reduzida ou substancialmente eliminada de um gene CKI endógeno em tecido de endosperma de planta.The invention also provides a method for producing transgenic plants having increased seed production relative to suitable control plants whose transgenic plants have reduced or substantially eliminated expression of an endogenous CKI gene in plant endosperm tissue.

Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo produção aumentada de sementes cujo método compreende:More specifically, the present invention provides a method for producing transgenic plants having increased seed production which method comprises:

(i) introduzir e expressar em uma planta, parte vegetal ou célula vegetal a construção gênica compreendendo uma ou mais seqüências de controle capaz de dirigir preferencialmente expressão de uma seqüência de ácidos nucleicos CKI sentido e/ou anti-sentido em tecido de endosperma de planta de forma a silenciar um gene CKI endógeno em tecido de endosperma de uma planta; e(i) introducing and expressing in a plant, plant part or plant cell the gene construct comprising one or more control sequences capable of preferentially directing expression of a sense and / or antisense CKI nucleic acid sequence in plant endosperm tissue to silence an endogenous CKI gene in plant endosperm tissue; and

(ii) cultivar a planta, parte vegetal ou célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.(ii) cultivate the plant, plant part or plant cell under conditions promoting plant growth and development.

Preferivelmente, a construção introduzida em uma planta é uma compreendendo uma repetição invertida (em parte ou completa) de um gene CKI ou fragmento deste, preferivelmente capaz de formar uma estrutura em grampo.Preferably, the construct introduced into a plant is one comprising an inverted (in part or complete) repeat of a CKI gene or fragment thereof, preferably capable of forming a staple structure.

De acordo com uma característica preferida da presente invenção, a construção é introduzida em uma planta por transformação.According to a preferred feature of the present invention, the construction is introduced into a plant by transformation.

O termo "transformação" é como definido na seção "Definições" neste lugar.The term "transformation" is as defined in the "Definitions" section in this place.

A presente invenção claramente se estende a qualquer célula vegetal ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas partes vegetais e propágulos destas. A presente invenção adicionalmente de estende para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer of os métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.The present invention clearly extends to any plant cell or plant produced by any of the methods described herein, and to all plant parts and seedlings thereof. The present invention further extends to encompass the progeny of a transformed or transfected primary cell, tissue, organ or whole plant that has been produced by any of the methods mentioned above, the only requirement being that the progeny exhibit the same (s) ) genotypic and / or phenotypic trait (s) than those produced by the ancestor in the methods according to the invention.

A invenção também se estende a partes aptas à colheita de uma planta tal como sementes e produtos derivados, preferivelmente diretamente derivados, de uma parte apta à colheita de uma tal planta, tal como pelotas secas ou pós, óleo, gordura e ácidos graxos, amido ou proteínas.The invention also extends to harvestable parts of a plant such as seeds and derived products, preferably directly derived, from a harvestable part of such a plant, such as dried pellets or powders, oil, fat and fatty acids, starch. or proteins.

A presente invenção também abrange uso de ácidos nucleicos CKI para a redução ou eliminação substancial de expressão de gene CKI endógeno em tecido de endosperma de planta para aumentar produção de sementes de planta como definido acima.The present invention also encompasses use of CKI nucleic acids for the substantial reduction or elimination of endogenous CKI gene expression in plant endosperm tissue to increase plant seed production as defined above.

Descrição de figurasDescription of figures

A presente invenção será agora descrita co referência às seguintes figuras nas quais: Fig. 1 dá uma visão geral dos motivos conservados presentes em SEQ ID NO: 2. Domínio rico em leucina é sublinhado, os motivos conservados 1, 2 e 3 são indicados em negrito e a seqüência em itálico representa o provável sítio de N-glicosilação com o provável sítio de fosforilação de proteína quinase C.The present invention will now be described with reference to the following figures in which: Fig. 1 gives an overview of the conserved motifs present in SEQ ID NO: 2. Leucine rich domain is underlined, the conserved motifs 1, 2 and 3 are given in bold and the italic sequence represents the probable N-glycosylation site with the probable protein kinase C phosphorylation site.

Fig. 2 mostra um alinhamento múltiplo de várias proteínas SYR. Os asteriscos indicam resíduos de aminoácidos idênticos, os dois pontos representam substituições altamente conservadas e os pontos representam substituições menos conservativas. Com a informação de Figura 1, os vários domínios e motivos conservados em SEQ ID NO: 2 podem ser facilmente identificados nas outras proteínas SYR.Fig. 2 shows a multiple alignment of various SYR proteins. Asterisks indicate identical amino acid residues, colon represent highly conserved substitutions, and colon represent less conservative substitutions. With the information in Figure 1, the various domains and motifs conserved in SEQ ID NO: 2 can be easily identified in the other SYR proteins.

Fig. 3 mostra vetores binários para transformação e expressão em Oryza sativa de um ácido nucleico SYR de Oryza sativa. Em pGOS2::SYR, a seqüência de codificação de SYR está sob o controle de um promotor GOS2 de arroz.Fig. 3 shows binary vectors for transformation and Oryza sativa expression of an Oryza sativa SYR nucleic acid. In pGOS2 :: SYR, the SYR coding sequence is under the control of a rice GOS2 promoter.

Fig. 4 mostra vetores binários para transformação e expressão em Oryza sativa de um ácido nucleico SYR de Oryza sativa. Em pH MGP::SYR, a seqüência de codificação de SYR está sob o controle de um promotor HMGP de arroz (SEQ ID NO: 18 em WO 2004/070039, cuja SEQ ID NO: 18 de WO 2004/070039 é incorporada neste lugar como se completamente exposta),.Fig. 4 shows binary vectors for transformation and Oryza sativa expression of an Oryza sativa SYR nucleic acid. At pH MGP :: SYR, the SYR coding sequence is under the control of a rice HMGP promoter (SEQ ID NO: 18 in WO 2004/070039, whose SEQ ID NO: 18 of WO 2004/070039 is incorporated herein. as if completely exposed).

Fig. 5 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção. SEQ ID NO: 1 e SEQ ID NO: 2 representam a seqüência de nucleotídeos e proteínas de SYR usado nos exemplos. Os códons de início e término em SEQ ID NO: 1 são dados emFig. 5 details examples of sequences useful for carrying out the methods according to the present invention. SEQ ID NO: 1 and SEQ ID NO: 2 represent the nucleotide and protein sequence of SYRs used in the examples. Start and stop codons in SEQ ID NO: 1 are given in

negrito. SEQ ID NO: 3 e SEQ ID NO: 4 são seQüências de iniciadores usados para isolar o ácido nucleico SYR. SEQ ID NO: 5 é a seqüência do promotor GOS2 e SEQ ID NO: 33 do promotor PROO170 como usado nos exemplos, SEQ ID NO: 6 a SEQ ID NO: 11 representam seqüências consenso de partes conservadas nas proteínas SYR. SEQ ID NO: 12 a 25, 27 a 32 e 36 a 42 são seqüências de nucleotídeos (comprimento completo ou parcial) e proteínas de homólogos do gene SYR e proteína como dado em SEQ ID NO: 1 e SEQID NO: 2. SEQ ID NO: 26 representa a seqüência de proteína ARGOS (acesso de GenBank AY305869).bold. SEQ ID NO: 3 and SEQ ID NO: 4 are primer sequences used to isolate SYR nucleic acid. SEQ ID NO: 5 is the sequence of the GOS2 promoter and SEQ ID NO: 33 of the PROO170 promoter as used in the examples, SEQ ID NO: 6 through SEQ ID NO: 11 represent consensus sequences of conserved portions of the SYR proteins. SEQ ID NO: 12 to 25, 27 to 32 and 36 to 42 are nucleotide sequences (full or partial length) and proteins of the SYR gene and protein homologs as given in SEQ ID NO: 1 and SEQID NO: 2. SEQ ID NO: 26 represents the ARGOS protein sequence (GenBank accession AY305869).

Fig. 6 dá uma visão geral de domínios protéicos FG-GAP. A proteína de SEQ ID NO: 46 compreende sinal de secreção (parte N-terminal encaixotada), um domínio FG-GAP começando em P73 e terminando com L98, indicado em negrito e sublinhado, e um domínio transmembrana (negrito e encaixotado). O motivo conservado DXDXDGXX(DZE) é encaixotado e sublinhado, caracterizado pelo fato de que o motivo DGXX(D/E) está em itálico. O domínio conservado FDGYLYLID está sublinhado.Fig. 6 gives an overview of FG-GAP protein domains. The protein of SEQ ID NO: 46 comprises secretion signal (boxed N-terminal part), an FG-GAP domain beginning at P73 and ending with L98, indicated in bold and underlined, and a transmembrane domain (bold and boxed). The DXDXDGXX (DZE) conserved motif is boxed and underlined, characterized by the fact that the DGXX (D / E) motif is italicized. The conserved domain FDGYLYLID is underlined.

Fig. 7 mostra um alinhamento múltiplo de proteínas FG-GAP de comprimento completo (SEQ ID NO: 46, SEQ ID NO: 55, SEQ ID NO: 57 e SEQ ID NO: 59), os asteriscos indicam aminoácidos idênticos, os dois pontos indicam substituições altamente conservadas e os pontos indicam substituições menos conservativas. As seqüências parciais listadas em Tabela G de Exemplo 12 podem ser úteis em um tal alinhamento múltiplo para a identificação de motivos adicionais.Fig. 7 shows a multiple alignment of full length FG-GAP proteins (SEQ ID NO: 46, SEQ ID NO: 55, SEQ ID NO: 57 and SEQ ID NO: 59), asterisks indicate identical amino acids, the colon indicate highly conserved substitutions and dots indicate less conservative substitutions. The partial sequences listed in Table G of Example 12 may be useful in such a multiple alignment for identifying additional motifs.

Fig. 8 mostra um vetor binário para transformação e expressão em Oryza sativa de um ácido nucleico codificando FG-GAP de Arabidopsis thaliana sob o controle de um promotor GOS2 de arroz.Fig. 8 shows a binary vector for transformation and Oryza sativa expression of a nucleic acid encoding Arabidopsis thaliana FG-GAP under the control of a rice GOS2 promoter.

Fig. 9 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção. SEQ ID NO: 45 e SEQ ID NO: 46 representam a seqüência de nucleotídeos e proteínas de FG-GAP usados nos exemplos; os códons de início e término em SEQ ID NO: 45 são dados em negrito. SEQ ID NO: 47 e SEQ ID NO: 48 são seqüências de iniciadores usados para isolar o ácido nucleico FG-GAP. SEQ ID NO: 49 é a seqüência da combinação promotor-gene como usada nos exemplos, SEQ ID NO: 50 a SEQ ID NO: 53 representam seqüências consenso de partes conservadas nas proteínas FG-GAP. SEQ ID NO: 54 a 71 são seqüências de nucleotídeos (comprimento completo ou parcial) e proteínas de homólogos do gene FG- GAP e proteína como dada em SEQ ID NO: 45 e SEQ ID NO: 46. SEQ ID NO: 72 é a seqüência genômica codificando uma proteína FG-GAP de Medicago sativa cuja proteína compreende as seqüências de peptídeos representadas por SEQ ID NO: 72 a 76.Fig. 9 details examples of sequences useful for carrying out the methods according to the present invention. SEQ ID NO: 45 and SEQ ID NO: 46 represent the sequence of FG-GAP nucleotides and proteins used in the examples; start and stop codons in SEQ ID NO: 45 are given in bold. SEQ ID NO: 47 and SEQ ID NO: 48 are primer sequences used to isolate FG-GAP nucleic acid. SEQ ID NO: 49 is the sequence of the promoter-gene combination as used in the examples. SEQ ID NO: 50 to SEQ ID NO: 53 represent consensus sequences of conserved portions of FG-GAP proteins. SEQ ID NO: 54 to 71 are nucleotide sequences (full or partial length) and proteins of the FG-GAP gene and protein homologs as given in SEQ ID NO: 45 and SEQ ID NO: 46. SEQ ID NO: 72 is genomic sequence encoding a Medicago sativa FG-GAP protein whose protein comprises the peptide sequences represented by SEQ ID NO: 72 to 76.

Fig. 10 mostra as características importantes encontradas em polipeptídeos CYP90B ou homólogos destes: o domínio hidrofóbico Ν- terminal, o domínio de transição (com o K/R-K/R-X3-9-P-G-G, os domínios AaD. Dentro do domínio A a seqüência consenso Ala/Gly-Gly-X-Asp/Glu- Thr-Thr/Ser é identificada. A seqüência consenso Phe-Ala-Gly-His-Glu-Thr- Ser-Ser dos polipeptídeos CYP90B compreende esta seqüência consenso Ala/Gly-Gly-X-Asp/Glu-Thr-Thr/Ser.Fig. 10 shows the important characteristics found in or homologous CYP90B polypeptides: the terminal-terminal hydrophobic domain, the transition domain (with the K / RK / R-X3-9-PGG, the AaD domains. Within domain A to Ala / Gly-Gly-X-Asp / Glu-Thr-Thr / Ser consensus sequence is identified.The Phe-Ala-Gly-His-Glu-Thr-Ser consensus sequence of the CYP90B polypeptides comprises this Ala / Gly consensus sequence. Gly-X-Asp / Glu-Thr-Thr / Ser.

Fig. 11 mostra a via biossintética ramificada de brassinoesteróide. Em Arabidopsis, o polipeptídeo CYP90B1/DWF4 compreende a atividade enzimática de esteróide 22 alfa hidroxilase.Fig. 11 shows the branched brassinoesteroid biosynthetic pathway. In Arabidopsis, the CYP90B1 / DWF4 polypeptide comprises the enzymatic activity of steroid 22 alpha hydroxylase.

Fig. 12 mostra o perfil de produção de ProtScale para hidrofobicidade do polipeptídeo CYP90B da invenção. Os primeiros 34 aminoácidos N-terminais (encaixotados) representam um domínio hidrofóbico, pois estes estão localizados acima da linha delimitando zero. Esta região corresponde ao domínio âncora N-terminal.Fig. 12 shows the ProtScale production profile for hydrophobicity of the CYP90B polypeptide of the invention. The first 34 N-terminal (boxed) amino acids represent a hydrophobic domain as they are located above the zero delimiting line. This region corresponds to the N-terminal anchor domain.

Fig. 13 mostra um alinhamento múltiplo de diversos polipeptídeos CYP90B vegetais, usando o programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo de ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma extensão de lacuna de 0,05. O domínio hidrofóbico N-terminal, o domínio de transição (com o K/R-K/R-X3. 9-P-G-G) e os domínios AaD estão indicados. A seqüência consenso Phe- Ala-Gly-His-Glu-Thr-Ser-Ser é encaixotada dentro do domínio A. Os números de acesso dos polipeptídeos CYP90B podem ser encontrados em Tabela 9a e 9b. Os Arath_CYP90Al_CPD (At5g05690), Arath_CYP90C 1 ROT3 (At4g36380) e Arath_CYP90Dl (At3gl3730) de Arabidopsis são mostrados como não polipeptídeos CYP90B.Fig. 13 shows multiple alignment of various vegetable CYP90B polypeptides using the VNTI AlignX multiple alignment program based on a modified ClustalW algorithm (InforMax, Bethesda, MD, http://www.informaxinc.com) with default settings. for gap opening penalty of 10 and a gap length of 0.05. The N-terminal hydrophobic domain, the transition domain (with the K / R-K / R-X3.9-P-G-G) and the AaD domains are indicated. The Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence is boxed within domain A. The CYP90B polypeptide accession numbers can be found in Table 9a and 9b. Arath_CYP90Al_CPD (At5g05690), Arath_CYP90C 1 ROT3 (At4g36380) and Arath_CYP90D1 (At3gl3730) from Arabidopsis are shown as non-CYP90B polypeptides.

Fig. 14 mostra um vetor de transformação vegetal para expressão em Oryza sativa de um ácido nucleico CYP90B de Oryza sativa sob o controle de um promotor vegetal, o qual pode ser um promotor não constitutivo (tal como endosperma ou embrião/aleurona específico) ou um promotor constitutivo (tal como GOS2 e HMGB1).Fig. 14 shows a plant transformation vector for Oryza sativa expression of an Oryza sativa CYP90B nucleic acid under the control of a plant promoter, which may be a non-constitutive promoter (such as endosperm or specific embryo / aleurone) or a constitutive promoter (such as GOS2 and HMGB1).

Fig. 15 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção. Diversas seqüências resultam de agrupamentos públicos de EST (veja Tabela 9a), com seqüenciamento de menos qualidade. Como uma conseqüência, umas poucas substituições de ácidos nucleicos podem ser esperadas. Os códons de início (ATG) e término delimitam as seqüências de ácidos nucleicos quando estas são de comprimento completo.Fig. 15 details examples of sequences useful for carrying out the methods according to the present invention. Several sequences result from public EST groupings (see Table 9a), with poor quality sequencing. As a consequence, a few nucleic acid substitutions may be expected. The start (ATG) and end codons delimit nucleic acid sequences when they are full length.

Fig. 16 representa uma figura esquemática de um polipeptídeo CDC27 de comprimento completo (mais especificamente o polipeptídeo hobbit CDC27B de Arabidopsis thaliana). As repetições de tetratricopeptídeo (TPR) são representadas como caixas pretas. A região NH2 terminal do polipeptídeo é representada como uma barra preta.Fig. 16 is a schematic figure of a full length CDC27 polypeptide (more specifically the Arabidopsis thaliana hobbit polypeptide CDC27B). Tetratricopeptide repeats (TPR) are represented as black boxes. The NH2 terminal region of the polypeptide is represented as a black bar.

Fig. 17 mostra o alinhamento múltiplo de polipeptídeos CDC27 de diferentes fontes, usando o programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo de ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma extensão de lacuna de 0,05. As repetições de tetratricopeptídeo (TPR) são encaixotadas através do alinhamento. O domínio NH2 conservado PDOl 1373 (como definido em ProDom, http://ribosome.toulouse.inra.fr/prodom/current/cgi- bin/ProDomBlast3.pl) é duplamente sublinhado.Fig. 17 shows the multiple alignment of CDC27 polypeptides from different sources using the VNTI AlignX multiple alignment program based on a modified ClustalW algorithm (InforMax, Bethesda, MD, http://www.informaxinc.com) with configurations. gap opening penalty of 10 and a gap length of 0.05. Tetratricopeptide repeats (TPR) are boxed through alignment. The conserved NH2 domain PDOl 1373 (as defined in ProDom, http://ribosome.toulouse.inra.fr/prodom/current/cgi-bin/ProDomBlast3.pl) is underlined twice.

Fig. 18 mostra um vetor binário pOSHl::CDC27 para expressão em Oryza sativa de um ácido nucleico CDC27 modificado de Arabidopsis thaliana sob o controle de um promotor vegetal que é um promotor de meristema apical de broto.Fig. 18 shows a pOSH1 :: CDC27 binary vector for expression in Oryza sativa of a modified Arabidopsis thaliana CDC27 nucleic acid under the control of a plant promoter which is a bud apical meristem promoter.

Fig. 19 mostra uma Tabela listando ortólogos e parálogos de CDC27 parciais e de comprimento completo de diferentes fontes, produzidos por TIGR (Institute for Genomic Research at http://www.tigr.org). TC895803 pode ser encontrado em http://www.tigr.org/tigr- scripts/tgi/ego/ego_report.pl?ego=895803.Fig. 19 shows a Table listing partial and full length CDC27 orthologs and paralogues from different sources produced by TIGR (Institute for Genomic Research at http://www.tigr.org). TC895803 can be found at http://www.tigr.org/tigr- scripts / tgi / ego / ego_report.pl? Ego = 895803.

Fig. 20 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção, ou úteis para isolar tais seqüências. Diversas seqüências resultam de assembléias públicas de EST (veja Tabela 10), com seqüenciamento de menos qualidade. Como uma conseqüência, umas poucas substituições de ácidos nucleicos podem ser esperadas. Os códons de início (ATG) e término delimitam as seqüências de ácidos nucleicos quando estes codificam polipeptídeos CDC27 de comprimento completo.Fig. 20 details examples of sequences useful for carrying out the methods according to the present invention, or useful for isolating such sequences. Several sequences result from public EST assemblies (see Table 10), with poor quality sequencing. As a consequence, a few nucleic acid substitutions may be expected. Start (ATG) and end codons delimit nucleic acid sequences when they encode full-length CDC27 polypeptides.

Fig. 21 mostra uma árvore filogenética de várias seqüências de polipeptídeos compreendendo um domínio AT-hook e um domínio DUF296. A árvore filogenética foi feita usando programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo de ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma extensão de lacuna de 0,05.Fig. 21 shows a phylogenetic tree of various polypeptide sequences comprising an AT-hook domain and a DUF296 domain. The phylogenetic tree was made using VNTI AlignX multiple alignment program, based on a modified ClustalW algorithm (InforMax, Bethesda, MD, http://www.informaxinc.com), with default settings for gap gap 10 and a gap length of 0.05.

Fig. 22 mostra um vetor binário pPROLAMINA::AT-hook, para expressão em Oryza sativa de um ácido nucleico de Oryza sativa codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 e Motivo 2 sob o controle de um promotor de prolamina. Fig. 23 mostra um alinhamento múltiplo de um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, preparado usando programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo de ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma extensão de lacuna de 0,05. E mostrado no alinhamento o domínio AT-hook e o domínio DUF296 e Motivo 2 em negrito, itálico e sublinhado..Fig. 22 shows a pPROLAMINE :: AT-hook binary vector for expression in Oryza sativa of an Oryza sativa nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 and Reason 2 domain under the control of a prolamine promoter. . Fig. 23 shows a multiple alignment of a polypeptide comprising an AT-hook domain and a DUF296 domain, prepared using AlignX VNTI multiple alignment program, based on a modified ClustalW algorithm (InforMax, Bethesda, MD, http: // www. informaxinc.com), with default settings for gap gap penalty of 10 and a gap length of 0.05. Shown in alignment are the AT-hook domain and the DUF296 and Reason 2 domain in bold, italics and underline.

Fig. 24 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção.Fig. 24 details examples of sequences useful for carrying out the methods according to the present invention.

Fig. 25 mostra uma árvore filogenética de fatores de transcrição DOF. A caixa mais perto do topo mostra o principal agrupamento de seqüências compartilhando homologia com SEQ ID NO: 227 (e compreendendo características (i) e (iii) como definido acima, i.e. pelo menos 60% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e Motivo I e/ou Motivo II como definido acima). A caixa mais perto do fundo mostra o principal agrupamento de seqüências compartilhando homologia com SEQ ID NO: 199 (e compreendendo características (i) e (ii) como definido acima, i.e. pelo menos 60% de identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e pelo menos 70% de identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200).Fig. 25 shows a phylogenetic tree of DOF transcription factors. The box near the top shows the main sequence grouping sharing homology with SEQ ID NO: 227 (and comprising characteristics (i) and (iii) as defined above, ie at least 60% of sequence identity or with the DOF domain represented SEQ ID NO: 200 or SEQ ID NO: 228; and Reason I and / or Reason II as defined above). The box closest to the bottom shows the main sequence grouping sharing homology with SEQ ID NO: 199 (and comprising characteristics (i) and (ii) as defined above, ie at least 60% of sequence identity or with the represented DOF domain SEQ ID NO: 200 or SEQ ID NO: 228, and at least 70% sequence identity with the DOF domain represented by SEQ ID NO: 200).

Fig. 26 mostra um vetor binário pGOS2::DOF, para expressão em Oryza sativa de um fator de transcrição DOF de Arabidopsis thaliana sob o controle de um promotor GOS2.Fig. 26 shows a binary vector pGOS2 :: DOF for expression in Oryza sativa of an Arabidopsis thaliana DOF transcription factor under the control of a GOS2 promoter.

Fig. 27 mostra um vetor binário pPROLAMINA::DOF, para expressão em Oryza sativa de um fator de transcrição DOF de Arabidopsis thaliana sob o controle de um promotor de prolamina.Fig. 27 shows a pPROLAMINE :: DOF binary vector for expression in Oryza sativa of an Arabidopsis thaliana DOF transcription factor under the control of a prolamine promoter.

Fig. 28 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção.Fig. 28 details examples of sequences useful for carrying out the methods according to the present invention.

Fig. 29 é uma representação esquemática de um polipeptídeo CKI vegetal de comprimento completo. Os motivos típicos 1 a 5 (SEQ ID NO: 261 a SEQ ID NO: 265) úteis para identificar CKIs são encaixotados e numerados por conseguinte (motivo 6 não mostrado).Fig. 29 is a schematic representation of a full length plant CKI polypeptide. Typical motifs 1 through 5 (SEQ ID NO: 261 to SEQ ID NO: 265) useful for identifying CKIs are boxed and numbered accordingly (reason 6 not shown).

Fig. 30 mostra uma árvore de agrupamento de vizinhos de um alinhamento múltiplo de polipeptídeos CKI de diferentes fontes, e feito usando o aplicativo computacional público ClustalW disponível em http://clustalw.genome.jp, com as configurações padrão. Um subgrupo de CKI4s de monocotiledôneas e dicotiledôneas é indicado pelo colchete grande. Dentro deste subgrupo, CKIs de monocotiledôneas se agrupam juntos, como indicado pelo colchete médio. O galho de CKI4 de monocotiledôneas é indicado pelo colchete pequeno.Fig. 30 shows a neighboring grouping tree of a multiple alignment of CKI polypeptides from different sources, and made using the ClustalW public computer application available at http://clustalw.genome.jp, with default settings. A subset of monocotyledon and dicotyledon CKI4s is indicated by the large bracket. Within this subgroup, monocotyledon CKIs group together, as indicated by the middle bracket. The monocotyledonous CKI4 branch is indicated by the small bracket.

Fig. 31 é um alinhamento múltiplo de polipeptídeos CKI de diferentes fontes vegetais, feito usando programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo de ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma extensão de lacuna de 0,05. A extremidade C-terminal conservada de CKIs é encaixotada, assim como motivos 1 a 5 (SEQ ID NO: 261 a SEQ ID NO: 265) úteis para identificar CKIs vegetais (motivo 6 não mostrado).Fig. 31 is a multiple alignment of CKI polypeptides from different plant sources, made using VNTI AlignX multiple alignment program, based on a modified ClustalW algorithm (InforMax, Bethesda, MD, http://www.informaxinc.com), with default settings for gap gap penalty of 10 and gap gap of 0.05. The conserved C-terminal end of CKIs are boxed, as are motifs 1 through 5 (SEQ ID NO: 261 to SEQ ID NO: 265) useful for identifying plant CKIs (motif 6 not shown).

Fig. 32 mostra um vetor binário para silenciamento de RNA de CKI em Oryza sativa, usando uma construção com estrutura em grampo, sob o controle de um promotor endosperma específico e sob o controle de um promotor broto específico.Fig. 32 shows a binary vector for CKI RNA silencing in Oryza sativa using a staple construct under the control of a specific endosperm promoter and under the control of a specific bud promoter.

Fig. 33 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção, ou úteis para isolar tais seqüências. Diversas seqüências resultam de assembléias públicas de EST, com seqüenciamento de menos qualidade. Como uma conseqüência, umas poucas substituições de ácidos nucleicos podem ser esperadas. Os códons de início (ATG) e término delimitam as seqüências de ácidos nucleicos quando estas codificam polipeptídeos CKI de comprimento completo. Entretanto tanto UTR 5' como 3' também podem ser usadas para realizar os métodos da invenção.Fig. 33 details examples of sequences useful for carrying out the methods according to the present invention, or useful for isolating such sequences. Several sequences result from public EST assemblies, with poor quality sequencing. As a consequence, a few nucleic acid substitutions may be expected. Start (ATG) and end codons delimit nucleic acid sequences when they encode full-length CKI polypeptides. However both 5 'and 3' UTRs can also be used to perform the methods of the invention.

ExemplosExamples

A presente invenção será agora descrita com referência aos seguintes exemplos, que estão como forma de ilustração apenas. Os seguintes exemplos não são pretendidos para definir completamente ou de outra maneira limitar o escopo da invenção.The present invention will now be described with reference to the following examples, which are by way of illustration only. The following examples are not intended to fully define or otherwise limit the scope of the invention.

Manipulação de DNADNA manipulation

A menos que de outra maneira determinado, técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3a Edição, Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et ai. (1994), Current Protocols in Molecular Biology, Current Protocols (http://www.4ulr.com/products/currentprotocols/index.html).Unless otherwise stated, recombinant DNA techniques are performed according to standard protocols described in (Sambrook (2001) Molecular Cloning: A Laboratory Manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York) or in Volumes 1 and 2 of Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols (http://www.4ulr.com/products/currentprotocols/index.html).

Materiais e métodos padrão para trabalho molecular com plantas são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).Standard materials and methods for plant molecular work are described in Plant Molecular Biology Labfax (1993) by R.D.D. Croy, published by BIOS Scientific Publications Ltd (UK) and Blackwell Scientific Publications (UK).

Análise estatísticaStatistical analysis

Uma ANOVA de dois fatores (análises de variância) corrigida para o modelo não equilibrado foi usada como modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com aquele gene. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e para verificar por um efeito geral do gene, também chamado neste lugar "efeito gênico global". Se o valor do teste F mostra que os dados são signifícantes, então é concluído que existe um efeito "gênico", significando que não apenas presença ou a posição do gene está causando o efeito. O limiar para significância para um verdadeiro efeito gênico global é ajustado em 5% de nível de probabilidade para o teste F.A two-way ANOVA (analysis of variance) corrected for the unbalanced model was used as a statistical model for the general evaluation of plant phenotypic characteristics. An F test was performed on all measured parameters of all plants of all events transformed with that gene. The F-test was performed to check for a gene effect on all transformation events and to check for a general gene effect, also called here "global gene effect". If the value of the F test shows that the data is significant, then it is concluded that there is a "gene" effect, meaning that not only the presence or position of the gene is causing the effect. The threshold for significance for a true global gene effect is set at a 5% probability level for the F test.

Para verificar por um efeito dos genes dentro de um evento, i.e., por um efeito linhagem específico, um teste t foi realizado dentro de cada evento usando conjuntos de dados das plantas transgênicas e das plantas nulas correspondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" são as plantas tratadas da mesma maneira que a planta transgênica, mas das quais o transgene foi segregado. Plantas nulas também podem ser descritas como as plantas transformadas negativas homozigotas. O limiar para significância para o teste t é ajustado em 10% de nível de probabilidade. Os resultados para alguns eventos podem estar acima ou abaixo deste limiar. Isto é baseado na hipótese de que um gene pode apenas ter um efeito em certas posições no genoma, e que a ocorrência deste efeito dependente de posição não é comum. Este tipo de efeito gênico é também chamado neste lugar um "efeito de linhagem do gene". O valor de ρ é obtido comparando o valor de t com a distribuição de t ou alternativamente, comparando o valor de F com a distribuição de F. O valor de ρ então gera a probabilidade de que a hipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.To verify for an effect of genes within an event, i.e., for a specific lineage effect, a t-test was performed within each event using transgenic and corresponding null plant datasets. "Null plants" or "null segregants" or "nullizigotes" are plants treated in the same manner as the transgenic plant, but from which the transgene has been secreted. Null plants can also be described as negative transformed homozygous plants. The threshold for significance for the t-test is set at 10% probability level. Results for some events may be above or below this threshold. This is based on the hypothesis that a gene can only have an effect on certain positions in the genome, and that the occurrence of this position-dependent effect is not common. This type of gene effect is also called in this place a "gene lineage effect". The value of ρ is obtained by comparing the value of t with the distribution of t or alternatively by comparing the value of F with the distribution of F. The value of ρ then generates the probability that the null hypothesis (ie, that there is no transgene effect) is correct.

EXEMPLO A: SYREXAMPLE A: SYR

Exemplo 1: Identificação de seqüências relacionadas a SEQ ID NO: 1 e SEQID NO: 2Example 1: Identification of Sequences Related to SEQ ID NO: 1 and SEQID NO: 2

Seqüências (cDNA de comprimento completo, ESTs ou genômicas) relacionadas a SEQ ID NO: 1 e/ou seqüências de proteínas relacionadas a SEQ ID NO: 2 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et ai. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de seqüências e calculando a significância estatística de identidades. O polipeptídeo codificado por SEQ ID NO: 1 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar contrapeso de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueada de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade de porcentagem. Identidade de porcentagem se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas em um comprimento particular. Em algumas instâncias, os parâmetros padrão foram ajustados para modificar a estringência da busca.Sequences (full length cDNA, ESTs or genomic) related to SEQ ID NO: 1 and / or protein sequences related to SEQ ID NO: 2 were identified among those maintained in the Entrez Nucleotides database at the National Center for Biotechnology Information (NCBI) ) using database sequence search tools such as the Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215: 403-410; and Altschul et al. (1997 ) Nucleic Acids Res. 25: 3389-3402). The program was used to find regions of local similarity between sequences by comparing nucleic acid or polypeptide sequences with sequence database and calculating the statistical significance of identities. The polypeptide encoded by SEQ ID NO: 1 was used for the TBLASTN algorithm, with default settings and the filter to bypass low complexity sequence counterweight. The result of the analysis was viewed by paired comparison, and ranked according to the probability score (E value), where the score reflects the probability that a particular alignment will occur at random (the lower the E value, the more significant the hit). . In addition to E values, comparisons were also scored by percentage identity. Percentage identity refers to the number of identical nucleotides (or amino acids) between the two nucleic acid (or polypeptide) sequences compared at a particular length. In some instances, the default parameters have been adjusted to modify the search stringency.

Em adição às seqüências de ácidos nucleicos disponíveis publicamente disponíveis em NCBI, outros bancos de dados de seqüências também podem ser buscados seguindo o mesmo procedimento que descrito acima.In addition to the publicly available nucleic acid sequences available from NCBI, other sequence databases can also be searched by following the same procedure as described above.

Tabela A fornece uma lista de seqüências de ácidos nucleicos e proteínas relacionadas à seqüência de ácidos nucleicos como representada por SEQ ID NO: 1 e à seqüência de proteínas representada por SEQ ID NO: 2.Table A provides a list of nucleic acid and protein sequences related to the nucleic acid sequence as represented by SEQ ID NO: 1 and the protein sequence represented by SEQ ID NO: 2.

Tabela A: Seqüências de ácidos nucleicos relacionadas à seqüência de ácidos nucleicos (SEQ ID NO: 1) úteis nos métodos da presente invenção, e os polipeptídeos deduzidos correspondentes. <table>table see original document page 194</column></row><table>Table A: Nucleic acid sequence related nucleic acid sequences (SEQ ID NO: 1) useful in the methods of the present invention, and the corresponding deduced polypeptides. <table> table see original document page 194 </column> </row> <table>

Exemplo 2: Alinhamento de seqüências depolipeptídeos relevantesExample 2: Alignment of Relevant Polypeptide Sequences

AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo de Clustal de alinhamento progressivo (Thompson et ai. (1997) Nucleic Acids Res 25:4876-4882; Chenna et ai. (2003). Nucleic Aeids Res 31:3497-3500). Uma árvore filogenétiea pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados).Vector Nign AlignX (Invitrogen) is based on the popular Clustal progressive alignment algorithm (Thompson et al. (1997) Nucleic Acids Res 25: 4876-4882; Chenna et al. (2003). Nucleic Aeids Res 31: 3497-3500 ). A phylogenetic tree can be constructed using a neighbor grouping algorithm. Default values are for gap gap penalty of 10, gap gap penalty of 0.1 and the selected weight matrix is Blosum 62 (if polypeptides are aligned).

O resultado do alinhamento múltiplo de seqüências usando polipeptídeos relevantes para identificar aqueles úteis para realizar os métodos da invenção é mostrado em Figura 2. A repetição rica em leucina e os motivos conservados podem ser facilmente discriminados nas várias seqüências.The result of multiple sequence alignment using relevant polypeptides to identify those useful for carrying out the methods of the invention is shown in Figure 2. Leucine-rich repeat and conserved motifs can be easily broken down into the various sequences.

Exemplo 3: Cálculo de identidade de porcentagem global entre seqüências de polipeptídeos úteis para realizar os métodos da invençãoExample 3: Calculating Global Percentage Identity Between Polypeptide Sequences Useful for Carrying Out the Methods of the Invention

Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein ou DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem necessitar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha divisora e identidade de seqüências é mostrada na metade de cima da linha divisora diagonal.Overall percentages of similarity and identity between full-length polypeptide sequences useful for carrying out the methods of the invention were determined using one of the methods available in the art, the MatGAT (BMC Bioinformatics. 2003 4:29) computer application. MatGAT: An application that generates similarity / identity matrices using protein or DNA sequences (Campanella JJ, Bitincka L, Smalley J; Ledion Bitincka hosted computer application). MatGAT computational application generates similarity / identity matrices for DNA or protein sequences without requiring data alignment. The program performs a series of paired alignments using the Myers and Miller global alignment algorithm (with a gap opening penalty of 12, and a gap length penalty of 2), calculating similarity and identity using for example Blosum 62 ( for polypeptides), and then put the results into a distance matrix. Sequence similarity is shown in the lower half of the dividing line and sequence identity is shown in the upper half of the diagonal dividing line.

Parâmetros usados na comparação foram:Parameters used in the comparison were:

Matriz de pontuação: Blosum62Score Matrix: Blosum62

PrimeiraLacuna: 12First Gap: 12

Lacuna de extensão: 2Extension Gap: 2

Resultados da análise de aplicativo computacional são mostrados em Tabela B para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos (excluindo as seqüências de polipeptídeos parciais). Identidade de porcentagem é dada acima da diagonal e similaridade de porcentagem é dada abaixo da diagonal.Results of the computational application analysis are shown in Table B for similarity and overall identity at full length of polypeptide sequences (excluding partial polypeptide sequences). Percentage identity is given above the diagonal and percentage similarity is given below the diagonal.

A identidade de porcentagem entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 27% de identidade de aminoácidos comparada com SEQ ID NO: 2. Tabela BPercent identity between polypeptide sequences useful for carrying out the methods of the invention may be as low as 27% amino acid identity compared to SEQ ID NO: 2. Table B

<table>table see original document page 197</column></row><table> Exemplo 4: Previsão de topologia do polipeptídeo seqüências úteis para realizar os métodos da invenção<table> table see original document page 191 </column> </row> <table> Example 4: Prediction of polypeptide topology sequences useful for carrying out the methods of the invention

TargetP 1.1 foi usado para prever a localização subcelular de proteínas eucariotas. De acordo com o programa, a designação de localização é baseada na presença prevista de qualquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Escores nos quais a previsão final está baseada não são probabilidades reais, e eles não necessariamente adicionam a um. Entretanto, a localização com o maior escore é a mais provável de acordo com TargetP, e a relação entre os escores (a classe de confiança) pode ser uma indicação de quão certa é a previsão. A classe de confiança (RC) varia de 1 a 5, onde 1 indica a previsão mais forte. TargetP é mantido no servidor da Technical University of Denmark.TargetP 1.1 was used to predict the subcellular localization of eukaryotic proteins. According to the program, the location designation is based on the expected presence of any of the N-terminal pre-sequences: chloroplast transit peptide (cTP), mitochondrial targeting peptide (mTP) or secretory pathway signal peptide (SP) . Scores on which the final forecast is based are not real probabilities, and they do not necessarily add to one. However, the location with the highest score is most likely according to TargetP, and the relationship between the scores (the confidence class) may be an indication of how accurate the prediction is. Confidence class (RC) ranges from 1 to 5, where 1 indicates the strongest forecast. TargetP is maintained on the server of the Technical University of Denmark.

Para as seqüências previstas conter uma pré-seqüência N- terminal um sítio de clivagem potencial também pode estar presente.For predicted sequences containing an N-terminal pre-sequence a potential cleavage site may also be present.

Diversos parâmetros foram selecionados, tal como grupo de organismo (não vegetal ou vegetal), conjuntos de atalhos (nenhum, conjunto pré-definido de atalhos, ou conjunto de atalhos especificado por usuário), e o cálculo de previsão de sítios de clivagem (sim ou não).Several parameters were selected, such as organism group (non-plant or plant), shortcut sets (none, predefined shortcut set, or user-specified shortcut set), and prediction calculation of cleavage sites (yes or not).

Os resultados de análise TargetP 1.1 da seqüência de polipeptídeos como representada por SEQ ID NO: 2 são apresentados na Tabela C abaixo. O grupo de organismo "vegetal" foi selecionado, nenhum atalho definido, e o comprimento previsto do peptídeo de trânsito requisitado.TargetP 1.1 analysis results of the polypeptide sequence as represented by SEQ ID NO: 2 are presented in Table C below. The "plant" organism group was selected, no shortcut defined, and the predicted length of the requested transit peptide.

De acordo com os resultados, a localização subcelular da seqüência de polipeptídeos como representada por SEQ ID NO: 2 pode ser a mitocôndria; entretanto a classe de confiança de 5 (i.e. a classe de confiança mais baixa) deve ser considerada. Tabela C: Análise TargetP 1.1 da seqüência de polipeptídeos como representada por SEQ ID NO: 2According to the results, the subcellular location of the polypeptide sequence as represented by SEQ ID NO: 2 may be mitochondria; however the confidence class of 5 (i.e. the lowest confidence class) must be considered. Table C: TargetP 1.1 Analysis of Polypeptide Sequence as Represented by SEQ ID NO: 2

<table>table see original document page 199</column></row><table><table> table see original document page 199 </column> </row> <table>

Dois domínios transmembrana foram identificados pelo programa TMHMM, hospedado no servidor do Center for Biological Sequence Analysis, Technical University of Denmark. Os resultados abaixo mostram que a probabilidade de que o término N esteja localizado dentro é 0,997. Detalhes adicionais na orientação são dados em Tabela D abaixo. Tabela D: resultados de TMHMM 2.0Two transmembrane domains were identified by the TMHMM program hosted on the Center for Biological Sequence Analysis server, Technical University of Denmark. The results below show that the probability that the N terminus is located within is 0.997. Additional details in the orientation are given in Table D below. Table D: TMHMM 2.0 Results

<table>table see original document page 199</column></row><table><table> table see original document page 199 </column> </row> <table>

Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:Many other algorithms can be used to perform such analyzes, including:

• ChloroP 1.1 hospedado no servidor da Technical University of Denmark;• ChloroP 1.1 hosted on the Technical University of Denmark server;

• Protein Prowler Subcellular Localisation Predictor versão 1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Austrália;• Protein Prowler Subcellular Localization Predictor version 1.2 hosted on the Institute for Molecular Bioscience server, University of Queensland, Brisbane, Australia;

• PENCE Proteome Analyst PA-GOSUB 2.5 hospedado no servidor da University of Alberta, Edmonton, Alberta, Canadá;• PENCE Proteome Analyst PA-GOSUB 2.5 hosted on the University of Alberta server, Edmonton, Alberta, Canada;

Exemplo 5: Clonagem de geneExample 5: Gene Cloning

O gene SYR de Oryza sativa foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântula de Oryza sativa (Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído de plântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio de inserto do banco foi 1,5 kb e o número original de clones foi da ordem de 1,59 x 107 cfu. Título original foi determinado como sendo 9,6 x 10 cfu/ml depois de primeira amplificação de 6 x 10u cfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μl. Iniciadores prm08170 (SEQ ID NO: 3; sentido, códon de início em negrito, sítio AttBl em itálico: S^ggggacaagtttgtacaaaaaageag gcítaatfctfatggaaggtgtaggtgctagg-s') e prm08171 (SEQ ID NO: 4; reverso, complementar, sítio AttB2 em itálico: 5'- ggggaccactttgtacaagaaagctgggtcaaaaacaaaaataaattcccc-3'1), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR do tamanho correto foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada", pSYR. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.The Oryza sativa SYR gene was PCR amplified using an Oryza sativa seedling cDNA library (Invitrogen, Paisley, UK) as a template. After reverse transcription of seedling-extracted RNA, cDNAs were cloned into pCMV Sport 6.0. Average bank insert size was 1.5 kb and the original number of clones was on the order of 1.59 x 107 cfu. Original titer was determined to be 9.6 x 10 cfu / ml after first amplification of 6 x 10u cfu / ml. After plasmid extraction, 200 ng of template were used in a 50 μl PCR mix. Primers prm08170 (SEQ ID NO: 3; sense, bold start codon, AttBl site in italics: S ^ ggggacaagtttgtacaaaaaageag gcítaatfctfatggaaggtgtaggtgctagg-s') and prm08171 (complementary SEB ID: 2; Att; - ggggaccactttgtacaagaaagctgggtcaaaaacaaaaataaattcccc-3'1), which include the AttB sites for Gateway recombination, were used for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. A PCR fragment of the correct size was amplified and purified using standard methods as well. The first step of the Gateway procedure, the BP reaction, was then performed, during which the PCR fragment recombines in vivo with plasmid pDONR201 to produce, according to Gateway terminology, an "input clone", pSYR. Plasmid pDONR201 was purchased from Invitrogen as part of Gateway® technology.

Exemplo 6: Construção de VetorExample 6: Vector Construction

O clone de entrada pSYR foi subseqüentemente usado em uma eação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T- DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 5) para expressão constitutiva foi localizado antes desta gaveta Gateway. Uma construção de vetor similar foi preparada, mas com o promotor de Proteína de Grupo de Alta Mobilidade (HMGP, SEQ ID NO: 33) ao invés do promotor GOS. Depois da etapa de recombinação LR, os vetores de expressão resultantes, pGOS2::SYR (com o promotor GOS2) e pH MGP::SYR (com o promotor HMGP), ambos para expressão constitutiva de SYR (Figura 2) foram transformados em linhagem LBA4044 de Agrobacterium e subseqüentemente para plantas de Oryza sativa. Exemplo 7: Transformação de arrozThe input clone pSYR was subsequently used in an LR action with a destination vector used for Oryza sativa transformation. This vector contains as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and a Gateway drawer intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. A rice GOS2 promoter (SEQ ID NO: 5) for constitutive expression was located before this Gateway drawer. A similar vector construct was prepared, but with the High Mobility Group Protein promoter (HMGP, SEQ ID NO: 33) instead of the GOS promoter. After the LR recombination step, the resulting expression vectors, pGOS2 :: SYR (with the GOS2 promoter) and pH MGP :: SYR (with the HMGP promoter), both for constitutive expression of SYR (Figure 2) were transformed into lineage. Agrobacterium LBA4044 and subsequently for Oryza sativa plants. Example 7: Rice Processing

A Agrobacterium contendo o vetor de expressão foi usada para transformar plantas de Oryza sativa. Sementes maduras secas da cultivar japonesa de arroz Nipponbare foram descascadas. Esterilização foi realizada incubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2% de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com água destilada estéril. As sementes estéreis foram então germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois de incubação no escuro por quatro semanas, calos embriogênicos derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados por subsafra no mesmo meio por outras 2 semanas. Pedaços de calo embriogênico foram sub-cultivados em meio fresco 3 dias antes de co-cultivo (para estimular atividade de divisão celular).Agrobacterium containing the expression vector was used to transform Oryza sativa plants. Dried ripe seeds of the Japanese Nipponbare rice cultivar were peeled. Sterilization was performed by incubating for one minute in 70% ethanol, followed by 30 minutes in 0.2% HgCl2, followed by a 15-minute wash 6 times with sterile distilled water. The sterile seeds were then germinated in a medium containing 2,4-D (callus induction medium). After incubation in the dark for four weeks, scutellus-derived embryogenic calli were excised and propagated in the same medium. After two weeks, the corns were multiplied or sub-propagated in the same medium for another 2 weeks. Embryogenic callus pieces were subcultured in fresh medium 3 days prior to co-cultivation (to stimulate cell division activity).

Linhagem LBA4404 de Agrobacterium contendo o vetor de expressão foi usada para co-cultivo. Agrobaeterium foi inoculada em meio AB com os antibióticos apropriados e cultivada por 3 dias a 28°C. As bactérias foram então coletadas e suspensas em meio de co-cultivo líquido para uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferida para uma placa de Petri e os calos imersos na suspensão por 15 minutos. Os tecidos de calos foram então secados em um papel filtro e transferidos para um meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C. Calos co-cultivados foram crescidos em meio contendo 2,4-D- por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depois de transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e brotos se desenvolveram nas próximas quatro a cinco semanas. Brotos foram excisados dos calos e incubados por 2 a 3 semanas em um meio contendo auxina a partir do qual eles foram transferidos para o solo. Brotos endurecidos foram crescidos em alta umidade e dias curtos em uma casa de vegetação.Agrobacterium strain LBA4404 containing the expression vector was used for co-cultivation. Agrobaeterium was inoculated in AB medium with the appropriate antibiotics and grown for 3 days at 28 ° C. The bacteria were then collected and suspended in liquid co-cultivation medium to a density (OD60) of about 1. The suspension was then transferred to a petri dish and the calluses immersed in the suspension for 15 minutes. Callus tissues were then dried on filter paper and transferred to a solidified co-culture medium and incubated for 3 days in the dark at 25 ° C. Co-cultured calli were grown in medium containing 2,4-D- for 4 weeks in the dark at 28 ° C in the presence of a selection agent. During this period, rapidly growing hard-shelled islands developed. After transfer of this material to a regeneration medium and incubation in light, the embryogenic potential was released and shoots developed in the next four to five weeks. Sprouts were excised from the corns and incubated for 2 to 3 weeks in auxin-containing medium from which they were transferred to the soil. Hardened shoots were grown in high humidity and short days in a greenhouse.

Aproximadamente 35 transformantes T0 de arroz independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação. Depois de uma análise de PCR quantitativo para verificar número de cópias do inserto de T-DNA, apenas plantas transgênicas de cópia única que exibem tolerância ao agente de seleção foram mantidas para colheita de semente T1. Sementes foram então coletadas três a cinco meses depois de transplante. O método produziu transformantes de locus único em uma taxa de até 50% (Aldemita and Hodgesl996, Chan et ai. 1993, Hiei et al. 1994).Approximately 35 independent T0 rice transformants were generated for one construction. Primary transformants were transferred from a tissue crop camera to a greenhouse. After a quantitative PCR analysis to verify copy number of the T-DNA insert, only single copy transgenic plants exhibiting tolerance to the selection agent were maintained for T1 seed harvest. Seeds were then collected three to five months after transplantation. The method produced single locus transformants at a rate of up to 50% (Aldemita and Hodges 1996, Chan et al. 1993, Hiei et al. 1994).

Para transformação de outras safras veja Exemplo 40. Exemplo 8: Métodos de avaliação de plantas transformada com SYR sob o controle do promotor GOS2 de arroz ou do promotor HMGPFor transformation of other crops see Example 40. Example 8: Methods of evaluating SYR-transformed plants under the control of the rice GOS2 promoter or the HMGP promoter

Configuração de avaliaçãoTrial Configuration

Aproximadamente 15 a 20 transformantes TO de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação para crescimento e colheita de semente T1. Oito eventos, dos quais a progênie T1 segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas T1 contendo o transgene (hetero e homo-zigotos) e aproximadamente 10 plântulas T1 carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas T1 selecionadas foram transferidas para uma casa de vegetação. Cada planta recebeu uma etiqueta de código de barras exclusiva para ligar inequivocamente os dados de fenotipagem à planta correspondente. As plantas Tl selecionadas foram crescidas no solo em potes de 10 cm de diâmetro nas seguintes configurações ambientais: fotoperíodo= 11,5 h, intensidade de luz do dia= 30.000 lux ou mais, temperatura de dia= 28°C ou superior, temperatura de noite= 22°C, umidade relativa= 60-70%. Plantas transgênicas e os nulizigotos correspondentes foram crescidos lado a lado em posições aleatórias. Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um armário para formação de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.Approximately 15 to 20 independent TO transformants of rice were generated. Primary transformants were transferred from a tissue crop camera to a greenhouse for T1 seed growth and harvest. Eight events, of which T1 progeny segregated 3: 1 for presence / absence of transgene, were retained. For each of these events, approximately 10 T1 seedlings containing the transgene (hetero and homozygotes) and approximately 10 T1 seedlings lacking the transgene (nullizigotes) were selected by monitoring visual marker expression. The selected T1 plants were transferred to a greenhouse. Each plant received a unique barcode label to unambiguously link the phenotyping data to the corresponding plant. The selected Tl plants were grown in the soil in 10 cm diameter pots in the following environmental settings: photoperiod = 11.5 h, daylight intensity = 30,000 lux or more, day temperature = 28 ° C or higher, night = 22 ° C, relative humidity = 60-70%. Transgenic plants and the corresponding nullizigotes were grown side by side in random positions. From the sowing stage to the maturity stage the plants were passed several times through a cabinet for digital image formation. At each moment digital images (2048x1536 pixels, 16 million colors) were taken from each plant from at least 6 different angles.

Triagem de estresse salinoSaline Stress Screening

Plantas de 4 eventos (sementes T2) foram crescidas em um substrato feito de fibras de coco e argex (proporção de 3 para 1). Uma solução nutritiva normal foi usada durante as primeiras duas semanas depois de transplantar as plântulas na casa de vegetação. Depois das primeiras duas semanas, 25 mM de sal (NaCl) foi adicionado à solução nutritiva, até as plantas terem sido coletadas.4-event plants (T2 seeds) were grown on a substrate made of coconut and argex fibers (3 to 1 ratio). A normal nutrient solution was used for the first two weeks after transplanting the seedlings in the greenhouse. After the first two weeks, 25 mM salt (NaCl) was added to the nutrient solution until the plants were collected.

Triagem de secaDrought Screening

Plantas de cinco eventos (sementes T2) foram crescidas em solo de vaso em condições normais até elas atingirem o estágio de espigamento. Elas foram então transferidas para uma seção "seca" onde irrigação foi retida. Sondas de umidade foram inseridas em potes aleatoriamente escolhidos para monitorar o teor de água no solo (SWC). Quando SWC passou abaixo de certos limites, as plantas foram automaticamente re-irrigadas continuamente até que um nível normal fosse atingido novamente. As plantas foram então re-transferidas novamente para condições normais. O resto do cultivo (maturação de planta, coleta de semente) foi o mesmo que para plantas não crescidas em condições de estresse abiótico. Uma sessão de confirmação foi realizada consistindo de repetir a triagem com sementes T2 não coletadas de plantas da primeira triagem de seca, mas de plantas crescidas em condições normais.Five-event plants (T2 seeds) were grown in pot soil under normal conditions until they reached the spike stage. They were then transferred to a "dry" section where irrigation was retained. Moisture probes were inserted into randomly selected pots to monitor soil water content (SWC). When SWC passed below certain limits, the plants were automatically re-irrigated continuously until a normal level was reached again. The plants were then re-transferred to normal conditions. The rest of the crop (plant maturation, seed collection) was the same as for plants not grown under abiotic stress conditions. A confirmation session was carried out consisting of repeating the screening with T2 seeds not collected from plants of the first drought, but from plants grown under normal conditions.

Parâmetros medidosMeasured Parameters

A parte aérea de planta (ou biomassa de folhas) foi determinada contando o número total de pixéis nas imagens digitais de partes aéreas de planta discriminado do fundo. Foi tirada a média deste valor para as fotos tiradas no mesmo momento dos ângulos diferentes e foi convertido para um valor de superfície física expresso em mm quadrados por calibração. Experimentos mostram que a parte aérea de planta medida desta maneira se correlaciona com a biomassa de partes aéreas de planta. A Areamax é a parte aérea no momento no qual a planta atingiu sua biomassa de folhas máxima.Plant shoot (or leaf biomass) was determined by counting the total number of pixels in the plant shoot digital images broken down from the background. This value was averaged for photos taken at the same time from different angles and converted to a physical surface value expressed in mm squared by calibration. Experiments show that the plant shoot measured in this way correlates with the plant shoot biomass. Areamax is the shoot at the moment the plant reached its maximum leaf biomass.

As panículas primárias maduras foram coletadas, ensacadas, etiquetadas com código de barras e então secas por três dias no forno a 37°C. As panículas foram então trilhadas e todas as sementes coletadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. Depois de separação, ambos os lotes de sementes foram então contados usando uma máquina de contagem disponível comercialmente. As cascas vazias foram descartadas. As cascas cheias foram pesadas em uma balança analítica e a área seccional cruzada das sementes foi medida usando formação de imagem digital. Este procedimento resultou no conjunto dos seguintes parâmetros relacionados a sementes:The mature primary panicles were collected, bagged, bar-coded and then oven dried at 37 ° C for three days. The panicles were then traced and all seeds collected. The full shells were separated from the empty shells using an air blowing device. After separation, both seed lots were then counted using a commercially available counting machine. The empty shells were discarded. The full shells were weighed on an analytical balance and the cross sectional area of the seeds was measured using digital imaging. This procedure resulted in the set of the following seed related parameters:

As flores por panícula estimam o número médio de floretes por panícula em uma planta, derivado do número de sementes total dividido pelo número de primeiras panículas. A panícula mais alta e todas as panículas que se sobrepõe com a panícula mais alta quando alinhadas verticalmente, foram consideradas as primeiras panículas e foram contadas manualmente. O número de grãos cheios foi determinado contando the número de cascas cheias que permaneceram depois da etapa de separação. A produção total de sementes (peso total de semente) foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta e corresponde ao número de floretes por planta. Peso de Mil Sementes (TKW) é extrapolado a partir do número de grãos cheios contadas e seu peso total. índice de colheita é definido como a proporção entre o peso total de semente e a área superficial (mm2), multiplicada por um fator 10^6. O parâmetro EmerVigor é uma indicação do vigor de plântula. Ele é calculado a partir da área (em mm2) coberta por biomassa de folhas na primeira formação de imagem. A taxa de enchimento de sementes (taxa de enchimento) é uma indicação do preenchimento das sementes. Ela é expressa como uma proporção (em%) do número de grãos cheios pelo número de floretes (no. total de sementes).Panicle flowers estimate the average number of rapiers per panicle in a plant, derived from the total number of seeds divided by the number of first panicles. The highest panicle and all panicles that overlap with the highest panicle when vertically aligned were considered the first panicles and were counted manually. The number of full grains was determined by counting the number of full husks that remained after the separation step. Total seed yield (total seed weight) was measured by weighing all full bark collected from a plant. Total number of seeds per plant was measured by counting the number of bark collected from a plant and corresponds to the number of rapiers per plant. Thousand Seed Weight (TKW) is extrapolated from the number of full grains counted and their total weight. Harvest index is defined as the ratio of total seed weight to surface area (mm2) multiplied by a factor 10 ^ 6. The EmerVigor parameter is an indication of seedling vigor. It is calculated from the area (in mm2) covered by leaf biomass in the first imaging. Seed filling rate (filling rate) is an indication of seed filling. It is expressed as a ratio (in%) of the number of filled grains by the number of rapiers (in total seeds).

Estes parâmetros foram derivados de uma maneira automatizada a partir das imagens digitais usando aplicativo computacional de análise de imagem e foram analisados estatisticamente. Parâmetros individuais de sementes (incluindo largura, comprimento, área, peso) foram medidos usando um dispositivo feito sob encomenda consistindo de dois componentes principais, um dispositivo de pesagem e formação de imagem, acoplado a aplicativo computacional para análise de imagem.These parameters were derived in an automated manner from digital images using computational image analysis application and were statistically analyzed. Individual seed parameters (including width, length, area, weight) were measured using a custom device consisting of two main components, a weighing and imaging device coupled with a computer application for image analysis.

Exemplo 9: mensuração de parâmetros relacionados a produção para transformantes pGOS2::SYR crescidos em condições normais de crescimento:Example 9: Measurement of production related parameters for pGOS2 :: SYR transformants grown under normal growing conditions:

Mediante análise das sementes como descrito acima, os requerentes encontraram que plantas transformada com a construção gênica pGOS2::STR tiveram uma maior produção de sementes, expressa como número de grãos cheios, peso total de sementes e índice de colheita, comparado com plantas carecendo do transgene SYR. Os valores de ρ mostram que os aumentos foram significantes. Métodos para análise estatística são como dados na seção introdutória para os Exemplos.Through seed analysis as described above, applicants found that plants transformed with the pGOS2 :: STR gene construct had a higher seed yield, expressed as number of full grains, total seed weight and harvest index, compared to plants lacking transgene SYR. The values of ρ show that the increases were significant. Methods for statistical analysis are as given in the introductory section for the Examples.

Os resultados obtidos para plantas na geração Tl estão resumidos Tabela E, a qual representa os valores médios para todas as linhagens testadas:The results obtained for plants in generation T1 are summarized in Table E, which represents the mean values for all tested strains:

Tabela E:Table E:

<table>table see original document page 206</column></row><table><table> table see original document page 206 </column> </row> <table>

Os dados obtidos para SYR no primeiro experimento foram confirmados em um segundo experimento com plantas T2. Quatro linhagens que tiveram o padrão de expressão correto foram selecionadas para análise adicional. Grupos de sementes das plantas positivas (tanto hetero como homozigotas) em Tl foram triados monitorando expressão de marcador. Para cada evento escolhido, os grupos de sementes heterozigotas foram então retidos para avaliação de T2. Dentro de cada grupo de sementes um número igual de plantas positivas e negativas foi crescido na casa de vegetação para avaliação. Mensuração dos parâmetros de produção de sementes novamente mostrou aumento em número de grãos cheios, peso total de sementes e índice de colheita, comparado com plantas carecendo do transgene S YR.The data obtained for SYR in the first experiment were confirmed in a second experiment with T2 plants. Four strains that had the correct expression pattern were selected for further analysis. Seed groups of positive plants (both hetero and homozygous) in T1 were screened by monitoring marker expression. For each chosen event, the heterozygous seed groups were then retained for T2 evaluation. Within each seed group an equal number of positive and negative plants were grown in the greenhouse for evaluation. Measurement of seed yield parameters again showed increase in full grain number, total seed weight and harvest index compared to plants lacking the S YR transgene.

Exemplo 10: mensuração de parâmetros relacionados a produção para transformantespGOS2::SYR crescidas em condições de estresse:Example 10: Measurement of production-related parameters for transformantspGOS2 :: SYR grown under stress conditions:

Mediante análise das sementes como descrito acima, os requerentes encontraram que plantas transformadas com a construção gênica pGOS2 ::SYR e crescidas sob estresse salino, tiveram uma maior produção de sementes, expressa como número de grãos cheios, peso total de sementes, taxa de enchimento e índice de colheita, comparada com plantas carecendo do transgene SYR. Além disso, estas plantas sal-estressadas tiveram um maior vigor de plântula comparado com as plantas de controle. Quando as plantas foram crescidas sob estresse por seca, as plantas transgênicas tiveram um maior peso total de sementes e um índice de colheita aumentado comparado com plantas carecendo do transgene SYR. Estas diferenças foram significantes, com um valor de P do teste F abaixo de 0,05.Through seed analysis as described above, applicants found that plants transformed with the pGOS2 :: SYR gene construct and grown under saline stress had a higher seed yield, expressed as number of full grains, total seed weight, fill rate. and harvest index, compared to plants lacking the SYR transgene. In addition, these salt-stressed plants had a higher seedling vigor compared to control plants. When the plants were grown under drought stress, the transgenic plants had a higher total seed weight and an increased harvest index compared to plants lacking the SYR transgene. These differences were significant, with a P-value of test F below 0.05.

Exemplo 11: mensuração de parâmetros relacionados a produção para transformantes pH MGP:: SYR:Example 11: Measurement of Production-Related Parameters for MGP :: SYR: pH Transformants

Similarmente como para as plantas transformadas com a construção gênica pGOS2::SYR, os requerentes encontraram que plantas transformadas com a construção gênica pH MGP::SYR tiveram uma maior produção de sementes, expressa como número de grãos cheios, peso total de sementes e índice de colheita, comparada com plantas carecendo do transgene SYR. Os valores de ρ mostram que os aumentos foram significantes.Similarly as for plants transformed with the pGOS2 :: SYR gene construct, applicants have found that plants transformed with the pH MGP :: SYR gene construct had a higher seed yield, expressed as full grain number, total seed weight and index. compared to plants lacking the SYR transgene. The values of ρ show that the increases were significant.

Os resultados obtidos para plantas na geração Tl estão resumidos Tabela F, a qual representa os valores médios para todas as linhagens testadas:The results obtained for plants in generation T1 are summarized in Table F, which represents the mean values for all strains tested:

Tabela F:Table F:

<table>table see original document page 207</column></row><table><table> table see original document page 207 </column> </row> <table>

EXEMPLO B: FG-GAPEXAMPLE B: FG-GAP

Exemplo 12: Identificação de seqüências relacionadas a SEQID NO: 45 e SEQID NO: 46Example 12: Identification of Sequences Related to SEQID NO: 45 and SEQID NO: 46

Seqüências (cDNA de comprimento completo, ESTs ou genômicas) relacionadas a SEQ ID NO: 45 e/ou seqüências de proteínas relacionadas a SEQ ID NO: 46 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et ai. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa foi usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de seqüências e calculando a significância estatística de identidades. O polipeptídeo codificado por SEQ ID NO: 45 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar contrapeso de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade de porcentagem. Identidade de porcentagem se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas em um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.Sequences (full length cDNA, ESTs or genomic) related to SEQ ID NO: 45 and / or protein sequences related to SEQ ID NO: 46 were identified among those maintained in the Entrez Nucleotides database at the National Center for Biotechnology Information (NCBI) ) using database sequence search tools such as the Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215: 403-410; and Altschul et al. (1997 ) Nucleic Acids Res. 25: 3389-3402). The program was used to find regions of local similarity between sequences by comparing nucleic acid or polypeptide sequences with sequence database and calculating the statistical significance of identities. The polypeptide encoded by SEQ ID NO: 45 was used for the TBLASTN algorithm, with default settings and the filter to bypass low complexity sequence counterweight. The result of the analysis was viewed by paired comparison, and ranked according to the probability score (E value), where the score reflects the likelihood that a particular alignment will occur at random (the lower the E value, the more significant the hit). . In addition to E values, comparisons were also scored by percentage identity. Percentage identity refers to the number of identical nucleotides (or amino acids) between the two nucleic acid (or polypeptide) sequences compared at a particular length. In some instances, the default parameters may be adjusted to modify the search stringency.

Em adição às seqüências de ácidos nucleicos disponíveis publicamente disponíveis em NCBI, outros bancos de dados de seqüências também podem ser buscados seguindo o mesmo procedimento que descrito acima.In addition to the publicly available nucleic acid sequences available from NCBI, other sequence databases can also be searched by following the same procedure as described above.

Tabela G fornece uma lista de seqüências de ácidos nucleicos e proteínas relacionadas à seqüência de ácidos nucleicos como representada por SEQ ID NO: 45 e à seqüência de proteínas representada por SEQ ID NO: 46. Tabela G: Seqüências de ácidos nucleicos relacionadas à seqüência de ácidos nucleicos (SEQ ID NO: 45) úteis nos métodos da presente invenção, e os polipeptídeos deduzidos correspondentes.Table G provides a list of nucleic acid and protein sequences related to the nucleic acid sequence as represented by SEQ ID NO: 45 and the protein sequence represented by SEQ ID NO: 46. Table G: Nucleic acid sequences related to the sequence nucleic acids (SEQ ID NO: 45) useful in the methods of the present invention, and the corresponding deduced polypeptides.

<table>table see original document page 209</column></row><table><table> table see original document page 209 </column> </row> <table>

Exemplo 13: Alinhamento de seqüências de polipeptídeos relevantesExample 13: Alignment of Relevant Polypeptide Sequences

AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo de Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados).Vector Nign AlignX (Invitrogen) is based on the popular Clustal progressive alignment algorithm (Thompson et al. (1997) Nucleic Acids Res 25: 4876-4882; Chenna et al. (2003). Nucleic Acids Res 31: 3497-3500 ). A phylogenetic tree can be constructed using a neighbor grouping algorithm. Default values are for gap gap penalty of 10, gap gap penalty of 0.1 and the selected weight matrix is Blosum 62 (if polypeptides are aligned).

O resultado do alinhamento múltiplo de seqüências usando polipeptídeos relevantes para identificar aqueles úteis para realizar os métodos da invenção é mostrado em Figura 7. Qualquer um pode ver claramente que apesar de algumas lacunas no alinhamento, conservação de seqüência é encontrada ao longo da maioria da seqüência de proteínas.The result of multiple sequence alignment using relevant polypeptides to identify those useful for carrying out the methods of the invention is shown in Figure 7. One can clearly see that despite some alignment gaps, sequence conservation is found throughout most of the sequence. of proteins.

Exemplo 14: Cálculo de identidade de porcentagem global entre seqüências de polipeptídeos úteis para realizar os métodos da invençãoExample 14: Calculation of Global Percentage Identity Between Polypeptide Sequences Useful for Carrying Out the Methods of the Invention

Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein ou DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha divisora e identidade de seqüências é mostrada na metade de cima da linha divisora diagonal.Overall percentages of similarity and identity between full-length polypeptide sequences useful for carrying out the methods of the invention were determined using one of the methods available in the art, the MatGAT (BMC Bioinformatics. 2003 4:29) computer application. MatGAT: An application that generates similarity / identity matrices using protein or DNA sequences (Campanella JJ, Bitincka L, Smalley J; Ledion Bitincka hosted computer application). MatGAT computational application generates similarity / identity matrices for DNA or protein sequences without pre-alignment of data. The program performs a series of paired alignments using the Myers and Miller global alignment algorithm (with a gap opening penalty of 12, and a gap length penalty of 2), calculating similarity and identity using for example Blosum 62 ( for polypeptides), and then put the results into a distance matrix. Sequence similarity is shown in the lower half of the dividing line and sequence identity is shown in the upper half of the diagonal dividing line.

Parâmetros usados na comparação foram: Matriz de pontuação: Blosum62 PrimeiraLacuna: 12 Lacuna de extensão: 2Parameters used in the comparison were: Score Matrix: Blosum62 FirstGap: 12 Extension Gap: 2

Resultados da análise de aplicativo computacional são mostrados em Tabela H para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos (excluindo as seqüências de polipeptídeos parciais). Identidade de porcentagem é dada acima da diagonal e similaridade de porcentagem é dada abaixo da diagonal.Results of the computational application analysis are shown in Table H for similarity and overall identity at full length of polypeptide sequences (excluding partial polypeptide sequences). Percentage identity is given above the diagonal and percentage similarity is given below the diagonal.

A identidade de porcentagem entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 17% de identidade de aminoácidos comparada com SEQ ID NO: 46. Tabela H: Resultados de MatGAT para similaridade e identidade global no comprimento completo das seqüências de polipeptídeos.Percentage identity between polypeptide sequences useful for carrying out the methods of the invention may be as low as 17% amino acid identity compared to SEQ ID NO: 46. Table H: MatGAT Results for Similarity and Overall Identity at Full Length of polypeptide sequences.

<formula>formula see original document page 211</formula><formula> formula see original document page 211 </formula>

Exemplo 15: Identificação de domínios compreendidos em seqüências de polipeptídeos úteis para realizar os métodos da invençãoExample 15: Identification of domains comprised of polypeptide sequences useful for carrying out the methods of the invention.

O banco de dados Integrated Resource of Protein Families, Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica sobre proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no European Bioinformatics Institute no Reino Unido.The Integrated Resource of Protein Families, Domains and Sites (InterPro) database is an integrated interface for signature databases commonly used for text and string-based searches. The InterPro database combines these databases, which use different methodologies and varying degrees of well-characterized protein biological information to derive protein signatures. Collaborating databases include SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom and Pfam, Smart and TIGRFAMs. Interpro is hosted at the European Bioinformatics Institute in the United Kingdom.

Os resultados da varredura de InterPro da seqüência de polipeptídeos como representada por SEQ ID NO: 46 são apresentados em Tabela I.InterPro scan results of the polypeptide sequence as represented by SEQ ID NO: 46 are presented in Table I.

Tabela I: Resultados de varredura de InterPro da seqüência de polipeptídeos como representada por SEQ ID NO: 46Table I: InterPro Scan Results of Polypeptide Sequence as Represented by SEQ ID NO: 46

<table>table see original document page 212</column></row><table><table> table see original document page 212 </column> </row> <table>

Exemplo 16: Previsão de topologia das seqüências de polipeptídeos úteis para realizar os métodos da invençãoExample 16: Topology Prediction of Polypeptide Sequences Useful for Carrying Out the Methods of the Invention

TargetP 1.1 prevê a localização subcelular de proteínas eucariotas. A designação de localização é baseada na presença prevista de qualquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Escores nos quais a previsão final está baseada não são probabilidades reais, e eles não necessariamente adicionam a um. Entretanto, a localização com o maior escore é a mais provável de acordo com TargetP, e a relação entre os escores (a classe de confiança) pode ser uma indicação de quão certa é a previsão. A classe de confiança (RC) varia de 1 a 5, onde 1 indica a previsão mais forte. TargetP é mantido no servidor da Technical University of Denmark.TargetP 1.1 predicts the subcellular localization of eukaryotic proteins. The location designation is based on the expected presence of any of the N-terminal pre-sequences: chloroplast transit peptide (cTP), mitochondrial targeting peptide (mTP) or secretory pathway signal peptide (SP). Scores on which the final forecast is based are not real probabilities, and they do not necessarily add to one. However, the location with the highest score is most likely according to TargetP, and the relationship between the scores (the confidence class) may be an indication of how accurate the prediction is. Confidence class (RC) ranges from 1 to 5, where 1 indicates the strongest forecast. TargetP is maintained on the server of the Technical University of Denmark.

Para as seqüências previstas conterem uma pré-seqüência N- terminal um sítio de clivagem potencial também pode ser previsto.For predicted sequences to contain an N-terminal pre-sequence a potential cleavage site may also be predicted.

Diversos parâmetros foram selecionados, tal como grupo de organismo (não vegetal ou vegetal), conjuntos de atalhos (nenhum, conjunto pré-defmido de atalhos, ou conjunto de atalhos especificado por usuário), e o cálculo de previsão de sítios de clivagem (sim ou não).Several parameters were selected, such as organism group (non-plant or plant), shortcut sets (none, predefined shortcut set, or user-specified shortcut set), and cleavage site prediction calculation (yes or not).

Os resultados de análise TargetP 1.1 da seqüência de polipeptídeos como representada por SEQ ID NO: 46 são apresentados em Tabela J. O grupo de organismo "vegetal" foi selecionado, nenhum atalho definido, e o comprimento previsto do peptídeo de trânsito requisitado. A localização subcelular da seqüência de polipeptídeos como representada por SEQ ID NO: 46 provavelmente não é intracelular, existe uma leve preferência pela via secretora (embora com um escore de confiança de 5) e o comprimento previsto do peptídeo de trânsito putativo é de 24 aminoácidos começando do término N (não tão confiável quanto à previsão da própria localização subcelular, pode variar em comprimento de uns poucos aminoácidos).TargetP 1.1 analysis results of the polypeptide sequence as represented by SEQ ID NO: 46 are presented in Table J. The "plant" organism group was selected, no shortcuts defined, and the predicted length of the requested transit peptide. The subcellular location of the polypeptide sequence as represented by SEQ ID NO: 46 is probably not intracellular, there is a slight preference for the secretory pathway (although with a reliable score of 5) and the predicted putative transit peptide length is 24 amino acids. starting from the N-terminus (not as reliable as predicting the subcellular location itself, may vary in length from a few amino acids).

Tabela J: Análise TargetP 1.1 da seqüência de polipeptídeos como representada por SEQ ID NO: 46Table J: TargetP 1.1 Analysis of Polypeptide Sequence as Represented by SEQ ID NO: 46

<table>table see original document page 213</column></row><table><table> table see original document page 213 </column> </row> <table>

Quando analisada com SignalP (Bendtsen et al., J. Mol. Biol., 340:783-795, 2004), existe uma identificação positiva confiável (probabilidade de 0.998) para a presença de um peptídeo sinal de secreção N- terminal com um comprimento de 24 aminoácidos. Além disso, quando usando o algoritmo THMM (Center for Biological Sequence Analysis, Technical University of Denmark), a proteína é prevista ser localizada no lado exterior da célula com apenas uma cauda C-terminal no citoplasma: resíduos 1-859: fora; resíduos 860-879: domínio transmembrana, resíduos 880-896: dentro.When analyzed with SignalP (Bendtsen et al., J. Mol. Biol., 340: 783-795, 2004), there is a reliable positive identification (probability of 0.998) for the presence of an N-terminal secretion signal peptide with a 24 amino acid in length. In addition, when using the Center for Biological Sequence Analysis, Technical University of Denmark (THMM) algorithm, the protein is predicted to be located on the outside of the cell with only one C-terminal tail in the cytoplasm: residues 1-859: outside; residues 860-879: transmembrane domain, residues 880-896: within.

Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:Many other algorithms can be used to perform such analyzes, including:

• ChloroP 1.1 hospedado no servidor do Technical University of Denmark;• ChloroP 1.1 hosted on the Technical University of Denmark server;

• Protein Prowler Subcellular Localisation Predictor versão 1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia; • PENCE Proteome Analyst PA-GOSUB 2.5 hospedado no servidor da University of Alberta, Edmonton, Alberta, Canada;• Protein Prowler Subcellular Localization Predictor version 1.2 hosted on the Institute for Molecular Bioscience server, University of Queensland, Brisbane, Australia; • PENCE Proteome Analyst PA-GOSUB 2.5 hosted on the University of Alberta server, Edmonton, Alberta, Canada;

Exemplo 17: Clonagem de geneExample 17: Gene Cloning

O gene FG-GAP de Arabidopsis thaliana foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântula de Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído de plântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio de inserto do banco foi de 1,5 kb e o número original de clones foi da ordem de 1,59 x 10^7 cfu. Título original foi determinado como sendo 9,6 x 10^5 cfu/ml depois de primeira amplificação de 6 x 10^11 cfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μl. Iniciadores prm06643 (SEQ ID NO: 47; sentido, códon de início em negrito, sítio AttBl em itálico: 5'- ggggacaagtttgtacaaaaaagcaggcttaaacaatgaaatctcgagcgagg-3') e prm06644 (SEQ ID NO: 48; reverso, complementar, sítio AttB2 em itálico: 5'- ggggaccactttgtacaagaaagctgggtcctg tttacagatggtacctagt-3'), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR de 3,2 kb (incluindo sítios attB) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada", pFG-GAP. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.The Arabidopsis thaliana FG-GAP gene was PCR amplified using a template of an Arabidopsis thaliana seedling cDNA library (Invitrogen, Paisley, UK). After reverse transcription of seedling-extracted RNA, cDNAs were cloned into pCMV Sport 6.0. Average bank insert size was 1.5 kb and the original number of clones was on the order of 1.59 x 10 7 cfu. Original titer was determined to be 9.6 x 10 5 cfu / ml after first amplification of 6 x 10 11 cfu / ml. After plasmid extraction, 200 ng of template were used in a 50 μl PCR mix. Primers prm06643 (SEQ ID NO: 47; sense, bold start codon, AttBl site in italics: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaaatctcgagcgagg-3 ') and prm06644 (SEQ ID no: 48; reversed Att: 2 - ggggaccactttgtacaagaaagctgggtcctg tttacagatggtacctagt-3 '), which include AttB sites for Gateway recombination, were used for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. A 3.2 kb PCR fragment (including attB sites) was amplified and purified using standard methods as well. The first step of the Gateway procedure, the BP reaction, was then performed, during which the PCR fragment recombines in vivo with plasmid pDONR201 to produce, according to Gateway terminology, an "input clone", pFG-GAP. . Plasmid pDONR201 was purchased from Invitrogen as part of Gateway® technology.

Exemplo 18: Construção de VetorExample 18: Vector Construction

O clone de entrada pFG-GAP foi subseqüentemente usado em uma reação LR com pGOS2, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (nucleotídeos 1 a 2193 de SEQ ID NO: 49, a combinação promotor-gene) para expressão constitutiva foi localizado antes desta gaveta Gateway.The pFG-GAP input clone was subsequently used in an LR reaction with pGOS2, a destination vector used for Oryza sativa transformation. This vector contains as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and a Gateway drawer intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. A rice GOS2 promoter (nucleotides 1 through 2193 of SEQ ID NO: 49, the promoter-gene combination) for constitutive expression was located prior to this Gateway cassette.

Depois da etapa de recombinação LR, o vetor de expressão resultante, pGOS2::FG-GAP para FG-GAP (Figura 7) foi transformado em linhagem LBA4044 de Agrobacterium e subseqüentemente para plantas de Oryza sativa. Plantas transformadas de arroz foram permitidas crescer e foram então avaliadas para os parâmetros descritos em Exemplo 19.After the LR recombination step, the resulting expression vector, pGOS2 :: FG-GAP for FG-GAP (Figure 7) was transformed into Agrobacterium strain LBA4044 and subsequently to Oryza sativa plants. Transformed rice plants were allowed to grow and were then evaluated for the parameters described in Example 19.

Para transformação de outras safras veja Exemplo 40. Exemplo 19: Métodos de avaliação para plantas transformadas com FG- GAP sob o controle do promotor GOS2 de arrozFor transformation of other crops see Example 40. Example 19: Evaluation methods for FG-GAP transformed plants under the control of the GOS2 rice promoter

Aproximadamente 15 a 20 transformantes T0 de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação para crescimento e colheita de semente T1. Sete eventos, dos quais a progênie T1 segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas T1 contendo o transgene (hetero e homo-zigotas) e aproximadamente 10 plântulas T1 carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas T1 selecionadas foram transferidas para uma casa de vegetação. Cada planta recebeu uma etiqueta com código de barras exclusivo para ligar inequivocamente os dados de fenotipagem à planta correspondente. As plantas T1 selecionadas foram crescidas no solo em potes de 10 cm de diâmetro nas seguintes configurações ambientais: fotoperíodo= 11,5 h, intensidade de luz do dia= 30.000 lux ou mais, temperatura de dia= 28°C ou superior, temperatura de noite= 22°C, umidade relativa= 60-70%. Plantas transgênicas e os nulizigotos correspondentes foram crescidos lado a lado em posições aleatórias. Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabine de formação de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.Approximately 15 to 20 independent T0 rice transformants were generated. Primary transformants were transferred from a tissue crop camera to a greenhouse for T1 seed growth and harvest. Seven events, of which T1 progeny segregated 3: 1 for presence / absence of transgene, were retained. For each of these events, approximately 10 T1 seedlings containing the transgene (hetero and homozygotes) and approximately 10 T1 seedlings lacking the transgene (nullizigotes) were selected by monitoring visual marker expression. The selected T1 plants were transferred to a greenhouse. Each plant was given a unique barcode label to unambiguously link the phenotyping data to the corresponding plant. The selected T1 plants were grown in the soil in pots of 10 cm in diameter in the following environmental settings: photoperiod = 11.5 h, daylight intensity = 30,000 lux or more, day temperature = 28 ° C or higher, night = 22 ° C, relative humidity = 60-70%. Transgenic plants and the corresponding nullizigotes were grown side by side in random positions. From the sowing stage to the maturity stage the plants were passed several times through a digital imaging booth. At each moment digital images (2048x1536 pixels, 16 million colors) were taken from each plant from at least 6 different angles.

A parte aérea de planta (ou biomassa de folhas) foi determinada contando o número total de pixéis nas imagens digitais de partes vegetais superficiais discriminado a partir do fundo. Foi tirada a média deste valor para as fotos tiradas no mesmo momento dos ângulos diferentes e foi convertido para um valor de superfície física expresso em mm quadrados por calibração. Experimentos mostram que a parte aérea de planta medida desta maneira se correlaciona com a biomassa de partes aéreas de planta. A Areamax é a parte aérea no momento no qual a planta atingiu sua biomassa de folhas máxima.Plant shoot (or leaf biomass) was determined by counting the total number of pixels in the digital images of surface plant parts broken down from the bottom. This value was averaged for photos taken at the same time from different angles and converted to a physical surface value expressed in mm squared by calibration. Experiments show that the plant shoot measured in this way correlates with the plant shoot biomass. Areamax is the shoot at the moment the plant reached its maximum leaf biomass.

As panículas primárias maduras foram coletadas, ensacadas, etiquetadas com código de barras e então secas por três dias no forno a 37°C. As panículas foram então trilhadas e todas as sementes coletadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. Depois de separação, ambos os lotes de sementes foram então contados usando uma máquina de contagem disponível comercialmente. As cascas vazias foram descartadas. As cascas cheias foram pesadas em uma balança analítica e a área seccional cruzada das sementes foi medida usando formação de imagem digital. Este procedimento resultou no conjunto dos seguintes parâmetros relacionados a sementes:The mature primary panicles were collected, bagged, bar-coded and then oven dried at 37 ° C for three days. The panicles were then traced and all seeds collected. The full shells were separated from the empty shells using an air blowing device. After separation, both seed lots were then counted using a commercially available counting machine. The empty shells were discarded. The full shells were weighed on an analytical balance and the cross sectional area of the seeds was measured using digital imaging. This procedure resulted in the set of the following seed related parameters:

As flores por panícula é um parâmetro estimando o número médio de floretes por panícula em uma planta, derivado do número de sementes total dividido pelo número de primeiras panículas. A panícula mais alta e todas as panículas que se sobrepõe com a panícula mais alta quando alinhadas verticalmente, foram consideradas as primeiras panículas e foram contadas manualmente. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. A produção total de sementes (peso total de semente) foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta e corresponde ao número de floretes por planta. Peso de Mil Sementes (TKW) é extrapolado a partir do número de grãos cheios contadas e seu peso total. índice de colheita é definido como a proporção entre o peso total de semente e a área superficial (mm2), multiplicada por um fator IO6. Estes parâmetros foram derivados de uma maneira automatizada a partir das imagens digitais usando aplicativo computacional de análise de imagem e foram analisados estatisticamente. Parâmetros individuais de sementes (incluindo largura, comprimento, área, peso) foram medidos usando um dispositivo feito sob encomenda consistindo de dois componentes principais, um dispositivo de pesagem e formação de imagem, acoplado a aplicativo computacional para análise de imagem.Flowers per panicle is a parameter estimating the average number of rapiers per panicle in a plant, derived from the total number of seeds divided by the number of first panicles. The highest panicle and all panicles that overlap with the highest panicle when vertically aligned were considered the first panicles and were counted manually. The number of full grains was determined by counting the number of full husks that remained after the separation step. Total seed yield (total seed weight) was measured by weighing all full bark collected from a plant. Total number of seeds per plant was measured by counting the number of bark collected from a plant and corresponds to the number of rapiers per plant. Thousand Seed Weight (TKW) is extrapolated from the number of full grains counted and their total weight. Harvest index is defined as the ratio of total seed weight to surface area (mm2), multiplied by a factor of 106. These parameters were derived in an automated manner from digital images using computational image analysis application and were statistically analyzed. Individual seed parameters (including width, length, area, weight) were measured using a custom device consisting of two main components, a weighing and imaging device coupled with a computer application for image analysis.

Uma ANOVA de dois fatores (análises de variância) corrigida para o modelo não equilibrado foi usada como modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com aquele gene. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e para verificar por um efeito geral do gene, também referido neste lugar como um "efeito gênico global". Se o valor do teste F mostrou que os dados foram significantes, então foi concluído que houve um efeito "gênico", significando que não foi apenas presença ou a posição do gene que estava causando o efeito. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em um nível de probabilidade de 5% para o teste F. Para verificar por um efeito dos genes dentro de um evento, i.e., por um efeito linhagem específico, um teste t foi realizado dentro de cada evento usando conjuntos de dados das plantas transgênicas e das plantas nulas correspondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" se referem a plantas tratadas da mesma maneira que a planta transgênica, mas das quais o transgene foi segregado. Plantas nulas também podem ser descritas como as plantas transformadas negativas homozigotas. O limiar para significância para o teste t foi ajustado em um nível de probabilidade de 10%. Os resultados para alguns eventos podem estar acima ou abaixo deste limiar. Isto é baseado na hipótese de que um gene pode apenas ter um efeito em certas posições no genoma, e que a ocorrência deste efeito dependente de posição não é comum. Este tipo de efeito gênico é também referido neste lugar como um "efeito de linhagem do gene". O valor de ρ foi obtido comparando o valor de t com a distribuição de t ou alternativamente, comparando o valor de F com a distribuição de F. O valor de ρ então gera a probabilidade de que a hipótese nula (i.e., que não existe nenhum efeito do transgene) esteja correta.A two-way ANOVA (analysis of variance) corrected for the unbalanced model was used as a statistical model for the general evaluation of plant phenotypic characteristics. An F test was performed on all measured parameters of all plants of all events transformed with that gene. The F test was performed to check for a gene effect on all transformation events and to check for a general gene effect, also referred to here as a "global gene effect". If the value of the F test showed that the data were significant, then it was concluded that there was a "gene" effect, meaning that it was not just the presence or position of the gene that was causing the effect. The threshold for significance for a true global gene effect was set at a 5% probability level for the F test. To verify for an effect of genes within an event, ie, for a specific lineage effect, a t test was performed. within each event using data sets of the transgenic plants and the corresponding null plants. "Null plants" or "null segregants" or "nullizigotes" refer to plants treated in the same manner as the transgenic plant but from which the transgene has been secreted. Null plants can also be described as negative transformed homozygous plants. The threshold for significance for the t-test was set at a 10% probability level. Results for some events may be above or below this threshold. This is based on the hypothesis that a gene can only have an effect on certain positions in the genome, and that the occurrence of this position-dependent effect is not common. This type of gene effect is also referred to here as a "gene lineage effect". The value of ρ was obtained by comparing the value of t with the distribution of t or alternatively by comparing the value of F with the distribution of F. The value of ρ then generates the probability that the null hypothesis (ie, that there is no transgene effect) is correct.

Os dados obtidos para FG-GAP no primeiro experimento foram confirmados em um segundo experimento com plantas T2. Quatro linhagens foram selecionadas para análise adicional. Grupos de sementes das plantas positivas (tanto hetero como homozigotas) em TI, foram triados monitorando expressão de marcador. Para cada evento escolhido, os grupos de sementes heterozigotas foram então retidos para avaliação de T2. Dentro de cada grupo de sementes um número igual de plantas positivas e negativas foi crescido na casa de vegetação para avaliação.The data obtained for FG-GAP in the first experiment were confirmed in a second experiment with T2 plants. Four strains were selected for further analysis. Seed groups of positive plants (both hetero and homozygous) in IT were screened by monitoring marker expression. For each chosen event, the heterozygous seed groups were then retained for T2 evaluation. Within each seed group an equal number of positive and negative plants were grown in the greenhouse for evaluation.

Um número total de 120 plantas transformadas FG-GAP foi avaliado na geração T2, isto é 30 plantas por evento das quais 15 foram positivas para o transgene, e 15 negativas.A total of 120 FG-GAP transformed plants were evaluated in the T2 generation, ie 30 plants per event of which 15 were transgene positive and 15 negative.

Devido ao fato de dois experimentos com eventos sobrepostos terem sido realizados, uma análise combinada foi realizada. Isto é útil para verificar consistência dos efeitos sobre os dois experimentos, e se este é o caso, para acumular evidência de ambos experimentos a fim de aumentar confiança na conclusão. O método usado foi uma abordagem de modelo misturado que leva em consideração a estrutura multivariada dos dados (i.e. experimento - evento - segregantes). Valores de P foram obtidos comparando teste de proporção de probabilidade com distribuições qui quadrado. Exemplo 20: Avaliação de transformantes FG-GAP: mensuração de parâmetros relacionados a produçãoDue to the fact that two experiments with overlapping events were performed, a combined analysis was performed. This is useful for verifying consistency of effects on both experiments, and if so, for accumulating evidence from both experiments to increase confidence in the conclusion. The method used was a mixed model approach that takes into account the multivariate data structure (i.e. experiment - event - segregants). P values were obtained comparing probability ratio test with chi square distributions. Example 20: Evaluation of FG-GAP Transformants: Measurement of Production-Related Parameters

Mediante análise das sementes como descrito acima, os requerentes encontraram que plantas transformadas com a construção gênica FG-GAP tiveram uma maior produção de sementes, expressa como número de grãos cheios e peso total de sementes, comparado com plantas carecendo do transgene FG-GAP. Os valores de ρ mostram que os aumentos foram significantes. Também o índice de colheita foi aumentado (+9%).Through seed analysis as described above, the applicants found that plants transformed with the FG-GAP gene construct had a higher seed yield, expressed as full grain number and total seed weight, compared to plants lacking the FG-GAP transgene. The values of ρ show that the increases were significant. Also the harvest index was increased (+ 9%).

Os resultados obtidos para plantas na geração Tl estão resumidos Tabela K:The results obtained for plants in generation T1 are summarized. Table K:

Tabela K:Table K:

<table>table see original document page 219</column></row><table><table> table see original document page 219 </column> </row> <table>

Estes resultados positivos foram obtidos novamente na geração T2. Em Tabela L, dados mostram os aumentos gerais em% para o número de grãos cheios, peso total de sementes e índice de colheita, calculados a partir dos dados das linhagens individuais da geração T2, e os respectivos valores de p. Estes dados T2 foram reavaliados em uma análise combinada com os resultados para a geração T1, e os valores de ρ obtidos mostram que os efeitos observados foram altamente significantes. Tabela L:These positive results were obtained again in the T2 generation. In Table L, data show the overall increases in% for the number of full grains, total seed weight and harvest index, calculated from the data of individual T2 generation strains, and the respective p values. These T2 data were reassessed in a combined analysis with the T1 generation results, and the ρ values obtained show that the observed effects were highly significant. Table L:

<table>table see original document page 220</column></row><table><table> table see original document page 220 </column> </row> <table>

EXEMPLO C: CYP90BEXAMPLE C: CYP90B

Exemplo 21: Clonagem de gene de cDNA de CYP90B de Oryza sativaExample 21: Oryza sativa CYP90B cDNA Gene Cloning

O cDNA de CYP90B de Oryza sativa foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântula de Oryza sativa (Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído de plântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio de inserto do banco foi de 1,6 kb e o número original de clones foi da ordem de 1,67x107 cfu. Título original foi determinado como sendo 3,34 xlO° cfii/ml 10 depois de primeira amplificação de 6x1010 cfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μΐ. Iniciadores (SEQ ID NO: 107; sentido, códon de início em negrito, sítio AttBl em itálico: 5'Oryza sativa CYP90B cDNA was PCR amplified using a model Oryza sativa seedling cDNA library (Invitrogen, Paisley, UK). After reverse transcription of seedling-extracted RNA, cDNAs were cloned into pCMV Sport 6.0. Average bank insert size was 1.6 kb and the original number of clones was around 1.67x107 cfu. Original titer was determined to be 3.34 x 10 8 cfu / ml after the first amplification of 6 x 10 10 cfu / ml. After plasmid extraction, 200 ng of template were used in a 50 μΐ PCR mix. Primers (SEQ ID NO: 107; meaning, bold start codon, AttBl site in italics: 5 '

GGGGA CAA GTTTGTA CAAAAA A GCA GGCTTAAAC AATGGCCGCC ATG ATGGC 3') e (SEQ ID NO: 108; reverso, complementar, sítio AttB2 em itálico: 5' GGGGACCACTTTGTACAAGAAAGCTGGGT TTACTCCTGCTCATCATCC 3'), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR de 1585 bp (incluindo sítios attB; 1521 bp de início a término) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada". Plasmídeo pDONR2Ql foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®. Exemplo 22: Construção de VetorGGGGA CAA GTTTGTA CAAAAA The GCA GGCTTAAAC AATGGCCGCC ATG ATGGC 3 ') and (SEQ ID NO: 108; reverse, complementary site AttB2 in italics: 5' GGGGACCACTTTGTACAAGAAAGCTGGGT TTACTATB the included Attach sites, the recommended ATC sites, the recommended ATATGTB Gateway) for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. A 1585 bp PCR fragment (including attB; 1521 bp start-to-finish sites) was amplified and purified using standard methods as well. The first step of the Gateway procedure, the BP reaction, was then performed, during which the PCR fragment recombines in vivo with plasmid pDONR201 to produce, according to Gateway terminology, an "input clone". Plasmid pDONR2Q1 was purchased from Invitrogen as part of Gateway® technology. Example 22: Vector Construction

O clone de entrada foi subseqüentemente usado em uma reação LR com vetores de destinação usados para transformação de Oryza sativa. Estes vetores contêm como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. Quatro promotores de arroz diferentes localizados antes desta gaveta Gateway foram usados para expressar o CYP90B de Oryza sativa: prolamina RP6, oleosina 18 kDa, GOS2 e HMGB1.The input clone was subsequently used in an LR reaction with destination vectors used for Oryza sativa transformation. These vectors contain as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and a Gateway drawer intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. Four different rice promoters located before this Gateway drawer were used to express Oryza sativa CYP90B: prolamine RP6, oleosin 18 kDa, GOS2 and HMGB1.

Depois da etapa de recombinação LR, os vetores de expressão resultantes (promotor de prolamina RP6, oleosina 18 kDa, GOS2 e HMGB1 - veja Figura 14) foram transformados em linhagem LBA4044 Agrobacterium e subseqüentemente para plantas de Oryza sativa. Plantas transformadas de arroz foram permitidas crescer e foram então avaliadas para o parâmetros descritos nos exemplos abaixo. Para transformação de outras safras vejaFollowing the LR recombination step, the resulting expression vectors (RP6 prolamine promoter, 18 kDa oleosin, GOS2 and HMGB1 - see Figure 14) were transformed into LBA4044 Agrobacterium strain and subsequently to Oryza sativa plants. Transformed rice plants were allowed to grow and were then evaluated for the parameters described in the examples below. For transformation of other crops see

Exemplo 40.Example 40.

Exemplo 23: Descrição do procedimento de avaliação fenotípicaExample 23: Description of the phenotypic assessment procedure

Aproximadamente 15 a 20 transformantes TO de arroz independentes foram gerados por construção. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação para crescimento e colheita de semente T1. Quatro ou cinco eventos, dos quais a progênie T1 segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas T1 contendo o transgene (hetero e homozigotas) e aproximadamente 10 plântulas T1 carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas transgênicas e as plantas de controle adequadas foram crescidas lado a lado em posições aleatórias. Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabine de formação de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.Approximately 15 to 20 independent rice TO transformants were generated per construct. Primary transformants were transferred from a tissue crop camera to a greenhouse for T1 seed growth and harvest. Four or five events, of which T1 progeny segregated 3: 1 for presence / absence of the transgene, were retained. For each of these events, approximately 10 T1 seedlings containing the transgene (hetero and homozygous) and approximately 10 T1 seedlings lacking the transgene (nullizigotes) were selected by monitoring visual marker expression. Suitable transgenic plants and control plants were grown side by side at random positions. From the sowing stage to the maturity stage the plants were passed several times through a digital imaging booth. At each moment digital images (2048x1536 pixels, 16 million colors) were taken from each plant from at least 6 different angles.

Três T1 eventos foram adicionalmente avaliados na geração T2 seguindo o mesmo procedimento de avaliação que para a geração Tl mas com mais indivíduos por evento.Three T1 events were additionally evaluated in generation T2 following the same evaluation procedure as for generation T1 but with more individuals per event.

Mensurações de parâmetros relacionados a sementesSeed related parameter measurements

As panículas primárias maduras foram coletadas, contadas, ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas em uma balança analítica. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. A produção total de sementes foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. Peso de Mil Sementes (TKW) é extrapolado a partir do número de grãos cheios contado e seu peso total. O índice de colheita (HI) na presente invenção é definido como a proporção entre a produção total de sementes e a parte aérea (mm2), multiplicada por um fator IO6. O número total de flores por panícula como definido na presente invenção é a proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de sementes como definido na presente invenção é a proporção (expressa como uma%) do número de grãos cheios sobre o número total de sementes (ou floretes). Parâmetros individuais de sementes (largura, comprimento e área) foram medidos usando um dispositivo feito sob encomenda consistindo de dois componentes principais, um dispositivo de pesagem e formação de imagem, acoplado a aplicativo computacional para análise de imagem. Tanto sementes com casca como descascadas foram usadas para estas mensurações. Análise estatística: teste FThe mature primary panicles were collected, counted, bagged, barcoded and then dried for three days in an oven at 37 ° C. The panicles were then traced and all seeds were collected and counted. The full shells were separated from the empty shells using an air blowing device. The empty shells were discarded and the remaining fraction counted again. The full shells were weighed on an analytical balance. The number of full grains was determined by counting the number of full husks that remained after the separation step. Total seed yield was measured by weighing all full bark collected from a plant. Total number of seeds per plant was measured by counting the number of bark collected from a plant. Thousand Seed Weight (TKW) is extrapolated from the number of full grains counted and their total weight. The harvest index (HI) in the present invention is defined as the ratio of total seed yield to shoot (mm2) multiplied by a factor 106. The total number of flowers per panicle as defined in the present invention is the ratio of the total number of seeds to the number of mature primary panicles. The seed fill rate as defined in the present invention is the ratio (expressed as a%) of the number of full grains to the total number of seeds (or rapiers). Individual seed parameters (width, length and area) were measured using a custom device consisting of two main components, a weighing and imaging device coupled with a computational application for image analysis. Both shelled and husked seeds were used for these measurements. Statistical analysis: F test

Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e por um efeito geral do gene, também conhecido como um efeito gênico global. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em um nível de probabilidade de 5% para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a presença ou posição do gene que está causando as diferenças em fenótipo.A two-way ANOVA (variant analysis) was used as a statistical model for the general evaluation of plant phenotypic characteristics. An F test was performed on all measured parameters of all plants of all events transformed with the gene of the present invention. The F test was performed to check for a gene effect on all transformation events and for a general gene effect, also known as a global gene effect. The threshold for significance for a true global gene effect has been adjusted to a 5% probability level for the F test. A significant F test value points to a gene effect, meaning that it is not just the presence or position of the gene that is present. causing differences in phenotype.

Exemplo 24: Resultados de CYP90B de Oryza sativa sob o controle de promotores não constitutivosExample 24: Results of Oryza sativa CYP90B under the control of non-constitutive promoters

24.1 Plantas transgênicas expressando CYP90B sob o controle do promotor endosperma específico24.1 Transgenic plants expressing CYP90B under control of specific endosperm promoter

Os resultados de produção de sementes e mensuração de HI para plantas transgênicas expressando CYP90B sob o controle do promotor endosperma específico (prolamina RP6) são mostrados em Tabela MeN, respectivamente. O número de eventos com um aumento é indicado, assim como os valores de ρ do teste F para as gerações Tle T2. Tabela Μ: Resultados de mensuração de produção de sementes de plantas transgênicas expressando CYP90B sob o controle do promotor endosperma específico.The results of seed production and HI measurement for transgenic plants expressing CYP90B under the control of specific endosperm promoter (prolamine RP6) are shown in Table MeN, respectively. The number of events with an increase is indicated, as well as the ρ values of the F test for Tle T2 generations. Table Μ: Results of measurement of seed yield of transgenic plants expressing CYP90B under the control of specific endosperm promoter.

<table>table see original document page 224</column></row><table><table> table see original document page 224 </column> </row> <table>

Tabela N: Resultados de mensuração de HI de plantas transgênicas expressando CYP90B sob o controle do promotor endosperma específico.Table N: IH measurement results from transgenic plants expressing CYP90B under the control of the specific endosperm promoter.

<table>table see original document page 224</column></row><table><table> table see original document page 224 </column> </row> <table>

As plantas transgênicas de arroz expressando CYP90B sob o controle do promotor endosperma específico (prolamina RP6) apresentam uma colheita aumentada, devido a um aumento em produção de sementes enquanto que biomassa de parte aérea de planta permanece não modificada (dados não mostrados), quando comparada com plantas de controle.Transgenic rice plants expressing CYP90B under the control of specific endosperm promoter (prolamine RP6) show an increased crop due to an increase in seed yield while plant shoot biomass remains unmodified (data not shown) when compared. with control plants.

24.2 Plantas transgênicas expressando CYP90B sob o controle do promotor embrião/aleurona específico24.2 Transgenic plants expressing CYP90B under the control of the embryo / specific aleurone promoter

Os resultados de mensuração de TKW para plantas transgênicas expressando CYP90B sob o controle de um promotor de embrião/aleurona (oleosina 18 kDa) são mostrados em Tabela O. O número de eventos com um aumento é indicado assim como os valores de ρ do teste F para as gerações T1 e T2.TKW measurement results for transgenic plants expressing CYP90B under the control of an embryo / aleurone promoter (oleosin 18 kDa) are shown in Table O. The number of events with an increase is indicated as well as the ρ values of the F test. for generations T1 and T2.

Tabela O: Resultados de mensuração de TKW de plantas transgênicas expressando CYP90B sob o controle do promotor de embrião/aleurona.Table O: TKW measurement results from transgenic plants expressing CYP90B under the control of the embryo / aleurone promoter.

<table>table see original document page 224</column></row><table><table> table see original document page 224 </column> </row> <table>

Os resultados de mensuração de área média de semente para plantas transgênicas expressando CYP90B sob o controle do promotor de oleosina 18 kDa são mostrados em Tabela Ρ. O número de eventos com um aumento é indicado assim como os valores de ρ do teste F para as gerações Tl e T2.Mean seed area measurement results for transgenic plants expressing CYP90B under the control of the 18 kDa oleosin promoter are shown in Table Ρ. The number of events with an increase is indicated as well as the F values of test F for generations T1 and T2.

Tabela P: Resultados de mensuração de área média de semente de plantas transgênicas expressando CYP90B sob o controle do promotor de embrião/aleurona.Table P: Measurement results of mean seed area of transgenic plants expressing CYP90B under control of embryo / aleurone promoter.

<table>table see original document page 225</column></row><table><table> table see original document page 225 </column> </row> <table>

Os resultados de mensuração de comprimento médio de semente para plantas transgênicas expressando CYP90B sob o controle do promotor de oleosina 18 kDa são mostrados em Tabela Q. O número de eventos com um aumento é indicado assim como os valores de ρ do teste F para as gerações Tl e T2.The mean seed length measurement results for transgenic plants expressing CYP90B under the control of the 18 kDa oleosin promoter are shown in Table Q. The number of events with an increase is indicated as well as the ρ values of the F test for generations. T1 and T2.

Tabela Q: Resultados de mensuração de comprimento médio de semente de plantas transgênicas expressando CYP90B sob o controle do promotor de embrião/aleurona.Table Q: Results of mean seed length measurement of transgenic plants expressing CYP90B under control of embryo / aleurone promoter.

<table>table see original document page 225</column></row><table><table> table see original document page 225 </column> </row> <table>

Plantas transgênicas de arroz expressando CYP90B sob o controle de um promotor de embrião/aleurona (oleosina 18 kDa) têm sementes com TKW, área de semente e comprimento de semente aumentado. Nenhum aumento significante em produção de sementes foi observado.Transgenic rice plants expressing CYP90B under the control of an embryo / aleurone promoter (oleosin 18 kDa) have seeds with increased TKW, seed area and seed length. No significant increase in seed yield was observed.

Exemplo 25: Avaliação e Resultados de Oryza sativa CYP90B sob o controle de promotores constitutivosExample 25: Evaluation and Results of Oryza sativa CYP90B under the Control of Constitutive Promoters

25.1 Plantas transgênicas expressando CYP90B sob o controle do promotor constitutivo GOS225.1 Transgenic plants expressing CYP90B under the control of the constitutive promoter GOS2

Os resultados de mensuração de avaliação para plantas transgênicas expressando CYP90B sob o controle do promotor constitutivo GOS2 são mostrados em Tabela R. O número de eventos com um aumento é indicado, assim como os valores de ρ do teste F para a geração TI. Nenhuma avaliação de geração T2 é realizada quando resultados negativos são obtidos na geração TI.Evaluation measurement results for transgenic plants expressing CYP90B under the control of the constitutive promoter GOS2 are shown in Table R. The number of events with an increase is indicated, as well as the ρ values of the F test for the TI generation. No T2 generation evaluation is performed when negative results are obtained in TI generation.

Tabela R: Resultados de mensuração de avaliação de plantas transgênicas expressando CYP90B sob o controle do promotor constitutivo GOS2.Table R: Evaluation results of evaluation of transgenic plants expressing CYP90B under the control of the constitutive promoter GOS2.

<table>table see original document page 226</column></row><table><table> table see original document page 226 </column> </row> <table>

25.2 Plantas transgênicas expressando CYP90B sob o controle do promotor constitutivo HMBGl25.2 Transgenic plants expressing CYP90B under the control of the constitutive promoter HMBGl

Os resultados de mensuração de avaliação para plantas transgênicas expressando CYP90B sob o controle do promotor constitutivo HMBGl são mostrados em Tabela S. O número de eventos com um aumento é indicado, assim como os valores de ρ do teste F para a geração TI. Nenhuma avaliação de geração T2 é realizada quando resultados negativos são obtidos na geração TI.Evaluation measurement results for transgenic plants expressing CYP90B under the control of the constitutive promoter HMBGl are shown in Table S. The number of events with an increase is indicated, as well as the ρ values of the F test for the TI generation. No T2 generation evaluation is performed when negative results are obtained in TI generation.

Tabela S: Resultados de mensuração de avaliação de plantas transgênicas expressando CYP90B sob o controle do promotor constitutivo HMBGl.Table S: Measurement results of evaluation of transgenic plants expressing CYP90B under the control of the constitutive promoter HMBGl.

<table>table see original document page 226</column></row><table><table> table see original document page 226 </column> </row> <table>

Plantas transgênicas de arroz expressando CYP90B sob o controle de dois diferentes promotores constitutivos mostram biomassa de parte aérea de planta, altura de planta, número de grãos cheios, produção de sementes e HI fortemente reduzidos comparados com plantas de controle.Transgenic rice plants expressing CYP90B under the control of two different constituent promoters show strongly reduced plant shoot biomass, plant height, full grain number, seed yield and HI compared to control plants.

EXEMPLO D: CDC27EXAMPLE D: CDC27

Exemplo 26: Clonagem de um gene de Arabidopsis thaliana codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeoExample 26: Cloning of an Arabidopsis thaliana gene encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide.

O gene de Arabidopsis thaliana codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo (CDS0171_2) foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântula de Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído de plântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio de inserto do banco foi de 1,5 kb e o número original de clones foi da ordem de 1,59x10 cfu. Título original foi determinado como sendo 9,6x105 cfu/ml, e depois da primeira amplificação de IO10 cfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μΐ. Iniciadores (SEQ ID NO: 149; sentido, códon de início em negrito, sítio AttBl em itálico: 5'- GGGGA CAA GTTTGTA CAAAA AA GCA GGCTTC AC A ATGC AAC AA CTGTCAACTTC 3') e (SEQ ID NO: 150; reverso, complementar, sítio AttB2 em itálico: 5' GGGGACCA CTTTGTACAAGAAAGCTGGGTTGGAG TAGC TATGGTTTCAC-3'), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR de 1816 bp (incluindo sítios attB; 1737 bp de início a término) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada". Plasmídeo pDONR2Ql foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.The Arabidopsis thaliana gene encoding a CDC27 polypeptide having at least one inactive TPR domain in the polypeptide terminal NH2 region (CDS0171_2) was PCR amplified using an Arabidopsis thaliana seedling cDNA library (Invitrogen, Paisley, UK). After reverse transcription of seedling-extracted RNA, cDNAs were cloned into pCMV Sport 6.0. Average bank insert size was 1.5 kb and the original number of clones was around 1.59x10 cfu. Original titer was determined to be 9.6x10 5 cfu / ml, and after the first 1010 cfu / ml amplification. After plasmid extraction, 200 ng of template were used in a 50 μΐ PCR mix. Primers (SEQ ID NO: 149; sense, bold start codon, AttBl site in italics: 5'- GGGGA CAA GTTTGTA CAAAA AA GCA GGCTTC AC ATGC AAC AA CTGTCAACTTC 3 ') and (SEQ ID NO: 150; reverse, complementary, AttB2 site in italics: 5 'GGGGACCA CTTTGTACAAGAAAGCTGGGTTGGAG TAGC TATGGTTTCAC-3'), which includes AttB sites for Gateway recombination, were used for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. An 1816 bp PCR fragment (including attB; 1737 bp start-to-finish sites) was amplified and purified using standard methods as well. The first step of the Gateway procedure, the BP reaction, was then performed, during which the PCR fragment recombines in vivo with plasmid pDONR201 to produce, according to Gateway terminology, an "input clone". Plasmid pDONR2Q1 was purchased from Invitrogen as part of Gateway® technology.

Exemplo 27: Construção de VetorExample 27: Vector Construction

O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T- DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. Um promotor OSHl de arroz (SEQ ID NO: 151) para expressão em meristema apical de broto foi localizado antes desta gaveta Gateway.The input clone was subsequently used in an LR reaction with a destination vector used for Oryza sativa transformation. This vector contains as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and a Gateway drawer intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. A rice OSH1 promoter (SEQ ID NO: 151) for expression in shoot apical meristem was located prior to this Gateway drawer.

Depois da etapa de recombinação LR, o vetor de expressão resultante mostrado em Figura 18 foi transformado em linhagem LBA4044 de Agrobacterium e subseqüentemente para plantas de Oryza sativa. Plantas transformadas de arroz foram permitidas crescer e foram então avaliadas para os parâmetros descritos em Exemplos 28 e 29. Para transformação de outras safras veja Exemplo 40.Following the LR recombination step, the resulting expression vector shown in Figure 18 was transformed into Agrobacterium LBA4044 and subsequently to Oryza sativa plants. Transformed rice plants were allowed to grow and were then evaluated for the parameters described in Examples 28 and 29. For transformation of other crops see Example 40.

Exemplo 28: Descrição do procedimento de avaliação fenotípicaExample 28: Description of the phenotypic assessment procedure

Aproximadamente 15 a 20 transformantes T0 de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação para crescimento e colheita de semente T1. Cinco eventos, dos quais a progênie T1 segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas T1 contendo o transgene (hetero e homo-zigotas) e aproximadamente 10 plântulas T1 carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas transgênicas e as plantas de controle adequadas foram crescidas lado a lado em posições aleatórias. Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabine de formação de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.Approximately 15 to 20 independent T0 rice transformants were generated. Primary transformants were transferred from a tissue crop camera to a greenhouse for T1 seed growth and harvest. Five events, of which T1 progeny segregated 3: 1 for presence / absence of transgene, were retained. For each of these events, approximately 10 T1 seedlings containing the transgene (hetero and homozygotes) and approximately 10 T1 seedlings lacking the transgene (nullizigotes) were selected by monitoring visual marker expression. Suitable transgenic plants and control plants were grown side by side at random positions. From the sowing stage to the maturity stage the plants were passed several times through a digital imaging booth. At each moment digital images (2048x1536 pixels, 16 million colors) were taken from each plant from at least 6 different angles.

Três dos eventos avaliados em Tl foram adicionalmente avaliados na geração T2 seguindo o mesmo procedimento de avaliação que para a geração Tl mas com mais indivíduos por evento. Mensurações de parâmetros relacionados a sementesThree of the events evaluated in T1 were additionally evaluated in generation T2 following the same evaluation procedure as for generation T1 but with more individuals per event. Seed related parameter measurements

As panículas primárias maduras foram coletadas, contadas, ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas em uma balança analítica. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. A produção total de sementes foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. Peso de Mil Sementes (TKW) é extrapolado a partir do número de grãos cheios contadas e seu peso total. O índice de colheita (HI) na presente invenção é definido como a proporção entre a produção total de sementes e a parte aérea (mm2), multiplicada por um fator IO6. O número total de flores por panícula como definido na presente invenção é a proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de sementes como definida na presente invenção é a proporção (expressa como 25 uma%) do número de grãos cheios sobre o número total de sementes (ou floretes).The mature primary panicles were collected, counted, bagged, barcoded and then dried for three days in an oven at 37 ° C. The panicles were then traced and all seeds were collected and counted. The full shells were separated from the empty shells using an air blowing device. The empty shells were discarded and the remaining fraction counted again. The full shells were weighed on an analytical balance. The number of full grains was determined by counting the number of full husks that remained after the separation step. Total seed yield was measured by weighing all full bark collected from a plant. Total number of seeds per plant was measured by counting the number of bark collected from a plant. Thousand Seed Weight (TKW) is extrapolated from the number of full grains counted and their total weight. The harvest index (HI) in the present invention is defined as the ratio of total seed yield to shoot (mm2) multiplied by a factor 106. The total number of flowers per panicle as defined in the present invention is the ratio of the total number of seeds to the number of mature primary panicles. The seed fill rate as defined in the present invention is the ratio (expressed as 25 µm) of the number of full grains to the total number of seeds (or rapiers).

Análise estatística: teste FStatistical analysis: F test

Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e por um efeito geral do gene, também conhecido como um efeito gênico global. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em um nível de probabilidade de 5% para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a presença ou posição do gene que está causando as diferenças em fenótipo.A two-way ANOVA (variant analysis) was used as a statistical model for the general evaluation of plant phenotypic characteristics. An F test was performed on all measured parameters of all plants of all events transformed with the gene of the present invention. The F test was performed to check for a gene effect on all transformation events and for a general gene effect, also known as a global gene effect. The threshold for significance for a true global gene effect has been adjusted to a 5% probability level for the F test. A significant F test value points to a gene effect, meaning that it is not just the presence or position of the gene that is present. causing differences in phenotype.

Exemplo 29: Resultados da avaliação de plantas transgênicas de arroz expressando um ácido nucleico CDC27 modificado de Arabidopsis thaliana sob o controle de um promotor de meristema apical de brotoExample 29: Results of the evaluation of transgenic rice plants expressing a modified Arabidopsis thaliana CDC27 nucleic acid under the control of a sprout apical meristem promoter

Os resultados de mensuração de avaliação (produção de sementes, número de grãos cheios, e HI) para plantas transgênicas expressando um ácido nucleico CDC27 modificado sob o controle de um promotor de meristema apical de broto (OSH1) são mostrados em Tabelas T a V. O número de eventos com um aumento, a% de diferença com plantas de controle adequadas, assim como os valores de ρ do teste F para as gerações T1 e T2 são indicados.Evaluation measurement results (seed yield, full grain number, and HI) for transgenic plants expressing a modified CDC27 nucleic acid under the control of a bud apical meristem promoter (OSH1) are shown in Tables T to V. The number of events with an increase, the% difference with appropriate control plants, as well as the ρ values of the F test for T1 and T2 generations are indicated.

Tabela T: Resultados de mensuração de produção de sementes de plantas transgênicas expressando um ácido nucleico CDC27 modificado sob o controle de um promotor de meristema apical de broto.Table T: Results of seed yield measurement of transgenic plants expressing a modified CDC27 nucleic acid under the control of a bud apical meristem promoter.

<table>table see original document page 230</column></row><table> Tabela U: Resultados de mensuração de número de grãos cheios de plantas transgênicas expressando um ácido nucleico CDC27 modificado sob o controle de um promotor de meristema apical de broto.<table> table see original document page 230 </column> </row> <table> Table U: Results of measurement of full grain number of transgenic plants expressing a modified CDC27 nucleic acid under the control of an apical meristem promoter of bud.

<table>table see original document page 231</column></row><table><table> table see original document page 231 </column> </row> <table>

Tabela V: Resultados de mensuração de índice de colheita de plantas transgênicas expressando um ácido nucleico CDC27 modificado sob o controle de um promotor de meristema apical de broto.Table V: Harvest index measurement results of transgenic plants expressing a modified CDC27 nucleic acid under the control of a bud apical meristem promoter.

<table>table see original document page 231</column></row><table><table> table see original document page 231 </column> </row> <table>

Plantas transgênicas de arroz expressando um ácido nucleico CDC27 modificado sob o controle de promotor de meristema apical de broto tiveram produção significantemente aumentada de sementes, número aumentado de sementes cheias e índice de colheita aumentado.Transgenic rice plants expressing a modified CDC27 nucleic acid under the control of shoot apical meristem promoter had significantly increased seed production, increased number of full seeds and increased harvest index.

EXEMPLO E: AT-hookEXAMPLE E: AT-hook

Exemplo 30: Clonagem de gene de ácido nucleico codificando AT-hook de Oryza sativaExample 30: Cloning of Oryza sativa AT-hook encoding nucleic acid gene

O gene de Oryza sativa codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 (veja SEQ ID NO: 152) foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântula de Oryza sativa (Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído de plântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio de inserto do banco foi de 1,6 kb e o 20 número original de clones foi da ordem de 1,67x107 cfu. Título original foi determinado como sendo 3,34 χIO6 cfü/ml depois de primeira amplificação de 6x1010 cfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μΐ. Iniciadores (SEQ ID NO: 196; sentido, iniciador AttB 1: 5'- ggggacaagtttgtacaaaaaagcaggcttaaacaatggat ccggtcacgg -3') e (SEQ ID NO: 197; reverso, complementar, iniciador AttB2: 5'-ggggaccactttgtacaagaaagctgggtggaatcgatccatctcagaa -3'), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR (incluindo sítios attB; de início a término) foi amplificado e purificado usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR recombinado in vivo com o plasmídeo pDC)NR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada". Plasmídeo pDC)NR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.The Oryza sativa gene encoding a polypeptide comprising an AT-hook domain and a DUF296 domain (see SEQ ID NO: 152) was PCR amplified using an Oryza sativa seedling cDNA library (Invitrogen, Paisley, UK) as a template. After reverse transcription of seedling-extracted RNA, cDNAs were cloned into pCMV Sport 6.0. Average bank insert size was 1.6 kb and the original number of clones was on the order of 1.67x107 cfu. Original titer was determined to be 3.34 χIO6 cfü / ml after first amplification of 6x1010 cfu / ml. After plasmid extraction, 200 ng of template were used in a 50 μΐ PCR mix. Primers (SEQ ID NO: 196; sense, initiator AttB 1: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggat ccggtcacgg -3 ') and (SEQ ID NO: 197; reverse, complementary, primer AttB2: 5'-ggggaccactaggcagagcagagcagagcagagcagagctag AttB sites for Gateway recombination were used for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. A PCR fragment (including attB sites; from start to finish) was amplified and purified using standard methods. The first step of the Gateway procedure, the BP reaction, was then performed, during which the PCR fragment recombined in vivo with plasmid pDC) NR201 to produce, according to Gateway terminology, an "input clone". Plasmid pDC) NR201 was purchased from Invitrogen as part of Gateway® technology.

Exemplo 31: Construção de VetorExample 31: Vector Construction

O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação contendo o promotor de prolamina usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. Um promotor de prolamina de arroz (SEQ ID NO: 195) para expressão endosperma específica foi localizado antes desta gaveta Gateway.The input clone was subsequently used in an LR reaction with a destination vector containing the prolamine promoter used for Oryza sativa transformation. This vector contains as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and a Gateway drawer intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. A rice prolamine promoter (SEQ ID NO: 195) for specific endosperm expression was located prior to this Gateway drawer.

Depois da etapa de recombinação LR, o vetor de expressão resultante mostrado em Figura 22 foi transformado em linhagem LBA4044 de Agrobacterium e subseqüentemente para plantas de Oryza sativa. Plantas transformadas de arroz foram permitidas crescer e foram então avaliadas para os parâmetros descritos abaixo. Para transformação de outras safras veja Exemplo 40.Following the LR recombination step, the resulting expression vector shown in Figure 22 was transformed into Agrobacterium LBA4044 and subsequently to Oryza sativa plants. Transformed rice plants were allowed to grow and were then evaluated for the parameters described below. For transformation of other crops see Example 40.

Exemplo 32: Avaliação e ResultadosExample 32: Evaluation and Results

Aproximadamente 15 a 20 transformantes TO de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação para crescimento e colheita de semente T1. Sete eventos, dos quais a progênie T1 segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero e homo-zigotas) e aproximadamente 10 plântulas T1 carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual.Approximately 15 to 20 independent TO transformants of rice were generated. Primary transformants were transferred from a tissue crop camera to a greenhouse for T1 seed growth and harvest. Seven events, of which T1 progeny segregated 3: 1 for presence / absence of transgene, were retained. For each of these events, approximately 10 T1 seedlings containing the transgene (hetero and homozygotes) and approximately 10 T1 seedlings lacking the transgene (nullizigotes) were selected by monitoring visual marker expression.

32.1 Análise estatística: teste F32.1 Statistical analysis: F test

Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e por um efeito geral do gene (também referidas como a efeito gênico global). O limiar para significância para um verdadeiro efeito gênico global foi ajustado em um nível de probabilidade de 5% para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a presença ou posição do gene que está causando as diferenças em fenótipo.A two-way ANOVA (variant analysis) was used as a statistical model for the general evaluation of plant phenotypic characteristics. An F test was performed on all measured parameters of all plants of all events transformed with the gene of the present invention. The F test was performed to check for a gene effect on all transformation events and for a general gene effect (also referred to as the overall gene effect). The threshold for significance for a true global gene effect has been adjusted to a 5% probability level for the F test. A significant F test value points to a gene effect, meaning that it is not just the presence or position of the gene that is present. causing differences in phenotype.

32.2 Mensurações de parâmetros relacionados a sementes32.2 Measurements of seed related parameters

As panículas primárias maduras foram coletadas, contadas, ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas em uma balança analítica. O número de grãos cheios foi determinado contando ρ número de cascas cheias que permaneceram depois da etapa de separação. A produção total de sementes foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. Peso de Mil Sementes (TKW) foi extrapolado a partir do número de grãos cheios contadas e seu peso total. O índice de colheita (HI) foi expresso como uma proporção entre a produção total de sementes e a parte aérea (mm2), multiplicada por um fator IO6. O número total de flores por panícula foi expresso como uma proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de sementes foi expressa como uma% do número de grãos cheios sobre o número total de sementes (ou floretes).The mature primary panicles were collected, counted, bagged, barcoded and then dried for three days in an oven at 37 ° C. The panicles were then traced and all seeds were collected and counted. The full shells were separated from the empty shells using an air blowing device. The empty shells were discarded and the remaining fraction counted again. The full shells were weighed on an analytical balance. The number of full kernels was determined by counting ρ number of full shells remaining after the separation step. Total seed yield was measured by weighing all full bark collected from a plant. Total number of seeds per plant was measured by counting the number of bark collected from a plant. Thousand Seed Weight (TKW) was extrapolated from the number of full grains counted and their total weight. The harvest index (HI) was expressed as a ratio between total seed production and shoot (mm2), multiplied by a factor of 106. The total number of flowers per panicle was expressed as a ratio between the total number of seeds and the number of mature primary panicles. Seed fill rate was expressed as a% of the number of full grains over the total number of seeds (or rapiers).

Tabela W: Dados comparativos para mostrar a diferença em produção de sementes obtida usando um promotor endosperma específico (prolamina) comparado com um promotor raiz específico (promotor RCc3)Table W: Comparative data to show the difference in seed yield obtained using a specific endosperm promoter (prolamine) compared to a specific root promoter (RCc3 promoter)

<table>table see original document page 234</column></row><table><table> table see original document page 234 </column> </row> <table>

A Tabela mostra a% de diferença em vários parâmetros para plantas transgênicas comparadas com plantas de controle correspondentes (nulizigotos); também mostrado na Tabela é o valor de ρ do teste F que indica o efeito geral do gene. Como mostrado na Tabela, vários parâmetros de produção de sementes foram aumentados em plantas expressando um ácido nucleico codificando AT-hook (SEQ ID NO: 152) sob o controle de um promotor endosperma específico, ao passo que nenhum aumento (de fato uma diminuição significante) foi obtido para plantas expressando o mesmo transgene sob o controle de um promotor raiz específico em plantas transgênicas. EXEMPLO F: fatores de transcrição DOFThe Table shows the% difference in various parameters for transgenic plants compared to corresponding control plants (nullizigotes); Also shown in the Table is the value of ρ from the F test that indicates the overall effect of the gene. As shown in the Table, various seed yield parameters were increased in plants expressing a nucleic acid encoding AT-hook (SEQ ID NO: 152) under the control of a specific endosperm promoter, whereas no increase (indeed a significant decrease). ) was obtained for plants expressing the same transgene under the control of a specific root promoter in transgenic plants. EXAMPLE F: DOF Transcription Factors

Exemplo 33: Clonagem de gene de fator de transcrição DOF de Arabidopsis thaliana (SEQID NO: 198)Example 33: Arabidopsis thaliana DOF Transcription Factor Gene Cloning (SEQID NO: 198)

O gene de fator de transcrição DOF de Arabidopsis thaliana foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântula de Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído de plântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio de inserto do banco foi de 1,5 kb e número original de clones foi de 1,59x10^7 cfu. Título original foi determinado como sendo 9,6x10^5 cfu/ml depois de primeira amplificação de 6x10^11 cfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μl. Iniciador (SEQ ID NO: 223) (sentido iniciador AttB 1: 5' ggggacaagtttgtacaaaaaa gcaggcttaaacaatgggtggatcgatggc 3') e (SEQ ID NO: 224) (iniciador AttB2 complementar reverso: 5' ggggaccactttgtacaagaaagctgggtcgttaatgatccgacaaaaca 3'), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR (incluindo sítios attB; de início a término) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada durante as quais o fragmento de PCR recombinado in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada". Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.The Arabidopsis thaliana DOF transcription factor gene was PCR amplified using a template of an Arabidopsis thaliana seedling cDNA library (Invitrogen, Paisley, UK). After reverse transcription of seedling-extracted RNA, cDNAs were cloned into pCMV Sport 6.0. Average bank insert size was 1.5 kb and original number of clones was 1.59x10 ^ 7 cfu. Original titer was determined to be 9.6x10 ^ 5 cfu / ml after first amplification of 6x10 ^ 11 cfu / ml. After plasmid extraction, 200 ng of template were used in a 50 μl PCR mix. Initiator (SEQ ID NO: 223) (initiator sense AttB 1: 5 'ggggacaagtttgtacaaaaaa gcaggcttaaacaatgggtggatcgatggc 3') and (SEQ ID NO: 224) (initiator AttB2 complementary reverse: 5 'ggggaccgggacgggacaggacaggacggacaggacggacaggacggacaggacgggacaaca Gateway, were used for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. A PCR fragment (including attB sites; from start to finish) was amplified and purified using standard methods as well. The first step of the Gateway procedure, the BP reaction, was then performed during which the PCR fragment recombined in vivo with plasmid pDONR201 to produce, according to Gateway terminology, an "input clone". Plasmid pDONR201 was purchased from Invitrogen as part of Gateway® technology.

Exemplo 33a: Construção de VetorExample 33a: Vector Construction

O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação contendo GOS2 usado para transformação de Oryza sativa. Este vetor continha como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 225) para expressão constitutiva foi localizado antes desta gaveta Gateway.The input clone was subsequently used in an LR reaction with a GOS2 containing destination vector used for Oryza sativa transformation. This vector contained as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and a Gateway drawer intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. A rice GOS2 promoter (SEQ ID NO: 225) for constitutive expression was located prior to this Gateway drawer.

Depois da etapa de recombinação LR, o vetor de expressão resultante mostrado em Figura 26 foi transformado em linhagem LBA4044 de Agrobacterium e subseqüentemente para plantas de Oryza sativa. Plantas transformadas de arroz foram permitidas crescer e foram então avaliadas para os parâmetros descritos abaixo. Para transformação de outras safras veja Exemplo 40.Following the LR recombination step, the resulting expression vector shown in Figure 26 was transformed into Agrobacterium LBA4044 and subsequently to Oryza sativa plants. Transformed rice plants were allowed to grow and were then evaluated for the parameters described below. For transformation of other crops see Example 40.

Exemplo 34: Clonagem de gene de fator de transcrição DOF de Arabidopsis thaliana (SEQ ID NO: 226)Example 34: Arabidopsis thaliana DOF Transcription Factor Gene Cloning (SEQ ID NO: 226)

O gene de fator de transcrição DOF de Arabidopsis thaliana foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântula de Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois de transcrição reversa de RNA extraído de plântulas, os cDNAs foram clonados em pCMV Sport 6.0. Tamanho médio de inserto do banco foi de 1,5 kb e número original de clones foi de 1,59x10 cfu. Título original foi determinado como sendo 9,6x105 cfü/ml depois de primeira amplificação de 6x1011 cfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μΐ. Iniciador (SEQ ID NO: 256) (iniciador AttBl sentido: 5' ggggacaagtttgtacaaaaaa gcaggcttaaacaatgatgatggagactagagatc3') and (SEQ ID NO: 257) (iniciador AttB2 complementar reverso: 5' ggggaccactttgtacaagaaagctgggtcatatgtaactctaaatctgttca3'), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR (incluindo sítios attB; de início a término) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada durante a qual o fragmento de PCR recombinado in vivo com o plasmídeo pDC>NR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada". Plasmídeo pDC)NR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.The Arabidopsis thaliana DOF transcription factor gene was PCR amplified using a template of an Arabidopsis thaliana seedling cDNA library (Invitrogen, Paisley, UK). After reverse transcription of seedling-extracted RNA, cDNAs were cloned into pCMV Sport 6.0. Average bank insert size was 1.5 kb and original number of clones was 1.59x10 cfu. Original titer was determined to be 9.6x105 cf / ml after first amplification of 6x1011 cfu / ml. After plasmid extraction, 200 ng of template were used in a 50 μΐ PCR mix. Initiator (SEQ ID NO: 256) (AttBl initiator sense: 5 'ggggacaagtttgtacaaaaaa gcaggcttaaacaatgatgatggagagagagagcc3') and (SEQ ID NO: 257) (AttB2 complementary initiator reverse: 5 'ggggaccactgatgatgatataggatataggatacgatacgatacgatacgatacgataccggtacgatacggtacgatacgtaggcagtaggtaggctagggtaggctaggtaggtaggtaggctaggtaggtaggctggtaggtaggtaggtaggagacctggtacgatgatagtgtcggtgtggtgactacgatgtgtatagggtataggctggiggtggiggtcgiggtactgtg name given in the full version) used for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. A PCR fragment (including attB sites; from start to finish) was amplified and purified using standard methods as well. The first step of the Gateway procedure, the BP reaction, was then performed during which the PCR fragment recombined in vivo with plasmid pDC> NR201 to produce, according to Gateway terminology, an "input clone". Plasmid pDC) NR201 was purchased from Invitrogen as part of Gateway® technology.

Exemplo 34a: Construção de VetorExample 34a: Vector Construction

O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação contendo prolamina usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dós limites de T-DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. Um promotor de prolamina de arroz (SEQ ID NO: 258) para expressão semente específica foi localizado antes desta gaveta Gateway.The input clone was subsequently used in an LR reaction with a prolamine-containing targeting vector used for Oryza sativa transformation. This vector contains as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and a Gateway drawer intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. A rice prolamine promoter (SEQ ID NO: 258) for specific seed expression was located before this Gateway drawer.

Depois da etapa de recombinação LR, o vetor de expressão resultante mostrado em Figura 27 foi transformado em linhagem LBA4044 de Agrobacterium e subseqüentemente para plantas de Oryza sativa. Plantas transformadas de arroz foram permitidas crescer e foram então avaliadas para os parâmetros descritos abaixo. Para transformação de outras safras veja Exemplo 40.After the LR recombination step, the resulting expression vector shown in Figure 27 was transformed into Agrobacterium LBA4044 and subsequently to Oryza sativa plants. Transformed rice plants were allowed to grow and were then evaluated for the parameters described below. For transformation of other crops see Example 40.

Exemplo 35: Avaliação e ResultadosExample 35: Evaluation and Results

Aproximadamente 15 a 20 transformantes TO de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação para crescimento e colheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero e homo-zigotas) e aproximadamente 10 plântulas Tl carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. Aproximadamente 4 eventos Tl foram adicionalmente avaliados na geração T2 seguindo o mesmo procedimento de avaliação que para a geração T1 mas com mais indivíduos por evento.Approximately 15 to 20 independent TO transformants of rice were generated. Primary transformants were transferred from a tissue crop camera to a greenhouse for growing and harvesting TI seed. Seven events, of which progeny T1 secreted 3: 1 for presence / absence of transgene, were retained. For each of these events, approximately 10 Tl seedlings containing the transgene (hetero and homozygotes) and approximately 10 Tl seedlings lacking the transgene (nullizigotes) were selected by monitoring visual marker expression. Approximately 4 T1 events were additionally evaluated in generation T2 following the same evaluation procedure as for generation T1 but with more individuals per event.

Plantas de cinco eventos foram crescidas em condições normais até o estágio de espigamento. Umidade do solo foi monitorada continuamente usando sensores de umidade inseridos nos potes de diversas plantas de controle não transgênicas escolhidas aleatoriamente. Em uma primeira fase, os potes foram saturados para um valor máximo de 60% para reduzir a variabilidade de pote para pote. Uma vez que os potes foram saturados, irrigação foi retida até que um teor de umidade no solo de abaixo de 20% fosse obtido. As plantas foram então re-irrigadas até umidade no solo ter atingido o nível máximo de 60% novamente. As plantas foram então representadas para avaliar os seguintes parâmetros relacionados a raízes e relacionados a sementes.Plants of five events were grown under normal conditions until the spike stage. Soil moisture was continuously monitored using moisture sensors inserted into the pots of several randomly selected non-transgenic control plants. In a first phase, the pots were saturated to a maximum of 60% to reduce pot-to-pot variability. Once the pots were saturated, irrigation was retained until a soil moisture content of below 20% was obtained. The plants were then re-irrigated until soil moisture reached the maximum level of 60% again. Plants were then represented to evaluate the following root-related and seed-related parameters.

Parâmetros relacionados a raízesRoot Related Parameters

Plantas foram crescidas em potes especialmente projetados com fundos transparentes para permitir visualização das raízes. Uma câmera digital registrou imagens através do fundo do pote durante crescimento vegetal. Características de raiz tal como área total projetada (a qual pode ser correlacionada a volume total de raiz), diâmetro e comprimento médio de raízes acima de um certo limiar de espessura (comprimento de raízes grossas, ou comprimento de raízes finas) foram deduzidos a partir da imagem gerada usando aplicativo computacional apropriado.Plants were grown in specially designed pots with transparent backgrounds to allow root visualization. A digital camera recorded images across the bottom of the pot during plant growth. Root characteristics such as total projected area (which can be correlated with total root volume), root diameter and root length above a certain threshold of thickness (thick root length, or thin root length) were deduced from generated image using appropriate computational application.

Mensurações de parâmetros relacionados a sementesSeed related parameter measurements

As panículas primárias maduras foram coletadas, contadas, ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas em uma balança analítica. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. A produção total de sementes foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. Peso de Mil Sementes (TKW) foi extrapolado a partir do número de grãos cheios contadas e seu peso total. O índice de colheita (HI) na presente invenção é definido como a proporção entre a produção total de sementes e a parte aérea (mm2), multiplicada por um fator IO6. O número total de flores por panícula como definido na presente invenção é a proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de sementes como definida na presente invenção é a proporção (expressa como uma%) do número de grãos cheios sobre o número total de sementes (ou floretes).The mature primary panicles were collected, counted, bagged, barcoded and then dried for three days in an oven at 37 ° C. The panicles were then traced and all seeds were collected and counted. The full shells were separated from the empty shells using an air blowing device. The empty shells were discarded and the remaining fraction counted again. The full shells were weighed on an analytical balance. The number of full grains was determined by counting the number of full husks that remained after the separation step. Total seed yield was measured by weighing all full bark collected from a plant. Total number of seeds per plant was measured by counting the number of bark collected from a plant. Thousand Seed Weight (TKW) was extrapolated from the number of full grains counted and their total weight. The harvest index (HI) in the present invention is defined as the ratio of total seed yield to shoot (mm2) multiplied by a factor 106. The total number of flowers per panicle as defined in the present invention is the ratio of the total number of seeds to the number of mature primary panicles. The seed fill rate as defined in the present invention is the ratio (expressed as a%) of the number of full grains to the total number of seeds (or rapiers).

Análise estatística: teste FStatistical analysis: F test

Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e por um efeito geral do gene, também conhecido como um efeito gênico global. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em um nível de probabilidade de 5% para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a presença ou posição do gene que está causando as diferenças em fenótipo.A two-way ANOVA (variant analysis) was used as a statistical model for the general evaluation of plant phenotypic characteristics. An F test was performed on all measured parameters of all plants of all events transformed with the gene of the present invention. The F test was performed to check for a gene effect on all transformation events and for a general gene effect, also known as a global gene effect. The threshold for significance for a true global gene effect has been adjusted to a 5% probability level for the F test. A significant F test value points to a gene effect, meaning that it is not just the presence or position of the gene that is present. causing differences in phenotype.

Tabela X abaixo mostra os resultados da avaliação de T2 para plantas transgênicas expressando um ácido nucleico codificando um fator de transcrição DOF sob o controle de um promotor GOS2 e os resultados da avaliação de T2 para plantas transgênicas expressando um ácido nucleico codificando um fator de transcrição DOF sob o controle de um promotor de prolamina. Embora não mostrados, resultados comparáveis foram obtidos para plantas de Tl. O valor de ρ do teste F é mostrado para os parâmetros listados na Tabela, assim como a porcentagem de diferença entre plantas transgênicas versos nulizigotos.Table X below shows the results of T2 evaluation for transgenic plants expressing a nucleic acid encoding a DOF transcription factor under the control of a GOS2 promoter and the results of T2 evaluation for transgenic plants expressing a nucleic acid encoding a DOF transcription factor under the control of a prolamine promoter. Although not shown, comparable results were obtained for Tl plants. The ρ value of the F test is shown for the parameters listed in the Table, as well as the percentage difference between transgenic plants versus nullizigotes.

Tabela X: Resultados de Avaliação de T2Table X: T2 Evaluation Results

<table>table see original document page 240</column></row><table><table> table see original document page 240 </column> </row> <table>

Em adição aos parâmetros relacionados a sementes descritos acima, os seguintes parâmetros de raiz também foram aumentados em plantas transgênicas comparadas com nulizigotos: 14% de aumento em biomassa total de raiz, 7% de aumento em número de raízes grossas (limiar interno), 36% de aumento em número de raízes finas (limiar interno) e uns 8% de aumento em diâmetro médio de raízes.In addition to the seed-related parameters described above, the following root parameters were also increased in transgenic plants compared to nullizigotes: 14% increase in total root biomass, 7% increase in number of thick roots (internal threshold), 36 % increase in number of thin roots (internal threshold) and an 8% increase in mean root diameter.

Os resultados mencionados acima foram obtidos em condições de estresse brando por seca; resultados similares seriam esperados em condições normais ou sem estresse.The results mentioned above were obtained under mild drought stress conditions; Similar results would be expected under normal or stress-free conditions.

EXEMPLO G: CKIEXAMPLE G: CKI

Exemplo 36: Clonagem de um gene de Oryza sativa codificando um polipeptídeo CKI4Example 36: Cloning of an Oryza sativa Gene Encoding a CKI4 Polypeptide

O gene de Oryza sativa codificando um polipeptídeo CKI4 foi amplificado por PCR usando como modelo uma biblioteca de cDNA de safra celular em suspensão de Oryza sativa clonada no vetor pAD-Gal4-2.1 de kit HybriZAP-2.1 (Stratagene, La Jolla, Califórnia USA), de acordo com as instruções de fabricante. Tamanho médio de inserto do banco foi de 1,5 kb e o número original de clones foi da ordem de 2x106 pfu. Título original foi determinado como sendo 4x106 pfu/ml e depois da primeira amplificação de 1010 pfu/ml. Depois de extração de plasmídeo, 200 ng de modelo foram usados em uma mistura de PCR de 50 μl. Iniciadores (SEQ ID NO: 284; sentido, códon de início em negrito, sítio AttBl em itálico: 5'- GGGGACAAGTTTGTACAAAAAAGCAGGCTTCACAATGGGCAAGTACA TGCGCAAGGCC-3') e (SEQ ID NO: 285; reverso, complementar, sítio AttB2 em itálico: 5'- GGGGACCACTTTGTACAAGAAAGCTGGG 7GGAGCAGAGAGGTCCATGGTGCCC-3'), os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando DNA polimerase Hifi Taq em condições padrão. Um fragmento de PCR de 662 bp (incluindo sítios attB; 585 bp de início a término) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada". Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.The Oryza sativa gene encoding a CKI4 polypeptide was PCR amplified using an Oryza sativa cell suspension cDNA library cloned into the HybriZAP-2.1 kit vector pAD-Gal4-2.1 (Stratagene, La Jolla, California USA). according to the manufacturer's instructions. Average bank insert size was 1.5 kb and the original number of clones was around 2x106 pfu. Original titer was determined to be 4x106 pfu / ml and after the first amplification of 1010 pfu / ml. After plasmid extraction, 200 ng of template were used in a 50 μl PCR mix. Primers (SEQ ID NO: 284; sense, bold start codon, AttBl site in italics: 5'- GGGGACAAGTTTGTACAAAAAAGCAGGCTTCACAATGGGCAAGTACA TGCGCAAGGCC-3 ') and (SEQ ID NO: 285; reverse 2, complementary'-Att GGGGACCACTTTGTACAAGAAAGCTGGG 7GGAGCAGAGAGGTCCATGGTGCCC-3 '), which includes AttB sites for Gateway recombination, were used for PCR amplification. PCR was performed using Hifi Taq DNA polymerase under standard conditions. A 662 bp PCR fragment (including attB; 585 bp start-to-end sites) was amplified and purified using standard methods as well. The first step of the Gateway procedure, the BP reaction, was then performed, during which the PCR fragment recombines in vivo with plasmid pDONR201 to produce, according to Gateway terminology, an "input clone". Plasmid pDONR201 was purchased from Invitrogen as part of Gateway® technology.

Exemplo 3 7: Construção de VetorExample 3 7: Vector Construction

O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T- DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e duas gavetas Gateway em orientação oposta pretendidas para recombinação in vivo LR com a seqüência de interesse já clonada no clone de entrada. As duas gavetas Gateway foram separadas por DNA não codificante (neste caso um fragmento de 315 bp de uma região de acoplamento de matriz (MAR) de tabaco, referência NCBI U67919, fragmento de 774 a 1088 bp), para promover formação de uma estrutura em forma de grampo do mRNA depois de transcrição. Um promotor de prolamina RP6 de arroz (SEQ ID NO: 281) para expressão endosperma específica foi localizado antes da primeira gaveta Gateway, em orientação oposta com respeito ao promotor.The input clone was subsequently used in an LR reaction with a destination vector used for Oryza sativa transformation. This vector contains as functional elements within the limits of T-DNA: a selectable plant marker; a traceable marker expression drawer; and two opposite orientation Gateway drawers intended for in vivo LR recombination with the sequence of interest already cloned into the input clone. The two Gateway drawers were separated by non-coding DNA (in this case a 315 bp fragment from a tobacco matrix coupling region (MAR), reference NCBI U67919, fragment 774 to 1088 bp), to promote formation of a structure in clip form of mRNA after transcription. A rice RP6 prolamine promoter (SEQ ID NO: 281) for specific endosperm expression was located before the first Gateway drawer, in opposite orientation with respect to the promoter.

O clone de entrada também foi usado em uma reação LR com outro vetor de destinação usado para transformação de Oryza sativa. Este vetor foi idêntico àquele descrito acima, exceto que o promotor de prolamina RP6 foi substituído por promotor de beta-expansina de arroz de SEQ ID NO: 282.The input clone was also used in an LR reaction with another target vector used for Oryza sativa transformation. This vector was identical to that described above except that the RP6 prolamine promoter was replaced by rice beta-expansin promoter of SEQ ID NO: 282.

Depois da etapa de recombinação LR, os dois vetores de expressão resultantes (Figura 32 para ambos vetores) foram transformados em linhagem LBA4044 de Agrobacterium e subseqüentemente para plantas de Oryza sativa. Plantas transformadas de arroz foram permitidas crescer e foram então avaliadas para os parâmetros descritos em Exemplos 38 e 39. Para transformação de outras safras veja Exemplo 40.After the LR recombination step, the two resulting expression vectors (Figure 32 for both vectors) were transformed into Agrobacterium LBA4044 and subsequently to Oryza sativa plants. Transformed rice plants were allowed to grow and were then evaluated for the parameters described in Examples 38 and 39. For transformation of other crops see Example 40.

Exemplo 38: Descrição do procedimento de avaliação fenotípicaExample 38: Description of the phenotypic assessment procedure

Aproximadamente 15 a 20 transformantes TO de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmera de safra de tecido para uma casa de vegetação para crescimento e colheita de semente T1. Quatro a cinco eventos, dos quais a progênie T1 segregou 3:1 para presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero e homozigotas) e aproximadamente 10 plântulas T1 carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas transgênicas e as plantas de controle adequadas foram crescidas lado a lado em posições aleatórias. Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabine de formação de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.Approximately 15 to 20 independent TO transformants of rice were generated. Primary transformants were transferred from a tissue crop camera to a greenhouse for T1 seed growth and harvest. Four to five events, of which T1 progeny segregated 3: 1 for transgene presence / absence, were retained. For each of these events, approximately 10 T1 seedlings containing the transgene (hetero and homozygous) and approximately 10 T1 seedlings lacking the transgene (nullizigotes) were selected by monitoring visual marker expression. Suitable transgenic plants and control plants were grown side by side at random positions. From the sowing stage to the maturity stage the plants were passed several times through a digital imaging booth. At each moment digital images (2048x1536 pixels, 16 million colors) were taken from each plant from at least 6 different angles.

Os mesmos eventos avaliados em T1 foram adicionalmente avaliados na geração T2 seguindo o mesmo procedimento de avaliação que para a geração T1.The same events evaluated at T1 were additionally evaluated at T2 generation following the same evaluation procedure as for T1 generation.

Mensurações de parâmetros relacionados a sementesSeed related parameter measurements

As panículas primárias maduras foram coletadas, contadas, ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas em uma balança analítica. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. A produção total de sementes foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. O índice de colheita (HI) na presente invenção é definido como a proporção entre a produção total de sementes e a parte aérea (mm2), multiplicada por um fator 10^6. O número total de flores por panícula como definido na presente invenção é a proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de sementes como definida na presente invenção é a proporção (expressa como uma%) do número de grãos cheios sobre o número total de sementes (ou floretes).The mature primary panicles were collected, counted, bagged, barcoded and then dried for three days in an oven at 37 ° C. The panicles were then traced and all seeds were collected and counted. The full shells were separated from the empty shells using an air blowing device. The empty shells were discarded and the remaining fraction counted again. The full shells were weighed on an analytical balance. The number of full grains was determined by counting the number of full husks that remained after the separation step. Total seed yield was measured by weighing all full bark collected from a plant. Total number of seeds per plant was measured by counting the number of bark collected from a plant. The harvest index (HI) in the present invention is defined as the ratio of total seed production to shoot (mm2) multiplied by a factor 10 ^ 6. The total number of flowers per panicle as defined in the present invention is the ratio of the total number of seeds to the number of mature primary panicles. The seed fill rate as defined in the present invention is the ratio (expressed as a%) of the number of full grains to the total number of seeds (or rapiers).

Análise estatística: teste FStatistical analysis: F test

Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e por um efeito geral do gene, também conhecido como um efeito gênico global. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em um nível de probabilidade de 5% para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a presença ou posição do gene que está causando as diferenças em fenótipo.A two-way ANOVA (variant analysis) was used as a statistical model for the general evaluation of plant phenotypic characteristics. An F test was performed on all measured parameters of all plants of all events transformed with the gene of the present invention. The F test was performed to check for a gene effect on all transformation events and for a general gene effect, also known as a global gene effect. The threshold for significance for a true global gene effect has been adjusted to a 5% probability level for the F test. A significant F test value points to a gene effect, meaning that it is not just the presence or position of the gene that is present. causing differences in phenotype.

Exemplo 39: Resultados da avaliação de planta transgênica de arroz com expressão de CKI4 reduzida no endospermaExample 39: Results of evaluation of transgenic rice plant with reduced CKI4 expression in endosperm

Os resultados de mensuração de avaliação (produção de sementes, número de grãos cheios, número total de sementes e flores por panícula) para plantas transgênicas com expressão de CKI4 reduzida no endosperma são apresentados em Tabela Y abaixo. O número de plantas com um aumento em um parâmetro, o aumento percentual médio assim como o valor de P da geração T2 são mostrados, e comparados com resultados obtidos com plantas transgênicas com expressão de CKI4 reduzida usando um promotor de beta expansina para expressão preferencial em tecido de broto.The evaluation measurement results (seed yield, number of full grains, total number of seeds and flowers per panicle) for transgenic plants with reduced endosperm CKI4 expression are presented in Table Y below. The number of plants with an increase in one parameter, the mean percent increase as well as the P value of the T2 generation are shown, and compared with results obtained with transgenic plants with reduced CKI4 expression using a beta expansin promoter for preferential expression in bud tissue.

Os resultados mostram que expressão reduzida de CKI4 no endosperma gera plantas com peso de semente, número de grãos cheios, total número de sementes e flores por panícula significantemente aumentados, comparadas com nulizigotos e comparadas com plantas transgênicas com expressão preferencialmente reduzida de CKI4 em tecido de broto (usando um promotor de beta expansina). Tabela Y: Resultados de mensuração de avaliação para plantas transgênicas com reduzida expressão de CKI4 no endospermaResults show that reduced CKI4 expression in endosperm yields significantly increased seed weight, full grain number, total number of seeds and flowers per panicle compared to nullizigotes and compared to transgenic plants with preferentially reduced CKI4 expression in tissue. bud (using a beta expansin promoter). Table Y: Evaluation measurement results for transgenic plants with reduced CKI4 expression in endosperm

<table>table see original document page 245</column></row><table><table> table see original document page 245 </column> </row> <table>

Exemplo 40: Transformação de Milho, Trigo, Soja, Colza e AlfafaExample 40: Corn, Wheat, Soybean, Rapeseed and Alfalfa Transformation

Transformação de milhoCorn Processing

Transformação de milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. Transformação é dependente de genótipo em milho e apenas genótipos específicos são receptivos para transformação e regeneração. A linhagem natural Al 88 (University of Minnesota) ou híbridos com Al 88 como um ancestral são boas fontes de material doador para transformação, mas outros genótipos também podem ser usados com sucesso. Espigas são coletadas a partir de planta de milho aproximadamente 11 dias depois de polinização (DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm. Embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Embriões excisados são crescidos em meio de indução de calo, então meio de regeneração de milho, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25°C por 2-3 semanas, ou até que brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para meio de enraizamento de milho e incubados a 25°C por 2-3 semanas, até que raízes se desenvolvam. Os brotos com raiz são transplantados para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.Corn transformation (Zea mays) is performed with a modification of the method described by Ishida et al. (1996) Nature Biotech 14 (6): 745-50. Transformation is genotype dependent in maize and only specific genotypes are receptive to transformation and regeneration. The Al 88 (University of Minnesota) natural line or Al 88 hybrids as an ancestor are good sources of donor material for transformation, but other genotypes can also be used successfully. Ears are harvested from maize plant approximately 11 days after pollination (DAP) when the immature embryo length is about 1 to 1.2 mm. Immature embryos are co-cultured with Agrobacterium tumefaciens containing the expression vector, and transgenic plants are recovered by organogenesis. Excised embryos are grown in callus induction medium, then corn regeneration medium, containing the selection agent (eg imidazolinone but various selection markers may be used). Petri dishes are incubated in light at 25 ° C for 2-3 weeks, or until buds develop. Green shoots are transferred from each embryo to maize rooting medium and incubated at 25 ° C for 2-3 weeks until roots develop. Rooted shoots are transplanted to soil in the greenhouse. T1 seeds are produced from plants that exhibit selection agent tolerance and contain a single copy of the T-DNA insert.

Transformação de trigoWheat processing

Transformação de trigo é realizada com o método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite (disponível a partir de CIMMYT, México) é comumente usada em transformação. Embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Depois de incubação com Agrobacterium, os embriões são crescidos in vitro em meio de indução de calo, então meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até que brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para meio de enraizamento e incubados a 25 0C por 2-3 semanas, até que raízes se desenvolvam. Os brotos com raiz são transplantados para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T- DNA.Wheat processing is performed with the method described by Ishida et al. (1996) Nature Biotech 14 (6): 745-50. The Bobwhite cultivar (available from CIMMYT, Mexico) is commonly used in processing. Immature embryos are co-cultured with Agrobacterium tumefaciens containing the expression vector, and transgenic plants are recovered by organogenesis. After incubation with Agrobacterium, the embryos are grown in vitro on callus-inducing medium, then regenerating medium, containing the selection agent (eg imidazolinone but various selection markers may be used). Petri dishes are incubated in light at 25 ° C for 2-3 weeks, or until buds develop. Green shoots are transferred from each embryo to rooting medium and incubated at 25 ° C for 2-3 weeks until roots develop. Rooted shoots are transplanted to soil in the greenhouse. T1 seeds are produced from plants which exhibit tolerance to the selection agent and which contain a single copy of the T-DNA insert.

Transformação de sojaSoybean Processing

Soja é transformada de acordo com uma modificação do método descrito na Patente Norte-Americana de Texas A&M 5.164.310. Diversas variedades comerciais de soja são receptivas para transformação por este método. A cultivar Jack (disponível a partir da Illinois Seed foundation) é comumente usada para transformação. Sementes de soja são esterilizadas para semeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados a partir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédone remanescente são adicionalmente crescidos para desenvolver nós axilares. Estes nós axilares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Depois do tratamento de co-cultivo, os explantes são lavados e transferidos para meio de seleção. Brotos regenerados são excisados e colocados em um meio de prolongamento de broto. Brotos menores do que 1 cm são colocados em meio de enraizamento até que raízes se desenvolvam. Os brotos com raiz são transplantados para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T- DNA.Soybean is transformed according to a modification of the method described in Texas A&M Patent 5,164,310. Several commercial soybean varieties are receptive to processing by this method. The Jack cultivar (available from the Illinois Seed foundation) is commonly used for processing. Soybean seeds are sterilized for in vitro sowing. The hypocotyl, radicle and cotyledon are excised from young seven-day-old seedlings. The epicotyl and the remaining cotyledon are further grown to develop axillary nodes. These axillary nodes are excised and incubated with Agrobacterium tumefaciens containing the expression vector. After the co-cultivation treatment, the explants are washed and transferred to selection medium. Regenerated shoots are excised and placed in a shoot extension medium. Sprouts smaller than 1 cm are placed in rooting medium until roots develop. Rooted shoots are transplanted to soil in the greenhouse. T1 seeds are produced from plants which exhibit tolerance to the selection agent and which contain a single copy of the T-DNA insert.

Transformação de colza/canolaRapeseed / canola transformation

Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6 dias de idade são usados como explantes para safra de tecido e transformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usada para transformação, mas outras variedades também podem ser usadas. Sementes de canola são superfície-esterilizadas para semeadura in vitro. Os explantes de pecíolo de cotilédone com o cotilédone acoplado são excisados das plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor de expressão) banhando a extremidade de corte do explante de pecíolo na suspensão bacteriana. Os explantes são então cultivados por 2 dias em meio MSBAP-3 contendo 3 mg/l de BAP, 3% de sacarose, 0,7% de pH ytagar a 23°C, 16 h de luz. Depois de dois dias de co-cultivo com Agrobacterium, os explantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e então cultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina e agente de seleção até regeneração de broto. Quando os brotos estão com 5 - 10 mm de comprimento, eles são cortados e transferidos para meio de prolongamento de broto (MSBAP-0,5, contendo 0,5 mg/l de BAP). Brotos de cerca de 2 cm de comprimento são transferidos para o meio de enraizamento (MSO) para indução de raiz. Os brotos com raiz são transplantados para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.Cotyledonary and hypocotyl petioles of 5-6 day old seedlings are used as tissue harvest explants and transformed according to Babic et al. (1998, Plant Cell Rep 17: 183-188). The commercial cultivar Westar (Agriculture Canada) is the standard variety used for processing, but other varieties can also be used. Canola seeds are surface-sterilized for in vitro sowing. Cotyledon petiole explants with coupled cotyledon are excised from seedlings in vitro, and inoculated with Agrobacterium (containing the expression vector) by bathing the cutting end of the petiole explant in the bacterial suspension. The explants are then cultured for 2 days in MSBAP-3 medium containing 3 mg / l BAP, 3% sucrose, 0.7% pH ytagar at 23 ° C, 16 h light. After two days of co-cultivation with Agrobacterium, petiole explants are transferred to MSBAP-3 medium containing 3 mg / l BAP, cefotaxime, carbenicillin, or timentin (300 mg / l) for 7 days, and then grown in MSBAP-3 medium with cefotaxime, carbenicillin, or timentin and selection agent until shoot regeneration. When the shoots are 5-10 mm long, they are cut and transferred to shoot extension medium (MSBAP-0.5 containing 0.5 mg / l BAP). Sprouts about 2 cm long are transferred to rooting medium (MSO) for root induction. Rooted shoots are transplanted to soil in the greenhouse. T1 seeds are produced from plants that exhibit selection agent tolerance and contain a single copy of the T-DNA insert.

Transformação de alfafaAlfalfa Transformation

Um clone regenerante de alfafa (Medicago sativa) é transformado usando o método de (McKersie et al., 1999 PIant physiol 119: 839-847). Regeneração e transformação de alfafa é dependente de genótipo e portanto uma planta regenerante é requerida. Métodos para obter plantas regenerantes foram descritos. Por exemplo, estas podem ser selecionadas a partir da cultivar Rangelander (Agriculture Canada) ou qualquer outra variedade comercial de alfafa como descrito por Brown DCW and A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, a variedade RA3 (University of Wisconsin) foi selecionada para uso em safra de tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolo são co-cultivados com uma safra noturna de Agrobacterium tumefaeiens C58C1 pMP90 (McKersie et al., 1999 Plant physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ L de tioprolina, 4,35 g/ L de K2SO4, e 100 μm de acetoseringona. Os explantes são lavados em meio Murashige-Skoog com meia força (Murashige and Skoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringona mas com um agente de seleção adequado e antibiótico adequado para inibir crescimento de Agrobaeterium. Depois de diversas semanas, embriões somáticos são transferidos para meio de desenvolvimento BOÍ2Y não contendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/L de sacarose. Embriões somáticos são subseqüentemente germinados em meio Murashige-Skoog com meia força. Plântulas enraizadas foram transplantadas em potes e crescidas em uma casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA. LISTAGEM DE SEOÜENCIASA regenerating alfalfa clone (Medicago sativa) is transformed using the method of (McKersie et al., 1999 PIant physiol 119: 839-847). Alfalfa regeneration and transformation is genotype dependent and therefore a regenerating plant is required. Methods to obtain regenerating plants have been described. For example, they may be selected from the cultivar Rangelander (Agriculture Canada) or any other commercial alfalfa variety as described by Brown DCW and Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternatively, the RA3 variety (University of Wisconsin) has been selected for use in tissue harvesting (Walker et al., 1978 Am J Bot 65: 654-659). Petiole explants are co-cultured with a nocturnal crop of Agrobacterium tumefaeiens C58C1 pMP90 (McKersie et al., 1999 Plant physiol 119: 839-847) or LBA4404 containing the expression vector. Explants are co-cultured for 3 d in the dark in SH induction medium containing 288 mg / l Pro, 53 mg / l thioproline, 4.35 g / l K2SO4, and 100 μm acetoseringone. The explants are washed in half-strength Murashige-Skoog medium (Murashige and Skoog, 1962) and placed in the same SH induction medium without acetoseringone but with a suitable selection agent and suitable antibiotic to inhibit Agrobaeterium growth. After several weeks, somatic embryos are transferred to BOY2 development medium containing no growth regulator, no antibiotic, and 50 g / L sucrose. Somatic embryos are subsequently germinated in Murashige-Skoog medium with half force. Rooted seedlings were transplanted into pots and grown in a greenhouse. T1 seeds are produced from plants that exhibit selection agent tolerance and contain a single copy of the T-DNA insert. SEO LISTING

<110> CropDesign N.V.<110> CropDesign N.V.

<120> "PLANTAS TENDO CARACTERÍSTICAS DE CRESCIMENTO MELHORADAS E MÉTODOS PARA FAZER AS MESMAS" PF57958 EP 05111597.0 2005-12-01 US 60/742,352 2005-12-05 EP 05111691.1 2005-12-05 EP 05111786.9 2005-12-07 <150> US 60/748,903 <151> 2005-12-08 <150> US 60/749,219 2005-12-09 EP 05111996.4 2005-12-12 <150> US 60/750,143 <151> 2005-12-14 <150> EP 05112562.3 2005-12-21 US 60/753,650 2005-12-23 EP 05113110.0 2005-12-30 EP 05113111.8<120> "PLANTS HAVING IMPROVED GROWTH CHARACTERISTICS AND METHODS FOR MAKING THE SAME" PF57958 EP 05111597.0 2005-12-01 US 60 / 742,352 2005-12-05 EP 05111691.1 2005-12-05 EP 05111786.9 2005-12-07 <150 > US 60 / 748,903 <151> 2005-12-08 <150> US 60 / 749,219 2005-12-09 EP 05111996.4 2005-12-12 <150> US 60 / 750,143 <151> 2005-12-14 <150> EP 05112562.3 2005-12-21 US 60 / 753,650 2005-12-23 EP 05113110.0 2005-12-30 EP 05113111.8

2005-12-30 US 60/756,0862005-12-30 US 60 / 756,086

2006-01-04 <150> US 60/756,042 <151> 2006-01-042006-01-04 <150> US 60 / 756,042 <151> 2006-01-04

285285

PatentIn versão 3.3 1PatentIn version 3.3 1

353 DNA353 DNA

<213> Oryza sativa <4 00> 1<213> Oryza sativa <4 00> 1

atggaaggtg taggtgctag gcagaggagg aaccctctga tacccagacc aaacggttca 60atggaaggtg taggtgctag gcagaggagg aaccctctga tacccagacc aaacggttca 60

aagaggcatc tgcagcatca gcatcagcca aatgctgccg agaagaagac cgccgcgaca 120 tcgaattact tcagtatcga ggcgttcctc gtgctcgtct tcctcaccat gtcattgctc 180 atacttccat tggtgcttcc cccattgcct ccgccgccat cgctgctgct gctgctgcca 240 gtctgcctgc tcatcctgct ggttgtgctg gccttcatgc caacggatgt gcggagcatg 300aagaggcatc tgcagcatca gcatcagcca aatgctgccg agaagaagac cgccgcgaca 120 tcgaattact tcagtatcga ggcgttcctc gtgctcgtct tcctcaccat gtcattgctc 180 atacttccat tggtgcttcc cccattgcct ccgccgccat cgctgctgct gctgctgcca 240 gtctgcctgc tcatcctgct ggttgtgctg gccttcatgc caacggatgt 300 gcggagcatg

<130> <150> <151> <150> <151> <150> <151> <150> <151><130> <150> <151> <150> <151> <150> <151> <150> <151>

<151> <150> <151><151> <150> <151>

<151> <150> <151> <150> <151> <150> <151> <150> <151><151> <150> <151> <150> <151> <150> <151> <150> <151>

<160> <17 0> <210> <211> <212><160> <17 0> <210> <211> <212>

gcttcctctt acttgtaaat acatctccta ggggaattta tttttgtttt tga <210> 2 <211> 105 <212> PRTgcttcctctt acttgtaaat acatctccta ggggaattta tttttgtttt tga <210> 2 <211> 105 <212> PRT

<213> Oryza sativa <400> 2<213> Oryza sativa <400> 2

Met Glu Gly Val Gly Ala Arg Gln Arg Arg Asn Pro Leu Ile Pro Arg 1 5 10 15Met Glu Gly Val Gly Arg Wing Arg Gln Arg Arg Asn Pro Read Ile Pro Arg 1 5 10 15

Pro Asn Gly Ser Lys Arg His Leu Gln His Gln His Gln Pro Asn AlaPro Asn Gly Be Lys Arg His Leu Gln His Gln His Gln Pro Asn Ala

20 25 3020 25 30

Ala Glu Lys Lys Thr Ala Ala Thr Ser Asn Tyr Phe Ser Ile Glu AlaGlu Wing Lys Lys Thr Wing Wing Thr Be Asn Tyr Phe Ser Ile Glu Wing

35 40 4535 40 45

Phe Leu Val Leu Val Phe Leu Thr Met Ser Leu Leu Ile Leu Pro LeuPhe Leu Val Leu Val Phe Leu Thr Met Ser Leu Leu Ile Leu Pro Leu

50 55 6050 55 60

Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu Leu Leu Leu Leu Pro 65 70 75 80Val Leu Pro Pro Leu Pro Pro Pro Ser Leu Leu Leu Leu Pro 65 70 75 80

353 Val Cys Leu Leu Ile Leu Leu Val Val Leu Ala Phe Met Pro Thr Asp353 Val Cys Leu Leu Ile Leu Leu Val Val Leu Wing Phe Met Pro Thr Asp

85 90 9585 90 95

Val Arg Ser Met Ala Ser Ser Tyr Leu 100 105Val Arg Be Met Wing Be Ser Tyr Leu 100 105

<210> 3 <211> 56 <212> DNA<210> 3 <211> 56 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm08170 <400> 3<223> initiator: prm08170 <400> 3

ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga aggtgtaggt gctagg 56ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga aggtgtaggt gctagg 56

<210> 4 <211> 51 <212> DNA<210> 4 <211> 51 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm08171 <400> 4<223> initiator: prm08171 <400> 4

ggggaccact ttgtacaaga aagctgggtc aaaaacaaaa ataaattccc c 51ggggaccact ttgtacaaga aagctgggtc aaaaacaaaa ataaattccc c 51

<210> 5<210> 5

<211> 2193<211> 2193

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 5<400> 5

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttc 2193aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaac the gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattg attgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttc 2193

<210> 6 <211> 3 <212> PRT<210> 6 <211> 3 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo conservado Ia <400> 6 Tyr Phe Ser 1<223> motif saved Ia <400> 6 Tyr Phe Ser 1

<210> 7 <211> 3 <212> PRT<210> 7 <211> 3 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo conservado Ib <400> 7 Tyr Phe Thr 1<223> conserved motif Ib <400> 7 Tyr Phe Thr 1

<210> 8 <211> 3 <212> PRT<210> 8 <211> 3 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo conservado Ic <400> 8 Tyr Phe Gly 1<223> conserved motif Ic <400> 8 Tyr Phe Gly 1

<210> 9 <211> 3 <212> PRT<210> 9 <211> 3 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo conservado Id <400> 9 Tyr Leu Gly 1<223> motif retained Id <400> 9 Tyr Leu Gly 1

<210> 10 <211> 7 <212> PRT<210> 10 <211> 7 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo conservado 2 <220><223> Subject retained 2 <220>

<221> VARIANTE <222> (1)..(1)<221> VARIANT <222> (1) .. (1)

<223> /substituir="Ala" /substituir="Ile" <220><223> / replace = "Wing" / replace = "Ile" <220>

<221> VARIANTE<221> VARIANT

<222> (7)..(7)<222> (7) .. (7)

<223> /substituir="Ser"<223> / replace = "Be"

<400> 10<400> 10

Val Leu Ala Phe Met Pro Thr 1 5Val Leu Wing Phe Met Pro Thr 1 5

<210> 11 <211> 3 <212> PRT<210> 11 <211> 3 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo conservado 3 <220><223> Subject retained 3 <220>

<221> VARIANTE <222> (1)..(1) <223> /substituir="Pro" <400> 11 Ser Tyr Leu 1<221> VARIANT <222> (1) .. (1) <223> / replace = "Pro" <400> 11 Ser Tyr Leu 1

<210> 12 <211> 178 <212> PRT<210> 12 <211> 178 <212> PRT

<213> Oryza sativa <4 00> 12<213> Oryza sativa <4 00> 12

Met Tyr Leu Leu Ser Pro Arg Asn Gly Asp Glu Glu Asp Glu Gln Glu 1 5 10 15Met Tyr Leu Read To Be Pro Arg Asn Gly Asp Glu Glu Asp Glu Gln Glu 1 5 10 15

Glu Ile Gln Glu Leu Ile Ser Asp Asp Glu Pro Pro Asn Leu Lys LeuGlu Ile Gln Glu Leu Ile Ser Asp Asp Glu Pro Pro Asn Leu Lys Leu

20 25 3020 25 30

Ala Ser Cys Ala Thr Ala Ala Ser Ser Ser Ser Ser Ser Gly Ser AspAla Ser Cys Ala Thr Ala Ala Ser Ser Ser Ser Ser Gly Ser Asp

35 40 4535 40 45

Met Glu Lys Gly Arg Gly Lys Ala Cys Gly Gly Gly Ser Thr Ala ProMet Glu Lys Gly Arg Gly Lys Wing Cys Gly Gly Gly Be Thr Wing Pro

50 55 6050 55 60

Pro Pro Pro Pro Pro Ser Ser Ser Gly Lys Ser Gly Gly Gly Gly Gly 65 70 75 80Pro Pro Pro Pro Pro Be Ser Gly Lys Ser Gly Gly Gly Gly Gly Gly 65 70 75 80

Ser Asn Ile Arg Glu Ala Ala Ala Ser Gly Gly Gly Gly Gly Val TrpBe Asn Ile Arg Glu Wing Wing Wing Be Gly Gly Gly Gly Gly Val Trp

85 90 9585 90 95

Gly Lys Tyr Phe Ser Val Glu Ser Leu Leu Leu Leu Val Cys Val ThrGly Lys Tyr Phe Ser Val Glu Ser Leu Leu Leu Leu Val Cys Val Thr

100 105 110100 105 110

Ala Ser Leu Val Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro ProWing Ser Leu Val Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro

115 120 125115 120 125

Pro Ser Met Leu Met Leu Val Pro Val Ala Met Leu Val Leu Leu LeuPro Be Met Leu Met Leu Val Pro Val Wing Met Leu Val Leu Leu Leu

130 135 140130 135 140

Ala Leu Ala Phe Met Pro Thr Thr Thr Ser Ser Ser Ser Ser Ala Gly 145 150 155 160Ala Leu Ala Phe Met Pro Thr Thr Thr Ser Ser Ser Ser Ser Ga 145 150 155 160

Gly Gly Gly Gly Gly Gly Arg Asn Gly Ala Thr Thr Gly His Ala Pro 165 170 175Gly Gly Gly Gly Gly Gly Gly Arg Asn Gly Wing Thr Thr Gly His Wing Pro 165 170 175

Tyr LeuTyr leu

<210> 13 <211> 126 <212> PRT<210> 13 <211> 126 <212> PRT

<213> Oryza sativa <4 00> 13<213> Oryza sativa <4 00> 13

Met Leu Leu Glu His Leu Met Ile Thr Met Glu Glu Gln Met Phe Arg 15 10 15Met Leu Leu Glu His Leu Met Ile Thr Met Glu Glu Gln Met Phe Arg 15 10 15

Glu Gln Gln Met Gln Arg Gly Gly Arg His His Gln His His Thr ThrGlu Gln Gln Met Gln Arg Gly Gly Arg His His

20 25 3020 25 30

Arg Glu Gln Glu Gln Gln Gln Lys Gln Gln Gln Arg Arg Arg Leu MetArg Glu Gln Glu Gln Gln Gln Lys Gln Gln Gln Arg Arg Arg Arg Read Le Met

35 40 4535 40 45

Asn Asn Ala Thr Asn Gly Gly Gly Gly Asp Gly Gly Ser Arg Cys TyrAsn Asn Ala Thr Asn Gly Gly Gly Gly Asp Gly Gly Being Arg Cys Tyr

50 55 6050 55 60

Phe Ser Thr Glu Ala Ile Leu Val Leu Ala Cys Val Thr Val Ser Leu 65 70 75 80Phe Ser Thr Glu Wing Ile Leu Val Leu Val Cys Wing Val Thr Val Ser Leu 65 70 75 80

Leu Val Leu Pro Leu Ile Leu Pro Pro Leu Pro Pro Pro Pro Thr LeuLeu Val Leu Pro Leu Ile Leu Pro Pro Leu Pro Pro Pro Thr Leu

85 90 9585 90 95

Leu Leu Leu Leu Pro Val Cys Leu Leu Ala Leu Leu Val Val Leu AlaLeu Leu Leu Leu Pro Val Cys Leu Leu Wing Leu Leu Val Val Leu Wing

100 105 110100 105 110

Phe Met Pro Thr Asp Met Arg Thr Met Ala Ser Ser Tyr Leu 115 120 125Phe Met Pro Thr Asp Met Arg Thr Met Wing Be Ser Tyr Leu 115 120 125

<210> 14 <211> 105 <212> PRT <213> Zea mays <220><210> 14 <211> 105 <212> PRT <213> Zea mays <220>

<221> INSEGURO <222> (65)..(75)<221> UNSAFE <222> (65) .. (75)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <4 00> 14<223> Xaa can be any naturally occurring amino acid <4 00> 14

Met Ala Ser Arg Ser Ser Ala Met Glu Gly Gly Ala Ala Ile Gln Arg 15 10 15 Arg Asn Ala Val Lys Arg His Leu Gln Gln Arg Gln Gln Glu Ala AspMet Wing Be Arg Be Be Wing Met Glu Gly Gly Wing Wing Ile Gln Arg 15 10 15 Arg Asn Wing Val Lys Arg His Leu Gln Gln Arg Gln Gln Glu Wing Asp

20 25 3020 25 30

Phe Leu Asp Lys Lys Val Ile Ala Ser Thr Tyr Phe Ser Ile Gly AlaPhe Le Asp Lys Lys Val Ile Wing Be Thr Tyr Phe Be Ile Gly Wing

35 40 4535 40 45

Phe Leu Val Leu Ala Cys Leu Thr Val Ser Leu Leu Ile Leu Pro LeuPhe Leu Val Leu Cys Wing Leu Thr Val Ser Leu Leu Ile Leu Pro Leu

50 55 6050 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Leu Trp Leu Pro 65 70 75 80Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Leu Trp Leu Pro 65 70 75 80

Val Cys Leu Leu Val Leu Leu Val Val Leu Ala Phe Met Pro Thr AspVal Cys Leu Leu Val Leu Leu Val Val Leu Wing Phe Met Pro Thr Asp

85 90 9585 90 95

Val Arg Ser Met Ala Ser Ser Tyr Leu 100 105Val Arg Be Met Wing Be Ser Tyr Leu 100 105

<210> 15 <211> 110 <212> PRT<210> 15 <211> 110 <212> PRT

<213> Triticum aestivum <400> 15<213> Triticum aestivum <400> 15

Met Asp Ser Gln Phe Gly Ala Leu Glu Arg Gly Gly Ser Arg Gln Arg 1 5 10 15Met Asp Be Gln Phe Gly Wing Read Glu Arg Gly Gly Be Arg Gln Arg 1 5 10 15

Arg Ser Pro Val Leu Ala Arg Pro Asn Thr Thr Lys Arg His Ile GlnArg Be Pro Val Leu Wing Arg Pro Asn Thr Thr Lys Arg His Ile Gln

20 25 3020 25 30

Gln Gln Arg Ala Asn Ala Ala Asp Lys Lys Val Val Met Pro Asn TyrGln Gln Arg Wing Asn Wing Wing Asp Lys Val Val Val Met Asn Tyr

35 40 4535 40 45

Phe Ser Ile Glu Ala Phe Phe Val Leu Ala Cys Leu Thr Val Ser LeuPhe Ser Ile Glu Wing Phe Phe Val Leu Cys Wing Leu Thr Val Ser Leu

50 55 6050 55 60

Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu 65 70 75 80Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Leu 65 70 75 80

Leu Leu Phe Val Pro Val Cys Leu Leu Ile Leu Leu Met Val Leu AlaLeu Leu Phe Val Pro Val Cys Leu Leu Ile Leu Leu Met Val Leu Wing

85 90 9585 90 95

Phe Met Pro Thr Asp Met Arg Ser Met Ala Thr Ser Tyr Leu 100 105 110Phe Met Pro Thr Asp Met Arg Be Met Wing Thr Be Tyr Leu 100 105 110

<210> 16 <211> 110 <212> PRT<210> 16 <211> 110 <212> PRT

<213> Hordeum vulgare <400> 16<213> Hordeum vulgare <400> 16

Met Asp Ser Gln Phe Gly Ala Met Asp Arg Gly Gly Ser Arg Gln Arg 15 10 15Met Asp Be Gln Phe Gly Wing Met Asp Be Gln Phe Gly Arg 15 15 15

Ser Ser Pro Val Leu Ala Arg Pro Asn Thr Ala Lys Arg Gln Met GlnSer Ser Pro Val Leu Arg Wing Pro Asn Thr Wing Lys Arg Gln Met Gln

20 25 3020 25 30

Gln Gln Arg Ala Asn Ala Ala Asp Lys Lys Val Val Ile Pro Asn TyrGln Gln Arg Wing Asn Wing Wing Asp Wing Val Lys Val Val Ile Pro Asn Tyr

35 40 4535 40 45

Phe Gly Val Glu Ala Phe Phe Val Leu Ala Cys Leu Thr Val Ser LeuPhe Gly Val Glu Wing Phe Phe Val Leu Cys Wing Leu Thr Val Ser Leu

50 55 6050 55 60

Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu 65 70 75 80Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Leu 65 70 75 80

Leu Leu Leu Leu Pro Val Cys Leu Leu Ile Leu Leu Met Val Leu AlaLeu Leu Leu Leu Pro Val Cys Leu Leu Ile Leu Leu Met Val Leu Wing

85 90 9585 90 95

Phe Met Pro Thr Asp Val Arg Ser Met Ala Thr Ser Tyr Leu 100 105 110Phe Met Pro Thr Asp Val Arg Be Met Wing Thr Be Tyr Leu 100 105 110

<210> 17 <211> 99 <212> PRT<210> 17 <211> 99 <212> PRT

<213> Saccharum officinarum <220><213> Saccharum officinarum <220>

<221> INSEGURO <222> (62) .. (62)<221> UNSAFE <222> (62) .. (62)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <4 00> 17<223> Xaa can be any naturally occurring amino acid <4 00> 17

Met Glu Gly Gly Gly Gln Ile Gln Arg Arg Asn Asn Ala Val Lys Arg 15 10 15Met Glu Gly Gly Gly Glly Ile Gln Arg Arg Asn Asn Wing Val Lys Arg 15 10 15

His Leu Gln Gln Arg Gln Gln Glu Ala Asp Phe Leu Asp Lys Lys Val 20 25 30 Ile Ala Ser Thr Tyr Phe Ser Ile Glu Ala Phe Leu Val Leu Ala CysHis Leu Gln Gln Arg Gln Gln Glu Wing Asp Phe Leu Asp Lys Lys Val 20 25 30 Ile Wing Be Thr Tyr Phe Be Ile Glu Wing Phe Leu Val Leu Wing Cys

35 40 4535 40 45

Leu Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Xaa Leu ProLeu Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Xaa Leu Pro

50 55 6050 55 60

Ala Pro Ala Ser Leu Leu Leu Trp Leu Pro Val Trp Leu Leu Glu Leu 65 70 75 80Pro Wing Al Ser Ser Leu Leu Leu Trp Leu Pro Val Trp Leu Leu Glu Leu 65 70 75 80

Leu Ile Val Leu Ala Phe Met Pro Thr Asp Val Arg Ser Met Ala Ser 85 90 95Leu Ile Val Leu Phe Wing Pro Thr Thr Asp Val Arg Be Met Wing Ser 85 90 95

Ser Tyr LeuSer Tyr Leu

<210> 18 <211> 99 <212> PRT<210> 18 <211> 99 <212> PRT

<213> Saccharum officinarum <4 00> 18<213> Saccharum officinarum <4 00> 18

Met Glu Gly Gly Gly Gln Ile Gln Arg Arg Asn Asn Ala Val Lys Arg 1 5 10 15Met Glu Gly Gly Gly Glly Ile Gln Arg Arg Asn Asn Wing Val Lys Arg 1 5 10 15

His Leu Gln Gln Arg Gln Gln Glu Ala Asp Phe Leu Asp Lys Lys ValHis Leu Gln Gln Arg Gln Gln Glu Wing Asp Phe Read Asp Lys Lys Val

20 25 3020 25 30

Ile Ala Ser Thr Tyr Phe Ser Ile Glu Ala Phe Leu Val Leu Ala CysIle Wing Be Thr Tyr Phe Be Ile Glu Wing Phe Leu Val Leu Wing Cys

35 40 4535 40 45

Leu Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Pro Leu ProLeu Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro

50 55 6050 55 60

Pro Pro Pro Ser Leu Leu Leu Trp Leu Pro Val Cys Leu Leu Ile Leu 65 70 75 80Pro Pro Pro Ser Leu Leu Leu Trp Leu Pro Val Cys Leu Leu Ile Leu 65 70 75 80

Leu Ile Val Leu Ala Phe Met Pro Thr Asp Val Arg Ser Met Ala Ser 85 90 95Leu Ile Val Leu Phe Wing Pro Thr Thr Asp Val Arg Be Met Wing Ser 85 90 95

Ser Tyr LeuSer Tyr Leu

<210> 19 <211> 107 <212> PRT<210> 19 <211> 107 <212> PRT

<213> Sorghum bicolor <4 00> 19<213> Sorghum bicolor <4 00> 19

Met Ala Ser Arg Ser Ser Ala Leu Glu Gly Gly Gly Ala Ala Ile Gln 15 10 15Met Wing Be Arg Be Wing Wing Read Glu Gly Gly Gly Wing Wing Ile Gln 15 10 15

Arg Arg Asn Asn Ala Val Lys Arg His Leu Gln Gln Arg Gln Gln GluArg Arg Asn Asn Wing Val Lys Arg His Leu Gln Gln Arg Gln Gln Glu

20 25 3020 25 30

Ala Asp Phe His Asp Lys Lys Val Ile Ala Ser Thr Tyr Phe Ser IleWing Asp Phe His Asp Lys Lys Val Ile Wing Be Thr Tyr Phe Ser Ile

35 40 4535 40 45

Gly Ala Phe Leu Val Leu Ala Cys Leu Thr Phe Ser Leu Leu Ile LeuGly Wing Phe Leu Val Leu Cys Wing Leu Thr Phe Ser Leu Leu Ile Leu

50 55 6050 55 60

Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu Leu Leu Trp 65 70 75 80Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Ser Leu Leu Leu Trp 65 70 75 80

Leu Pro Val Cys Leu Leu Val Leu Leu Val Val Leu Ala Phe Met ProLeu Pro Val Cys Leu Leu Val Leu Leu Val Val Leu Phe Met Pro Wing

85 90 9585 90 95

Thr Asp Val Arg Ser Val Ala Ala Ser Tyr Leu 100 105Thr Asp Val Arg Be Val Wing Wing Be Tyr Leu 100 105

<210> 20 <211> 130 <212> PRT<210> 20 <211> 130 <212> PRT

<213> Arabidopsis thaliana <400> 20<213> Arabidopsis thaliana <400> 20

Met Ile Arg Glu Ile Ser Asn Leu Gln Lys Asp Ile Ile Asn Ile Gln 15 10 15Met Ile Arg Glu Ile Ser Asn Leu Gln Lys Asp Ile Ile Asn Ile Gln 15 10 15

Asp Ser Tyr Ser Asn Asn Arg Val Met Asp Val Gly Arg Asn Asn ArgAsp Be Tyr Be Asn Asn Arg Val Met Asp Val Gly Arg Asn Asn Arg

20 25 3020 25 30

Lys Asn Met Ser Phe Arg Ser Ser Pro Glu Lys Ser Lys Gln Glu LeuLys Asn Met Be Phe Arg Be Pro Glu Lys Be Lys Gln Glu Leu

35 40 4535 40 45

Arg Arg Ser Phe Ser Ala Gln Lys Arg Met Met Ile Pro Ala Asn TyrArg Arg Be Phe Be Wing Gln Lys Arg Met Met Ile Pro Wing Asn Tyr

50 55 6050 55 60

Phe Ser Leu Glu Ser Leu Phe Leu Leu Val Gly Leu Thr Ala Ser Leu 65 70 75 80 Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Phe MetPhe Ser Leu Glu Ser Leu Phe Leu Leu Val Gly Leu Thr Wing Ala Leu 65 70 75 80 Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Phe Met

85 90 9585 90 95

Leu Leu Leu Val Pro Ile Gly Ile Met Val Leu Leu Val Val Leu AlaLeu Leu Leu Val Pro Ile Gly Ile Met Val Leu Leu Val Val Leu Wing

100 105 110100 105 110

Phe Met Pro Ser Ser His Ser Asn Ala Asn Thr Asp Val Thr Cys Asn 115 120 125Phe Met Pro To Be His To Be Asn Wing Asn Thr Asp Val Thr Cys Asn 115 120 125

Phe Met 130 <210> 21 <211> 135 <212> PRTPhe Met 130 <210> 21 <211> 135 <212> PRT

<213> Arabidopsis thaliana <400> 21<213> Arabidopsis thaliana <400> 21

Met Ile Arg Glu Phe Ser Ser Leu Gln Asn Asp Ile Ile Asn Ile Gln 1 5 10 15Met Ile Arg Glu Phe Ser Be Leu Gln Asn Asp Ile Ile Asn Ile Gln 1 5 10 15

Glu His Tyr Ser Leu Asn Asn Asn Met Asp Val Arg Gly Asp His AsnGlu His Tyr Ser Leu Asn Asn Asn Met Asp Val Arg Gly Asp His Asn

20 25 3020 25 30

Arg Lys Asn Thr Ser Phe Arg Gly Ser Ala Pro Ala Pro Ile Met GlyArg Lys Asn Thr Be Phe Arg Gly Be Ala Pro Ala Pro Ile Met Gly

35 40 4535 40 45

Lys Gln Glu Leu Phe Arg Thr Leu Ser Ser Gln Asn Ser Pro Arg ArgLys Gln Glu Read Phe Arg Thr Read It Be Ser Gln Asn Be Pro Arg Arg

50 55 6050 55 60

Leu Ile Ser Ala Ser Tyr Phe Ser Leu Glu Ser Met Val Val Leu Val 65 70 75 80Leu Ile Ser Ala Ser Tyr Phe Ser Leu Glu Ser Met Val Val Leu Val 65 70 75 80

Gly Leu Thr Ala Ser Leu Leu Ile Leu Pro Leu Ile Leu Pro Pro LeuGly Leu Thr Wing Be Leu Leu Ile Leu Pro Leu Ile Leu Pro Pro Leu

85 90 9585 90 95

Pro Pro Pro Pro Phe Met Leu Leu Leu Ile Pro Ile Gly Ile Met ValPro Pro Pro Pro Phe Met Leu Leu Leu Ile Pro Ile Gly Ile Met Val

100 105 110100 105 110

Leu Leu Met Val Leu Ala Phe Met Pro Ser Ser Asn Ser Lys His ValLeu Leu Met Val Leu Wing Phe Met Pro Be Ser Asn Ser Lys His Val

115 120 125115 120 125

Ser Ser Ser Ser Thr Phe Met 130 135Being Being Being Being Thr Phe Met 130 135

<210> 22 <211> 139 <212> PRT<210> 22 <211> 139 <212> PRT

<213> Vitis vinifera <400> 22<213> Vitis vinifera <400> 22

Met Ser Ile Glu Gln Pro Glu Ala Asp Ser Arg Leu Ser Glu Gly Pro 1 5 10 15Met Ser Ile Glu Gln Pro Glu Wing Asp Be Arg Read Le Be Glu Gly Pro 1 5 10 15

Leu Ile Asn Leu Gln Asp Arg Tyr Leu Ser Gly Ile Met Glu Ala ArgLeu Ile Asn Leu Gln Asp Arg Tyr Leu Ser Gly Ile Met Glu Ala Arg

20 25 3020 25 30

Gly Arg Arg Asn Ser Ala Pro Leu Gln Val Glu Arg Lys Asn Pro ThrGly Arg Arg Asn Be Pro Wing Read Gln Val Glu Arg Lys Asn Pro Thr

35 40 4535 40 45

Pro Pro Met Ala Glu Gly Lys Lys Met Glu Tyr Asn Arg Thr Pro LeuPro Pro Met Glu Wing Gly Lys Lys Met Glu Tyr Asn Arg Thr Pro Leu

50 55 6050 55 60

Ser Arg Glu Asn Ser Arg Arg Leu Ile Pro Ala Ser Tyr Phe Ser Leu 65 70 75 80Ser Arg Glu Asn Ser Arg Arg Leu Ile Pro Wing Ser Tyr Phe Ser Leu 65 70 75 80

Glu Ser Leu Leu Leu Leu Ile Cys Leu Thr Ala Ser Leu Leu Ile LeuGlu Ser Leu Leu Leu Leu Ile Cys Leu Thr Ala Ser Leu Leu Ile Leu

85 90 9585 90 95

Pro Leu Ile Leu Pro Pro Leu Pro Pro Pro Pro Phe Met Leu Leu LeuPro Leu Ile Leu Pro Pro Leu Pro Pro Pro Phe Met Leu Leu Leu

100 105 110100 105 110

Leu Pro Ile Gly Ile Leu Ala Val Leu Met Ile Leu Ala Phe Met ProLeu Pro Ile Gly Ile Leu Val Wing Leu Met Ile Leu Phe Met Pro Wing

115 120 125115 120 125

Ser Asn Val Arg Asp Leu Thr Tyr Thr Tyr ValSer Asn Val Arg Asp Read Thr Tyr Thr Tyr Val

130 135130 135

<210> 23 <211> 126 <212> PRT <213> Citrus sp. <220><210> 23 <211> 126 <212> PRT <213> Citrus sp. <220>

<221> INSEGURO <222> (103)..(103)<221> UNSAFE <222> (103) .. (103)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 23 Met Asn Ser Asp Asn Ser Glu Ser Arg Gln Arg Leu Ser Lys Gly Ile 15 10 15<223> Xaa can be any naturally occurring amino acid <400> 23 Met Asn Ser Asp Asn Ser Glu Ser Arg Gln Arg Leu Ser Lys Gly Ile 15 10 15

Ile Asn Leu Gln Asp Arg Tyr Pro Thr Ser Ile Met Asp Arg Gly ValIle Asn Read Gln Asp Arg Tyr Pro Thr Be Ile Met Asp Arg Gly Val

20 25 3020 25 30

Arg Lys Ile Ala Thr Pro Pro Val Glu Lys Arg Lys Val Glu Tyr HisArg Lys Ile Wing Pro Pro Val Glu Lys Arg Lys Val Glu Tyr His

35 40 4535 40 45

Arg Ser Tyr Ser Gln Gly Ala Ser Arg Lys Leu Phe Ser Ala Ser TyrArg Be Tyr Be Gln Gly Wing Be Arg Lys Read Phe Be Wing Be Tyr

50 55 6050 55 60

Phe Thr Leu Glu Ser Leu Leu Leu Leu Val Cys Leu Thr Ala Ser Leu 65 70 75 80Phe Thr Leu Glu Ser Leu Leu Leu Leu Val Cys Leu Thr Ala Ser Leu 65 70 75 80

Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Pro Phe LeuLeu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro Pro Phe Leu

85 90 9585 90 95

Leu Leu Leu Val Pro Ile Xaa Ile Leu Ala Val Leu Leu Val Leu AlaLeu Leu Leu Val Pro Ile Xaa Ile Leu Wing Val Leu Leu Val Leu Wing

100 105 110100 105 110

Phe Met Pro Ser Asn Val Arg Asp Ile Thr Ser Thr Tyr Val 115 120 125Phe Met Pro Being Asn Val Arg Asp Ile Thr Being Thr Tyr Val 115 120 125

<210> 24 <211> 118 <212> PRT<210> 24 <211> 118 <212> PRT

<213> Lycorpersicon esculentum <400> 24<213> Lycorpersicon esculentum <400> 24

Met Asn Met Asp Met Glu Ser Ser Glu Ala Lys Leu Arg Ser Ser Lys 15 10 15Met Asn Met Asp Met Glu Be Glu Ala Lys Leu Arg Be Ser Lys 15 10 15

Gly Phe Ile Asn Leu Glu Glu His Gln Gln Tyr Phe Asn Asn Ile MetGly Phe Asle Asn Leu Glu Glu His Gln Tyr Phe Asn Asn Ile Met

20 25 3020 25 30

Glu Gly Asn Lys Met Glu His Lys Arg Ser Phe Thr Gln Gly His GlyGlu Gly Asn Lys Met Glu His Lys Arg Be Phe Thr Gln Gly His Gly

35 40 4535 40 45

Lys Lys Met Leu Ser Met Asn Tyr Phe Ser Leu Glu Ser Ile Ile LeuLys Lys Met Leu Be Met Asn Tyr Phe Be Leu Glu Be Ile Ile Leu

50 55 6050 55 60

Leu Leu Gly Leu Thr Ala Ser Leu Leu Leu Leu Pro Leu Met Leu Pro 65 70 75 80Leu Leu Gly Leu Thr Wing Ser Leu Leu Leu Leu Pro Leu Met Leu Pro 65 70 75 80

Pro Leu Pro Pro Pro Pro Phe Met Leu Leu Leu Val Pro Ile Phe IlePro Leu Pro Pro Pro Phe Met Leu Leu Leu Val Pro Ile Phe Ile

85 90 9585 90 95

Leu Val Val Leu Met Ile Leu Ala Phe Met Pro Ser Asn Val Arg AsnLeu Val Val Leu Met Ile Leu Wing Phe Met Pro Ser Asn Val Arg Asn

100 105 110100 105 110

Val Thr Cys Ser Tyr Leu 115Val Thr Cys Ser Tyr Leu 115

<210> 25 <211> 87 <212> PRT<210> 25 <211> 87 <212> PRT

<213> Lycorpersicon esculentum <400> 25<213> Lycorpersicon esculentum <400> 25

Met Glu Gly Asn Lys Met Glu His Lys Arg Ser Phe Thr Gln Gly His 15 10 15Met Glu Gly Asn Lys Met Glu His Lys Arg Be Phe Thr Gln Gly His 15 10 15

Gly Lys Lys Met Leu Ser Met Asn Tyr Phe Ser Leu Glu Ser Ile IleGly Lys Lys Met Leu Be Met Asn Tyr Phe Be Read Glu Be Ile Ile

20 25 3020 25 30

Leu Leu Leu Gly Leu Thr Ala Ser Leu Leu Leu Leu Pro Leu Met LeuLeu Leu Leu Gly Leu Thr Wing Ser Leu Leu Leu Leu Pro Leu Met Leu

35 40 4535 40 45

Pro Pro Leu Pro Pro Pro Pro Phe Met Leu Leu Leu Val Pro Ile PhePro Pro Leu Pro Pro Pro Phe Met Leu Leu Leu Val Pro Ile Phe

50 55 6050 55 60

Ile Leu Val Val Leu Met Ile Leu Ala Phe Met Pro Ser Asn Val Arg 65 70 75 80Ile Leu Val Val Leu Met Ile Leu Wing Phe Met Pro Ser Asn Val Arg 65 70 75 80

Asn Val Thr Cys Ser Tyr Leu 85Asn Val Thr Cys Ser Tyr Leu 85

<210> 26 <211> 106 <212> PRT<210> 26 <211> 106 <212> PRT

<213> Arabidopsis thaliana <400> 26<213> Arabidopsis thaliana <400> 26

Met Asp Val Gly Arg Asn Asn Arg Lys Asn Met Ser Phe Arg Ser Ser 15 10 15Met Asp Val Gly Arg Asn Asn Arg Lys Asn Met Be Phe Arg Be Ser 15 10 15

Pro Glu Lys Ser Lys Gln Glu Leu Arg Arg Ser Phe Ser Ala Gln Lys 20 25 30 gaggaggacg aagttggcat aagggaagag tcgtcaggta ggcggcggcg gtgacggcgt atgctgatgc acgacgacgt acgacgggacPro Glu Lys Be Lys Gln Glu Read Le Arg Arg Be Phe Be Wing Gln Lys 20 25 30

Arg Met Met Ile Pro Ala Asn Tyr Phe Ser LeuArg Met Met Ile Pro Wing Asn Tyr Phe Ser Leu

35 4035 40

Leu Val Gly Leu Thr Alá Ser Leu Leu Ile LeuLeu Val Gly Leu Thr Allah Be Leu Leu Ile Leu

50 5550 55

Pro Leu Pro Pro Pro Pro Phe Met Leu Leu Leu 65 70 75Pro Leu Pro Pro Pro Phe Met Leu Leu 65 70 75

Met Val Leu Leu Val Val Leu Ala Phe Met ProMet Val Leu Leu Val Val Leu Wing Phe Met Pro

85 9085 90

Ala Asn Thr Asp Val Thr Cys Asn Phe Met 100 105Wing Asn Thr Asp Val Thr Cys Asn Phe Met 100 105

<210> 27<210> 27

<211> 537<211> 537

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 27<400> 27

atgtacttgt tgagcccaag aaatggcgac ctgatcagcg acgacgagcc gcccaatctc agcagcagca gcagcggcag cgacatggag agtacggcgc cgccgccgcc gccgccgtcg agcaatatca gggaggcggc ggctagcggc tcggtggagt cgctgctcct gctggtgtgc gtgctgccgc cgctgccccc gccgccgtcg gtgctgctgc tggcgctggc gttcatgccg ggcggcggcg gcggcggccg caatggggcg <210> 28 <211> 538 <212> DNA <213> Zea mays <220>atgtacttgt tgagcccaag aaatggcgac ctgatcagcg acgacgagcc gcccaatctc agcagcagca gcagcggcag cgacatggag agtacggcgc cgccgccgcc gccgccgtcg agcaatatca gggaggcggc ggctagcggc tcggtggagt cgctgctcct gctggtgtgc gtgctgccgc cgctgccccc gccgccgtcg gtgctgctgc tggcgctggc gttcatgccg ggcggcggcg gcggcggccg caatggggcg <210> 28 <211> 538 <212> DNA <213> Zea mays <220>

<221> misc_feature <222> (177)..(208) <223> η is a, c, g, <220><221> misc_feature <222> (177) .. (208) <223> η is a, c, g, <220>

<221> misc_feature <222> (493)..(493) <223> η is a, c, g, <400> 28<221> misc_feature <222> (493) .. (493) <223> η is a, c, g, <400> 28

ttcacattac actcatgact cgtcttagga ctggccaaga cctatttatc tatttacagg ggcatgaagg ccagtacaac cagcaagacg nnnnnnnnnn nnnnnnnnnn nnnnnnnncc caggcgagca cgaggaatgc cccgatgctg aggaaatccg cctcctgctg acgctgctgc attgccgccc ctccttccat cgcgctagat gaggtggaga ccagtcgcag tgagtggttg agaaccgcct tgngttttct gaacgttttg <210> 29 <211> 578 <212> DNAttcacattac actcatgact cgtcttagga ctggccaaga cctatttatc tatttacagg ggcatgaagg ccagtacaac cagcaagacg nnnnnnnnnn nnnnnnnnnn nnnnnnnncc caggcgagca cgaggaatgc cccgatgctg aggaaatccg cctcctgctg acgctgctgc attgccgccc ctccttccat cgcgctagat gaggtggaga ccagtcgcag tgagtggttg agaaccgcct tgngttttct gaacgttttg <210> 29 <211> 578 <212> DNA

<213> Vitis vinifera <400> 29<213> Vitis vinifera <400> 29

tttttttttt tttttttaat caagaaataa aaataacaaa aattgtatga tgagaagagg tgtataagtc aaatctctga cattagaagg aatgccaatg gggagcagaa gcagcatgaa gggaaggatc agcaatgaag ccgtgagaca atagcttgct gggatcagtc tcctgctgtt catcttcttt ccttcggcca taggaggagt agagttcctc cttcctctcg cttccatgat caaaggtcct tcagacagtc ttgaatctgc tcctttaccg gtcaccaagt tccaaccggt <210> 30 <211> 704tttttttttt tttttttaat caagaaataa aaataacaaa aattgtatga tgagaagagg tgtataagtc aaatctctga cattagaagg aatgccaatg gggagcagaa gcagcatgaa gggaaggatc agcaatgaag ccgtgagaca atagcttgct gggatcagtc tcctgctgtt catcttcttt ccttcggcca taggaggagt agagttcctc cttcctctcg cttccatgat caaaggtcct tcagacagtc ttgaatctgc tcctttaccg gtcaccaagt tccaaccggt <210> 30 <211> 704

Glu Ser Leu Phe Leu 45Glu Ser Leu Phe Leu 45

Pro Leu Val Leu Pro 60Pro Leu Val Leu Pro 60

Val Pro Ile Gly Ile 80Val Pro Ile Gly Ile 80

Ser Ser His Ser Asn 95Ser Ser Ser His Asn 95

aacaggagga cctgcgccac gtaaagcctg aatccggcgg gcgtgtgggg cgctggtgat tggtgccggt cgtcgtcgtc atgctccctaaacaggagga cctgcgccac gtaaagcctg aatccggcgg gcgtgtgggg cgctggtgat tggtgccggt cgtcgtcgtc atgctcccta

aatccaggag tgcagccagc cggcggcggg cggcggcggc caagtacttc cctcccgctc ggcgatgctg gtccgccggc cttgtagaatccaggag tgcagccagc cggcggcggg cggcggcggc caagtacttc cctcccgctc ggcgatgctg gtccgccggc cttgtag

ou tor t

ou tor t

cgaatcctgc taagaggagg agcaggcaga agcggcagta aagtaggtgg agatgccgct cggcttgcca ccaaagtaag taatcagatccgaatcctgc taagaggagg agcaggcaga agcggcagta aagtaggtgg agatgccgct cggcttgcca ccaaagtaag taatcagatc

agctgcaaaa ccatgctgcg ccggcagcca tcagcagcga acgcgatgac tcacggcatt tgtgttcttt caagaagtga tgagctcgggagctgcaaaa ccatgctgcg ccggcagcca tcagcagcga acgcgatgac tcacggcatt tgtgttcttt caagaagtga tgagctcggg

cacagaaaat cacatctgtc cagcagnnnn gacggtgagg cttcttgtcg cctcctttgt ggtgtaggcg aaggcggtgt tggtcgaacacagaaaat cacatctgtc cagcagnnnn gacggtgagg cttcttgtcg cctcctttgt ggtgtaggcg aaggcggtgt tggtcgaa

aataactgat tgcacttttg catgaaagcc aggagggggt gatgagcaaa ctctcgtgag agggtttttc gccactcaaa ttcaggctgc tcaaagtaaataactgat tgcacttttg catgaaagcc aggagggggt gatgagcaaa ctctcgtgag agggtttttc gccactcaaa ttcaggctgc tcaaagta

tttcatctga aacaccacca aagatcataa ggcaatggtg agcaatgact aggggagttc ctctcaactt tatcgatctt tcaatactcatttcatctga aacaccacca aagatcataa ggcaatggtg agcaatgact aggggagttc ctctcaactt tatcgatctt tcaatactca

atatcaagac tttacacata gcactgctag gtagtatcag ccaagctgaa tattatattc gcagaggagc gcagattgat tttaaatttcatatcaagac tttacacata gcactgctag gtagtatcag ccaagctgaa tattatattc gcagaggagc gcagattgat tttaaatttc

60 120 180 240 300 360 420 480 53760 120 180 240 300 360 420 480 537

60 120 180 240 300 360 420 480 53860 120 180 240 300 360 420 480 538

60 120 180 240 300 360 420 480 540 578 <212> DNA60 120 180 240 300 360 420 480 540 578 <212> DNA

<213> Citrus reticulata <220><213> Citrus reticulata <220>

<221> misc_feature <222> (619)..(619) <223> η is a, c, g, ou t <400> 30<221> misc_feature <222> (619) .. (619) <223> η is a, c, g, or t <400> 30

agggtttctt caaagatagg tagccatttg cacatttgaa tctgcttgtt ggatattgtc 60agggtttctt caaagatagg tagccatttg cacatttgaa tctgcttgtt ggatattgtc 60

aaggaggctg ttggaattag gccacatttc agaatctggt ttcatcctgg atcgctgggc 120 atttgaaggc attttgtgat catcgctgtt taaaatttgg ccgcatatta gaatctgggt 180 tctcatcggt tttccgtaca tttaccttga ccacattttg atatctgggt tgagctgcat 240 tttagccttc gtatttaaaa ggacttgatc taatctgggg tcttggtgag ccggggcaac 300 tgatcatagt aaatgaattc tgataattct gagtcgagac agagactatc aaagggcatt 360 ataaacttgc aagatcgata tccgaccagc attatggatc gtggtgtaag aaaaattgca 420 actcctccgg tcgagaagag gaaagttgag tatcaccgaa gttactcgca aggggcatcc 480 agaaaactgt tttcggcaag ctatttcacc ctggaatcat tgcttttgct cgtatgtctg 540 acggcctcat tgctgatcct gccattggtg cttccgccct tgccgccccc gccattcctg 600 ctgcttctgg ttcctatang tattctagcc gtgcttttgg tcttggcatt catgccttct 660 aatgtaagag atataacttc cacgtacgtg taaatggtgt tgct 704aaggaggctg ttggaattag gccacatttc agaatctggt ttcatcctgg atcgctgggc 120 atttgaaggc attttgtgat catcgctgtt taaaatttgg ccgcatatta gaatctgggt 180 tctcatcggt tttccgtaca tttaccttga ccacattttg atatctgggt tgagctgcat 240 tttagccttc gtatttaaaa ggacttgatc taatctgggg tcttggtgag ccggggcaac 300 tgatcatagt aaatgaattc tgataattct gagtcgagac agagactatc aaagggcatt 360 ataaacttgc aagatcgata tccgaccagc attatggatc gtggtgtaag aaaaattgca 420 actcctccgg tcgagaagag gaaagttgag tatcaccgaa gttactcgca aggggcatcc 480 agaaaactgt tttcggcaag ctatttcacc ctggaatcat tgcttttgct cgtatgtctg 540 acggcctcat tgctgatcct gccattggtg cttccgccct tgccgccccc gccattcctg 600 ctgcttctgg ttcctatang tattctagcc gtgcttttgg tcttggcatt catgccttct 660 aatgtaagag atataacttc cacgtacgtg taaatggtgt TGCT 704

<210> 31 <211> 382 <212> DNA<210> 31 <211> 382 <212> DNA

<213> Lycorpersicon esculentum <400> 31<213> Lycorpersicon esculentum <400> 31

gaaaaaaatg tatttaatca ttatgtaaaa aacaagtgaa tctactttga tattttcttc 60gaaaaaaatg tatttaatca ttatgtaaaa aacaagtgaa tctactttga tattttcttc 60

taaattaaac cacacaatta aagatatgag caagtcacat tcctaacatt agaaggcata 120 aaagctaaga tcataagaac aacaagaatg aaaattggga ctaacaacaa cataaaaggt 180 ggtggtggca atggtggaag catcaatggc aaaagtaaca aagatgctgt aagaccaagt 240 aacaaaataa ttgactctaa gctaaaataa ttcattgaca acattttctt gccatgtcct 300 tgtgtaaatg atctcttatg ctccatctta ttgccttcca taatgttgtt gaaatattgt 360 tgatgttcct ccaaattaat aa 382taaattaaac cacacaatta aagatatgag caagtcacat tcctaacatt agaaggcata 120 aaagctaaga tcataagaac aacaagaatg aaaattggga ctaacaacaa cataaaaggt 180 ggtggtggca atggtggaag catcaatggc aaaagtaaca aagatgctgt aagaccaagt 240 aacaaaataa ttgactctaa gctaaaataa ttcattgaca acattttctt gccatgtcct 300 tgtgtaaatg atctcttatg ctccatctta ttgccttcca taatgttgtt gaaatattgt 360 aa 382 tgatgttcct ccaaattaat

<210> 32 <211> 624 <212> DNA<210> 32 <211> 624 <212> DNA

<213> Lycorpersicon esculentum <400> 32<213> Lycorpersicon esculentum <400> 32

tttgttaaag attggcacat tttcaagttc agtattcatt cgatttttga tatctacata 60tttgttaaag attggcacat tttcaagttc agtattcatt cgatttttga tatctacata 60

aaaaaaaagt gtcctggtac tactcaatat tcctcagaac gacttcatat tcaggtctcg 120 aattcaaaac ctcacatcaa gattcttagg aaatttcaag attggttgaa aaactcatat 180 ccttctctaa gtttcaagat tggttccaaa ttaaaactcg agacttctga gtaagagcgt 240 acgactagta atgaacatgg acatggaatc atcagaggca aaattgagat catcaaaagg 300 gtttattaat ttggaggaac atcaacaata tttcaacaac attatggaag gcaataagat 360 ggagcataag agatcattta cacaaggaca tggcaagaaa atgttgtcaa tgaattattt 420 tagcttagag tcaattattt tgttacttgg tcttacagca tctttgttac ttttgccatt 480 gatgcttcca ccattgccac caccaccttt tatgttgttg ttagtcccaa ttttcattct 540 tgttgttctt atgatcttag cttttatgcc ttctaatgtt aggaatgtga cttgctcata 600 tctttaattg tgtggtttaa ttta 624aaaaaaaagt gtcctggtac tactcaatat tcctcagaac gacttcatat tcaggtctcg 120 aattcaaaac ctcacatcaa gattcttagg aaatttcaag attggttgaa aaactcatat 180 ccttctctaa gtttcaagat tggttccaaa ttaaaactcg agacttctga gtaagagcgt 240 acgactagta atgaacatgg acatggaatc atcagaggca aaattgagat catcaaaagg 300 gtttattaat ttggaggaac atcaacaata tttcaacaac attatggaag gcaataagat 360 ggagcataag agatcattta cacaaggaca tggcaagaaa atgttgtcaa tgaattattt 420 tagcttagag tcaattattt tgttacttgg tcttacagca tctttgttac ttttgccatt 480 gatgcttcca ccattgccac caccaccttt tatgttgttg ttagtcccaa ttttcattct 540 tgttgttctt atgatcttag cttttatgcc ttctaatgtt aggaatgtga cttgctcata 600 tctttaattg tgtggtttaa ttta 624

<210> 33 <211> 1130 <212> DNA <213> Oryza sativa <400> 33<210> 33 <211> 1130 <212> DNA <213> Oryza sativa <400> 33

catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa 60catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa 60

tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca 120 caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca 180 catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa 240 gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg 300 gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca 360 tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac 420 gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg 480 acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac 540 caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt 600 gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt 660 Ile Leu Ile Ala Leu 15tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca 120 caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca 180 catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa 240 gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg 300 gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca 360 tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac 420 gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg 480 acaccccggg cccacccacc tgtccgggggggggggggggggggggggggg

Pro Pro Leu Pro Pro 30Pro Pro Leu Pro Pro 30

Ile Met Ala Ala Leu 45Ile Met Wing Leu Wing 45

Lys Asn Val Val Val 60Lys Asn Val Val Val 60

Lys ArgLys arg

tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc 720 cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac 780 gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata 840 tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc 900 ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct 960 ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020 gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080 gcctcgcgcg gatctgaccg cttccctcgc ccttctcgca ggattcagcc 1130tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc 720 cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac 780 gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata 840 tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc 900 ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct 960 ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020 gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080 gcctcgcgcg gatctgaccg cttccctcgc ccttctcgca ggattcagcc 1130

<210> 34 <211> 77 <212> PRT<210> 34 <211> 77 <212> PRT

<213> Medicago sativa <400> 34<213> Medicago sativa <400> 34

Met Val Arg Cys Phe Ser Leu Gly Ser Val Leu 15 10Met Val Arg Cys Phe Ser Leu Gly Ser Val Leu 15 10

Ala Ala Ser Met Val Val Leu Pro Leu Met LeuWing Wing Ser Met Val Val Leu Pro Leu Met Leu

20 2520 25

Pro Pro Leu Ala Leu Leu Phe Phe Pro Val GlyPro Pro Leu Wing Leu Leu Phe Phe Pro Val Gly

35 4035 40

Val Val Leu Ala Phe Ser Pro Ser Glu Asn ValVal Val Leu Wing Phe Ser Pro Glu Asn Val

50 5550 55

Tyr Ser Ser Ser Ser Ser Gly Ile Ala Asn Ser 65 70 75Tyr Ser Ser Ser Ser Gly Ile Wing Asn Ser 65 70 75

<210> 35 <211> 78 <212> PRT<210> 35 <211> 78 <212> PRT

<213> Medicago sativa <400> 35<213> Medicago sativa <400> 35

Met Ile Met Val Ala Ser Lys Glu Lys Thr Asn 15 10Met Ile Met Val Wing Be Lys Glu Lys Thr Asn 15 10

Phe Arg Tyr Ser Val Leu Ile Leu Ser Leu LeuPhe Arg Tyr Ser Leu Ile Leu Ser Leu Leu

20 2520 25

Val Leu Pro Leu Val Met Pro Pro Leu Pro ProVal Leu Pro Leu Val Met Pro Leu Pro

35 4035 40

Leu Leu Val Pro Val Phe Ile Met Leu Leu LeuLeu Leu Val Pro Val Phe Ile Met Leu Leu Leu

50 5550 55

Ser Pro Ser Lys Lys Val Pro Asn Lys Ala Ser 65 70 75Ser Pro Lys Lys Val Pro Asn Lys Ala Ser 65 70 75

<210> 36 <211> 613 <212> DNA<210> 36 <211> 613 <212> DNA

<213> Hordeum vulgare <400> 36<213> Hordeum vulgare <400> 36

cttccgagaa agatgcttca tattgcactc atcttatgcc aacacacaat cagaaacaaa 60cttccgagaa agatgcttca tattgcactc atcttatgcc aacacacaat cagaaacaaa 60

aaccacgcag caagcctatt tacaagtaag aggtggccat gctccgcaca tcagtcggca 120 tgaaggccag caccatcaac aggatgagca agcagaccgg caagagcagc agtagcgatg 180 gcggtggggg caacggaggc agcaccaatg gcagtatgag caatgaaacg gtgaggcagg 240 cgagcacgaa gaacgcttcg acgccgaagt agttcggtat gacaaccttc ttgtcagcag 300 catttgccct ctgctgctgc atttgcctct ttgcagtatt tggtctggct aacacagggc 360 tgctcctctg cctactaccg cctctgtcca ttgcaccgaa ctggctatcc atctattctt 420 tggtgagtgc agatcagcgg ctatccagga actgagatga ataagaactt gtggaatctg 480 aaggttttta acagatctga agtctttgtg agtccgtgac tgaactgcag atcatctgct 540 gtggaagaac tgcaccgcaa gtggcaatac cttcgatcct gaaacttgca ttttggtgat 600 gcccgtacca cgc 613aaccacgcag caagcctatt tacaagtaag aggtggccat gctccgcaca tcagtcggca 120 tgaaggccag caccatcaac aggatgagca agcagaccgg caagagcagc agtagcgatg 180 gcggtggggg caacggaggc agcaccaatg gcagtatgag caatgaaacg gtgaggcagg 240 cgagcacgaa gaacgcttcg acgccgaagt agttcggtat gacaaccttc ttgtcagcag 300 catttgccct ctgctgctgc atttgcctct ttgcagtatt tggtctggct aacacagggc 360 tgctcctctg cctactaccg cctctgtcca ttgcaccgaa ctggctatcc atctattctt 420 tggtgagtgc agatcagcgg ctatccagga actgagatga ataagaactt gtggaatctg 480 aaggttttta acagatctga agtctttgtg agtccgtgac tgaactgcag atcatctgct 540 gtggaagaac tgcaccgcaa gtggcaatac cttcgatcct gaaacttgca ttttggtgat 600 gcccgtacca cgc 613

<210> 37 <211> 617 <212> DNA<210> 37 <211> 617 <212> DNA

<213> Saccharum officinarum <220><213> Saccharum officinarum <220>

<221> misc_feature <222> (451)..(451) <223> η is a, c, g, ou t <400> 37<221> misc_feature <222> (451) .. (451) <223> η is a, c, g, or t <400> 37

Ser Gly Gly Cys Met 15Ser Gly Gly Cys Met 15

Ala Leu Ser Ile Leu 30Wing Leu Ser Ile Leu 30

Pro Pro Leu Leu Leu 45Pro Pro Leu Leu Leu 45

Phe Phe Ile Ala Phe 60Phe Phe Ile Ala Phe 60

Phe Val Ser ggagaacgtg cttgttcagg tggttcaaca gtgcggacca gagaacaatg cgaggttcag 60Phe Val Ser ggagaacgtg cttgttcagg tggttcaaca gtgcggacca gagaacaatg cgaggttcag 60

gattaaaggt attctggctt cagaggcagt tcttccaaag caagtgacag gcgattccat 120gattaaaggt attctggctt cagaggcagt tcttccaaag caagtgacag gcgattccat 120

caccggagct aagatcttat tacaacattc agaaacacag gagtcctccc accgcctttc 180caccggagct aagatcttat tacaacattc agaaacacag gagtcctccc accgcctttc 180

acttcttgct tacttctgca accactcgcc gtgactgatc tccacgcaca ccaaagaaca 240acttcttgct tacttctgca accactcgcc gtgactgatc tccacgcaca ccaaagaaca 240

caacacgtgg caagccgatc tagcgcgatg gaaggagggg ggcaaataca gaggaggaat 300caacacgtgg caagccgatc tagcgcgatg gaaggagggg ggcaaataca gaggaggaat 300

aatgccgtga agcggcacct gcagcagcgg cagcaggagg cggatttcct cgacaagaag 360aatgccgtga agcggcacct gcagcagcgg cagcaggagg cggatttcct cgacaagaag 360

gtcatcgcgt ccacctattt cagcatcgag gcgttcctcg tgctcgcctg cctcaccgtc 420gtcatcgcgt ccacctattt cagcatcgag gcgttcctcg tgctcgcctg cctcaccgtc 420

tcgctgctga tactgccgct tgtgctgccg ncgctgccgg cgccggcgtc gctgctgctg 480tcgctgctga tactgccgct tgtgctgccg ncgctgccgg cgccggcgtc gctgctgctg 480

tggctgccgg tctggctgct cgaactgctg attgtgcttg ccttcatgcc gacagatgtg 540tggctgccgg tctggctgct cgaactgctg attgtgcttg ccttcatgcc gacagatgtg 540

cgcagcatgg cctcctctta cttgtaaaaa aatagataaa taggccacct ttggcaattt 600cgcagcatgg cctcctctta cttgtaaaaa aatagataaa taggccacct ttggcaattt 600

tctggggttt ggaggtg 617 <210> 38 <211> 638 <212> DNAtctggggttt ggaggtg 617 <210> 38 <211> 638 <212> DNA

<213> Saccharum officinarum <400> 38<213> Saccharum officinarum <400> 38

gattttttcc aagccagtga ccggcgattc atcaaccgga gctgagatct tatacaacat 60gattttttcc aagccagtga ccggcgattc atcaaccgga gctgagatct tatacaacat 60

tcagaaacac aggagtcctc gcaccgcttt ccactcttgg ctaattttgc aaccactcgc 120tcagaaacac aggagtcctc gcaccgcttt ccactcttgg ctaattttgc aaccactcgc 120

cgtgactgat ctccacgcac accaaagaac acaacacgtg gcaacccgat ctagcgcgat 180cgtgactgat ctccacgcac accaaagaac acaacacgtg gcaacccgat ctagcgcgat 180

ggaaggaggg gggcaaatac agaggaggaa taatgccgtg aagcggcacc tgcagcagcg 24 0ggaaggaggg gggcaaatac agaggaggaa taatgccgtg aagcggcacc tgcagcagcg 24 0

gcagcaggag gcggatttcc tcgacaagaa ggtcatcgcg tccacctatt tcagcatcga 300gcagcaggag gcggatttcc tcgacaagaa ggtcatcgcg tccacctatt tcagcatcga 300

ggcgttcctc gtgctcgcct gcctcaccgt ctcgctgctg atactgccgc tggtgctgcc 360ggcgttcctc gtgctcgcct gcctcaccgt ctcgctgctg atactgccgc tggtgctgcc 360

gccgctgccg ccgccgccgt cgctgctgct gtggctgccg gtctgcctgc tcatcctgct 420gccgctgccg ccgccgccgt cgctgctgct gtggctgccg gtctgcctgc tcatcctgct 420

gattgtgctg gccttcatgc cgacagatgt gcgcagcatg gcctcctctt acttgtaata 480gattgtgctg gccttcatgc cgacagatgt gcgcagcatg gcctcctctt acttgtaata 480

aatagataaa taggccacct tggtcaatat tctgtgattt ggaggtgatt cgtcctgaga 540aatagataaa taggccacct tggtcaatat tctgtgattt ggaggtgatt cgtcctgaga 540

tgagtctcga ttgatgtcag ctactcccaa ggggaaatgc atgtaacact tggtggccga 600tgagtctcga ttgatgtcag ctactcccaa ggggaaatgc atgtaacact tggtggccga 600

cggtggcaag ataatcatgc taccatgtca gttaaacc 638 <210> 39 <211> 778 <212> DNAcggtggcaag ataatcatgc taccatgtca gttaaacc 638 <210> 39 <211> 778 <212> DNA

<213> Sorghum bicolor <400> 39<213> Sorghum bicolor <400> 39

gctgttggtg ttgttcttga gatctctttc ttgatcttgt gtgggattaa agagggattc 60gctgttggtg ttgttcttga gatctctttc ttgatcttgt gtgggattaa agagggattc 60

ttgccttcct acgggagaaa gagaaaaggg gaagaacgtg cttgttccgg tggttcaaca 120ttgccttcct acgggagaaa gagaaaaggg gaagaacgtg cttgttccgg tggttcaaca 120

gtgcggagac ccggagaaca atgcgaggtt caggattaaa ggtgttctgg cttcaggtgc 180gtgcggagac ccggagaaca atgcgaggtt caggattaaa ggtgttctgg cttcaggtgc 180

agttcttcca aagcaggtga caggcgattc gatcaccgga gctcagatct gacgaaaaca 240agttcttcca aagcaggtga caggcgattc gatcaccgga gctcagatct gacgaaaaca 240

aaacacagtc ctcctcccac cgcctttcag ttcttgctta cttctgcaac cactcactgc 300aaacacagtc ctcctcccac cgcctttcag ttcttgctta cttctgcaac cactcactgc 300

gaccgtacac caaagaacac tgcacatggc aagccgatct agcgcgctgg aaggaggggg 360gaccgtacac caaagaacac tgcacatggc aagccgatct agcgcgctgg aaggaggggg 360

ggcagcaata cagcggagga ataatgccgt gaagcggcac ctgcagcagc ggcagcagga 420ggcagcaata cagcggagga ataatgccgt gaagcggcac ctgcagcagc ggcagcagga 420

ggcggatttc cacgacaaga aggtcatcgc gtccacctac ttcagcatcg gcgcgttcct 480ggcggatttc cacgacaaga aggtcatcgc gtccacctac ttcagcatcg gcgcgttcct 480

ggtgctcgcc tgcctcacct tctcgctgct catcctgccg ctggtgctgc cgccgctgcc 540ggtgctcgcc tgcctcacct tctcgctgct catcctgccg ctggtgctgc cgccgctgcc 540

gccgccgccg tcgctgctgc tgtggctgcc ggtctgcctg ctcgtcctgc tggttgtgct 600gccgccgccg tcgctgctgc tgtggctgcc ggtctgcctg ctcgtcctgc tggttgtgct 600

ggccttcatg ccgacagatg tgcgcagcgt ggcggcctct tacttgtaaa tagccagata 660ggccttcatg ccgacagatg tgcgcagcgt ggcggcctct tacttgtaaa tagccagata 660

aataggccac cacctttggc cagttttctg tgttttcggg ggtgattcgt cctaagatga 720aataggccac cacctttggc cagttttctg tgttttcggg ggtgattcgt cctaagatga 720

gtcatgatcg agtgtaatgt gaagcatctt ttccaggggt agtagatttc aatgaagt 778 <210> 40 <211> 732 <212> DNAgtcatgatcg agtgtaatgt gaagcatctt ttccaggggt agtagatttc aatgaagt 778 <210> 40 <211> 732 <212> DNA

<213> Arabidopsis thaliana <400> 40<213> Arabidopsis thaliana <400> 40

ttgtcttcct catttcccta ctagtacttg tttcacacag tttcttgatc caaccaaaac 60ttgtcttcct catttcccta ctagtacttg tttcacacag tttcttgatc caaccaaaac 60

caatacacaa agcttctcaa actccttcac ctcaaagctt cttcctttac atctgaatcg 120caatacacaa agcttctcaa actccttcac ctcaaagctt cttcctttac atctgaatcg 120

ttgagttaac tcggatttgt tctgcatcct· ctgtttctga atcgtgggcc atccttattt 180ttgagttaac tcggatttgt tctgcatcct · ctgtttctga atcgtgggcc atccttattt 180

tgtctcgaat tcttcaccaa ttgcttcgat caagctgcat tggttaacca gttgccctaa 240tgtctcgaat tcttcaccaa ttgcttcgat caagctgcat tggttaacca gttgccctaa 240

agatcagatc tttgagcaaa attttgtcac tgatcttcta aatccaaacc agacacagca 300agatcagatc tttgagcaaa attttgtcac tgatcttcta aatccaaacc agacacagca 300

aaacaacctc tgtagatgat tcgagaaatc tcaaacttac aaaaagatat tataaacatt 360aaacaacctc tgtagatgat tcgagaaatc tcaaacttac aaaaagatat tataaacatt 360

caagacagtt attcgaacaa ccgagtcatg gacgtcggaa gaaacaaccg gaaaaacatg 420caagacagtt attcgaacaa ccgagtcatg gacgtcggaa gaaacaaccg gaaaaacatg 420

agctttcgaa gttcgccgga gaaaagcaag caagagttac ggcggagttt ctcggcgcag 480agctttcgaa gttcgccgga gaaaagcaag caagagttac ggcggagttt ctcggcgcag 480

aaaaggatga tgatcccggc gaattatttc agtttagagt ctctgttcct attggttggt 540aaaaggatga tgatcccggc gaattatttc agtttagagt ctctgttcct attggttggt 540

ctaacggcat ctctgttaat acttccgtta gttttgccgc cgttacctcc gcctccgttt 600ctaacggcat ctctgttaat acttccgtta gttttgccgc cgttacctcc gcctccgttt 600

atgctgctat tggttcccat tgggattatg gttttactcg tcgttcttgc cttcatgcct 660atgctgctat tggttcccat tgggattatg gttttactcg tcgttcttgc cttcatgcct 660

tcttctcatt ctaatgctaa tacagatgta acttgcaatt tcatgtaaat ctgaaattta 720tcttctcatt ctaatgctaa tacagatgta acttgcaatt tcatgtaaat ctgaaattta 720

ttatatgatg at 732 <210> 41 <211> 891 <212> DNAttatatgatg at 732 <210> 41 <211> 891 <212> DNA

<213> Arabidopsis thaliana <400> 41<213> Arabidopsis thaliana <400> 41

cccactttat ttcttcttct ctggttttct taccaaaaga gtatttaagc tttaacaccc tgtttttggt ttccaacgtt ctgaaggtgt gtttggctct aacggtttaa agctttcttg ctctctaccg gcaaaaaaaa aagattagtc cttttaggtc gttctaaacc ttagattttg tctgcatttc gggataatca aaccaaacta catttacaga agaagaagaa gaagaaaagt ggataaacaa actcaagttt cttcttcata catcgatctg aaaagagaaa aagccttctt taaatgattc gtgagttctc taaacattca agaacattat tctctcaaca acaacatgga ggaaaaacac gagttttcgt ggttcagctc cagctccgat ttcggacatt gtcgtcgcag aacagtccaa ggaggctaat tagaatcaat ggttgtgctt gttggtctca cagcatctct ttccaccatt gcctcctcct ccttttatgc tgcttttgat tgcttatggt tcttgctttc atgccttctt ctaattccaa cttttatgta ataaacgttt ctttaattga agaaagaaat <210> 42 <211> 732 <212> DNAcccactttat ttcttcttct ctggttttct taccaaaaga gtatttaagc tttaacaccc tgtttttggt ttccaacgtt ctgaaggtgt gtttggctct aacggtttaa agctttcttg ctctctaccg gcaaaaaaaa aagattagtc cttttaggtc gttctaaacc ttagattttg tctgcatttc gggataatca aaccaaacta catttacaga agaagaagaa gaagaaaagt ggataaacaa actcaagttt cttcttcata catcgatctg aaaagagaaa aagccttctt taaatgattc gtgagttctc taaacattca agaacattat tctctcaaca acaacatgga ggaaaaacac gagttttcgt ggttcagctc cagctccgat ttcggacatt gtcgtcgcag aacagtccaa ggaggctaat tagaatcaat ggttgtgctt gttggtctca cagcatctct ttccaccatt gcctcctcct ccttttatgc tgcttttgat tgcttatggt tcttgctttc atgccttctt ctaattccaa cttttatgta ataaacgttt ctttaattga agaaagaaat <210> 42 <211> 732 <212> DNA

<213> Arabidopsis thaliana <400> 42<213> Arabidopsis thaliana <400> 42

ttgtcttcct catttcccta ctagtacttg tttcacacag caatacacaa agcttctcaa actccttcac ctcaaagctt ttgagttaac tcggatttgt tctgcatcct ctgtttctga tgtctcgaat tcttcaccaa ttgcttcgat caagctgcat agatcagatc tttgagcaaa attttgtcac tgatcttcta aaacaacctc tgtagatgat tcgagaaatc tcaaacttac caagacagtt attcgaacaa ccgagtcatg gacgtcggaa agctttcgaa gttcgccgga gaaaagcaag caagagttac aaaaggatga tgatcccggc gaattatttc agtttagagt ctaacggcat ctctgttaat acttccgtta gttttgccgc atgctgctat tggttcccat tgggattatg gttttactcg tcttctcatt ctaatgctaa tacagatgta acttgcaatt ttatatgatg at <210> 43 <211> 519 <212> DNA <213> Zea mays <400> 43ttgtcttcct catttcccta ctagtacttg tttcacacag caatacacaa agcttctcaa actccttcac ctcaaagctt ttgagttaac tcggatttgt tctgcatcct ctgtttctga tgtctcgaat tcttcaccaa ttgcttcgat caagctgcat agatcagatc tttgagcaaa attttgtcac tgatcttcta aaacaacctc tgtagatgat tcgagaaatc tcaaacttac caagacagtt attcgaacaa ccgagtcatg gacgtcggaa agctttcgaa gttcgccgga gaaaagcaag caagagttac aaaaggatga tgatcccggc gaattatttc agtttagagt ctaacggcat ctctgttaat acttccgtta gttttgccgc atgctgctat tggttcccat tgggattatg gttttactcg tcttctcatt ctaatgctaa tacagatgta acttgcaatt ttatatgatg at <210> 43 <211> 519 <212> DNA <213> Zea mays <400> 43

atgcgaggtt cgggatttaa gatgttcggc tttaggggca gggcgattcg accaccggag ctcagatctg attacaaaac tctcacaccg cctttcactt cttgcttact ttggcaacca cctccaccta caccaagaac acatggcaag ccgatctacg atacaaagga ggaatgccgt gaagcggcat ctgcagcagc ctcgacaaga aggtcatcgc gtccacctac ttcagcatcg tgcctcaccg tctcgctgct gatactgccg ctggtgctgc tcgctgctgt tgtggctgcc ggtctgcctg ctcgtcttgc ccgacagatg tgcgcagcat ggcctcctct tacctgtaa <210> 44 <211> 98 <212> PRT <213> Zea mays <400> 44atgcgaggtt cgggatttaa gatgttcggc tttaggggca gggcgattcg accaccggag ctcagatctg attacaaaac tctcacaccg cctttcactt cttgcttact ttggcaacca cctccaccta caccaagaac acatggcaag ccgatctacg atacaaagga ggaatgccgt gaagcggcat ctgcagcagc ctcgacaaga aggtcatcgc gtccacctac ttcagcatcg tgcctcaccg tctcgctgct gatactgccg ctggtgctgc tcgctgctgt tgtggctgcc ggtctgcctg ctcgtcttgc ccgacagatg tgcgcagcat ggcctcctct tacctgtaa <210> 44 <211> 98 <212> PRT <213 > Zea mays <400> 44

Met Glu Gly Gly Ala Ala Ile Gln Arg Arg Asn 1 5 10Met Glu Gly Gly Wing Wing Ile Gln Arg Arg Asn 1 5 10

Leu Gln Gln Arg Gln Gln Glu Ala Asp Phe LeuLeu Gln Gln Arg Gln Gln Glu Wing Asp Phe Leu

20 2520 25

Ala Ser Thr Tyr Phe Ser Ile Gly Ala Phe Leu 35 40Ala Ser Thr Tyr Phe Ser Ile Gly Ala Phe Leu 35 40

aactttcttc caatcttcat aaacaccaat tggaaacgcc tttcatcgtc tcgttacttt attttccaga cagtctacaa cgtgagagga tatggggaag atcagcgagt cttgatctta tcctattggg acatgtttct ccttaaacaaaactttcttc caatcttcat aaacaccaat tggaaacgcc tttcatcgtc tcgttacttt attttccaga cagtctacaa cgtgagagga tatggggaag atcagcgagt cttgatctta tcctattggg acatgtttct ccttaaacaa

gtcttcctct cttcttctcg tgaatctttt aagatcactc agggttcttc ttatgcgttt tcaaacttcg aacgacatca gatcataacc caagaattgt tacttcagtt ccgttgattc attatggttt tcttcttccagtcttcctct cttcttctcg tgaatctttt aagatcactc agggttcttc ttatgcgttt tcaaacttcg aacgacatca gatcataacc caagaattgt tacttcagtt ccgttgattc attatggttt tcttcttcca

tttcttgatc cttcctttac atcgtgggcc tggttaacca aatccaaacc aaaaagatat gaaacaaccg ggcggagttt ctctgttcct cgttacctcc tcgttcttgc tcatgtaaattttcttgatc cttcctttac atcgtgggcc tggttaacca aatccaaacc aaaaagatat gaaacaaccg ggcggagttt ctctgttcct cgttacctcc tcgttcttgc tcatgtaaat

caaccaaaac atctgaatcg atccttattt gttgccctaa agacacagca tataaacatt gaaaaacatg ctcggcgcag attggttggt gcctccgttt cttcatgcct ctgaaatttacaaccaaaac atctgaatcg atccttattt gttgccctaa agacacagca tataaacatt gaaaaacatg ctcggcgcag attggttggt gcctccgttt cttcatgcct ctgaaattta

gttcttctga gttcagaaaa ctcactgcga cgatggaagg gtcagcagga gggcgttcct ctcccctgcc tggttgtactgttcttctga gttcagaaaa ctcactgcga cgatggaagg gtcagcagga gggcgttcct ctcccctgcc tggttgtact

agcaggggac cacaaggcgt ctggtctcca aggggcggca ggcggatttc cgtgctcgcc gccgccgccg ggccttcatgagcaggggac cacaaggcgt ctggtctcca aggggcggca ggcggatttc cgtgctcgcc gccgccgccg ggccttcatg

Ala Val Lys Arg His 15Wing Val Lys Arg His 15

Asp Lys Lys Val Ile 30Asp Lys Lys Val Ile 30

Val Leu Ala Cys Leu 45Val Leu Wing Cys Leu 45

60 120 180 240 300 360 420 480 540 600 660 720 780 840 89160 120 180 240 300 360 420 480 540 600 660 720 780 840 891

60 120 180 240 300 360 420 480 540 600 660 720 73260 120 180 240 300 360 420 480 540 600 660 720 732

60 120 180 240 300 360 420 480 519 Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro60 120 180 240 300 360 420 480 519 Thr Val Ser Leu Leu Ile Leu Pro Leu Val Leu Pro Pro Leu Pro Pro

50 55 6050 55 60

Pro Pro Ser Leu Leu Leu Trp Leu Pro Val Cys Leu Leu Val Leu Leu 65 70 75 80Pro Pro Ser Leu Leu Leu Trp Leu Pro Val Cys Leu Leu Val Leu Leu 65 70 75 80

Val Val Leu Ala Phe Met Pro Thr Asp Val Arg Ser Met Ala Ser Ser 85 90 95Val Val Leu Wing Phe Met Pro Thr Asp Val Arg Be Met Wing Be Ser 85 90 95

Tyr LeuTyr leu

<210> 45 <211> 2745 <212> DNA<210> 45 <211> 2745 <212> DNA

<213> Arabidopsis thaliana <400> 45<213> Arabidopsis thaliana <400> 45

atgagcaatg cttttttata atgccaactt tgtacaaaaa agcaggctta aacaatgaaa 60atgagcaatg cttttttata atgccaactt tgtacaaaaa agcaggctta aacaatgaaa 60

tctcgagcga ggcagtgtct gctggtttgt ttgctctgtc tttccttaac gaatctctcc 120tctcgagcga ggcagtgtct gctggtttgt ttgctctgtc tttccttaac gaatctctcc 120

tatggagaaa ataagttcag agagcgtaaa gccaccgatg acgagctggg ctaccccgat 180tatggagaaa ataagttcag agagcgtaaa gccaccgatg acgagctggg ctaccccgat 180

attgatgaag atgctttatt gaatactcag tgcccgaaaa aattggagct gcgatggcaa 240attgatgaag atgctttatt gaatactcag tgcccgaaaa aattggagct gcgatggcaa 240

actgaagtca cttctagcgt ttatgctaca cccttgattg ctgatattaa cagtgatgga 300actgaagtca cttctagcgt ttatgctaca cccttgattg ctgatattaa cagtgatgga 300

aagcttgaca ttgttgttcc atcttttgtt cattacctcg aagttcttga aggagctgat 360aagcttgaca ttgttgttcc atcttttgtt cattacctcg aagttcttga aggagctgat 360

ggagacaaga tgccaggttg gcctgctttt caccagtcaa atgtgcactc gagtcctctt 420ggagacaaga tgccaggttg gcctgctttt caccagtcaa atgtgcactc gagtcctctt 420

ctatttgata tcgacaaaga tggtgttaga gaaattgctc tggctaccta caatgccgaa 480ctatttgata tcgacaaaga tggtgttaga gaaattgctc tggctaccta caatgccgaa 480

gtgctctttt tcagggtatc aggctttttg atgtcagata agctagaagt gccacgtaga 540gtgctctttt tcagggtatc aggctttttg atgtcagata agctagaagt gccacgtaga 540

aaagtgcaca agaactggca tgtgggactt aatcctgatc ctgttgaccg ttcacatcct 600aaagtgcaca agaactggca tgtgggactt aatcctgatc ctgttgaccg ttcacatcct 600

gatgttcatg atgatgtgct tgaggaggaa gctatggcaa tgaagtcatc gaccactcaa 660gatgttcatg atgatgtgct tgaggaggaa gctatggcaa tgaagtcatc gaccactcaa 660

acgaatgcaa ctaccacaac accaaatgtt acagtctcga tgaccaaaga agttcatggc 720acgaatgcaa ctaccacaac accaaatgtt acagtctcga tgaccaaaga agttcatggc 720

gctaattcat atgtgtcaac tcaagaggat caaaagagac cagagaataa tcaaacagaa 780gctaattcat atgtgtcaac tcaagaggat caaaagagac cagagaataa tcaaacagaa 780

gctattgtaa agcctactcc agagctacat aattcctcca tggatgctgg agcaaataat 840gctattgtaa agcctactcc agagctacat aattcctcca tggatgctgg agcaaataat 840

ttggcagcaa atgctactac agctggctca agagaaaacc tcaatagaaa tgtaaccacc 900ttggcagcaa atgctactac agctggctca agagaaaacc tcaatagaaa tgtaaccacc 900

aatgaggtgg atcaaagcaa aattagtgga gataagaatg aaactgttat taaattaaat 960aatgaggtgg atcaaagcaa aattagtgga gataagaatg aaactgttat taaattaaat 960

actagtacgg gtaattcctc agaaactctg gggacatctg gaaacagtag tacggcagag 1020actagtacgg gtaattcctc agaaactctg gggacatctg gaaacagtag tacggcagag 1020

acagtaacca aaagtgggag gcgacttctg gaagaggatg gttcgaaaga atctgtggac 1080acagtaacca aaagtgggag gcgacttctg gaagaggatg gttcgaaaga atctgtggac 1080

agccattcgg acagtaaaga caacagtgag ggtgtccgca tggcgacagt agaaaatgat 1140agccattcgg acagtaaaga caacagtgag ggtgtccgca tggcgacagt agaaaatgat 1140

ggaggcttag aagctgacgc agattcatcg tttgagttgt tgcgtgagaa tgatgagtta 1200ggaggcttag aagctgacgc agattcatcg tttgagttgt tgcgtgagaa tgatgagtta 1200

gctgatgaat acagttatga ttatgacgat tatgttgatg agaaaatgtg gggtgatgag 1260gctgatgaat acagttatga ttatgacgat tatgttgatg agaaaatgtg gggtgatgag 1260

gaatgggttg aggggcagca cgagaactca gaagattatg tgaatattga cgcccatata 1320gaatgggttg aggggcagca cgagaactca gaagattatg tgaatattga cgcccatata 1320

ctatgcactc ctgtaattgc tgacatagac aaagatggag tacaggagat gattgttgct 1380ctatgcactc ctgtaattgc tgacatagac aaagatggag tacaggagat gattgttgct 1380

gtttcctatt tcttcgaccc cgagtactat gataatccag aacatctgaa agagcttggt 1440gtttcctatt tcttcgaccc cgagtactat gataatccag aacatctgaa agagcttggt 1440

ggtatcgaca ttaaaaatta tattgctagt tcaattgtgg ttttcaatct tgatactaaa 1500ggtatcgaca ttaaaaatta tattgctagt tcaattgtgg ttttcaatct tgatactaaa 1500

caagtcaagt ggatcaaaga gctagatttg agtacggata aagcaaactt ccgtgcttat 1560caagtcaagt ggatcaaaga gctagatttg agtacggata aagcaaactt ccgtgcttat 1560

atttattctt caccaacggt tgttgatttg gatggcgatg gttatttgga tatccttgtc 1620atttattctt caccaacggt tgttgatttg gatggcgatg gttatttgga tatccttgtc 1620

ggaacttcct ttggcttatt ctacgccatg gatcatcgtg gaaacatcag agaaaaattc 1680ggaacttcct ttggcttatt ctacgccatg gatcatcgtg gaaacatcag agaaaaattc 1680

ccactggaaa tggctgaaat tcaaggagca gtggttgcgg ccgacataaa tgatgatgga 1740ccactggaaa tggctgaaat tcaaggagca gtggttgcgg ccgacataaa tgatgatgga 1740

aagattgaac ttgtaactac tgattcacac ggaaatatag cagcatggac cacccaagga 1800aagattgaac ttgtaactac tgattcacac ggaaatatag cagcatggac cacccaagga 1800

gtggaaattt gggaagcaca tcttaagagc cttgttcccc agggtccttc tataggcgat 1860gtggaaattt gggaagcaca tcttaagagc cttgttcccc agggtccttc tataggcgat 1860

gttgatggtg acggacacac ggaggttgtg gttcctacat catcaggaaa catatacgtt 1920gttgatggtg acggacacac ggaggttgtg gttcctacat catcaggaaa catatacgtt 1920

cttagtggca aggatggttc tattgtccgt ccttacccat acaggactca tggaagagtg 1980cttagtggca aggatggttc tattgtccgt ccttacccat acaggactca tggaagagtg 1980

atgaaccaac ttcttcttgt tgatctgaac aagcgaggtg agaaaaagaa gggtctcacc 2040atgaaccaac ttcttcttgt tgatctgaac aagcgaggtg agaaaaagaa gggtctcacc 2040

atcgttacta catcctttga cggttacctg tatctcatag atggacccac ctcgtgcact 2100atcgttacta catcctttga cggttacctg tatctcatag atggacccac ctcgtgcact 2100

gacgttgttg acattggcga aacttcatac agcatggtct tggctgataa tgttgacggt 2160gacgttgttg acattggcga aacttcatac agcatggtct tggctgataa tgttgacggt 2160

ggagatgatc tcgatcttat tgtctcaact atgaatggaa acgtcttttg cttctcaacg 2220ggagatgatc tcgatcttat tgtctcaact atgaatggaa acgtcttttg cttctcaacg 2220

ccttcttctc accatcccct taaggcttgg agatctagtg atcaaggcag gaacaataag 2280ccttcttctc accatcccct taaggcttgg agatctagtg atcaaggcag gaacaataag 2280

gccaatcgtt atgatcgtga aggcgttttt gtcacgcatt cgaccagagg tttccgtgat 2340gccaatcgtt atgatcgtga aggcgttttt gtcacgcatt cgaccagagg tttccgtgat 2340

gaggaaggca aaaacttctg ggctgagatc gagatcgttg ataaatatag atatccatct 2400gaggaaggca aaaacttctg ggctgagatc gagatcgttg ataaatatag atatccatct 2400

ggttcacaag caccctacaa cgttactacg acgctgttgg ttccaggcaa ttaccaggga 2460ggttcacaag caccctacaa cgttactacg acgctgttgg ttccaggcaa ttaccaggga 2460

gagaggagga taacgcagag ccagatctat gaccgccctg gaaaataccg gataaaacta 2520gagaggagga taacgcagag ccagatctat gaccgccctg gaaaataccg gataaaacta 2520

ccaactgtgg gagtgagaac aacaggaact gtaatggtgg agatggcaga taagaatgga 2580ccaactgtgg gagtgagaac aacaggaact gtaatggtgg agatggcaga taagaatgga 2580

ctccatttct cagacgaatt ctcactaact ttccatatgt attactacaa gcttctgaaa 2640ctccatttct cagacgaatt ctcactaact ttccatatgt attactacaa gcttctgaaa 2640

tggcttcttg ttctcccgat gctcgggatg ttcggtctgc tcgtgatact acggcctcaa 2700tggcttcttg ttctcccgat gctcgggatg ttcggtctgc tcgtgatact acggcctcaa 2700

gaagccgtgc ctctcccgtc tttttcccgc aacacagatt tatga 2745 <210> 46 <211> 896 <212> PRTgaagccgtgc ctctcccgtc tttttcccgc aacacagatt tatga 2745 <210> 46 <211> 896 <212> PRT

<213> Arabidopsis thaliana <400> 46<213> Arabidopsis thaliana <400> 46

Met Lys Ser Arg Ala Arg Gln Cys Leu Leu Val Cys Leu Leu Cys Leu 1 5 10 15 Ser Leu Thr Asn Leu Ser Tyr Gly Glu Asn Lys Phe Arg Glu Arg Lys 20 25 30 Ala Thr Asp Asp Glu Leu Gly Tyr Pro Asp Ile Asp Glu Asp Ala Leu 35 40 45 Leu Asn Thr Gln Cys Pro Lys Lys Leu Glu Leu Arg Trp Gln Thr Glu 50 55 60 Val Thr Ser Ser Val Tyr Ala Thr Pro Leu Ile Ala Asp Ile Asn Ser 65 70 75 80 Asp Gly Lys Leu Asp Ile Val Val Pro Ser Phe Val His Tyr Leu Glu 85 90 95 Val Leu Glu Gly Ala Asp Gly Asp Lys Met Pro Gly Trp Pro Ala Phe 100 105 110 His Gln Ser Asn Val His Ser Ser Pro Leu Leu Phe Asp Ile Asp Lys 115 120 125 Asp Gly Val Arg Glu Ile Ala Leu Ala Thr Tyr Asn Ala Glu Val Leu 130 135 140 Phe Phe Arg Val Ser Gly Phe Leu Met Ser Asp Lys Leu Glu Val Pro 145 150 155 160 Arg Arg Lys Val His Lys Asn Trp His Val Gly Leu Asn Pro Asp Pro 165 170 175 Val Asp Arg Ser His Pro Asp Val His Asp Asp Val Leu Glu Glu Glu 180 185 190 Ala Met Ala Met Lys Ser Ser Thr Thr Gln Thr Asn Ala Thr Thr Thr 195 200 205 Thr Pro Asn Val Thr Val Ser Met Thr Lys Glu Val His Gly Ala Asn 210 215 220 Ser Tyr Val Ser Thr Gln Glu Asp Gln Lys Arg Pro Glu Asn Asn Gln 225 230 235 240 Thr Glu Ala Ile Val Lys Pro Thr Pro Glu Leu His Asn Ser Ser Met 245 250 255 Asp Ala Gly Ala Asn Asn Leu Ala Ala Asn Ala Thr Thr Ala Gly Ser 260 265 270 Arg Glu Asn Leu Asn Arg Asn Val Thr Thr Asn Glu Val Asp Gln Ser 275 280 285 Lys Ile Ser Gly Asp Lys Asn Glu Thr Val Ile Lys Leu Asn Thr Ser 290 295 300 Thr Gly Asn Ser Ser Glu Thr Leu Gly Thr Ser Gly Asn Ser Ser Thr 305 310 315 320 Ala Glu Thr Val Thr Lys Ser Gly Arg Arg Leu Leu Glu Glu Asp Gly 325 330 335 Ser Lys Glu Ser Val Asp Ser His Ser Asp Ser Lys Asp Asn Ser Glu 340 345 350 Gly Val Arg Met Ala Thr Val Glu Asn Asp Gly Gly Leu Glu Ala Asp 355 360 365 Ala Asp Ser Ser Phe Glu Leu Leu Arg Glu Asn Asp Glu Leu Ala Asp 370 375 380 Glu Tyr Ser Tyr Asp Tyr Asp Asp Tyr Val Asp Glu Lys Met Trp Gly 385 390 395 400 Asp Glu Glu Trp Val Glu Gly Gln His Glu Asn Ser Glu Asp Tyr Val 405 410 415 Asn Ile Asp Ala His Ile Leu Cys Thr Pro Val Ile Ala Asp Ile Asp 420 425 430 Lys Asp Gly Val Gln Glu Met Ile Val Ala Val Ser Tyr Phe Phe Asp 435 440 445 Pro Glu Tyr Tyr Asp Asn Pro Glu His Leu Lys Glu Leu Gly Gly Ile 450 455 460 Asp Ile Lys Asn Tyr Ile Ala Ser Ser Ile Val Val Phe Asn Leu Asp 465 470 475 480 Thr Lys Gln Val Lys Trp Ile Lys Glu Leu Asp Leu Ser Thr Asp Lys 485 490 495 Ala Asn Phe Arg Ala Tyr Ile Tyr Ser Ser Pro Thr Val Val Asp LeuMet Lys Ser Arg Arg Wing Gln Cys Leu Leu Val Cys Leu Leu Cys Leu 1 5 10 15 Ser Leu Thr Asn Leu Ser Tyr Gly Glu Asn Lys Phe Arg Glu Arg Lys 20 25 30 Wing As Thr Asp Glu Leu Gly Tyr Pro Asp Ile Asp Glu Asp Wing Leu 35 40 45 Read Asn Thr Gln Cys Pro Lys Lys Leu Glu Leu Arg Trp Gln Thr Glu 50 55 60 Val Thr Be Ser Val Tyr Wing Pro Pro Ile Wing Asp Ile Asn Ser 65 70 75 80 Asp Gly Lys Leu Asp Ile Val Val Pro Ser Phe Val His Tyr Leu Glu 85 90 95 Val Leu Glu Gly Ala Asp Gly Asp Lys Met Pro Gly Trp Pro Ala Phe 100 105 110 His Gln Ser Asn Val His Ser Ser Pro Leu Phe Asp Ile Asp Lys 115 120 125 Asp Gly Val Arg Glu Ile Wing Leu Thr Wing Tyr Asn Wing Glu Val Leu 130 135 140 Phe Phe Arg Val Ser Gly Phe Leu Met Ser Asp Lys Leu Glu Val Pro 145 150 155 160 Arg Lys Val His Lys Asn Trp His Val Gly Read Asn Pro Asp Pro 165 170 175 Val Asp Arg Be His Pro Asp Val is Asp Asp Val Leu Glu Glu Glu 180 185 190 Wing Met Wing Met Lys Being Ser Thr Thr Gln Thr Asn Wing Thr Thr Thr 195 200 205 Thr Pro Asn Val Thr Val Being Met Thr Lys Glu Val His Gly Wing Asn 210 215 220 Ser Tyr Val Ser Thr Gln Glu Asp Gln Lys Arg Pro Glu Asn Asn Gln 225 230 235 240 Thr Glu Wing Ile Val Lys Pro Thr Glu Leu His Asn Ser Be Met 245 250 255 Asp Wing Gly Wing Asn Asn Leu Wing Wing Asn Wing Thr Thr Wing Gly Ser 260 265 270 Arg Glu Asn Leu Asn Arg Asn Val Thr Thr Asn Glu Val Asp Gln Ser 275 280 285 Lys Ile Ser Gly Asp Lys Asn Glu Thr Val Ile Lys Leu Asn Thr Ser 290 295 300 Thr Gly Asn Ser Ser Glu Thr Leu Gly Thr Be Gly Asn Ser Be Thr 305 310 315 320 Wing Glu Thr Val Lys Be Gly Arg Arg Leu Read Leu Glu Glu Asp Gly 325 330 335 Be Lys Glu Be Val Asp Be His Asp Be Lys Asp Asn Be Glu 340 345 350 Gly Val Arg Met Wing Thr Val Glu Asn Asp Gly Gl and Leu Glu Wing Asp 355 360 365 Wing Asp Be Ser Phe Glu Leu Read Le Arg Glu Asn Asp Glu Leu Wing Asp 370 375 380 Glu Tyr Ser Tyr Asp Tyr Asp Tyr Val Asp Glu Trp Val Glu Gly Gln His Glu Asn Ser Glu Asp Tyr Val 405 410 415 Asn Ile Asp Wing His Ile Leu Cys Thr Pro Val Ile Wing Asp Ile Asp 420 425 430 Lys Asp Gly Val Gln Glu Met Wing Asp 435 440 445 Pro Glu Tyr Tyr Asp Pro Glu His Leu Lys Glu Leu Gly Gly Ile 450 455 460 Asp Ile Lys Asn Tyr Ile Wing Ser Ser Ile Val Val Phe Lys Glu Leu Asp Leu Ser Thr Thr Asp Lys 485 490 495 Asn Phe Arg Wing Tyr Ile Tyr Ser Ser Thr Thr Val Val Asp Leu

500 505 510500 505 510

Asp Gly Asp Gly Tyr Leu Asp Ile Leu Val Gly Thr Ser Phe Gly LeuAsp Gly Asp Gly Tyr Leu Asp Ile Leu Val Gly Thr Be Phe Gly Leu

515 520 525515 520 525

Phe Tyr Ala Met Asp His Arg Gly Asn Ile Arg Glu Lys Phe Pro LeuPhe Tyr Ala Met Asp His Arg Gly Asn Ile Arg Glu Lys Phe Pro Leu

530 535 540530 535 540

Glu Met Ala Glu Ile Gln Gly Ala Val Val Ala Ala Asp Ile Asn Asp 545 550 555 560Glu Met Wing Glu Ile Gln Gly Wing Val Val Wing Wing Asp Ile Asn Asp 545 550 555 560

Asp Gly Lys Ile Glu Leu Val Thr Thr Asp Ser His Gly Asn Ile AlaAsp Gly Lys Ile Glu Read Val Thr Thr Asp Be His Gly Asn Ile Wing

565 570 575565 570 575

Ala Trp Thr Thr Gln Gly Val Glu Ile Trp Glu Ala His Leu Lys SerTrp Wing Thr Thr Gln Gly Val Glu Ile Trp Glu Wing His Leu Lys Ser

580 585 590580 585 590

Leu Val Pro Gln Gly Pro Ser Ile Gly Asp Val Asp Gly Asp Gly HisRead Val Pro Gln Gly Pro Ser Ile Gly Asp Val Asp Gly Asp Gly His

595 600 605595 600 605

Thr Glu Val Val Val Pro Thr Ser Ser Gly Asn Ile Tyr Val Leu SerThr Glu Val Val Val Pro Thr Be Ser Gly Asn Ile Tyr Val Leu Ser

610 615 620610 615 620

Gly Lys Asp Gly Ser Ile Val Arg Pro Tyr Pro Tyr Arg Thr His Gly 625 630 635 640Gly Lys Asp Gly Ser Ile Val Arg Tyr Pro Tyr Tyr Arg Thr His Gly 625 630 635 640

Arg Val Met Asn Gln Leu Leu Leu Val Asp Leu Asn Lys Arg Gly GluArg Val Met Asn Gln Leu Leu Leu Val Asp Leu Asn Lys Arg Gly Glu

645 650 655645 650 655

Lys Lys Lys Gly Leu Thr Ile Val Thr Thr Ser Phe Asp Gly Tyr LeuLys Lys Lys Gly Leu Thr Ile Val Thr Thr Be Phe Asp Gly Tyr Leu

660 665 670660 665 670

Tyr Leu Ile Asp Gly Pro Thr Ser Cys Thr Asp Val Val Asp Ile GlyTyr Leu Ile Gly Asp Pro Thr Be Cys Asp Val Val Asp Ile Gly

675 680 685675 680 685

Glu Thr Ser Tyr Ser Met Val Leu Ala Asp Asn Val Asp Gly Gly AspGlu Thr Be Tyr Be Met Val Leu Wing Asp Asn Val Asp Gly Gly Asp

690 695 700690 695 700

Asp Leu Asp Leu Ile Val Ser Thr Met Asn Gly Asn Val Phe Cys Phe 705 710 715 720Asp Leu Asp Leu Ile Val Be Thr Met Asn Gly Asn Val Phe Cys Phe 705 710 715 720

Ser Thr Pro Ser Ser His His Pro Leu Lys Ala Trp Arg Ser Ser AspBe Thr Pro Be Be His His Pro Read Lys Wing Trp Arg Be Be Asp

725 730 735725 730 735

Gln Gly Arg Asn Asn Lys Ala Asn Arg Tyr Asp Arg Glu Gly Val PheGln Gly Arg Asn Asn Lys Wing Asn Arg Tyr Asp Arg Glu Gly Val Phe

740 745 750740 745 750

Val Thr His Ser Thr Arg Gly Phe Arg Asp Glu Glu Gly Lys Asn PheVal Thr His Ser Thr Arg Gly Phe Arg Asp Glu Glu Gly Lys Asn Phe

755 760 765755 760 765

Trp Ala Glu Ile Glu Ile Val Asp Lys Tyr Arg Tyr Pro Ser Gly SerTrp Wing Glu Ile Glu Ile Val Asp

770 775 780770 775 780

Gln Ala Pro Tyr Asn Val Thr Thr Thr Leu Leu Val Pro Gly Asn Tyr 785 790 795 800Gln Wing Pro Tyr Asn Val Thr Thr Thr Read Leu Val Pro Gly Asn Tyr 785 790 795 800

Gln Gly Glu Arg Arg Ile Thr Gln Ser Gln Ile Tyr Asp Arg Pro GlyGln Gly Glu Arg Arg Ile Thr Gln Be Gln Ile Tyr Asp Arg Pro Gly

805 810 815805 810 815

Lys Tyr Arg Ile Lys Leu Pro Thr Val Gly Val Arg Thr Thr Gly ThrLys Tyr Arg Ile Lys Read Pro Thr Val Gly

820 825 830820 825 830

Val Met Val Glu Met Ala Asp Lys Asn Gly Leu His Phe Ser Asp GluVal Met Val Glu Met Wing Asp Lys Asn Gly Read His Phe Ser Asp Glu

835 840 845835 840 845

Phe Ser Leu Thr Phe His Met Tyr Tyr Tyr Lys Leu Leu Lys Trp LeuPhe Ser Leu Thr Phe His Met Tyr Tyr Tyr Lys Leu Leu Lys Trp Leu

850 855 860850 855 860

Leu Val Leu Pro Met Leu Gly Met Phe Gly Leu Leu Val Ile Leu Arg 865 870 875 880Leu Val Leu Pro Met Leu Gly Met Phe Gly Leu Leu Val Ile Leu Arg 865 870 875 880

Pro Gln Glu Ala Val Pro Leu Pro Ser Phe Ser Arg Asn Thr Asp Leu 885 890 895Pro Gln Glu Wing Val Pro Leu Pro Be Phe Ser Arg Asn Thr Asp Leu 885 890 895

<210> 47<210> 47

<211> 53<211> 53

<212> DNA<212> DNA

<213> Seqüência artificial<213> Artificial sequence

<220><220>

<223> iniciador: prm06643<223> initiator: prm06643

<400> 47<400> 47

ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa atctcgagcg agg <210> 48ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa atctcgagcg agg <210> 48

<211> 52<211> 52

<212> DNA<212> DNA

<213> Seqüência artificial<213> Artificial sequence

<220> <223> iniciador: prm06644 <400> 48<220> <223> initiator: prm06644 <400> 48

ggggaccact ttgtacaaga aagctgggtc ctgtttacag atggtaccta gt 52 <210> 49 <211> 4938 <212> DNAggggaccact ttgtacaaga aagctgggtc ctgtttacag atggtaccta gt 52 <210> 49 <211> 4938 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> cassete de expressão <400> 49<223> expression cassette <400> 49

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120

catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180

tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240

tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300

aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360

atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420

ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480

ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540

gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600

tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660

tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720

aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780

aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840

acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900

tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960

aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020

ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080

cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140

cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200

tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260

gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320

ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380

gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440

aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500

ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560

atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620

acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680

cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740

ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800

gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860

tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920

attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980

tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040

cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100

agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160

tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag 2220tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag 2220

tttgtacaaa aaagcaggct taaacaatga aatctcgagc gaggcagtgt ctgctggttt 2280tttgtacaaa aaagcaggct taaacaatga aatctcgagc gaggcagtgt ctgctggttt 2280

gtttgctctg tctttcctta acgaatctct cctatggaga aaataagttc agagagcgta 2340gtttgctctg tctttcctta acgaatctct cctatggaga aaataagttc agagagcgta 2340

aagccaccga tgacgagctg ggctaccccg atattgatga agatgcttta ttgaatactc 2400aagccaccga tgacgagctg ggctaccccg atattgatga agatgcttta ttgaatactc 2400

agtgcccgaa aaaattggag ctgcgatggc aaactgaagt cacttctagc gtttatgcta 2460agtgcccgaa aaaattggag ctgcgatggc aaactgaagt cacttctagc gtttatgcta 2460

cacccttgat tgctgatatt aacagtgatg gaaagcttga cattgttgtt ccatcttttg 2520cacccttgat tgctgatatt aacagtgatg gaaagcttga cattgttgtt ccatcttttg 2520

ttcattacct cgaagttctt gaaggagctg atggagacaa gatgccaggt tggcctgctt 2580ttcattacct cgaagttctt gaaggagctg atggagacaa gatgccaggt tggcctgctt 2580

ttcaccagtc aaatgtgcac tcgagtcctc ttctatttga tatcgacaaa gatggtgtta 2640ttcaccagtc aaatgtgcac tcgagtcctc ttctatttga tatcgacaaa gatggtgtta 2640

gagaaattgc tctggctacc tacaatgccg aagtgctctt tttcagggta tcaggctttt 2700gagaaattgc tctggctacc tacaatgccg aagtgctctt tttcagggta tcaggctttt 2700

tgatgtcaga taagctagaa gtgccacgta gaaaagtgca caagaactgg catgtgggac 2760tgatgtcaga taagctagaa gtgccacgta gaaaagtgca caagaactgg catgtgggac 2760

ttaatcctga tcctgttgac cgttcacatc ctgatgttca tgatgatgtg cttgaggagg 2820ttaatcctga tcctgttgac cgttcacatc ctgatgttca tgatgatgtg cttgaggagg 2820

aagctatggc aatgaagtca tcgaccactc aaacgaatgc aactaccaca acaccaaatg 2880aagctatggc aatgaagtca tcgaccactc aaacgaatgc aactaccaca acaccaaatg 2880

ttacagtctc gatgaccaaa gaagttcatg gcgctaattc atatgtgtca actcaagagg 2940ttacagtctc gatgaccaaa gaagttcatg gcgctaattc atatgtgtca actcaagagg 2940

atcaaaagag accagagaat aatcaaacag aagctattgt aaagcctact ccagagctac 3000atcaaaagag accagagaat aatcaaacag aagctattgt aaagcctact ccagagctac 3000

ataattcctc catggatgct ggagcaaata atttggcagc aaatgctact acagctggct 3060ataattcctc catggatgct ggagcaaata atttggcagc aaatgctact acagctggct 3060

caagagaaaa cctcaataga aatgtaacca ccaatgaggt ggatcaaagc aaaattagtg 3120caagagaaaa cctcaataga aatgtaacca ccaatgaggt ggatcaaagc aaaattagtg 3120

gagataagaa tgaaactgtt attaaattaa atactagtac gggtaattcc tcagaaactc 3180 tggggacatc tggaagagga agggtgtccg cgtttgagtt attatgttga cagaagatta acaaagatgg atgataatcc gttcaattgt tgagtacgga tggatggcga tggatcatcg cagtggttgc acggaaatat gccttgttcc tggttcctac gtccttaccc acaagcgagg tgtatctcat acagcatggt ctatgaatgg ggagatctag ttgtcacgca tcgagatcgt cgacgctgtt atgaccgccc ctgtaatggt ctttccatat tgttcggtct gcaacacaga <210> 50 <211> 10 <212> PRT <213> Seqüência artificial <220>gagataagaa tgaaactgtt attaaattaa atactagtac gggtaattcc tcagaaactc 3180 tggggacatc tggaagagga agggtgtccg cgtttgagtt attatgttga cagaagatta acaaagatgg atgataatcc gttcaattgt tgagtacgga tggatggcga tggatcatcg cagtggttgc acggaaatat gccttgttcc tggttcctac gtccttaccc acaagcgagg tgtatctcat acagcatggt ctatgaatgg ggagatctag ttgtcacgca tcgagatcgt cgacgctgtt atgaccgccc ctgtaatggt ctttccatat tgttcggtct gcaacacaga <210> 50 <211> 10 <212> PRT < 213> Artificial sequence <220>

<223> motivo conservado 1 <220><223> Subject retained 1 <220>

<221> VARIANTE<221> VARIANT

<222> (9)..(9)<222> (9) .. (9)

<223> /substituir="Glu"<223> / replace = "Glu"

<400> 50<400> 50

Phe Asp Gly Tyr Leu Tyr Leu Ile Asp Gly 15 10Phe Asp Gly Tyr Leu Tyr Leu Ile Asp Gly 15 10

<210> 51 <211> 5 <212> PRT<210> 51 <211> 5 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo conservado 2 <220><223> Subject retained 2 <220>

<221> INSEGURO <222> (3)..(4)<221> UNSAFE <222> (3) .. (4)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220><223> Xaa can be any naturally occurring amino acid <220>

<221> VARIANTE <222> (5)..(5) <223> /substituir="Glu" <400> 51<221> VARIANT <222> (5) .. (5) <223> / replace = "Glu" <400> 51

Asp Gly Xaa Xaa Asp 1 5Asp Gly Xaa Xaa Asp 1 5

<210> 52 <211> 9 <212> PRT<210> 52 <211> 9 <212> PRT

tggaaacagt tggttcgaaa catggcgaca gttgcgtgag tgagaaaatg tgtgaatatt agtacaggag agaacatctg ggttttcaat taaagcaaac tggttatttg tggaaacatc ggccgacata agcagcatgg ccagggtcct atcatcagga atacaggact tgagaaaaag agatggaccc cttggctgat aaacgtcttt tgatcaaggc ttcgaccaga tgataaatat ggttccaggc tggaaaatac ggagatggca gtattactac gctcgtgata tttatgattggaaacagt tggttcgaaa catggcgaca gttgcgtgag tgagaaaatg tgtgaatatt agtacaggag agaacatctg ggttttcaat taaagcaaac tggttatttg tggaaacatc ggccgacata agcagcatgg ccagggtcct atcatcagga atacaggact tgagaaaaag agatggaccc cttggctgat aaacgtcttt tgatcaaggc ttcgaccaga tgataaatat ggttccaggc tggaaaatac ggagatggca gtattactac gctcgtgata tttatgat

agtacggcag gaatctgtgg gtagaaaatg aatgatgagt tggggtgatg gacgcccata atgattgttg aaagagcttg cttgatacta ttccgtgctt gatatccttg agagaaaaat aatgatgatg accacccaag tctataggcg aacatatacg catggaagag aagggtctca acctcgtgca aatgttgacg tgcttctcaa aggaacaata ggtttccgtg agatatccat aattaccagg cggataaaac gataagaatg aagcttctga ctacggcctcagtacggcag gaatctgtgg gtagaaaatg aatgatgagt tggggtgatg gacgcccata atgattgttg aaagagcttg cttgatacta ttccgtgctt gatatccttg agagaaaaat aatgatgatg accacccaag tctataggcg aacatatacg catggaagag aagggtctca acctcgtgca aatgttgacg tgcttctcaa aggaacaata ggtttccgtg agatatccat aattaccagg cggataaaac gataagaatg aagcttctga ctacggcctc

agacagtaac acagccattc atggaggctt tagctgatga aggaatgggt tactatgcac ctgtttccta gtggtatcga aacaagtcaa atatttattc tcggaacttc tcccactgga gaaagattga gagtggaaat atgttgatgg ttcttagtgg tgatgaacca ccatcgttac ctgacgttgt gtggagatga cgccttctcc aggccaatcg atgaggaagg ctggttcaca gagagaggag taccaactgt gactccattt aatggcttct aagaagccgtagacagtaac acagccattc atggaggctt tagctgatga aggaatgggt tactatgcac ctgtttccta gtggtatcga aacaagtcaa atatttattc tcggaacttc tcccactgga gaaagattga gagtggaaat atgttgatgg ttcttagtgg tgatgaacca ccatcgttac ctgacgttgt gtggagatga cgccttctcc aggccaatcg atgaggaagg ctggttcaca gagagaggag taccaactgt gactccattt aatggcttct aagaagccgt

caaaagtggg ggacagtaaa agaagctgac atacagttat tgaggggcag tcctgtaatt tttcttcgac cattaaaaat gtggatcaaa ttcaccaacg ctttggctta aatggctgaa acttgtaact ttgggaagca tgacggacac caaggatggt acttcttctt tacatccttt tgacattggc tctcgatctt tcaccatccc ttatgatcgt caaaaacttc agcaccctac gataacgcag gggagtgaga ctcagacgaa tgttctcccg gcctctcccgcaaaagtggg ggacagtaaa agaagctgac atacagttat tgaggggcag tcctgtaatt tttcttcgac cattaaaaat gtggatcaaa ttcaccaacg ctttggctta aatggctgaa acttgtaact ttgggaagca tgacggacac caaggatggt acttcttctt tacatccttt tgacattggc tctcgatctt tcaccatccc ttatgatcgt caaaaacttc agcaccctac gataacgcag gggagtgaga ctcagacgaa tgttctcccg gcctctcccg

aggcgacttc gacaacagtg gcagattcat gattatgacg cacgagaact gctgacatag cccgagtact tatattgcta gagctagatt gttgttgatt ttctacgcca attcaaggag actgattcac catcttaaga acggaggttg tctattgtcc gttgatctga gacggttacc gaaacttcat attgtctcaa cttaaggctt gaaggcgttt tgggctgaga aacgttacta agccagatct acaacaggaa ttctcactaa atgctcggga tctttttcccaggcgacttc gacaacagtg gcagattcat gattatgacg cacgagaact gctgacatag cccgagtact tatattgcta gagctagatt gttgttgatt ttctacgcca attcaaggag actgattcac catcttaaga acggaggttg tctattgtcc gttgatctga gacggttacc gaaacttcat attgtctcaa cttaaggctt gaaggcgttt tgggctgaga aacgttacta agccagatct acaacaggaa ttctcactaa atgctcggga tctttttccc

3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4938 <213> Seqüência artificial <220>3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4938 <213> Artificial sequence <220>

<223> motivo conservado 3 <220><223> Subject retained 3 <220>

INSEGURO (2)..(2)INSECURE (2) .. (2)

Xaa pode ser qualquer aminoácido ocorrendo naturalmenteXaa can be any naturally occurring amino acid

<221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <400><221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <220> <221> <222> <223> <400>

INSEGURO (4} . . (4) Xaa podeUNSAFE (4}.. (4) Xaa can

INSEGURO (7) .. (8) Xaa podeINSECURE (7) .. (8) Xaa can

ser qualquer aminoácido ocorrendo naturalmentebe any naturally occurring amino acid

ser qualquer aminoácido ocorrendo naturalmentebe any naturally occurring amino acid

VARIANTE (9)..(9)VARIANT (9) .. (9)

/substituir="Glu" 52/ replace = "Glu" 52

Asp Xaa Asp Xaa Asp Gly Xaa Xaa Asp 1 5Asp Xaa Asp Xaa Asp Gly Xaa Xaa Asp 1 5

<210> <211> <212> <213> <220> <223> <400><210> <211> <212> <213> <220> <223> <400>

53 36 PRT53 36 PRT

SeqüênciaSequence

seqüência 53string 53

SerTo be

Gly Gly Ser 1Gly Gly Ser 1

Asp Leu ValAsp Leu Val

Val 20 LeuVal 20 Leu

artificialartificial

de domínio conservado FG-GAPFG-GAP Conserved Domain Name

Val Ala Ala Gly Asp Leu Asn Gly Asp Gly Arg Pro 5 10 15Val Wing Wing Gly Asp Read Asn Gly Asp Gly Arg Pro 5 10 15

Gly Ala Pro Gly Ala Asp Gly Gly Thr Asp Gly Ser 25 30Gly Wing Pro Gly Wing Asp Gly Gly Thr Asp Gly Ser 25 30

Val Tyr Leu 35Val Tyr Leu 35

<210> 54 <211> 2449 <212> DNA<210> 54 <211> 2449 <212> DNA

<213> Arabidopsis thaliana <400> 54<213> Arabidopsis thaliana <400> 54

gttctctctg ctctçgttctctctg ctctç

attcttcatc gccattgata gatgctctct agaagcatgg accacctatt tgatgccaaa agcacgtgtt acgtgctgtg gaagcaggtt gaaaaagctg gatagcaatt tggtggacgg gacagcacaa ttctggagcc tcttcgatgg aattccacaaattcttcatc gccattgata gatgctctct agaagcatgg accacctatt tgatgccaaa agcacgtgtt acgtgctgtg gaagcaggtt gaaaaagctg gatagcaatt tggtggacgg gacagcacaa ttctggagccggcgcgcg

ggatttgcta tttcatttgt gtagctgatc attcaggttc cttgcggaaa gccatggcca gtggtcgttg tgggaaacga tcgataagca atggagatgc aatgctgatc ataaacttgc agtaaaaaga cacaattacaggatttgcta tttcatttgt gtagctgatc attcaggttc cttgcggaaa gccatggcca gtggtcgttg tgggaaacga tggataagca atggagtgatc ataaacttgc agtaaaaaga cacaattaca

tattcttcac tcttcagcactattcttcac tcttcagcac

gtttgagtgc agggaattta acgtgaagat acattattga gaagcaggct ggtagtaagt cgctggaaag gacttgtcaa tggctcggca aaacccaaga gctttggtgg gttcctaatg ttgttgtggc tcatcaaaag tttgcctact ggtcgaacac tttgcaagct ttctctacttgtttgagtgc agggaattta acgtgaagat acattattga gaagcaggct ggtagtaagt cgctggaaag

ttacctcagg ttggtctgtg atctgcagga ggatttccca attacacatt gaagcatggt agccatataa tcacatggac aacacagaag aagtgctact gtcacttttc tgtctatgca ctgatgatgt tgaagctcac agcttgatgt gcatgctcta gagaatcaat tcttagtgtc agcttgctca tttcaggcga ctacagctta tccgtttcac gaaagattcc aaaattgatt agggtatgca atacattccgttacctcagg ttggtctgtg atctgcagga ggatttccca attacacatt gaagcatggt agccatataa tcacatggac aacacagaag aagtgctact gtcacttttc tgtctatgca ctgatgatgt tgaagctcac agcttgatgt gcatgctcta gagaatcaat tcttagtgtc agcttgctca tttcaggcga ctacagctta tccgtttcac gaaagattcc aaaattgatt agggtatgca atacattccg

ctacctactg atgcaaatct 60 aaacgcgatt tggctatttt 120 gagggtgatt ttgcgttcaa 180 tacgaagctg atcgtctccc 240 gaggttctcg ttgctactaa 300 gtggatgaag gttttagtga 360 atccgtgttg cgtcagggag 420 tataaaaatg gaactcccca 480 ctctgctttg atcacaacct 540 cataatgcac accatagaga 600 gatacgggtt tggttattgt 660 ccatttgagg aacttggcat 720 gagaatcagg cctctgaaga 780 tttgctggca agactggcct 840 acctcagatg catcacaatt 900 aatagccgtc acccaggaga 960 atgccccatc gctgggaccg 1020 cacaagagga aaacattgaa 1080 aaacctgagg aacacacacc 1140 ggaaaggctg cacgctatgc 1200 acgataacta attacacgaa 1260 gaaggaattg aagctattca 1320 gaaggtggac ttcacgccga 1380 cataaacgga gatggtgttc tcgatcatgt ccagactgtc aactgtagtg agcgggtcaa tggaagtgtt gaagccttgc cgttcccatc cgggaacagc tctttaacgt ctcgatctgc cttgcactat ggaggagatt actcacgaca cttcgcccag ggagatcgca actcccattc tcatccccag agatgatgga tcacggagat gtaatcttct tgacaaaccg tggagaggtg gcacggccac gacgcagtct ggcaatggca gcttcagaca cccgtctcca tcgggtttaa ctgaatcagg gacggtggtc gttgcgcatt catgataacc agcctatgat ccttgccggg catctctccg ggaggaagca tattggcttc catcgaatta acttatcact gatgacttct cgaacgatgg tctaacggat tggggtttac gggtttgttc aaaccagaca gccaggggct gggttgtctc ttagtagtta tggcagttat tttcgttact aggtaagcct cgaccatcat ctagctttta atagaaatct tacggaagtt aaaccggcag gtccgcttta gcagcttcac cggaaatatt actgatatac cagtgtagat tcagtgcctt taactttata ctttgtagaa ttcaagtaaa aaatggtaga tttttgtcaa ttttgatgtt ttaatggaat tatgtgacat <210> 55 <211> 698 <212> PRTctacctactg atgcaaatct 60 aaacgcgatt tggctatttt 120 gagggtgatt ttgcgttcaa 180 tacgaagctg atcgtctccc 240 gaggttctcg ttgctactaa 300 gtggatgaag gttttagtga 360 atccgtgttg cgtcagggag 420 tataaaaatg gaactcccca 480 ctctgctttg atcacaacct 540 cataatgcac accatagaga 600 gatacgggtt tggttattgt 660 ccatttgagg aacttggcat 720 gagaatcagg cctctgaaga 780 tttgctggca agactggcct 840 acctcagatg catcacaatt 900 aatagccgtc acccaggaga 960 atgccccatc gctgggaccg 1020 cacaagagga aaacattgaa 1080 aaacctgagg aacacacacc 1140 ggaaaggctg cacgctatgc 1200 acgataacta attacacgaa 1260 gaaggaattg aagctattca 1320 gaaggtggac ttcacgccga 1380 cataaacgga gatggtgttc tcgatcatgt ccagactgtc aactgtagtg agcgggtcaa tggaagtgtt gaagccttgc cgttcccatc cgggaacagc tctttaacgt ctcgatctgc cttgcactat ggaggagatt actcacgaca cttcgcccag ggagatcgca actcccattc tcatccccag agatgatgga tcacggagat gtaatcttct tgacaaaccg tggagaggtg gcacggccac gacgcagtct ggcaatggca gcttcagaca cccgtctcca tcgggtttaa ctgaatcagg gacggtggtc gttgcgcatt catgataacc agcctatgat ccttgcc ggg catctctccg ggaggaagca tattggcttc catcgaatta acttatcact gatgacttct cgaacgatgg tctaacggat tggggtttac gggtttgttc aaaccagaca gccaggggct gggttgtctc ttagtagtta tggcagttat tttcgttact aggtaagcct cgaccatcat ctagctttta atagaaatct tacggaagtt aaaccggcag gtccgcttta gcagcttcac cggaaatatt actgatatac cagtgtagat tcagtgcctt taactttata ctttgtagaa ttcaagtaaa aaatggtaga tttttgtcaa ttttgatgtt ttaatggaat tatgtgacat <210> 55 <211> 698 <212> PRT

<213> Arabidopsis thaliana <400> 55<213> Arabidopsis thaliana <400> 55

Met Arg Lys Arg Asp Leu Ala Ile Leu Met Leu 15 10Met Arg Lys Arg Asp Leu Wing Ile Leu Met Leu 15 10

Phe Phe Thr Leu Gln His Glu Gly Asp Phe AlaPhe Phe Thr Read Gln His Glu Gly Asp Phe Wing

20 2520 25

Phe His Leu Tyr Asp Glu Tyr Pro Val Lys TyrPhe His Tyr Asp Glu Tyr Pro Val Lys Tyr

35 4035 40

Pro Pro Pro Ile Val Ala Asp Leu Asn Gly AspPro Pro Pro Ile Val Wing Asp Read Asn Gly Asp

50 5550 55

Leu Val Ala Thr Asn Asp Ala Lys Ile Gln Val 65 70 75Leu Val Wing Thr Asn Asp Wing Lys Ile Gln Val 65 70 75

Arg Arg Val Asp Glu Gly Phe Ser Glu Ala ArgArg Arg Val Asp Glu Gly Phe Ser Glu Wing Arg

85 9085 90

Thr Leu Leu Pro Asp Lys Ile Arg Val Ala SerThr Read Leu Pro Asp Lys Ile Arg Val Wing Ser

100 105100 105

Ala Met Ala Thr Gly Val Ile Asp Arg Tyr TyrWings Met Wings Thr Gly Val Ile Asp Arg Tyr Tyr

ggaggcaatg tgggcagtgg catcactccc gcaagagaca cacaaacacc acatcataca gaagccacat ccaaccctga ggagatcaag ccgtctcaac gtgattgtga ctgttcttca cagcacttaa cgtagagttt ccacatcggt atttcctggt ggcaaataga ttaatttatggaggcaatg tgggcagtgg catcactccc gcaagagaca cacaaacacc acatcataca gaagccacat ccaaccctga ggagatcaag ccgtctcaac gtgattgtga cagcacttaa cgtagagttt ccacatcgggt atttgtatta

ttggagagag caacctcagg cttttaactt cctctactct gcaaaggcag cgcctgatgt ggtcgaatct aaccattctc cagcggtcat cgactcatgc tgacctcaaa gttcgttggt actccattca tcttcctctc tttggtaaac ttcagctgta ggactttatgttggagagag caacctcagg cttttaactt cctctactct gcaaaggcag cgcctgatgt

115115

120120

Gln Lys Gln Val Val Val Val Val Thr Ser GlyGln Lys Gln Val Val Val Val Val Val Ser Gly

130130

135135

Phe Asp His Asn Leu Lys Lys Leu Trp Glu ThrPhe Asp His Asn Leu Lys Lys Leu Trp Glu Thr

145145

150150

155155

Phe Pro His Asn Ala His His Arg Glu Ile AlaPhe Pro His Asn Wing His His Arg Glu Ile Wing

165165

170170

Tyr Thr Leu Lys His Gly Asp Thr Gly Leu ValTyr Thr Read Lys His Gly Asp Thr Gly Read Leu

180180

185185

Met Glu Met Gln Pro Tyr Asn His Met Asp ProMet Glu Met Gln Pro Tyr Asn His Met Asp Pro

195195

200200

Met Thr Ala Gln Asn Ala Asp Gln His Arg ArgMet Thr Wing Gln Asn Wing Asp Gln His Arg Arg

210 215210 215

Gln Ala Ser Glu Asp Ser Gly Ala Ile Asn Leu 225 230 235Gln Wing Be Glu Asp Be Gly Wing Ile Asn Leu 225 230 235

Tyr Ala Phe Ala Gly Lys Thr Gly Leu Leu ArgTyr Ala Phe Ala Gly Lys Thr Gly Leu Leu Arg

245 250245 250

Asp Asp Val Glu Ala His Thr Ser Asp Ala SerAsp Asp Val Glu Wing His Thr Be Asp Wing Wing

260 265260 265

His Asn Tyr Lys Leu Asp Val His Ala Leu AsnHis Asn Tyr Lys Leu Asp Val

275 280275 280

Glu Phe Glu Cys Arg Glu Phe Arg Glu Ser IleGlu Phe Glu Cys Arg Glu Phe Arg Glu Ser Ile

290 295290 295

His Arg Trp Asp Arg Arg Glu Asp Thr Leu Leu 305 310 315His Arg Trp Asp Arg Arg Glu Asp Thr Read Leu 305 310 315

Ser Gly Phe Ala Ile 15 Phe Lys Glu Ala Trp 30 Glu Ala Asp Arg Leu 45 Gly Lys Lys Glu Val 60 Leu Glu Pro His Ser 80 Val Leu Ala Glu Ile 95 Gly Arg Arg Ala Val 110 Lys Asn Gly Thr Pro 125 Trp Ser Val Leu Cys 140 Asn Leu Gln Glu Asp 160 Ile Ser Ile Ser Asn 175 Ile Val Gly Gly Arg 190 Phe Glu Glu Leu Gly 205 Ser Ala Thr Glu Asn 220 Arg His Phe Ser Val 240 Trp Ser Lys Lys Thr 255 Gln Leu Ile Pro Gln 270 Ser Arg His Pro Gly 285 Leu Ser Val Met Pro 300 Lys Leu Ala His PheSer Gly Phe Wing Ile 15 Phe Lys Glu Wing Trp 30 Glu Wing Asp Arg Leu 45 Gly Lys Lys Glu Val 60 Leu Glu Pro His Ser 80 Val Leu Wing Glu Ile 95 Gly Arg Arg Wing Val 110 Lys Asn Gly Thr Pro 125 Trp Ser Val Leu Cys 140 Asn Leu Gln Glu Asp 160 Ile Ser Ile Ser Asn 175 Ile Val Gly Gly Arg 190 Phe Glu Glu Leu Gly 205 Ser Wing Thr Glu Asn 220 Arg His Phe Ser Val 240 Trp Ser Lys Lys Thr 255 Gln Leu Ile Pro Gln 270 Ser Arg His Pro Gly 285 Le Ser Val Val Pro 300 Lys Leu Wing His Phe

1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 24491440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2449

320 Arg Arg His Lys Arg Lys Thr Leu Lys Lys Gln Ala Gly Ser Lys Ser320 Arg Arg His Lys Arg Lys Thr Read Lys Lys Gln Wing Gly Ser Lys Ser

325 330 335325 330 335

Thr Ala Tyr Pro Phe His Lys Pro Glu Glu His Thr Pro Ala Gly LysThr Wing Tyr Pro Phe His Lys Glu Glu His Thr Pro Wing Gly Lys

340 345 350340 345 350

Asp Leu Ser Arg Lys Ile Pro Lys Leu Ile Gly Lys Ala Ala Arg TyrAsp Leu Be Arg Lys Ile Pro Lys Leu Ile Gly Lys Wing Wing Arg Tyr

355 360 365355 360 365

Ala Gly Ser Ala Lys Pro Lys Lys Gly Met Gln Tyr Ile Pro Thr IleGly Wing Be Lys Pro Wing Lys Lys Gly Met Gln Tyr Ile Pro Thr Ile

370 375 380370 375 380

Thr Asn Tyr Thr Lys Leu Trp Trp Val Pro Asn Val Val Val Ala His 385 390 395 400Thr Asn Tyr Thr Lys Leu Trp Trp Val Pro Asn Val Val Val Wing His 385 390 395 400

Gln Lys Glu Gly Ile Glu Ala Ile His Leu Pro Thr Gly Arg Thr LeuGln Lys Glu Gly Ile Glu Wing Ile His Leu Pro Thr Gly Arg Thr Leu

405 410 415405 410 415

Cys Lys Leu Ser Leu Leu Glu Gly Gly Leu His Ala Asp Ile Asn GlyCys Lys Read Be Read Read Glu Gly Gly Read His Wing Asp Ile Asn Gly

420 425 430420 425 430

Asp Gly Val Leu Asp His Val Gln Thr Val Gly Gly Asn Val Gly GluAsp Gly Val Leu Asp His Val Gln Thr Val Gly Gly Asn Val Gly Glu

435 440 445435 440 445

Arg Thr Val Val Ser Gly Ser Met Glu Val Leu Lys Pro Cys Trp AlaArg Thr Val Val Gly Be Met Glu Val Leu Lys Pro Cys Trp Wing

450 455 460450 455 460

Val Ala Thr Ser Gly Val Pro Ile Arg Glu Gln Leu Phe Asn Val Ser 465 470 475 480Val Wing Thr Be Gly Val Pro Ile Arg Glu Gln Leu Phe Asn Val Ser 465 470 475 480

Ile Cys His His Ser Pro Phe Asn Phe Leu His Tyr Gly Gly Asp TyrIle Cys His His Being Pro Phe Asn Phe Read His Tyr Gly Gly Asp Tyr

485 490 495485 490 495

Ser Arg His Phe Ala Gln Ala Arg Asp Thr Ser Thr Leu Glu Ile AlaBe Arg His Phe Wing Gln Wing Arg Asp Thr Be Thr Read Leu Glu Ile Wing

500 505 510500 505 510

Thr Pro Ile Leu Ile Pro Arg Asp Asp Gly His Lys His Arg Lys GlyThr Pro Ile Read Ile Pro Arg Asp Gly His Lys His Arg Lys Gly

515 520 525515 520 525

Ser His Gly Asp Val Ile Phe Leu Thr Asn Arg Gly Glu Val Thr SerBeing His Gly Asp Val Ile Phe Leu Thr Asn Arg Gly Glu Val Thr Being

530 535 540530 535 540

Tyr Thr Pro Asp Val His Gly His Asp Ala Val Trp Gln Trp Gln Leu 545 550 555 560Tyr Thr Pro Asp Val His Gly His Asp Val Wing Trp Gln Trp Gln Leu 545 550 555 560

Gln Thr Glu Ala Thr Trp Ser Asn Leu Pro Ser Pro Ser Gly Leu ThrGln Thr Glu Wing Thr Trp Being Asn Leu Pro Being Pro Gly Leu Thr

565 570 575565 570 575

Glu Ser Gly Thr Val Val Pro Thr Leu Lys Pro Phe Ser Leu Arg IleGlu Ser Gly Thr Val Val Pro Thr Read Lys Pro Phe Be Read Le Arg Ile

580 585 590580 585 590

His Asp Asn Gln Pro Met Ile Leu Ala Gly Gly Asp Gln Ala Ala ValHis Asp Asn Gln Pro Met Ile Read Wing Gly Gly Asp Gln Wing Ala Val

595 600 605595 600 605

Ile Ile Ser Pro Gly Gly Ser Ile Leu Ala Ser Ile Glu Leu Pro SerIle Ile Ser Pro Gly Gly Ser Ile Leu Wing Ser Ile Glu Leu Pro Ser

610 615 620610 615 620

Gln Pro Thr His Ala Leu Ile Thr Asp Asp Phe Ser Asn Asp Gly Leu 625 630 635 640Gln Pro Thr His Wing Read Ile Thr Asp Asp Phe Ser Asn Asp Gly Leu 625 630 635 640

Thr Asp Val Ile Val Met Thr Ser Asn Gly Val Tyr Gly Phe Val GlnThr Asp Val Ile Val Met Thr Be Asn Gly Val Tyr Gly Phe Val Gln

645 650 655645 650 655

Thr Arg Gln Pro Gly Ala Leu Phe Phe Ser Ser Leu Val Gly Cys LeuThr Arg Gln Pro Gly Wing Read Phe Phe Be Ser Be Read Val Gly Cys Leu

660 665 670660 665 670

Leu Val Val Met Ala Val Ile Phe Val Thr Gln His Leu Asn Ser IleLeu Val Val Met Wing Val Ile Phe Val Thr Gln His Leu Asn Ser Ile

675 680 685675 680 685

Gln Gly Lys Pro Arg Pro Ser Ser Ser PheGln Gly Lys Pro Arg Pro Be Ser Be Phe

690 695690 695

<210> 56 <211> 2834 <212> DNA <213> Oryza sativa <400> 56<210> 56 <211> 2834 <212> DNA <213> Oryza sativa <400> 56

atgcgtcccc tcctcgcctt cgcggcggta tgcgcccttc tcgtggctgc cgcagcgccg 60atgcgtcccc tcctcgcctt cgcggcggta tgcgcccttc tcgtggctgc cgcagcgccg 60

gcggccgcgg aggaggagaa ggcgaacaag ttccggcagc gcgaggccac cgacgacatg 120 cttggatacc cccaccttga tgaagatgct ttattgaaga ccaagtgtcc aaaacatgta 180 gagctgagat ggcagactga agttagttcc agcatttatg caactccgtt gatcgctgat 240 atcaacagcg atggaaagtt ggaagtagtg gtgccatcat ttgttcatta cctggaagtt 300 cttgaaggct ctgatgggga caaattgcca ggatggcctg catttcacca gtcaaatgtt 360 cattcaagtc cacttctata tgatattgac aaggacggga cacgggaaat agttttggca 420 acttacaatg gtgtagtgaa tttcttcagg gtatcaggtt atatgatgat ggacaagcta 480 gaagtacctc gtaggaaggt acacaaagac tggtatgttg ggctgaatac agatcccgtt 540 gaccgctccc atccagatgt tcatgacagc tcaattgcaa agaaagctgc ttctgaagaa 600 tctcacccaagcggccgcgg aggaggagaa ggcgaacaag ttccggcagc gcgaggccac cgacgacatg 120 cttggatacc cccaccttga tgaagatgct ttattgaaga ccaagtgtcc aaaacatgta 180 gagctgagat ggcagactga agttagttcc agcatttatg caactccgtt gatcgctgat 240 atcaacagcg atggaaagtt ggaagtagtg gtgccatcat ttgttcatta cctggaagtt 300 cttgaaggct ctgatgggga caaattgcca ggatggcctg catttcacca gtcaaatgtt 360 cattcaagtc cacttctata tgatattgac aaggacggga cacgggaaat agttttggca 420 acttacaatg gtgtagtgaa tttcttcagg gtatcaggtt atatgatgat ggacaagcta 480 gaagtacctc gtaggaaggt acacaaagac tggtatgttg ggctgaatac agatcccgtt 540 gaccgctccc atccagatgt tcatgacagc tcaattgcaa agaaagctgc ttctgaagaa 600 tctcacccaa

cggagcacaacggagcacaa

gagccagttggagccagttg

aatctaaacaaatctaaaca

tcacatgttctcacatgttc

gaaactgatggaaactgatg

ctagaggctgctagaggctg

gagtacaattgagtacaatt

aaagaacaacaaagaacaac

accccagtgaaccccagtga

tacttctttgtacttctttg

gacattggcagacattggca

aaatggactgaaatggactg

tcttcgccgatcttcgccga

tcctttggcttcctttggct

gagatggcgggagatggcgg

gagatggtcagagatggtca

atctgggaggatctgggagg

ggagatggtcggagatggtc

ggaaaggatgggaaaggatg

cctgttctatcctgttctat

actacatcctactacatcct

gttgacattggttgacattg

gacctcgatcgacctcgatc

ccgcaccatcccgcaccatc

cgttacaacccgttacaacc

ggcaagcattggcaagcatt

caagctccttcaagctcctt

cgcattgtggcgcattgtgg

gttcctgtgagttcctgtga

ttctctgacgttctctgacg

gtgcttcttcgtgcttcttc

gctccgttgcgctccgttgc

tcctcatagatcctcataga

gagcttgtccgagcttgtcc

atgctgcatcatgctgcatc

ttttgtcacattttgtcaca

tctgatcctgtctgatcctg

<210> 57<210> 57

<211> 851<211> 851

<212> PRT<212> PRT

<213> Oryza<213> Oryza

<400> 57<400> 57

atattcagga atgactcaac aaagtaaacc gcacagatgc agagaaggtt caagtgatac atgctgatgc acgattatga aacatgaaaa ttgcagatat accacgagta aatatattgc cagaacttga ccgtggttga tgttttatgt agattcatgc ctgctgatgt ttcatcttaa gcactgaagt gctcaaaaat tgcttgacat ttgatggtta gagagacctc ttattgttac cacttaagga gtgaaggtat tctgggtaga ataacgtgac ttaatgcagc gaaccacagg agttctcgct caatgcttgg catcattttc agcagataag acatcatact ccatcagtta cttgagattg gtttatattcagga atgactcaac aaagtaaacc gcacagatgc agagaaggtt caagtgatac atgctgatgc acgattatga aacatgaaaa ttgcagatat accacgagta aatatattgc cagaacttga ccgtggttga tgttttatgt agattcatgc ctgctgatgt ttcatcttaa gcactgaagt gctcaaaaat tgcttgacat ttgatggtta gagagacctc ttattgttac cacttaagga gtgaaggtat tctgggtaga ataacgtgac ttaatgcagc gaaccacagg agttctcgct caatgcttgg catcattttc agcagataag acatcatact ccatcagtta cttgagattg gttt

sativasativa

caagccagtt aacacgagga taattctacc tgggaacaac gcttcaaaca cggaacagca atcatttaat tgactacgtt ggcagaagat tgacagagat ttatgataaa aagcagtata tttgagtaca tttggatggt tatcgatcat accagtcatt ccatggcaat gagtcttatc tgtggtccca tcagcctttc gagcaaacat cttgtatttg gtacagtatg taccatgaat atggagatca ttatgttaaa gtttgagatt ggttactcta ttataatgaa aactgtgctt caccttccac gatgtttagc aaggaatatt cagaacaaga gcatcgggga gctagttcgg ttttctaactcaagccagtt aacacgagga taattctacc tgggaacaac gcttcaaaca cggaacagca atcatttaat tgactacgtt ggcagaagat tgacagagat ttatgataaa aagcagtata tttgagtaca tttggatggt tatcgatcat accagtcatt ccatggcaat gagtcttatc tgtggtccca tcagcctttc gagcaaacat cttgtatttg gtacagtatg taccatgaat atggagatca ttatgttaaa gtttgagatt ggttactcta ttataatgaa aactgtgctt caccttccac gatgtttagc aaggaatatt cagaacaaga gcatcgggga gctagttcgg ttttctaact

gtgaatgaat gttgattcca cgaggacagg tctagtttaa gatgagaaaa aaagcagcta ttgtttcggg gatgaaacca tatgtgagca ggcatacaag ccagaacatc gttgttttta gatagtggaa gatggaaatt cgtggtaagg gcagcagata gtagcagcat ccacagcgcc accgtgtcag ccatatagaa gatgaaaagt attgagggct gttttggctg ggcaatgtct tcaaaccagg cacggttcca gtggacaagt cttgtccctg ccaggcaagc gtggaaatgg atgcattatt gttcttgtca gattagtgat tattagcagg gctcaatctg gaagtacagc tatgatatttgtgaatgaat gttgattcca cgaggacagg tctagtttaa gatgagaaaa aaagcagcta ttgtttcggg gatgaaacca tatgtgagca ggcatacaag ccagaacatc gttgttttta gatagtggaa gatggaaatt cgtggtaagg gcagcagata gtagcagcat ccacagcgcc accgtgtcag ccatatagaa gatgaaaagt attgagggct gttttggctg ggcaatgtct tcaaaccagg cacggttcca gtggacaagt cttgtccctg ccaggcaagc gtggaaatgg atgcattatt gttcttgtca gattagtgat tattagcagg gctcaatctg gaagtacagc tatgatattt

cttctaagga tgaaacatgc agaatatgga gtactacaac gtaatcaagc ctgttgaaaa atgtagaaga tgtggggaga tagatgctca aaatggtgat taaaggagtt accttgacac attttactgc tggatattct ttaggaacaa tcaatgatga ggactgcaga ctactgttgg gaaacatata cgcatggaag ctaaaggcct caagtggctg ataatgttga tctgcttctc gaagaaacaa gaacattccg acagggttcc ggaattatca agcggatgaa ttgacaaaaa acaagcttct tcctgcggcc ttgcacagtg atatccaatc cacagaaaaa ttttagtcat acacaaggaacttctaagga tgaaacatgc agaatatgga gtactacaac gtaatcaagc ctgttgaaaa atgtagaaga tgtggggaga tagatgctca aaatggtgat taaaggagtt accttgacac attttactgc tggatattct ttaggaacaa tcaatgatga ggactgcaga ctactgttgg gaaacatata cgcatggaag ctaaaggcct caagtggctg ataatgttga tctgcttctc gaagaaacaa gaacattccg acagggttcc ggaattatca agcggatgaa ttgacaaaaa acaagcttct tcctgcggcc ttgcacagtg atatccaatc cacagaaaaa ttttagtcat acacaaggaa

atcccagtca gtctaaggaa tgtgttaaac agagaatgca aggaagctca tagcgagcct tctgcctgat cgaggactgg catcttgtcc ttctgtatct aggagggatt aagacaagtc ccatgcatat tgttggaact gttcccactt tgggaaaatc gggagaagaa tgatgttaat tgttcttagt gatcatgagt cacccttgct tgcagatgtt tggtggagat cactccctct tgctgcatat tgacgaagag ttatgggaac aggagaaagg gcttcccaca cgggttctac gaaatggctc acaagaaggc aaacgtcagg acccatgaag acccctcacg gcaaaaagaa ctggcagctgatcccagtca gtctaaggaa tgtgttaaac agagaatgca aggaagctca tagcgagcct tctgcctgat cgaggactgg catcttgtcc ttctgtatct aggagggatt aagacaagtc ccatgcatat tgttggaact gttcccactt tgggaaaatc gggagaagaa tgatgttaat tgttcttagt gatcatgagt cacccttgct tgcagatgtt tggtggagat cactccctct tgctgcatat tgacgaagag ttatgggaac aggagaaagg gcttcccaca cgggttctac gaaatggctc acaagaaggc aaacgtcagg acccatgaag acccctcacg gcaaaaagaa ctggcagctg

Met Arg Pro Leu Leu Ala Phe Ala Ala Val Cys Ala Leu Leu Val Ala 1 5 10 15 Ala Ala Ala Pro Ala Ala Ala Glu Glu Glu Lys Ala Asn Lys Phe Arg 20 25 30 Gln Arg Glu Ala Thr Asp Asp Met Leu Gly Tyr Pro His Leu Asp Glu 35 40 45 Asp Ala Leu Leu Lys Thr Lys Cys Pro Lys His Val Glu Leu Arg Trp 50 55 60 Gln Thr Glu Val Ser Ser Ser Ile Tyr Ala Thr Pro Leu Ile Ala Asp 65 70 75 80 Ile Asn Ser Asp Gly Lys Leu Glu Val Val Val Pro Ser Phe Val His 85 90 95 Tyr Leu Glu Val Leu Glu Gly Ser Asp Gly Asp Lys Leu Pro Gly Trp 100 105 110 Pro Ala Phe His Gln Ser Asn Val His Ser Ser Pro Leu Leu Tyr Asp 115 120 125 Ile Asp Lys Asp Gly Thr Arg Glu Ile Val Leu Ala Thr Tyr Asn Gly 130 135 140 Val Val Asn Phe Phe Arg Val Ser Gly Tyr Met Met Met Asp Lys LeuMet Arg Pro Leu Leu Wing Phe Wing Val Wing Cys Wing Leu Leu Val Wing Wing 1 5 10 15 Wing Wing Pro Wing Wing Wing Wing Glu Glu Glu Lys Wing Asn Lys Phe Arg 20 25 30 Gln Arg Glu Wing Asp Thr Met Leu Gly Tyr Pro His Leu Asp Glu 35 40 45 Asp Ala Leu Leu Lys Thr Lys Cys Pro Lys His Val Glu Leu Arg Trp 50 55 60 Gln Thr Glu Val Ser Ser Ile Tyr Ala Thr Pro Leu Ile Ala Asp 65 70 75 80 Ile Asn Ser Asp Gly Lys Leu Glu Val Val Val Pro Ser Phe Val His 85 90 95 Tyr Leu Glu Val Leu Glu Gly Ser Asp Gly Asp Lys Leu Pro Gly Trp 100 105 110 Pro Wing Phe His Gln Ser Asn Val His Ser Seru Leu Tyr Asp 115 120 125 Ile Asp Lys Asp Gly Thr Arg Glu Ile Val Leu Wing Thr Thr

660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2834660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2834

145145

150150

155155

160 Glu Val Pro Arg Arg Lys Val His Lys Asp Trp Tyr Val Gly Leu Asn 165 170 175 Thr Asp Pro Val Asp Arg Ser His Pro Asp Val His Asp Ser Ser Ile 180 185 190 Ala Lys Lys Ala Ala Ser Glu Glu Ser His Pro Asn Ile Gln Asp Lys 195 200 205 Pro Val Val Asn Glu Ser Ser Lys Glu Ser Gln Ser Arg Ser Thr Asn 210 215 220 Asp Ser Thr Thr Arg Gly Val Asp Ser Met Lys His Ala Ser Lys Glu 225 230 235 240 Glu Pro Val Glu Ser Lys Pro Asn Ser Thr Arg Gly Gln Glu Asn Met 245 250 255 Asp Val Leu Asn Asn Leu Asn Ser Thr Asp Ala Gly Asn Asn Ser Ser 260 265 270 Leu Ser Thr Thr Thr Glu Asn Ala Ser His Val Gln Arg Arg Leu Leu 275 280 285 Gln Thr Asp Glu Lys Ser Asn Gln Ala Gly Ser Ser Glu Thr Asp Ala 290 295 300 Ser Asp Thr Gly Thr Ala Lys Ala Ala Thr Val Glu Asn Ser Glu Pro 305 310 315 320 Leu Glu Ala Asp Ala Asp Ala Ser Phe Asn Leu Phe Arg Asp Val Glu 325 330 335 Asp Leu Pro Asp Glu Tyr Asn Tyr Asp Tyr Asp Asp Tyr Val Asp Glu 340 345 350 Thr Met Trp Gly Asp Glu Asp Trp Lys Glu Gln Gln His Glu Lys Ala 355 360 365 Glu Asp Tyr Val Ser Ile Asp Ala His Ile Leu Ser Thr Pro Val Ile 370 375 380 Ala Asp Ile Asp Arg Asp Gly Ile Gln Glu Met Val Ile Ser Val Ser 385 390 395 400 Tyr Phe Phe Asp His Glu Tyr Tyr Asp Lys Pro Glu His Leu Lys Glu 405 410 415 Leu Gly Gly Ile Asp Ile Gly Lys Tyr Ile Ala Ser Ser Ile Val Val 420 425 430 Phe Asn Leu Asp Thr Arg Gln Val Lys Trp Thr Ala Glu Leu Asp Leu 435 440 445 Ser Thr Asp Ser Gly Asn Phe Thr Ala His Ala Tyr Ser Ser Pro Thr 450 455 460 Val Val Asp Leu Asp Gly Asp Gly Asn Leu Asp Ile Leu Val Gly Thr 465 470 475 480 Ser Phe Gly Leu Phe Tyr Val Ile Asp His Arg Gly Lys Val Arg Asn 485 490 495 Lys Phe Pro Leu Glu Met Ala Glu Ile His Ala Pro Val Ile Ala Ala 500 505 510 Asp Ile Asn Asp Asp Gly Lys Ile Glu Met Val Thr Ala Asp Val His 515 520 525 Gly Asn Val Ala Ala Trp Thr Ala Glu Gly Glu Glu Ile Trp Glu Val 530 535 540 His Leu Lys Ser Leu Ile Pro Gln Arg Pro Thr Val Gly Asp Val Asn 545 550 555 560 Gly Asp Gly Arg Thr Glu Val Val Val Pro Thr Val Ser Gly Asn Ile 565 570 575 Tyr Val Leu Ser Gly Lys Asp Gly Ser Lys Ile Gln Pro Phe Pro Tyr 580 585 590 Arg Thr His Gly Arg Ile Met Ser Pro Val Leu Leu Leu Asp Met Ser 595 600 605 Lys His Asp Glu Lys Ser Lys Gly Leu Thr Leu Ala Thr Thr Ser Phe 610 615 620 Asp Gly Tyr Leu Tyr Leu Ile Glu Gly Ser Ser Gly Cys Ala Asp Val 625 630 635 640 Val Asp Ile Gly Glu Thr Ser Tyr Ser Met Val Leu Ala Asp Asn Val 645 650 655 Asp Gly Gly Asp Asp Leu Asp Leu Ile Val Thr Thr Met Asn Gly Asn 660 665 670160 Glu Val Pro Arg Arg Lys Val His Asp Trp Tyr Val Gly Leu Asn 165 170 175 Thr Asp Pro Val Asp Arg Be His Pro Asp Val His Asp Be Ser Ile 180 185 190 Wing Lys Lys Wing Wing Be Glu Glu Be His Pro Asn Ile Gln Asp Lys 195 200 205 Pro Val Val Asn Glu Be Ser Lys Glu Be Gln Ser Arg Be Thr Asn 210 215 220 Asp Be Thr Thr Arg Gly Val Glu Be Lys Pro Asn Be Thr Arg Gly Gln Glu Asn Met 245 250 255 Asp Val Leu Asn Asn Leu Asn Be Thr Asp Wing Gly Asn Asn Be Ser 260 265 270 Leu Be Thr Thr Thr Glu Asn Wing Be His Val Gln Arg Arg Leu Leu 275 280 285 Gln Thr Asp Glu Lys Be Asn Gln Wing Gly Be Be Glu Thr Asp Wing 290 295 300 Be Asp Thr Gly Thr Wing Lys Wing Thr Val Glu Asn Be Glu Pro 305 310 315 320 Leu Glu Wing Asp Wing Asp Wing Ser Phe Asn Leu Phe Arg Asp Val Glu 325 330 335 Asp Leu Pro Asp Glu Tyr Asn Tyr Asp Tyr Asp Tyr Asp Tyr Val Asp Glu 340 345 350 Thr Met Trp Gly Asp Glu Asp Trp Lys Gln Gln His Glu Lys Wing 355 360 365 Glu Asp Tyr Val Ser Ile Asp Wing His Ile Read Ser Thr Thr Pro Val Ile 370 375 380 Wing Asp Ile Asp Arg Asp Gly Ile Gln Glu Met Val Ile Ser Val Ser 385 390 395 400 Tyr Phe Phe Asp His Glu Tyr Tyr Asp Lys Pro Glu His Leu Lys Glu 405 410 415 Leu Gly Gly Ile Asp Ile Gly Lys Tyr Ile Wing Be Ser Ile Val Val 420 425 430 Phe Asn Leu Asp Thr Arg Gln Val Lys Trp Thr Wing Glu Leu Asp Leu 435 440 445 Ser Thr Asp Be Gly Asn Phe Thr Wing His Tyr Be Pro Pro 450 450 455 460 Val Val Asp Leu Asp Gly Asp Gly Asn Leu Asp Ile Leu Val Gly Thr 465 470 475 480 Ser Phe Gly Leu Phe Tyr Val Ile Asp His Arg Gly Lys Val Arg Asn 485 490 495 Lys Phe Pro Leu Glu Met Ala Glu Ile His Val Ile Pro Wing 500 Wing Wing 500 505 510 Asp Ile Asn Asp Asp Gly Lys Ile Glu Met Val Thr Wing Asp Val His 515 520 525 Gly Asn Val Wing Trp Wing Wing Trp Glu Gly Glu Glu Ile Trp Wing Glu Val 530 535 540 His Leu Lys Ser Leu Ile Pro Gln Bear Val Gn Asp Val Asn 545 550 555 560 Gly Asp Gly Arg Thr Glu Val Val Val Pro Thr Val Ser Gly Asn Ile 565 570 575 Tyr Val Leu Be Gly Lys Asp Gly Lys Ile Gln Pro Phe Pro Tyr 580 585 590 Arg Thr His Gly Arg Ile Met Ser Pro Val Leu Leu Leu Asp Met Ser 595 600 605 Lys His Asp Glu Lys Ser Lys Gly Leu Thr Leu Wing Thr Thr Be Phe 610 615 620 Asp Gly Tyr Leu Tyr Leu Ile Glu Gly Being Ser Gly Cys Wing Asp Val 625 630 635 640 Val Asp Ile Gly Glu Thr As Tyr Be Met Val Leu Wing Asp Asn Val 645 650 655 Asp Gly Gly Asp Asp As Leu Asp Leu Ile Val Thr Thr Asn Gly Asn 660 665 670

Val Phe Cys Phe Ser Thr Pro Ser Pro His His Pro Leu Lys Glu TrpVal Phe Cys Phe Be Pro Pro Be His Pro His Read Lys Glu Trp

675 680 685675 680 685

Arg Ser Ser Asn Gln Gly Arg Asn Asn Ala Ala Tyr Arg Tyr Asn ArgArg Be Ser Asn Gln Gly Arg Asn Asn Wing Wing Tyr Arg Tyr Asn Arg

690 695 700690 695 700

Glu Gly Ile Tyr Val Lys His Gly Ser Arg Thr Phe Arg Asp Glu Glu 705 710 715 720Glu Gly Ile Tyr Val Lys His Gly Ser Arg Thr Phe Arg Asp Glu Glu 705 710 715 720

Gly Lys His Phe Trp Val Glu Phe Glu Ile Val Asp Lys Tyr Arg ValGly Lys His Phe Trp Val Glu Phe Glu Ile Val Asp Lys Tyr Arg Val

725 730 735725 730 735

Pro Tyr Gly Asn Gln Ala Pro Tyr Asn Val Thr Val Thr Leu Leu ValPro Tyr Gly Asn Gln Wing Pro Tyr Asn Val Thr Val Leu Leu Val

740 745 750740 745 750

Pro Gly Asn Tyr Gln Gly Glu Arg Arg Ile Val Val Asn Ala Ala TyrPro Gly Asn Tyr Gln Gly Glu Arg Arg Ile Val Val Asn Wing Tyr Wing

755 760 765755 760 765

Asn Glu Pro Gly Lys Gln Arg Met Lys Leu Pro Thr Val Pro Val ArgAsn Glu Pro Gly Lys Gln Arg Met Lys Read Pro Thr Val Pro Val Arg

770 775 780770 775 780

Thr Thr Gly Thr Val Leu Val Glu Met Val Asp Lys Asn Gly Phe Tyr 785 790 795 800Thr Thr Gly Thr Val Leu Val Glu Met Val Asp Lys Asn Gly Phe Tyr 785 790 795 800

Phe Ser Asp Glu Phe Ser Leu Thr Phe His Met His Tyr Tyr Lys LeuPhe Ser Asp Glu Phe Ser Leu Thr Phe His Met His Tyr Tyr Lys Leu

805 810 815805 810 815

Leu Lys Trp Leu Val Leu Leu Pro Met Leu Gly Met Phe Ser Val LeuLeu Lys Trp Leu Val Leu Leu Pro Met Leu Gly Met Phe Ser Val Leu

820 825 830820 825 830

Val Ile Leu Arg Pro Gln Glu Gly Ala Pro Leu Pro Ser Phe Ser ArgVal Ile Leu Arg Pro Gln Glu Gly Wing Pro Leu Pro Be Phe Ser Arg

835 840 845835 840 845

Asn Ile AspAsn Ile Asp

850 <210> 58 <211> 2411 <212> DNA <213> Oryza sativa <400> 58850 <210> 58 <211> 2411 <212> DNA <213> Oryza sativa <400> 58

gagtgtctag gccagtccag tccagtccag tccaggacgg tccagtccgg tcccgtagag 60gagtgtctag gccagtccag tccagtccag tccaggacgg tccagtccgg tcccgtagag 60

cgccggcgcg tgtagcttcc tcctccgctc caggctccag cgagggaggg agggagacca 120 ccgtctccgc cggctttgag agagaaagag aaagagagag agagagagcg gcgagatgcg 180 gaagcgggat ctgggcatcc tcctcctcgc cgccttcgcc gtcttcttct cgctccagca 240 cgacggcgac ctctccttcc gcgaggcctg gtaccacctc tccgatgccg actaccccat 300 caagcacgac gccgaccgcc tcccctctcc cctagtcgcc gacctcaacg gcgacggcaa 360 acccgaggtc ctcatcccca cccacgacgc caagatccag gtcctccagc cccaccccag 420 gccctccccc gacgatgcct ccttccacga cgcccgcctc atggctgatg tctccctcct 480 cccctccaac gttcgcctct cctccgggag gcgccccgtc gccatggccg ttggcaccgt 540 cgaccgccac tacgcccacg ccccctcccc ctccaagcag ctcctcgtcg tcgtcacctc 600 cggatggtcc gtcatgtgct tcgaccacaa cctcaaaaag ctctgggagg ctaatctcca 660 ggacgatttc ccccacgccg cccaccatcg cgaggttgcc atttccatta ccaactacac 720 tctcaagcat ggggatgcag gtttggtcat cgtcggagga aggatggaaa tgcaacatca 780 ttcagcagag cttttcgatg aatttatggt gtcagaacac aacagggaag agcaccgtag 840 aagcgccagt gagaagcagg cttctgagac aggcaacaca gacctgcgtc attttgccct 900 ttatgctttt gctggccgca ctggtgaatt aagatggagc cgaaagaatg agaatatccc 960 atcgcaacca tccgatgctt cagtgctgat accacaacac aattacaagc ttgatgccca 1020 tgcccttaat agtcgtcatc ctggtcagtt cgaatgtcgg gaatttagag aatcagttct 1080 tggggtcatg cctcatcatt gggataggag agaggatact tttctgcaac ttgcccattt 1140 taggaggcat aaaaggaaag cactgaagaa aacacctgga aaagctgttg taaataacgt 1200 gcacaagccc agtgaacata atccacctgg aaaggatgtt tccaataggt tagcaaatgt 1260 gattgggaaa gctgcagata tggctaattc aaataaaatc aagaagtcac aaaggacgct 1320 ttatgttccg acaatcacca actatactca agtttggtgg gttcctaatg ttgttgttgc 1380 ccacgaaaaa gaagggatag aggctgttca tctagcttct ggacgtacaa tctgcaagct 1440 tcatttaaca gaaggaggcc ttcatgcaga tattaatgga gatggggttc tagaccatgt 1500 tcaggttgtt ggtgcaaatg gcatcgagca aacagttgtt agtggttcaa tggaagtgct 1560 gaaaccttgt tgggcagtag ctacatctgg tgtgccagtg cgggagcaac tttttaatgt 1620 ttctatctgc cattacaaca atttcaattt gtttcatcat ggtgactttt caagaagttt 1680 tgggaggaca tttgatacaa ctggcttaga ggtggcgact cctattctgc tccagagaga 1740 tgatggtcat aaacacagga gaggaagcca cggggatatc atctttctta cgagtcgtgg 1800 ggaggtgacc tcgtactctc caggtctact tggtcatgat gcaatatgga gatggcaact 1860 gtcaacaggt gcaacatggt ccaaccttcc gtctccatca gggatgatgg aaaacattgt 1920 agttccaact ttgaaggctt tctctctgcg agcctatgac ccaaaacagg taatcatcgc 1980 gggtggtgat ctggaggctg tggtgatttc tccttctggt ggtttattgg catccattga 2040 actccctgca cctccaaccc atgcgctggt acttgaagat ttcaatggtg atggtttaac 2100 tgatattatt ctggtaacat cggggggagt ctatgggttt gtgcagacaa gacatcctgg 2160 ggctcttttc ttcagcacgc ttgtgggttg cttgatagtt gttatcggag tgatatttgt 2220 ttcactgcac ctcaactcct cgaacagcgg taaacctagg gcttcaaccg actataggtg 2280 acgacattat gtcagtcgac agaattcctt gtcaatattg aggtgttgtt atagcatttg 2340 atttagattt ttcatataat caactgccaa ctgggttatg taaacttgtg cggcgaatgc 2400 atttttggcg t 2411cgccggcgcg tgtagcttcc tcctccgctc caggctccag cgagggaggg agggagacca 120 ccgtctccgc cggctttgag agagaaagag aaagagagag agagagagcg gcgagatgcg 180 gaagcgggat ctgggcatcc tcctcctcgc cgccttcgcc gtcttcttct cgctccagca 240 cgacggcgac ctctccttcc gcgaggcctg gtaccacctc tccgatgccg actaccccat 300 caagcacgac gccgaccgcc tcccctctcc cctagtcgcc gacctcaacg gcgacggcaa 360 acccgaggtc ctcatcccca cccacgacgc caagatccag gtcctccagc cccaccccag 420 gccctccccc gacgatgcct ccttccacga cgcccgcctc atggctgatg tctccctcct 480 cccctccaac gttcgcctct cctccgggag gcgccccgtc gccatggccg ttggcaccgt 540 cgaccgccac tacgcccacg ccccctcccc ctccaagcag ctcctcgtcg tcgtcacctc 600 cggatggtcc gtcatgtgct tcgaccacaa cctcaaaaag ctctgggagg ctaatctcca 660 ggacgatttc ccccacgccg cccaccatcg cgaggttgcc atttccatta ccaactacac 720 ggggatgcag gtttggtcat cgtcggagga tctcaagcat aggatggaaa tgcaacatca 780 ttcagcagag cttttcgatg aatttatggt gtcagaacac aacagggaag agcaccgtag 840 aagcgccagt gagaagcagg cttctgagac aggcaacaca gacctgcgtc attttgccct 900 ttatgctttt gctggccgc the ctggtgaatt aagatggagc cgaaagaatg agaatatccc 960 atcgcaacca tccgatgctt cagtgctgat accacaacac aattacaagc ttgatgccca 1020 tgcccttaat agtcgtcatc ctggtcagtt cgaatgtcgg gaatttagag aatcagttct 1080 tggggtcatg cctcatcatt gggataggag agaggatact tttctgcaac ttgcccattt 1140 taggaggcat aaaaggaaag cactgaagaa aacacctgga aaagctgttg taaataacgt 1200 gcacaagccc agtgaacata atccacctgg aaaggatgtt tccaataggt tagcaaatgt 1260 gattgggaaa gctgcagata tggctaattc aaataaaatc aagaagtcac aaaggacgct 1320 ttatgttccg acaatcacca actatactca agtttggtgg gttcctaatg ttgttgttgc 1380 ccacgaaaaa gaagggatag aggctgttca tctagcttct ggacgtacaa tctgcaagct 1440 tcatttaaca gaaggaggcc ttcatgcaga tattaatgga gatggggttc tagaccatgt 1500 tcaggttgtt ggtgcaaatg gcatcgagca aacagttgtt agtggttcaa tggaagtgct 1560 gaaaccttgt tgggcagtag ctacatctgg tgtgccagtg cgggagcaac tttttaatgt 1620 ttctatctgc cattacaaca atttcaattt gtttcatcat ggtgactttt caagaagttt 1680 tgggaggaca tttgatacaa ctggcttaga ggtggcgact cctattctgc tccagagaga 1740 tgatggtcat aaacacagga gagga agcca cggggatatc atctttctta cgagtcgtgg 1800 ggaggtgacc tcgtactctc caggtctact tggtcatgat gcaatatgga gatggcaact 1860 gtcaacaggt gcaacatggt ccaaccttcc gtctccatca gggatgatgg aaaacattgt 1920 agttccaact ttgaaggctt tctctctgcg agcctatgac ccaaaacagg taatcatcgc 1980 gggtggtgat ctggaggctg tggtgatttc tccttctggt ggtttattgg catccattga 2040 actccctgca cctccaaccc atgcgctggt acttgaagat ttcaatggtg atggtttaac 2100 tgatattatt ctggtaacat cggggggagt ctatgggttt gtgcagacaa gacatcctgg 2160 ggctcttttc ttcagcacgc ttgtgggttg cttgatagtt tgatatttgt gttatcggag 2220 ttcactgcac ctcaactcct cgaacagcgg taaacctagg gcttcaaccg actataggtg 2280 acgacattat gtcagtcgac agaattcctt gtcaatattg aggtgttgtt atagcatttg 2340 atttagattt ttcatataat caactgccaa ctgggttatg taaacttgtg cggcgaatgc 2400 2411 t atttttggcg

<210> 59 <211> 701 <212> PRT<210> 59 <211> 701 <212> PRT

<213> Oryza sativa <400> 59<213> Oryza sativa <400> 59

Met Arg Lys Arg Asp Leu Gly Ile Leu Leu Leu Ala Ala Phe Ala Val 1 5 10 15Met Arg Lys Arg Asp Leu Gly Ile Leu Leu Leu Wing Ala Phe Ala Val 1 5 10 15

Phe Phe Ser Leu Gln His Asp Gly Asp Leu Ser Phe Arg Glu Ala TrpPhe Phe Be Read Gln His Asp Gly Asp Read Be Phe Arg Glu Ala Trp

20 25 3020 25 30

Tyr His Leu Ser Asp Ala Asp Tyr Pro Ile Lys His Asp Ala Asp ArgTyr His Read Being Asp Wing Asp Tyr Pro Ile Lys His Asp Wing Asp Arg

35 40 4535 40 45

Leu Pro Ser Pro Leu Val Ala Asp Leu Asn Gly Asp Gly Lys Pro GluLeu Pro Ser Pro Leu Val Asp Wing Read Asn Gly Asp Gly Lys Pro Glu

50 55 6050 55 60

Val Leu Ile Pro Thr His Asp Ala Lys Ile Gln Val Leu Gln Pro His 65 70 75 80Val Leu Ile Pro Thr His Asp Wing Lys Ile Gln Val Leu Gln Pro His 65 70 75 80

Pro Arg Pro Ser Pro Asp Asp Ala Ser Phe His Asp Ala Arg Leu MetPro Arg Pro Pro Asp Asp Wing Be Phe His Asp Wing Arg Read Le Met

85 90 9585 90 95

Ala Asp Val Ser Leu Leu Pro Ser Asn Val Arg Leu Ser Ser Gly ArgWing Asp Val Ser Leu Leu Pro Ser Asn Val Arg Leu Ser Ser Gly Arg

100 105 110100 105 110

Arg Pro Val Ala Met Ala Val Gly Thr Val Asp Arg His Tyr Ala HisArg Pro Val Wing Met Wing Val Gly Thr Val Asp Arg His Tyr Wing His

115 120 125115 120 125

Ala Pro Ser Pro Ser Lys Gln Leu Leu Val Val Val Thr Ser Gly TrpWing Pro Be Pro Be Lys Gln Read Leu Val Val Val Thr Be Gly Trp

130 135 140130 135 140

Ser Val Met Cys Phe Asp His Asn Leu Lys Lys Leu Trp Glu Ala Asn 145 150 155 160Ser Val Met Cys Phe Asp His Asn Read Lys Lys Read Le Trp Glu Wing Asn 145 150 155 160

Leu Gln Asp Asp Phe Pro His Ala Ala His His Arg Glu Val Ala IleRead Glu Asp Asp Phe Pro His Wing Ala His His Arg Glu Val Ala Ile

165 170 175165 170 175

Ser Ile Thr Asn Tyr Thr Leu Lys His Gly Asp Ala Gly Leu Val IleSer Ile Thr Asn Tyr Thr Read Lys His Gly Asp Wing Gly Leu Val Ile

180 185 190180 185 190

Val Gly Gly Arg Met Glu Met Gln His His Ser Ala Glu Leu Phe AspVal Gly Gly Arg Met Glu Met Gln His His Be Wing Glu Leu Phe Asp

195 200 205195 200 205

Glu Phe Met Val Ser Glu His Asn Arg Glu Glu His Arg Arg Ser AlaGlu Phe Met Val Be Glu His Asn Arg Glu Glu His Arg Arg Be Wing

210 215 220210 215 220

Ser Glu Lys Gln Ala Ser Glu Thr Gly Asn Thr Asp Leu Arg His Phe 225 230 235 240Be Glu Lys Gln Wing Be Glu Thr Gly Asn Thr Asp Read Arg His Phe 225 230 235 240

Ala Leu Tyr Ala Phe Ala Gly Arg Thr Gly Glu Leu Arg Trp Ser ArgWing Read Tyr Wing Phe Wing Gly Arg Thr Gly Glu Read Arg Trp Be Arg

245 250 255245 250 255

Lys Asn Glu Asn Ile Pro Ser Gln Pro Ser Asp Ala Ser Val Leu IleLys Asn Glu Asn Ile Pro To Be Gln Pro To Be Asp Wing To Be Val Leu Ile

260 265 270260 265 270

Pro Gln His Asn Tyr Lys Leu Asp Ala His Ala Leu Asn Ser Arg HisPro Gln His Asn Tyr Lys Read Asp Wing His Wing Read Asn Be Arg His

275 280 285275 280 285

Pro Gly Gln Phe Glu Cys Arg Glu Phe Arg Glu Ser Val Leu Gly ValPro Gly Gln Phe Glu Cys Arg Glu Phe Arg Glu Ser Val Leu Gly Val

290 295 300290 295 300

Met Pro His His Trp Asp Arg Arg Glu Asp Thr Phe Leu Gln Leu Ala 305 310 315 320Met Pro His His Trp Asp Arg Arg Glu Asp Thr Phe Leu Gln Leu Wing 305 310 315 320

His Phe Arg Arg His Lys Arg Lys Ala Leu Lys Lys Thr Pro Gly LysHis Phe Arg Arg His Lys Arg Lys Wing Read Lys Lys Thr Pro Gly Lys

325 330 335325 330 335

Ala Val Val Asn Asn Val His Lys Pro Ser Glu His Asn Pro Pro GlyVal Val Wing Asn Asn Val His Lys Pro Be Glu His Asn Pro Gly

340 345 350340 345 350

Lys Asp Val Ser Asn Arg Leu Ala Asn Val Ile Gly Lys Ala Ala AspLys Asp Val Ser Asn Arg Leu Wing Asn Val Ile Gly Lys Wing Asp Wing

355 360 365355 360 365

Met Ala Asn Ser Asn Lys Ile Lys Lys Ser Gln Arg Thr Leu Tyr ValMet Wing Asn Be Asn Lys Ile Lys Lys Be Gln Arg Thr Read Tyr Val

370 375 380370 375 380

Pro Thr Ile Thr Asn Tyr Thr Gln Val Trp Trp Val Pro Asn Val Val 385 390 395 400 Val Ala His Glu Lys 405 Glu Gly Ile Glu Ala 410 Val His Leu Ala Ser 415 Gly Arg Thr Ile Cys 420 Lys Leu His Leu Thr 425 Glu Gly Gly Leu His 430 Ala Asp Ile Asn Gly 435 Asp Gly Val Leu Asp 440 His Val Gln Val Val 445 Gly Ala Asn Gly Ile 450 Glu Gln Thr Val Val 455 Ser Gly Ser Met Glu 460 Val Leu Lys Pro Cys Trp Ala Val Ala Thr Ser Gly Val Pro Val Arg Glu Gln Leu Phe 465 470 475 480 Asn Val Ser Ile Cys 485 His Tyr Asn Asn Phe 490 Asn Leu Phe His His 495 Gly Asp Phe Ser Arg 500 Ser Phe Gly Arg Thr 505 Phe Asp Thr Thr Gly 510 Leu Glu Val Ala Thr 515 Pro Ile Leu Leu Gln 520 Arg Asp Asp Gly His 525 Lys His Arg Arg Gly 530 Ser His Gly Asp Ile 535 Ile Phe Leu Thr Ser 540 Arg Gly Glu Val Thr Ser Tyr Ser Pro Gly Leu Leu Gly His Asp Ala Ile Trp Arg Trp 545 550 555 560 Gln Leu Ser Thr Gly 565 Ala Thr Trp Ser Asn 570 Leu Pro Ser Pro Ser 575 Gly Met Met Glu Asn 580 Ile Val Val Pro Thr 585 Leu Lys Ala Phe Ser 590 Leu Arg Ala Tyr Asp 595 Pro Lys Gln Val Ile 600 Ile Ala Gly Gly Asp 605 Leu Glu Ala Val Val 610 Ile Ser Pro Ser Gly 615 Gly Leu Leu Ala Ser 620 Ile Glu Leu Pro Ala Pro Pro Thr His Ala Leu Val Leu Glu Asp Phe Asn Gly Asp Gly 625 630 635 640 Leu Thr Asp Ile Ile 645 Leu Val Thr Ser Gly 650 Gly Val Tyr Gly Phe 655 Val Gln Thr Arg His 660 Pro Gly Ala Leu Phe 665 Phe Ser Thr Leu Val 670 Gly Cys Leu Ile Val 675 Val Ile Gly Val Ile 680 Phe Val Ser Leu His 685 Leu Asn Ser Ser Asn 690 Ser Gly Lys Pro Arg 695 Ala Ser Thr Asp Tyr 700 ArgPro Thr Ile Thr Asn Tyr Thr Gln Val Trp Trp Val Pro Asn Val Val 385 390 395 400 Val Wing His Glu Lys 405 Glu Gly Ile Glu Wing 410 Val His Leu Wing Ser 415 Gly Arg Thr Ile Cys 420 Lys Leu His Leu Thr 425 Glu Gly Gly Leu His 430 Wing Asp Ile Asn Gly 435 Asp Gly Val Leu Asp 440 His Val Gln Val Val 445 Gly Wing Asn Gly Ile 450 Glu Thr Val Val 455 Ser Gly Ser Met Glu 460 Val Leu Lys Pro Cys Trp Val Wing Ala Thr Ser Gly Val Pro Val Arg Glu Glu Leu Phe 465 470 475 480 Asn Val Ser Ile Cys 485 His Tyr Asn Asn Phe 490 Asn Leu Phe His His 495 Gly Asp Phe Be Arg 500 Ser Phe Gly Arg Thr 505 Phe Asp Thr Thr Gly 510 Leu Glu Val Wing Thr 515 Pro Ile Leu Leu Gln 520 Arg Asp Asp Gly His 525 Lys His Arg Arg Gly 530 Being His Gly Asp Ile 535 Ile Phe Leu Thr Being 540 Arg Gly Glu Val Thr Being Tyr Ser Pro Gly Leu Leu Gly His Asp Wing Ile Trp Arg Trp 545 550 555 560 Gln Leu To Be Thr Gly 565 Wing Thr Trp To Asn 570 Leu Pro To Be Pro 575 Gly Met Met Glu Asn 580 Lys Wing Phe Ser 590 Leu Arg Wing Tyr Asp 595 Pro Lys Gln Val Ile 600 Ile Wing Gly Gly Asp 605 Leu Glu Wing Val Val 610 Ile Ser Pro Gly 615 Gly Leu Leu Wing Ser 620 Ile Glu Leu Pro Wing Pro Pro Thr His Wing Leu Val Leu Glu Asp Phe Asn Gly Asp Gly 625 630 635 640 Leu Thr Asp Ile Ile 645 Leu Val Thr Be Gly 650 Gly Val Tyr Gly Phe 655 Val Gln Thr Arg His 660 Pro Gly Wing Leu Phe 665 Phe Ser Thr Leu Val 670 Gly Cys Leu Ile Val 675 Val Ile Gly Val Ile 680 Phe Val Ser Leu His 685 Leu Asn Ser Ser Asn 690 Ser Gly Lys Pro Arg 695 Wing Ser Thr Asp Tyr 700 Arg

<210> 60 <211> 1103 <212> DNA<210> 60 <211> 1103 <212> DNA

<213> Triticum aestivum <220><213> Triticum aestivum <220>

<221> misc_feature <222> (16)..(16) <223> η is a, c, g, ou t <400> 60<221> misc_feature <222> (16) .. (16) <223> η is a, c, g, or t <400> 60

gcgttccgga gctttnaaaa gagtcaggag ggattgacat aggaccatat attgcatgca 60gcgttccgga gctttnaaaa gagtcaggag ggattgacat aggaccatat attgcatgca 60

gtatagttgt gggtaacctt gacacaaaac aagttaaatg gacagcagaa ctcgatttga 120 gtaccgaaag cgggaaattc cttgcccatg catattcgtc tccaactgtg gttgatttgg 180gtatagttgt gggtaacctt gacacaaaac aagttaaatg gacagcagaa ctcgatttga 120 gtaccgaaag cgggaaattc cttgcccatg catattcgtc tccaactgtg gttgatttgg 180

atggtgatgg aaatttggat atccttgtcg gaacttccta tggcttgttt tatgttcttg 240 atcatcacgg taagactagg aaaaatttcc cccttgagat ggctgagatc catgcaccag 300atggtgatgg aaatttggat atccttgtcg gaacttccta tggcttgttt tatgttcttg 240 atcatcacgg taagactagg aaaaatttcc cccttgagat ggctgagatc catgcaccag 300

tcattgcagc agacatcaat gatgatggta agatcgagat ggtcactgct gatgtgcatg 360tcattgcagc agacatcaat gatgatggta agatcgagat ggtcactgct gatgtgcatg 360

gtaatgtagc agcttggact gcagagggag acgaaatctg ggaggtgcat ctgaagagcc 420gtaatgtagc agcttggact gcagagggag acgaaatctg ggaggtgcat ctgaagagcc 420

ttgttccaca gcgacctact gtcggggacg tcaatggaga tggccacact gatgttgtgg 480ttgttccaca gcgacctact gtcggggacg tcaatggaga tggccacact gatgttgtgg 480

tcccaactgt atcaggaaac atctacgttc ttagtggaaa ggatggctca aaagttcagc 540tcccaactgt atcaggaaac atctacgttc ttagtggaaa ggatggctca aaagttcagc 540

ctttcccata tagaacacat ggaaggatca tgagtccggt cttgttagtt gacatgagca 600ctttcccata tagaacacat ggaaggatca tgagtccggt cttgttagtt gacatgagca 600

aacgtggaga aaagacgcaa ggactaaccc ttgctactac gtcctttgat ggttatttgt 660aacgtggaga aaagacgcaa ggactaaccc ttgctactac gtcctttgat ggttatttgt 660

atttgatcga gggctctagt ggctgtgcag atgttgtcga cattggagag acctcgtaca 720atttgatcga gggctctagt ggctgtgcag atgttgtcga cattggagag acctcgtaca 720

ctatgggttt ggctgacaat gtggatggcg gagatgacct tgatctgatt gttactacca 780ctatgggttt ggctgacaat gtggatggcg gagatgacct tgatctgatt gttactacca 780

tgattggcaa tgtcttttgc tttttcactc cctcaccgga acatcctctc aaggaatgga 840tgattggcaa tgtcttttgc tttttcactc cctcaccgga acatcctctc aaggaatgga 840

gatcatcaaa ccaggaaagg aataatgctg catataggca ccacccgtca aggtatttat 900gatcatcaaa ccaggaaagg aataatgctg catataggca ccacccgtca aggtatttat 900

gtaaggcatg gttcaggaca acccgggaat gaaaagggta aacatttcgg ggtcgatttg 960 aaaattggag acaagtacag ggttccctat gggaattaac tccttaaaat gtcagggtac 1020 cttactcgtc ctgggaatta ccagggaaac aggggtattg gggtttgcca attttaaaat 1080 gaaccgggca caaggaattg ggt 1103gtaaggcatg gttcaggaca acccgggaga gaaaagggta aacatttcgg ggtcgatttg 960 aaaattggag acaagtacag ggttccctat gggaattaac tccttaaaat gtcaggggaga 1020 cttggggaggggggag

<210> 61 <211> 1152 <212> DNA <213> Zea mays <220><210> 61 <211> 1152 <212> DNA <213> Zea mays <220>

<221> misc_feature <222> (232)..(256) <223> η is a, c, g, ou t <220><221> misc_feature <222> (232) .. (256) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (416) . . (474) <223> η is a, c, g, ou t <220><221> misc_feature <222> (416). . (474) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (525)..(529) <223> η is a, c, g, ou t <220><221> misc_feature <222> (525) .. (529) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (1025)..(1047) <223> η is a, c, g, ou t <400> 61<221> misc_feature <222> (1025) .. (1047) <223> η is a, c, g, or t <400> 61

acaggcttat tataggtttg ttttctacta atagttatga ccgagagttt tgcttctcct ctccgagggt cgcttctctt tcaaaggcct actgtaaact ctcaatggtg acaatatgct attgaaaatg gctgtgtaca aaattgttct gcagaactaa nnnnnnnnnn nnnnnnaaat ggttaactgt tgggatacta tcatggagat gttggggagt cacttcgtca gcttcaatgg agtcgatatt ccgtgaaaac gatggcagcg gcgcaccttc nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gcatgtggaa ggtgagtgag aactcgtcgg agaagtacag ccacgaccac agttccagta gttctaacag gaacagtggg ctggttgatg atacacacca ctgacaacaa tgcgcctatc caagtaaagt taccgtcacg ttataaggag cttgcttccc caacgatttc aaactctatc cagaaattct tgccctcttc catgcttaac atagatacct tcacggttgt actgatatgc ttgatgacct ccattcctta agcggatggt gtggtgattg tgccattcat agtggtaaca ataagatcaa ggtcatctcc aaaccatagt gtacgaggtc tctccaatgt caacaacatc caatnnnnnn nnnnnnnnnn nnnnnnnacg ttgttgcaag ctccatgttt gctcatgtcg agaagtagaa caggactcat atgggaaagg tt <210> 62 <211> 720 <212> DNAacaggcttat tataggtttg ttttctacta atagttatga ccgagagttt tgcttctcct ctccgagggt cgcttctctt tcaaaggcct actgtaaact ctcaatggtg acaatatgct attgaaaatg gctgtgtaca aaattgttct gcagaactaa nnnnnnnnnn nnnnnnaaat ggttaactgt tgggatacta tcatggagat gttggggagt cacttcgtca gcttcaatgg agtcgatatt ccgtgaaaac gatggcagcg gcgcaccttc nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gcatgtggaa ggtgagtgag aactcgtcgg agaagtacag ccacgaccac agttccagta gttctaacag gaacagtggg ctggttgatg atacacacca ctgacaacaa tgcgcctatc caagtaaagt taccgtcacg ttataaggag cttgcttccc caacgatttc aaactctatc cagaaattct tgccctcttc catgcttaac atagatacct tcacggttgt actgatatgc ttgatgacct ccattcctta agcggatggt gtggtgattg tgccattcat agtggtaaca ataagatcaa ggtcatctcc aaaccatagt gtacgaggtc tctccaatgt caacaacatc caatnnnnnn nnnnnnnnnn nnnnnnnacg ttgttgcaag ctccatgttt gctcatgtcg agaagtagaa caggactcat atgggaaagg tt <210> 62 <211> 720 <212> DNA

<213> Solanum tuberosum <400> 62<213> Solanum tuberosum <400> 62

gtttcaatct agataccaag caagttaaat ggactgcaca gttggactta agtactgacg 60gtttcaatct agataccaag caagttaaat ggactgcaca gttggactta agtactgacg 60

acgggaaatt ccgtgcctat atatactctt ctcctacggt agttgatttg gatggtgatg 120 gaaacatgga cattctagtg gggacctcct atggcttctt ttatgtgttg gatcacaacg 180 gcaaagtgag ggaaaagttc cctctcgaaa tggctgaaat ccaaggagca gtagttgcag 240 ctgatatcaa tgatgatgga aagattgaac tagttacaac agattcacat ggaaatgttg 300 ctgcttggac cgcacaaggc acagaaattt gggaaacgca tctcaagagc cttgttcctc 360 agggaccggt tattggcgat gtggatggag atggccatac agatgtcgtt gtcccaacac 420 tttctgggaa tatatatgtt ctgaatggca aggacggctc atttgtacgt ccatatcctt 480 ataggactca tggtagggtg atgaatcgag cacttcttgt cgacttgagc aaacgtgggg 540 agaagaaaaa agggcttaca attgtcacaa tgtcatttga tggttatttg tatctcatag 600 atggaccaac atcatgtgct gatgttgtag atattggtga aacttcatac agcatggtct 660 tggctgataa tgttgatggt ggcgatgatc ttgatcttat tgtaacaacc atgaatggta 720 <210> 63 <211> 904acgggaaatt ccgtgcctat atatactctt ctcctacggt agttgatttg gatggtgatg 120 gaaacatgga cattctagtg gggacctcct atggcttctt ttatgtgttg gatcacaacg 180 gcaaagtgag ggaaaagttc cctctcgaaa tggctgaaat ccaaggagca gtagttgcag 240 ctgatatcaa tgatgatgga aagattgaac tagttacaac agattcacat ggaaatgttg 300 ctgcttggac cgcacaaggc acagaaattt gggaaacgca tctcaagagc cttgttcctc 360 agggaccggt tattggcgat gtggatggag atggccatac agatgtcgtt gtcccaacac 420 tttctgggaa tatatatgtt ctgaatggca aggacggctc atttgtacgt ccatatcctt 480 ataggactca tggtagggtg atgaatcgag cacttcttgt cgacttgagc aaacgtgggg 540 agaagaaaaa agggcttaca attgtcacaa tgtcatttga tggttatttg tatctcatag 600 atggaccaac atcatgtgct gatgttgtag atattggtga aacttcatac agcatggtct 660 tggctgataa tgttgatggt ggcgatgatc ttgatcttat tgtaacaacc atgaatggta 720 <210> 63 <211> 904

agagcgtttt agaatctgac tgttctttgg atgggtacat cactgaacaa gtcaccggca ttggggcctc nnnnnnnnnn cccannnnna aagcatcatc tccttgataa atagggcacc gtcacggaag agcattattc agtggagaag accatccacg tgcacagcca agttagccct gattcttccaagagcgtttt agaatctgac tgttctttgg atgggtacat cactgaacaa gtcaccggca ttggggcctc nnnnnnnnnn ccagnnnna aagcatcatc tccttgataa atagggcacc gtcacggaag aggattcagcagcagcagcagcagcaggag

gacacagtat aattaccgtt gtgagccaat tnnnnnnnnn gacatttagg tttcaccact aagatnnnnn nnnnagtaat tcgatcatct cgttgcttcc ttccccggaa ctgtacttgt gtcctggaac cttccttggt cagaagacgt ttatcagcca ctcgatccct tttgcattgt tgtgttctatgacacagtat aattaccgtt gtgagccaat

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1152 <212> DNA <213> Aquilegia <400> 6360 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1152 <212> DNA <213> Aquilegia <400> 63

gtgaatattg attcacacat cctttgcact cctgtgattg cagacatcga caatgacgga 60gtgaatattg attcacacat cctttgcact cctgtgattg cagacatcga caatgacgga 60

gtatcagaaa tggttgtcgc tgtatcctat ttctttgatc atgagtatta tgacaaccca 120gtatcagaaa tggttgtcgc tgtatcctat ttctttgatc atgagtatta tgacaaccca 120

gagcatctct ctgagttggg tggcatagat attgggaaat atgtagcggg aggaattgta 180gagcatctct ctgagttggg tggcatagat attgggaaat atgtagcggg aggaattgta 180

gtatttgatc ttgatacaag acaagttaag tggacaacag agctagatct tagtacagac 240gtatttgatc ttgatacaag acaagttaag tggacaacag agctagatct tagtacagac 240

acaggggact tccgtgctta tatatattct tctccaacgg tggtcgattt ggatggagat 300acaggggact tccgtgctta tatatattct tctccaacgg tggtcgattt ggatggagat 300

ggaaatttgg acattcttgt tgggacatct tttggcttgt tttatgtttt ggaccataat 360ggaaatttgg acattcttgt tgggacatct tttggcttgt tttatgtttt ggaccataat 360

ggcaagataa gaaacaagtt ccctctcgaa atggctgaga ttcagggctc tgtcattgcg 420ggcaagataa gaaacaagtt ccctctcgaa atggctgaga ttcagggctc tgtcattgcg 420

gcggatataa atgatgatgg aaaaattgaa ttggttacaa ctgatactca tggaaatgtt 480gcggatataa atgatgatgg aaaaattgaa ttggttacaa ctgatactca tggaaatgtt 480

gctgcatgga ccccagaagg agaagaaatt tgggaagtac atcttaagag tcttgttcca 540gctgcatgga ccccagaagg agaagaaatt tgggaagtac atcttaagag tcttgttcca 540

caacgtccaa cagttggtga tgttgatggc gatggtcata ctgatgtggt ggttcctaca 600caacgtccaa cagttggtga tgttgatggc gatggtcata ctgatgtggt ggttcctaca 600

ctatcaggga acatatacgt tctcagtggc aaggatggct cttttgttca cccataccca 660ctatcaggga acatatacgt tctcagtggc aaggatggct cttttgttca cccataccca 660

tatcgtactc atgggagagt catgaatcaa gttcttttag tagatctaag taaacgtgaa 720tatcgtactc atgggagagt catgaatcaa gttcttttag tagatctaag taaacgtgaa 720

gagaaacaga agggactcac tcttgtcaca acatcatttg atggctattt gtaccttatt 780gagaaacaga agggactcac tcttgtcaca acatcatttg atggctattt gtaccttatt 780

gacggaccat catcttgtgc tgatgttgtt gatattggcg agacttcata tagtatggtc 840gacggaccat catcttgtgc tgatgttgtt gatattggcg agacttcata tagtatggtc 840

ttggcagaca atgttgatgg tggggatgat cttgatctaa ttgttacaac tatgaatggg 900ttggcagaca atgttgatgg tggggatgat cttgatctaa ttgttacaac tatgaatggg 900

aatg 904 <210> 64 <211> 708 <212> DNAaatg 904 <210> 64 <211> 708 <212> DNA

<213> Brassica napus <400> 64<213> Brassica napus <400> 64

atttgggaag tgcatctaaa gagtcttgtt ccccagggtc cttcaatagg cgatgttgat 60atttgggaag tgcatctaaa gagtcttgtt ccccagggtc cttcaatagg cgatgttgat 60

ggtgatggac atactgatgt cgtggttcct acaacgtcag gaaacattta tgttcttagt 120ggtgatggac atactgatgt cgtggttcct acaacgtcag gaaacattta tgttcttagt 120

ggcaaggatg gttcgattat acgtccgtac ccgtacagaa ctcatggaag agtgatgaac 180ggcaaggatg gttcgattat acgtccgtac ccgtacagaa ctcatggaag agtgatgaac 180

caacttcttc ttgttgatct gaacaagcga ggtgagaaaa agaaggggct caccattgtt 240caacttcttc ttgttgatct gaacaagcga ggtgagaaaa agaaggggct caccattgtt 240

accacatcct ttgacggtta catgtacctc atagatggac ccacctcatg cacggacgct 300accacatcct ttgacggtta catgtacctc atagatggac ccacctcatg cacggacgct 300

gttgatattg gtgaaacttc atacagcatg gtcttggctg ataatgttga cggtggagat 360gttgatattg gtgaaacttc atacagcatg gtcttggctg ataatgttga cggtggagat 360

gatcttgatc taatcgtctc aactatgaat ggaaacgtct tttgcttctc tacaccttct 420gatcttgatc taatcgtctc aactatgaat ggaaacgtct tttgcttctc tacaccttct 420

cctcaccatc ccctcaaggc gtggagatcg actgatcaag ggaggaacaa taaggcaatc 480cctcaccatc ccctcaaggc gtggagatcg actgatcaag ggaggaacaa taaggcaatc 480

cgttacggtc gtgaaggtgt ctttgtcact cattcaacca gaggcttccg tgacgaggaa 540cgttacggtc gtgaaggtgt ctttgtcact cattcaacca gaggcttccg tgacgaggaa 540

ggcaaaaact tctgggctga gatcgagatt gttgataact acagataccc atctggttca 600ggcaaaaact tctgggctga gatcgagatt gttgataact acagataccc atctggttca 600

caagcaccct acaacgttac tacgacgttg ttggtaccag gcaactacca aggagatagg 660caagcaccct acaacgttac tacgacgttg ttggtaccag gcaactacca aggagatagg 660

aggataacac atagccagat ctatgaccga ccaggaaaat acagaatt 708 <210> 65 <211> 834 <212> DNAaggataacac atagccagat ctatgaccga ccaggaaaat acagaatt 708 <210> 65 <211> 834 <212> DNA

<213> Citrus sinensis <400> 65<213> Citrus sinensis <400> 65

gttgatgggg atggccatac tgatgttgta gttccaacac tatcggggaa catttacgtt 60gttgatgggg atggccatac tgatgttgta gttccaacac tatcggggaa catttacgtt 60

cttagtggca aggatggcag taaagtccgt ccttatcctt atagaactca tggaagggtg 120cttagtggca aggatggcag taaagtccgt ccttatcctt atagaactca tggaagggtg 120

atgaatcaag tccttcttgt tgatttaact aaacgcgggg agaaaagcaa gggactcaca 180atgaatcaag tccttcttgt tgatttaact aaacgcgggg agaaaagcaa gggactcaca 180

attgttacaa catcttttga tggctatttg taccttatag atggcccaac atcatgtgct 240attgttacaa catcttttga tggctatttg taccttatag atggcccaac atcatgtgct 240

gatgtagtcg acattggcga aacttcatat agcatggtct tagctgacaa tgttgacggt 300gatgtagtcg acattggcga aacttcatat agcatggtct tagctgacaa tgttgacggt 300

ggagatgatc ttgatcttat tgttaccaca atgaacggca atgttttttg cttctcaact 360ggagatgatc ttgatcttat tgttaccaca atgaacggca atgttttttg cttctcaact 360

cctgctccac accatcccct caaggcatgg agatcaatta accaaggaag aaacaatgtt 420cctgctccac accatcccct caaggcatgg agatcaatta accaaggaag aaacaatgtt 420

gcaatccgtt acaaccgtga aggaatctat gttacacatc catcaagagc tttccgtgat 480gcaatccgtt acaaccgtga aggaatctat gttacacatc catcaagagc tttccgtgat 480

gaggaaggca gaaacttctg ggtggagatt gagattgtag atgaatatag attcccatct 540gaggaaggca gaaacttctg ggtggagatt gagattgtag atgaatatag attcccatct 540

gggtcccaag ctccatataa tgtcactaca acattgttgg tccccggcaa ttaccaaggt 600gggtcccaag ctccatataa tgtcactaca acattgttgg tccccggcaa ttaccaaggt 600

gagaggagga ttaagcaaag ccaaatcttt gcacgtcgtg gaaaatatag aatcaaattg 660gagaggagga ttaagcaaag ccaaatcttt gcacgtcgtg gaaaatatag aatcaaattg 660

ccgacagtcg gggtaaggac gacagggact gttttggtgg agatggttga caagaacgga 720ccgacagtcg gggtaaggac gacagggact gttttggtgg agatggttga caagaacgga 720

ctttatttct cagacgaatt ctcgcttaca ttccatatgt attactataa actactaaag 780ctttatttct cagacgaatt ctcgcttaca ttccatatgt attactataa actactaaag 780

tggctcctag tcctcccgat gctcgggatg tttggtgtgc ttgtcatcct tcgt 834 <210> 66 <211> 906 <212> DNAtggctcctag tcctcccgat gctcgggatg tttggtgtgc ttgtcatcct tcgt 834 <210> 66 <211> 906 <212> DNA

<213> Asparagus officinalis <400> 66<213> Asparagus officinalis <400> 66

gggtggaaag gatggatcgt ttgttcgacc cttcccctat aggacacgag ggagattgat 60gggtggaaag gatggatcgt ttgttcgacc cttcccctat aggacacgag ggagattgat 60

gagtccagtt cttctggctg atttaagcaa acgtgatgaa aagttaaagg gcctaactct 120gagtccagtt cttctggctg atttaagcaa acgtgatgaa aagttaaagg gcctaactct 120

tgttacaact gcatttgatg gctatttgta cctaattgat gggtccactg gttgtacgga 180 tgttgttgac attggcgaga catcatacac ggacgatctt gaccttattg ttactactat ctcaccgcat catcctctga aggaatggag aagtagatat aaccgtgaag gaatatacat ggaaggtaaa catttctggg tggagctgga gcatcaaggg ccttataatg tcacaacaac aaggcgaatt gtcgtcaaca atgtatataa aacagttcct gttcgaacaa cagggactgt gtatttctct gatgaatttt ctcttacatt gcttctgttt ctaccgatgc tcggaatgtt aggtgcaccg ttaccatcgt tttcacgaaa gaagatgaga atactccaaa gtgcgatgct tgtgtg <210> 67 <211> 779 <212> DNA <213> Populus <220>tgttacaact gcatttgatg gctatttgta cctaattgat gggtccactg gttgtacgga 180 tgttgttgac attggcgaga catcatacac ggacgatctt gaccttattg ttactactat ctcaccgcat catcctctga aggaatggag aagtagatat aaccgtgaag gaatatacat ggaaggtaaa catttctggg tggagctgga gcatcaaggg ccttataatg tcacaacaac aaggcgaatt gtcgtcaaca atgtatataa aacagttcct gttcgaacaa cagggactgt gtatttctct gatgaatttt ctcttacatt gcttctgttt ctaccgatgc tcggaatgtt aggtgcaccg ttaccatcgt tttcacgaaa gaagatgaga atactccaaa gtgcgatgct tgtgtg <210> 67 <211 > 779 <212> DNA <213> Populus <220>

<221> misc_feature <222> (34)..(39) <223> η is a, c, g, ou t <220><221> misc_feature <222> (34) .. (39) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (663)..(663) <223> η is a, c, g, ou t <220><221> misc_feature <222> (663) .. (663) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (686)..(688) <223> η is a, c, g, ou t <220><221> misc_feature <222> (686) .. (688) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (739)..(744) <223> η is a, c, g, ou t <220><221> misc_feature <222> (739) .. (744) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (746)..(748) <223> η is a, c, g, ou t <220><221> misc_feature <222> (746) .. (748) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (760)..(761) <223> η is a, c, g, ou t <220><221> misc_feature <222> (760) .. (761) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (766Y..(769) <223> η is a, c, g, ou t <220><221> misc_feature <222> (766Y .. (769) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (773T..(777) <223> η is a, c, g, ou t <400> 67<221> misc_feature <222> (773T .. (777) <223> η is a, c, g, or t <400> 67

tgaatcaagt tcttcttctt gacttaagta cttgttacaa catcattcga tggttatctt gatgttgttg atattggtga aacttcatat ggagatgatc ttgatctcat agtttcaaca cctgttccac atcatcccct gaaggcttgg gcaaaccgct acaaccgtga aggggtgtat gaggagggga agagcttctg ggtggaattt gggtctcaag caccttataa tgtcactaca gaacgacgga taaagcaaaa tcaaatcttt ccaacagttg gagtgagaac tactggaact ctctatttct cagatgactt ctcgcttaca tgnctccttg tcctcccaat gcttgnnntg gaggccgtgc ccttgccann nnnntnnnggtgaatcaagt tcttcttctt gacttaagta cttgttacaa catcattcga tggttatctt gatgttgttg atattggtga aacttcatat ggagatgatc ttgatctcat agtttcaaca cctgttccac atcatcccct gaaggcttgg gcaaaccgct acaaccgtga aggggtgtat gaggagggga agagcttctg ggtggaattt gggtctcaag caccttataa tgtcactaca gaacgacgga taaagcaaaa tcaaatcttt ccaacagttg gagtgagaac tactggaact ctctatttct cagatgactt ctcgcttaca tgnctccttg tcctcccaat gcttgnnntg gaggccgtgc ccttgccann nnnntnnngg

catggtcttg gaatggcaat atcatccaac atcacatgga gataatagac attattagtt tcaacctgga gctggtggag tcacatgcat tggagttctt tttggattga atctgacatgcatggtcttg gaatggcaat atcatccaac atcacatgga gataatagac attattagtt tcaacctgga gctggtggag tcacatgcat tggagttctt tttggattga atctgacatg

gcagataatg gtcttttgct cagggaagaa tccagagctt aagtacaggt cctggaaatt aagcaacgga atggttgaca tactacaagc gtcattctac tattaatgat tatgcctttggcagataatg gtcttttgct cagggaagaa tccagagctt aagtacaggt cctggaaatt aagcaacgga atggttgaca tactacaagc gtcattctac tattaatgat tatgcctttg

ttgatggtgg tttccacacc acaatgcagc tccgcgatga ttccctcagg accaaggaga taaagctgcc agaatggatt tactgaagtg gtccccagga atcatccaat tacatctgaattgatggtgg tttccacacc acaatgcagc tccgcgatga ttccctcagg accaaggaga taaagctgcc agaatggatt tactgaagtg gtccccagga atcatccaat tacatctgaa

aacnnnnnng taccttatag agcatggtct atgaatggaa agatctaata attaaacctt gagattgtgg accctgttag gaccgtccag gttttggtgg ttccacatgc tttggtgtgc aatactgacnaacnnnnnng taccttatag agcatggtct atgaatggaa agatctaata attaaacctt gagattgtgg accctgttag gaccgtccag gttttggtgg ttccacatgc tttggtgtgc aatactgacn

agaaaaacaa atggaccaac tggcagacaa atgtcttttg atcaaggaag catcaagaag acaagtatag ttcctggcaa gaaaatatcg agatggttga attactataa ttgtcatcct ngtgannnncagaaaaacaa atggaccaac tggcagacaa atgtcttttg atcaaggaag catcaagaag acaagtatag ttcctggcaa gaaaatatcg agatggttga attactataa ttgtcatcct ngtgannnnc

gggactcaca ttcttgtgct tgttgatggt cttttcaact aaacaatgta tttccgtgat aatcccgtct ttatcaaggt gataaaactt taagaatgga actgctgaag tcgtccacaa atnnnnnacgggactcaca ttcttgtgct tgttgatggt cttttcaact aaacaatgta tttccgtgat aatcccgtct ttatcaaggt gataaaactt taagaatgga actgctgaag tcgtccacaa atnnnnnac

240 300 360 420 480 540 600 660 720 780 840 900 906240 300 360 420 480 540 600 660 720 780 840 900 906

60 120 180 240 300 360 420 480 540 600 660 720 779 <210> 68 <211> 723 <212> DNA <213> Populus <400> 6860 120 180 240 300 360 420 480 540 600 660 720 779 <210> 68 <211> 723 <212> DNA <213> Populus <400> 68

ggcacgagca cacttgttac aacatcattt acttcttgtg ctgatgttgt tgatattggt aatgttgatg gtggagatga tctagatctc tgcttttcaa ctcctgttcc acatcaccct agaaacaacg tggtgaaccg ctacaaccgt agttttcgtg atgaggaggg aaagagcttc agattcccat ctgggtctca agcaccttat aattatcaag gtgagagacg aataaagcaa cgggtaaaac ttccaacagt tggagtgagg gataagaacg ggctctattt ctcagatgac aaactgctga agtggctcct agtcctccca cttcgtccac agaggccatg ccccttacat tctggcacgagca cacttgttac aacatcattt acttcttgtg ctgatgttgt tgatattggt aatgttgatg gtggagatga tctagatctc tgcttttcaa ctcctgttcc acatcaccct agaaacaacg tggtgaaccg ctacaaccgt agttttcgtg atgaggaggg aaagagcttc agattcccat ctgggtctca agcaccttat aattatcaag gtgagagacg aataaagcaa cgggtaaaac ttccaacagt tggagtgagg gataagaacg ggctctattt ctcagatgac aaactgctga agtggctcct agtcctccca cttcgtccac agaggccatg ccccttacat tct

<210> 69 <211> 704 <212> DNA<210> 69 <211> 704 <212> DNA

<213> Euphorbia esula <220><213> Euphorbia esula <220>

<221> misc_feature <222> (10)..(11) <223> n is a, c, g, ou t <400> 69<221> misc_feature <222> (10) .. (11) <223> is not a, c, g, or t <400> 69

ctgatacccn ntgaaatgtt gctgcttgga atctcaaaag tcttatttcc cagggcccat ccgatgtggt agtccctact atatctggga caaatgttcg cccataccca tatagaaccc ttgatttaag taaacgtggg gagaaaagca atggatactt gtaccttata gatgggccca aaacctcata tagcatggtc ttagcggaca tagtcacaac aatgaatggg aacgtctttt ttaaggcatg gagatcggct aatcaaggta aaggggtcta tgttacacct tcatcaagag gggtggaaat cgaaatcgtg gataaatata aagtcactac aaccctgtta gttccgggta <210> 70 <211> 1088 <212> DNActgatacccn ntgaaatgtt gctgcttgga atctcaaaag tcttatttcc cagggcccat ccgatgtggt agtccctact atatctggga caaatgttcg cccataccca tatagaaccc ttgatttaag taaacgtggg gagaaaagca atggatactt gtaccttata gatgggccca aaacctcata tagcatggtc ttagcggaca tagtcacaac aatgaatggg aacgtctttt ttaaggcatg gagatcggct aatcaaggta aaggggtcta tgttacacct tcatcaagag gggtggaaat cgaaatcgtg gataaatata aagtcactac aaccctgtta gttccgggta <210> 70 <211> 1088 <212> DNA

<213> Ceratopteris richardii <400> 70<213> Ceratopteris richardii <400> 70

ccacgcgtcc gggttacaac agatgcccgg aaagaaattt gggaagttca cttaaaaagc attgatggag acggaacatt ggatattgtt ttgcatggaa agactggtgt tactatgaag atggctcctg ttcttctggt ggacttggcc ctggtggttt catcatttga tgggtacctc gatgtggttg atgtaggaga gacatcctac ggagatgatt tggatttaat agtgacgacc cctgctcctt atcatccttt acggtcatgg gcatctcgta taagacatga agggatttat gaaggtggtg aaagtttttg ggtgcatttc gggccttaca atattacggc tacccttctt attacagaga gtcagttaat tcaacaacca tctgtacgat catctgggac tgtagttcta actgatgagt attcattgac attccacatg gtgcttccaa tgcttggaat gctttttgtc tcagttcttc cttccttttc aagggatcat ctcctaaatc caaaccttat tgtaaatgta gaaatgcaccacgcgtcc gggttacaac agatgcccgg aaagaaattt gggaagttca cttaaaaagc attgatggag acggaacatt ggatattgtt ttgcatggaa agactggtgt tactatgaag atggctcctg ttcttctggt ggacttggcc ctggtggttt catcatttga tgggtacctc gatgtggttg atgtaggaga gacatcctac ggagatgatt tggatttaat agtgacgacc cctgctcctt atcatccttt acggtcatgg gcatctcgta taagacatga agggatttat gaaggtggtg aaagtttttg ggtgcatttc gggccttaca atattacggc tacccttctt attacagaga gtcagttaat tcaacaacca tctgtacgat catctgggac tgtagttcta actgatgagt attcattgac attccacatg gtgcttccaa tgcttggaat gctttttgtc tcagttcttc cttccttttc aagggatcat ctcctaaatc caaaccttat tgtaaatgta gaaatgca

gatggttatt tgtaccttat agacggacca 60 gaaacttcat acagcatggt cttggcagat 120 atagtctcaa caatgaatgg gaatgtcttt 180 ctcaaggctt ggagatcttc taatcaagga 240 gaaggggttt atgttacacc ttcatcaaga 300 tgggtggaat ttgagattgt agacaagtat 360 aatgtcacta caaccctttt agttcctggc 420 agccaaatct ttgaccgtcc aggaaattat 480 actactggaa ctgttttggt ggagatggtt 540 ttctccctta cgtttcacat gcattactat 600 atgcttggaa tgttttgtgt gcttgtcatc 660 cattttcagg aatactgact tgtgatatca 720 723gatggttatt tgtaccttat agacggacca 60 gaaacttcat acagcatggt cttggcagat 120 180 atagtctcaa caatgaatgg gaatgtcttt ctcaaggctt ggagatcttc taatcaagga 240 300 gaaggggttt atgttacacc ttcatcaaga tgggtggaat ttgagattgt agacaagtat 360 aatgtcacta caaccctttt agttcctggc 420 480 agccaaatct ttgaccgtcc aggaaattat actactggaa ctgttttggt ggagatggtt 540 600 ttctccctta cgtttcacat gcattactat atgcttggaa tgttttgtgt gcttgtcatc 660 720 723 cattttcagg aatactgact tgtgatatca

cttcacaagg cagttggtga atatatatgt atgggagagt ccggactcag catcctgcgc atgtagacgg gcttcgcgac gaaataatgt cttttcgaga gatacccttc attatcaaggcttcacaagg cagttggtga atatatatgt atgggagagt ccggactcag catcctgcgc atgtagacgg gcttcgcgac gaaataatgt cttttcgaga gatacccttc attatcaagg

aaaggaaatt tgtggatggg tttgagcggc aatgaatcaa ccttgtaaca tgatgtcgtt aggagatgac tcctgttcca ggcaaacaga cgaggaagga tggttctcaa tgagaaaggaaatt tgtggatggg tttgagcggc aatgaatcaa ccttgtaaca tgatgtcgtt aggagatgac tcctgttcca ggcaaacaga cgaggaagga tggttctcaa tgag

tgggagaggc gatggccata aaggatgggt gttctccttg acttcatttg gatattggtg cttgacctag catcatcccc tttaaccgtg aagaatttct gcaccttatatgggagaggc gatggccata aaggatgggt gttctccttg acttcatttg gatattggtg cttgacctag catcatcccc tttaaccgtg aagaatttct gcaccttata

ggaaatgttg ttgattgctc gtgccaactg ccatatccat aagctaggca tacctcatag acaatggtgc atgaatggga acctcacaga gctacatctg aatattattg gtcccccaca ggaacgcaca gagatggtgg cactattatc ttgttgtggc taaaatgaca tacattttgaggaaatgttg ttgattgctc gtgccaactg ccatatccat aagctaggca tacctcatag acaatggtgc atgaatggga acctcacaga gctacatctg aatattattg gtaccccaca ggaacgcaca gagatggtgg cactattatgg tacgatgga

ctgcatggac agggtccgac tgtcaggaaa ttcgtaccca ccgagagaag atggtcccac ttgcagacaa atgttttctg atcagggtag gctcgagaag atgagaaccg actacatggg agttcaaact ataaacatgg ggctactgaa ttcatcctga tatgagctca catttatccactgcatggac agggtccgac tgtcaggaaa ttcgtaccca ccgagagaag atggtcccac ttgcagacaa atgttttctg atcagggtag gctcgagaag atgagaaccg actacatggg agttcaaact ataaacatgg gggtctgtctctg

aaataaagga tgtcggagat tatatatgtt tgggcgtgtg aggtctggtc agcctgtgct cgttgatgga cttctctaca gagcaatctt tttcagggat cttaccttcg tccaaggcgc gccatgtgta gttctatttc atggatggta ggatgccata atttttggta gtctactaaaaaataaagga tgtcggagat tatatatgtt tgggcgtgtg aggtctggtc agcctgtgct cgttgatgga cttctctaca gagcaatctt tttcagggat cttaccttcg tccaaggcgc gcggggggggggggggggggggggggggg

60 120 180 240 300 360 420 480 540 600 660 70460 120 180 240 300 360 420 480 540 600 660 704

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1088 ctctgcgctt tcgctatttt cttctctctt actttctcac tcttaaaccc taaccctcat60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1088 ctctgcgctt tcgctatttt cttctctctt actttctcac tcttaaaccc taaccctcat

<210> 71 <211> 830 <212> DNA<210> 71 <211> 830 <212> DNA

<213> Welwitschia mirabilis <400> 71<213> Welwitschia mirabilis <400> 71

atgacaatca tgaacacttg aaggagctgg gtgatattga tattagcaaa tatgtttcag gtgctatagt ggtatttaat cttgatacaa agcaagtgaa gtggagtact cagttggatc ttagcacaac ctctgggact tttaatgcat acatctattc ttctcctact gtggttgacc tggatggtga cggcaatttg gatattattg ttggcacgtc atttggtttc ttttatgtat tggatcacca tggaaaaaat agagaaggct ttccattaca gatgggtgag attcaaggac aagtaattgc tgctgatata aatgatgatg ggaagattga aatggttaca acagataccc gtggaaatgt ggctgcttgg acttctcagg ggaaagaaat atgggagata catttaaaaa gtcttattgc tcaggggcct acagtaggtg atattgatgg agatggtcat acagatttgg tggttcctac agtatcagga aatatttatg tattaaatgg gaaagatgga tcattggtga agccatttcc ttatcgtact catggaagag tcatgagtcc ggtacttttg gttgacctta gcaaacgtgg ggaaaagcaa aagggcttaa ctcttgcagc attatcattt gatggttact tctacttaat tgatggtcaa acagcttgtg cagatgttgt tgatattgga gagacttcct actctatggc tttggcggac aatgtagatg gcggcgatga tcttgatttt attatcacaa ctatgaatgg caatgtgttc tgcttttcaa cccctgctcc acatcatcca <210> 72 <211> 8730 <212> DNA <213> Medicago sativa <400> 72atgacaatca tgaacacttg aaggagctgg gtgatattga tattagcaaa tatgtttcag gtgctatagt ggtatttaat cttgatacaa agcaagtgaa gtggagtact cagttggatc ttagcacaac ctctgggact tttaatgcat acatctattc ttctcctact gtggttgacc tggatggtga cggcaatttg gatattattg ttggcacgtc atttggtttc ttttatgtat tggatcacca tggaaaaaat agagaaggct ttccattaca gatgggtgag attcaaggac aagtaattgc tgctgatata aatgatgatg ggaagattga aatggttaca acagataccc gtggaaatgt ggctgcttgg acttctcagg ggaaagaaat atgggagata catttaaaaa gtcttattgc tcaggggcct acagtaggtg atattgatgg agatggtcat acagatttgg tggttcctac agtatcagga aatatttatg tattaaatgg gaaagatgga tcattggtga agccatttcc ttatcgtact catggaagag tcatgagtcc ggtacttttg gttgacctta gcaaacgtgg ggaaaagcaa aagggcttaa ctcttgcagc attatcattt gatggttact tctacttaat tgatggtcaa acagcttgtg cagatgttgt tgatattgga gagacttcct actctatggc tttggcggac aatgtagatg gcggcgatga tcttgatttt attatcacaa ctatgaatgg caatgtgttc tgcttttcaa cccctgctcc acatcatcca <210> 72 <211> 8730 <212> DNA <213> Medicago sativa <400> 72

atgaggaagc gtgatttggc gattcttatg caggtattgt accctttaac cccctaattc tttcaattca attgattcag caagatggtg gtgtttcatt caaagacgcg tggatgcatc taacagatga atacccaatc aaatacgaag ccgaacgcct tcctcctcct gttgtcgccg atctcaacgg cgatggtaag aaagaagttc tcgtagctac ccacgatgcc aaaattcagg ttctttcatt tcccaatttt cctcaatttt ttattcactt ataaaattcc aggttttatt tggtttcctt cacaactgga cattgtcaaa aaaacatttt ttttctttca gtaaaccatc aatgtagttg atgaactata actctcttca atttagtttg taagtagtct ctaaaattca tcaattaatc cctgctatta atgtttggtt ctacaccgaa gaaagttgac tttgaatgag ttgattgtgt aaactctatt tgggctaaaa ttgatttgaa ggtaaagtga tttatgtttg gactttggat acattcatgt aaaagtgaat tgaacaggtg aaaaatcaac tctagaatca gaagctacaa tttctaactt taagtagaat gtagaatcaa ttctggaggt aaaatcaatt ttactctaga agaaccaaat atgtcaatca attttgggtc ctccaaaatt agaaccaaac atacagaaag tagagactaa aattgatgga ttttcatata ctttagggac ttaattgacc ggttttatat actttaaaga ctacttatca tatttatata gtttagggac tagattgatg gtacaagtaa tatagtagta actggatttt gtatttatgg tcggtgtctt agattttgga gccacatagt aggcgtgttg atgaaggatt cagtgaggca cgtgtgttag cggaggtgtc tctgttgcct gacaaagtgc gtgtcatgtc tgggagacga cctgttgcta tggccactgg ctttattgac cgccatagaa ttggacaacc acataagcag gttttggttg tagtaacatc gggttggttt gtaatgtgtt ttgattccaa cctccaaaag ttgtgggaaa ataatttgca ggtatgatgt ttatgttgtg ccatgtttca gttgatagaa ttttcagtta aacattttga ttatcttgtt atgttttagt ttaccaactg ttttagtggt tgttaacagg aggatttccc ccataatgct caccacaggg aagtttcaat atctataagc aattatactc tcaagcatgg agatacagga ttgatcattg ttggtgggag aatggaaatg cagcctcatg tatgtgtcac tttccttctt gttttctggt ttgttattct ttttagcaga gtatgtgtgt ctgtgttcta tctgctgatg gaaaaactta gaatttaatg tggatggtgt ttaccatctt ttatgaaagc gaaaactctc aacttcatga gtagcataag attctggcta tcttgttttc ttggaagtga tgaaaatgaa agttcctgag taattttatt tgataaagta tgatggtaat gtgagggttt gctgctgctt ctcgagtttc agaatttttt atttgttatt tgattctttc tatggtaatg attttggaat tgttcatctt tggaattatt ggcattatct tctaatctga tggttctgtt ggcttatgtt gattgctttc cattttcaga tttttatgga cccttttgaa gaaatgggaa tgggagctag atttgctgag cagcatcgaa gaagtgctac tgaaaaggag gtatagatac gtttctagtt gatgctaaat tttatgccca tttttttact atctgtagca tgctaatttt ggtttaaact ttgagacact atttgcttta tttatttcac tttaattttg ggtcttcaag gttgacctta ttttatgctc ctaaacagtc aattcaaatt cctattttga tataaataga taatataaaa gttcaccatg tcttggcatg ataaagccaa taaataaaat ctgtgcacct tgcagtaagt agtctataaa tctgaacctt catgatcagg tagctaaata aacaggagac agtttcactc gttttgttta gatttttgtt tttacaaaaa aatgtatcag gtgattttag ttttcttccc attttaaggt tgaagacttt aacttgttta ttgtgttcct ttttctggatatgaggaagc gtgatttggc gattcttatg caggtattgt accctttaac cccctaattc tttcaattca attgattcag caagatggtg gtgtttcatt caaagacgcg tggatgcatc taacagatga atacccaatc aaatacgaag ccgaacgcct tcctcctcct gttgtcgccg atctcaacgg cgatggtaag aaagaagttc tcgtagctac ccacgatgcc aaaattcagg ttctttcatt tcccaatttt cctcaatttt ttattcactt ataaaattcc aggttttatt tggtttcctt cacaactgga cattgtcaaa aaaacatttt ttttctttca gtaaaccatc aatgtagttg atgaactata actctcttca atttagtttg taagtagtct ctaaaattca tcaattaatc cctgctatta atgtttggtt ctacaccgaa gaaagttgac tttgaatgag ttgattgtgt aaactctatt tgggctaaaa ttgatttgaa ggtaaagtga tttatgtttg gactttggat acattcatgt aaaagtgaat tgaacaggtg aaaaatcaac tctagaatca gaagctacaa tttctaactt taagtagaat gtagaatcaa ttctggaggt aaaatcaatt ttactctaga agaaccaaat atgtcaatca attttgggtc ctccaaaatt agaaccaaac atacagaaag tagagactaa aattgatgga ttttcatata ctttagggac ttaattgacc ggttttatat actttaaaga ctacttatca tatttatata gtttagggac tagattgatg gtacaagtaa tatagtagta actggatttt gtatttatgg tcggtgtctt agattttgga gccacatagt aggcgtgttg atgaaggatt cagtgaggca cgtgtgttag cggaggtgtc tctgttgcct gacaaagtgc gtgtcatgtc tgggagacga cctgttgcta tggccactgg ctttattgac cgccatagaa ttggacaacc acataagcag gttttggttg tagtaacatc gggttggttt gtaatgtgtt ttgattccaa cctccaaaag ttgtgggaaa ataatttgca ggtatgatgt ttatgttgtg ccatgtttca gttgatagaa ttttcagtta aacattttga ttatcttgtt atgttttagt ttaccaactg ttttagtggt tgttaacagg aggatttccc ccataatgct caccacaggg aagtttcaat atctataagc aattatactc tcaagcatgg agatacagga ttgatcattg ttggtgggag aatggaaatg cagcctcatg tatgtgtcac tttccttctt gttttctggt ttgttattct ttttagcaga gtatgtgtgt ctgtgttcta tctgctgatg gaaaaactta gaatttaatg tggatggtgt ttaccatctt ttatgaaagc gaaaactctc aacttcatga gtagcataag attctggcta tcttgttttc ttggaagtga tgaaaatgaa agttcctgag taattttatt tgataaagta tgatggtaat gtgagggttt gctgctgctt ctcgagtttc agaatttttt atttgttatt tgattctttc tatggtaatg attttggaat tgttcatctt tggaattatt ggcattatct tctaatctga tggttctgtt ggcttatgtt gattgctttc cattttcaga tttttatgga cccttttgaa gaaatgggaa tgggagctag atttgctga g cagcatcgaa gaagtgctac tgaaaaggag gtatagatac gtttctagtt gatgctaaat tttatgccca tttttttact atctgtagca tgctaatttt ggtttaaact ttgagacact atttgcttta tttatttcac tttaattttg ggtcttcaag gttgacctta ttttatgctc ctaaacagtc aattcaaatt cctattttga tataaataga taatataaaa gttcaccatg tcttggcatg ataaagccaa taaataaaat ctgtgcacct tgcagtaagt agtctataaa tctgaacctt catgatcagg tagctaaata aacaggagac agtttcactc gttttgttta gatttttgtt tttacaaaaa aatgtatcag gtgattttag ttttcttccc attttaaggt tgaagacttt aacttgttta ttgtgttcct ttttctggat

60 120 180 240 300 360 420 480 540 600 660 720 780 83060 120 180 240 300 360 420 480 540 600 660 720 780 830

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 aggcttctga aaacaccgga actgtggatt tacgccattt tgcattttat gcatttgctg 240060 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 aggcttctga aaacaccgga actgtggatt tacgccattt tgcattttat gcatttgt

gtcgatcagg tgtagaacga tggagcagaa aaacagaggt ggtgttcttt tttttttgtt 24 60gtcgatcagg tgtagaacga tggagcagaa aaacagaggt ggtgttcttt tttttttgtt 24 60

ttcagtgcgc tctattattt gggtgttgtc aacatgcaaa tatgaaacaa ttatttattt 2520ttcagtgcgc tctattattt gggtgttgtc aacatgcaaa tatgaaacaa ttatttattt 2520

ttaatttaaa aatgcatttt cttgtttttt aaaagagctg tcttttctat ctggaaattc 2580ttaatttaaa aatgcatttt cttgtttttt aaaagagctg tcttttctat ctggaaattc 2580

attaggtgat taagtgaact ttctctgtcc tccctctctg tacataactt tattcagggg 2640attaggtgat taagtgaact ttctctgtcc tccctctctg tacataactt tattcagggg 2640

gtagcaactt agttctagac agtatgtttt gtcctgcaac agacatgaaa actgaagaaa 2700gtagcaactt agttctagac agtatgtttt gtcctgcaac agacatgaaa actgaagaaa 2700

agttatatag ttaagctcac aaagttcaga acataatgag ttagagccta aatgtcaata 2760agttatatag ttaagctcac aaagttcaga acataatgag ttagagccta aatgtcaata 2760

atagattata aattatacct ttgaagatat tggagtcttg ttgcaagcat ctgcacttgg 2820atagattata aattatacct ttgaagatat tggagtcttg ttgcaagcat ctgcacttgg 2820

attttaacgc actggtgcac aaatatgtat tttttgaaaa gaaaatctat caaacaaatg 2880attttaacgc actggtgcac aaatatgtat tttttgaaaa gaaaatctat caaacaaatg 2880

gaaccacctc ccaaccagca taaactttag tcttttctgt ctttgggtgg tagtaccaga 2940gaaccacctc ccaaccagca taaactttag tcttttctgt ctttgggtgg tagtaccaga 2940

tagatgtttt acaatcaaca tagcggtcca gtttgattga atatgtgatt tacgctagtc 3000tagatgtttt acaatcaaca tagcggtcca gtttgattga atatgtgatt tacgctagtc 3000

caacatttat tttgttaaat gatcttgtgt atccttgtcc tttttttttt cttttctttt 3060caacatttat tttgttaaat gatcttgtgt atccttgtcc tttttttttt cttttctttt 3060

ctaattgcta gtattgtgat ttaattgttt agaacattga agcagcagct tcttcagacg 3120ctaattgcta gtattgtgat ttaattgttt agaacattga agcagcagct tcttcagacg 3120

catcacagtt aattccacag cataactaca aacttgatgt tcatgctctg aatagacgtc 3180catcacagtt aattccacag cataactaca aacttgatgt tcatgctctg aatagacgtc 3180

aacctggaga ggtacttagc tatagctgtt caatttaatc ctaaattcct aatggtatat 3240aacctggaga ggtacttagc tatagctgtt caatttaatc ctaaattcct aatggtatat 3240

tgaattgatg gaatatggta aattggagtg gcataaaata ccattccatc ctttttaagc 3300tgaattgatg gaatatggta aattggagtg gcataaaata ccattccatc ctttttaagc 3300

aggggaatca ttgcttttct ttttcataca tccattttat tctaatctag aaatatgcat 3360aggggaatca ttgcttttct ttttcataca tccattttat tctaatctag aaatatgcat 3360

gttgattttt atgttctccc ctttagctca acgtactgat tttgttatat gtaagtaata 3420gttgattttt atgttctccc ctttagctca acgtactgat tttgttatat gtaagtaata 3420

ctgtaatttc agatttatta ctttttccat tcctttcctc atcaatctta agtaataccg 3480ctgtaatttc agatttatta ctttttccat tcctttcctc atcaatctta agtaataccg 3480

tagaatagat tcctagtcat atctttatgt tcttcacctt ttctcttcaa atgatcaaac 3540tagaatagat tcctagtcat atctttatgt tcttcacctt ttctcttcaa atgatcaaac 3540

actaaagcaa atatttgttt gttaatatgg agtttactat gagaactcta gtacaatagt 3600actaaagcaa atatttgttt gttaatatgg agtttactat gagaactcta gtacaatagt 3600

actcatccaa atctacttga gtaacttggt catctccttc ctttgtgtgt ggaaatagca 3660actcatccaa atctacttga gtaacttggt catctccttc ctttgtgtgt ggaaatagca 3660

gcatgtgcac ataaaggagt gtttcaatca aatttaatat tattgtgaaa cctttgtata 3720gcatgtgcac ataaaggagt gtttcaatca aatttaatat tattgtgaaa cctttgtata 3720

tgtttatcca tatctaccca atagatagct tcctgtgaca tgtgaaatta tagtttgaat 3780tgtttatcca tatctaccca atagatagct tcctgtgaca tgtgaaatta tagtttgaat 3780

gcagggaatt cagagaatca atcctgggag ttatgccaca tcaatgggta cactctattt 3840gcagggaatt cagagaatca atcctgggag ttatgccaca tcaatgggta cactctattt 3840

tcaaccttga ttaacgtttg gtactaaagc ataatctcaa atgtcatagt taactgatat 3900tcaaccttga ttaacgtttg gtactaaagc ataatctcaa atgtcatagt taactgatat 3900

tagatacatg cactcatcag gataggagag aagatacttt attgaagttg gtccacttca 3960tagatacatg cactcatcag gataggagag aagatacttt attgaagttg gtccacttca 3960

atcggcataa gaggaaaaca ttgaagaaaa cacctggaaa gactatcaat taccctttcg 4020atcggcataa gaggaaaaca ttgaagaaaa cacctggaaa gactatcaat taccctttcg 4020

acaagcctga ggaaaaccat ccaccaggga aggactcaac caaaaaaatt tcaaacataa 4080acaagcctga ggaaaaccat ccaccaggga aggactcaac caaaaaaatt tcaaacataa 4080

ttgggaaagc agcaaatttt gctggttcag caaaatccaa gaaggtaatt agaaaccatg 4140ttgggaaagc agcaaatttt gctggttcag caaaatccaa gaaggtaatt agaaaccatg 4140

tcatgcaatg caactggtaa caattcattc aattgttgac ataatgataa ttagttttaa 4200tcatgcaatg caactggtaa caattcattc aattgttgac ataatgataa ttagttttaa 4200

gatggctaca actggacaac tcaaaaattc ttttccaaac atgatttcag ctacaagctt 4260gatggctaca actggacaac tcaaaaattc ttttccaaac atgatttcag ctacaagctt 4260

ttgttgtctt tatccagtaa cagagctgtc tgtttacttt ctaactactg catgtccaat 4320ttgttgtctt tatccagtaa cagagctgtc tgtttacttt ctaactactg catgtccaat 4320

tttttgttat gtgatctaaa tctttgtgtt ggtaatattc tcagcatctg ctgattttaa 4380tttttgttat gtgatctaaa tctttgtgtt ggtaatattc tcagcatctg ctgattttaa 4380

ttcattttgg ctaaacctat tttgaatttg ttatgataac cattgcttag catttttaat 4440ttcattttgg ctaaacctat tttgaatttg ttatgataac cattgcttag catttttaat 4440

ttttttttta aactaagcac tggtcagata aaccatctca cttgttatat ttgtatttgt 4500ttttttttta aactaagcac tggtcagata aaccatctca cttgttatat ttgtatttgt 4500

tcttaaagat ttaagtctag ctacattttt tatttctcat ttaaattttt tgaatcctga 4560tcttaaagat ttaagtctag ctacattttt tatttctcat ttaaattttt tgaatcctga 4560

atttagggag ccaagatatt tagttataaa aataatgatt aataataaat atgcagttct 4620atttagggag ccaagatatt tagttataaa aataatgatt aataataaat atgcagttct 4620

ccccattgtc gtgttaattt ggtagatagc atagtagtca atcttggata gcggtgcgta 4680ccccattgtc gtgttaattt ggtagatagc atagtagtca atcttggata gcggtgcgta 4680

gtggccaacc ccaaaaatgg gatagcgtat agcggtatga caaatagcgg tcaccgatgt 4740gtggccaacc ccaaaaatgg gatagcgtat agcggtatga caaatagcgg tcaccgatgt 4740

ttgattattt tttggacaat tatatgaata atagcaaagt ataaacaaac ttatatattt 4800ttgattattt tttggacaat tatatgaata atagcaaagt ataaacaaac ttatatattt 4800

ctcaacaaaa aaaacttata ttaaatataa cactcaaatc tcacgagaca ttcataaatc 4860ctcaacaaaa aaaacttata ttaaatataa cactcaaatc tcacgagaca ttcataaatc 4860

aaaacaccga aaacaaaaga caggaacaaa taaaaaaaat cataaaacag gagaaaccat 4 920aaaacaccga aaacaaaaga caggaacaaa taaaaaaaat cataaaacag gagaaaccat 4 920

aagatagaag atagaagagt gtgtttcgcg gcacaggtga gaagagagaa aaagttgaaa 4 980aagatagaag atagaagagt gtgtttcgcg gcacaggtga gaagagagaa aaagttgaaa 4 980

aatgttaggg tttacgaaat cctcaaaatg ccctaaaaaa ggttttaaaa atagggtcaa 5040aatgttaggg tttacgaaat cctcaaaatg ccctaaaaaa ggttttaaaa atagggtcaa 5040

tttggaaatt tcctactaaa ataaatagcg gctgctatcc aacccgcacc gctatagcag 5100tttggaaatt tcctactaaa ataaatagcg gctgctatcc aacccgcacc gctatagcag 5100

ctgaagcggc cgctatttga ttccgcgcta tttgataccg ctatgctaca cgcggccgct 5160ctgaagcggc cgctatttga ttccgcgcta tttgataccg ctatgctaca cgcggccgct 5160

atagcgccac tatcggctgc tattgactac tatggtagat agaaactgtt aggttaccta 5220atagcgccac tatcggctgc tattgactac tatggtagat agaaactgtt aggttaccta 5220

gtagggctga tgatgtgtta gtgggctcaa gtaatgagtg agaggcccat tatttggagg 5280gtagggctga tgatgtgtta gtgggctcaa gtaatgagtg agaggcccat tatttggagg 5280

gtgtatgaac gtgggaagaa gagaggagag aagggactaa gggtgcttcc tagctggcag 5340gtgtatgaac gtgggaagaa gagaggagag aagggactaa gggtgcttcc tagctggcag 5340

ttagttagta tgaggcagag ggagtgaata tatttcttct gaggagctgt tgctctagtt 5400ttagttagta tgaggcagag ggagtgaata tatttcttct gaggagctgt tgctctagtt 5400

tatccgtcat agtgatttca ttgttattct agtttagcca ggctttggga gtatttggta 5460tatccgtcat agtgatttca ttgttattct agtttagcca ggctttggga gtatttggta 5460

tatctacctc gaagatgcta ggtcctaaaa tgatgcagtt ggaaggttcg attgcgggag 5520tatctacctc gaagatgcta ggtcctaaaa tgatgcagtt ggaaggttcg attgcgggag 5520

tctctctgtt ggtgatgatt taaacacaat ttcatatact cctggtgtgg ttgaagcgtt 5580tctctctgtt ggtgatgatt taaacacaat ttcatatact cctggtgtgg ttgaagcgtt 5580

gggggttgcc tttggattca tcagatactg ctggtgtgca tttgggtggg ggtggggggt 5640gggggttgcc tttggattca tcagatactg ctggtgtgca tttgggtggg ggtggggggt 5640

catatggtgc agatattggg caaatgtgtg gttggcttct gcatatcggc ccttatgcag 5700catatggtgc agatattggg caaatgtgtg gttggcttct gcatatcggc ccttatgcag 5700

tcttgctgga tacatatgtg ttggggttag aagaggtcat gccaaagtac caattactct 5760tcttgctgga tacatatgtg ttggggttag aagaggtcat gccaaagtac caattactct 5760

cttaatacct gtctaataag actctaatgc tttaaattga cgaggatttg catttttcac 5820cttaatacct gtctaataag actctaatgc tttaaattga cgaggatttg catttttcac 5820

ctttcactgg caaacatatg ggttaaactg gtagatgttt agcgtgttca agtacaagct 5880ctttcactgg caaacatatg ggttaaactg gtagatgttt agcgtgttca agtacaagct 5880

gtgttcccat agatgaagta cttcatgttt ggggagtttg atcgttaaac tacctaattg 5940gtgttcccat agatgaagta cttcatgttt ggggagtttg atcgttaaac tacctaattg 5940

tttgtttaaa tgaattttga attccctctt ctaataattt tagtgcttcc aaagattata 6000tttgtttaaa tgaattttga attccctctt ctaataattt tagtgcttcc aaagattata 6000

atgcatataa aacaatttga ggattatctt gttcttaggt gaaaaacagt ttttttccca 6060atgcatataa aacaatttga ggattatctt gttcttaggt gaaaaacagt ttttttccca 6060

tttgaaatta gataaacaga gtagttgtag atttctactg tggaaagcat aacatgtcta 6120 agctggttaa atatacttaa ttgatggttt ttgtcattaa agtaatttct ttgcatacat 6180tttgaaatta gataaacaga gtagttgtag atttctactg tggaaagcat aacatgtcta 6120 agctggttaa atatacttaa ttgatggttt ttgtcattaa agtaatttct ttgcatacat 6180

ttttatgttc tcatgttatt gcttaatcgg aaaggggttc tataaaatgg atggcatttt 6240ttttatgttc tcatgttatt gcttaatcgg aaaggggttc tataaaatgg atggcatttt 6240

atgggattcc gagaagcctt tttctttttt ttgccagggt ggggggtttg cattatttgt 6300atgggattcc gagaagcctt tttctttttt ttgccagggt ggggggtttg cattatttgt 6300

cataatgttt tttcttttgg aatgcagtat ccaccatatg ttcccaccat aaccaactat 6360cataatgttt tttcttttgg aatgcagtat ccaccatatg ttcccaccat aaccaactat 6360

actaaggttt ggtgggttcc taatgttgtt gtggctcatc taaaggaggg gatagaagtc 6420actaaggttt ggtgggttcc taatgttgtt gtggctcatc taaaggaggg gatagaagtc 6420

cttcatctgg catctggtcg aacactatgt aaggtaaata taaagccact gatcagcttg 6480cttcatctgg catctggtcg aacactatgt aaggtaaata taaagccact gatcagcttg 6480

aaaatcaaaa tacaaaaaaa aaaaaaaaaa gtttacaagt agttgtacaa catttgctcc 6540aaaatcaaaa tacaaaaaaa aaaaaaaaaa gtttacaagt agttgtacaa catttgctcc 6540

tgtggttgta gatttgtagt attaaactgc catggtttca gccaaaatct tatttagcat 6600tgtggttgta gatttgtagt attaaactgc catggtttca gccaaaatct tatttagcat 6600

tcacgttact tttgaaattt ttcgtattct gtgaaatgac acttctattt atctcagctt 6660tcacgttact tttgaaattt ttcgtattct gtgaaatgac acttctattt atctcagctt 6660

caccttcagg aaggtggtct acatgctgat attaatggtg atggagttct ggatcatgtg 6720caccttcagg aaggtggtct acatgctgat attaatggtg atggagttct ggatcatgtg 6720

caggttcact ttttttcctt cacatttttt gataaacaaa caagccaaat ctttattaat 6780caggttcact ttttttcctt cacatttttt gataaacaaa caagccaaat ctttattaat 6780

ttagcatgat aattgttaac ttaacggggg attttcctct gcctgatgtc tgaaagattt 6840ttagcatgat aattgttaac ttaacggggg attttcctct gcctgatgtc tgaaagattt 6840

atctaatcag gctgttggag gaaatggtgc tgagcaaact gtagttagtg ggtccatgga 6900atctaatcag gctgttggag gaaatggtgc tgagcaaact gtagttagtg ggtccatgga 6900

tgttctacgt ccttgttggg ctgttgcaac gtctggcgta ccagtacggg aacaactctt 6960tgttctacgt ccttgttggg ctgttgcaac gtctggcgta ccagtacggg aacaactctt 6960

caatgtatct atttgtcatt atacccattt taacttattc caacatggag aactttatag 7020caatgtatct atttgtcatt atacccattt taacttattc caacatggag aactttatag 7020

aggcttcaac cgaggttcag atatgtcttc tttggaggta gcaacaccca ttctcattcc 7080aggcttcaac cgaggttcag atatgtcttc tttggaggta gcaacaccca ttctcattcc 7080

tagaagcgat ggtcacaagc accggaaggg aagccacggg gatgttatct tcttgacaaa 7140tagaagcgat ggtcacaagc accggaaggg aagccacggg gatgttatct tcttgacaaa 7140

ccggggagag gtacgctctt ttttgttcga ctaaatctgg ttatgtaaca tttgatagtt 7200ccggggagag gtacgctctt ttttgttcga ctaaatctgg ttatgtaaca tttgatagtt 7200

tgtttgagca ccaatcaaac aaacctagtt cttaacttct gttaacaaat tatttcaagt 7260tgtttgagca ccaatcaaac aaacctagtt cttaacttct gttaacaaat tatttcaagt 7260

cacgcacgac taatatattt tggtggtatt tgtgagataa tccgtacctc cgtactgact 7320cacgcacgac taatatattt tggtggtatt tgtgagataa tccgtacctc cgtactgact 7320

ttatgaaaat tgctccttgc agataacttc gcacactcct ggtttgcatg gtcatgatgc 7380ttatgaaaat tgctccttgc agataacttc gcacactcct ggtttgcatg gtcatgatgc 7380

tgtttggcag tggcaacaat caactggtgt cacatggtca aacctacctt ccccagcagg 7440tgtttggcag tggcaacaat caactggtgt cacatggtca aacctacctt ccccagcagg 7440

gatgatggaa ggtggtttgg tgattcccac actaaagcct tttcctttgc ggttgcatga 7500gatgatggaa ggtggtttgg tgattcccac actaaagcct tttcctttgc ggttgcatga 7500

caatcatgag atgatccttg cagctggaga acaagaggct gtggtaatat cacccggagg 7560caatcatgag atgatccttg cagctggaga acaagaggct gtggtaatat cacccggagg 7560

tagcatattg gctacaattg aactccctgg ttcacctaca catgtattga tccgtgaaga 7620tagcatattg gctacaattg aactccctgg ttcacctaca catgtattga tccgtgaaga 7620

cttctcaaat gatgggctca ctgaccttat tctcgtcacc tcatccggag tgtacggctt 7680cttctcaaat gatgggctca ctgaccttat tctcgtcacc tcatccggag tgtacggctt 7680

tgtccagact cgacaacctg gtgctctctt cttcagtgtg ctgatcggct gtctcatagt 7740tgtccagact cgacaacctg gtgctctctt cttcagtgtg ctgatcggct gtctcatagt 7740

cgtgatggga attatatttg ttacccagca cataaattcc atgaagggga agcctcgtcc 7800cgtgatggga attatatttg ttacccagca cataaattcc atgaagggga agcctcgtcc 7800

atcatctggt cctaggtgaa atgcaggacc tgaaatttat acattaactt tgcaggcgct 7860atcatctggt cctaggtgaa atgcaggacc tgaaatttat acattaactt tgcaggcgct 7860

tacagatgaa gcagaagaca aagcggtgtg cgcatcgtat ggagcttcaa gattgttgga 7920tacagatgaa gcagaagaca aagcggtgtg cgcatcgtat ggagcttcaa gattgttgga 7920

aatgcataga atgtaaggag attttgagga ggtgttgtac tgtctaggat ggatgattgt 7980aatgcataga atgtaaggag attttgagga ggtgttgtac tgtctaggat ggatgattgt 7980

aaaatttaga cagaagtgac agaatgtcct tcatgagaga aacatgatcc attaatataa 8040aaaatttaga cagaagtgac agaatgtcct tcatgagaga aacatgatcc attaatataa 8040

ggaaactata gtctttgcct acgtatctgg ctgttgttta gaagttatac tgcccacact 8100ggaaactata gtctttgcct acgtatctgg ctgttgttta gaagttatac tgcccacact 8100

tgacaattgt cacccgttcc gaattagttg atacttgata gttgatgcat aacagaaact 8160tgacaattgt cacccgttcc gaattagttg atacttgata gttgatgcat aacagaaact 8160

caccttggtc tttacacttt tcgctaaaag gattttctct tgtcattaca caattcttgt 8220caccttggtc tttacacttt tcgctaaaag gattttctct tgtcattaca caattcttgt 8220

aaatacgacc atcgtttatt tgcttcagat ttagcagtgt aaaacattaa atctagcaac 8280aaatacgacc atcgtttatt tgcttcagat ttagcagtgt aaaacattaa atctagcaac 8280

caacttgctc caatctgtct tggtcttctt cagaatacac ttcttaaaag tcaattaaga 8340caacttgctc caatctgtct tggtcttctt cagaatacac ttcttaaaag tcaattaaga 8340

aatgacttcc tgattccatc aaattaccaa tgtggttgat cccatcatac atcaagtgct 8400aatgacttcc tgattccatc aaattaccaa tgtggttgat cccatcatac atcaagtgct 8400

atgtacgtaa tccctgttag tctttggcat caccttaagt gttttagcta ttgcttttcc 8460atgtacgtaa tccctgttag tctttggcat caccttaagt gttttagcta ttgcttttcc 8460

tgtgcgtcga gaaatgtttc aaataaccat ctgaatgatt caatattgca tcatataata 8520tgtgcgtcga gaaatgtttc aaataaccat ctgaatgatt caatattgca tcatataata 8520

ttgcaaaccc aaaattagtg tgttcctata atggataaag cttgaaaata atgcgagtgg 8580ttgcaaaccc aaaattagtg tgttcctata atggataaag cttgaaaata atgcgagtgg 8580

tcgattagtg cgattggtgc aatgttggat tcattaacaa ctggtattga aaatattgca 8640tcgattagtg cgattggtgc aatgttggat tcattaacaa ctggtattga aaatattgca 8640

taaagctatc aacttctcca tataccatgc tacattgtct tttgcctgat gatgattttt 8700taaagctatc aacttctcca tataccatgc tacattgtct tttgcctgat gatgattttt 8700

gacatccaac cgtgtaaata caatattagt 8730 <210> 73 <211> 57 <212> PRTgacatccaac cgtgtaaata caatattagt 8730 <210> 73 <211> 57 <212> PRT

<213> Medicago sativa <400> 73<213> Medicago sativa <400> 73

Ile Gln Gln Asp Gly Gly Val Ser Phe Lys Asp Ala Trp Met His Leu 1 5 10 15Ile Gln Gln Asp Gly Gly Val Ser Phe Lys Asp Wing Trp Met His Leu 1 5 10 15

Thr Asp Glu Tyr Pro Ile Lys Tyr Glu Ala Glu Arg Leu Pro Pro ProThr Asp Glu Tyr Pro Ile Lys Tyr Glu Wing Glu Arg Leu Pro Pro

20 25 3020 25 30

Val Val Ala Asp Leu Asn Gly Asp Gly Lys Lys Glu Val Leu Val AlaVal Val Wing Asp Leu Asn Gly Asp Gly Lys Lys Glu Val Leu Val Ala

35 40 4535 40 45

Thr His Asp Ala Lys Ile Gln Val LeuThr His Asp Wing Lys Ile Gln Val Leu

50 5550 55

<210> 74 <211> 25 <212> PRT<210> 74 <211> 25 <212> PRT

<213> Medicago sativa <400> 74<213> Medicago sativa <400> 74

Leu Ser Gln Leu His Leu Gln Glu Gly Gly Leu His Ala Asp Ile Asn 1 5 10 15 Gly Asp Gly Val 20 Leu Asp His Val Gln 25 <210> 75 <211> 107 <212> PRT <213> Medicago sativa <400> 75 Gln Ala Val Gly Gly Asn Gly Ala Glu Gln Thr Val Val Ser Gly Ser 1 5 10 15 Met Asp Val Leu 20 Arg Pro Cys Trp Ala 25 Val Ala Thr Ser Gly 30 Val Pro Val Arg Glu Gln Leu Phe Asn Val Ser Ile Cys His Tyr Thr His Phe 35 40 45 Asn Leu Phe Gln His Gly Glu Leu Tyr Arg Gly Phe Asn Arg Gly Ser 50 55 60 Asp Met Ser Ser Leu Glu Val Ala Thr Pro Ile Leu Ile Pro Arg Ser 65 70 75 80 Asp Gly His Lys His 85 Arg Lys Gly Ser His 90 Gly Asp Val Ile Phe 95 Leu Thr Asn Arg Gly 100 Glu Val Arg Ser Phe 105 Leu Phe <210> 76 <211> 156 <212> PRT <213> Medicago sativa <400> 76 Gln Ile Thr Ser His Thr Pro Gly Leu His Gly His Asp Ala Val Trp 1 5 10 15 Gln Trp Gln Gln 20 Ser Thr Gly Val Thr 25 Trp Ser Asn Leu Pro 30 Ser Pro Ala Gly Met Met Glu Gly Gly Leu Val Ile Pro Thr Leu Lys Pro Phe 35 40 45 Pro Leu Arg Leu His Asp Asn His Glu Met Ile Leu Ala Ala Gly Glu 50 55 60 Gln Glu Ala Val Val Ile Ser Pro Gly Gly Ser Ile Leu Ala Thr Ile 65 70 75 80 Glu Leu Pro Gly Ser 85 Pro Thr His Val Leu 90 Ile Arg Glu Asp Phe 95 Ser Asn Asp Gly Leu 100 Thr Asp Leu Ile Leu 105 Val Thr Ser Ser Gly 110 Val Tyr Gly Phe Val Gln Thr Arg Gln Pro Gly Ala Leu Phe Phe Ser Val Leu 115 120 125 Ile Gly Cys Leu Ile Val Val Met Gly Ile Ile Phe Val Thr Gln His 130 135 140 Ile Asn Ser Met Lys Gly Lys Pro Arg Pro Ser Ser 145 150 155Leu Ser Gln Leu His Leu Gln Glu Gly Gly Leu His Wing Asp Ile Asn 1 5 10 15 Gly Asp Gly Val 20 Leu Asp His Val Gln 25 <210> 75 <211> 107 <212> PRT <213> Medicago sativa <400 > 75 Gln Wing Val Gly Gly Asn Gly Wing Glu Gln Thr Val Val Gly Ser 1 5 10 15 Met Asp Val Leu 20 Arg Pro Cys Trp Wing 25 Val Wing Thr Ser Gly 30 Val Pro Val Glu Leu Phe Asn Val Ser Ile Cys His Tyr Thr His Phe 35 40 45 Asn Leu Phe Gln His Gly Glu Leu Tyr Arg Gly Phe Asn Arg Gly Ser 50 55 60 Asp Met Be Ser Leu Glu Val Wing Thr Pro Gly His Lys His 85 Arg Lys Gly Be His 90 Gly Asp Val Ile Phe 95 Read Thr Asn Arg Gly 100 Glu Val Arg Be Phe 105 Read Phe <210> 76 <211> 156 <212> PRT <213> Medicago sativa <400 > 76 Gln Ile Thr Be His Thr Pro Gly Read His Gly His Asp Wing Val Trp 1 5 10 15 Gln Trp Gln Gln 20 Be Thr Gly Val Thr 25 Trp Be Asn Leu Pro 30 Be Pro Wing Gly Met Met Glu Gly Gly Leu Val Ile Pro Thr Read Lys Pro Phe 35 40 45 Pro Read Arg Read His Asp Asn His Glu Met Ile Leu Wing Wing Gly Glu 50 55 60 Gln Glu Wing Val Val Ile Ser Pro Gly Gly Ser Ile Leu Wing Thr Ile 65 70 75 80 Glu Leu Pro Gly Ser 85 Pro Thr His Val Leu 90 Ile Arg Glu Asp Phe 95 Ser Asn Asp Gly Leu 100 Thr Asp Leu Ile Leu 105 Val Thr Be Ser Gly 110 Val Tyr Gly Phe Val Gln Thr Arg Gln Pro Gly Wing Leu Phe Phe Ser Val Leu 115 120 125 Ile Gly Cys Leu Ile Val Val Met Gly Ile Ile Phe Val Thr Gln His 130 135 140 Ile Asn Be Met Lys Gly Lys Pro Arg Pro Ser 145 145 155 155

<210> 77<210> 77

<211> 1521<211> 1521

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 77<400> 77

atggccgcca tgatggcgtc cataaccagc gagctgctct tctttctccc cttcatcctc 60atggccgcca tgatggcgtc cataaccagc gagctgctct tctttctccc cttcatcctc 60

cttgccctgc tcacgttcta caccaccacc gtggccaaat gccacggcgg gcactggtgg 120cttgccctgc tcacgttcta caccaccacc gtggccaaat gccacggcgg gcactggtgg 120

cgaggtggga cgacgccggc gaagaggaag cggatgaacc tgccgcccgg cgccgccggg 180cgaggtggga cgacgccggc gaagaggaag cggatgaacc tgccgcccgg cgccgccggg 180

tggccgctcg tcggcgagac gttcggctac ctccgcgccc accccgccac ctccgtcggc 240tggccgctcg tcggcgagac gttcggctac ctccgcgccc accccgccac ctccgtcggc 240

cgcttcatgg agcagcacat cgcacggtac gggaagatat accggtcgag cctgttcggg 300cgcttcatgg agcagcacat cgcacggtac gggaagatat accggtcgag cctgttcggg 300

gagcggacgg tggtgtcggc ggacgcgggg ctcaaccggt acatcctgca gaacgagggg 360gagcggacgg tggtgtcggc ggacgcgggg ctcaaccggt acatcctgca gaacgagggg 360

aggctgttcg agtgcagcta cccgcgcagc atcggcggca tcctgggcaa gtggtccatg 420aggctgttcg agtgcagcta cccgcgcagc atcggcggca tcctgggcaa gtggtccatg 420

ctggtcctcg tcggggaccc gcaccgcgag atgcgcgcca tctccctcaa cttcctctcc 480ctggtcctcg tcggggaccc gcaccgcgag atgcgcgcca tctccctcaa cttcctctcc 480

tccgtccgcc tccgcgccgt cctcctcccc gaggtcgagc gccacaccct cctcgtcctc 540tccgtccgcc tccgcgccgt cctcctcccc gaggtcgagc gccacaccct cctcgtcctc 540

cgcgcctggc ccccttcctc caccttctcc gctcagcacc aagccaagaa gttcacgttc 600cgcgcctggc ccccttcctc caccttctcc gctcagcacc aagccaagaa gttcacgttc 600

aacctgatgg cgaagaacat aatgagcatg gacccggggg aggaagagac ggagcggctg 660 cggcgggagt acatcacctt catgaagggc gtggtctccg cgccgctcaa acgccctact ggaaggctct caagtcgcgt gctgccattc tcggagtaat atggaagagc gggttgagaa gctgagcaag gaggatgcaa gcgtagagca ctcggatggg ctctgaaaca atctaacctt tcaaaagagc aaatcctgga agcttgctct tcgccgggca cgagacgtcg tccatggcgc tcgccctcgc cttgaaggct gccccaaggc tgtccaagaa ctgagggagg agcatcttgg agacaaaggc taagagggga gtgcaaattg agctgggaag actacaaaga acgcaatgtg tcataaacga gacgttgcgg ctaggaaacg tggtcaggtt aaggtcatca aggacgtgca ctacaagggt tatgacattc caagcggatg ccggtgttag ccgcggtgca tctggactcg tccctgtacg aggaccccca ccctggagat ggaagagtag cggatcatcc ggcggcttgg ctcagagcag ccgtacggcg gcgggacgcg gctgtgcgcc gggtcggagc tcgcgaagct gtgttcttgc accacctggt gctcaacttc aggtgggagc tcgccgagcc ttcgtcttcc ccttcgtcga cttccccaag ggccttccca ttagggttca caggatgatg agcaggagta a <210> 78 <211> 505 <212> PRTaacctgatgg cgaagaacat aatgagcatg gacccggggg aggaagagac ggagcggctg 660 cggcgggagt acatcacctt catgaagggc gtggtctccg cgccgctcaa acgccctact ggaaggctct caagtcgcgt gctgccattc tcggagtaat atggaagagc gggttgagaa gctgagcaag gaggatgcaa gcgtagagca ctcggatggg ctctgaaaca atctaacctt tcaaaagagc aaatcctgga agcttgctct tcgccgggca cgagacgtcg tccatggcgc tcgccctcgc cttgaaggct gccccaaggc tgtccaagaa ctgagggagg agcatcttgg agacaaaggc taagagggga gtgcaaattg agctgggaag actacaaaga acgcaatgtg tcataaacga gacgttgcgg ctaggaaacg tggtcaggtt aaggtcatca aggacgtgca ctacaagggt tatgacattc caagcggatg ccggtgttag ccgcggtgca tctggactcg tccctgtacg aggaccccca ccctggagat ggaagagtag cggatcatcc ggcggcttgg ctcagagcag ccgtacggcg gcgggacgcg gctgtgcgcc gggtcggagc tcgcgaagct gtgttcttgc accacctggt gctcaacttc aggtgggagc tcgccgagcc ttcgtcttcc ccttcgtcga cttccccaag ggccttccca ttagggttca caggatgatg the agcaggagta <210> 78 <211> 505 <212> PRT

<213> Oryza sativa <400> 78<213> Oryza sativa <400> 78

Met Ala Ala Met Met Ala Ser Ile Thr Ser Glu Leu Leu 15 10Met Wing Met Wing Met Wing Be Ile Thr Be Glu Leu Leu 15 10

Pro Phe Ile Leu Leu Ala Leu Leu Thr Phe Tyr Thr ThrPro Phe Ile Leu Leu Wing Leu Leu Thr Phe Tyr Thr Thr

20 2520 25

Lys Cys His Gly Gly His Trp Trp Arg Gly Gly Thr ThrLys Cys Gly Gly Gly His Trp Arg Gly Gly Thr Thr

35 40 4535 40 45

Arg Lys Arg Met Asn Leu Pro Pro Gly Ala Ala Gly TrpArg Lys Arg Met Asn Leu Pro Pro Gly Wing Gly Wing Trp

50 55 6050 55 60

Gly Glu Thr Phe Gly Tyr Leu Arg Ala His Pro Ala Thr 65 70 75Gly Glu Thr Phe Gly Tyr Read Arg Wing His Pro Wing Thr 65 70 75

Arg Phe Met Glu Gln His Ile Ala Arg Tyr Gly Lys IleArg Phe Met Glu Gln His Ile Wing Arg Tyr Gly Lys Ile

85 9085 90

Ser Leu Phe Gly Glu Arg Thr Val Val Ser Ala Asp AlaSer Leu Phe Gly Glu Arg Thr Val Val Ser Wing Asp Wing

100 105100 105

Arg Tyr Ile Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys 115 120 125Arg Tyr Ile Read Gln Asn Glu Gly Arg Read Le Phe Glu Cys 115 120 125

Arg Ser Ile Gly Gly Ile Leu Gly Lys Trp Ser Met LeuArg Ser Ile Gly Gly Ile Leu Gly Lys Trp Ser Met Leu

130 135 140130 135 140

Gly Asp Pro His Arg Glu Met Arg Ala Ile Ser Leu Asn 145 150 155Gly Asp Pro His Arg Glu Met Arg Wing Ile Ser Leu Asn 145 150 155

Ser Val Arg Leu Arg Ala Val Leu Leu Pro Glu Val GluSer Val Arg Leu Arg Wing Val Leu Leu Pro Glu Val Glu

165 170165 170

Leu Leu Val Leu Arg Ala Trp Pro Pro Ser Ser Thr PheLeu Leu Val Leu Arg Wing Trp Pro Pro Be Ser Thr Phe

180 185180 185

His Gln Ala Lys Lys Phe Thr Phe Asn Leu Met Ala Lys 195 200 205His Gln Wing Lys Lys Phe Thr Phe Asn Read Met Wing Lys 195 200 205

Ser Met Asp Pro Gly Glu Glu Glu Thr Glu Arg Leu ArgBe Met Asp Pro Gly Glu Glu Glu Thr Glu Arg Read Leu Arg

210 215 220210 215 220

Ile Thr Phe Met Lys Gly Val Val Ser Ala Pro Leu Asn 225 230 235Ile Thr Phe Met Lys Gly Val Val Ser Pro Wing Read Asn 225 230 235

Thr Pro Tyr Trp Lys Ala Leu Lys Ser Arg Ala Ala IleThr Pro Tyr Trp Lys Wing Read Lys Ser Arg Wing Wing Ile

245 250245 250

Ile Glu Arg Lys Met Glu Glu Arg Val Glu Lys Leu SerIle Glu Arg Lys Met Glu Glu Arg Val Glu Lys Leu Ser

260 265260 265

Ala Ser Val Glu Gln Asp Asp Leu Leu Gly Trp Ala Leu 275 280 285Wing Ser Val Glu Gln Asp Asp Leu Leu Gly Trp Wing Leu 275 280 285

Asn Leu Ser Lys Glu Gln Ile Leu Asp Leu Leu Leu SerAsn Leu Ser Lys Glu Gln Ile Leu Asp Leu Leu Ser

290 295 300290 295 300

Ala Gly His Glu Thr Ser Ser Met Ala Leu Ala Leu Ala 305 310 315Wing Gly His Glu Thr Be Being Met Wing Leu Wing Leu Wing 305 310 315

Leu Glu Gly Cys Pro Lys Ala Val Gln Glu Leu Arg GluLeu Glu Gly Cys Pro Lys Wing Val Gln Glu Leu Arg Glu

325 330325 330

Gly Ile Ala Arg Arg Gln Arg Leu Arg Gly Glu Cys LysGly Ile Arg Wing Arg Arg Gln Arg Read Arg Gly Glu Cys Lys

cctgcccggg agagaggaaa agacgatctt cctcttgctg catcttcttc gattgcaagg gatggttttc cctgcaccgg gaagatcctg gcgcttcaat cagcttcatg ggagatggcc ggaccaagcc tagaattgcacctgcccggg agagaggaaa agacgatctt cctcttgctg catcttcttc gattgcaagg gatggttttc cctgcaccgg gaagatcctg gcgcttcaat cagcttcatg ggagatggcc ggaccaagcc tagaattgca

Phe Phe Leu 15Phe Phe Leu 15

Thr Val Ala 30Thr Val Wing 30

Pro Ala LysPro Wing Lys

Pro Leu ValPro Leu Val

Ser Val Gly 80Ser Val Gly 80

Tyr Arg Ser 95Tyr Arg Ser 95

Gly Leu Asn 110Gly Leu Asn 110

Ser Tyr ProBe tyr pro

Val Leu ValVal Leu Val

Phe Leu Ser 160Phe Leu Ser 160

Arg His Thr 175Arg His Thr 175

Ser Ala Gln 190Ser Wing Gln 190

Asn Ile MetAsn Ile Met

Arg Glu TyrArg Glu Tyr

Leu Pro Gly 240Read Pro Gly 240

Leu Gly ValRead Gly Val

255 Lys Glu Asp 270255 Lys Glu Asp 270

Lys Gln SerLys Gln Ser

Leu Leu PheLeu Leu Phe

Ile Phe Phe 320Ile Phe Phe 320

Glu His Leu 335Glu His Leu 335

Leu Ser TrpRead Ser Trp

720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1521 340 345720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1521 340 345

Glu Asp Tyr Lys Glu Met Val Phe Thr Gln CysGlu Asp Tyr Lys Glu Met Val Phe Thr Gln Cys

355 360355 360

Leu Arg Leu Gly Asn Val Val Arg Phe Leu HisLeu Arg Leu Gly Asn Val Val Arg Phe Leu His

370 375370 375

Asp Val His Tyr Lys Gly Tyr Asp Ile Pro Ser 385 390 395Asp Val His Tyr Lys Gly Tyr Asp Ile Pro Ser 385 390 395

Pro Val Leu Ala Ala Val His Leu Asp Ser SerPro Val Leu Wing Wing Val His Leu Asp Ser Ser

405 410405 410

Gln Arg Phe Asn Pro Trp Arg Trp Lys Ser SerGln Arg Phe Asn Pro Trp Arg Trp Lys Ser Ser

420 425420 425

Leu Ala Gln Ser Ser Ser Phe Met Pro Tyr GlyRead Wing Gln Ser Ser Ser Phe Met Pro Tyr Gly

435 440435 440

Cys Ala Gly Ser Glu Leu Ala Lys Leu Glu MetCys Wing Gly Ser Glu Leu Wing Lys Leu Glu Met

450 455450 455

His Leu Val Leu Asn Phe Arg Trp Glu Leu Ala 465 470 475His Leu Val Leu Asn Phe Arg Trp Glu Leu Wing 465 470 475

Phe Val Phe Pro Phe Val Asp Phe Pro Lys GlyPhe Val Phe Pro Phe Val Asp Phe Pro Lys Gly

485 490485 490

His Arg Ile Ala Gln Asp Asp Glu Gln 500 505His Arg Ile Wing Gln Asp Asp Glu Gln 500 505

<210> 79 <211> 1542 <212> DNA<210> 79 <211> 1542 <212> DNA

<213> Arabidopsis thaliana <400> 79<213> Arabidopsis thaliana <400> 79

atgttcgaaa cagagcatca tactctctta cctcttcttc cttcttctct tcttgattct cttgaagaga agaaatagaa ccgggtaaat ccggttggcc atttcttggt gaaaccatcg gccacaacac tcggtgactt catgcaacaa catgtctcca tcgaacttgt ttggagaacc aacgatcgta tcagctgatg ttacaaaacg aaggaaggct ctttgaatgt agttatccta gggaaatggt cgatgcttgt tcttgttggt gacatgcata cttaacttct taagtcacgc acgtcttaga actattctac actttgtttg ttcttgattc ttggcaacaa aactctattt aaaaagttta cgtttaatct aatggcgaag catataatga gaaacagagc aattaaagaa agagtatgta actttcatga ctaaatctac caggaactgc ttatcataaa gctcttcagt ttcattgaga ggaaaatgga agagagaaaa ttggatatca gaagaagtga aaacagagga tgaagcagag atgagtaaga agaacagacg atgatctttt gggatgggtt ttgaaacatt attctcgatc tcattcttag tttgttattt gccggacatg gctctcgcta tcttcttctt gcaagcttgc cctaaagccg catcttgaga tcgcgagggc caagaaggaa ctaggagagt tacaagaaaa tggactttac tcaatgtgtt ataaatgaaa gttaggtttt tgcatcgcaa agcactcaaa gatgttcggt agtgggtgga aagtgttacc ggtgatctca gccgtacatt caacctaatc tctttaatcc ttggagatgg caacagcaaa ggaagtggta gtttttcgac gtggggaaac aactacatgc ctatgtgctg gttcagagct agccaagtta gaaatggcag cttaaattca attgggaatt agcagaagat gatcaaccat tttcctaacg gtttgcctat tagggtttct cgtattctgt <210> 80 <211> 513 <212> PRTatgttcgaaa cagagcatca tactctctta cctcttcttc cttcttctct tcttgattct cttgaagaga agaaatagaa ccgggtaaat ccggttggcc atttcttggt gaaaccatcg gccacaacac tcggtgactt catgcaacaa catgtctcca tcgaacttgt ttggagaacc aacgatcgta tcagctgatg ttacaaaacg aaggaaggct ctttgaatgt agttatccta gggaaatggt cgatgcttgt tcttgttggt gacatgcata cttaacttct taagtcacgc acgtcttaga actattctac actttgtttg ttcttgattc ttggcaacaa aactctattt aaaaagttta cgtttaatct aatggcgaag catataatga gaaacagagc aattaaagaa agagtatgta actttcatga ctaaatctac caggaactgc ttatcataaa gctcttcagt ttcattgaga ggaaaatgga agagagaaaa ttggatatca gaagaagtga aaacagagga tgaagcagag atgagtaaga agaacagacg atgatctttt gggatgggtt ttgaaacatt attctcgatc tcattcttag tttgttattt gccggacatg gctctcgcta tcttcttctt gcaagcttgc cctaaagccg catcttgaga tcgcgagggc caagaaggaa ctaggagagt tacaagaaaa tggactttac tcaatgtgtt ataaatgaaa gttaggtttt tgcatcgcaa agcactcaaa gatgttcggt agtgggtgga aagtgttacc ggtgatctca gccgtacatt caacctaatc tctttaatcc ttggagatgg caacagcaaa ggaagtggta gtttttcgac gtggggaaac aactacatgc ctatgtgctg gttcagagct agccaagtta gaaatggcag cttaaattca attgggaatt agcagaagat gatcaaccat tttcctaacg gtttgcctat tagggtttct cgtattctgt <210> 80 <211> 513 <212>

<213> Arabidopsis thaliana <400> 80<213> Arabidopsis thaliana <400> 80

Met Phe Glu Thr Glu His His Thr Leu Leu Pro 1 5 10Met Phe Glu Thr Glu His His Leu Leu Pro 1 5 10

Ser Leu Leu Ser Leu Leu Leu Phe Leu Ile LeuSer Leu Leu Ser Leu Leu Leu Phe Leu Ile Leu

20 2520 25

Arg Lys Thr Arg Phe Asn Leu Pro Pro Gly Lys 35 40Arg Lys Thr Arg Phe Asn Pro Le Pro Gly Lys 35 40

350 Val Ile Asn Glu Thr 365 Arg Lys Val Ile Lys 380 Gly Trp Lys Ile Leu 400 Leu Tyr Glu Asp Pro 415 Gly Ser Ser Gly Gly 430 Gly Gly Thr Arg Leu 445 Ala Val Phe Leu His 460 Glu Pro Asp Gln Ala 480 Leu Pro Ile Arg Val350 Val Ile Asn Glu Thr 365 Arg Lys Val Ile Lys 380 Gly Trp Lys Ile Leu 400 Leu Tyr Glu Asp Pro 415 Gly Ser Ser Gly Gly 430 Gly Gly Thr Arg Leu 445 Wing Val Phe Leu His 460 Glu Pro Asp Gln Wing 480 Leu For Ile Arg Val

495495

ttctcccatc aaaccagatt gttatcttaa agtatggtaa ctggacttaa gaagtatagg gagatatgag ttaaagatgt tctctgctca gtatggatcc aaggagttgt cacgagcaac aggaagaaga gtgatcatgt cgaatttatc agacttcttc ttgaagagct cagaattaaa ctcttcgatt acaaaggata tggataattc acaacggagc cgtttggagg tgtttattca ttgcttttcc aattctcccatc aaaccagatt gttatcttaa agtatggtaa ctggacttaa gaagtatagg gagatatgag ttaaagatgt tctctgctca gtatggatcc aaggagttgt cacgagcaac aggaagaaga gtgatcatgt cgaatttatc agacttcttc ttgaagagct cagaattaaa ctcttcgatt acaaaggata tggataattc acaacggagc cgtttggagg tgtttattca aa ttgcttttcc

gcttttgtct caatctacct accgtacacc gatatataga tagattcata tgggattctt aagtatctcg tgagagacat agacgaggcc tggagaagaa ctctgctcct gatattgaag tcaagaagaa taggaaacaa gacggagcaa tgtagccatt tagggaagag ttgggatgat gggaaatgta cgatatccct tcgttatgac gtcatcgtca agggccaagg tcatctagtt ttttgttgatgcttttgtct caatctacct accgtacacc gatatataga tagattcata tgggattctt aagtatctcg tgagagacat agacgaggcc tggagaagaa ctctgctcct gatattgaag tcaagaagaa taggaaacaa gacggagcaa tgtagccatt tagggaagag ttgggatgat gggaaatgta cgatatccct tcgttatgac gtcatcgtca agggccaagg tcatctagtt ttttgttgat

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 154260 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1542

Leu Leu Leu Leu Pro 15Leu Leu Leu Leu Pro 15

Leu Lys Arg Arg Asn 30Read Lys Arg Arg Asn 30

Ser Gly Trp Pro Phe 45 Leu Gly Glu Thr Ile Gly Tyr Leu Lys Pro Tyr Thr Ala Thr Thr LeuSer Gly Trp Pro Phe 45 Leu Gly Glu Thr Ile Gly Tyr Leu Lys Pro Tyr Thr Wing Thr Thr Leu

50 55 6050 55 60

Gly Asp Phe Met Gln Gln His Val Ser Lys Tyr Gly Lys Ile Tyr Arg 65 70 75 80Gly Asp Phe Met Gln Gln His Val Being Lys Tyr Gly Lys Ile Tyr Arg 65 70 75 80

Ser Asn Leu Phe Gly Glu Pro Thr Ile Val Ser Ala Asp Ala Gly LeuSer Asn Leu Phe Gly Glu Pro Thr Ile Val Ser As Asa Wing Gly Leu

85 90 9585 90 95

Asn Arg Phe Ile Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser TyrAsn Arg Phe Ile Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr

100 105 110100 105 110

Pro Arg Ser Ile Gly Gly Ile Leu Gly Lys Trp Ser Met Leu Val LeuPro Arg Be Ile Gly Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu

115 120 125115 120 125

Val Gly Asp Met His Arg Asp Met Arg Ser Ile Ser Leu Asn Phe LeuVal Gly Asp Met His Arg Asp Met Arg Ser Ile Ser Leu Asn Phe Leu

130 135 140130 135 140

Ser His Ala Arg Leu Arg Thr Ile Leu Leu Lys Asp Val Glu Arg His 145 150 155 160Be His Wing Arg Leu Arg Thr Ile Leu Read Lys Asp Val Glu Arg His 145 150 155 160

Thr Leu Phe Val Leu Asp Ser Trp Gln Gln Asn Ser Ile Phe Ser AlaThr Leu Phe Val Leu Asp Ser Trp Gln Gln Asn Ser Ile Phe Ser Ala

165 170 175165 170 175

Gln Asp Glu Ala Lys Lys Phe Thr Phe Asn Leu Met Ala Lys His IleGln Asp Glu Wing Lys Lys Phe Thr Phe Asn Leu Met Wing Lys His Ile

180 185 190180 185 190

Met Ser Met Asp Pro Gly Glu Glu Glu Thr Glu Gln Leu Lys Lys GluMet Ser Met Asp Pro Gly Glu Glu Glu Thr Glu Glu Leu Lys Lys Glu

195 200 205195 200 205

Tyr Val Thr Phe Met Lys Gly Val Val Ser Ala Pro Leu Asn Leu ProTyr Val Thr Phe Met Lys Gly Val Val Ser Wing Pro Leu Asn Leu Pro

210 215 220210 215 220

Gly Thr Ala Tyr His Lys Ala Leu Gln Ser Arg Ala Thr Ile Leu Lys 225 230 235 240Gly Thr Wing Tyr His Lys Wing Read Gln Be Arg Wing Thr Ile Read Lys 225 230 235 240

Phe Ile Glu Arg Lys Met Glu Glu Arg Lys Leu Asp Ile Lys Glu GluPhe Ile Glu Arg Lys Met Glu Glu Arg Lys Read Asp Ile Lys Glu Glu

245 250 255245 250 255

Asp Gln Glu Glu Glu Glu Val Lys Thr Glu Asp Glu Ala Glu Met SerAsp Gln Glu Glu Glu Glu Val Lys Thr Glu Asp Glu Wing Glu Met Ser

260 265 270260 265 270

Lys Ser Asp His Val Arg Lys Gln Arg Thr Asp Asp Asp Leu Leu GlyLys Be Asp His Val Arg Lys Gln Arg Thr Asp Asp Asp Read Leu Gly

275 280 285275 280 285

Trp Val Leu Lys His Ser Asn Leu Ser Thr Glu Gln Ile Leu Asp LeuVal Leu Trp His Lys Be Asn Leu Be Thr Glu Gln Ile Leu Asp Leu

290 295 300290 295 300

Ile Leu Ser Leu Leu Phe Ala Gly His Glu Thr Ser Ser Val Ala Ile 305 310 315 320Ile Leu Be Leu Leu Phe Ala Gly His Glu Thr Be Val Ala Ile 305 310 315 320

Ala Leu Ala Ile Phe Phe Leu Gln Ala Cys Pro Lys Ala Val Glu GluWing Leu Wing Ile Phe Phe Leu Gln Wing Cys Pro Lys Wing Val Glu Glu

325 330 335325 330 335

Leu Arg Glu Glu His Leu Glu Ile Ala Arg Ala Lys Lys Glu Leu GlyLeu Arg Glu Glu His Leu Glu Ile Wing Arg Wing Lys Lys Glu Leu Gly

340 345 350340 345 350

Glu Ser Glu Leu Asn Trp Asp Asp Tyr Lys Lys Met Asp Phe Thr GlnGlu Ser Glu Read Asn Trp Asp Asp Tyr Lys Lys Met Asp Phe Thr Gln

355 360 365355 360 365

Cys Val Ile Asn Glu Thr Leu Arg Leu Gly Asn Val Val Arg Phe LeuCys Val Ile Asn Glu Thr Leu Arg Leu Gly Asn Val Val Arg Phe Leu

370 375 380370 375 380

His Arg Lys Ala Leu Lys Asp Val Arg Tyr Lys Gly Tyr Asp Ile Pro 385 390 395 400His Arg Lys Wing Read Lys Asp Val Arg Tyr Lys Gly Tyr Asp Ile Pro 385 390 395 400

Ser Gly Trp Lys Val Leu Pro Val Ile Ser Ala Val His Leu Asp AsnSer Gly Trp Lys Val Leu Pro Val Ile Ser Wing Val His Leu Asp Asn

405 410 415405 410 415

Ser Arg Tyr Asp Gln Pro Asn Leu Phe Asn Pro Trp Arg Trp Gln GlnBe Arg Tyr Asp Gln Pro Asn Read Phe Asn Pro Trp Arg Trp Gln Gln

420 425 430420 425 430

Gln Asn Asn Gly Ala Ser Ser Ser Gly Ser Gly Ser Phe Ser Thr TrpGln Asn Asn Gly Wing Be Be Be Gly Be Gly Be Phe Be Thr Trp

435 440 445435 440 445

Gly Asn Asn Tyr Met Pro Phe Gly Gly Gly Pro Arg Leu Cys Ala GlyGly Asn Asn Tyr Met Pro Phe Gly Gly Gly Gly Pro Arg Read Cys Wing Gly

450 455 460450 455 460

Ser Glu Leu Ala Lys Leu Glu Met Ala Val Phe Ile His His Leu Val 465 470 475 480Ser Glu Leu Wing Lys Leu Glu Met Wing Val Phe Ile His His Leu Val 465 470 475 480

Leu Lys Phe Asn Trp Glu Leu Ala Glu Asp Asp Gln Pro Phe Ala PheLeu Lys Phe Asn Trp Glu Leu Wing Glu Asp Asp Gln Pro Phe Ala Phe

485 490 495485 490 495

Pro Phe Val Asp Phe Pro Asn Gly Leu Pro Ile Arg Val Ser Arg Ile 500 505 510Pro Phe Val Asp Phe Pro Asn Gly Leu Pro Ile Arg Val Ser Arg Ile 500 505 510

LeuRead

<210> 81<210> 81

<211> 1590<211> 1590

<212> DNA<212> DNA

<213> Saccharum officinarum <220><213> Saccharum officinarum <220>

<221> misc_feature <222> (394) .. (394) <223> η is a, c, g, ou t <400> 81<221> misc_feature <222> (394) .. (394) <223> η is a, c, g, or t <400> 81

atgggcgcca tgatggcctc ctggccctcc tcgccctgta cgccggccga agaagaagcgatgggcgcca tgatggcctc ctggccctcc tcgccctgta cgccggccga agaagaagcg

ggcgagacct cagcatgtcg gtgtcggcgg tgcagctacc ggcgacgcgc cgcgccgtgc ccctccgacg gcgaagaaca tacatcacct tggaaggcgc aggcttcaga gccctgaagc ttcgccgggc tgccccaagg ctaagagggg tgtataaacg caagatgtgc gcggcggtgc tggaagagca gggtcggagc cggtgggagc ggcctcccga cgagaagcac gagggaattg <210> 82ggcgagacct cagcatgtcg gtgtcggcgg tgcagctacc ggcgacgcgc cgcgccgtgc ccctccgacg gcgaagaaca tacatcacct tggaaggcgc aggcttcaga gccctgaagc ttcgccgggc tgccccaagg ctaagagggg tgtataaacg caagatgtgc gcggcggtgc tggaagagca gggtcggagc cggtgggagc ggcctcccga cgagaagcac gagggaattg <210> 82

tcggctacct cacggtacgg acgcggggct cgcgcagcat accgcgagat tgctcccgga gcacggtctc taatgagcattcggctacct cacggtacgg acgcggggct cgcgcagcat accgcgagat tgctcccgga gcacggtctc taatgagcat

cataaccagc gagctcctct tcttccttcc cttcatcctg caccaccact gtcgccaaat gcgacggcac ccaccagtgg gccgaacctg cccccgggcg ccctcggatg gcctttcgtc ccgcgcccac ccggccacct ccgtgggcct cttcatggag caagatatac cggtcgagcc tgttcgggga gcggacggtg caaccgctac atcctgcaga acgaggggcg gctgttcgag cggcggcatc ctgngcaagt ggtccatgct ggtgctggtg gcgcgccatc tcgctcaact ttctcagctc ggtggagcgc cacaccctgc tggtgctccg cgcgcagcac caagccaaga agttcacgttcataaccagc gagctcctct tcttccttcc cttcatcctg caccaccact gtcgccaaat gcgacggcac ccaccagtgg gccgaacctg cccccgggcg ccctcggatg gcctttcgtc ccgcgcccac ccggccacct ccgtgggcct cttcatggag caagatatac cggtcgagcc tgttcgggga gcggacggtg caaccgctac atcctgcaga acgaggggcg gctgttcgag cggcggcatc ctgngcaagt ggtccatgct ggtgctggtg gcgcgccatc tcgctcaact ttctcagctc ggtggagcgc cacaccctgc tggtgctccg cgcgcagcac caagccaaga agttcacgtt

ggaccccggc gaggaggaga cggagcggctggaccccggc gaggaggaga cggagcggct

tcatgaaggg cgtcgtgtca gcgccgctca acttcccggg tcaagtcacg cgcgtccata cttggagtaa tagagaggaa aaatgagtaa ggagaactca agtgtggagg aagacgatcttcatgaaggg cgtcgtgtca gcgccgctca acttcccggg tcaagtcacg cgcgtccata cttggagtaa tagagaggaa aaatgagtaa ggagaactca agtgtggagg aagacgatct

agtccaatct gtcaaaggaa acgagacttc gtcaatggcgagtccaatct gtcaaaggaa acgagacttc gtcaatggcg

cagatcctgg acctcttgct ctagccctcg ccatcttcttcagatcctgg acctcttgct ctagccctcg ccatcttctt

cgtccgcctc ctcatggccg taacctgatg gcggctggag cacggcctac gatggaggac tcttggatgg gagcctgctc ccttgaaggacgtccgcctc ctcatggccg taacctgatg gcggctggag cacggcctac gatggaggac tcttggatgg gagcctgctc ccttgaagga

ctgttcaaga actccgggag gagcatctcg agattgctag gagacaaagg cgttcaaatt gagctgggaa gactacaagg aaatggtttt cacgccatgg agacattgcg ggttggcaac gtggtcaggt tcctgcaccg gaaggtcatcctgttcaaga actccgggag gagcatctcg agattgctag gagacaaagg cgttcaaatt gagctgggaa gactacaagg aaatggtttt cacgccatgg agacattgcg ggttggcaac gtggtcaggt tcctgcaccg gaagggcat

actacaatgg gtacgacata atctggattc gtcgctgtacactacaatgg gtacgacata atctggattc gtcgctgtac

ccacgcgggt ggaaaatcct gccggtgtta aaggacccct accggttcaa cccttggagaccacgcgggt ggaaaatcct gccggtgtta aaggacccct accggttcaa cccttggaga

acgcgccgag cagcttcatg ccgtacggcg gcgggccgcg gctgtgcgccacgcgccgag cagcttcatg ccgtacggcg gcgggccgcg gctgtgcgcc

tggccaagct ggagatcgcc tggcggagcc ggaccaagcc tcagggtcca gcggatcgcc gatgtagcgg tacgggtaca gggctgggtg gttatggtaatggccaagct ggagatcgcc tggcggagcc ggaccaagcc tcagggtcca gcggatcgcc gatgtagcgg tacgggtaca gggctgggtg gttatggtaa

atcttcctgc accacctggt gctcaacttc ttcgtctacc ccttcgtcga cttccccaag gacgaccagg gggcatcgca gcgttttgac caagcaagta caaaattttc gttgcattttatcttcctgc accacctggt gctcaacttc ttcgtctacc ccttcgtcga cttccccaag gacgaccagg gggcatcgca gcgttttgac caagcaagta caaaattttc gttgcatttt

<211> <212> <213> <220> <221> <222><211> <212> <213> <220> <221> <222>

529 PRT529 PRT

Saccharum officinarumSaccharum officinarum

INSEGURO (132)..(132)INSECURE (132) .. (132)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 82<223> Xaa can be any naturally occurring amino acid <400> 82

Ser Ile ThrTo be Ile Thr

Met 1Met 1

Gly AlaGly Wing

Met Met 5Met Met 5

AlaAllah

Ser Glu Leu Leu 10Ser Glu Leu Leu 10

PhePhe

Phe 15Phe 15

LeuRead

Pro Phe Ile Leu 20 Leu Ala Leu Leu Ala 25 Leu Tyr Thr Thr Thr 30 Val Ala Lys Cys Asp 35 Gly Thr His Gln Trp 40 Arg Arg Pro Lys Lys 45 Lys Arg Pro Asn Leu 50 Pro Pro Gly Ala Leu 55 Gly Trp Pro Phe Val 60 Gly Glu Thr Phe Gly Tyr Leu Arg Ala His Pro Ala Thr Ser Val Gly Leu Phe Met Glu 65 70 75 80 Gln His Val Ala Arg 85 Tyr Gly Lys Ile Tyr 90 Arg Ser Ser Leu Phe 95 Gly Glu Arg Thr Val 100 Val Ser Ala Asp Ala 105 Gly Leu Asn Arg Tyr 110 Ile Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg Ser Ile Gly 115 120 125 Gly Ile 130 Leu Xaa Lys Trp Ser 135 Met Leu Val Leu Val 140 Gly Asp Ala His Arg Glu Met Arg Ala Ile Ser Leu Asn Phe Leu Ser Ser Val Arg Leu 145 150 155 160 Arg Ala Val Leu Leu 165 Pro Glu Val Glu Arg 170 His Thr Leu Leu Val 175 LeuPro Phe Ile Leu 20 Leu Wing Leu Leu Wing 25 Leu Tyr Thr Thr Thr 30 Val Wing Lys Cys Asp 35 Gly Thr His Gln Trp 40 Arg Arg Lys Lys 45 Lys Arg Pro Asn Leu 50 Pro Gly Wing Leu 55 Gly Trp Pro Phe Val 60 Gly Glu Thr Phe Gly Tyr Leu Arg Wing His Pro Pro Wing Thr Be Val Gly Leu Phe Met Glu 65 70 75 80 Gln His Val Wing Arg 85 Tyr Gly Lys Ile Tyr 90 Arg Be Being Read Le Phe 95 Gly Glu Arg Thr Val 100 Val Ser Wing Asp Wing 105 Gly Leu Asn Arg Tyr 110 Ile Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg Ser Ile Gly 115 120 125 Gly Ile 130 Leu Xaa Lys Trp Ser 135 Met Leu Val Leu Val 140 Gly Asp Wing His Arg Glu Met Arg Wing Ile Be Leu Asn Phe Leu Be Ser Val Arg Leu 145 150 155 160 Arg Wing Val Leu Leu 165 Pro Glu Val Glu Arg 170 His Thr Leu Leu Val 175 Leu

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1590 Arg Ser Trp Pro Pro Ser Asp Gly Thr Val Ser Ala Gln His Gln Ala 180 185 190 Lys Lys Phe Thr Phe Asn Leu Met Ala Lys Asn Ile Met Ser Met Asp 195 200 205 Pro Gly Glu Glu Glu Thr Glu Arg Leu Arg Leu Glu Tyr Ile Thr Phe 210 215 220 Met Lys Gly Val Val Ser Ala Pro Leu Asn Phe Pro Gly Thr Ala Tyr 225 230 235 240 Trp Lys Ala Leu Lys Ser Arg Ala Ser Ile Leu Gly Val Ile Glu Arg 245 250 255 Lys Met Glu Asp Arg Leu Gln Lys Met Ser Lys Glu Asn Ser Ser Val 260 265 270 Glu Glu Asp Asp Leu Leu Gly Trp Ala Leu Lys Gln Ser Asn Leu Ser 275 280 285 Lys Glu Gln Ile Leu Asp Leu Leu Leu Ser Leu Leu Phe Ala Gly His 290 295 300 Glu Thr Ser Ser Met Ala Leu Ala Leu Ala Ile Phe Phe Leu Glu Gly 305 310 315 320 Cys Pro Lys Ala Val Gln Glu Leu Arg Glu Glu His Leu Glu Ile Ala 325 330 335 Arg Arg Gln Arg Leu Arg Gly Ala Phe Lys Leu Ser Trp Glu Asp Tyr 340 345 350 Lys Glu Met Val Phe Thr Pro Trp Cys Ile Asn Glu Thr Leu Arg Val 355 360 365 Gly Asn Val Val Arg Phe Leu His Arg Lys Val Ile Gln Asp Val His 370 375 380 Tyr Asn Gly Tyr Asp Ile Pro Arg Gly Trp Lys Ile Leu Pro Val Leu 385 390 395 400 Ala Ala Val His Leu Asp Ser Ser Leu Tyr Lys Asp Pro Tyr Arg Phe 405 410 415 Asn Pro Trp Arg Trp Lys Ser Asn Ala Pro Ser Ser Phe Met Pro Tyr 420 425 430 Gly Gly Gly Pro Arg Leu Cys Ala Gly Ser Glu Leu Ala Lys Leu Glu 435 440 445 Ile Ala Ile Phe Leu His His Leu Val Leu Asn Phe Arg Trp Glu Leu 450 455 460 Ala Glu Pro Asp Gln Ala Phe Val Tyr Pro Phe Val Asp Phe Pro Lys 465 470 475 480 Gly Leu Pro Ile Arg Val Gln Arg Ile Ala Asp Asp Gln Gly Ala Ser 485 490 495 Gln Arg Phe Asp Arg Glu Ala Arg Cys Ser Gly Thr Gly Thr Gln Ala 500 505 510 Ser Thr Lys Phe Ser Leu His Phe Glu Gly Ile Gly Ala Gly Trp Leu 515 520 525 Trp60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1590 Arg Be Trp Pro Pro Be Asp Gly Thr Val Be Wing Gln His Gln Wing 180 185 190 Lys Lys Phe Thr Phe Asn Leu Met Ala Lys Asn Ile Met Being Met Asp 195 200 205 Pro Gly Glu Glu Glu Thr Glu Arg Leu Arg Leu Glu Tyr Ile Thr Phe 210 215 220 Met Lys Gly Val Val Sera Pro Leu Asn Phe Pro Gly Thr Ala Tyr 225 230 235 240 Trp Lys Wing Leu Lys Be Arg Wing Be Ile Leu Gly Val Ile Glu Arg 245 250 255 Lys Met Glu Asp Arg Leu Gln Lys Met Be Lys Glu Asn Be Ser Val 260 265 270 Glu Glu Asp Asp Leu Gly Trp Wing Leu Lys Gln Ser Asn Leu Ser 275 280 285 Lys Glu Gln Ile Leu Asp Leu Leu Read Leu Leu Phe Wing Gly His 290 295 300 Glu Thr Be Met Wing Leu Wing Alle Ile Phe Phe Leu Glu Gly 305 310 315 320 Cys Pro Lys Val Wing Glu Glu Read Le Arg Glu Glu 330 335 Arg Arg Gln Arg Read Arg Gly Ala Phe Lys Read Ser Trp Glu Asp Tyr 340 345 350 Lys Glu Met Val Phe Thr Pro Cp Ile Asn Glu Thr Leu Arg Val 355 360 365 Gly Asn Val Val Arg Phe Read His Arg Lys Val Ile Gln Asp Val His 370 375 380 Tyr Asn Gly Tyr Asp Ile Pro Arg Gly Trp Lys Ile Leu Pro Val Leu 385 390 395 400 Wing Ala Val His Leu Asp Ser Be Leu Tyr Lys Asp Pro Tyr Arg Phe 405 410 415 Asn Pro Trp Arg Trp Lys Be Asn Wing Pro Be Ser Phe Met Pro Tyr 420 425 430 Gly Gly Gly Pro Arg Leu Cys Wing Gly Be Glu Leu Wing Lys Leu Glu 435 440 445 Ile Wing Ile Phe Read His His Leu Val Leu Asn Phe Arg Trp Glu Leu 450 455 460 Wing Glu Pro Asp Gln Wing Phe Val Tyr Pro Phe Val Asp Phe Pro Lys 465 470 475 480 Gly Leu Pro Ile Arg Val Gln Arg Ile Wing Asp Gln Gly Wing Ser 485 490 495 Gln Arg Phe Asp Arg Glu Wing Arg Cys Ser Gly Thr Gly Thr Gln Wing 500 505 510 Be Thr Lys Phe Be Read His Phe Glu Gly Ile Gly Wing Gly Trp Leu 515 520 525 Trp

<210> 83 <211> 1437 <212> DNA <213> Allium cepa <400> 83<210> 83 <211> 1437 <212> DNA <213> Allium strains <400> 83

atggagatca tattagtgtc tacattgatc atatcgctac taatatttct tggatttaga 60atggagatca tattagtgtc tacattgatc atatcgctac taatatttct tggatttaga 60

agcaatggga aaacggagag aaaattgctg cctacactac caccaggcaa tcttggaggt 120agcaatggga aaacggagag aaaattgctg cctacactac caccaggcaa tcttggaggt 120

tggccattca tcggtgacac cattccgttc atgacacctc attcttctgc tttgttgggc 180tggccattca tcggtgacac cattccgttc atgacacctc attcttctgc tttgttgggc 180

acttacatcg atcaaaatat ttccaaatat gggaggatat ttcgaatgaa cttgttagga 240acttacatcg atcaaaatat ttccaaatat gggaggatat ttcgaatgaa cttgttagga 240

aaggcaacga tcgtgtctgt agaccctgat ttcaacagat atattctaca gaatgaagga 300aaggcaacga tcgtgtctgt agaccctgat ttcaacagat atattctaca gaatgaagga 300

agattgtttg aaaatagctg cccaacgagc attaaagaga ttttgggaaa atggtctatg 360agattgtttg aaaatagctg cccaacgagc attaaagaga ttttgggaaa atggtctatg 360

cttgcattag ctggggatat acacagagaa atgagatcca ttgctgtgaa tttcatgaac 420cttgcattag ctggggatat acacagagaa atgagatcca ttgctgtgaa tttcatgaac 420

agtgttaagc ttagaactta ttttttaaag gatattgata ttcaggctgt taatattctt 480agtgttaagc ttagaactta ttttttaaag gatattgata ttcaggctgt taatattctt 480

gatgcttgga aggtcaactc tactttctct gcacaggatg aaggaaagaa gtttgcattt 540gatgcttgga aggtcaactc tactttctct gcacaggatg aaggaaagaa gtttgcattt 540

aacctcatgg tgaagcatct aatgaatatg gatcctggaa tgccagagac agaagaaatc 600aacctcatgg tgaagcatct aatgaatatg gatcctggaa tgccagagac agaagaaatc 600

agaaaagagt acattttctt catggagggg atggcttcca ttcctttaaa ctttcctgga 660agaaaagagt acattttctt catggagggg atggcttcca ttcctttaaa ctttcctgga 660

acagcctaca gaagagcttt acagtcaagg tccaggattc tggcaataat ggggcaaaag 720acagcctaca gaagagcttt acagtcaagg tccaggattc tggcaataat ggggcaaaag 720

cttgacgaaa ggatgcagaa aataaaagaa ggctgtaaag gactggaaga agaggatctt 780 cttgcctcag ttgcaagaaa tactaacata acaagagacc agattcttga tttgatgatc 840 agcatgcttt ttgctggtca tgaaacttct tctgccgcta tttctcttgc catttatttc 900 ctgcaagctt cccccgatgt tcttaaaaag cttcgagagg agcacataaa gattgcaaaa 960 caaaagaaag aaaggggcga aactgaattg aactgggatg attacaagca aatggaattc 1020 acaaactgcg ttattcatga aaccctaaga ttaggcaaca tcgttaagtt tttgcatcgg 1080 aaaaccatca aagatgttca atacaaaggt tatgaaattc catgtgggtg ggaagtagtg 1140 ccaatcatct cagcagcaca tttggattct tctatctttg acaacccaaa agttatgaat 1200 ccttcgaggt gggaggcgat attttcagca ggagcaaaga gcaatataat gtcattcagc 1260 ggtggacctc ggttatgtcc aggagcagag ttggcgaaac tggagatggc tatttttctt 1320 catcatcttg tacagaggtt cgactgggaa ttggtggaga aggataaccc tgtatcattc 1380 cccttccttg gatttcccaa gaaattgcct atcaaaatca cagctcttaa acattga 1437cttgacgaaa ggatgcagaa aataaaagaa ggctgtaaag gactggaaga agaggatctt 780 cttgcctcag ttgcaagaaa tactaacata acaagagacc agattcttga tttgatgatc 840 agcatgcttt ttgctggtca tgaaacttct tctgccgcta tttctcttgc catttatttc 900 ctgcaagctt cccccgatgt tcttaaaaag cttcgagagg agcacataaa gattgcaaaa 960 caaaagaaag aaaggggcga aactgaattg aactgggatg attacaagca aatggaattc 1020 acaaactgcg ttattcatga aaccctaaga ttaggcaaca tcgttaagtt tttgcatcgg 1080 aaaaccatca aagatgttca atacaaaggt tatgaaattc catgtgggtg ggaagtagtg 1140 ccaatcatct cagcagcaca tttggattct tctatctttg acaacccaaa agttatgaat 1200 ccttcgaggt gggaggcgat attttcagca ggagcaaaga gcaatataat gtcattcagc 1260 ggtggacctc ggttatgtcc aggagcagag ttggcgaaac tggagatggc tatttttctt 1320 catcatcttg tacagaggtt cgactgggaa ttggtggaga aggataaccc tgtatcattc 1380 cccttccttg gatttcccaa gaaattgcct atcaaaatca cagctcttaa 1437 acattga

<210> 84 <211> 478 <212> PRT <213> Allium cepa <400> 84<210> 84 <211> 478 <212> PRT <213> Allium cepa <400> 84

Met Glu Ile Ile Leu Val Ser Thr Leu Ile Ile Ser Leu Leu Ile Phe 1 5 10 15Met Glu Ile Ile Leu Val Ser Thr Leu Ile Ile Ser Leu Leu Ile Phe 1 5 10 15

Leu Gly Phe Arg Ser Asn Gly Lys Thr Glu Arg Lys Leu Leu Pro ThrRead Gly Phe Arg Be Asn Gly Lys Thr Glu Arg Lys Read Leu Pro Thr

20 25 3020 25 30

Leu Pro Pro Gly Asn Leu Gly Gly Trp Pro Phe Ile Gly Asp Thr IleLeu Pro Gly Asn Leu Pro Gly Gly Trp Pro Phe Ile Gly Asp Thr Ile

35 40 4535 40 45

Pro Phe Met Thr Pro His Ser Ser Ala Leu Leu Gly Thr Tyr Ile AspPro Phe Met Thr Pro His Being Ala Read Leu Gly Thr Tyr Ile Asp

50 55 6050 55 60

Gln Asn Ile Ser Lys Tyr Gly Arg Ile Phe Arg Met Asn Leu Leu Gly 65 70 75 80Gln Asn Ile Be Lys Tyr Gly Arg Ile Phe Arg Met Asn Read Leu Gly 65 70 75 80

Lys Ala Thr Ile Val Ser Val Asp Pro Asp Phe Asn Arg Tyr Ile LeuLys Wing Thr Ile Val Ser Val Asp Pro Asp Phe Asn Arg Tyr Ile Leu

85 90 9585 90 95

Gln Asn Glu Gly Arg Leu Phe Glu Asn Ser Cys Pro Thr Ser Ile LysGln Asn Glu Gly Arg Read Le Phe Glu Asn Be Cys Pro Thr Be Ile Lys

100 105 110100 105 110

Glu Ile Leu Gly Lys Trp Ser Met Leu Ala Leu Ala Gly Asp Ile HisGlu Ile Leu Gly Lys Trp Ser Met Leu Wing Leu Wing Gly Asp Ile His

115 120 125115 120 125

Arg Glu Met Arg Ser Ile Ala Val Asn Phe Met Asn Ser Val Lys LeuArg Glu Met Arg Ser Ile Wing Val Asn Phe Met Asn Ser Val Lys Leu

130 135 140130 135 140

Arg Thr Tyr Phe Leu Lys Asp Ile Asp Ile Gln Ala Val Asn Ile Leu 145 150 155 160Arg Thr Tyr Phe Leu Lys Asp Ile Asp Ile Gln Wing Val Asn Ile Leu 145 150 155 160

Asp Ala Trp Lys Val Asn Ser Thr Phe Ser Ala Gln Asp Glu Gly LysAsp Wing Trp Lys Val Asn Be Thr Phe Be Wing Gln Asp Glu Gly Lys

165 170 175165 170 175

Lys Phe Ala Phe Asn Leu Met Val Lys His Leu Met Asn Met Asp ProLys Phe Ala Phe Asn Leu Met Val Lys His Leu Met Asn Met Asp Pro

180 185 190180 185 190

Gly Met Pro Glu Thr Glu Glu Ile Arg Lys Glu Tyr Ile Phe Phe MetGly Met Pro Glu Thr Glu Glu Ile Arg Lys Glu Tyr Ile Phe Phe Met

195 200 205195 200 205

Glu Gly Met Ala Ser Ile Pro Leu Asn Phe Pro Gly Thr Ala Tyr ArgGlu Gly Met Wing Ser Ile Pro Read Asn Phe Pro Gly Thr Wing Tyr Arg

210 215 220210 215 220

Arg Ala Leu Gln Ser Arg Ser Arg Ile Leu Ala Ile Met Gly Gln Lys 225 230 235 240Arg Wing Read Gln Be Arg Be Arg Ile Read Wing Ile Met Gly Gln Lys 225 230 235 240

Leu Asp Glu Arg Met Gln Lys Ile Lys Glu Gly Cys Lys Gly Leu GluRead Asp Glu Arg Met Gln Lys Ile Lys Glu Gly Cys Lys Gly Leu Glu

245 250 255245 250 255

Glu Glu Asp Leu Leu Ala Ser Val Ala Arg Asn Thr Asn Ile Thr ArgGlu Glu Asp Leu Leu Wing Ser Val Wing Arg Wing Asn Thr Asn Ile Thr Arg

260 265 270260 265 270

Asp Gln Ile Leu Asp Leu Met Ile Ser Met Leu Phe Ala Gly His GluAsp Gln Ile Leu Asp Leu Met Ile Ser Met Leu Phe Ala Gly His Glu

275 280 285275 280 285

Thr Ser Ser Ala Ala Ile Ser Leu Ala Ile Tyr Phe Leu Gln Ala SerThr Ser Ser Ala Wing Ile Ser Leu Ile Wing Tyr Phe Leu Gln Ala Ser

290 295 300290 295 300

Pro Asp Val Leu Lys Lys Leu Arg Glu Glu His Ile Lys Ile Ala Lys 305 310 315 320Pro Asp Val Leu Lys Lys Leu Arg Glu Glu His Ile Lys Ile Wing Lys 305 310 315 320

Gln Lys Lys Glu Arg Gly Glu Thr Glu Leu Asn Trp Asp Asp Tyr LysGln Lys Lys Glu Arg Gly Glu Thr Glu Read Asn Trp Asp Asp Tyr Lys

325 330 335325 330 335

Gln Met Glu Phe Thr Asn Cys Val Ile His Glu Thr Leu Arg Leu GlyGln Met Glu Phe Asn Cys Val Ile His Glu Thr Read Leu Arg Leu Gly

340 345 350340 345 350

Asn Ile Val Lys Phe Leu His Arg Lys Thr Ile Lys Asp Val Gln TyrAsn Ile Val Lys Phe Read His Arg Lys Thr Ile Lys Asp Val Gln Tyr

355 360 365355 360 365

Lys Gly Tyr Glu Ile Pro Cys Gly Trp Glu Val Val Pro Ile Ile Ser 370 375 380Lys Gly Tyr Glu Ile Ile Cys Gly Trp Glu Ile Val Val Ile Ile Ser 370 375 380

Ala Ala His Leu Asp Ser Ser Ile Phe Asp AsnWing Wing His Leu Asp Ser Ser Ile Phe Asp Asn

385 390 395385 390 395

Pro Ser Arg Trp Glu Ala Ile Phe Ser Ala GlyPro Ser Arg Trp Glu Wing Ile Phe Ser Wing Gly

405 410405 410

Met Ser Phe Ser Gly Gly Pro Arg Leu Cys ProMet Be Phe Be Gly Gly Pro Arg Read Cys Pro

420 425420 425

Leu Glu Met Ala Ile Phe Leu His His LeuLeu Glu Met Wing Ile Phe Leu His His Leu

LysLys

435435

440440

Trp Glu Leu Val Glu Lys Asp Asn Pro Val SerTrp Glu Leu Val Glu Lys Asp Asn Pro Val Ser

450450

455455

Phe Pro Lys Lys Leu Pro Ile Lys Ile Thr Ala 465 470 475Phe Pro Lys Lys Leu Pro Ile Lys Ile Thr Wing 465 470 475

<210> 85 <211> 1491 <212> DNA<210> 85 <211> 1491 <212> DNA

<213> Zinnia elegans <400> 85<213> Zinnia elegans <400> 85

atgtgttcaa caaccctaaa tatgtgtgac cttgagttct gtcttggctc tttttctcat cttgaagctt gtcaaaagaa cgaaatcttc caccgggcaa catgggctgg ccgttcatcg caaccgtatt cggctacaac catcggcaag tttatggaac aagatataca aatctagttt gtttggtgag ccaacaatag aataagtaca tattgcaaaa tgaagggagg ttatttgaat gggggtattc ttggcaaatg gtccatgttg gttttggttg aggcaaattt cactcaactt tttgtccaat gcaaggctta gttgagaaaa atactttgtg ggtattagat tcttggaaag caagaagaag ccaagaagtt tacttttaat ctaatggcaa ccgggtgaac cggagaccga gcgattgaag aaagagtatg gtttctcccc ctttaaactt ccctggaact gcatactgga acgattctta aattcatcga aacaaaaatg gaggagcgga ggattaggga aactagacaa tgatcttctt ggatggtcta aaagagcaaa tactcgattt ggtattgagt ctactctttg gtttcgatat cgttagccgt ttacttcctt gaagcttgtc agagaagaac atgaagaaat tgtgatgaaa aaaaagctat tgggatgact acaaaaagat ggagtttact cagtgtgtga gggaatgtgg tgagattcct ccacagaaag gctattaaag gacattccat gtggttggaa agtgctgcca gtgattgcag cattttgacc aaccttacct ttttgatcca tggagatggc tctacttgtt caaccccgcc atcagcaagt aacttcatgc ttatgcacag ggtcagagct agcgaaacta gagatggcga ctaaaatacg agtgggaatt ggttgactca gatgaagcat tttccaaaag gtctgccaat caaaatccgt caccgaaaac <210> 86 <211> 496 <212> PRTatgtgttcaa caaccctaaa tatgtgtgac cttgagttct gtcttggctc tttttctcat cttgaagctt gtcaaaagaa cgaaatcttc caccgggcaa catgggctgg ccgttcatcg caaccgtatt cggctacaac catcggcaag tttatggaac aagatataca aatctagttt gtttggtgag ccaacaatag aataagtaca tattgcaaaa tgaagggagg ttatttgaat gggggtattc ttggcaaatg gtccatgttg gttttggttg aggcaaattt cactcaactt tttgtccaat gcaaggctta gttgagaaaa atactttgtg ggtattagat tcttggaaag caagaagaag ccaagaagtt tacttttaat ctaatggcaa ccgggtgaac cggagaccga gcgattgaag aaagagtatg gtttctcccc ctttaaactt ccctggaact gcatactgga acgattctta aattcatcga aacaaaaatg gaggagcgga ggattaggga aactagacaa tgatcttctt ggatggtcta aaagagcaaa tactcgattt ggtattgagt ctactctttg gtttcgatat cgttagccgt ttacttcctt gaagcttgtc agagaagaac atgaagaaat tgtgatgaaa aaaaagctat tgggatgact acaaaaagat ggagtttact cagtgtgtga gggaatgtgg tgagattcct ccacagaaag gctattaaag gacattccat gtggttggaa agtgctgcca gtgattgcag cattttgacc aaccttacct ttttgatcca tggagatggc tctacttgtt caaccccgcc atcagcaagt aacttcatgc ttatgcacag ggtcagagct agcgaaacta gagatggcga ctaaaatacg agtgggaatt ggttgactca gatgaagcat tttccaaaag

<213> Zinnia elegans <400> 86<213> Zinnia elegans <400> 86

380380

Pro Lys Val Met Asn 400Pro Lys Val Met Asn 400

Ala Lys Ser Asn Ile 415Lys Ser Asn Ile Wing 415

Gly Ala Glu Leu Ala 430Gly Wing Glu Leu Wing 430

Val Gln Arg Phe Asp 445Val Gln Arg Phe Asp 445

Phe Pro Phe Leu Gly 460Phe Pro Phe Leu Gly 460

Leu Lys HisRead Lys His

tcatccttgc gaacaaacaa gtgaaaccat aacacatatc tttctgctga gtagttatcc gtgacatgca aaactcaact aaaactcacc cacatatcat taactttcat aagctttaaa ttaggatgga tgaagaactc ctggtcacga ctaccgcggt tgggtgagaa tcaatgagac atgtgaggta ccgtgcattt agaacgcaag catttggtgg tatttatcca tcgcttatcc aatcatgttatcatccttgc gaacaaacaa gtgaaaccat aacacatatc tttctgctga gtagttatcc gtgacatgca aaactcaact aaaactcacc cacatatcat taactttcat aagctttaaa ttaggatgga tgaagaactc ctggtcacga ctaccgcggt tgggtgagaa tcaatgagac atgtgaggta ccgtgcattt agaacgcaag catttggtgg tatttatcca tcgcttatcc aatcatgtta

atcttgtctt tggttcgact cggttacctc caagtatggg tccagggttg aagaagcata tagagacatg agtaaatgaa tttttgtgcc gagtttagac gaaaggtgtg gtctcgagcg cgaaggaaac aaatctcact aacgtcttcg tcgtcaactt gtatctcact gctaagattc taaaggatat ggatcctaca tgtcacgtca agggccccgc ccatttggtc atatctcgacatcttgtctt tggttcgact cggttacctc caagtatggg tccagggttg aagaagcata tagagacatg agtaaatgaa tttttgtgcc gagtttagac gaaaggtgtg gtctcgagcg cgaaggaaac aaatctcact aacgtcttcg tcgtcaactt gtatctcact gctaagattc taaaggatat ggatcctaca tgtcacgtca agggccccgc ccatttggtc atatctcgac

gg

Met Cys Ser Thr Thr Leu Asn Met Cys Asp Leu Glu Phe Phe Ile Leu 1 5 10 15 Ala Ser Cys Leu Val Leu Ala Leu Phe Leu Ile Leu Lys Leu Val Lys 20 25 30 Arg Arg Thr Asn Asn Gly Ser Thr Arg Asn Leu Pro Pro Gly Asn Met 35 40 45 Gly Trp Pro Phe Ile Gly Glu Thr Ile Gly Tyr Leu Gln Pro Tyr Ser 50 55 60 Ala Thr Thr Ile Gly Lys Phe Met Glu Gln His Ile Ser Lys Tyr Gly 65 70 75 80 Lys Ile Tyr Lys Ser Ser Leu Phe Gly Glu Pro Thr Ile Val Ser Ala 85 90 95 Asp Pro Gly Leu Asn Lys Tyr Ile Leu Gln Asn Glu Gly Arg Leu Phe 100 105 110 Glu Cys Ser Tyr Pro Arg Ser Ile Gly Gly Ile Leu Gly Lys Trp SerMet Cys Be Thr Thr Read Asn Met Cys Asp Read Glu Phe Phe Ile Leu 1 5 10 15 Wing Be Cys Read Leu Val Leu Wing Leu Phe Leu Ile Leu Val Lys 20 25 30 Arg Arg Asn As As Gly Be Thr Arg Asn Leu Gly Pro Pro Gly Asn Met 35 40 45 Gly Trp Pro Phe Ile Gly Glu Thr Ile Gly Tyr Leu Gln Pro Tyr Ser 50 55 60 Wing Thr Thr Ile Gly Lys Phe Met Glu His Ile Ser Lys Tyr Gly 65 70 75 80 Lys Ile Tyr Lys Ser Serve Phe Gly Glu Pro Thr Ile Val Ser Ala 85 90 95 Asp Pro Ser Gly Leu Asn Lys Tyr Ile Read Gln Asn Glu Gly Arg Leu Phe 100 105 110 Glu Cys Ser Tyr Pro Arg Ser Ile Gly Ile Leu Gly Lys Trp To be

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1491 115 120 125 Met Leu Val Leu Val Gly Asp Met His Arg Asp Met Arg Gln Ile Ser 130 135 140 Leu Asn Phe Leu Ser Asn Ala Arg Leu Lys Thr Gln Leu Val Asn Glu 145 150 155 160 Val Glu Lys Asn Thr Leu Trp Val Leu Asp Ser Trp Lys Glu Asn Ser 165 170 175 Pro Phe Cys Ala Gln Glu Glu Ala Lys Lys Phe Thr Phe Asn Leu Met 180 185 190 Ala Thr His Ile Met Ser Leu Asp Pro Gly Glu Pro Glu Thr Glu Arg 195 200 205 Leu Lys Lys Glu Tyr Val Thr Phe Met Lys Gly Val Val Ser Pro Pro 210 215 220 Leu Asn Phe Pro Gly Thr Ala Tyr Trp Lys Ala Leu Lys Ser Arg Ala 225 230 235 240 Thr Ile Leu Lys Phe Ile Glu Thr Lys Met Glu Glu Arg Ile Arg Met 245 250 255 Asp Glu Gly Asn Gly Leu Gly Lys Leu Asp Asn Asp Leu Leu Gly Trp 260 265 270 Ser Met Lys Asn Ser Asn Leu Thr Lys Glu Gln Ile Leu Asp Leu Val 275 280 285 Leu Ser Leu Leu Phe Ala Gly His Glu Thr Ser Ser Val Ser Ile Ser 290 295 300 Leu Ala Val Tyr Phe Leu Glu Ala Cys Pro Thr Ala Val Arg Gln Leu 305 310 315 320 Arg Glu Glu His Glu Glu Ile Val Met Lys Lys Lys Leu Leu Gly Glu 325 330 335 Lys Tyr Leu Thr Trp Asp Asp Tyr Lys Lys Met Glu Phe Thr Gln Cys 340 345 350 Val Ile Asn Glu Thr Leu Arg Phe Gly Asn Val Val Arg Phe Leu His 355 360 365 Arg Lys Ala Ile Lys Asp Val Arg Tyr Lys Gly Tyr Asp Ile Pro Cys 370 375 380 Gly Trp Lys Val Leu Pro Val Ile Ala Ala Val His Leu Asp Pro Thr 385 390 395 400 His Phe Asp Gln Pro Tyr Leu Phe Asp Pro Trp Arg Trp Gln Asn Ala 405 410 415 Ser Val Thr Ser Ser Thr Cys Ser Thr Pro Pro Ser Ala Ser Asn Phe 420 425 430 Met Pro Phe Gly Gly Gly Pro Arg Leu Cys Thr Gly Ser Glu Leu Ala 435 440 445 Lys Leu Glu Met Ala Ile Phe Ile His His Leu Val Leu Lys Tyr Glu 450 455 460 Trp Glu Leu Val Asp Ser Asp Glu Ala Phe Ala Tyr Pro Tyr Leu Asp 465 470 475 480 Phe Pro Lys Gly Leu Pro Ile Lys Ile Arg His Arg Lys Gln Ser Cys 485 490 49560 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1491 115 120 125 Met Leu Val Leu Val Gly Asp Met His Arg Asp Met Arg Gln Ile Ser 130 135 140 Leu Asn Phe Leu Ser Asn Arg Wing Leu Lys Thr Gln Leu Val Asn Glu 145 150 155 160 Val Glu Lys Asn Thr Leu Trp Val Leu Asp Ser Trp Lys Glu Asn Ser 165 170 175 Pro Phe Cys Ala Gln Glu Ala Lys Lys Phe Thr Phe Asn Leu Met 180 185 190 Wing Thr His Ile Met Ser Read Asp Pro Gly Glu Pro Glu Thr Glu Arg 195 200 205 Tyr Trp Lys Wing Leu Lys Ser Arg Wing 225 230 235 240 Thr Ile Leu Lys Phe Ile Glu Thr Lys Met Glu Glu Arg Ile Arg Met 245 250 255 Asp Glu Gly Asn Gly Leu Gly Lys Leu Asp Asn Leu Gly Trp 260 265 270 Be Met Lys Asn Be Asn Leu Thr Lys Glu Gln Ile Leu Asp Le u Val 275 280 285 Leu Ser Leu Leu Phe Ala Gly His Glu Thr Ser Ser Val Val Ile Ser 290 295 300 Leu Ala Val Tyr Phe Leu Glu Cys Pro Thr Wing Val Arg Gln Leu 305 310 315 320 Arg Glu Glu His Glu Glu Ile Val Met Lys Lys Lys Leu Leu Gly Glu 325 330 335 Lys Tyr Leu Thr Trp Asp Asp Tyr Lys Met Glu Phe Thr Gln Cys 340 345 350 Val Ile Asn Glu Thr Leu Arg Phe Gly Asn Val Val Arg Phe Leu His 355 360 365 Arg Lys Ile Wing Lys Asp Val Arg Tyr Lys Gly Tyr Asp Ile Pro Cys 370 375 380 Gly Trp Lys Val Leu Pro Val Ile Wing Val His Leu Asp Pro Thr 385 390 395 400 His Phe Asp Gln Pro Tyr Leu Phe Asp Pro Trp Arg Trp Gln Asn Wing 405 410 415 Ser Val Thr Ser Ser Thr Cys Ser Thr Ser Pro Pro Ser Ser Ser Asn Phe 420 425 430 Met Pro Ser Ser Ply Gly Gly Gly Pro Arg Leu Cys Thr Gly Ser Alu 435 440 445 Lys Leu Glu Met Wing Ile Phe Ile His His 455 460 Trp Glu Leu Val Asp Ser Asp Glu Wing Phe Wing Tyr Pro Tyr Leu Asp 465 470 475 480 Phe Pro Lys Gly Leu Pro Ile Lys Ile Arg His Arg Lys Gln Ser Cys 485 490 495

<210> 87 <211> 1422 <212> DNA<210> 87 <211> 1422 <212> DNA

<213> Medicago trunculata <400> 87<213> Medicago trunculata <400> 87

atgtctaact catacttaac ttgcagtttt ctttcttcca tctttgttct ttctttgatt 60atgtctaact catacttaac ttgcagtttt ctttcttcca tctttgttct ttctttgatt 60

ttcattttca tcaaaagaaa gaaaacaagg tataatcttc cacctggaaa aatgggatgg 120ttcattttca tcaaaagaaa gaaaacaagg tataatcttc cacctggaaa aatgggatgg 120

ccctttatag gagaaaccat tggttatttg aagccttaca ctgccaccac aatgggagaa 180ccctttatag gagaaaccat tggttatttg aagccttaca ctgccaccac aatgggagaa 180

tttatggaaa atcacatagc aaggtatggg acaatttaca agtcaaattt gtttggaggg 240tttatggaaa atcacatagc aaggtatggg acaatttaca agtcaaattt gtttggaggg 240

ccagctattg tatcagcaga tgcagaattg aataggttca tattacaaaa tgatggaaaa 300ccagctattg tatcagcaga tgcagaattg aataggttca tattacaaaa tgatggaaaa 300

ttgtttgagt gtagctatcc aaaaagcatt ggtggaatac ttggaaaatg gtcaatgttg 360ttgtttgagt gtagctatcc aaaaagcatt ggtggaatac ttggaaaatg gtcaatgttg 360

gttttagtag gtgacatgca tagggaaatg aggaatatat cactaaactt tatgagctat 420gttttagtag gtgacatgca tagggaaatg aggaatatat cactaaactt tatgagctat 420

gctaggctta aaacacattt tttgaaagat atggagaagc ataccctttt tgttctaagc 480gctaggctta aaacacattt tttgaaagat atggagaagc ataccctttt tgttctaagc 480

tcttggaaag aaaattgtac attttcagct caagatgaag caaaaaagtt caccttcaat 540tcttggaaag aaaattgtac attttcagct caagatgaag caaaaaagtt caccttcaat 540

ttgatggcca aacaaatcat gagtttggat ccagggaatc ttgagacaga acagttgaaa 600ttgatggcca aacaaatcat gagtttggat ccagggaatc ttgagacaga acagttgaaa 600

aaagagtatg tctgtttcat gaaaggtgtt gtttctgctc ctttgaattt gccaggaact 660 gcatacagaa aagcattaaa gtctaggaac aatatattga agttcataga ggggaaaatg 720 gaagaaaggg tgaagagaaa ccaagaagga aaaaaaggga tggaggaaaa tgatcttcta 780 aattgggttt taaagcattc aaatctttcc actgagcaaa ttcttgactt gattctaagt 840 ttactttttg ctggccatga aacttcatct gtggctatag ctctagctat ttactttttg 900 cctagttgtc ctcaagctat acaacaatta agggaagagc atagagaaat agctagatcc 960 aagaagaaag caggggaggt tgaattaact tgggatgatt ataaaagaat ggaatttact 1020 cattgtgttg tgaatgaaac actaaggttg ggtaatgttg tgagattcct tcacaggaag 1080 gctatcaaag atgttcatta caaaggttat gacattccat gtggatggaa agtccttccg 1140 gtgatttcag cggtacattt ggatccttca aattttgacc aacctcaaca cttcaatcct 1200 tggagatggc agatgagcaa taacaacttc atgccatttg gaggaggacc aaggctatgt 1260 gcaggattag aattagccaa acttgaaatg gctgttttca ttcaccatat catcctcaaa 1320 tacaactggg acatggtcga tgttgatcaa cctattgtat acccttttgt tgattttccc 1380 aaaggtttgc caattagagt ccaaagccaa gccactcttt aa 1422aaagagtatg tctgtttcat gaaaggtgtt gtttctgctc ctttgaattt gccaggaact 660 gcatacagaa aagcattaaa gtctaggaac aatatattga agttcataga ggggaaaatg 720 gaagaaaggg tgaagagaaa ccaagaagga aaaaaaggga tggaggaaaa tgatcttcta 780 aattgggttt taaagcattc aaatctttcc actgagcaaa ttcttgactt gattctaagt 840 ttactttttg ctggccatga aacttcatct gtggctatag ctctagctat ttactttttg 900 cctagttgtc ctcaagctat acaacaatta agggaagagc atagagaaat agctagatcc 960 aagaagaaag caggggaggt tgaattaact tgggatgatt ataaaagaat ggaatttact 1020 cattgtgttg tgaatgaaac ggtaatgttg tgagattcct tcacaggaag actaaggttg 1080 gctatcaaag atgttcatta caaaggttat gacattccat gtggatggaa agtccttccg 1140 gtgatttcag cggtacattt ggatccttca aattttgacc aacctcaaca cttcaatcct 1200 tggagatggc agatgagcaa taacaacttc atgccatttg gaggaggacc aaggctatgt 1260 gcaggattag aattagccaa acttgaaatg gctgttttca ttcaccatat catcctcaaa 1320 tacaactggg acatggtcga tgttgatcaa cctattgtat acccttttgt tgattttccc 1380 aaaggtttgc caattagagt ccaaagccaa gccactcttt aa 1422

<210> 88 <211> 480 <212> PRT<210> 88 <211> 480 <212> PRT

<213> Medicago trunculata <400> 88<213> Medicago trunculata <400> 88

Met Ser Asn Ser Tyr Leu Thr Cys Ser Phe Leu Ser Ser Ile Phe Val 15 10 15Met Ser Asn Ser Tyr Leu Thr Cys Ser Phe Le Ser Ser Ile Phe Val 15 10 15

Leu Ser Leu Ile Phe Ile Phe Ile Lys Arg Lys Lys Thr Arg Tyr AsnRead It Be Read It Ile Phe Ile Phe Ile Lys Arg Lys Thr Arg Tyr Asn

20 25 3020 25 30

Leu Pro Pro Gly Lys Met Gly Trp Pro Phe Ile Gly Glu Thr Ile GlyRead Pro Gly Lys Met Gly Trp Pro Phe Ile Gly Glu Thr Ile Gly

35 40 4535 40 45

Tyr Leu Lys Pro Tyr Thr Ala Thr Thr Met Gly Glu Phe Met Glu AsnTyr Leu Lys Pro Tyr Thr Wing Thr Thr Met Gly Glu Phe Met Glu Asn

50 55 6050 55 60

His Ile Ala Arg Tyr Gly Thr Ile Tyr Lys Ser Asn Leu Phe Gly Gly 65 70 75 80His Ile Wing Arg Tyr Gly Thr Ile Tyr Lys Ser Asn Leu Phe Gly Gly 65 70 75 80

Pro Ala Ile Val Ser Ala Asp Ala Glu Leu Asn Arg Phe Ile Leu GlnPro Wing Ile Val Ser Wing Asp Wing Glu Leu Asn Arg Phe Ile Leu Gln

85 90 9585 90 95

Asn Asp Gly Lys Leu Phe Glu Cys Ser Tyr Pro Lys Ser Ile Gly GlyAsn Asp Gly Lys Leu Phe Glu Cys Ser Tyr Pro Lys Ser Ile Gly Gly

100 105 110100 105 110

Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp Met His ArgIle Leu Gly Lys Trp Being Met Leu Val Leu Val Gly Asp Met His Arg

115 120 125115 120 125

Glu Met Arg Asn Ile Ser Leu Asn Phe Met Ser Tyr Ala Arg Leu LysGlu Met Arg Asn Ile Be Read Asn Phe Met Be Tyr Wing Arg Read Le Lys

130 135 140130 135 140

Thr His Phe Leu Lys Asp Met Glu Lys His Thr Leu Phe Val Leu Ser 145 150 155 160Thr His Phe Leu Lys Asp Met Glu Lys His Thr Leu Phe Val Leu Ser 145 150 155 160

Ser Trp Lys Glu Asn Cys Thr Phe Ser Ala Gln Asp Glu Ala Lys LysBe Trp Lys Glu Asn Cys Thr Phe Be Wing Gln Asp Glu Wing Lys Lys

165 170 175165 170 175

Phe Thr Phe Asn Leu Met Ala Lys Gln Ile Met Ser Leu Asp Pro GlyPhe Thr Phe Asn Read Met Lys Wing Gln Ile Met Be Read Asp Pro Gly

180 185 190180 185 190

Asn Leu Glu Thr Glu Gln Leu Lys Lys Glu Tyr Val Cys Phe Met LysAsn Leu Glu Thr Glu Gln Read Lys Lys Glu Tyr Val Cys Phe Met Lys

195 200 205195 200 205

Gly Val Val Ser Ala Pro Leu Asn Leu Pro Gly Thr Ala Tyr Arg LysGly Val Val Ser Pro Wing Read Asn Leu Pro Gly Thr Wing Tyr Arg Lys

210 215 220210 215 220

Ala Leu Lys Ser Arg Asn Asn Ile Leu Lys Phe Ile Glu Gly Lys Met 225 230 235 240Wing Read Lys Ser Arg Asn Asn Ile Read Lys Phe Ile Glu Gly Lys Met 225 230 235 240

Glu Glu Arg Val Lys Arg Asn Gln Glu Gly Lys Lys Gly Met Glu GluGlu Glu Arg Val Lys Arg Asn Gln Glu Gly Lys Lys Gly Met Glu Glu

245 250 255245 250 255

Asn Asp Leu Leu Asn Trp Val Leu Lys His Ser Asn Leu Ser Thr GluAsn Asp Leu Leu Asn Trp Val Leu Lys His Ser Asn Leu Be Thr Glu

260 265 270260 265 270

Gln Ile Leu Asp Leu Ile Leu Ser Leu Leu Phe Ala Gly His Glu ThrGln Ile Leu Asp Leu Ile Leu Ser Leu Leu Phe Ala Gly His Glu Thr

275 280 285275 280 285

Ser Ser Val Ala Ile Ala Leu Ala Ile Tyr Phe Leu Pro Ser Cys ProBe Ser Val Wing Ile Wing Leu Wing Ile Tyr Phe Leu Pro Ser Cys Pro

290 295 300290 295 300

Gln Ala Ile Gln Gln Leu Arg Glu Glu His Arg Glu Ile Ala Arg Ser 305 310 315 320Gln Ile Wing Gln Gln Read Le Arg Glu Glu His Arg Glu Ile Wing Arg Ser 305 310 315 320

Lys Lys Lys Ala Gly Glu Val Glu Leu Thr Trp Asp Asp Tyr Lys ArgLys Lys Lys Wing Gly Glu Val Glu Read Thr Thr Asp Asp Tyr Lys Arg

325 330 335325 330 335

Met Glu Phe Thr His Cys Val Val Asn Glu Thr Leu Arg Leu Gly AsnMet Glu Phe His Thr Cys Val Val Asn Glu Thr Leu Arg Leu Gly Asn

340 345 350340 345 350

Val Val Arg Phe Leu His Arg Lys Ala Ile Lys Asp Val His Tyr Lys 355 360 365Val Val Arg Phe Read His Arg Lys Wing Ile Lys Asp Val His Tyr Lys 355 360 365

Gly Tyr Asp Ile Pro Cys Gly Trp Lys Val Leu Pro Val Ile Ser AlaGly Tyr Asp Ile Pro Cys Gly Trp Lys Val Leu Pro Val Ile Ser Ala

370 375 380370 375 380

Val His Leu Asp Pro Ser Asn Phe Asp Gln Pro Gln His Phe Asn Pro 385 390 395 400Val His Read Asp Pro Ser Asn Phe Asp Gln Pro Gln His Phe Asn Pro 385 390 395 400

Trp Arg Trp Gln Gln Asn Asn Asp Gly Ala Ser Gly Asn Ser Asn IleTrp Arg Trp Gln Gln Asn Asn Asp

405 410 415405 410 415

Phe Leu Pro Phe Gly Gly Gly Pro Arg Leu Cys Ala Gly Leu Glu LeuPhe Leu Pro Phe Gly Gly Gly Pro Arg Read Cys Wing Gly Leu Glu Leu

420 425 430420 425 430

Ala Lys Leu Glu Met Ala Val Phe Ile His His Ile Ile Leu Lys TyrWing Lys Leu Glu Met Wing Val Phe Ile His His Ile Ile Leu Lys Tyr

435 440 445435 440 445

Asn Trp Asp Met Val Asp Val Asp Gln Pro Ile Val Tyr Pro Phe ValAsp Trp Asp Met Val Asp Val Asp Gln Ile Val Tyr Pro Phe Val

450 455 460450 455 460

Asp Phe Pro Lys Gly Leu Pro Ile Arg Val Gln Ser Gln Ala Thr Leu 465 470 475 480Asp Phe Pro Lys Gly Leu Pro Ile Arg Val Gln Ser Gln Wing Thr Leu 465 470 475 480

<210> 89 <211> 1485 <212> DNA<210> 89 <211> 1485 <212> DNA

<213> Populus trichocarpa <220><213> Populus trichocarpa <220>

<221> misc_feature <222> (1110) .. (1110) <223> η is a, c, g, ou t <400> 89<221> misc_feature <222> (1110) .. (1110) <223> η is a, c, g, or t <400> 89

atgtctcact cagagcttgt tgtctttctc cttccatcga ttttatcact actcttgctc 60atgtctcact cagagcttgt tgtctttctc cttccatcga ttttatcact actcttgctc 60

ttcattctcg tgcaaagaaa gcaagtaaga tttaatctcc caccgggcaa catggggtgg 120 ccatttcttg gagaaaccat tggctacctg aagccttact ctgctacttc aataggagaa 180 ttcatggaac agcacatatc aaggtatgga aagatttaca agtccaattt gtttggggag 240 ccaacaatag tatccgcaga tgctggactt agcagattta tactacagaa tgagggaaga 300 ttatttgaat gcagctatcc aaaaagtatt ggtggaattc ttggaaaatg gtccatgatg 360 gttcttgttg gagacatgca tagagacatg aggattatat ctctcaactt tttgagccat 420 gccaggttaa gaactcatct attgaaagaa gtggagaagc aaaccctgct tgttcttagc 480 tcttggaagg agaattgtac attttcagct caagatgaag caaacaagtt taccttcaat 540 tggatggcaa aacatatcat gagcttggat cctggaaaga cagagactga gcagctgaaa 600 aaagagtatg ttactttcat gaaaggagta gtttcaggtc ctataaattt tcctggaacc 660 ccatatagaa aagccttgaa gtctcgatca atcatcttga aatttataga gcgaaagatg 720 gaggagagaa ttggagaaac gaagggtgga gtagaaaact tggaagacga tgatcttctt 780 ggatgggtct tgaagcattc aaatctttat acggagcaaa tccttgaatt aatcttaagc 840 ttgctctttg ctggccacga aacttcttct gtgtccatag ctctagccat atccttcttg 900 caagcttgtc ctggttctat tcaacagtta aaagaagaac atattcaaat ctccagagcc 960 aagaaacggt caggagagac ggaattgacc tgggatgatt acaaaaaaat ggaattcact 1020 caatgcgtta taagcgagac agtgaggctt ggaaacgtag tcaggtttgt tcacagaaaa 1080 gctctaaaag atgttcggta caaagggtan gacattccat gtggatggaa agtgttacca 1140 gtaatctcat ccgtccattt agattcaact cttttcgacc aacctcaaca cttcaatcca 1200 tggagatggc agcagcacaa caatgctcgt ggatcttcta cttgttcgag tgcggcggcg 1260 gcggcggcgg cggcggtgag tagtaatcac ttcatgccat ttgggggagg accgcgactc 1320 tgtgcaggat cggaattggc aaaacttgaa atggcagttt tcattcacca tttggttctg 1380 aacttccatt gggaattggt cggtgccgat caagcctttg cctttccttt tgttgatttt 1440 cctaaaggct tgccaataag agtcaagcac cacacagtca tataa 1485ttcattctcg tgcaaagaaa gcaagtaaga tttaatctcc caccgggcaa catggggtgg 120 ccatttcttg gagaaaccat tggctacctg aagccttact ctgctacttc aataggagaa 180 ttcatggaac agcacatatc aaggtatgga aagatttaca agtccaattt gtttggggag 240 ccaacaatag tatccgcaga tgctggactt agcagattta tactacagaa tgagggaaga 300 ttatttgaat gcagctatcc aaaaagtatt ggtggaattc ttggaaaatg gtccatgatg 360 gttcttgttg gagacatgca tagagacatg aggattatat ctctcaactt tttgagccat 420 gccaggttaa gaactcatct attgaaagaa gtggagaagc aaaccctgct tgttcttagc 480 tcttggaagg agaattgtac attttcagct caagatgaag caaacaagtt taccttcaat 540 tggatggcaa aacatatcat gagcttggat cctggaaaga cagagactga gcagctgaaa 600 aaagagtatg ttactttcat gaaaggagta gtttcaggtc ctataaattt tcctggaacc 660 ccatatagaa aagccttgaa gtctcgatca atcatcttga aatttataga gcgaaagatg 720 gaggagagaa ttggagaaac gaagggtgga gtagaaaact tggaagacga tgatcttctt 780 ggatgggtct tgaagcattc aaatctttat acggagcaaa tccttgaatt aatcttaagc 840 ttgctctttg ctggccacga aacttcttct gtgtccatag ctctagccat atccttcttg 900 caagcttgtc ctggttcta t tcaacagtta aaagaagaac atattcaaat ctccagagcc 960 aagaaacggt caggagagac ggaattgacc tgggatgatt acaaaaaaat ggaattcact 1020 caatgcgtta taagcgagac agtgaggctt ggaaacgtag tcaggtttgt tcacagaaaa 1080 gctctaaaag atgttcggta caaagggtan gacattccat gtggatggaa agtgttacca 1140 ccgtccattt agattcaact cttttcgacc gtaatctcat aacctcaaca cttcaatcca 1200 tggagatggc agcagcacaa caatgctcgt ggatcttcta cttgttcgag tgcggcggcg 1260 gcggcggcgg cggcggtgag tagtaatcac ttcatgccat ttgggggagg accgcgactc 1320 tgtgcaggat cggaattggc aaaacttgaa atggcagttt tcattcacca tttggttctg 1380 aacttccatt gggaattggt cggtgccgat caagcctttg cctttccttt tgttgatttt 1440 cctaaaggct tgccaataag agtcaagcac cacacagt85 tataa85

<210> <211> <212><210> <211> <212>

9090

494494

PRTPRT

<213> Populus trichocarpa <220><213> Populus trichocarpa <220>

<221> INSEGURO <222> (370)..(370)<221> INSECURE <222> (370) .. (370)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 90<223> Xaa can be any naturally occurring amino acid <400> 90

Met Ser His Ser Glu Leu Val Val Phe Leu Leu Pro Ser Ile Leu Ser 1 5 10 15Met Be His Be Glu Leu Val Val Phe Leu Pro Le I Ser Leu Ser 1 5 10 15

Leu Leu Leu Leu Phe Ile Leu Val Gln Arg Lys Gln Val Arg Phe AsnLeu Leu Leu Leu Phe Ile Leu Val Gln Arg Lys Gln Val Arg Phe Asn

20 25 3020 25 30

Leu Pro Pro Gly Asn Met Gly Trp Pro Phe Leu Gly Glu Thr Ile Gly 35 40 45Leu Pro Gly Asn Met Gly Trp Pro Phe Leu Pro Gly Glu Thr Ile Gly 35 40 45

Tyr Leu Lys Pro Tyr Ser Ala Thr Ser Ile Gly Glu Phe Met Glu GlnTyr Leu Lys Pro Tyr Be Wing Thr Be Ile Gly Glu Phe Met Glu Gln

50 55 6050 55 60

His Ile Ser Arg Tyr Gly Lys Ile Tyr Lys Ser Asn Leu Phe Gly Glu 65 70 75 80His Ile Be Arg Tyr Gly Lys Ile Tyr Lys Ser Asn Leu Phe Gly Glu 65 70 75 80

Pro Thr Ile Val Ser Ala Asp Ala Gly Leu Ser Arg Phe Ile Leu GlnPro Thr Ile Val Ser Wing Asp Wing Gly Leu Being Arg Phe Ile Leu Gln

85 90 9585 90 95

Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Lys Ser Ile Gly GlyAsn Glu Gly Arg Read Le Phe Glu Cys Ser Tyr Pro Lys Ser Ile Gly Gly

100 105 110100 105 110

Ile Leu Gly Lys Trp Ser Met Met Val Leu Val Gly Asp Met His ArgIle Leu Gly Lys Trp Being Met Met Val Leu Val Gly Asp Met His Arg

115 120 125115 120 125

Asp Met Arg Ile Ile Ser Leu Asn Phe Leu Ser His Ala Arg Leu ArgAsp Met Arg Ile Ile Be Read Asn Phe Read His Be Wing Arg Read Le Arg

130 135 140130 135 140

Thr His Leu Leu Lys Glu Val Glu Lys Gln Thr Leu Leu Val Leu Ser 145 150 155 160Thr His Leu Leu Lys Glu Val Glu Lys Gln Thr His Leu Leu Val Leu Ser 145 150 155 160

Ser Trp Lys Glu Asn Cys Thr Phe Ser Ala Gln Asp Glu Ala Asn LysBe Trp Lys Glu Asn Cys Thr Phe Be Wing Gln Asp Glu Wing Asn Lys

165 170 175165 170 175

Phe Thr Phe Asn Trp Met Ala Lys His Ile Met Ser Leu Asp Pro GlyPhe Thr Phe Asn Trp Met Wing Lys His Ile Met Being Read Asp Pro Gly

180 185 190180 185 190

Lys Thr Glu Thr Glu Gln Leu Lys Lys Glu Tyr Val Thr Phe Met LysLys Thr Glu Thr Glu Gln Leu Lys Lys Glu Tyr Val Thr Phe Met Lys

195 200 205195 200 205

Gly Val Val Ser Gly Pro Ile Asn Phe Pro Gly Thr Pro Tyr Arg LysGly Val Val Ser Gly Pro Ile Asn Phe Pro Gly Thr Pro Tyr Arg Lys

210 215 220210 215 220

Ala Leu Lys Ser Arg Ser Ile Ile Leu Lys Phe Ile Glu Arg Lys Met 225 230 235 240Wing Read Lys Be Arg Be Ile Ile Read Lys Phe Ile Glu Arg Lys Met 225 230 235 240

Glu Glu Arg Ile Gly Glu Thr Lys Gly Gly Val Glu Asn Leu Glu AspGlu Glu Arg Ile Gly Glu Thr Lys Gly Gly Val Glu Asn

245 250 255245 250 255

Asp Asp Leu Leu Gly Trp Val Leu Lys His Ser Asn Leu Tyr Thr GluAsp Asp Leu Leu Gly Trp Val Leu Lys His Ser Asn Leu Tyr Thr Glu

260 265 270260 265 270

Gln Ile Leu Glu Leu Ile Leu Ser Leu Leu Phe Ala Gly His Glu ThrGln Ile Leu Glu Leu Ile Leu Ser Leu Leu Phe Wing Gly His Glu Thr

275 280 285275 280 285

Ser Ser Val Ser Ile Ala Leu Ala Ile Ser Phe Leu Gln Ala Cys ProSer Ser Val Ser Ile Wing Leu Wing Ile Ser Phe Leu Gln Wing Cys Pro

290 295 300290 295 300

Gly Ser Ile Gln Gln Leu Lys Glu Glu His Ile Gln Ile Ser Arg Ala 305 310 315 320Gly Ser Ile Gln Gln Read Lys Glu Glu His Ile Gln Ile Be Arg Wing 305 310 315 320

Lys Lys Arg Ser Gly Glu Thr Glu Leu Thr Trp Asp Asp Tyr Lys LysLys Lys Arg Be Gly Glu Thr Glu Read Thr Trp Asp Asp Tyr Lys Lys

325 330 335325 330 335

Met Glu Phe Thr Gln Cys Val Ile Ser Glu Thr Val Arg Leu Gly AsnMet Glu Phe Thr Gln Cys Val Ile Being Glu Thr Val Arg Leu Gly Asn

340 345 350340 345 350

Val Val Arg Phe Val His Arg Lys Ala Leu Lys Asp Val Arg Tyr LysVal Val Arg Phe Val His Arg Lys Wing Read Lys Asp Val Arg Tyr Lys

355 360 365355 360 365

Gly Xaa Asp Ile Pro Cys Gly Trp Lys Val Leu Pro Val Ile Ser SerGly Xaa Asp Ile Pro Cys

370 375 380370 375 380

Val His Leu Asp Ser Thr Leu Phe Asp Gln Pro Gln His Phe Asn Pro 385 390 395 400Val His Read Asp Be Thr Read Le Phe Asp Gln Pro Gln His Phe Asn Pro 385 390 395 400

Trp Arg Trp Gln Gln His Asn Asn Ala Arg Gly Ser Ser Thr Cys SerTrp Arg Trp Gln Gln His Asn Asn Wing Arg Gly Ser Be Thr Cys Ser

405 410 415405 410 415

Ser Ala Ala Ala Ala Ala Ala Ala Ala Val Ser Ser Asn His Phe MetSer Ala Ala Ala Ala Ala Ala Ala Ala Val Ser Ser Asn His Phe Met

420 425 430420 425 430

Pro Phe Gly Gly Gly Pro Arg Leu Cys Ala Gly Ser Glu Leu Ala LysPro Phe Gly Gly Gly Pro Arg Read Cys Wing Gly Be Glu Read Lys Wing

435 440 445435 440 445

Leu Glu Met Ala Val Phe Ile His His Leu Val Leu Asn Phe His TrpRead Glu Met Wing Val Phe Ile His His Read Leu Val Leu Asn Phe His Trp

450 455 460450 455 460

Glu Leu Val Gly Ala Asp Gln Ala Phe Ala Phe Pro Phe Val Asp Phe 465 470 475 480Glu Read Val Gly Wing Asp Gln Wing Phe Wing Phe Pro Phe Val Asp Phe 465 470 475 480

Pro Lys Gly Leu Pro Ile Arg Val Lys His His Thr Val Ile 485 490Pro Lys Gly Leu Pro Ile Arg Val Lys His His Thr Val Ile 485 490

<210> 91 <211> 1407 <212> DNA<210> 91 <211> 1407 <212> DNA

<213> Aquilegia formosa χ Aquilegia pubescens <220><213> Aquilegia formosa χ Aquilegia pubescens <220>

<221> misc feature <222> (1031)..(1032) <223> η is a, c, g, ou t <400> 91<221> misc feature <222> (1031) .. (1032) <223> η is a, c, g, or t <400> 91

atgcctgagc ttgtgttttt cttttcatta gctccagcaa ttttagcact aatacttctc 60atgcctgagc ttgtgttttt cttttcatta gctccagcaa ttttagcact aatacttctc 60

ttgaaactct tcaaaaggaa gaaaaagtca tataatcttc caccaggaaa catgggttgg 120ttgaaactct tcaaaaggaa gaaaaagtca tataatcttc caccaggaaa catgggttgg 120

ccatatctag gcgaaactct tggttatttg aagccttatt gtgctatcac tactggagat 180ccatatctag gcgaaactct tggttatttg aagccttatt gtgctatcac tactggagat 180

ttcatggagc aacatatatc aaggtatggg aagatctaca agtcaaattt atttggttat 240ttcatggagc aacatatatc aaggtatggg aagatctaca agtcaaattt atttggttat 240

cctacaatag tttcagttga tcctgaatta aatcgatatg tattacaaaa cgaaggaaga 300 ctgtttgaat gtagttatcc aagtagttta ggtgggattc ttggcaaatg gtcaatgtta 360cctacaatag tttcagttga tcctgaatta aatcgatatg tattacaaaa cgaaggaaga 300 ctgtttgaat gtagttatcc aagtagttta ggtgggattc ttggcaaatg gtcaatgtta 360

gttttggttg gagacatgca taaaaacatg aggatgatct ctgtcaactt catgagcagc 420gttttggttg gagacatgca taaaaacatg aggatgatct ctgtcaactt catgagcagc 420

gcaagacttc gaacacatct aattcaagat gtggagactc aagccttatt ggtgctgaaa 480gcaagacttc gaacacatct aattcaagat gtggagactc aagccttatt ggtgctgaaa 480

tcttggcagg ttgataaaaa gattttggcc caagatgaag caaagaagtt taccttcaat 540tcttggcagg ttgataaaaa gattttggcc caagatgaag caaagaagtt taccttcaat 540

ttaattgtaa aaaatataat gagcatggaa cctggaacac ctgaaagtga gaagcttagg 600ttaattgtaa aaaatataat gagcatggaa cctggaacac ctgaaagtga gaagcttagg 600

agggaataca ttacattcat gaaaggaatc atttctgcgc ctttgaattt gcctggaact 660agggaataca ttacattcat gaaaggaatc atttctgcgc ctttgaattt gcctggaact 660

gcatatagaa gagccttaaa gtctcgatcg aacattctgc aacttatcga gcataacatg 720gcatatagaa gagccttaaa gtctcgatcg aacattctgc aacttatcga gcataacatg 720

aatgagagac tccaaaagac taacggagat ggtaagaaag tggaagatga tgatctactt 780aatgagagac tccaaaagac taacggagat ggtaagaaag tggaagatga tgatctactt 780

ggatgggtct tgaagcattc aaatcttacc actgaacaaa ttcttgattt gatactaagt 840ggatgggtct tgaagcattc aaatcttacc actgaacaaa ttcttgattt gatactaagt 840

atgcttttcg cgggtcatga aacttcctca gtatctatat ctctagccat ataccttttg 900atgcttttcg cgggtcatga aacttcctca gtatctatat ctctagccat ataccttttg 900

caaggatgcc taaaagcagt tgaagagtta agggaagagc atattagaat tgctaaagca 960caaggatgcc taaaagcagt tgaagagtta agggaagagc atattagaat tgctaaagca 960

aaagaacagg caggacagag atctggatta aattgggaag attacaaaca catggaattc 1020aaagaacagg caggacagag atctggatta aattgggaag attacaaaca catggaattc 1020

actcaatgtg nntttcttca tagaaaaact ctcaaagatg ttcagtacaa agggtatgac 1080actcaatgtg nntttcttca tagaaaaact ctcaaagatg ttcagtacaa agggtatgac 1080

attccatgtg gttggaaagt tcttccagta tttgcagcag ttcatttgga ccctttaaat 1140attccatgtg gttggaaagt tcttccagta tttgcagcag ttcatttgga ccctttaaat 1140

ttcgaccaac ctcatgcttt caatccatgg agatggcaga atgggaagac aagcacgacg 1200ttcgaccaac ctcatgcttt caatccatgg agatggcaga atgggaagac aagcacgacg 1200

actaacaact tcatgccgtt tggtggtgga ttacggttat gtgctggttc agagctagcc 1260actaacaact tcatgccgtt tggtggtgga ttacggttat gtgctggttc agagctagcc 1260

aagttggaaa tggctatttt cattcaccat ttggtcttga attatgattg ggatatagca 1320aagttggaaa tggctatttt cattcaccat ttggtcttga attatgattg ggatatagca 1320

gaaccagatc aaccatttgc ctacccattt gttgaatttc caaaaggtct accaattaag 1380gaaccagatc aaccatttgc ctacccattt gttgaatttc caaaaggtct accaattaag 1380

gtctatgacc atcagtgctt aacatga 1407 <210> 92 <211> 468 <212> PRTgtctatgacc atcagtgctt aacatga 1407 <210> 92 <211> 468 <212> PRT

<213> Aquilegia formosa χ Aquilegia pubescens <220><213> Aquilegia formosa χ Aquilegia pubescens <220>

<221> INSEGURO <222> (344)..(344)<221> UNSAFE <222> (344) .. (344)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 92<223> Xaa can be any naturally occurring amino acid <400> 92

Met Pro Glu Leu Val Phe Phe Phe Ser Leu Ala Pro Ala Ile Leu AlaMet Pro Glu Leu Val Phe Phe Phe Ser Leu Wing Pro Wing Ile Leu Wing

1 D IU 13 Leu Ile Leu Leu Leu Lys Leu Phe Lys Arg Lys Lys Lys Ser Tyr Asn 20 25 30 Leu Pro Pro Gly Asn Met Gly Trp Pro Tyr Leu Gly Glu Thr Leu Gly 35 40 45 Tyr Leu Lys Pro Tyr Cys Ala Ile Thr Thr Gly Asp Phe Met Glu Gln 50 55 60 His Ile Ser Arg Tyr Gly Lys Ile Tyr Lys Ser Asn Leu Phe Gly Tyr 65 70 75 80 Pro Thr Ile Val Ser Val Asp Pro Glu Leu Asn Arg Tyr Val Leu Gln 85 90 95 Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Ser Ser Leu Gly Gly 100 105 110 Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp Met His Lys 115 120 125 Asn Met Arg Met Ile Ser Val Asn Phe Met Ser Ser Ala Arg Leu Arg 130 135 140 Thr His Leu Ile Gln Asp Val Glu Thr Gln Ala Leu Leu Val Leu Lys 145 150 155 160 Ser Trp Gln Val Asp Lys Lys Ile Leu Ala Gln Asp Glu Ala Lys Lys 165 170 175 Phe Thr Phe Asn Leu Ile Val Lys Asn Ile Met Ser Met Glu Pro Gly 180 185 190 Thr Pro Glu Ser Glu Lys Leu Arg Arg Glu Tyr Ile Thr Phe Met Lys 195 200 205 Gly Ile Ile Ser Ala Pro Leu Asn Leu Pro Gly Thr Ala Tyr Arg Arg 210 215 2201 D IU 13 Leu Ile Leu Leu Leu Lys Leu Phe Lys Arg Lys Lys Ser Tyr Asn 20 25 30 Leu Pro Gly Asn Met Gly Trp Pro Tyr Leu Gly Glu Thr Leu Gly 35 40 45 Tyr Leu Lys Pro Tyr Cys Ala Ile Thr Thr Gly Asp Phe Met Glu Gln 50 55 60 His Ile Be Arg Tyr Gly Lys Ile Tyr Lys Ser Asn Leu Phe Gly Tyr 65 70 75 80 Pro Thr Ile Val Ser Val Asp Asn Glu Gly Arg Leu Phe Glu Cys To Be Tyr Pro To Be Leu Gly Gly 100 105 110 Ile Leu Gly Lys Trp To Met Leu Val Leu Val Gly Asp Met His Lys 115 120 125 Asn Met Arg Met Ile To Be Val Asn Phe Met To Be Wing Arg Leu Arg 130 135 140 Thr His Leu Ile Gln Asp Val Glu Thr Gln Wing Alu Leu Leu Val Leu Lys 145 150 155 160 Ser Trp Gln Val Asp Lys Ile Leu Wing Gln Asp Glu Ala Lys Lys 165 170 175 Phe Thr Phe Asn Leu Ile Val Lys Asn Ile Met Being Met Glu Pro Gly 180 185 190 Pro Thr lu Being Glu Lys Leu Arg Arg Glu Tyr Ile Thr Phe Met Lys 195 200 205 Gly Ile Ile Being Pro Wing Read Asn Leu Pro Gly Thr Wing Tyr Arg 210 210 220 220

Ala Leu Lys Ser Arg Ser Asn Ile Leu Gln Leu Ile Glu His Asn Met 225 230 235 240Wing Read Lys Be Arg Be Asn Ile Read Gln Read Ile Glu His Asn Met 225 230 235 240

Asn Glu Arg Leu Gln Lys Thr Asn Gly Asp Gly Lys Lys Val Glu AspAsn Glu Arg Read Le Gln Lys Thr Asn Gly Asp Gly Lys Lys Val Glu Asp

245 250 255245 250 255

Asp Asp Leu Leu Gly Trp Val Leu Lys His Ser Asn Leu Thr Thr GluAsp Asp Leu Leu Gly Trp Val Leu Lys His Ser Asn Leu Thr Thr Glu

260 265 270260 265 270

Gln Ile Leu Asp Leu Ile Leu Ser Met Leu Phe Ala Gly His Glu ThrGln Ile Leu Asp Leu Ile Leu Be Met Leu Phe Ala Gly His Glu Thr

275 280 285275 280 285

Ser Ser Val Ser Ile Ser Leu Ala Ile Tyr Leu Leu Gln Gly Cys LeuSer Ser Val Ser Ile Ser Leu Wing Ile Tyr Leu Leu Gln Gly Cys Leu

290 295 300290 295 300

Lys Ala Val Glu Glu Leu Arg Glu Glu His Ile Arg Ile Ala Lys Ala 305 310 315 320Lys Wing Val Glu Glu Leu Arg Glu Glu His Ile Arg Ile Wing Lys Wing 305 310 315 320

Lys Glu Gln Ala Gly Gln Arg Ser Gly Leu Asn Trp Glu Asp Tyr LysLys Glu Gln Wing Gly Gln Arg Be Gly Read Asn Trp Glu Asp Tyr Lys

325 330 335325 330 335

His Met Glu Phe Thr Gln Cys Xaa Phe Leu His Arg Lys Thr Leu LysHis Met Glu Phe Thr Gln Cys Xaa Phe Read His Arg Lys Thr Read Lys

340 345 350340 345 350

Asp Val Gln Tyr Lys Gly Tyr Asp Ile Pro Cys Gly Trp Lys Val LeuAsp Val Gln Tyr Lys Gly Tyr Asp Ile Pro Cys Gly Trp Lys Val Leu

355 360 365355 360 365

Pro Val Phe Ala Ala Val His Leu Asp Pro Leu Asn Phe Asp Gln ProPro Val Phe Asa Wing Val His Leu Asp Pro Leu Asn Phe Asp Gln Pro

370 375 380370 375 380

His Ala Phe Asn Pro Trp Arg Trp Gln Asn Gly Lys Thr Ser Thr Thr 385 390 395 400His Ala Phe Asn Pro Trp Arg Trp Gln Asn Gly Lys Thr Be Thr Thr 385 390 395 400

Thr Asn Asn Phe Met Pro Phe Gly Gly Gly Leu Arg Leu Cys Ala GlyThr Asn Asn Phe Met Pro Phe Gly Gly Gly Read Arg Read Le Cys Wing Gly

405 410 415405 410 415

Ser Glu Leu Ala Lys Leu Glu Met Ala Ile Phe Ile His His Leu ValSer Glu Leu Wing Lys Leu Glu Met Wing Ile Phe Ile His His Leu Val

420 425 430420 425 430

Leu Asn Tyr Asp Trp Asp Ile Ala Glu Pro Asp Gln Pro Phe Ala TyrRead Asn Tyr Asp Trp Asp Ile Wing Glu Pro Asp Gln Pro Phe Wing Tyr

435 440 445435 440 445

Pro Phe Val Glu Phe Pro Lys Gly Leu Pro Ile Lys Val Tyr Asp HisPro Phe Val Glu Phe Pro Lys Gly Leu Pro Ile Lys Val Tyr Asp His

450 455 460450 455 460

Gln Cys Leu Thr 465Gln Cys Leu Thr 465

<210> 93 <211> 641 <212> DNA<210> 93 <211> 641 <212> DNA

<213> Triticum aestivum <400> 93<213> Triticum aestivum <400> 93

atggccgcca tcatggcctc cataaccagc gagctccttt tcttcctccc cttcatcctc 60atggccgcca tcatggcctc cataaccagc gagctccttt tcttcctccc cttcatcctc 60

ctggccctgc tcaccttcta caccagcgcc gtggctaaat gccatggcct ccactggtgg 120 agcggccgga cgaagaagag gcggccgaac ctgccgcccg gcgccgtcgg ctggcccttc 180 atcggcgaga ccttcgggta cctccgcgcc cacccggcca cctccatcgg ccagttcatg 240 gaccagcaca tcgcacggta cgggaagata taccggtcga gcctgttcgg ggaccggacg 300 gtggtgtcgg cggacgcggg gctgaaccgg tacatcctgc agaacgaggg gcggctgttc 360 gagtgtagct acccgcggag catcggcggc atccttggca aatggtcgat gctggtgctc 420 gtcggcgacc cccaccgcga gatgcgcttc atctccctca acttcctcag ctccgtccgc 480 ctccgcgccg tgctcctccc ggaggtggag cgccacaccc tcctcgtcct ccgcgactgg 540 ctgccttact cctcctcctc cgtcttctcc gcgcagcacg aagccaagaa gttcacgttt 600 aacctgatgg cgaagaacat catgagcatg gaccccggcg a 641ctggccctgc tcaccttcta caccagcgcc gtggctaaat gccatggcct ccactggtgg 120 agcggccgga cgaagaagag gcggccgaac ctgccgcccg gcgccgtcgg ctggcccttc 180 atcggcgaga ccttcgggta cctccgcgcc cacccggcca cctccatcgg ccagttcatg 240 gaccagcaca tcgcacggta cgggaagata taccggtcga gcctgttcgg ggaccggacg 300 gtggtgtcgg cggacgcggg gctgaaccgg tacatcctgc agaacgaggg gcggctgttc 360 gagtgtagct acccgcggag catcggcggc atccttggca aatggtcgat gctggtgctc 420 gtcggcgacc cccaccgcga gatgcgcttc atctccctca acttcctcag ctccgtccgc 480 ctccgcgccg Tgctcctccc ggaggtggag cgccacaccc tcctcgtcct ccgcgactgg 540 ctgccttact cctcctcctc cgtcttctcc

<210> 94 <211> 213 <212> PRT<210> 94 <211> 213 <212> PRT

<213> Triticum aestivum <400> 94<213> Triticum aestivum <400> 94

Met Ala Ala Ile Met Ala Ser Ile Thr Ser Glu Leu Leu Phe Phe Leu 15 10 15Met Wing Ile Wing Met Wing Ile Thr Be Glu Leu Leu Phe Phe Leu 15 10 15

Pro Phe Ile Leu Leu Ala Leu Leu Thr Phe Tyr Thr Ser Ala Val AlaPro Phe Ile Leu Leu Wing Leu Leu Thr Phe Tyr Thr Ser Wing Val Wing

20 25 3020 25 30

Lys Cys His Gly Leu His Trp Trp Ser Gly Arg Thr Lys Lys Arg ArgLys Cys His Gly Read His Trp Trp Being Gly Arg Thr Lys Lys Arg

35 40 4535 40 45

Pro Asn Leu Pro Pro Gly Ala Val Gly Trp Pro Phe Ile Gly Glu ThrPro Asn Leu Pro Pro Gly Wing Val Gly Trp Pro Phe Ile Gly Glu Thr

50 55 6050 55 60

Phe Gly Tyr Leu Arg Ala His Pro Ala Thr Ser Ile Gly Gln Phe Met 65 70 75 80Phe Gly Tyr Read Arg Wing His Pro Wing Thr Be Ile Gly Gln Phe Met 65 70 75 80

Asp Gln His Ile Ala Arg Tyr Gly Lys Ile Tyr Arg Ser Ser Leu PheAsp Gln His Ile Arg Wing Tyr Gly Lys Ile Tyr Arg Be Ser Leu Phe

85 90 9585 90 95

Gly Asp Arg Thr Val Val Ser Ala Asp Ala Gly Leu Asn Arg Tyr IleGly Asp Arg Thr Val Val Ser Wing Asp Wing Gly Leu Asn Arg Tyr Ile

100 105 110100 105 110

Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg Ser IleRead Gln Asn Glu Gly Arg Read Phe Glu Cys Be Tyr Pro Arg Be Ile

115 120 125115 120 125

Gly Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp ProGly Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp Pro

130 135 140130 135 140

His Arg Glu Met Arg Phe Ile Ser Leu Asn Phe Leu Ser Ser Val Arg 145 150 155 160His Arg Glu Met Arg Phe Ile Be Read Asn Phe Read Be Be Val Arg 145 150 155 160

Leu Arg Ala Val Leu Leu Pro Glu Val Glu Arg His Thr Leu Leu ValLeu Arg Val Wing Leu Leu Pro Glu Val Glu Arg His Thr Leu Leu Val

165 170 175165 170 175

Leu Arg Asp Trp Leu Pro Tyr Ser Ser Ser Ser Val Phe Ser Ala GlnLeu Arg Asp Trp Leu Pro Tyr Ser Ser Ser Ser Val Phe Ser Ala Gln

180 185 190180 185 190

His Glu Ala Lys Lys Phe Thr Phe Asn Leu Met Ala Lys Asn Ile MetHis Glu Alys Lys Lys Phe Thr Phe Asn Leu Met Alys Lys Asn Ile Met

195 200 205195 200 205

Ser Met Asp Pro Gly 210 <210> 95 <211> 791 <212> DNASer Met Asp Pro Gly 210 <210> 95 <211> 791 <212> DNA

<213> Triticum aestivum <400> 95<213> Triticum aestivum <400> 95

ggaaggccct caagtcgcga gccaccatac ttggagtaat ggcttgagaa aatgaataag gaggcctcga gcatggaaga cgatgaagca gtccaatctt tcgaaagaac aaatattgga ttgccgggca tgagacatcg tcaatggcgc tcgccctcgc gccctaaagc cgttgaagaa ctgcgggagg agcatcttga tgagagggga gtgcaaactg agctgggaag actacaaaga ttataaacga gaccttgcgg ctaggcaacg tggtcaggtt gagatgtgca ctacaatggg tatgacatcc cgagcggatg cggcggtgca tctcgactcg tcgctgtacg aggaccccag ggaagggcaa cgcgtccggc gtggcgcaga acagtaactt cgaggctctg cgccgggtcg gagctcgcca agctcgagat tggtgctcaa cttccggtgg gagctcgccg agcccgacca tcgacttccc caagggcctg cccatcaggg tccataggat aagaggagta a <210> 96 <211> 261 <212> PRTggaaggccct caagtcgcga gccaccatac ttggagtaat ggcttgagaa aatgaataag gaggcctcga gcatggaaga cgatgaagca gtccaatctt tcgaaagaac aaatattgga ttgccgggca tgagacatcg tcaatggcgc tcgccctcgc gccctaaagc cgttgaagaa ctgcgggagg agcatcttga tgagagggga gtgcaaactg agctgggaag actacaaaga ttataaacga gaccttgcgg ctaggcaacg tggtcaggtt gagatgtgca ctacaatggg tatgacatcc cgagcggatg cggcggtgca tctcgactcg tcgctgtacg aggaccccag ggaagggcaa cgcgtccggc gtggcgcaga acagtaactt cgaggctctg cgccgggtcg gagctcgcca agctcgagat tggtgctcaa cttccggtgg gagctcgccg agcccgacca tcgacttccc caagggcctg cccatcaggg tccataggat aagaggagta at <210> 96 <211> 261 <212> PRT

<213> Triticum aestivum <400> 96<213> Triticum aestivum <400> 96

Lys Ala Leu Lys Ser Arg Ala Thr Ile Leu Gly Val Ile Glu Arg Lys 15 10 15Lys Wing Leu Lys Be Arg Wing Thr Ile Leu Gly Val Ile Glu Arg Lys 15 10 15

Met Glu Glu Arg Leu Glu Lys Met Asn Lys Glu Ala Ser Ser Met GluMet Glu Glu Arg Read Leu Glu Lys Met Asn Lys Glu Wing Ser Be Met Glu

20 25 3020 25 30

Glu Asp Asp Leu Leu Gly Trp Ala Met Lys Gln Ser Asn Leu Ser LysGlu Asp Asp Leu Read Gly Trp Wing Met Lys Gln Be Asn Leu Be Lys

35 40 4535 40 45

Glu Gln Ile Leu Asp Leu Leu Leu Ser Leu Leu Phe Ala Gly His GluGlu Gln Ile Leu Asp Leu Leu Leu Seru Leu Phe Ala Gly His Glu

50 55 6050 55 60

Thr Ser Ser Met Ala Leu Ala Leu Ala Ile Phe Phe Leu Glu Gly Cys 65 70 75 80Thr Be Ser Met Wing Leu Wing Leu Wing Ile Phe Phe Leu Glu Gly Cys 65 70 75 80

Pro Lys Ala Val Glu Glu Leu Arg Glu Glu His Leu Glu Ile Ala ArgPro Lys Wing Valu Glu Glu Leu Arg Glu Glu His Leu Glu Ile Arg Wing

85 90 9585 90 95

Arg Gln Lys Leu Arg Gly Glu Cys Lys Leu Ser Trp Glu Asp Tyr LysArg Gln Lys Read Arg Gly Glu Cys Lys Read Ser Trp Glu Asp Tyr Lys

100 105 110100 105 110

Glu Met Val Phe Thr Gln Cys Val Ile Asn Glu Thr Leu Arg Leu GlyGlu Met Val Phe Thr Gln Cys Val Ile Asn Glu Thr Leu Arg Leu Gly

115 120 125115 120 125

Asn Val Val Arg Phe Leu His Arg Lys Val Ile Arg Asp Val His TyrAsn Val Val Arg Phe Read His Arg Lys Val Ile Arg Asp Val His Tyr

130 135 140130 135 140

Asn Gly Tyr Asp Ile Pro Ser Gly Trp Lys Ile Leu Pro Val Leu Ala 145 150 155 160Asn Gly Tyr Asp Ile Pro Ser Gly Trp Lys Ile Leu Pro Val Leu Wing 145 150 155 160

agagaggaaa agatgatctt cctcttgctg catcttcttc gattgctagg gatggttttc cctgcaccgg gaaaattctg cagcttcaac catgccctac ggccatcttc ggcgttcgtg tgcacaggaaagagaggaaa agatgatctt cctcttgctg catcttcttc gattgctagg gatggttttc cctgcaccgg gaaaattctg cagcttcaac catgccctac ggccatcttc ggcgttcgtg tgcacaggaa

atggaggaaa ctcgggtggg agcttgctgt ctcgaaggtt agacagaagc acgcaatgcg aaggtcattc ccggtgttag ccttggagat ggcggcggca ctgcaccacc tacccgttcg gaagaaggagatggaggaaa ctcgggtggg agcttgctgt ctcgaaggtt agacagaagc acgcaatgcg aaggtcattc ccggtgttag ccttggagat ggcggcggca ctgcaccacc tacccgttcg gaagaaggag

60 120 180 240 300 360 420 480 540 600 660 720 780 791 Ala Val His Leu Asp Ser Ser Leu Tyr Glu Asp Pro Ser Ser Phe Asn60 120 180 240 300 360 420 480 540 600 660 720 780 791 Wing Val His Read Asp Ser Be Read Tyr Glu Asp Pro Be Phe Asn

165 170 175165 170 175

Pro Trp Arg Trp Lys Gly Asn Ala Ser Gly Val Ala Gln Asn Ser AsnPro Trp Arg Trp Lys Gly Asn Wing Be Gly Val Wing Gln Asn Be Asn

180 185 190180 185 190

Phe Met Pro Tyr Gly Gly Gly Thr Arg Leu Cys Ala Gly Ser Glu LeuPhe Met Pro Tyr Gly Gly Gly Thr Arg Leu Cys Wing Gly Ser Glu Leu

195 200 205195 200 205

Ala Lys Leu Glu Met Ala Ile Phe Leu His His Leu Val Leu Asn PheWing Lys Leu Glu Met Wing Ile Phe His His Leu Val Leu Asn Phe

210 215 220210 215 220

Arg Trp Glu Leu Ala Glu Pro Asp Gln Ala Phe Val Tyr Pro Phe Val 225 230 235 240Arg Trp Glu Leu Glu Pro Wing Asp Gln Wing Phe Val Tyr Pro Phe Val 225 230 235 240

Asp Phe Pro Lys Gly Leu Pro Ile Arg Val His Arg Ile Ala Gln GluAsp Phe Pro Lys Gly Leu Pro Ile Arg Val His Arg Ile Wing Gln Glu

245 250 255245 250 255

Glu Glu Gly Glu Glu 260Glu Glu Gly Glu Glu 260

<210> 97 <211> 789 <212> DNA<210> 97 <211> 789 <212> DNA

<213> Euphorbia esula <220><213> Euphorbia esula <220>

<221> misc_feature <222> (325)..(326) <223> η is a, c, g, ou t <400> 97<221> misc_feature <222> (325) .. (326) <223> η is a, c, g, or t <400> 97

agcatggacc ctggaaaacc agagactgaa aagctcaaga aagaatatgt tactttcatg aaaggagttg tttctgctcc tattaatttg cctggaactg cttatagaag ggccttacag tctcgatcga caattttgaa gttcatagag gagaaaatgg aggaaagaaa tgaaaaatta aaagaaggaa aagcagagga agaagaagaa gatgatcttc taggatgggt tttaaagcat tcaaatcttt caactgagca aattctagat ttggtattaa gtttaatgtt tgctggccat gaaacttctt cagtagcaat tcttnnagct atctattttt tgcaagattc tcctgctgct cttcaacagc taagggaaga acataaggaa attgaaaaag ccaagaagca gtcaggagag aagggattga actgggatgt ttacaaaaat atggaattca ctcagtgtgt tatcaatgaa acactaagac ttggaaatgt agtcaggttc cttcatagga agactattaa acacgttcaa tacaaaggat atgacattcc acgtggatgg aaagtgctgc cagtgattgc agccgtgcat ttggacagta gccattttga gaagcctcaa cacttcaatc catggagatg gttgcaccag aataatggga tacaaaatat gaataataat ttcatgccat ttgggggagg accaagatta tgtgcaggat cagaattagc aaaactagaa atggctattt ttattcatca tttggtcctt aattaccag <210> 98 <211> 263 <212> PRTagcatggacc ctggaaaacc agagactgaa aagctcaaga aagaatatgt tactttcatg aaaggagttg tttctgctcc tattaatttg cctggaactg cttatagaag ggccttacag tctcgatcga caattttgaa gttcatagag gagaaaatgg aggaaagaaa tgaaaaatta aaagaaggaa aagcagagga agaagaagaa gatgatcttc taggatgggt tttaaagcat tcaaatcttt caactgagca aattctagat ttggtattaa gtttaatgtt tgctggccat gaaacttctt cagtagcaat tcttnnagct atctattttt tgcaagattc tcctgctgct cttcaacagc taagggaaga acataaggaa attgaaaaag ccaagaagca gtcaggagag aagggattga actgggatgt ttacaaaaat atggaattca ctcagtgtgt tatcaatgaa acactaagac ttggaaatgt agtcaggttc cttcatagga agactattaa acacgttcaa tacaaaggat atgacattcc acgtggatgg aaagtgctgc cagtgattgc agccgtgcat ttggacagta gccattttga gaagcctcaa cacttcaatc catggagatg gttgcaccag aataatggga tacaaaatat gaataataat ttcatgccat ttgggggagg accaagatta tgtgcaggat cagaattagc aaaactagaa atggctattt ttattcatca tttggtcctt aattaccag <210> 98 <211> 263 <212> PRT

<213> Euphorbia esula <220><213> Euphorbia esula <220>

<221> INSEGURO <222> (109)..(109)<221> UNSAFE <222> (109) .. (109)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 98<223> Xaa can be any naturally occurring amino acid <400> 98

Ser Met Asp Pro Gly Lys Pro Glu Thr Glu Lys Leu Lys Lys Glu Tyr 1 5 10 15 Val Thr Phe Met 20 Lys Gly Val Val Ser 25 Ala Pro Ile Asn Leu 30 Pro Gly Thr Ala Tyr Arg Arg Ala Leu Gln Ser Arg Ser Thr Ile Leu Lys PheSer Met Asp Pro Gly Lys Pro Glu Thr Glu Lys Leu Lys Lys Glu Tyr 1 5 10 15 Val Thr Phe Met 20 Lys Gly Val Val Ser 25 Wing Pro Ile Asn Leu 30 Pro Gly Thr Wing Tyr Arg Wing Thr Ile Read Lys Phe

3535

Ile Glu Glu Lys 50Ile Glu Glu Lys 50

4040

4545

Met Glu Glu Arg Asn Glu Lys Leu Lys Glu Gly LysMet Glu Glu Arg Asn Glu Lys

5555

6060

Ala Glu Glu Glu Glu Glu Asp Asp Leu Leu Gly Trp Val Leu Lys HisGlu Wing Glu Glu Glu Glu Asp Asp Leu Leu Gly Trp Val Leu Lys His

6565

7070

7575

8080

Ser Asn Leu Ser Thr Glu Gln Ile Leu Asp Leu Val Leu Ser Leu MetSer Asn Leu Ser Thr Glu Gln Ile Leu Asp Leu Val Leu Ser Leu Met

85 90 9585 90 95

Phe Ala Gly His Glu Thr Ser Ser Val Ala Ile Leu Xaa Ala Ile TyrPhe Ala Gly His Glu Thr Be Ser Val Ala Ile Leu Xaa Ala Ile Tyr

100 105 110100 105 110

Phe Leu Gln Asp Ser Pro Ala Ala Leu Gln Gln Leu Arg Glu Glu HisPhe Leu Gln Asp Ser Pro Wing Ward Leu Gln Gln Leu Arg Glu Glu His

115 120 125115 120 125

Lys Glu Ile Glu Lys Ala Lys Lys Gln Ser Gly Glu Lys Gly Leu AsnLys Glu Ile Glu Lys Wing Lys Lys Gln Ser Gly Glu Lys Gly Leu Asn

60 120 180 240 300 360 420 480 540 600 660 720 780 789 130 135 14060 120 180 240 300 360 420 480 540 600 660 720 780 789 130 135 140

Trp Asp Val Tyr Lys Asn Met Glu Phe Thr Gln Cys Val Ile Asn Glu 145 150 155 160Trp Asp Val Tyr Lys Asn Met Glu Phe Thr Gln Cys Val Ile Asn Glu 145 150 155 160

Thr Leu Arg Leu Gly Asn Val Val Arg Phe Leu His Arg Lys Thr IleThr Read Le Arg Read Gly Asn Val Val Arg Phe Read His Arg Lys Thr Ile

165 170 175165 170 175

Lys His Val Gln Tyr Lys Gly Tyr Asp Ile Pro Arg Gly Trp Lys ValLys His Val Gln Tyr Lys Gly As Tyr Asp Ile Pro Arg Gly Trp Lys Val

180 185 190180 185 190

Leu Pro Val Ile Ala Ala Val His Leu Asp Ser Ser His Phe Glu LysLeu Pro Val Ile Wing Val Val Wing Leu Asp Ser Be His Phe Glu Lys

195 200 205195 200 205

Pro Gln His Phe Asn Pro Trp Arg Trp Leu His Gln Asn Asn Gly IlePro Gln His Phe Asn Pro Trp Arg Trp Read His Gln Asn Asn Gly Ile

210 215 220210 215 220

Gln Asn Met Asn Asn Asn Phe Met Pro Phe Gly Gly Gly Pro Arg Leu 225 230 235 240Gln Asn Met Asn Asn Asn Pn Met Asn Pn Gn Gly Gly Gly Pro Arg Leu 225 230 235 240

Cys Ala Gly Ser Glu Leu Ala Lys Leu Glu Met Ala Ile Phe Ile HisCys Wing Gly Ser Glu Leu Wing Lys Leu Glu Met Wing Ile Phe Ile His

245 250 255245 250 255

His Leu Val Leu Asn Tyr Gln 260His Leu Val Leu Asn Tyr Gln 260

<210> 99 <211> 955 <212> DNA<210> 99 <211> 955 <212> DNA

<213> Gossypium hirsutum <400> 99<213> Gossypium hirsutum <400> 99

atgcctgact cagagcctat tttcttgctt cttccatcta ttttatcttt gattctgttc ttcattctca tcaagagaaa gcaaagaagg tataatcttc caccagggaa catggggtgg ccttttctcg gcgaaacaat cggttacttg aggccttact ctgctacttc agtaggtgaa ttcatgcacc agcatatatc aaggtatggg aatatctaca aatcgaattt gtttggtgag aagacaatag tgtctgcaga tgctgggttg aacaagttca tattacaaaa cgaagggaga ttattcgagt gcagttaccc gagaagcatt ggtggcattc ttgggaaatg gtcgatgctg gttttggttg gggatatgca tagagacatg aggattatat cactcaactt cttgagcaac gccaggctga ggactcatct tttgagagaa gtggagaaac atactttgct tgttctaaat acttggaaag agaagtgcat attttcagct caggatgaag caaaaaagtt cactttcaat ttgatggcaa aaaatatcat gagcatggac cctggacatc cagagacgga gcagctaaag aaagaatatg ttactttcat gaaaggagtc gtttctgctc ctttaaattt acctggaact gcatacagaa aagccttaca atctcgatca acaatcctga aatttattga aaagaaaatg gaagtaagga taaggaaaat gaaggaagga aaagaaaact cagaggaaga tgatcttctt gaatgggtct taaagcattc taatctttcc acagagcaaa tccttgactt gattttgagc ttgctttttg ctggacatga gacttcctcg gtagccataa ccttagccat ctacttcttg ccaggttgtc ctttggccat tcaacagttg agagaggaac accttgaagt tgcag <210> 100 <211> 333 <212> PRTatgcctgact cagagcctat tttcttgctt cttccatcta ttttatcttt gattctgttc ttcattctca tcaagagaaa gcaaagaagg tataatcttc caccagggaa catggggtgg ccttttctcg gcgaaacaat cggttacttg aggccttact ctgctacttc agtaggtgaa ttcatgcacc agcatatatc aaggtatggg aatatctaca aatcgaattt gtttggtgag aagacaatag tgtctgcaga tgctgggttg aacaagttca tattacaaaa cgaagggaga ttattcgagt gcagttaccc gagaagcatt ggtggcattc ttgggaaatg gtcgatgctg gttttggttg gggatatgca tagagacatg aggattatat cactcaactt cttgagcaac gccaggctga ggactcatct tttgagagaa gtggagaaac atactttgct tgttctaaat acttggaaag agaagtgcat attttcagct caggatgaag caaaaaagtt cactttcaat ttgatggcaa aaaatatcat gagcatggac cctggacatc cagagacgga gcagctaaag aaagaatatg ttactttcat gaaaggagtc gtttctgctc ctttaaattt acctggaact gcatacagaa aagccttaca atctcgatca acaatcctga aatttattga aaagaaaatg gaagtaagga taaggaaaat gaaggaagga aaagaaaact cagaggaaga tgatcttctt gaatgggtct taaagcattc taatctttcc acagagcaaa tccttgactt gattttgagc ttgctttttg ctggacatga gacttcctcg gtagccataa ccttagccat ctacttcttg ccaggttgtc ctttggccat tcaacagttg agagaggaac accttgaagt tgcag <210> 100 <211> 333 <212> PRT

<213> Gossypium hirsutum <220><213> Gossypium hirsutum <220>

<221> INSEGURO <222> (326)..(326)<221> UNSAFE <222> (326) .. (326)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 100<223> Xaa can be any naturally occurring amino acid <400> 100

Met Pro Asp Ser Glu Pro Ile Phe Leu Leu Leu Pro Ser Ile Leu Ser 15 10 15Met Pro Asp Be Glu Pro Ile Phe Leu Leu Leu Pro Ser Ile Leu Ser 15 10 15

Leu Ile Leu Phe Phe Ile Leu Ile Lys Arg Lys Gln Arg Arg Tyr AsnLeu Ile Leu Phe Phe Ile Leu Ile Lys Arg Lys Gln Arg Arg Tyr Asn

2020

2525

3030

Leu Pro Pro Gly Asn Met Gly Trp Pro Phe Leu Gly Glu Thr Ile GlyRead Pro Gly Asn Met Gly Trp Pro Phe Read Gly Glu Thr Ile Gly

3535

4040

4545

Tyr Leu Arg Pro Tyr Ser Ala Thr Ser Val Gly Glu Phe Met His GlnTyr Leu Arg Pro Tyr Be Wing Thr Be Val Gly Glu Phe Met His Gln

5050

5555

6060

His 65His 65

Ile Ser Arg Tyr Gly Asn Ile Tyr Lys Ser Asn Leu Phe Gly GluIle Be Arg Tyr Gly Asn Ile Tyr Lys Be Asn Leu Phe Gly Glu

7070

7575

8080

Lys Thr Ile Val Ser Ala Asp Ala Gly Leu Asn Lys Phe Ile Leu GlnLys Thr Ile Val Ser Wing Asp Wing Gly Leu Asn Lys Phe Ile Leu Gln

8585

9090

9595

Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg Ser Ile Gly GlyAsn Glu Gly Arg Read Phe Glu Cys Be Tyr Pro Arg Be Ile Gly Gly

100100

105105

110110

Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp Met His ArgIle Leu Gly Lys Trp Being Met Leu Val Leu Val Gly Asp Met His Arg

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 95560 120 180 240 300 360 420 480 540 600 660 720 780 840 900 955

115115

120120

125 Asp Met Arg Ile Ile Ser Leu Asn Phe Leu Ser125 Asp Met Arg Ile Ile Ser Read Asn Phe Read Ser

130130

135135

Thr His Leu Leu Arg Glu Val Glu Lys His ThrThr His Leu Leu Arg Glu Val Glu Lys His Thr

Asn Ala 140Asn Wing 140

Leu LeuLeu Leu

Arg Leu Val LeuArg Leu Val Leu

ArgArg

AsnAsn

145145

150150

165165

170170

180180

185185

195195

200200

210210

215215

225225

230230

245245

250250

260260

265265

275275

280280

290290

295295

305305

310310

155 160 Gln Asp Glu Ala Lys 175 Lys Met Ser Met Asp 190 Pro Gly Tyr Val Thr 205 Phe Met Lys Gly Thr 220 Ala Tyr Arg Lys Phe Ile Glu Lys Lys Met 235 240 Lys Glu Asn Ser Glu 255 Glu Ser Asn Leu Ser 270 Thr Glu Phe Ala Gly 285 His Glu Thr Phe Leu 300 Pro Gly Cys Pro Leu Lys Leu Gln Ser Gln 315 320 Asp Thr Glu155 160 Gln Asp Glu Wing Lys 175 Lys Met Ser As As 190 Pro Gly Tyr Val Thr 205 Phe Met Lys Gly Thr 220 As Tyr Arg Lys Phe Ile Glu As Lys Met 235 240 Lys Glu Asn As Glu 255 Thr Glu Phe Ala Gly 285 His Glu Thr Phe Leu 300 Pro Gly Cys Pro Leu Lys Leu Gln Ser Gln 315 320 Asp Thr Glu

325325

330330

<210> 101 <211> 832 <212> DNA<210> 101 <211> 832 <212> DNA

<213> Lycopersicon esculentum <4 00> 101<213> Lycopersicon esculentum <4 00> 101

atgggttggc cttttcttgg tgaaactatt ggctatttga gaccttattc agctactact 60atgggttggc cttttcttgg tgaaactatt ggctatttga gaccttattc agctactact 60

attggagatt tcatgcaaga tcatatctct aggtatggga aaattttcaa gtcaaatttg 120attggagatt tcatgcaaga tcatatctct aggtatggga aaattttcaa gtcaaatttg 120

tttggagagc caacaatagt ttcagcagat gcagggctaa acagatacat tctgcagaat 180tttggagagc caacaatagt ttcagcagat gcagggctaa acagatacat tctgcagaat 180

gaagggagat tatttgagtg taattatcca agaagtatag gtgggatact tggtaaatgg 240 tctatgttag ttcaagttgg acaaatgcat agagatatga ggatgatttc tctgaatttt 300gaagggagat tatttgagtg taattatcca agaagtatag gtgggatact tggtaaatgg 240 tctatgttag ttcaagttgg acaaatgcat agagatatga ggatgatttc tctgaatttt 300

ttgagcaatg ctaggctaag gaatcaactt ttaagtgaag ttgaaaagca tactttgctt 360ttgagcaatg ctaggctaag gaatcaactt ttaagtgaag ttgaaaagca tactttgctt 360

gttcttggct cttggaaaca ggattctgtt gtttgtgcac aagatgaagc aaagaagtta 420gttcttggct cttggaaaca ggattctgtt gtttgtgcac aagatgaagc aaagaagtta 420

acattcaact ttatggcaga gcatatcatg agtctacaac ctggaaatcc agagacagag 480acattcaact ttatggcaga gcatatcatg agtctacaac ctggaaatcc agagacagag 480

aagctgaaaa aagagtacat cacatttatg aaaggagtgg tttctgctcc attgaatttt 540aagctgaaaa aagagtacat cacatttatg aaaggagtgg tttctgctcc attgaatttt 540

ccaggaacag cttacagaaa ggccttacag tctcgatcaa caattcttgg atttattgag 600ccaggaacag cttacagaaa ggccttacag tctcgatcaa caattcttgg atttattgag 600

agaaaaatgg aggagaggct taaggaaatg aacagaaacg aaaacgacct tctaggttgg 660agaaaaatgg aggagaggct taaggaaatg aacagaaacg aaaacgacct tctaggttgg 660

gttctgaaga attcaaatct ctcaaaagag caaattcttg atttgctact gagtttgctc 720gttctgaaga attcaaatct ctcaaaagag caaattcttg atttgctact gagtttgctc 720

tttgctggcc atgaaacttc atcagtagca atagctctgt ctattttctt actcgaaagc 780tttgctggcc atgaaacttc atcagtagca atagctctgt ctattttctt actcgaaagc 780

tgtcctgctg ctgttcaaca attaacagaa gagcacttgg agatttcccg gg 832 <210> 102 <211> 277 <212> PRTtgtcctgctg ctgttcaaca attaacagaa gagcacttgg agatttcccg gg 832 <210> 102 <211> 277 <212> PRT

<213> Lycopersicon esculentum <4 00> 102<213> Lycopersicon esculentum <4 00> 102

Met Gly Trp Pro Phe Leu Gly Glu Thr Ile GlyMet Gly Trp Pro Phe Leu Gly Glu Thr Ile Gly

1010

Tyr Leu ArgTyr Leu Arg

Ser Ala Thr Thr Ile Gly Asp Phe Met Gln Asp HisBe Wing Thr Thr Ile Gly Asp Phe Met Gln Asp His

20 2520 25

Gly Lys Ile Phe Lys Ser Asn Leu Phe Gly Glu ProGly Lys Ile Phe Lys Ser Asn Leu Phe Gly Glu Pro

3535

4040

Ala Asp Ala Gly Leu Asn Arg Tyr Ile Leu GlnWing Asp Wing Gly Leu Asn Arg Tyr Ile Leu Gln

5050

5555

Phe Glu Cys Asn Tyr Pro Arg Ser Ile Gly GlyPhe Glu Cys Asn Tyr Pro Arg Be Ile Gly Gly

Asn 60 IleAsn 60 Ile

Ile SerIle Ser

30 Thr Ile 4530 Thr Ile 45

Glu GlyGlu Gly

6565

7070

7575

Ser Met Leu Val Gln Val Gly Gln Met His Arg AspSer Met Leu Val Gln Val Gly Gln Met His Arg Asp

85 9085 90

Ser Leu Asn Phe Leu Ser Asn Ala Arg Leu Arg AsnSer As Leu Asn Phe Ser As Le Asn Ala Arg As Le Arg Asn

Leu Gly Met Arg Gln LeuRead Gly Met Arg Gln Read

Pro Tyr 15Pro Tyr 15

Arg TyrArg tyr

Val SerVal ser

Arg LeuArg Leu

Lys Trp 80 Met Ile 95Lys Trp 80 Met Ile 95

Leu Ser 100 105 110Read Ser 100 105 110

Glu Val Glu Lys His Thr Leu Leu Val Leu Gly Ser Trp LysGlu Val Glu Lys His Thr Leu Leu Val Leu Gly Ser Trp Lys

115 120 125115 120 125

Ser Val Val Cys Ala Gln Asp Glu Ala Lys Lys Leu Thr PheSer Val Val Cys Wing Gln Asp Glu Wing Lys Lys Leu Thr Phe

130 135 140130 135 140

Met Ala Glu His Ile Met Ser Leu Gln Pro Gly Asn Pro Glu 145 150 155Met Wing Glu His Ile Met Being Read Gln Pro Gly Asn Pro Glu 145 150 155

Lys Leu Lys Lys Glu Tyr Ile Thr Phe Met Lys Gly Val ValLys Leu Lys Lys Glu Tyr Ile Thr Phe Met Lys Gly Val Val

165 170165 170

Pro Leu Asn Phe Pro Gly Thr Ala Tyr Arg Lys Ala Leu Gln 180 185 190Pro Leu Asn Phe Pro Gly Thr Wing Tyr Arg Lys Wing Leu Gln 180 185 190

Ser Thr Ile Leu Gly Phe Ile Glu Arg Lys Met Glu Glu ArgBeing Thr Ile Read Gly Phe Ile Glu Arg Lys Met Glu Glu Arg

195 200 205195 200 205

Glu Met Asn Arg Asn Glu Asn Asp Leu Leu Gly Trp Val LeuGlu Met Asn Arg Asn Glu Asn Asp Leu Leu Gly Trp Val Leu

210 215 220210 215 220

Ser Asn Leu Ser Lys Glu Gln Ile Leu Asp Leu Leu Leu Ser 225 230 235Ser Asn Leu Ser Lys Glu Gln Ile Leu Asp Leu Leu Le Ser 225 225 235

Phe Ala Gly His Glu Thr Ser Ser Val Ala Ile Ala Leu SerPhe Ala Gly His Glu Thr Be Ser Val Val Ile Ala Leu Ser

245 250245 250

Leu Leu Glu Ser Cys Pro Ala Ala Val Gln Gln Leu Thr Glu 260 265 270Leu Leu Glu Ser Cys Pro Wing Val Wing Gln Gln Leu Thr Glu 260 265 270

Leu Glu Ile Ser ArgRead Glu Ile Ser Arg

275 <210> 103 <211> 711 <212> DNA275 <210> 103 <211> 711 <212> DNA

<213> Solanum tuberosum <400> 103<213> Solanum tuberosum <400> 103

atgtctgact tagagttttt tctttttctt gttcctccaa tcttggcagt cttaatctat tcaaaagaaa acacaaattt caaaatcttc caccagggga ccttttcttg gtgaaactat tggttatttg agaccttact cagttactac ttcatgcaag atcatatctc aaggtatggg aaaattttca agtcaaattt ccaacaattg tttcagcaga tgcagggctt aacagataca ttctgcagaa ttatttgagt gtaattatcc aagaagtata ggtgggatac ttggtaaatg gttcaagttg gacaaatgca tagagatatg aggatgattt ctctgaattt gctagactca ggaatcaact tttaagtgaa gttgaaaagc atactgtgct tcttggaaac aggattctgt tgtttgtgca caagatgaag caaagaagtt tttatggcag agcatatcat gagtctacaa cctggaaatc cagagacaga aaagagtaca tcacatttat gaaaggagtg gtttctgctc cattgaattt gcttacagaa aagccctaca gtctcgatca acaattcttg gaattattga <210> 104 <211> 237 <212> PRTatgtctgact tagagttttt tctttttctt gttcctccaa tcttggcagt cttaatctat tcaaaagaaa acacaaattt caaaatcttc caccagggga ccttttcttg gtgaaactat tggttatttg agaccttact cagttactac ttcatgcaag atcatatctc aaggtatggg aaaattttca agtcaaattt ccaacaattg tttcagcaga tgcagggctt aacagataca ttctgcagaa ttatttgagt gtaattatcc aagaagtata ggtgggatac ttggtaaatg gttcaagttg gacaaatgca tagagatatg aggatgattt ctctgaattt gctagactca ggaatcaact tttaagtgaa gttgaaaagc atactgtgct tcttggaaac aggattctgt tgtttgtgca caagatgaag caaagaagtt tttatggcag agcatatcat gagtctacaa cctggaaatc cagagacaga aaagagtaca tcacatttat gaaaggagtg gtttctgctc cattgaattt gcttacagaa aagccctaca gtctcgatca acaattcttg gaattattga <210> 104 <211> 237 <212> PRT

<213> Solanum tuberosum <400> 104<213> Solanum tuberosum <400> 104

Met Ser Asp Leu Glu Phe Phe Leu Phe Leu Val 1 5 10Met Ser Asp Leu Glu Phe Phe Leu Phe Leu Val 1 5 10

Val Leu Ile Ile Leu Asn Leu Phe Lys Arg LysVal Leu Ile Ile Leu Asn Leu Phe Lys Arg Lys

20 2520 25

Leu Pro Pro Gly Asp Met Gly Trp Pro Phe LeuRead Pro Gly Asp Met Gly Trp Pro Phe Leu

35 4035 40

Tyr Leu Arg Pro Tyr Ser Val Thr Thr Ile Gly AspTyr Leu Arg Pro Tyr Be Val Thr Thr Ile Gly Asp

50 55 6050 55 60

His Ile Ser Arg Tyr Gly Lys Ile Phe Lys Ser Asn Leu Phe 65 70 75His Ile Ser Arg Tyr Gly Lys Ile Phe Lys Ser Asn Leu Phe 65 70 75

Pro Thr Ile Val Ser Ala Asp Ala Gly Leu Asn Arg Tyr IlePro Thr Ile Val Ser Wing Asp Wing Gly Leu Asn Arg Tyr Ile

85 9085 90

Asn Glu Gly Arg Leu Phe Glu Cys Asn Tyr Pro Arg Ser Ile 100 105 110Asn Glu Gly Arg Read Phe Glu Cys Asn Tyr Pro Arg Ser Ile 100 105 110

Ile Leu Gly Lys Trp Ser Met Leu Val Gln Val Gly Gln MetIle Leu Gly Lys Trp Being Met Leu Val Gln Val Gly Gln Met

115 120 125115 120 125

Asp Met Arg Met Ile Ser Leu Asn Phe Leu Ser Asn Ala Arg 130 135 140Asp Met Arg Met Ile Be Read Asn Phe Read Be Asn Wing Arg 130 135 140

GlnGln

AsnAsn

ThrThr

Ser 175 SerBeing 175 Being

LeuRead

LysLys

LeuRead

Ile 255 GluIle 255 Glu

AspAsp

PhePhe

Glu 160 AlaGlu 160 Wing

ArgArg

LysLys

AsnAsn

Leu 240 PheRead 240 Phe

HisHis

ccttattatt tatgggttgg tattggagat gtttggagag tgaagggaga gtctatgttg tttgagcaat tgttcttggc tacattcaac gaagctgaag tccaggaacaccttattatt tatgggttgg tattggagat gtttggagag tgaagggaga gtctatgttg tttgagcaat tgttcttggc tacattcaac gaagctgaag tccaggaaca

gg

Pro Pro IlePro Pro Ile

His Lys Phe 30His Lys Phe 30

Gly Glu Thr 45Gly Glu Thr 45

Phe MetPhe Met

Leu Ala 15Read Wing 15

Gln AsnGln asn

Ile GlyIle gly

Gln AspGln asp

Gly Glu 80Gly Glu 80

Leu Gln 95Read Gln 95

Gly Gly His Arg Leu ArgGly Gly His Arg Read Arg

60 120 180 240 300 360 420 480 540 600 660 711 Asn Gln Leu Leu Ser Glu Val Glu Lys His Thr Val Leu Val Leu Gly 145 150 155 16060 120 180 240 300 360 420 480 540 600 660 711 Asn Gln Leu Leu Be Glu Val Glu Lys His Thr Val Leu Val Leu Gly 145 150 155 160

Ser Trp Lys Gln Asp Ser Val Val Cys Ala Gln Asp Glu Ala Lys LysBe Trp Lys Gln Asp Be Val Val Cys Wing Gln Asp Glu Wing Lys Lys

165 170 175165 170 175

Phe Thr Phe Asn Phe Met Ala Glu His Ile Met Ser Leu Gln Pro GlyPhe Thr Phe Asn Phe Met Glu Wing His Ile Met Being Read Gln Pro Gly

180 185 190180 185 190

Asn Pro Glu Thr Glu Lys Leu Lys Lys Glu Tyr Ile Thr Phe Met LysAsn Pro Glu Thr Glu Lys Read Lys Lys Lys Glu Tyr Ile Thr Phe Met Lys

195 200 205195 200 205

Gly Val Val Ser Ala Pro Leu Asn Phe Pro Gly Thr Ala Tyr Arg LysGly Val Val Ser Wing Pro Read Asn Phe Pro Gly Thr Wing Tyr Arg Lys

210 215 220210 215 220

Ala Leu Gln Ser Arg Ser Thr Ile Leu Gly Ile Ile Glu 225 230 235Wing Read Gln Be Arg Be Thr Ile Read Gly Ile Ile Glu 225 230 235

<210> 105 <211> 431 <212> DNA<210> 105 <211> 431 <212> DNA

<213> Solanum tuberosum <4 00> 105<213> Solanum tuberosum <4 00> 105

ggaaagctgt gaaagatgtt cgatacaaag gttatgacat tccatgtgga tggaaagtat 60ggaaagctgt gaaagatgtt cgatacaaag gttatgacat tccatgtgga tggaaagtat 60

tgccggtgat ttcagcagcg catttagatc cttcactttt tgaccgacct cacgactttg 120 atccttggag atggcagaat gcagaagagt cgccttcagg taaaggagga agcacaggca 180 caagcagcac aacaaaaagt agtaataatt tcatgccatt tgggggaggt ccacgtctat 240 gtgcaggatc tgaactggcc aaacttgaga tggccatttt cattcactat cttgttctta 300 attttcactg gaaattagct gcacctgatc aggcttttgc ctatccttac gtagattttc 360 ccaatgccct accaatcact atccaacatc gatcgtcaaa taaattaaac caccacactt 420 actacctcta a 431tgccggtgat ttcagcagcg catttagatc cttcactttt tgaccgacct cacgactttg 120 atccttggag atggcagaat gcagaagagt cgccttcagg taaaggagga agcacaggca 180 caagcagcac aacaaaaagt agtaataatt tcatgccatt tgggggaggt ccacgtctat 240 gtgcaggatc tgaactggcc aaacttgaga tggccatttt cattcactat cttgttctta 300 attttcactg gaaattagct gcacctgatc aggcttttgc ctatccttac gtagattttc 360 ccaatgccct accaatcact atccaacatc gatcgtcaaa taaattaaac caccacactt 420 to 431 actacctcta

<210> 106 <211> 142 <212> PRT<210> 106 <211> 142 <212> PRT

<213> Solanum tuberosum <4 00> 106<213> Solanum tuberosum <4 00> 106

Lys Ala Val Lys Asp Val Arg Tyr Lys Gly Tyr Asp Ile Pro Cys Gly 15 10 15Lys Wing Val Lys Asp Val Arg Tyr Lys Gly Tyr Asp Ile

Trp Lys Val Leu Pro Val Ile Ser Ala Ala His Leu Asp Pro Ser LeuTrp Lys Val Leu Pro Val Ile Ser Ward Wing His Leu Asp Pro Ser Leu

20 25 3020 25 30

Phe Asp Arg Pro His Asp Phe Asp Pro Trp Arg Trp Gln Asn Ala GluPhe Asp Arg Pro His Asp Phe Asp Pro Trp Arg Trp Gln Asn Wing Glu

35 40 4535 40 45

Glu Ser Pro Ser Gly Lys Gly Gly Ser Thr Gly Thr Ser Ser Thr ThrGlu Be Pro Be Gly Lys Gly Gly Be Thr

50 55 6050 55 60

Lys Ser Ser Asn Asn Phe Met Pro Phe Gly Gly Gly Pro Arg Leu Cys 65 70 75 80Lys Being Ser Asn Asn Phe Met Pro Phe Gly Gly Gly Pro Arg Read Le Cys 65 70 75 80

Ala Gly Ser Glu Leu Ala Lys Leu Glu Met Ala Ile Phe Ile His TyrWing Gly Ser Glu Leu Wing Lys Leu Glu Met Wing Ile Phe Ile His Tyr

85 90 9585 90 95

Leu Val Leu Asn Phe His Trp Lys Leu Ala Ala Pro Asp Gln Ala PheLeu Val Leu Asn Phe His Trp Lys Leu Wing Pro Wing Asp Gln Wing Phe

100 105 110100 105 110

Ala Tyr Pro Tyr Val Asp Phe Pro Asn Ala Leu Pro Ile Thr Ile GlnTyr Wing Pro Tyr Val Asp Phe Pro Asn Wing Read Pro Ile Thr Ile Gln

115 120 125115 120 125

His Arg Ser Ser Asn Lys Leu Asn His His Thr Tyr Tyr LeuHis Arg Being Ser Asn Lys Leu Asn His His Thr Tyr Tyr Leu

130 135 140130 135 140

<210> 107 <211> 52 <212> DNA<210> 107 <211> 52 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm06540 <4 00> 107<223> initiator: prm06540 <4 00> 107

ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc cgccatgatg gc 52ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc cgccatgatg gc 52

<210> 108 <211> 48 <212> DNA<210> 108 <211> 48 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm06520 <4 00> 108 ggggaccact ttgtacaaga aagctgggtt<223> initiator: prm06520 <4 00> 108 ggggaccact ttgtacaaga aagctgggtt

<210> 109<210> 109

<211> 654<211> 654

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 109<400> 109

cttctacatc ggcttaggtg tagcaacacg ttattttaca aaaatataaa atagatcagt ttattgtaaa gttctacaaa gctaatttaa aaacaagagt gtcaatggaa caatgaaaac attgaaatta tataattcaa agagaataaa gcattaccaa aatatatata gcttacaaaa ccttatcaca ttgacacata aagtgagtga atcatgtata tatgatagcc acaaagttac gtgcacctaa cagaatatcc aaataatatg aaaactaaca ctctaaagca accgatggga aatcctcatc atccttcacc acaattcaaa <210> 110 <211> 1236 <212> DNA <213> Oryza sativa <400> 110cttctacatc ggcttaggtg tagcaacacg ttattttaca aaaatataaa atagatcagt ttattgtaaa gttctacaaa gctaatttaa aaacaagagt gtcaatggaa caatgaaaac attgaaatta tataattcaa agagaataaa gcattaccaa aatatatata gcttacaaaa ccttatcaca ttgacacata aagtgagtga atcatgtata tatgatagcc acaaagttac gtgcacctaa cagaatatcc aaataatatg aaaactaaca ctctaaagca accgatggga aatcctcatc atccttcacc acaattcaaa <210> 110 <211> 1236 <212> DNA <213> Oryza sativa <400> 110

ggtcagccaa tacattgatc cgttgccaat ccggaattga taattgtgtt ctgactaaat tatccgaaac ctggattaaa caatcctgtt ttgttttttt gacatgtttt cttgactgag ttttaacttt ttcatcacat cagaactttt acatcgttcc aatttcaatc aaactttcaa ttttattgct cctccgtacg ggttggctgg tagatattgg gaggaacttg gcatgaatgg tgaggaggta ccatgaggta ccaaaatttt ggtattatga ggtaccaaat ttacaataga taccgtaaaa ttgctcctat atttaagggg attttgataa gaaaaaatgt gagcacacca actcgtcaac tgtgaagaac ctcaaaaatg aactttaaag ttttgaacat cgatttcact tgatagttta gaactctaga atcattgtcg tccagctatg aaaaaaccct caccaaacac gcggccatgc tgtcacgcaa cgcaccgcat tccccgtgca catatccgac agacgcgccg gcccatgcaa gcatccaccc ccgccacgta tctctccacc tatatatgcc cacctggccc cttcttcttc ttcttcgttg cattcatctt <210> 111 <211> 1455 <212> DNA <213> Glycine max <220>ggtcagccaa tacattgatc cgttgccaat ccggaattga taattgtgtt ctgactaaat tatccgaaac ctggattaaa caatcctgtt ttgttttttt gacatgtttt cttgactgag ttttaacttt ttcatcacat cagaactttt acatcgttcc aatttcaatc aaactttcaa ttttattgct cctccgtacg ggttggctgg tagatattgg gaggaacttg gcatgaatgg tgaggaggta ccatgaggta ccaaaatttt ggtattatga ggtaccaaat ttacaataga taccgtaaaa ttgctcctat atttaagggg attttgataa gaaaaaatgt gagcacacca actcgtcaac tgtgaagaac ctcaaaaatg aactttaaag ttttgaacat cgatttcact tgatagttta gaactctaga atcattgtcg tccagctatg aaaaaaccct caccaaacac gcggccatgc tgtcacgcaa cgcaccgcat tccccgtgca catatccgac agacgcgccg gcccatgcaa gcatccaccc ccgccacgta tctctccacc tatatatgcc cacctggccc cttcttcttc ttcttcgttg cattcatctt <210> 111 <211> <p> <p>

<221> misc_feature <222> (1043) .. (1044) <223> n is a, c, g, ou t <400> 111<221> misc_feature <222> (1043) .. (1044) <223> is not a, c, g, or t <400> 111

atgtctgact cactcttaac tttctattct ttcatcttca ttctcatcaa aagaaagcaa aacatgggtt ggccatttct tggtgaaacc acagtagggg aattcatgga gcaacacata ctgtttgcgg ggccagcaat agtgtcagca aacgaaggga aattgttcga gtgcagctat tggtccatgt tggtcttagt tggtgacatg tttctaagcc acgccaggct cagaacacac ttggttctga actcttggag ccaaaattcc ttcaccttca atttaatggc taagcatatc gagcaactaa agaaagagta cgtcactttcatgtctgact cactcttaac tttctattct ttcatcttca ttctcatcaa aagaaagcaa aacatgggtt ggccatttct tggtgaaacc acagtagggg aattcatgga gcaacacata ctgtttgcgg ggccagcaat agtgtcagca aacgaaggga aattgttcga gtgcagctat tggtccatgt tggtcttagt tggtgacatg tttctaagcc acgccaggct cagaacacac ttggttctga actcttggag ccaaaattcc ttcaccttca atttaatggc taagcatatc gagcaactaa agaaagagta cgtcactttc

tactcctgct catcatcctactcctgct catcatcc

4848

actttattat ccctcaccac aagttattgc catatgacat tccacatagc catgacaagc tgagtcataa tttgatgatg actcacttag aagcatctat tattatagttactttattat ccctcaccac aagttattgc catatgacat tccacatagc catgacaagc tgagtcataa tttgatgatg actcacttag aagcatctat tattatagtt

tattattatt aagtagagca attaacttat actataattt cgtaaagttc ttagtttgaa tattattttc atatcaaaga atcataatag aaatagacaa gaagcatagttattattatt aagtagagca attaacttat actataattt cgtaaagttc ttagtttgaa tattattttc atatcaaaga atcataatag aaatagacaa gaagcatagt

attattatta agttggtgag ttcatattac tgtttttatt tacatgtggt aaattgcaat tttgctaccc acatttttag agcatcaagt gcacaatgaa agtaattattatta agttggtgag ttcatattac tgtttttatt tacatgtggt aaattgcaat tttgctaccc acatttttag agcatcaagt gcacaatgaa agta

catgcaaagt taaatgacca ctgttctcta gcctgtttgt ctacacatat ttttggcgtg ttgagaatag ccactatatt agtgtaaatt aaaaatagta atgtttatat agcatgtcca ctcaatatag aaacaacaat gcggagaaag catcaaacaa tgcctgatgg tgtcagcgag caccccctcc ctctcctccc gctagccatgcaaagt taaatgacca ctgttctcta gcctgtttgt ctacacatat ttttggcgtg ttgagaatag ccactatatt agtgtaaatt aaaaatagta atgtttatat agcatgtcca ctcaatatag aaacaacaat gcggagaaggcccctagtctcta

attttggctg gaagtcgcta gcccctcctg tctaaacttt aaacttttaa aactaaacac gtattttcag tagagcaatt ttagtatctc cttcatggta ctatccatat tgaccttgca ctacaggtgc tattatctcc taaattattt gagttcacca ccgctcgatg ctcctcgacc tcctccctac atctccacttattttggctg gaagtcgcta gcccctcctg tctaaacttt aaacttttaa aactaaacac gtattttcag tagagcaatt ttagtatctc cttcatggta ctatccatat tgaccttgca ctacaggtgc tattatcccccctctctcgctg

tggccgagtg tcttccaatg catggccgga ttcttcaaac cttttccgtc accctgagtc agagaaaatc ctacggtcct attataacta ctttcttaag ccataatttg ctcttggctc ctgaaaaaat ctctgaaaga tccccaaatt aaccgcccat catgcatgct gacctgtgta gtgtcaccgc cacccgatcgtggccgagtg tcttccaatg catggccgga ttcttcaaac cttttccgtc accctgagtc agagaaaatc ctacggtcct attataacta ctttcttaag ccataatttg ctcttggctc ctgaaaaaat ctctgggacctcgggtcgctg

ctttcagcca agcaaaccca attggctatt gcaaggtatg gatgcaggac cctagaagca catagagaca ctcttgaaag atattctcag atgagcatgg atgaaaggggctttcagcca agcaaaccca attggctatt gcaaggtatg gatgcaggac cctagaagca catagagaca ctcttgaaag atattctcag atgagcatgg atgaaagggg

ttcttgctct ggctcaacct tgaagcctta gtacaattta tcaacaggtt tcggtggaat tgcgggttat aggtggagaa cccaagatga atcctgggga tggtttccgcttcttgctct ggctcaacct tgaagcctta gtacaattta tcaacaggtt tcggtggaat tgcgggttat aggtggagaa cccaagatga atcctgggga tggtttccgc

tctcccaatc tcccccaggt ttctgccacc caagtcaaaa cattctacaa actaggaaaa atcactcaac gcaatccctc agctaagaag tatcgagaca gccattgaattctcccaatc tcccccaggt ttctgccacc caagtcaaaa cattctacaa actaggaaaa atcactcaac gcaatccctc agctaagaag tatcgagaca gccattgaat

60 120 180 240 300 360 420 480 540 600 65460 120 180 240 300 360 420 480 540 600 654

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 123660 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1236

60 120 180 240 300 360 420 480 540 600 660 ttacctggaa ctgcataccg aaaggcattg aagtctcggt ccattatact aaagttcata gaggggaaaa tggaagagag agttagaaga atccaagagg ggaatgagag tttggaggaa gatgatcttc taaattgggt tttgaagaat tcaaatcttt caaccgagca aattcttgac ttgattctca gcttgctctt cgctggccat gaaacttcgt cggtagccat agctctagcc atttacttct tacccggttg tcctcaagct atacaacagt taaaggaaga acacagagaa attgccagag ccaaaaagca agcaggggaa gttgaactca cttgggatga ctacaaacga atggaattta ctcattgtgt aannttggga aatgttgtga ggtttctcca caggaaggct gtgaaagatg ttaactataa aggttatgac attccatgtg ggtggaaagt cctcccggtg attgcagccg tgcatctgga tccttcactt tttgaccaac ctcaacactt caatccatgg agatggcaga acaatggcag tcatggaagt tgtccaagca agaacacagc aaacaacaac tttcttccgt tcggaggagg accacgatta tgtgcaggat cagagttagc taagcttgaa atggctgttt tcattcacca tctcattctc aactaccatt gggaattggc tgataccgat caagcttttg cctacccttt tgtcgacttc cccaaaggcc tacccgttag agtccaagcc cattctttac tttga <210> 112 <211> 530 <212> PRT <213> Glycine max <220>60 120 180 240 300 360 420 480 540 600 660 ttacctggaa ctgcataccg aaaggcattg aagtctcggt ccattatact aaagttcata gaggggaaaa tggaagagag agttagaaga atccaagagg ggaatgagag tttggaggaa gatgatcttc taaattgggt tttgaagaat tcaaatcttt caaccgagca aattcttgac ttgattctca gcttgctctt cgctggccat gaaacttcgt cggtagccat agctctagcc atttacttct tacccggttg tcctcaagct atacaacagt taaaggaaga acacagagaa attgccagag ccaaaaagca agcaggggaa gttgaactca cttgggatga ctacaaacga atggaattta ctcattgtgt aannttggga aatgttgtga ggtttctcca caggaaggct gtgaaagatg ttaactataa aggttatgac attccatgtg ggtggaaagt cctcccggtg attgcagccg tgcatctgga tccttcactt tttgaccaac ctcaacactt caatccatgg agatggcaga acaatggcag tcatggaagt tgtccaagca agaacacagc aaacaacaac tttcttccgt tcggaggagg accacgatta tgtgcaggat cagagttagc taagcttgaa atggctgttt tcattcacca tctcattctc aactaccatt gggaattggc tgataccgat caagcttttg cctacccttt tgtcgacttc cccaaaggcc tacccgttag agtccaagcc cattctttac tttga <210> 112 <211> 530 < 212> PRT <213> Glycine max <220>

<221> INSEGURO <222> (391)..(392)<221> UNSAFE <222> (391) .. (392)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <4 00> 112<223> Xaa can be any naturally occurring amino acid <4 00> 112

Met Ser Asp Ser Leu Leu Thr Phe Tyr Ser Leu Ser Ala Ile Leu Ala 15 10 15Met Ser Asp Ser Leu Leu Thr Phe Tyr Ser Leu Sera Wing Ile Leu Wing 15 10 15

Leu Leu Pro Ile Phe Ile Phe Ile Leu Ile Lys Arg Lys Gln Ser LysRead Leu Pro Ile Phe Ile Phe Ile Read Ile Lys Arg Lys Gln Ser Lys

20 25 3020 25 30

Pro Arg Leu Asn Leu Pro Pro Gly Asn Met Gly Trp Pro Phe Leu GlyPro Arg Read Asn Leu Pro Pro Gly Asn Met Gly Trp Pro Phe Leu Gly

35 40 4535 40 45

Glu Thr Ile Gly Tyr Leu Lys Pro Tyr Ser Ala Thr Thr Val Gly GluGlu Thr Ile Gly Tyr Read Lys Pro Tyr Ser Wing Thr Thr Val Gly Glu

50 55 6050 55 60

Phe Met Glu Gln His Ile Ala Arg Tyr Gly Thr Ile Tyr Lys Ser Lys 65 70 75 80Phe Met Glu Gln His Ile Wing Arg Tyr Gly Thr Ile Tyr Lys Ser Lys 65 70 75 80

Leu Phe Ala Gly Pro Ala Ile Val Ser Ala Asp Ala Gly Leu Asn ArgLeu Phe Wing Gly Pro Wing Ile Val Ser Wing Asp Wing Gly Leu Asn Arg

85 90 9585 90 95

Phe Ile Leu Gln Asn Glu Gly Lys Leu Phe Glu Cys Ser Tyr Pro ArgPhe Ile Read Gln Asn Glu Gly Lys Read Phe Glu Cys Ser Tyr Pro Arg

100 105 110100 105 110

Ser Ile Gly Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val GlySer Ile Gly Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly

115 120 125115 120 125

Asp Met His Arg Asp Met Arg Val Ile Ser Leu Asn Phe Leu Ser HisAsp Met His Arg Asp Met Arg Val Ile Be Read Asn Phe Read His Be

130 135 140130 135 140

Ala Arg Leu Arg Thr His Leu Leu Lys Glu Val Glu Lys Gln Ser Leu 145 150 155 160Arg Wing Arg Read Arg Thr His Leu Read Lys Glu Val Glu Lys Gln Ser Leu 145 150 155 160

Leu Val Leu Asn Ser Trp Ser Gln Asn Ser Ile Phe Ser Ala Gln AspLeu Val Leu Asn Ser Trp Ser Gln Asn Ser Ile Phe Ser Wing Gln Asp

165 170 175165 170 175

Glu Ala Lys Lys Phe Thr Phe Asn Leu Met Ala Lys His Ile Met SerGlu Alys Lys Lys Phe Thr Phe Asn Leu Met Alys Lys His Ile Met Ser

180 185 190180 185 190

Met Asp Pro Gly Asp Ile Glu Thr Glu Gln Leu Lys Lys Glu Tyr ValMet Asp Pro Gly Asp Ile Glu Thr Glu Gln Read Lys Lys Lys Glu Tyr Val

195 200 205195 200 205

Thr Phe Met Lys Gly Val Val Ser Ala Pro Leu Asn Leu Pro Gly ThrThr Phe Met Lys Gly Val Val Ser Wing Pro Leu Asn Leu Pro Gly Thr

210 215 220210 215 220

Ala Tyr Arg Lys Ala Leu Lys Ser Arg Ser Ile Ile Leu Lys Phe Ile 225 230 235 240Wing Tyr Arg Lys Wing Read Lys Be Arg Be Ile Ile Read Lys Phe Ile 225 230 235 240

Glu Gly Lys Met Glu Glu Arg Val Arg Arg Ile Gln Glu Gly Asn GluGlu Gly Lys Met Glu Glu Arg Val Arg Arg Ile Gln

245 250 255245 250 255

Ser Leu Glu Glu Asp Asp Leu Leu Asn Trp Val Leu Lys Asn Ser AsnBe Leu Glu Glu Asp Asp Leu Leu Asn Trp Val Leu Lys Asn Ser Asn

260 265 270260 265 270

Leu Ser Thr Glu Gln Ile Leu Asp Leu Ile Leu Ser Leu Leu Phe AlaLeu Ser Thr Glu Gln Ile Leu Asp Leu Ile Leu Ser Leu Leu Phe Ala

275 280 285275 280 285

Gly His Glu Thr Ser Ser Val Ala Ile Ala Leu Ala Ile Tyr Phe LeuGly His Glu Thr Be Ser Val Wing Ile Wing Leu Wing Ile Tyr Phe Leu

290 295 300290 295 300

Pro Gly Cys Pro Gln Ala Ile Gln Gln Leu Lys Glu Glu His Arg Glu 305 310 315 320Pro Gly Cys Pro Gln Wing Ile Gln Gln Read Lys Glu Glu His Arg Glu 305 310 315 320

720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1455 Ile Ala Arg Ala Lys 325 Lys Gln Ala Gly Glu 330 Val Glu Leu Thr Trp 335 Asp Asp Tyr Lys Arg 340 Met Glu Phe Thr His 345 Cys Val Ser Gly Met 350 Ile Ile Asn Glu Leu 355 Trp Arg Ser Thr Cys 360 Leu Phe Phe Tyr Phe 365 Met Tyr Ser Asn Cys 370 Tyr Tyr Tyr Tyr Leu 375 Met Asn Met Leu Val 380 Val Ser Asn Ile Ile Trp Asp Asp Glu Ala Xaa Xaa Val Gly Leu Gly Asn Val Val Arg 385 390 395 400 Phe Leu His Arg Lys 405 Ala Val Lys Asp Val 410 Asn Tyr Lys Gly Tyr 415 Asp Ile Pro Cys Gly 420 Trp Lys Val Leu Pro 425 Val Ile Ala Ala Val 430 His Leu Asp Pro Ser 435 Leu Phe Asp Gln Pro 440 Gln His Phe Asn Pro 445 Trp Arg Trp Gln Asn 450 Asn Gly Ser His Gly 455 Ser Cys Pro Ser Lys 460 Asn Thr Ala Asn Asn Asn Phe Leu Pro Phe Gly Gly Gly Pro Arg Leu Cys Ala Gly Ser 465 470 475 480 Glu Leu Ala Lys Leu 485 Glu Met Ala Val Phe 490 Ile His His Leu Ile 495 Leu Asn Tyr His Trp 500 Glu Leu Ala Asp Thr 505 Asp Gln Ala Phe Ala 510 Tyr Pro Phe Val Asp 515 Phe Pro Lys Gly Leu 520 Pro Val Arg Val Gln 525 Ala His Ser720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1455 Ile Arg Wing Lys 325 Wing Lys Gln Wing Gly Glu 330 Val Glu Leu Thr Trp 335 Asp Tyr Lys Arg 340 Met Glu Phe Thr His 345 Cys Val Ser Gly Met 350 Ile Ile Asn Glu Leu 355 Trp Arg Be Thr Cys 360 Leu Phe Phe Tyr Phe 365 Met Tyr Ser Asn Cys 370 Tyr Tyr Tyr Tyr Leu 375 Met Asn Met Leu Val 380 Val As Asn Ile Ile Trp Asp Asp Glu Leu Gly Asn Val Val Arg 385 390 395 400 Phe Leu His Arg Lys 405 Wing Val Lys Asp Val 410 Asn Tyr Lys Gly Tyr 415 Asp Ile Pro Cys Gly 420 Trp Lys Val Leu Pro 425 Val Ile Wing Val 430 His Leu Asp Pro Ser 435 Leu Phe Asp Pro Gln 440 Gln His Phe Asn Pro 445 Trp Arg Trp Gln Asn 450 Asn Gly Being His Gly 455 Ser Cys Pro Being Lys 460 Asn Thr Aln Asn Phe Leu Pro Phe Gly Gly Gly Pro Gly Ser 465 470 475 480 Glu Leu Wing Lys Leu 485 Glu Met Wing Val Phe 490 Ile His His Leu Ile 495 Leu Asn Tyr His Trp 500 Glu Leu Wing Asp Thr 505 Asp Gln Ala Phe Ala 510 Tyr Phe Pro Val Asp 515 Phe Pro Lys Gly Leu 520 Pro Val Arg Val Gln 525 His His Wing

Leu Leu 530 <210> 113 <211> <212>Leu Leu 530 <210> 113 <211> <212>

1458 DNA1458 DNA

<213> Gossypium hirsutum <400> 113<213> Gossypium hirsutum <400> 113

atgcctgact cagagcctat tttcttgctt ctaccatcta ttcattctca tcaagagaaa gcaaagaagg tataatcttc ccttttctcg gcgaaacaat cggttacttg aggccttact ttcatgcacc agcatatatc aaggtatggg aatatctaca aagacaatag tgtctgcaga tgctgggttg aacaagttca ttattcgagt gcagttaccc gagaagcatt ggtggcattc gttttggttg gggatatgca tagagacatg aggattatat gccaggctga ggactcatct tttgagagaa gtggagaaac acttggaaag agaagtgcat attttcagct caggatgaag ttggtggcaa aaaatatcat gagcatggac cctggacatc aaagaatatg ttactttcat gaaaggagtc gtttctgctc gcatacagaa aagccttaca atctcgatca acaatcctga gaagtaagga taaggaaaat gaaggaagga aaagaaaact gaatgggtct taaagcattc taatctttcc acagagcaaa ttgctttttg ctggacatga gacctcctcg gtagccataa ccaggttgtc ctttggccat tcaacagttg agagaagaac aagaaccaat caggagagac tgaactcaac tgggatgatt caatgtgtta ttaacgagac acttaggctt ggtaatgtcg gctctcaaag atattagata taaaggttat gatattccat gtgattgcag cagtgcactt ggatccctgt ctttttgacc tggcgatggc agcaaaataa tgggagtcga ggggcgggga agcagcaatt acttcatgcc attcggggga ggaccacggc gctaaactgg aaatggcggt gttcatccac catttggtcc gccgatacgg atgaagcctt tgccttccct tttgtcgact agagtcttca aatcttaa <210> 114 <211> 485 <212> PRTatgcctgact cagagcctat tttcttgctt ctaccatcta ttcattctca tcaagagaaa gcaaagaagg tataatcttc ccttttctcg gcgaaacaat cggttacttg aggccttact ttcatgcacc agcatatatc aaggtatggg aatatctaca aagacaatag tgtctgcaga tgctgggttg aacaagttca ttattcgagt gcagttaccc gagaagcatt ggtggcattc gttttggttg gggatatgca tagagacatg aggattatat gccaggctga ggactcatct tttgagagaa gtggagaaac acttggaaag agaagtgcat attttcagct caggatgaag ttggtggcaa aaaatatcat gagcatggac cctggacatc aaagaatatg ttactttcat gaaaggagtc gtttctgctc gcatacagaa aagccttaca atctcgatca acaatcctga gaagtaagga taaggaaaat gaaggaagga aaagaaaact gaatgggtct taaagcattc taatctttcc acagagcaaa ttgctttttg ctggacatga gacctcctcg gtagccataa ccaggttgtc ctttggccat tcaacagttg agagaagaac aagaaccaat caggagagac tgaactcaac tgggatgatt caatgtgtta ttaacgagac acttaggctt ggtaatgtcg gctctcaaag atattagata taaaggttat gatattccat gtgattgcag cagtgcactt ggatccctgt ctttttgacc tggcgatggc agcaaaataa tgggagtcga ggggcgggga agcagcaatt acttcatgcc attcggggga ggaccacggc gctaaactgg aaatggcggt gttcatccac catttggtcc gccgatacgg atgaagcctt tgccttccct tttgtcgact agagtcttca aatcttaa <210> 114 <211> 485 <212> PRT

<213> Gossypium hirsutum <400> 114<213> Gossypium hirsutum <400> 114

ttttatcttt caccagggaa ctgctacttc aatcgaattt tattacaaaa ttgggaaatg cactcaactt atactttgct caaaaaagtt cagagacgga ctttaaattt aatttattga cagaggaaga tccttgactt ccttagccat accttgaagt acaagaaaat tcagatttct gtgggtggaa accctcaact cggcaacgtc tatgtgcagg tcaactacca tccctaaaggttttatcttt caccagggaa ctgctacttc aatcgaattt tattacaaaa ttgggaaatg cactcaactt atactttgct caaaaaagtt cagagacgga ctttaaattt aatttattga cagaggaaga tccttgactt ccttagccat accttgaagt acaagaaaat tcagatttct gtgggtggaa accctcaact cggcaacgtc tatgtgcagg tcaactacca tccctaaagg

gattctgttc catggggtgg agtaggtgaa gtttggtgag cgaagggaga gtcgatgctg cttgagcaac tgttctaaat cactttcaat gcagctaaag acctggaact aaagaaaatg tgatcttctt gattttgagc ctacttcttg tgccagagcc ggagttcact ccacagaaaa agtgcttcca cttcaatcca atcagcgagc aacagagctg gtgggagtta cctacccatcgattctgttc catggggtgg agtaggtgaa gtttggtgag cgaagggaga gtcgatgctg cttgagcaac tgttctaaat cactttcaat gcagctaaag acctggaact aaagaaaatg tgatcttctt gattttgagc ctacttcttg tgccagagcc ggagttcact ccacagaaaa agtgcttcca cttcaatcca atcagcgagc aacagagctg gtgggagtta cctacccatc

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1458 Met Pro Asp Ser Glu 1 560 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1458 Met Pro Asp Ser Glu 1 5

Leu Ile Leu Phe Phe 20Leu Ile Leu Phe Phe 20

Leu Pro Pro Gly Asn 35Read Pro Pro Gly Asn 35

Tyr Leu Arg Pro Tyr 50Tyr Leu Arg Pro Tyr 50

His Ile Ser Arg Tyr 65His Ile Ser Arg Tyr 65

Lys Thr Ile Val Ser 85Lys Thr Ile Val Ser 85

Asn Glu Gly Arg Leu 100Asn Glu Gly Arg Leu 100

Ile Leu Gly Lys Trp 115Ile Leu Gly Lys Trp 115

Asp Met Arg Ile Ile 130Asp Met Arg Ile Ile 130

Thr His Leu Leu Arg 145Thr His Leu Leu Arg 145

Thr Trp Lys Glu Lys 165Thr Trp Lys Glu Lys 165

Phe Thr Phe Asn Leu 180Phe Thr Phe Asn Leu 180

His Pro Glu Thr Glu 195His Pro Glu Thr Glu 195

Gly Val Val Ser Ala 210Gly Val Val Ser Wing 210

Ala Leu Gln Ser Arg 225Wing Read Gln Ser Arg 225

Glu Val Arg Ile Arg 245Glu Val Arg Ile Arg 245

Asp Asp Leu Leu Glu 260Asp Asp Leu Leu Glu 260

Gln Ile Leu Asp Leu 275Gln Ile Leu Asp Leu 275

Ser Ser Val Ala Ile 290Ser Ser Val Wing Ile 290

Leu Ala Ile Gln Gln 305Read Ala Ile Gln Gln 305

Lys Asn Gln Ser Gly 325Lys Asn Gln Ser Gly 325

Met Glu Phe Thr Gln 340Met Glu Phe Thr Gln 340

Val Val Arg Phe Leu 355Val Val Arg Phe Leu 355

Gly Tyr Asp Ile Pro 370Gly Tyr Asp Ile Pro 370

Val His Leu Asp Pro 385Val His Leu Asp Pro 385

Trp Arg Trp Gln Gln 405Trp Arg Trp Gln Gln 405

Ser Ser Ala Ser Ser 420Ser Ser Ala Ser Ser 420

Arg Leu Cys Ala Gly 435Arg Read Cys Wing Gly 435

Ile His His Leu Val 450Ile His His Leu Val 450

Glu Ala Phe Ala Phe 465Glu Ala Phe Ala Phe 465

Arg Val Phe Lys Ser 485Arg Val Phe Lys Ser 485

<210> 115<210> 115

Pro Ile Phe Leu Leu 10For Ile Phe Leu Leu 10

Ile Leu Ile Lys Arg 25Ile Leu Ile Lys Arg 25

Met Gly Trp Pro Phe 40Met Gly Trp Pro Phe 40

Ser Ala Thr Ser Val 55Ser Wing Thr Ser Val 55

Gly Asn Ile Tyr Lys 70Gly Asn Ile Tyr Lys 70

Ala Asp Ala Gly Leu 90Wing Asp Wing Gly Leu 90

Phe Glu Cys Ser Tyr 105Phe Glu Cys Ser Tyr 105

Ser Met Leu Val Leu 120Ser Met Leu Val Leu 120

Ser Leu Asn Phe Leu 135Ser Leu Asn Phe Leu 135

Glu Val Glu Lys His 150Glu Val Glu Lys His 150

Cys Ile Phe Ser Ala 170Cys Ile Phe Ser Ala 170

Val Ala Lys Asn Ile 185Val Ala Lys Asn Ile 185

Gln Leu Lys Lys Glu 200Gln Leu Lys Lys Glu 200

Pro Leu Asn Leu Pro 215Pro Leu Asn Leu Pro 215

Ser Thr Ile Leu Lys 230Ser Thr Ile Leu Lys 230

Lys Met Lys Glu Gly 250Lys Met Lys Glu Gly 250

Trp Val Leu Lys His 265Trp Val Leu Lys His 265

Ile Leu Ser Leu Leu 280Ile Leu Ser Leu Leu 280

Thr Leu Ala Ile Tyr 295Thr Leu Wing Ile Tyr 295

Leu Arg Glu Glu His 310Read Arg Glu Glu His 310

Glu Thr Glu Leu Asn 330Glu Thr Glu Leu Asn 330

Cys Val Ile Asn Glu 345Cys Val Ile Asn Glu 345

His Arg Lys Ala Leu 360His Arg Lys Wing Leu 360

Cys Gly Trp Lys Val 375Cys Gly Trp Lys Val 375

Cys Leu Phe Asp His 390Cys Leu Phe Asp His 390

Asn Asn Gly Ser Arg 410Asn Asn Gly Ser Arg 410

Ser Asn Tyr Phe Met 425Ser Asn Tyr Phe Met 425

Thr Glu Leu Ala Lys 440Thr Glu Leu Wing Lys 440

Leu Asn Tyr Gln Trp 455Read Asn Tyr Gln Trp 455

Pro Phe Val Asp Phe 470Pro Phe Val Asp Phe 470

Leu Pro Ser Ile Leu SerLeu Pro Ser Ile Leu Ser

15 Lys Gln Arg Arg Tyr Asn 30 Leu Gly Glu Thr Ile Gly 45 Gly Glu Phe Met His Gln 60 Ser Asn Leu Phe Gly Glu 75 80 Asn Lys Phe Ile Leu Gln 95 Pro Arg Ser Ile Gly Gly 110 Val Gly Asp Met His Arg 125 Ser Asn Ala Arg Leu Arg 140 Thr Leu Leu Val Leu Asn 155 160 Gln Asp Glu Ala Lys Lys 175 Met Ser Met Asp Pro Gly 190 Tyr Val Thr Phe Met Lys 205 Gly Thr Ala Tyr Arg Lys 220 Phe Ile Glu Lys Lys Met 235 240 Lys Glu Asn Ser Glu Glu 255 Ser Asn Leu Ser Thr Glu 270 Phe Ala Gly His Glu Thr 285 Phe Leu Pro Gly Cys Pro 300 Leu Glu Val Ala Arg Ala 315 320 Trp Asp Asp Tyr Lys Lys 335 Thr Leu Arg Leu Gly Asn 350 Lys Asp Ile Arg Tyr Lys 365 Leu Pro Val Ile Ala Ala 380 Pro Gln Leu Phe Asn Pro 395 400 Gly Ala Gly Thr Ala Thr 415 Pro Phe Gly Gly Gly Pro 430 Leu Glu Met Ala Val Phe 445 Glu Leu Ala Asp Thr Asp 460 Pro Lys Gly Leu Pro Ile 475 480 <211> 1521 <212> DNA <213> Zea mays <400> 11515 Lys Gln Arg Arg Tyr Asn 30 Leu Gly Glu Thr Ile Gly 45 Gly Glu Phe Met His Gln 60 Ser Asn Leu Phe Gly Glu 75 80 Asn Lys Phe Ile Leu Gln 95 Pro Arg Ser Ile Gly Gly 110 Val Gly Asp Met His Arg 125 Ser Asn Arg Wing Arg Leu Arg 140 Thr Leu Val Leu Asn 155 160 Gln Asp Glu Wing Lys Lys 175 Met Ser Met Asp Pro Gly 190 Tyr Val Thr Phe Met Lys 205 Gly Thr Wing Tyr Arg Lys Lys 220 Phe 235 240 Lys Glu Asn Be Glu Glu 255 Be Asn Leu Be Thr Glu 270 Phe Wing Gly His Glu Thr 285 Phe Leu Pro Gly Cys Pro 300 Leu Glu Val Wing Ala 315 320 Trp Asp Asp Tyr Lys Lys 335 Thr Leu Arg Leu Gly Asn 350 Lys Asp Ile Arg Tyr Lys 365 Leu Pro Val Ile Wing Ala 380 Pro Gln Leu Phe Asn Pro 395 400 Gly Wing Gly Thr Wing 415 Pro Phe Gly Gly Gly Pro 430 Leu Glu Met Wing Val Phe 445 Glu Leu Wing Asp Thr Asp 460 Pro Lys Gly Leu Pro Ile 475 480 <211> 1521 <212> DNA < 213> Zea mays <400> 115

atgggcgcca tgatggcctc cataaccagc gagctcctct ctggccctcc tcgccttgta caccaccacc gtcgccaaat cgccgtcaga agaagaagcg gcccaacctg cccccgggcg ggcgaaactt tcggctacct ccgcgcccac ccggccacct cggcatgtcg cacggtacgg gaagatatac cggtcgagcc gtgtcggcgg acgcggggct gaaccgctac atcctgcaga tgcagctacc cgcgcagcat cggcggcatc ctgggcaagt ggcgacgcgc accgcgagat gcgcgctatc tcgctcaact cgcgccgtgc tgctccccga ggtggagcgc cacaccctgc ccctccgacg gcaccttctc cgcccagcac gaagccaaga gcgaagaaca taatgagcat ggaccccggc gaggaggaga tacatcacct tcatgaaggg cgtcgtgtca gcgccgctca tggaaggcgc tcaagtcacg cgcgtccata cttggagtga aggcttgaga agatgagcag ggagaagtca agcgtggagg gccctgaagc aatccaacct gtccaaggaa cagatcctgg ttcgcggggc acgagacttc gtccatggcg ctcgccctcg tgccctaagg ccgtgcaaga actccgggag gagcatctcc ctaagagggg cgtctaaatt gagctgggaa gactacaagg gttataaacg agacattgcg gctcggcaac gtggtcaggt cgagatgtac actacaatgg gtacgacata ccgcgggggt gcggcggtgc acctggactc gtcgctgtac gaggacccca tggaagagca acaacgcgcc aagcagcttc atgccgtacg gccgggtcgg agctggccaa gctggagatg gccatcttcc .ttccggtggg agctggcgga gccggaccag gccttcgttt aagggcctcc cgatcagggt ccagcgggtc gccgacgacc accgagagca caagaggctg a <210> 116 <211> 506 <212> PRT <213> Zea mays <4 00> 116atgggcgcca tgatggcctc cataaccagc gagctcctct ctggccctcc tcgccttgta caccaccacc gtcgccaaat cgccgtcaga agaagaagcg gcccaacctg cccccgggcg ggcgaaactt tcggctacct ccgcgcccac ccggccacct cggcatgtcg cacggtacgg gaagatatac cggtcgagcc gtgtcggcgg acgcggggct gaaccgctac atcctgcaga tgcagctacc cgcgcagcat cggcggcatc ctgggcaagt ggcgacgcgc accgcgagat gcgcgctatc tcgctcaact cgcgccgtgc tgctccccga ggtggagcgc cacaccctgc ccctccgacg gcaccttctc cgcccagcac gaagccaaga gcgaagaaca taatgagcat ggaccccggc gaggaggaga tacatcacct tcatgaaggg cgtcgtgtca gcgccgctca tggaaggcgc tcaagtcacg cgcgtccata cttggagtga aggcttgaga agatgagcag ggagaagtca agcgtggagg gccctgaagc aatccaacct gtccaaggaa cagatcctgg ttcgcggggc acgagacttc gtccatggcg ctcgccctcg tgccctaagg ccgtgcaaga actccgggag gagcatctcc ctaagagggg cgtctaaatt gagctgggaa gactacaagg gttataaacg agacattgcg gctcggcaac gtggtcaggt cgagatgtac actacaatgg gtacgacata ccgcgggggt gcggcggtgc acctggactc gtcgctgtac gaggacccca tggaagagca acaacgcgcc aagcagcttc atgccgtacg gccgggtcgg agctggccaa gctggagatg gccatcttcc .ttccggtggg agctggcgga gccggaccag gccttcgttt aagggcctcc cgatcagggt ccagcgggtc gccgacgacc accgagagca caagaggct a <210> 116 <211> 506 <213> PR

tcttccttcc gccacggcac cccgcggatg ccgtgggccg tgttcgggga acgaggggcg ggtccatgct tcctcagctc tggtcctccg agttcacgtt cggagcggct acttcccggg tagagaggaa aggacgacct acctcttgct ccatcttctt tgattgctag aaatggtttt tcctgcaccg ggaaaatcct gccggttcaa gcggcgggcc tgcaccacct accctttcgt aaggccatcgtcttccttcc gccacggcac cccgcggatg ccgtgggccg tgttcgggga acgaggggcg ggtccatgct tcctcagctc tggtcctccg agttcacgtt cggagcggct acttcccggg tagagaggaa aggacgacct acctcttgct ccatcttctt tgattgctag aaatggtttt tcctgcaccg ggaaaatcct gccggttcaa gcggcgggcc tgcaccacct accctttcgt aaggccatcg

cttcatcctg ccacccgtgg gcccttggtc cttcatggag gcggacggtg gctgttcgag ggtgctcgtg cgtccgcctc ctcgtggccg taacctgatg gcggctggag cacggcctac gatggaggac tcttggatgg gagcctgctc cctcgaaggg gagacaaagg cacgcagtgt gaaggtcatc gccggttcta cccttggaga gcggctgtgc ggtgctcaac cgacttcccc tagcgttttgcttcatcctg ccacccgtgg gcccttggtc cttcatggag gcggacggtg gctgttcgag ggtgctcgtg cgtccgcctc ctcgtggccg taacctgatg gcggctggag cacggcctac gatggaggac tcttggatgg gagcctgctc cctcgaaggg gagacaaagg cacgcagtgt gaaggtcatc gccggttcta cccttggaga gcggctgtgc ggtgctcaac cgacttcccc tagcgttttg

Met Gly Ala Met Met Ala Ser Ile Thr Ser Glu Leu Leu Phe Phe Leu 1 5 10 15 Pro Phe Ile Leu 20 Leu Ala Leu Leu Ala 25 Leu Tyr Thr Thr Thr 30 Val Ala Lys Cys His 35 Gly Thr His Pro Trp 40 Arg Arg Gln Lys Lys 45 Lys Arg Pro Asn Leu 50 Pro Pro Gly Ala Arg 55 Gly Trp Pro Leu Val 60 Gly Glu Thr Phe Gly Tyr Leu Arg Ala His Pro Ala Thr Ser Val Gly Arg Phe Met Glu 65 70 75 80 Arg His Val Ala Arg 85 Tyr Gly Lys Ile Tyr 90 Arg Ser Ser Leu Phe 95 Gly Glu Arg Thr Val 100 Val Ser Ala Asp Ala 105 Gly Leu Asn Arg Tyr 110 Ile Leu Gln Asn Glu 115 Gly Arg Leu Phe Glu 120 Cys Ser Tyr Pro Arg 125 Ser Ile Gly Gly Ile 130 Leu Gly Lys Trp Ser 135 Met Leu Val Leu Val 140 Gly Asp Ala His Arg Glu Met Arg Ala Ile Ser Leu Asn Phe Leu Ser Ser Val Arg Leu 145 150 155 160 Arg Ala Val Leu Leu 165 Pro Glu Val Glu Arg 170 His Thr Leu Leu Val 175 Leu Arg Ser Trp Pro 180 Pro Ser Asp Gly Thr 185 Phe Ser Ala Gln His 190 Glu Ala Lys Lys Phe 195 Thr Phe Asn Leu Met 200 Ala Lys Asn Ile Met 205 Ser Met Asp Pro Gly 210 Glu Glu Glu Thr Glu 215 Arg Leu Arg Leu Glu 220 Tyr Ile Thr PheMet Gly Wing Met Met Wing Be Ile Thr Be Glu Leu Leu Phe Phe Leu 1 5 10 15 Pro Phe Ile Leu 20 Leu Wing Leu Leu Wing 25 Leu Tyr Thr Thr 30 Val Wing Lys Cys His 35 Arg Gln Lys Lys 45 Lys Arg Pro Asn Leu 50 Pro Pro Gly Wing Arg 55 Gly Trp Pro Leu Val 60 Gly Glu Thr Phe Gly Tyr Leu Arg Wing His Pro Wing Thr Be Val Gly Arg Phe Met Glu 65 70 75 80 Arg His Val Arg 85 Wing Tyr Gly Lys Ile Tyr 90 Arg Be Ser Leu Phe 95 Gly Glu Arg Thr Val 100 Val Ser As Asa Wing 105 Gly Leu Asn Arg Tyr 110 Ile Leu Gln Asn Glu 115 Gly Arg Leu Phe Glu 120 Cys Ser Tyr Pro Arg 125 Ser Ile Gly Gly Ile 130 Leu Gly Lys Trp Ser 135 Met Leu Val Leu Val 140 Gly Asp Wing His Arg Glu Met Arg Wing Ile Ser Leu Asn Phe Leu Ser Ser Val Arg Leu 145 150 155 160 Arg Wing Val Leu Leu 165 Pro Glu Val Glu Arg 170 His Thr Read Leu Val 175 Read Le Arg Be Trp Pro 180 Be Asp Gly Thr 185 Phe Be Wing Gln His 190 Glu Wing Lys Lys Phe 195 Thr Phe Asn Leu Met 200 Wing Lys Asn Ile Met 20 5 Ser Met Asp Pro Gly 210 Glu Glu Glu Thr Glu 215 Arg Leu Arg Leu Glu 220 Tyr Ile Thr Phe

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1521 Met Lys Gly Val Val Ser Ala Pro Leu Asn Phe Pro Gly Thr Ala Tyr 225 230 235 240 Trp Lys Ala Leu Lys Ser Arg Ala Ser Ile Leu Gly Val Ile Glu Arg 245 250 255 Lys Met Glu Asp Arg Leu Glu Lys Met Ser Arg Glu Lys Ser Ser Val 260 265 270 Glu Glu Asp Asp Leu Leu Gly Trp Ala Leu Lys Gln Ser Asn Leu Ser 275 280 285 Lys Glu Gln Ile Leu Asp Leu Leu Leu Ser Leu Leu Phe Ala Gly His 290 295 300 Glu Thr Ser Ser Met Ala Leu Ala Leu Ala Ile Phe Phe Leu Glu Gly 305 310 315 320 Cys Pro Lys Ala Val Gln Glu Leu Arg Glu Glu His Leu Leu Ile Ala 325 330 335 Arg Arg Gln Arg Leu Arg Gly Ala Ser Lys Leu Ser Trp Glu Asp Tyr 340 345 350 Lys Glu Met Val Phe Thr Gln Cys Val Ile Asn Glu Thr Leu Arg Leu 355 360 365 Gly Asn Val Val Arg Phe Leu His Arg Lys Val Ile Arg Asp Val His 370 375 380 Tyr Asn Gly Tyr Asp Ile Pro Arg Gly Trp Lys Ile Leu Pro Val Leu 385 390 395 400 Ala Ala Val His Leu Asp Ser Ser Leu Tyr Glu Asp Pro Ser Arg Phe 405 410 415 Asn Pro Trp Arg Trp Lys Ser Asn Asn Ala Pro Ser Ser Phe Met Pro 420 425 430 Tyr Gly Gly Gly Pro Arg Leu Cys Ala Gly Ser Glu Leu Ala Lys Leu 435 440 445 Glu Met Ala Ile Phe Leu His His Leu Val Leu Asn Phe Arg Trp Glu 450 455 460 Leu Ala Glu Pro Asp Gln Ala Phe Val Tyr Pro Phe Val Asp Phe Pro 465 470 475 480 Lys Gly Leu Pro Ile Arg Val Gln Arg Val Ala Asp Asp Gln Gly His 485 490 495 Arg Ser Val Leu Thr Glu Ser Thr Arg Gly 500 50560 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1521 Met Lys Gly Val Val Being Pro Wing Read Asn Phe Pro Gly Thr Wing Tyr 225 230 235 240 Trp Lys Wing Leu Lys Be Arg Wing Be Ile Leu Gly Val Ile Glu Arg 245 250 255 Lys Met Wing Glu Asp Arg Leu Glu Lys Be Wing Arg Be Glu Lys Be Val 260 265 270 Glu Glu Asp Winged Leu Gly Trp Wing Lys Gln Be Asn Leu Be 275 280 285 Lys Glu Gln Ile Leu Asp Leu Leu Leu Leu Seru Leu Phe Wing Gly His 290 295 300 Glu Thr Be Ser Met Leu Wing Leu Wing Ile Phe Leu Glu Gly 305 310 315 320 Cys Pro Lys Wing Valu Glu Leu Arg Glu Glu His Read Leu Ile Wing 325 330 335 Arg Arg Gln Arg Read Le Arg Gly Wing Be Lys Read Trp Glu Asp Tyr 340 345 350 Lys Glu Met Val Phe Thr Gln Cys Val Ile Asn Glu Thr Read Le Arg 355 360 365 Gly Asn Val Val Arg Phe Read His Arg Lys Val Ile Arg Asp Val His 370 375 380 Tyr Asn Gly Tyr Asp Ile Pro Arg Gly Trp Lys Ile Leu Pro Val Leu 385 390 395 400 Wing Wing Val His Leu Asp Be Seru Leu Tyr Glu Asp Pro Ser Arg Phe 405 410 415 Asn Pro Trp Arg Trp Lys Ser Asn Asn Ala Pro Be Ser Phe Met Pro 420 425 430 Tyr Gly Gly Gly Pro Arg Leu Cys Wing Gly Be Glu Leu Wing Lys Leu 435 440 445 Glu Met Wing Ile Phe Leu His His Leu Val Leu Asn Phe Arg Trp Glu 450 455 460 Leu Glu Wing Pro Asp Gln Wing Phe Val Tyr Pro Phe Val Asp Phe Pro 465 470 475 480 Lys Gly Leu

<210> 117 <211> 1566 <212> DNA <213> Zea mays <4 00> 117<210> 117 <211> 1566 <212> DNA <213> Zea mays <4 00> 117

atgggcgcca tgatggcctc cataaccagc gagctcctct tcttccttcc cttcatcctg 60atgggcgcca tgatggcctc cataaccagc gagctcctct tcttccttcc cttcatcctg 60

ctggccctcc tcgccttgta caccaccacc gtcgccaaat gccacggcac ccaccagtgg 120ctggccctcc tcgccttgta caccaccacc gtcgccaaat gccacggcac ccaccagtgg 120

cgccgtcaga agaagaagcg gcccaacctg cccccgggcg cccgcggatg gcccttggtc 180cgccgtcaga agaagaagcg gcccaacctg cccccgggcg cccgcggatg gcccttggtc 180

ggcgagactt tcggctacct ccgcgcccac ccggccacct ccgtgggccg cttcatggag 240ggcgagactt tcggctacct ccgcgcccac ccggccacct ccgtgggccg cttcatggag 240

cggcatgtcg cacggtacgg gaagatatac cggtcgagcc tgttcgggga gcggacggtg 300cggcatgtcg cacggtacgg gaagatatac cggtcgagcc tgttcgggga gcggacggtg 300

gtgtcggcgg acgcggggct gaaccggtac atcctgcaga acgaggggcg gctgttcgag 360gtgtcggcgg acgcggggct gaaccggtac atcctgcaga acgaggggcg gctgttcgag 360

tgcagctacc cgcgcagcat cggcggcatc ctgggcaagt ggtccatgct ggtgctcgtg 420tgcagctacc cgcgcagcat cggcggcatc ctgggcaagt ggtccatgct ggtgctcgtg 420

ggcgacgcgc accgcgagat gcgcgctatc tcgctcaact tcctcagctc cgtccgcctc 480ggcgacgcgc accgcgagat gcgcgctatc tcgctcaact tcctcagctc cgtccgcctc 480

cgcgccgtgc tgctccccga ggtggagcgc cacaccctgc tggtcctccg ctcctggccg 540cgcgccgtgc tgctccccga ggtggagcgc cacaccctgc tggtcctccg ctcctggccg 540

cctccgaccg gcaccttctc cgcccagcac gaagccaaga agttcacgtt taacctgatg 600cctccgaccg gcaccttctc cgcccagcac gaagccaaga agttcacgtt taacctgatg 600

gcgaagaaca taatgagcat ggaccccggc gaggaggaga cggagcggct gcggctggag 660gcgaagaaca taatgagcat ggaccccggc gaggaggaga cggagcggct gcggctggag 660

tacatcacct tcatgaaggg cgtcgtgtca gcgccgctca acttcccggg cacggcctac 720tacatcacct tcatgaaggg cgtcgtgtca gcgccgctca acttcccggg cacggcctac 720

tggaaggcgc tcaagtcgcg cgcgtccata cttggagtga tagagaggaa gatggaggac 780tggaaggcgc tcaagtcgcg cgcgtccata cttggagtga tagagaggaa gatggaggac 780

aggcttgaga agatgagcag ggagaagtca agcgtggagg aggacgacct tcttggatgg 840aggcttgaga agatgagcag ggagaagtca agcgtggagg aggacgacct tcttggatgg 840

gccctgaagc aatccaacct gtccaaggaa cagatcctgg acctcttgct gagcctgctc 900gccctgaagc aatccaacct gtccaaggaa cagatcctgg acctcttgct gagcctgctc 900

ttcgcggggc acgagacttc gtccatggcg ctcgccctcg ccatcttctt cctcgaaggg 960ttcgcggggc acgagacttc gtccatggcg ctcgccctcg ccatcttctt cctcgaaggg 960

tgccctaagg ccgtgcaaga actccgggag gagcatctcc tgattgctag gagacaaagg 1020tgccctaagg ccgtgcaaga actccgggag gagcatctcc tgattgctag gagacaaagg 1020

ctaagggggg cgtccaaatt gagctgggaa gactacaagg aaatggtttt cacgcagtgt 1080ctaagggggg cgtccaaatt gagctgggaa gactacaagg aaatggtttt cacgcagtgt 1080

gttataaacg agacattgcg gctcggcaac gtggtcaggt tcctgcaccg gaaggtcatc 1140gttataaacg agacattgcg gctcggcaac gtggtcaggt tcctgcaccg gaaggtcatc 1140

cgagatgtac actacaatgg gtacgacata ccgcgggggt ggaaaatcct gccggttcta 1200cgagatgtac actacaatgg gtacgacata ccgcgggggt ggaaaatcct gccggttcta 1200

gcggcggtgc acctggactc gtcgctgtac gaggatccca gccggttcaa cccttggaga 1260gcggcggtgc acctggactc gtcgctgtac gaggatccca gccggttcaa cccttggaga 1260

tggaaggtca gtgccctgcc ccctcccctc gcaaaaggca caagccaagg gacaagcaag 1320 aggtttacac cgttcggtgg tggcccccgg ctctgcccag gatcagagct cgctaaagtg 1380 gagactgctt tcttcctcca tcaccttgtc ctcaattata gatggagaat tgatggcgat 1440 gacattccaa tggcataccc gtatgtggag tttcagagag gtctgccaat agaaatcgag 1500 ccaacgtccc ctgaatttga ctgtcctgga gctacagcca tcagttatca caccagagag 1560 aaatga 1566tggaaggtca gtgccctgcc ccctcccctc gcaaaaggca caagccaagg gacaagcaag 1320 aggtttacac cgttcggtgg tggcccccgg ctctgcccag gatcagagct cgctaaagtg 1380 gagactgctt tcttcctcca tcaccttgtc ctcaattata gatggagaat tgatggcgat 1440 gacattccaa tggcataccc gtatgtggag tttcagagag gtctgccaat agaaatcgag 1500 ccaacgtccc ctgaatttga ctgtcctgga gctacagcca tcagttatca caccagagag 1560 1566 aaatga

<210> 118 <211> 521 <212> PRT<210> 118 <211> 521 <212> PRT

<213> Zea mays <4 00> 118 Met Gly Ala Met Met Ala Ser Ile Thr Ser Glu Leu Leu Phe Phe Leu 1 5 10 15 Pro Phe Ile Leu Leu Ala Leu Leu Ala Leu Tyr Thr Thr Thr Val Ala 20 25 30 Lys Cys His Gly Thr His Gln Trp Arg Arg Gln Lys Lys Lys Arg Pro 35 40 45 Asn Leu Pro Pro Gly Ala Arg Gly Trp Pro Leu Val Gly Glu Thr Phe 50 55 60 Gly Tyr Leu Arg Ala His Pro Ala Thr Ser Val Gly Arg Phe Met Glu 65 70 75 80 Arg His Val Ala Arg Tyr Gly Lys Ile Tyr Arg Ser Ser Leu Phe Gly 85 90 95 Glu Arg Thr Val Val Ser Ala Asp Ala Gly Leu Asn Arg Tyr Ile Leu 100 105 110 Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg Ser Ile Gly 115 120 125 Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp Ala His 130 135 140 Arg Glu Met Arg Ala Ile Ser Leu Asn Phe Leu Ser Ser Val Arg Leu 145 150 155 160 Arg Ala Val Leu Leu Pro Glu Val Glu Arg His Thr Leu Leu Val Leu 165 170 175 Arg Ser Trp Pro Pro Pro Thr Gly Thr Phe Ser Ala Gln His Glu Ala 180 185 190 Lys Lys Phe Thr Phe Asn Leu Met Ala Lys Asn Ile Met Ser Met Asp 195 200 205 Pro Gly Glu Glu Glu Thr Glu Arg Leu Arg Leu Glu Tyr Ile Thr Phe 210 215 220 Met Lys Gly Val Val Ser Ala Pro Leu Asn Phe Pro Gly Thr Ala Tyr 225 230 235 240 Trp Lys Ala Leu Lys Ser Arg Ala Ser Ile Leu Gly Val Ile Glu Arg 245 250 255 Lys Met Glu Asp Arg Leu Glu Lys Met Ser Arg Glu Lys Ser Ser Val 260 265 270 Glu Glu Asp Asp Leu Leu Gly Trp Ala Leu Lys Gln Ser Asn Leu Ser 275 280 285 Lys Glu Gln Ile Leu Asp Leu Leu Leu Ser Leu Leu Phe Ala Gly His 290 295 300 Glu Thr Ser Ser Met Ala Leu Ala Leu Ala Ile Phe Phe Leu Glu Gly 305 310 315 320 Cys Pro Lys Ala Val Gln Glu Leu Arg Glu Glu His Leu Leu Ile Ala 325 330 335 Arg Arg Gln Arg Leu Arg Gly Ala Ser Lys Leu Ser Trp Glu Asp Tyr 340 345 350 Lys Glu Met Val Phe Thr Gln Cys Val Ile Asn Glu Thr Leu Arg Leu 355 360 365 Gly Asn Val Val Arg Phe Leu His Arg Lys Val Ile Arg Asp Val His 370 375 380 Tyr Asn Gly Tyr Asp Ile Pro Arg Gly Trp Lys Ile Leu Pro Val Leu 385 390 395 400 Ala Ala Val His Leu Asp Ser Ser Leu Tyr Glu Asp Pro Ser Arg Phe 405 410 415 Asn Pro Trp Arg Trp Lys Val Ser Ala Leu Pro Pro Pro Leu Ala Lys 420<213> Zea mays <4 00> 118 Met Gly Wing Met Met Wing Be Ile Thr Be Glu Leu Leu Phe Phe Leu 1 5 10 15 Pro Phe Ile Leu Leu Wing Leu Leu Wing Tyr Thr Thr Val Wing 20 25 30 Lys Cys His Gly Thr His Gln Arg Trp Arg Gln Lys Lys Arg Pro 35 40 45 Asn Leu Pro Pro Gly Wing Arg Gly Trp Pro Read Val Gly Glu Thr Phe 50 55 60 Gly Tyr Leu Arg Wing His Pro Thr Be Val Gly Arg Phe Met Glu 65 70 75 80 Arg His Val Arg Wing Arg Tyr Gly Lys Ile Tyr Arg Being Being Read Phe Gly 85 90 95 Glu Arg Thr Val Val Being Wing Asp Wing Gly Leu Asn Arg Tyr Ile Leu 100 105 110 Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg Ser Ile Gly 115 120 125 Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp Wing His 130 135 140 Arg Glu Met Arg Wing Ile Ser Leu Asn Phe Leu Being Ser Val Arg Leu 145 150 155 160 Arg Wing Val Leu Leu Pro Glu Val Glu Arg His Thr Leu Val Leu 165 170 175 Arg Be Trp Pro Pro Thr Gly Thr Phe Be Wing Gln His Glu Wing 180 185 190 Lys Lys Phe Thr Phe Asn Leu Met Wing Lys Asn Ile Met Being Met Asp 195 200 205 Pro Gly Glu Glu Glu Thr Glu Arg Leu Arg Leu Glu Tyr Ile Thr Phe 210 215 220 Met Lys Gly Val Val Ser Wing Pro Leu Asn Phe Pro Gly Thr Wing Tyr 225 230 235 240 Trp Lys Wing Leu Lys Ser Arg Wing Ser Ile Leu Gly Val Ile Glu Arg 245 250 255 Lys Met Glu Asp Arg Leu Glu Lys Met Ser Arg Glu Lys Ser Ser Val 260 265 270 Glu Glu Asp Asp Leu Gly Trp Wing Leu Lys Gln Ser Asn Leu Ser 275 280 285 Lys Glu Gln Ile Leu Asp Leu Leu Leu Phe Gly Wing His 290 295 300 Glu Thr Be Being Met Wing Leu Wing Leu Wing Ile Phe Phe Leu Wing Glu Gly 305 310 315 320 Cys Pro Lys Val Wing Gln Glu Leu Arg Glu Glu His Leu Ile Wing 325 330 335 Arg Arg Gln Arg Leu Arg Gly Ala Ser Lys Read Trp Glu Asp Tyr 340 345 350 Lys Glu Met Val Val Phe Thr Gln Cys Val Ile Asn Ile Leu Pro Val Leu 385 390 395 400 Wing Val Wing Val His Leu Asp Be Ser Leu Tyr Glu Asp Pro Ser Arg Phe 405 410 415 Asn Pro Trp Arg Trp Lys Val Ser Wing Leu Pro Pro Leu Lys 420 Wing

425425

430430

Gly Thr Ser Gln Gly Thr Ser Lys Arg Phe Thr Pro Phe Gly Gly Gly 435 440 445 Pro Arg Leu Cys Pro Gly Ser Glu Leu Ala Lys Val Glu Thr Ala Phe 450 455 460 Phe Leu His His Leu Val Leu Asn Tyr Arg Trp Arg Ile Asp Gly Asp 465 470 475 480 Asp Ile Pro Met Ala Tyr Pro Tyr Val Glu Phe Gln Arg Gly Leu Pro 485 490 495 Ile Glu Ile Glu Pro Thr Ser Pro Glu Phe Asp Cys Pro Gly Ala Thr 500 505 510 Ala Ile Ser Tyr His Thr Arg Glu LysGly Thr Be Gln Gly Thr Be Lys Arg Phe Thr Pro Phe Gly Gly Gly 435 440 445 Pro Arg Read Cys Pro Gly Be Glu Read Wing Lys Val Glu Thr Wing Phe 450 455 460 Phe Read His His Leu Val Read Asn Tyr Arg Trp Arg Ile Asp Gly Asp 465 470 475 480 Asp Ile Pro Met Tyr Wing Pro Tyr Val Glu Phe Gln Arg Gly Leu Pro 485 490 495 Ile Glu Ile Glu Pro Thr Be Pro Glu Phe Asp Cys Pro Gly Wing Thr 500 505 510 Wing His Thr Arg Glu Lys

<210> <211> <212> <213> <220> <221> <222> <223> <400><210> <211> <212> <213> <220> <221> <222> <223> <400>

515 119 1257 DNA515 119 1257 DNA

BrassicaBrassica

520520

raparapa

ou tor t

misc_feature (967)..(969) η is a, c, g 119misc_feature (967) .. (969) η is a, c, g 119

atgttcgaaa cagagcatac ctcctcttct tgattctctt aaatctggat ggccatttct actctcggtt acttcatgca ttgtttggag aaccaacgat aacgaaggaa gactctttga tggtcgatgc ttgttcttgt tttctaagtc acgctcgtct ttcgttctta attcttggca tttacgttta atctaatggc gagcagttaa agaaagagta ctcccaggaa ctgcttatcg attgagaaga aaatggaaga gagaaaatca gcagagatta gtagaagtga tcattatgag ggatgggttc taaaacattc caatctttcg ttattatttg ccggacatga tgaaggaaga attgggatga taggaaatgt acgatatccc cccgttacgaatgttcgaaa cagagcatac ctcctcttct tgattctctt aaatctggat ggccatttct actctcggtt acttcatgca ttgtttggag aaccaacgat aacgaaggaa gactctttga tggtcgatgc ttgttcttgt tttctaagtc acgctcgtct ttcgttctta attcttggca tttacgttta atctaatggc gagcagttaa agaaagagta ctcccaggaa ctgcttatcg attgagaaga aaatggaaga gagaaaatca gcagagatta gtagaagtga tcattatgag ggatgggttc taaaacattc caatctttcg ttattatttg ccggacatga tgaaggaaga attgggatga taggaaatgt acgatatccc cccgttacga

gcgggcnnnt tcagaattga actcttcgac tataaaggat ttggataact <210> 120 <211> <212> <213> <220> <221> <222>gcgggcnnnt tcagaattga actcttcgac tataaaggat ttggataact <210> 120 <211> <212> <213> <220> <221> <222>

tctcgtgcct cttcttcttc tcccatcact tctatctctt 60tctcgtgcct cttcttcttc tcccatcact tctatctctt 60

gaagagacga agtcgacaca gtttcaatct ccctcctgga 120gaagagacga agtcgacaca gtttcaatct ccctcctgga 120

aggcgaaacc atcggatatc tcaaacctta ctctgccaaa 180aggcgaaacc atcggatatc tcaaacctta ctctgccaaa 180

acaacatatc tccaagtatg ggaagatata tagatcgaat 240acaacatatc tccaagtatg ggaagatata tagatcgaat 240

cgtatcagct gatgcaggac tcaacaggtt catattacaa 300cgtatcagct gatgcaggac tcaacaggtt catattacaa 300

cctcgaagta ttggtgggat tcttgggaaa 360cctcgaagta ttggtgggat tcttgggaaa 360

catagagaca tgagaagtat ctcgctaaac 420catagagaca tgagaagtat ctcgctaaac 420

cttcttaagg acgttgagag gcatactttg 480cttcttaagg acgttgagag gcatactttg 480

gttttctctg ctcaagatga ggccaaaaag 540gttttctctg ctcaagatga ggccaaaaag 540

atgagtatgg atcctggaga agaagagaca 600atgagtatgg atcctggaga agaagagaca 600

atgaaagggg ttgtttctgc tcctctcaat 660atgaaagggg ttgtttctgc tcctctcaat 660

cagcagtcac gagggacgat attgaagttt 720cagcagtcac gagggacgat attgaagttt 720

gagattcaag aagaagacga agaagatgaa 780gagattcaag aagaagacga agaagatgaa 780

agaaaacata gagcagatga tgatcttttg 840agaaaacata gagcagatga tgatcttttg 840

actgagcaaa ttctcgatct tattctcagt 900actgagcaaa ttctcgatct tattctcagt 900

gtagccatcg ctctcgctat ctacttttta 960gtagccatcg ctctcgctat ctacttttta 960

atcgcgaggg tgaagaagga acttggagag 1020atcgcgaggg tgaagaagga acttggagag 1020

atggacttta ctcatagtgt tataaatgag 1080atggacttta ctcatagtgt tataaatgag 1080

ttgcatcgta aagcactcaa aaacgttcgg 1140ttgcatcgta aagcactcaa aaacgttcgg 1140

aagtgggtgg aaagtgttac cagtgatctc agccgtacat 1200aagtgggtgg aaagtgttac cagtgatctc agccgtacat 1200

cgaacctaat ctctttaatc cttggagatg gcaacag 1257cgaacctaat ctctttaatc cttggagatg gcaacag 1257

atgtagttat tggagacatg cagaacgatt acaacattct gaagcatata tgtgactttc taaagctctcatgtagttat tggagacatg cagaacgatt acaacattct gaagcatata tgtgactttc taaagctctc

gacatcatct gcatcttgaa ttacaagaca agtaaggtttgacatcatct gcatcttgaa ttacaagaca agtaaggttt

419 PRT419 PRT

BrassicaBrassica

raparapa

INSEGURO (323)..(323)INSECURE (323) .. (323)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 120<223> Xaa can be any naturally occurring amino acid <400> 120

Met Phe Glu Thr Glu His Thr Leu Val Pro Leu Leu Leu Leu Pro 15 10 15Met Phe Glu Thr Glu His Thr Leu Val Pro Leu Leu Leu Leu Pro 15 10 15

SerTo be

Leu Leu Ser Leu Leu Leu Phe Leu Ile Leu Leu Lys Arg Arg Ser Arg 20 25 30 His Ser Phe Asn Leu Pro Pro Gly Lys Ser Gly Trp Pro Phe Leu Gly 35 40 45 Glu Thr Ile Gly Tyr Leu Lys Pro Tyr Ser Ala Lys Thr Leu Gly Tyr 50 55 60 Phe Met Gln Gln His Ile Ser Lys Tyr Gly Lys Ile Tyr Arg Ser Asn 65 70 75 80 Leu Phe Gly Glu Pro Thr Ile Val Ser Ala Asp Ala Gly Leu Asn Arg 85Leu Leu Be Leu Leu Leu Phe Leu Ile Leu Leu Lys Arg Arg Arg Arg 25 25 30 His Ser Phe Asn Leu Pro Gly Lys Pro Gly Trp Pro Phe Leu Gly 35 40 45 Glu Thr Ile Gly Tyr Leu Lys Pro Tyr Ala Lys Thr Leu Gly Tyr 50 55 60 Phe Met Gln Gln His Ile Ser Lys Tyr Gly Lys Ile Tyr Arg Ser Asn 65 70 75 80 Leu Phe Gly Glu Pro Thr Ile Val Ser Wing Asp Wing Gly Leu Asn Arg 85

9090

9595

Phe Ile Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg 100 105 110 Ser Ile Gly Gly Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly 115 120 125 Asp Met His Arg Asp Met Arg Ser Ile Ser Leu Asn Phe Leu Ser His 130 135 140 Ala Arg Leu Arg Thr Ile Leu Leu Lys Asp Val Glu Arg His Thr Leu 145 150 155 160 Phe Val Leu Asn Ser Trp Gln Gln His Ser Val Phe Ser Ala Gln Asp 165 170 175 Glu Ala Lys Lys Phe Thr Phe Asn Leu Met Ala Lys His Ile Met Ser 180 185 190 Met Asp Pro Gly Glu Glu Glu Thr Glu Gln Leu Lys Lys Glu Tyr Val 195 200 205 Thr Phe Met Lys Gly Val Val Ser Ala Pro Leu Asn Leu Pro Gly Thr 210 215 220 Ala Tyr Arg Lys Ala Leu Gln Gln Ser Arg Gly Thr Ile Leu Lys Phe 225 230 235 240 Ile Glu Lys Lys Met Glu Glu Arg Lys Ser Glu Ile Gln Glu Glu Asp 245 250 255 Glu Glu Asp Glu Ala Glu Ile Ser Arg Ser Asp His Tyr Glu Arg Lys 260 265 270 His Arg Ala Asp Asp Asp Leu Leu Gly Trp Val Leu Lys His Ser Asn 275 280 285 Leu Ser Thr Glu Gln Ile Leu Asp Leu Ile Leu Ser Leu Leu Phe Ala 290 295 300 Gly His Glu Thr Ser Ser Val Ala Ile Ala Leu Ala Ile Tyr Phe Leu 305 310 315 320 Ala Gly Xaa Leu Lys Glu Glu His Leu Glu Ile Ala Arg Val Lys Lys 325 330 335 Glu Leu Gly Glu Ser Glu Leu Asn Trp Asp Asp Tyr Lys Thr Met Asp 340 345 350 Phe Thr His Ser Val Ile Asn Glu Thr Leu Arg Leu Gly Asn Val Val 355 360 365 Arg Phe Leu His Arg Lys Ala Leu Lys Asn Val Arg Tyr Lys Gly Tyr 370 375 380 Asp Ile Pro Ser Gly Trp Lys Val Leu Pro Val Ile Ser Ala Val His 385 390 395 400 Leu Asp Asn Ser Arg Tyr Asp Glu Pro Asn Leu Phe Asn Pro Trp Arg 405 410 415Phe Ile Leu Gln Asn Glu Gly Arg Leu Phe Glu Cys Ser Tyr Pro Arg 100 105 110 Ser Ile Gly Gly Ile Leu Gly Lys Trp Being Met Leu Val Leu Val Gly 115 120 125 Asp Met His Arg Phe Leu Be His 130 130 140 Wing Arg Leu Arg Thr Ile Leu Leu Lys Asp Val Glu Arg His Thr Leu 145 150 155 160 Phe Val Leu Asn Ser Trp Gln Gln His Ser Val Phe Ser Wing Gln Asp 165 170 175 Glu Ala Lys Lys Phe Thr Phe Asn Leu Met Lys Wing His Ile Met Ser 180 185 190 Met Asp Pro Gly Glu Glu Glu Thr Glu Leu Lys Lys Glu Tyr Val 195 200 205 Thr Phe Met Lys Gly Val Val Ala Pro Leu Asn Leu Pro Gly Thr 210 215 220 Wing Tyr Arg Lys Wing Leu Gln Gln Ser Arg Gly Thr Ile Leu Lys Phe 225 230 235 240 Ile Glu Lys Lys Met Glu Glu Arg Lys Ser Glu Ile Gln Glu Asu Glu Asp Arg Ser Asp His Tyr Glu Arg Lys 260 265 270 His Arg Wing Asp Asp Asp Leu Leu Gly Trp Val Leu Lys His Ser Asn 275 280 285 Leu Being Thr Glu Gln Ile Leu Asp Leu Ile Leu Being Leu Leu Phe Wing 290 295 300 Gly His Glu Thr Being Val Ala Ile Ala Ile Tyr Phe Leu 305 310 315 320 Wing Gly Xaa Leu Lys Glu Glu His Leu Glu Ile Wing Arg Val Lys Lys 325 330 335 Glu Leu Gly Glu Be Glu Leu Asn Trp Asp Tyr Lys Thr Met Asp 340 345 350 Phe Thr His Ser Val Ile Asn Glu Thr Leu Arg Leu Gly Asn Val Val 355 360 365 Arg Phe Read His Arg Lys Wing Leu Lys Asn Val Arg Tyr Lys Gly Tyr 370 375 380 Asp Ile Pro Be Gly Read Asp Asn Be Arg Tyr Asp Glu Pro Asn

Trp Gln GlnTrp Gln Gln

<210> 121 <211> 848 <212> DNA<210> 121 <211> 848 <212> DNA

<213> Hordeum vulgare <4 00> 121<213> Hordeum vulgare <4 00> 121

atggccgcca tgatggcatc cataaccagc gagctccttt tcttcctccc cttcatcctc 60atggccgcca tgatggcatc cataaccagc gagctccttt tcttcctccc cttcatcctc 60

ctggccctgc tcaccttcta caccagcagc gtggccaaat gccatggcct ccaccggtgg 120ctggccctgc tcaccttcta caccagcagc gtggccaaat gccatggcct ccaccggtgg 120

agcggccgga cgaagaagaa gcggccgaat ctgccgcccg gcgccgccgg ctggcctttc 180agcggccgga cgaagaagaa gcggccgaat ctgccgcccg gcgccgccgg ctggcctttc 180

gtcggcgaga ccttcgggta cctccgcgcc cacccggcca cctccatcgg ccagttcatg 240gtcggcgaga ccttcgggta cctccgcgcc cacccggcca cctccatcgg ccagttcatg 240

aaccagcaca tcgcacggta cgggaagata taccggtcga gcctgttcgg ggagcggacg 300aaccagcaca tcgcacggta cgggaagata taccggtcga gcctgttcgg ggagcggacg 300

gtggtgtcgg cggacgcggg gctgaaccgg tacatcctgc agaacgaggg gcggctgttc 360gtggtgtcgg cggacgcggg gctgaaccgg tacatcctgc agaacgaggg gcggctgttc 360

gagtgcagct acccgcggag catcggcggc atcctgggca aatggtccat gctggtgctc 420gagtgcagct acccgcggag catcggcggc atcctgggca aatggtccat gctggtgctc 420

gtgggcgacc cccaccgcga gatgcgctcc atctccctca acttcctcag ctccctccgc 480gtgggcgacc cccaccgcga gatgcgctcc atctccctca acttcctcag ctccctccgc 480

ctccgcgccg tgctcctccc ggaggtggag cgccacaccc tcctcgtcct ccgcgactgg 540ctccgcgccg tgctcctccc ggaggtggag cgccacaccc tcctcgtcct ccgcgactgg 540

ctgccttcct cctcctccgc cgtcttctcc gcccagcacg aagccaagaa gttcacgttt 600ctgccttcct cctcctccgc cgtcttctcc gcccagcacg aagccaagaa gttcacgttt 600

aacctgatgg cgaagaacat catgagcatg gaccccggcg aggaggagac ggagcggctg 660aacctgatgg cgaagaacat catgagcatg gaccccggcg aggaggagac ggagcggctg 660

aggctcgagt acatcacctt catgaagggg gtggtgtccg cgcccctcaa cttccccggg 720aggctcgagt acatcacctt catgaagggg gtggtgtccg cgcccctcaa cttccccggg 720

acggcctact ggaaggccct caagtctcga gccaccatac ttggggtaat agagaggaaa 780acggcctact ggaaggccct caagtctcga gccaccatac ttggggtaat agagaggaaa 780

atggaggata ggctcgagaa aatgaacaag gaggcctcga gcatgaagaa gatatctctc 840atggaggata ggctcgagaa aatgaacaag gaggcctcga gcatgaagaa gatatctctc 840

ggggggcg 848 <210> 122 <211> 282 <212> PRTggggggcg 848 <210> 122 <211> 282 <212> PRT

<213> Hordeum vulgare <400> 122<213> Hordeum vulgare <400> 122

Met Ala Ala Met Met Ala Ser Ile Thr Ser Glu Leu Leu Phe Phe Leu 1 5 10 15 Pro Phe Ile Leu 20 Leu Ala Leu Leu Thr 25 Phe Tyr Thr Ser Ser 30 Val Ala Lys Cys His 35 Gly Leu His Arg Trp 40 Ser Gly Arg Thr Lys 45 Lys Lys Arg Pro Asn 50 Leu Pro Pro Gly Ala 55 Ala Gly Trp Pro Phe 60 Val Gly Glu Thr Phe Gly Tyr Leu Arg Ala His Pro Ala Thr Ser Ile Gly Gln Phe Met 65 70 75 80 Asn Gln His Ile Ala 85 Arg Tyr Gly Lys Ile 90 Tyr Arg Ser Ser Leu 95 Phe Gly Glu Arg Thr 100 Val Val Ser Ala Asp 105 Ala Gly Leu Asn Arg 110 Tyr Ile Leu Gln Asn 115 Glu Gly Arg Leu Phe 120 Glu Cys Ser Tyr Pro 125 Arg Ser Ile Gly Gly 130 Ile Leu Gly Lys Trp 135 Ser Met Leu Val Leu 140 Val Gly Asp Pro His Arg Glu Met Arg Ser Ile Ser Leu Asn Phe Leu Ser Ser Leu Arg 145 150 155 160 Leu Arg Ala Val Leu 165 Leu Pro Glu Val Glu 170 Arg His Thr Leu Leu 175 Val Leu Arg Asp Trp 180 Leu Pro Ser Ser Ser 185 Ser Ala Val Phe Ser 190 Ala Gln His Glu Ala 195 Lys Lys Phe Thr Phe 200 Asn Leu Met Ala Lys 205 Asn Ile Met Ser Met 210 Asp Pro Gly Glu Glu 215 Glu Thr Glu Arg Leu 220 Arg Leu Glu Tyr Ile Thr Phe Met Lys Gly Val Val Ser Ala Pro Leu Asn Phe Pro Gly 225 230 235 240 Thr Ala Tyr Trp Lys 245 Ala Leu Lys Ser Arg 250 Ala Thr Ile Leu Gly 255 Val Ile Glu Arg Lys 260 Met Glu Asp Arg Leu 265 Glu Lys Met Asn Lys 270 Glu Ala Ser Ser Met 275 Lys Lys Ile Ser Leu 280 Gly GlyMet Wing Ala Met Met Ala Ser Ile Thr Be Glu Leu Leu Phe Phe Leu 1 5 10 15 Pro Phe Ile Leu 20 Leu Wing Leu Leu Thr 25 Phe Tyr Thr Ser 30 Val Alys Lys Cys His 35 Gly Leu His Arg Trp 40 Ser Gly Arg Thr Lys 45 Lys Lys Arg Pro Asn 50 Leu Pro Pro Gly Wing 55 Wing Gly Trp Pro Phe 60 Val Gly Glu Thr Phe Gly Tyr Leu Arg Wing His Pro Thr Be Ile Gly Gln Phe Met 65 70 75 80 Asn Gln His Ile Wing 85 Arg Tyr Gly Lys Ile 90 Tyr Arg Be Ser Leu 95 Phe Gly Glu Arg Thr 100 Val Val Ser Wing Asp 105 Wing Gly Leu Asn Arg 110 Tyr Ile Leu Gln Asn 115 Glu Gly Arg Leu Phe 120 Glu Cys Ser Tyr Pro 125 Arg Be Ile Gly Gly 130 Ile Leu Gly Lys Trp 135 Ser Met Leu Val Leu 140 Val Gly Asp Pro His Arg Glu Met Arg Be Ile Be Leu Asn Phe Leu Be Ser Leu Arg 145 150 155 160 Leu Arg Wing Val Leu 165 Leu Pro Glu Val Glu 170 Arg His Thr Leu Leu 175 Val Leu Arg Asp Trp 180 Leu Pro Ser Ser Ser 185 Ser Val Val Phe Ser 190 Gln His Glu Wing 195 Lys Lys Phe Thr Phe 200 Asn Leu Met Ala Lys 20 5 Asn Ile Met Be Met 210 Asp Pro Gly Glu Glu 215 Glu Thr Glu Arg Leu 220 Arg Leu Glu Tyr Ile Thr Phe Met Lys Gly Val Val Be Wing Pro Read Asn Phe Pro Gly 225 230 235 240 Thr Wing Tyr Trp Lys 245 Wing Leu Lys Ser Arg 250 Wing Thr Ile Leu Gly 255 Val Ile Glu Arg Lys 260 Met Glu Asp Arg Leu 265 Glu Lys Met Asn Lys 270 Glu Wing To Be Met 275 Lys Lys Ile Ser Leu 280 Gly Gly

<210> 123 <211> 1200 <212> DNA<210> 123 <211> 1200 <212> DNA

<213> Lotus japonicus <400> 123<213> Lotus japonicus <400> 123

atgtctgact catacctcac tttctgtttt ctttcttcca ttcttgctct cactgtaatc 60atgtctgact catacctcac tttctgtttt ctttcttcca ttcttgctct cactgtaatc 60

atcattttca tgaaaagaaa gaaggcaagg cttaaccttc cccctggaaa aatgggatgg 120atcattttca tgaaaagaaa gaaggcaagg cttaaccttc cccctggaaa aatgggatgg 120

ccctttcttg gggaaaccat tgggtacttg aagccatact ctgctaccac agtaggagat 180ccctttcttg gggaaaccat tgggtacttg aagccatact ctgctaccac agtaggagat 180

tttatggaaa agcacatagc aaggtatggt acaatttaca agtcaaaatt gtttggtgag 240tttatggaaa agcacatagc aaggtatggt acaatttaca agtcaaaatt gtttggtgag 240

cctgcaatag tttctgcaga tgcagagttg aacaggttca tattacagaa cgaagggaag 300cctgcaatag tttctgcaga tgcagagttg aacaggttca tattacagaa cgaagggaag 300

ctgtttgagt gcagctatcc aagaagcatt ggaggaatac ttggaaaatg gtccatgttg 360ctgtttgagt gcagctatcc aagaagcatt ggaggaatac ttggaaaatg gtccatgttg 360

gtcttagttg gggacatgca tagggacatg agaaacattt cactgaactt tctgagcctt 420gtcttagttg gggacatgca tagggacatg agaaacattt cactgaactt tctgagcctt 420

gctaggctca aaacacatct attgaaagaa gtggagaagc actctcttct agttctaggc 480gctaggctca aaacacatct attgaaagaa gtggagaagc actctcttct agttctaggc 480

tcttggaaag aaaattgtac attctcagct caagatgaag caaagaagtt cacattcaat 540tcttggaaag aaaattgtac attctcagct caagatgaag caaagaagtt cacattcaat 540

ttgatggcga aacatatcat gagcttggat cctgggaatc tagagacaga acagctgaag 600ttgatggcga aacatatcat gagcttggat cctgggaatc tagagacaga acagctgaag 600

aaagagtatg tctctttcat gaatggtgtg gtgtctgcac ctttgaattt tcccggaact 660aaagagtatg tctctttcat gaatggtgtg gtgtctgcac ctttgaattt tcccggaact 660

gcatacagaa aagcattaaa gtctaggtcc accatactga agttcataga gggaaaaatg 720gcatacagaa aagcattaaa gtctaggtcc accatactga agttcataga gggaaaaatg 720

gaagaaagga tcaaaagaaa ccaaaatttg gaggaagatc ttctaaactg ggttgtgatg 780gaagaaagga tcaaaagaaa ccaaaatttg gaggaagatc ttctaaactg ggttgtgatg 780

cattcaaatc tttcaactga gcaaattctt gacctggttc tgagcttgct ctttgcaggc 840cattcaaatc tttcaactga gcaaattctt gacctggttc tgagcttgct ctttgcaggc 840

catgaaactt catctgtggc tatagcttta gctatttact ttttgccagg ttgtcctaaa 900catgaaactt catctgtggc tatagcttta gctatttact ttttgccagg ttgtcctaaa 900

gctatacaac aattaaggga agaacataga gaaatagcca ggtccaagaa gcaagcaggg 960gctatacaac aattaaggga agaacataga gaaatagcca ggtccaagaa gcaagcaggg 960

gaggttgaat taacttggga tgattacaaa agaatggagt ttactcaatg tgtagttgtg 1020 aatgaaacac tgaggttggg aaatgttgtg aggttccttc acaggaaggc tctgaaagat 1080 gttcggtaca aaggttatga cattccacgt gggtggaaag tcctccctgt gatttcagct 1140 atgcatctgg atcctgcact tttttaccaa cctcaacact tcaatccatg gagatggaag 1200gaggttgaat taacttggga tgattacaaa agaatggagt ttactcaatg tgtagttgtg 1020 aatgaaacac tgaggttggg aaatgttgtg aggttccttc acaggaaggc tctgaaagat 1080 gttcggtaca aaggttatga cattccacgt gggtggaaag tcctccctgt gatttcagct 1140 atgcatctgg atcctgcact tttttaccaa cctcaacact tcaatccatg 1200 gagatggaag

<210> 124<210> 124

<211> 400<211> 400

<212> PRT<212> PRT

<213> Lotus japonicus<213> Lotus japonicus

<400> 124<400> 124

Met Ser Asp Ser Tyr Leu Thr Phe Cys Phe Leu Ser Ser Ile Leu Ala 1 5 10 15Met Ser Asp Ser Tyr Leu Thr Phe Cys Phe Le Ser Ser Ile Leu Wing 1 5 10 15

Leu Thr Val Ile Ile Ile Phe Met Lys Arg Lys Lys Ala Arg Leu AsnLeu Thr Val Ile Ile Ile Phe Met Lys Arg Lys Lys Wing Arg Leu Asn

20 25 3020 25 30

Leu Pro Pro Gly Lys Met Gly Trp Pro Phe Leu Gly Glu Thr Ile GlyRead Pro Gly Gly Lys Met Gly Trp Pro Phe Read Gly Gly Glu Thr Ile Gly

35 40 4535 40 45

Tyr Leu Lys Pro Tyr Ser Ala Thr Thr Val Gly Asp Phe Met Glu LysTyr Leu Lys Pro Tyr Be Wing Thr Thr Val Gly Asp Phe Met Glu Lys

50 55 6050 55 60

His Ile Ala Arg Tyr Gly Thr Ile Tyr Lys Ser Lys Leu Phe Gly Glu 65 70 75 80His Ile Wing Arg Tyr Gly Thr Ile Tyr Lys Ser Lys Leu Phe Gly Glu 65 70 75 80

Pro Ala Ile Val Ser Ala Asp Ala Glu Leu Asn Arg Phe Ile Leu GlnPro Wing Ile Val Ser Wing Asp Wing Glu Leu Asn Arg Phe Ile Leu Gln

85 90 9585 90 95

Asn Glu Gly Lys Leu Phe Glu Cys Ser Tyr Pro Arg Ser Ile Gly GlyAsn Glu Gly Lys Leu Phe Glu Cys Ser Tyr Pro Arg Ser Ile Gly Gly

100 105 110100 105 110

Ile Leu Gly Lys Trp Ser Met Leu Val Leu Val Gly Asp Met His ArgIle Leu Gly Lys Trp Being Met Leu Val Leu Val Gly Asp Met His Arg

115 120 125115 120 125

Asp Met Arg Asn Ile Ser Leu Asn Phe Leu Ser Leu Ala Arg Leu LysAsp Met Arg Asn Ile Be Read Asn Phe Read Be Read Read Wing Arg Read Read Lys

130 135 140130 135 140

Thr His Leu Leu Lys Glu Val Glu Lys His Ser Leu Leu Val Leu Gly 145 150 155 160Thr His Leu Leu Lys Glu Val Glu Lys His Ser Leu Leu Val Leu Gly 145 150 155 160

Ser Trp Lys Glu Asn Cys Thr Phe Ser Ala Gln Asp Glu Ala Lys LysBe Trp Lys Glu Asn Cys Thr Phe Be Wing Gln Asp Glu Wing Lys Lys

165 170 175165 170 175

Phe Thr Phe Asn Leu Met Ala Lys His Ile Met Ser Leu Asp Pro GlyPhe Thr Phe Asn Le Met Met Wing Lys His Ile Met Being Le Asp Pro Gly

180 185 190180 185 190

Asn Leu Glu Thr Glu Gln Leu Lys Lys Glu Tyr Val Ser Phe Met AsnAsn Leu Glu Thr Glu Gln Leu Lys Lys Glu Tyr Val Ser Phe Met Asn

195 200 205195 200 205

Gly Val Val Ser Ala Pro Leu Asn Phe Pro Gly Thr Ala Tyr Arg LysGly Val Val Ser Wing Pro Read Asn Phe Pro Gly Thr Wing Tyr Arg Lys

210 215 220210 215 220

Ala Leu Lys Ser Arg Ser Thr Ile Leu Lys Phe Ile Glu Gly Lys Met 225 230 235 240Wing Read Lys Be Arg Be Thr Ile Read Lys Phe Ile Glu Gly Lys Met 225 230 235 240

Glu Glu Arg Ile Lys Arg Asn Gln Asn Leu Glu Glu Asp Leu Leu AsnGlu Glu Arg Ile Lys Arg Asn Gln Asn Read Glu Glu Asp Read Leu Asn

245 250 255245 250 255

Trp Val Val Met His Ser Asn Leu Ser Thr Glu Gln Ile Leu Asp LeuTrp Val Val Met His Be Asn Leu Be Thr Glu Gln Ile Leu Asp Leu

260 265 270260 265 270

Val Leu Ser Leu Leu Phe Ala Gly His Glu Thr Ser Ser Val Ala IleVal Leu Ser Leu Leu Phe Ala Gly His Glu Thr Ser Ser Val Ala Ile

275 280 285275 280 285

Ala Leu Ala Ile Tyr Phe Leu Pro Gly Cys Pro Lys Ala Ile Gln GlnWing Leu Wing Ile Tyr Phe Leu Pro Gly Cys Pro Lys Wing Ile Gln Gln

290 295 300290 295 300

Leu Arg Glu Glu His Arg Glu Ile Ala Arg Ser Lys Lys Gln Ala Gly 305 310 315 320Read Arg Glu Glu His Arg Glu Ile Wing Arg Be Lys Lys Wing Gln Gly 305 310 315 320

Glu Val Glu Leu Thr Trp Asp Asp Tyr Lys Arg Met Glu Phe Thr GlnGlu Val Glu Leu Thr Trp Asp Asp Tyr Lys Arg Met Glu Phe Thr Gln

325 330 335325 330 335

Cys Val Val Val Asn Glu Thr Leu Arg Leu Gly Asn Val Val Arg PheCys Val Val Val Val Asn Glu Thr Leu Arg Leu Gly Asn Val Val Arg Phe

340 345 350340 345 350

Leu His Arg Lys Ala Leu Lys Asp Val Arg Tyr Lys Gly Tyr Asp IleRead His Arg Lys Wing Read Le Lys Asp Val Arg Tyr Lys Gly Tyr Asp Ile

355 360 365355 360 365

Pro Arg Gly Trp Lys Val Leu Pro Val Ile Ser Ala Met His Leu AspPro Arg Gly Trp Lys Val Leu Pro Val Ile Be Wing Met His Leu Asp

370 375 380370 375 380

Pro Ala Leu Phe Tyr Gln Pro Gln His Phe Asn Pro Trp Arg Trp Lys 385 390 395 400Pro Wing Read Phe Tyr Gln Pro Gln His Phe Asn Pro Trp Arg Trp Lys 385 390 395 400

<210> 125<210> 125

<211> 1092<211> 1092

<212> DNA<212> DNA

<213> Malus domestica<213> Malus domesticus

<400> 125 agagacatga atgagagaag ttttcagctc agcttggatc aaaggtgtgg tcaagatcaa accgaaaaca aaggagcaaa gtgtctatag agggaagaac tgggaggact gggaatgtgg gacattccat ctttttgacc caccgtggat ccatttgggg gtgttcatcc ccttttgctt gtaccaaact <210> 126 <211> 363 <212> PRT <213> Malus <400> 126<400> 125 agagacatga atgagagaag ttttcagctc agcttggatc aaaggtgtgg tcaagatcaa accgaaaaca aaggagcaaa gtgtctatag agggaagaac tgggaggact gggaatgtgg gacattccat ctttttgacc caccgtggat ccatttgggg gtgttcatcc ccttttgctt gtaccaaact <210> 126 <211> 363 <212> PRT <213> Malus <400> 126

ggatgatatc ttgaaaagca aggatgaagc ctggaaaacc tttctcctcc cgattctgaa ttggggaaga ttcttgactt ccttagcaat acagtgaaat acaagaaaat tgagattttt ctgggtggaa acccgcaaca catcgtcgtc gaggaccacg accaccttgt tccccttcgt aaggatgatatc ttgaaaagca aggatgaagc ctggaaaacc tttctcctcc cgattctgaa ttggggaaga ttcttgactt ccttagcaat acagtgaaat acaagaaaat tgagattttt ctgggtggaa acccgacaca catgggact tcggacaca

domesticadomestic

tctcaacttc cactcttctt taagaagttc agagactgag tctgaattta gtttatagag tgatctgctt aatattgagc ttacttttta tgccaaagcc ggagttcacc acacagaaag agtgcttccg cttcaatcca atcatcatgc actttgcgcc cctcaacttc cgatttccaatctcaacttc cactcttctt taagaagttc agagactgag tctgaattta gtttatagag tgatctgctt aatattgagc ttacttttta tgccaaagcc tgccaaagcc

ttgagccatg gttttgggga acgttcaact cagctgaaga ccaggaacag tgcaaaatga ggatgggttc ttgctctttg ccaagctgcc aagaaactgg gaatgtgtaa gctctgaagg gtgattgcag tggagatggc tacacgagca ggttcagaat cactgggagt aatggcctacttgagccatg gttttgggga acgttcaact cagctgaaga ccaggaacag tgcaaaatga ggatgggttc ttgctctttg ccaagctgcc aagaaactgg gaattgtgag

ccagactcag gttggaagga tgatggccaa aattgtatgt cttacagaag aagaaagatt tgaagaattc ctggccatga ctaatgcaat caggcgagac tctgtgagac atgttcggta ccgtgcattt agcagaataa tgacaagtca tggccaaact tagccgatcc caatcacagcccagactcag gttggaagga tgatggccaa aattgtatgt cttacagaag aagaaagatt tgaagaattc ctggccatga ctaatgcaat caggcgagac tctgtgagac

aacccatctg aaactctgtt acatatcatg tactttcatg agccttacag gatggaggga aaatctttca aacttcatca tctgcagtta agagttgaat acttcggctt caaagggtat ggatccttta caaccaccac caactttatg tgaaatggcc tttcgacaaa ccaccgctacaacccatctg aaactctgtt acatatcatg tactttcatg agccttacag gatggaggga aaatctttca aacttcatca tctgcagtta agagttgaat acttcggctt caaagggtat ggatccttta caaccaccac caactttatg tgaagggccca

Arg Asp Met Arg Met Ile Ser Leu Asn Phe Leu Ser His Ala Arg Leu 1 5 10 15 Arg Thr His Leu Met Arg Glu Val Glu Lys His Thr Leu Leu Val Leu 20 25 30 Gly Ser Trp Lys Glu Asn Ser Val Phe Ser Ala Gln Asp Glu Ala Lys 35 40 45 Lys Phe Thr Phe Asn Leu Met Ala Lys His Ile Met Ser Leu Asp Pro 50 55 60 Gly Lys Pro Glu Thr Glu Gln Leu Lys Lys Leu Tyr Val Thr Phe Met 65 70 75 80 Lys Gly Val Val Ser Pro Pro Leu Asn Leu Pro Gly Thr Ala Tyr Arg 85 90 95 Arg Ala Leu Gln Ser Arg Ser Thr Ile Leu Lys Phe Ile Glu Cys Lys 100 105 110 Met Lys Glu Arg Leu Met Glu Gly Thr Glu Asn Ile Gly Glu Asp Asp 115 120 125 Leu Leu Gly Trp Val Leu Lys Asn Ser Asn Leu Ser Lys Glu Gln Ile 130 135 140 Leu Asp Leu Ile Leu Ser Leu Leu Phe Ala Gly His Glu Thr Ser Ser 145 150 155 160 Val Ser Ile Ala Leu Ala Ile Tyr Phe Leu Pro Ser Cys Pro Asn Ala 165 170 175 Ile Leu Gln Leu Arg Glu Glu His Ser Glu Ile Ala Lys Ala Lys Lys 180 185 190 Leu Ala Gly Glu Thr Glu Leu Asn Trp Glu Asp Tyr Lys Lys Met Glu 195 200 205 Phe Thr Glu Cys Val Ile Cys Glu Thr Leu Arg Leu Gly Asn Val Val 210 215 220 Arg Phe Leu His Arg Lys Ala Leu Lys Asp Val Arg Tyr Lys Gly Tyr 225 230 235 240 Asp Ile Pro Ser Gly Trp Lys Val Leu Pro Val Ile Ala Ala Val His 245 250 255 Leu Asp Pro Leu Leu Phe Asp His Pro Gln His Phe Asn Pro Trp Arg 260 265 270 Trp Gln Gln Asn Asn Asn His His His Arg Gly Ser Ser Ser Ser Ser 275 280 285 Ser Cys Tyr Thr Ser Met Thr Ser His Asn Phe Met Pro Phe Gly Gly 290 295 300 Gly Pro Arg Leu Cys Ala Gly Ser Glu Leu Ala Lys Leu Glu Met AlaArg Asp Met Arg Met Ile Be Leu Asn Phe Leu Be His Wing Arg Leu 1 5 10 15 Arg Thr His Leu Met Arg Glu Val Glu Lys His Thr Leu Leu Val Leu 20 25 30 Gly Ser Trp Lys Glu Asn Be Val Phe Ser Ala Gln Asp Glu Ala Lys 35 40 45 Lys Phe Thr Phe Asn Leu Met Ala Lys His Ile Met Being Read Asp Pro 50 55 60 Gly Lys Pro Glu Thr Glu Gln Leu Lys Lys Leu Tyr Val Thr Phe Met 65 70 75 80 Lys Gly Val Val Ser Pro Pro Leu Asn Leu Pro Gly Thr Wing Tyr Arg 85 90 95 Arg Wing Leu Gln Ser Arg Be Thr Ile Leu Lys Phe Ile Glu Cys Lys 100 105 110 Met Lys Glu Arg Leu Met Glu Gly Thr Glu Asn Ile Gly Glu Asp Asp 115 120 125 Leu Leu Gly Trp Val Leu Lys Asn Ser Asn Leu Ser Lys Glu Gln Ile 130 135 140 Leu Asp Leu Ile Leu Seru Leu Phe Wing Gly His Glu Thr Ser Ser 145 150 155 160 Val Ser Ile Ala Leu Ala Ile Tyr Phe Leu Pro Be Cys Pro Asn Wing 165 170 175 Ile Leu Gln Leu Arg Glu Glu His Se r Glu Ile Wing Lys Wing Lys Lys 180 185 190 Leu Wing Gly Glu Thr Glu Leu Asn Trp Glu Asp Tyr Lys Lys Met Glu 195 200 205 Phe Thr Glu Cys Val Ile Cys Glu Thr Leu Arg Leu Gly Asn Val Val 210 215 220 Arg Phe Leu His Arg Lys Wing Leu Lys Asp Val Arg Tyr Lys Gly Tyr 225 230 235 240 Asp Ile Pro Be Gly Trp Lys Val Leu Pro Val Ile Wing Val His 245 250 255 Leu Asp Pro Leu Phe Asp His Pro Gln His Phe Asn Pro Trp Arg 260 265 270 Trp Gln Gln Asn Asn Asn His His Arg His Gly Be Ser Ser Ser Ser Ser 275 280 285 Ser Cyr Tyr Thr Ser Met Thr Ser As As Phe Met Pro Phe Gly Gly 290 295 300 Gly Pro Arg Leu Cys Wing Gly Ser Glu Leu Wing Lys Leu Glu Met Wing

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1092 305 310 31560 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1092 305 310 315

Val Phe Ile His His Leu Val Leu Asn Phe HisVal Phe Ile His His Leu Val Leu Asn Phe His

325 330325 330

Pro Phe Asp Lys Pro Phe Ala Phe Pro Phe ValPro Phe Asp Lys Pro Phe Ala Phe Pro Phe Val

340 345340 345

Leu Pro Ile Thr Ala His Arg Tyr Val Pro AsnRead Pro Ile Thr Wing His Arg Tyr Val Pro Asn

355 360355 360

<210> 127 <211> 748 <212> DNA<210> 127 <211> 748 <212> DNA

<213> Vitis vinifera <4 00> 127<213> Vitis vinifera <4 00> 127

agacttcatg gagcaacaca tatcaaggtt cggagaaatc cgagccaacc atagtctcag cggattctgg gctgaacaga aaaattgttt gaatgcagct atcccagaag cataggtgga gctggtttta gttggagaca tgcatagaga catgagaacc ccatggcagg cttaggactc atctcctacc agaggtggtg aagctcttgg aaggagaatt gtacattttc tgctcaagat caatctgatg gcaaaacata tcatgagctt ggatcccgga taagaaagag tatgttactt tcatgaaagg agtggtatct aactgcatac agaaaagccc tacagtctcg gtccaccatc gatggaagag aggattcaga aactgagggg aggagggttt tcttcttgga tgggtgctga agcattccaa cctttcaact actgagcttg ctctttgctg gccatgaaac ttcatcagtg cttcttggaa ggctgtccca acgccgtt <210> 128 <211> 248 <212> PRTagacttcatg gagcaacaca tatcaaggtt cggagaaatc cgagccaacc atagtctcag cggattctgg gctgaacaga aaaattgttt gaatgcagct atcccagaag cataggtgga gctggtttta gttggagaca tgcatagaga catgagaacc ccatggcagg cttaggactc atctcctacc agaggtggtg aagctcttgg aaggagaatt gtacattttc tgctcaagat caatctgatg gcaaaacata tcatgagctt ggatcccgga taagaaagag tatgttactt tcatgaaagg agtggtatct aactgcatac agaaaagccc tacagtctcg gtccaccatc gatggaagag aggattcaga aactgagggg aggagggttt tcttcttgga tgggtgctga agcattccaa cctttcaact actgagcttg ctctttgctg gccatgaaac ttcatcagtg cttcttggaa ggctgtccca acgccgtt <210> 128 <211> 248 <212> PRT

<213> Vitis vinifera <4 00> 128<213> Vitis vinifera <4 00> 128

Asp Phe Met Glu Gln His Ile Ser Arg Phe Gly 15 10Asp Phe Met Glu Gln His Ile Be Arg Phe Gly 15 10

Asn Leu Phe Gly Glu Pro Thr Ile Val Ser AlaAsn Leu Phe Gly Glu Pro Thr Ile Val Ser Ala

20 2520 25

Arg Phe Ile Leu Gln Asn Glu Gly Lys Leu PheArg Phe Ile Leu Gln Asn Glu Gly Lys Leu Phe

35 4035 40

Arg Ser Ile Gly Gly Ile Leu Gly Lys Trp SerArg Be Ile Gly Gly Ile Read Gly Lys Trp Ser

50 5550 55

Gly Asp Met His Arg Asp Met Arg Thr Ile Ser 65 70 75Gly Asp Met His Arg Asp Met Arg Thr Ile Ser 65 70 75

His Gly Arg Leu Arg Thr His Leu Leu Pro GluHis Gly Arg Leu Arg Thr His Leu Leu Pro Glu

85 9085 90

Leu Leu Val Leu Ser Ser Trp Lys Glu Asn CysLeu Leu Val Leu Being Trp Lys Glu Asn Cys

100 105100 105

Asp Glu Ala Lys Lys Phe Thr Phe Asn Leu MetAsp Glu Wing Lys Lys Phe Thr Phe Asn Leu Met

115 120115 120

Ser Leu Asp Pro Gly Lys Pro Glu Thr Glu GlnGet Asp Pro Gly Lys Pro Glu Thr Glu Gln

130 135130 135

Val Thr Phe Met Lys Gly Val Val Ser Ala Pro 145 150 155Val Thr Phe Met Lys Gly Val Val Ser Wing Pro 145 150 155

Thr Ala Tyr Arg Lys Ala Leu Gln Ser Arg SerThr Wing Tyr Arg Lys Wing Read Gln Ser Arg Ser

165 170165 170

Ile Glu Leu Lys Met Glu Glu Arg Ile Gln LysIle Glu Read Lys Met Glu Arg Ile Glu Lys

180 185180 185

Phe Glu Asn Met Glu Asp Asp Asp Leu Leu GlyPhe Glu Asn Met Glu Asp Asp Asp Read Leu Gly

195 200195 200

Ser Asn Leu Ser Thr Glu Gln Ile Leu Asp LeuBe Asn Leu Be Thr Glu Gln Ile Leu Asp Leu

210 215210 215

Phe Ala Gly His Glu Thr Ser Ser Val Ala Ile 225 230 235Phe Ala Gly His Glu Thr Ser Ser Val Ala Ile 225 230 235

Phe Leu Glu Gly Cys Pro Asn Ala 245Phe Leu Glu Gly Cys Pro Asn Wing 245

<210> 129<210> 129

320320

Trp Glu Leu Ala Asp 335Trp Glu Leu Wing Asp 335

Asp Phe Gln Asn Gly 350Asp Phe Gln Asn Gly 350

tacaagtcca ttcatactac attcttggga atctccctca aagcacactt gaagctaaga aagccggaga gctcctttga ttaaaattta gagaatatgg gagcaaatcc gcaatagctttacaagtcca ttcatactac attcttggga atctccctca aagcacactt gaagctaaga aagccggaga gctcctttga ttaaaattta gagaatatgg gagcaaatcc gcaatagctt

atctgtttgg agaacgaagg aatggtccat acttcttgag tgcttgttct agtttacctt ctgagcagct atttccctgg tcgagctgaa aggatgacga tggacttggt tagctatctaatctgtttgg agaacgaagg aatggtccat acttcttgag tgcttgttct agtttacctt ctgagcagct atttccctgg tcgagctgaa aggatgacga tggacttggt tagctatcta

GluGlu

AspAsp

GluGlu

Met 60 LeuMet 60 Leu

ValVal

ThrThr

AlaAllah

Leu 140 LeuLeu 140 Leu

ThrThr

LeuRead

TrpTrp

Val 220 AlaVal 220 Wing

IleIle

SerTo be

CysCys

4545

LeuRead

AsnAsn

ValVal

PhePhe

Lys 125 LysLys 125 Lys

AsnAsn

IleIle

ArgArg

Val 205 LeuVal 205 Leu

LeuRead

TyrTyr

GlyGly

3030

SerTo be

ValVal

PhePhe

LysLys

Ser 110 HisSer 110 His

LysLys

PhePhe

LeuRead

Gly 190 LeuGly 190 Leu

SerTo be

AlaAllah

Lys Ser 15Lys Ser 15

Leu AsnRead asn

Tyr ProTyr pro

Leu ValRead val

Leu Ser 80 His Thr 95Read Ser 80 His Thr 95

Ala GlnGln Wing

Ile MetIle met

Glu TyrGlu Tyr

Pro Gly 160 Lys Phe 175Pro Gly 160 Lys Phe 175

Gly GlyGly Gly

Lys HisLys his

Leu LeuLeu Leu

Ile Tyr 240Ile Tyr 240

60 120 180 240 300 360 420 480 540 600 660 720 748 <211> 1737 <212> DNA60 120 180 240 300 360 420 480 540 600 660 720 748 <211> 1737 <212> DNA

<213> Arabidopsis thaliana <400> 129<213> Arabidopsis thaliana <400> 129

atgcaacaac tgtcaacttc tctactaaaa acacgagttc catggcctta aagatatctc aacatgtcat tctataatac ccaccacttt tccggaattt agttctccaa agtccactgt gaaggaaagt tacgtaagat tcaagactgt ctgctgattc aatgtgaaca acgcttccaa tctgtaacac ttcggaaggg ggggaacctt ttgatgattc aatgatcaag aagacgaaac acaattggtg tttcggaaat tcatacatgt acaggtgtca tataatacag gatgggttct ttagaggctg aaaaggcatt atggatatat actctacggt gctcaggaac taatatcaac tgctatagct tgcaaaagga ctgaatccaa gatttgcata gattttgaga acggaatgaa aacgcatggt acgggcttgg catcacttca gaatggcttt gggacatctt tgcatgcctt atagtagcag atagaaaaaa ttagaaagat tagatgaagc gagagcagcg tttacgcttt gccatgcttc atttcggtct ataaaggctg caatggagaa <210> 130 <211> 578 <212> PRT <213> Arabidopsis thaliana <400> 130atgcaacaac tgtcaacttc tctactaaaa acacgagttc catggcctta aagatatctc aacatgtcat tctataatac ccaccacttt tccggaattt agttctccaa agtccactgt gaaggaaagt tacgtaagat tcaagactgt ctgctgattc aatgtgaaca acgcttccaa tctgtaacac ttcggaaggg ggggaacctt ttgatgattc aatgatcaag aagacgaaac acaattggtg tttcggaaat tcatacatgt acaggtgtca tataatacag gatgggttct ttagaggctg aaaaggcatt atggatatat actctacggt gctcaggaac taatatcaac tgctatagct tgcaaaagga ctgaatccaa gatttgcata gattttgaga acggaatgaa aacgcatggt acgggcttgg catcacttca gaatggcttt gggacatctt tgcatgcctt atagtagcag atagaaaaaa ttagaaagat tagatgaagc gagagcagcg tttacgcttt gccatgcttc atttcggtct ataaaggctg caatggagaa <210> 130 <211> 578 <212> PRT <213> Arabidopsis thaliana <400> 130

Met Gln Gln Leu Ser Thr Ser Leu Gly Leu Asn Thr Tyr Asn Glu Glu 1 5 10 15 Arg Asn Ser Thr 20 Ser Thr Lys Asn Thr 25 Ser Ser Glu Asp Tyr 30 Ser Pro Arg Gln Ser 35 Lys His Thr Gln Ser 40 His Gly Leu Lys Asp 45 Ile Ser Gly Asn Phe 50 His Ser His Gly Val 55 Asn Gly Gly Val Ser 60 Asn Met Ser Phe Tyr Asn Thr Pro Ser Pro Val Ala Ala Gln Leu Ser Gly Ile Ala Pro 65 70 75 80 Pro Pro Leu Phe Arg 85 Asn Phe Gln Pro Ala 90 Val Ala Asn Pro Asn 95 Ser Leu Ile Thr Asp 100 Ser Ser Pro Lys Ser 105 Thr Val Asn Ser Thr 110 Leu Gln Ala Pro Arg 115 Arg Lys Phe Val Asp 120 Glu Gly Lys Leu Arg 125 Lys Ile Ser Gly Arg 130 Leu Phe Ser Asp Ser 135 Gly Pro Arg Arg Ser 140 Ser Arg Leu Ser Ala Asp Ser Gly Ala Asn Ile Asn Ser Ser Val Ala Thr Val Ser Gly 145 150 155 160 Asn Val Asn Asn Ala 165 Ser Lys Tyr Leu Gly 170 Gly Ser Lys Leu Ser 175 Ser Leu Ala Leu Arg 180 Ser Val Thr Leu Arg 185 Lys Gly His Ser Trp 190 Ala Asn Glu Asn Met Asp Glu Gly Val Arg Gly Glu Pro Phe Asp Asp Ser ArgMet Gln Gln Read Be Thr Be Read Gly Read Asn Thr Tyr Asn Glu Glu 1 5 10 15 Arg Asn Be Thr 20 Be Thr Lys Asn Thr 25 Be Be Glu Asp Tyr 30 Be Pro Arg Gln Be 35 Lys His Thr Gln Be 40 His Gly Leu Lys Asp 45 Ile Being Gly Asn Phe 50 His Being His Gly Val 55 Asn Gly Gly Val Being 60 Asn Met Being Phe Tyr Asn Thr Pro Being Val Wing Ward Gln Leu Being Gly Ile Wing Pro 65 70 75 80 Pro Pro Leu Phe Arg 85 Asn Phe Gln Pro Wing 90 Val Wing Asn Pro Asn 95 Ser Leu Ile Thr Asp 100 Ser Ser Pro Lys Ser 105 Thr Val Asn Ser Thr 110 Leu Gln Ala Pro Arg 115 Arg Lys Phe Val Asp 120 Glu Gly Lys Leu Arg 125 Lys Ile Be Gly Arg 130 Read Le Phe Be Asp Be 135 Gly Pro Arg Arg Be 140 Be Arg Read Le Be Wing Asp Be Gly Wing Asn Ile Asn Be Be Val Wing Thr Val Be Gly 145 150 155 160 Asn Val Asn Asn Wing 165 Ser Lys Tyr Leu Gly 170 Gly Ser Lys Leu Ser 175 Ser Leu Wing Leu Arg 180 Ser Val Thr Leu Arg 185 Lys Gly His Ser Trp 190 Wing Asn Glu Asn Met Asp Glu Gly Val Arg Gly Glu Pro Phe Asp Asp Ser Ar g

cctcggctta tgaagattat cggaaatttc gccttcgcca tcagccagct taactctact ttctggcaga aggggcaaac gtatttggga acactcctgg aaggcctaat aatgtcgatt tttaaacctc ggaggcactg ttcccaggtc ccgtcttgcc cctctatcat cgatcgctta ccatgagacc tgcacatacc aagttaccaa aatgatatat cctaataaac gaagagaagt ccctcttcca tctagaagtt aatgggcagg agctttagat attgcatgttcctcggctta tgaagattat cggaaatttc gccttcgcca tcagccagct taactctact ttctggcaga aggggcaaac gtatttggga acactcctgg aaggcctaat aatgtcgatt tttaaacctc ggaggcactg ttcccaggtc ccgtcttgcc cctctatcat cgatcgctta ccatgagacc tgcacatacc aagttaccaa aatgatatat cctaataaac gaagagaagt ccctcttcca tctagaagtt aatgggcagg agctttagat attgcatgtt

aacacttaca agtccaaggc cattctcatg gtggctgcac gttgcaaacc cttcaagcac ctattttctg attaattcaa ggttctaaat gcaaatgaaa actgcctcaa ggtggcatag cttaggacac gatacgtata gggaaagcat cgtctggctt ttgaaggaag gctcctcaat gcactgaaga ttatgtggcc aacgcacttc ctacgccaag ccgagttcct gaggaagcac atgtaccaga cttgaggagc atctataagc atgaaaccgc ccagatgagaaacacttaca agtccaaggc cattctcatg gtggctgcac gttgcaaacc cttcaagcac ctattttctg attaattcaa ggttctaaat gcaaatgaaa actgcctcaa ggtggcatag cttaggacac gatacgtata gggaaagcat cgtctggctt ttgaaggaag gctcctcaat gcactgaaga ttatgtggcc aacgcacttc ctacgccaag ccgagttcct gaggaagcac atgtaccaga cttgaggagc atctataagc atgaaaccgc ccagatgaga

acgaggaacg agtctaaaca gagttaatgg agctatccgg caaactccct ctagaagaaa attctggtcc gtgttgcaac tgagttcttt acatggatga cgactggttc caatgagttc tcggagaagg tgaaacttcc actttgaact ctccttattg acatgaagct cttggtgtgc atttcctacg acgaatacac gtgtagatac agaagttaga ctgttataat tagagataat aagctaacat tcaaagagta ggcgaaacat ctgcaactga tcgatgagagacgaggaacg agtctaaaca gagttaatgg agctatccgg caaactccct ctagaagaaa attctggtcc gtgttgcaac tgagttcttt acatggatga cgactggttc caatgagttc tcggagaagg tgaaacttcc actttgaact ctccttattg acatgaagct cttggtgtgc atttcctacg acgaatacac gtgtagatac agaagttaga ctgttataat tagagataat aagctaacat tcaaagagta ggcgaaacat ctgcaactga tcgatgagag

taattcaact 60 cacacaaagc 120 aggtgtttcg 180 tatagctcca 240 tattactgac 300 gtttgtagat 360 acgacggagt 420 agtaagcgga 480 ggcacttcgt 540 aggggtccgt 600 tatggcttcc 660 tcaaacaatc 720 gtgtagactt 780 acataagcat 840 aattgactat 900 cttagaagga 960 gagttacttg 1020 tatgggaaat 1080 agctgttcaa 1140 aactcttgag 1200 aagacactac 1260 gttctcagag 1320 gtcttattta 1380 ggagcaagcc 1440 acttgtctgc 1500 tgcgccttca 1560 gcacgataaa 1620 cgttgctgca 1680 cccgtga 1737 195 200 205taattcaact 60 cacacaaagc 120 aggtgtttcg 180 tatagctcca 240 tattactgac 300 gtttgtagat 360 acgacggagt 420 agtaagcgga 480 ggcacttcgt 540 aggggtccgt 600 tatggcttcc 660 tcaaacaatc 720 gtgtagactt 780 acataagcat 840 aattgactat 900 cttagaagga 960 gagttacttg 1020 tatgggaaat 1080 agctgttcaa 1140 aactcttgag 1200 aagacactac 1260 gttctcagag 1320 gtcttattta 1380 ggagcaagcc 1440 acttgtctgc 1500 tgcgccttca 1560 gcacgataaa 1620 cgttgctgca 1680 cccgtga 1737 195 200 205

Pro Asn Thr Ala Ser Thr Thr Gly Ser Met Ala Ser Asn Asp Gln GluPro Asn Thr Wing Be Thr Thr Gly Be Met Wing Be Asn Asp Gln Glu

210 215 220210 215 220

Asp Glu Thr Met Ser Ile Gly Gly Ile Ala Met Ser Ser Gln Thr Ile 225 230 235 240Asp Glu Thr Met Being Ile Gly Gly Ile Wing Met Being Being Gln Thr Ile 225 230 235 240

Thr Ile Gly Val Ser Glu Ile Leu Asn Leu Leu Arg Thr Leu Gly GluThr Ile Gly Val Ser Glu Ile Leu Asn Leu Leu Arg Thr Leu Gly Glu

245 250 255245 250 255

Gly Cys Arg Leu Ser Tyr Met Tyr Arg Cys Gln Glu Ala Leu Asp ThrGly Cys Arg Read Tyr Met Tyr Arg Cys Gln Glu Wing Read Asp Thr

260 265 270260 265 270

Tyr Met Lys Leu Pro His Lys His Tyr Asn Thr Gly Trp Val Leu SerTyr Met Lys Leu For His Lys His Tyr Asn Thr Gly Trp Val Leu Ser

275 280 285275 280 285

Gln Val Gly Lys Ala Tyr Phe Glu Leu Ile Asp Tyr Leu Glu Ala GluGln Val Gly Lys Wing Tyr Phe Glu Leu Ile Asp Tyr Leu Glu Wing Glu

290 295 300290 295 300

Lys Ala Phe Arg Leu Ala Arg Leu Ala Ser Pro Tyr Cys Leu Glu Gly 305 310 315 320Lys Wing Phe Arg Wing Read Wing Wing Wing Wing Wing Wing Wing Be Pro Tyr Cys Winged Glu Gly 305 310 315 320

Met Asp Ile Tyr Ser Thr Val Leu Tyr His Leu Lys Glu Asp Met LysMet Asp Ile Tyr Be Thr Val Leu Tyr His Leu Lys Glu Asp Met Lys

325 330 335325 330 335

Leu Ser Tyr Leu Ala Gln Glu Leu Ile Ser Thr Asp Arg Leu Ala ProLeu Ser Tyr Leu Wing Gln Glu Leu Ile Be Thr Asp Arg Leu Wing Pro

340 345 350340 345 350

Gln Ser Trp Cys Ala Met Gly Asn Cys Tyr Ser Leu Gln Lys Asp HisGln Being Trp Cys Ala Met Gly Asn Cys Tyr Being Read Gln Lys Asp His

355 360 365355 360 365

Glu Thr Ala Leu Lys Asn Phe Leu Arg Ala Val Gln Leu Asn Pro ArgGlu Thr Wing Leu Lys Asn Phe Leu Arg Wing Val Val Gln Leu Asn Pro Arg

370 375 380370 375 380

Phe Ala Tyr Ala His Thr Leu Cys Gly His Glu Tyr Thr Thr Leu Glu 385 390 395 400Phe Ala Tyr Ala His Thr Read Cys Gly His Glu Tyr Thr Thr Leu Glu 385 390 395 400

Asp Phe Glu Asn Gly Met Lys Ser Tyr Gln Asn Ala Leu Arg Val AspAsp Phe Glu Asn Gly Met Lys Ser Tyr Gln Asn Wing Leu Arg Val Asp

405 410 415405 410 415

Thr Arg His Tyr Asn Ala Trp Tyr Gly Leu Gly Met Ile Tyr Leu ArgThr Arg His Tyr Asn Ala Trp Tyr Gly Leu Gly Met Ile Tyr Leu Arg

420 425 430420 425 430

Gln Glu Lys Leu Glu Phe Ser Glu His His Phe Arg Met Ala Phe LeuGlu Glu Lys Leu Glu Phe Be Glu His His Phe Arg Met Wing Phe Leu

435 440 445435 440 445

Ile Asn Pro Ser Ser Ser Val Ile Met Ser Tyr Leu Gly Thr Ser LeuIle Asn Pro Be Ser Be Val Ile Met Be Tyr Leu Gly Thr Be Leu

450 455 460450 455 460

His Ala Leu Lys Arg Ser Glu Glu Ala Leu Glu Ile Met Glu Gln Ala 465 470 475 480His Wing Read Lys Arg Be Glu Glu Wing Read Leu Glu Ile Met Glu Gln Wing 465 470 475 480

Ile Val Ala Asp Arg Lys Asn Pro Leu Pro Met Tyr Gln Lys Ala AsnIle Val Wing Asp Arg Lys Asn Pro Read Le Pro Met Tyr Gln Lys Wing Asn

485 490 495485 490 495

Ile Leu Val Cys Leu Glu Arg Leu Asp Glu Ala Leu Glu Val Leu GluIle Leu Val Cys Leu Glu Arg Leu Asp Glu Wing Leu Glu Val Leu Glu

500 505 510500 505 510

Glu Leu Lys Glu Tyr Ala Pro Ser Glu Ser Ser Val Tyr Ala Leu MetGlu Leu Lys Glu Tyr Wing Pro To Be Glu To Be Val Tyr Wing Leu Met

515 520 525515 520 525

Gly Arg Ile Tyr Lys Arg Arg Asn Met His Asp Lys Ala Met Leu HisGly Arg Ile Tyr Lys Arg Arg Asn Met His Asp Lys Ala Met Leu His

530 535 540530 535 540

Phe Gly Leu Ala Leu Asp Met Lys Pro Pro Ala Thr Asp Val Ala Ala 545 550 555 560Phe Gly Leu Wing Read Asp Met Lys Pro Pro Wing Thr Asp Val Wing Wing 545 550 555 560

Ile Lys Ala Ala Met Glu Lys Leu His Val Pro Asp Glu Ile Asp Glu 565 570 575Ile Lys Ala Wing Met Glu Lys Read His Val Pro Asp Glu Ile Asp Glu 565 570 575

Ser ProTo be pro

<210> 131 <211> 2235 <212> DNA<210> 131 <211> 2235 <212> DNA

<213> Arabidopsis thaliana <4 00> 131<213> Arabidopsis thaliana <4 00> 131

atggaagcta tgcttgtgga ctgtgtaaac aacagtcttc gtcattttgt ctacaaaaat 60atggaagcta tgcttgtgga ctgtgtaaac aacagtcttc gtcattttgt ctacaaaaat 60

gctattttca tgtgcgagcg tctctgcgct gagtttcctt ctgaggttaa tttgcagcta 120gctattttca tgtgcgagcg tctctgcgct gagtttcctt ctgaggttaa tttgcagcta 120

ttagccacca gctacctgca gaataatcaa gcttacagtg catatcatct gctaaaggga 180ttagccacca gctacctgca gaataatcaa gcttacagtg catatcatct gctaaaggga 180

acacaaatgg ctcagtcccg atacttgttc gcattatcat gcttccagat ggaccttctc 240acacaaatgg ctcagtcccg atacttgttc gcattatcat gcttccagat ggaccttctc 240

aatgaagctg aatctgcact ctgccctgtt aatgaacctg gtgcggagat cccaaatggt 300aatgaagctg aatctgcact ctgccctgtt aatgaacctg gtgcggagat cccaaatggt 300

gcagcaggcc attaccttct tggacttatt tacaagtata ctgatagaag gaagaatgct 360gcagcaggcc attaccttct tggacttatt tacaagtata ctgatagaag gaagaatgct 360

gctcaacaat ttaaacagtc cttgacaata gaccctctac tttgggctgc atatgaggaa 420gctcaacaat ttaaacagtc cttgacaata gccctctac tttgggctgc atatgaggaa 420

ttatgtatat taggtgctgc tgaggaagca actgcagttt ttggtgaaac agctgctctc 480ttatgtatat taggtgctgc tgaggaagca actgcagttt ttggtgaaac agctgctctc 480

tccattcaaa agcagtatat gcaacaactg tcaacttccc tcggcttaaa cacttacaac 540 gaggaacgta attcaacttc tactaaaaac acgagttctg aagattatag tccaaggcag 600tccattcaaa agcagtatat gcaacaactg tcaacttccc tcggcttaaa cacttacaac 540 gaggaacgta attcaacttc tactaaaaac acgagttctg aagattatag tccaaggcag 600

tctaaacaca cacaaagcca tggccttaaa gatatctccg gaaatttcca ttctcatgga 660tctaaacaca cacaaagcca tggccttaaa gatatctccg gaaatttcca ttctcatgga 660

gttaatggag gtgtttcgaa catgtcattc tataatacgc cttcgccagt ggctgcacag 720gttaatggag gtgtttcgaa catgtcattc tataatacgc cttcgccagt ggctgcacag 720

ctatccggta tagctccacc accacttttc cggaattttc agccagctgt tgcaaaccca 780ctatccggta tagctccacc accacttttc cggaattttc agccagctgt tgcaaaccca 780

aactccctta ttactgacag ttctccaaag tccactgtta actctactct tcaagcacct 840aactccctta ttactgacag ttctccaaag tccactgtta actctactct tcaagcacct 840

agaagaaagt ttgtagatga aggaaagtta cgtaagattt ctggcagact attttctgat 900agaagaaagt ttgtagatga aggaaagtta cgtaagattt ctggcagact attttctgat 900

tctggtccac gacggagttc aagactgtct gctgattcag gggcaaacat taattcaagt 960tctggtccac gacggagttc aagactgtct gctgattcag gggcaaacat taattcaagt 960

gttgcaacag taagcggaaa tgtgaacaac gcttccaagt atttgggagg ttctaaattg 1020gttgcaacag taagcggaaa tgtgaacaac gcttccaagt atttgggagg ttctaaattg 1020

agttctttgg cacttcgttc tgtaacactt cggaagggac actcctgggc aaatgaaaac 1080agttctttgg cacttcgttc tgtaacactt cggaagggac actcctgggc aaatgaaaac 1080

atggatgaag gggtccgtgg ggaacctttt gatgattcaa ggcctaatac tgcctcaacg 1140atggatgaag gggtccgtgg ggaacctttt gatgattcaa ggcctaatac tgcctcaacg 1140

actggttcta tggcttccaa tgatcaagaa gacgaaacaa tgtcgattgg tggcatagca 1200actggttcta tggcttccaa tgatcaagaa gacgaaacaa tgtcgattgg tggcatagca 1200

atgagttctc aaacaatcac aattggtgtt tcggaaattt taaacctcct taggacactc 1260atgagttctc aaacaatcac aattggtgtt tcggaaattt taaacctcct taggacactc 1260

ggagaagggt gtagactttc atacatgtac aggtgtcagg aggcactgga tacgtatatg 1320ggagaagggt gtagactttc atacatgtac aggtgtcagg aggcactgga tacgtatatg 1320

aaacttccac ataagcatta taatacagga tgggttcttt cccaggtcgg gaaagcatac 1380aaacttccac ataagcatta taatacagga tgggttcttt cccaggtcgg gaaagcatac 1380

tttgaactaa ttgactattt agaggctgaa aaggcattcc gtcttgcccg tctggcttct 1440tttgaactaa ttgactattt agaggctgaa aaggcattcc gtcttgcccg tctggcttct 1440

ccttattgct tagaaggaat ggatatatac tctacggtcc tctatcattt gaaggaagac 1500ccttattgct tagaaggaat ggatatatac tctacggtcc tctatcattt gaaggaagac 1500

atgaagctga gttacttggc tcaggaacta atatcaaccg atcgcttagc tcctcaatct 1560atgaagctga gttacttggc tcaggaacta atatcaaccg atcgcttagc tcctcaatct 1560

tggtgtgcta tgggaaattg ctatagcttg caaaaggacc atgagaccgc actgaagaat 1620tggtgtgcta tgggaaattg ctatagcttg caaaaggacc atgagaccgc actgaagaat 1620

ttcctacgag ctgttcaact gaatccaaga tttgcatatg cacatacctt atgtggccac 1680ttcctacgag ctgttcaact gaatccaaga tttgcatatg cacatacctt atgtggccac 1680

gaatacacaa ctcttgagga ttttgagaac ggaatgaaaa gttaccaaaa cgcacttcgt 1740gaatacacaa ctcttgagga ttttgagaac ggaatgaaaa gttaccaaaa cgcacttcgt 1740

gtagatacaa gacactacaa cgcatggtac gggcttggaa tgatatatct acgccaagag 1800gtagatacaa gacactacaa cgcatggtac gggcttggaa tgatatatct acgccaagag 1800

aagttagagt tctcagagca tcacttcaga atggctttcc taataaaccc gagttcctct 1860aagttagagt tctcagagca tcacttcaga atggctttcc taataaaccc gagttcctct 1860

gttataatgt cttatttagg gacatctttg catgccttga agagaagtga ggaagcacta 1920gttataatgt cttatttagg gacatctttg catgccttga agagaagtga ggaagcacta 1920

gagataatgg agcaagccat agtagcagat agaaaaaacc ctcttccaat gtaccagaaa 1980gagataatgg agcaagccat agtagcagat agaaaaaacc ctcttccaat gtaccagaaa 1980

gctaacatac ttgtctgctt agaaagatta gatgaagctc tagaagttct tgaggagctc 2040gctaacatac ttgtctgctt agaaagatta gatgaagctc tagaagttct tgaggagctc 2040

aaagagtatg cgccttcaga gagcagcgtt tacgctttaa tgggcaggat ctataagcgg 2100aaagagtatg cgccttcaga gagcagcgtt tacgctttaa tgggcaggat ctataagcgg 2100

cgaaacatgc acgataaagc catgcttcat ttcggtctag ctttagatat gaaaccgcct 2160cgaaacatgc acgataaagc catgcttcat ttcggtctag ctttagatat gaaaccgcct 2160

gcaactgacg ttgctgcaat aaaggctgca atggagaaat tgcatgttcc agatgagatc 2220gcaactgacg ttgctgcaat aaaggctgca atggagaaat tgcatgttcc agatgagatc 2220

gatgagagcc cgtga 2235gatgagagcc cgtga 2235

<210> 132 <211> 744 <212> PRT <213> Arabidopsis thaliana <400> 132 Met Glu Ala Met Leu Val Asp Cys Val Asn Asn Ser Leu Arg His Phe 1 5 10 15 Val Tyr Lys Asn Ala Ile Phe Met Cys Glu Arg Leu Cys Ala Glu Phe 20 25 30 Pro Ser Glu Val Asn Leu Gln Leu Leu Ala Thr Ser Tyr Leu Gln Asn 35 40 45 Asn Gln Ala Tyr Ser Ala Tyr His Leu Leu Lys Gly Thr Gln Met Ala 50 55 60 Gln Ser Arg Tyr Leu Phe Ala Leu Ser Cys Phe Gln Met Asp Leu Leu 65 70 75 80 Asn Glu Ala Glu Ser Ala Leu Cys Pro Val Asn Glu Pro Gly Ala Glu 85 90 95 Ile Pro Asn Gly Ala Ala Gly His Tyr Leu Leu Gly Leu Ile Tyr Lys 100 105 110 Tyr Thr Asp Arg Arg Lys Asn Ala Ala Gln Gln Phe Lys Gln Ser Leu 115 120 125 Thr Ile Asp Pro Leu Leu Trp Ala Ala Tyr Glu Glu Leu Cys Ile Leu 130 135 140 Gly Ala Ala Glu Glu Ala Thr Ala Val Phe Gly Glu Thr Ala Ala Leu 145 150 155 160 Ser Ile Gln Lys Gln Tyr Met Gln Gln Leu Ser Thr Ser Leu Gly Leu 165 170 175 Asn Thr Tyr Asn Glu Glu Arg Asn Ser Thr Ser Thr Lys Asn Thr Ser 180 185 190 Ser Glu Asp Tyr Ser Pro Arg Gln Ser Lys His Thr Gln Ser His Gly 195 200 205 Leu Lys Asp Ile Ser Gly Asn Phe His Ser His Gly Val Asn Gly Gly 210 215 220 Val Ser Asn Met Ser Phe Tyr Asn Thr Pro Ser Pro Val Ala Ala Gln 70 225 230 235 240 Leu Ser Gly Ile Ala Pro Pro Pro Leu Phe Arg Asn Phe Gln Pro Ala 245 250 255 Val Ala Asn Pro Asn Ser Leu Ile Thr Asp Ser Ser Pro Lys Ser Thr 260 265 270 Val Asn Ser Thr Leu Gln Ala Pro Arg Arg Lys Phe Val Asp Glu Gly 275 280 285 Lys Leu Arg Lys Ile Ser Gly Arg Leu Phe Ser Asp Ser Gly Pro Arg 290 295 300 Arg Ser Ser Arg Leu Ser Ala Asp Ser Gly Ala Asn Ile Asn Ser Ser 305 310 315 320 Val Ala Thr Val Ser Gly Asn Val Asn Asn Ala Ser Lys Tyr Leu Gly 325 330 335 Gly Ser Lys Leu Ser Ser Leu Ala Leu Arg Ser Val Thr Leu Arg Lys 340 345 350 Gly His Ser Trp Ala Asn Glu Asn Met Asp Glu Gly Val Arg Gly Glu 355 360 365 Pro Phe Asp Asp Ser Arg Pro Asn Thr Ala Ser Thr Thr Gly Ser Met 370 375 380 Ala Ser Asn Asp Gln Glu Asp Glu Thr Met Ser Ile Gly Gly Ile Ala 385 390 395 400 Met Ser Ser Gln Thr Ile Thr Ile Gly Val Ser Glu Ile Leu Asn Leu 405 410 415 Leu Arg Thr Leu Gly Glu Gly Cys Arg Leu Ser Tyr Met Tyr Arg Cys 420 425 430 Gln Glu Ala Leu Asp Thr Tyr Met Lys Leu Pro His Lys His Tyr Asn 435 440 445 Thr Gly Trp Val Leu Ser Gln Val Gly Lys Ala Tyr Phe Glu Leu Ile 450 455 460 Asp Tyr Leu Glu Ala Glu Lys Ala Phe Arg Leu Ala Arg Leu Ala Ser 465 470 475 480 Pro Tyr Cys Leu Glu Gly Met Asp Ile Tyr Ser Thr Val Leu Tyr His 485 490 495 Leu Lys Glu Asp Met Lys Leu Ser Tyr Leu Ala Gln Glu Leu Ile Ser 500 505 510 Thr Asp Arg Leu Ala Pro Gln Ser Trp Cys Ala Met Gly Asn Cys Tyr 515 520 525 Ser Leu Gln Lys Asp His Glu Thr Ala Leu Lys Asn Phe Leu Arg Ala 530 535 540 Val Gln Leu Asn Pro Arg Phe Ala Tyr Ala His Thr Leu Cys Gly His 545 550 555 560 Glu Tyr Thr Thr Leu Glu Asp Phe Glu Asn Gly Met Lys Ser Tyr Gln 565 570 575 Asn Ala Leu Arg Val Asp Thr Arg His Tyr Asn Ala Trp Tyr Gly Leu 580 585 590 Gly Met Ile Tyr Leu Arg Gln Glu Lys Leu Glu Phe Ser Glu His His 595 600 605 Phe Arg Met Ala Phe Leu Ile Asn Pro Ser Ser Ser Val Ile Met Ser 610 615 620 Tyr Leu Gly Thr Ser Leu His Ala Leu Lys Arg Ser Glu Glu Ala Leu 625 630 635 640 Glu Ile Met Glu Gln Ala Ile Val Ala Asp Arg Lys Asn Pro Leu Pro 645 650 655 Met Tyr Gln Lys Ala Asn Ile Leu Val Cys Leu Glu Arg Leu Asp Glu 660 665 670 Ala Leu Glu Val Leu Glu Glu Leu Lys Glu Tyr Ala Pro Ser Glu Ser 675 680 685 Ser Val Tyr Ala Leu Met Gly Arg Ile Tyr Lys Arg Arg Asn Met His 690 695 700 Asp Lys Ala Met Leu His Phe Gly Leu Ala Leu Asp Met Lys Pro Pro 705 710 715 720 Ala Thr Asp Val Ala Ala Ile Lys Ala Ala Met Glu Lys Leu His Val<210> 132 <211> 744 <212> PRT <213> Arabidopsis thaliana <400> 132 Met Glu Ala Met Leu Val Asp Cys Val Asn Asn Ser Leu Arg His Phe 1 5 10 15 Val Tyr Lys Asn Ala Ile Phe Met Cys Glu Arg Leu Cys Wing Glu Phe 20 25 30 Pro Ser Glu Val Asn Leu Gln Leu Leu Wing Thr Be Tyr Leu Gln Asn 35 40 45 Asn Gln Wing Tyr Ser Wing Tyr His Leu Lys Gly Thr Gln Met Wing 50 55 60 Gln Ser Arg Tyr Leu Phe Wing Leu Be Cys Phe Gln Met Asp Leu Leu 65 70 75 80 Asn Glu Wing Glu Be Wing Leu Cys Pro Val Asn Glu Pro Gly Wing Glu 85 90 95 Ile Pro Asn Gly Wing Gly His Tyr Leu Leu Gly Leu Ile Tyr Lys 100 105 110 Tyr Thr Asp Arg Arg Lys Asn Wing Wing Gln Gln Phe Lys Gln Be Leu 115 120 125 Thr Ile Asp Pro Leu Read Trp Wing Wing Tyr Glu Glu Leu Cys Ile Leu 130 135 140 Gly Wing Wing Glu Glu Wing Thr Wing Val Phe Gly Glu Thr Wing Wing Leu 145 150 155 160 Ser Ile Gln Lys Gln Tyr Met Gln Gln Read Be Thr Be Read Gly Leu 165 170 175 Asn Thr Tyr Asn Glu Glu Arg Asn Be Thr Be Thr Lys Asn Thr Ser 180 185 190 Be Glu Asp Tyr Be Pro Arg Gln Ser Lys His Thr Gln Be His Gly 195 200 205 Leu Lys Asp Ile Be Gly Asn Phe His Be His Gly Val Asn Gly Gly 210 215 220 Val Be Asn Met Be Phe Tyr Asn Thr Pro Be Val Wing Ala Gln 70 225 230 235 240 Leu Ser Gly Ile Ala Pro Pro Leu Phe Arg Asn Phe Gln Pro Ala 245 250 255 Val Asn Pro Wing Asn Be Leu Ile Thr Asp Ser Pro Lys Be Thr 260 265 270 Val Asn Ser Thr Leu Gln Ala Pro Arg Arg Lys Phe Val Asp Glu Gly 275 280 285 Lys Read Arg Lys Ile Be Gly Arg Read Le Phe Be Asp Be Gly Pro Arg 290 295 300 Arg Be Be Arg Leu Be Wing Asp Be Gly Wing Asn Ile Asn Be 305 310 315 320 Val Wing Thr Thr Val Ser Gly Asn Val Asn Asn Wing Ser Lys Tyr Leu Gly 3 25 330 335 Gly Be Lys Read Le Be Be Read Ala Leu Arg Be Val Thr Leu Arg Lys 340 345 350 350 Gly His Be Trp Wing Asn Glu Asn Met Asp Glu Gly Val Arg Gly Glu 355 360 365 Pro Phe Asp Asp Be Arg Pro Asn Thr Wing Be Thr Thr Gly Be Met 370 375 380 Wing Be Asn Asp Gln Glu Asp Glu Thr Met Be Ile Gly Gly Ile Wing 385 390 395 400 Met Be Ser Gln Thr Ile Gly Val Be Glu Ile Leu Asn Leu 405 410 415 Leu Arg Thr Read Gly Glu Gly Cys Arg Read Le Be Tyr Met Tyr Arg Cys 420 425 430 Gln Glu Wing Read Asp Thr Tyr Met Lys Leu Pro His Lys His Tyr Asn 435 440 445 Thr Gly Trp Val Leu Be Gln Val Gly Lys Wing Tyr Phe Glu Leu Ile 450 455 460 Asp Tyr Leu Glu Wing Glu Lys Wing Phe Arg Leu Wing Arg Leu Wing Ser 465 470 475 480 Pro Tyr Cys Leu Glu Gly Met Asp Ile Tyr Ser Thr Val Leu Tyr His 485 490 495 Leu Lys Glu Asp Met Lys Leu Ser Tyr Leu Wing Gln Glu Leu Ile Ser 500 505 5 10 Thr Asp Arg Leu Wing Pro Gln Ser Trp Cys Wing Met Gly Asn Cys Tyr 515 520 525 Ser Read Gln Lys Asp His Glu Thr Wing Leu Lys Asn Phe Leu Arg Wing 530 535 540 Val Gln Leu Asn Pro Arg Phe Wing Tyr Ala His Thr Leu Cys Gly His 545 550 555 560 Glu Tyr Thr Thr Leu Glu Asp Phe Glu Asn Gly Met Lys Ser Tyr Gln 565 570 575 Asn Wing Leu Arg Val Asp Thr Arg His Tyr Asn Wing Trp Tyr Gly Leu 580 585 590 Gly Met Ile Tyr Leu Arg Gln Glu Lys Leu Glu Phe Be Glu His His 595 600 605 Phe Arg Met Ala Phe Leu Ile Asn Pro To Be Ser Val Ile Met Ser 610 615 620 Tyr Leu Gly Thr Be Leu Lys Arg Be Glu Glu Wing Leu 625 630 635 640 Glu Ile Met Glu Gln Wing Ile Val Wing Asp Arg Lys Asn Pro Leu Pro 645 650 655 Met Tyr Gln Lys Wing Asn Ile Leu Val Cys Leu Glu Arg Leu Asp Glu 660 665 670 Wing Leu Glu Val Leu Glu Glu Read Lys Glu Tyr Wing Pro Be Glu Ser 675 680 685 Ser Val Ty r Wing Leu Met Gly Arg Ile Tyr Lys Arg Arg Asn Met His 690 695 700 Asp Lys Wing Met Leu His Phe Gly Leu Wing Leu Asp Met Lys Pro 705 710 715 720 Wing Thr Asp Val Wing Wing Ile Lys Wing Wing Met Glu Lys Wing Read his val

725 730 735 Pro Asp Glu Ile Asp Glu Ser Pro 740725 730 735 Pro Asp Glu Ile Asp Glu Ser Pro 740

<210> 133 <211> 2181 <212> DNA<210> 133 <211> 2181 <212> DNA

<213> Arabidopsis thaliana <400> 133<213> Arabidopsis thaliana <400> 133

atgatggaga atctactggc gaattgtgtc cagaaaaacc aatgctatct tcctttgcga acttcttctc gcccaatttc ttgttagcca ggtgttactt gagtaacagt caagcttata ggttcaaaaa cgcctcagtc tcggtattta tttgcattct cttggagagg ctgaagctgc attgttgccc tgtgaagatt ggtgcagctg ggcattatct tcttggtctt atatatagat tcaatacaac agtttaggat ggcattgtca tttgatccat gaactttgta gtttaggtgc cgctgaagaa gcctcaacag cagcgtctta aaacttgtgt agaacaaaga ataagcttct cagattacag attctgataa ggccttaaaa gatacaggtt ccaggagaga accaacaaga tctgaaaatt atgcagcagc actgacaggc aacttagtac aaacggatgg gacttgaaca caggtaatgg atgctccacc gcctctgctt cttaagaata ggatctttga tgtctgtaca tggagtgcgt gtgcgtcgaa ttgtcagcag aggctcaaga agaatctggg cgccgccgta aaaaagaatc ctatgtcgca gtcatttgga aaagattccc tccgagtcaa actatgcacc ttctctttcc tcgatgattg agcaaagaag cgattcctga taccgttact ctaaatgatc tctgtaagtg acactggaag ctctgttgat gatgaggaaa tccccggatc gtttcagcct tatttctgga atttcagaag cttggagatg gccacaggca tttacatatg tacaagtgtc caaaagctat ctcagaaaca atacaataca cactgggttc tattttgagc tacaagacta cttcaacgct gactcttcct tatccttatg ctttggaagg aatggataca tactccactg gagatgaggt tgggctatct ggctcaggaa ctgatttcag tcctggtgtg cagttgggaa ctgttacagt ttgcgtaagg atgtttcaga gagctatcca actgaatgaa agattcacat cacgagtttg ccgcattgga agaattcgag gatgcagaga ggcatagata cgagacacta taatgcatgg tacggtcttg gagaaattcg agtttgcgca gcatcaattt caactggctc tcagtcatca tgtgttacta tggaattgct ttgcatgagt ttgatgatga tggagaaggc tgtactcact gatgcaaaga aaggctcaca tattaaccag cctaggtgat tatcacaaag ctcaaagaat gtgctcctca agaaagcagt gtccatgcat cagctaaagc aatacgacaa agccgtgtta catttcggca tctccatctg atgctgtcaa gataaaggct tacatggaga ctggtgacgg aggaaaattt g <210> 134 <211> 728 <212> PRTatgatggaga atctactggc gaattgtgtc cagaaaaacc aatgctatct tcctttgcga acttcttctc gcccaatttc ttgttagcca ggtgttactt gagtaacagt caagcttata ggttcaaaaa cgcctcagtc tcggtattta tttgcattct cttggagagg ctgaagctgc attgttgccc tgtgaagatt ggtgcagctg ggcattatct tcttggtctt atatatagat tcaatacaac agtttaggat ggcattgtca tttgatccat gaactttgta gtttaggtgc cgctgaagaa gcctcaacag cagcgtctta aaacttgtgt agaacaaaga ataagcttct cagattacag attctgataa ggccttaaaa gatacaggtt ccaggagaga accaacaaga tctgaaaatt atgcagcagc actgacaggc aacttagtac aaacggatgg gacttgaaca caggtaatgg atgctccacc gcctctgctt cttaagaata ggatctttga tgtctgtaca tggagtgcgt gtgcgtcgaa ttgtcagcag aggctcaaga agaatctggg cgccgccgta aaaaagaatc ctatgtcgca gtcatttgga aaagattccc tccgagtcaa actatgcacc ttctctttcc tcgatgattg agcaaagaag cgattcctga taccgttact ctaaatgatc tctgtaagtg acactggaag ctctgttgat gatgaggaaa tccccggatc gtttcagcct tatttctgga atttcagaag cttggagatg gccacaggca tttacatatg tacaagtgtc caaaagctat ctcagaaaca atacaataca cactgggttc tattttgagc tacaagacta cttcaacgct gactcttcct tatccttatg ctttggaagg aatggataca tactccactg gagatgaggt tgggctatct ggctcaggaa ctgatttcag tcctggtgtg cagttgggaa ctgttacagt ttgcgtaagg atgtttcaga gagctatcca actgaatgaa agattcacat cacgagtttg ccgcattgga agaattcgag gatgcagaga ggcatagata cgagacacta taatgcatgg tacggtcttg gagaaattcg agtttgcgca gcatcaattt caactggctc tcagtcatca tgtgttacta tggaattgct ttgcatgagt ttgatgatga tggagaaggc tgtactcact gatgcaaaga aaggctcaca tattaaccag cctaggtgat tatcacaaag ctcaaagaat gtgctcctca agaaagcagt gtccatgcat cagctaaagc aatacgacaa agccgtgtta catttcggca tctccatctg atgctgtcaa gataaaggct tacatggaga ctggtgacgg aggaaaattt g <210> 134 <211> 728 <212> PRT

<213> Arabidopsis thaliana <400> 134<213> Arabidopsis thaliana <400> 134

Met Met Glu Asn Leu Leu Ala Asn Cys Val Gln 15 10Met Met Glu Asn Leu Read Leu Wing Asn Cys Val Gln 15 10

Phe Met Phe Thr Asn Ala Ile Phe Leu Cys GluPhe Met Phe Thr Asn Wing Ile Phe Leu Cys Glu

20 2520 25

Phe Pro Ser Glu Val Asn Leu Gln Leu Leu AlaPhe Pro Ser Glu Val Asn Leu Gln Leu Leu Wing

35 4035 40

Asn Ser Gln Ala Tyr Ser Ala Tyr Tyr Ile LeuAsn Ser Gln Wing Tyr Be Wing Tyr Tyr Ile Leu

50 5550 55

Pro Gln Ser Arg Tyr Leu Phe Ala Phe Ser Cys 65 70 75Pro Gln Ser Arg Tyr Read Phe Ala Phe Ser Cys 65 70 75

Leu Gly Glu Ala Glu Ala Ala Leu Leu Pro CysLeu Gly Glu Wing Glu Wing Wing Leu Leu Pro Cys

85 9085 90

Glu Val Pro Gly Gly Ala Ala Gly His Tyr Leu 100 105Glu Val Pro Gly Gly Wing Gly Wing His Tyr Leu 100 105

ttaaccattt tatgttcacc 60 catctgaggt gaacctgcaa 120 gtgcatatta tatccttaaa 180 catgctttaa gttggatctt 240 atgctgaaga agttcctggt 300 attctgggag gaagaactgt 360 tgtgttggga agcatatgga 420 ttttcgggaa tgttgcttcc 480 cagaaggagc aaccatagac 540 tatcgcaaac agaacacatt 600 ctggagatat tccaccaaat 660 caccttctcc agtgctttta 720 tgcgtcgtcc agcagtggaa 780 gaaacttttt tagtgaagaa 840 gtgctagaat agcagcaagg 900 attggttaca tctttcacct 960 gaaaatgcag aatccaaagc 1020 cagcaacgac gtcaggccag 1080 agtcaaatcc tagtgaatct 1140 tgctaggcat tctgaaaatt 1200 aggaagcttt gttggcatat 1260 tcatgcaggt tggaaaagca 1320 ttactcttgc tcatcaaaag 1380 ttctttatca cctgaaagaa 1440 ttgatcgcct gtctccagaa 1500 atcatgatac tgctctcaaa 1560 atgcacatac cctttgtggc 1620 gatgctaccg gaaggctctg 1680 gaatgaccta tcttcgtcag 1740 tccaaataaa tccaagatct 1800 caaagagaaa cgatgaggcg 1860 atccgctccc caagtactac 1920 cacagaaagt tttagaagag 1980 cgcttggcaa aatatacaat 2040 ttgctttgga tttaagccct 2100 ggttgatact accagacgag 2160 2181ttaaccattt tatgttcacc 60 catctgaggt gaacctgcaa 120 gtgcatatta tatccttaaa 180 catgctttaa gttggatctt 240 atgctgaaga agttcctggt 300 attctgggag gaagaactgt 360 tgtgttggga agcatatgga 420 ttttcgggaa tgttgcttcc 480 cagaaggagc aaccatagac 540 tatcgcaaac agaacacatt 600 ctggagatat tccaccaaat 660 caccttctcc agtgctttta 720 tgcgtcgtcc agcagtggaa 780 gaaacttttt tagtgaagaa 840 gtgctagaat agcagcaagg 900 attggttaca tctttcacct 960 gaaaatgcag aatccaaagc 1020 cagcaacgac gtcaggccag 1080 agtcaaatcc tagtgaatct 1140 tgctaggcat tctgaaaatt 1200 aggaagcttt gttggcatat 1260 tcatgcaggt tggaaaagca 1320 ttactcttgc tcatcaaaag 1380 ttctttatca cctgaaagaa 1440 ttgatcgcct gtctccagaa 1500 atcatgatac tgctctcaaa 1560 atgcacatac cctttgtggc 1620 gatgctaccg gaaggctctg 1680 gaatgaccta tcttcgtcag 1740 tccaaataaa tccaagatct 1800 caaagagaaa cgatgaggcg 1860 atccgctccc caagtactac 1920 cacagaaagt tttagaagag 1980 cgcttggcaa aatatacaat 2040 ttgctttgga tttaagccct 2100 ggttgatact accagacgag 2160 2181

Lys AsnLys asn

Leu LeuLeu Leu

Arg Cys 45Arg Cys 45

Lys Gly 60Lys Gly 60

Phe Lys Glu Asp Leu GlyPhe Lys Glu Asp Leu Gly

Leu Asn His 15 Leu Ala Gln 30 Tyr Leu Ser Ser Lys Thr Leu Asp Leu 80 Tyr Ala Glu 95 Leu Ile Tyr 110 72 Arg Tyr Ser Gly Arg Lys Asn Cys Ser Ile Gln Gln Phe Arg Met Ala 115 120 125 Leu Ser Phe Asp Pro Leu Cys Trp Glu Ala Tyr Gly Glu Leu Cys Ser 130 135 140 Leu Gly Ala Ala Glu Glu Ala Ser Thr Val Phe Gly Asn Val Ala Ser 145 150 155 160 Gln Arg Leu Gln Lys Thr Cys Val Glu Gln Arg Ile Ser Phe Ser Glu 165 170 175 Gly Ala Thr Ile Asp Gln Ile Thr Asp Ser Asp Lys Ala Leu Lys Asp 180 185 190 Thr Gly Leu Ser Gln Thr Glu His Ile Pro Gly Glu Asn Gln Gln Asp 195 200 205 Leu Lys Ile Met Gln Gln Pro Gly Asp Ile Pro Pro Asn Thr Asp Arg 210 215 220 Gln Leu Ser Thr Asn Gly Trp Asp Leu Asn Thr Pro Ser Pro Val Leu 225 230 235 240 Leu Gln Val Met Asp Ala Leu Pro Pro Leu Leu Leu Lys Asn Met Arg 245 250 255 Arg Pro Ala Val Glu Gly Ser Leu Met Ser Val His Gly Val Arg Val 260 265 270 Arg Arg Arg Asn Phe Phe Ser Glu Glu Leu Ser Ala Glu Ala Gln Glu 275 280 285 Glu Ser Gly Arg Arg Arg Ser Ala Arg Ile Ala Ala Arg Lys Lys Asn 290 295 300 Pro Met Ser Gln Ser Phe Gly Lys Asp Ser His Trp Leu His Leu Ser 305 310 315 320 Pro Ser Glu Ser Asn Tyr Ala Pro Ser Leu Ser Ser Met Ile Gly Lys 325 330 335 Cys Arg Ile Gln Ser Ser Lys Glu Val Ile Pro Asp Thr Val Thr Leu 340 345 350 Asn Asp Pro Ala Thr Thr Ser Gly Gln Ser Val Ser Asp Ile Gly Ser 355 360 365 Ser Val Asp Asp Glu Glu Lys Ser Asn Pro Ser Glu Ser Ser Pro Asp 370 375 380 Arg Phe Ser Leu Ile Ser Gly Ile Ser Glu Val Leu Ser Leu Leu Lys 385 390 395 400 Ile Leu Gly Asp Gly His Arg His Leu His Met Tyr Lys Cys Gln Glu 405 410 415 Ala Leu Leu Ala Tyr Gln Lys Leu Ser Gln Lys Gln Tyr Asn Thr His 420 425 430 Trp Val Leu Met Gln Val Gly Lys Ala Tyr Phe Glu Leu Gln Asp Tyr 435 440 445 Phe Asn Ala Asp Ser Ser Phe Thr Leu Ala His Gln Lys Tyr Pro Tyr 450 455 460 Ala Leu Glu Gly Met Asp Thr Tyr Ser Thr Val Leu Tyr His Leu Lys 465 470 475 480 Glu Glu Met Arg Leu Gly Tyr Leu Ala Gln Glu Leu Ile Ser Val Asp 485 490 495 Arg Leu Ser Pro Glu Ser Trp Cys Ala Val Gly Asn Cys Tyr Ser Leu 500 505 510 Arg Lys Asp His Asp Thr Ala Leu Lys Met Phe Gln Arg Ala Ile Gln 515 520 525 Leu Asn Glu Arg Phe Thr Tyr Ala His Thr Leu Cys Gly His Glu Phe 530 535 540 Ala Ala Leu Glu Glu Phe Glu Asp Ala Glu Arg Cys Tyr Arg Lys Ala 545 550 555 560 Leu Gly Ile Asp Thr Arg His Tyr Asn Ala Trp Tyr Gly Leu Gly Met 565 570 575 Thr Tyr Leu Arg Gln Glu Lys Phe Glu Phe Ala Gln His Gln Phe Gln 580 585 590 Leu Ala Leu Gln Ile Asn Pro Arg Ser Ser Val Ile Met Cys Tyr TyrLeu Asn His 15 Leu Wing Gln 30 Tyr Leu Ser Ser Lys Thr Leu Asp Leu 80 Tyr Ala Glu 95 Leu Ile Tyr 110 72 Arg Tyr Ser Gly Arg Lys Asn Cys Ser Ile Gln Phe Arg Met Ala 115 120 125 Leu Ser Phe Asp Pro Leu Cys Trp Glu Wing Tyr Gly Glu Leu Cys Ser 130 135 140 Leu Gly Wing Glu Glu Wing Ser Thr Val Phe Gly Asn Val Wing Ser 145 150 155 160 Gln Arg Leu Gln Lys Thr Cys Val Glu Gln Arg Ile Be Phe Ser Glu 165 170 175 Gly Ala Thr Ile Asp Gln Ile Thr Asp Ser Asp Lys Ala Leu Lys Asp 180 185 190 Thr Gly Leu Be Gln Thr His Ile Pro Gly Glu Asn Gln Gln Asp 195 200 205 Leu Lys Ile Met Gln Pro Gly Asp Ile Pro Pro Asn Thr Asp Arg 210 215 220 Gln Read Be Thr Asn Gly Trp Asp Read Asn Thr Pro Be Pro Val Leu 225 230 235 240 Read Gln Val Met Asp Wing Read Pro Pro Read Leu Lys Asn Met Arg 245 250 255 Arg Pro Wing Val Glu Gly Be Read Met Met Be Val His Gly Val 265 270 Arg Arg Arg Asn Phe Phe Be Glu Glu Read Le Be Glu Wing Wing Gln Glu 275 280 285 Glu Be Gly Arg Arg Arg Be Wing Arg Ile Wing Arg Lys Lys Asn 290 295 300 Pro Met Be Gln Be Phe Gly Lys Asp Ser His Trp Read His Read Le 305 310 315 320 Pro Be Le Glu Asn Tyr Ala Pro Le Le Be Met Ile Gly Lys 325 330 335 Cys Arg Ile Gln Be Lys Glu Val Ile Pro Asp Thr Val Thr Leu 340 345 350 Asn Asp Pro Wing Thr Thr Be Gly Gln Be Val Asp Ile Gly Be 355 360 365 Be Val Asp Asp Glu Glu Lys Be Asn Pro Be Glu Be Pro Asp 370 375 380 Arg Phe Be Read Ile Be Gly Ile Be Glu Val Leu Be Read Leu Lys 385 390 395 400 Ile Leu Gly Asp Gly His Arg His Leu His Met Tyr Lys Cys Gln Glu 405 410 415 Wing Leu Leu Wing Tyr Gln Lys Leu Being Gln Lys Gln Tyr Asn Thr His 420 425 430 Trp Val Leu Met Gln Val Gly Lys Wing Tyr Phe Glu Read Gln Asp Tyr 435 440 445 Phe Asn Asp Wing Asp Be Being Phe Thr Winged His Gln Lys Tyr Pro Tyr 450 455 460 Winged Leu Glu Gly Met Asp Thr Tyr's Winged Val Leu Tyr His Leu Lys 465 470 475 480 Glu Glu Met Winged Gly Tyr Leu Wing Gln Glu Leu Ile Be Val Asp 485 490 495 Arg Leu Be Pro Glu Be Trp Cys Wing Val Gly Asn Cys Tyr Be Leu 500 505 510 Arg Lys Asp His Wing Thr Leu Lys Met Phe Gln Arg Wing Ile Gln 515 520 525 Leu Asn Glu Arg Phe Thr Tyr Wing His Thr Read Cys Gly His Glu Phe 530 535 540 Wing Wing Leu Read Glu Glu Phe Glow Asp Wing Glu Arg Cys Tyr Arg Lys Wing 545 550 555 560 Leu Gly Ile Asp Thr Arg His Tyr Asn Wing Trp Tyr Gly Leu Gly Met 565 570 575 Thr Tyr Leu Arg Gln Glu Lys Phe Glu Phe Ala Gln His Gln Phe Gln 580 585 590 Leu Wing Leu Gln Ile Asn Pro Arg Be Ser Val Ile Met Cys Tyr Tyr

595 600 605 Gly Ile Ala Leu His Glu Ser Lys Arg Asn Asp Glu Ala Leu Met Met 610 615 620 Met Glu Lys Ala Val Leu Thr Asp Ala Lys Asn Pro Leu Pro Lys Tyr 625 630 635 640 Tyr Lys Ala His Ile 645 Leu Thr Ser Leu Gly 650 Asp Tyr His Lys Ala 655 Gln Lys Val Leu Glu 660 Glu Leu Lys Glu Cys 665 Ala Pro Gln Glu Ser 670 Ser Val His Ala Ser 675 Leu Gly Lys Ile Tyr 680 Asn Gln Leu Lys Gln 685 Tyr Asp Lys Ala Val 690 Leu His Phe Gly Ile 695 Ala Leu Asp Leu Ser 700 Pro Ser Pro Ser Asp Ala Val Lys Ile Lys Ala Tyr Met Glu Arg Leu Ile Leu Pro Asp 705 710 715 720 Glu Leu Val Thr Glu Glu Asn Leu595 600 605 Gly Ile Wing Read His Glu Ser Lys Arg Asn Asp Glu Wing Read Le Met Met 610 615 620 Met Glu Lys Wing Val Leu Thr Asp Wing Lys Asn Pro Read Pro Lys Tyr 625 630 635 640 Tyr Lys Wing His Ile 645 Leu Thr Ser Leu Gly 650 Asp Tyr His Lys Wing 655 Gln Lys Val Leu Glu 660 Glu Leu Lys Glu Cys 665 Wing Pro Gln Glu Ser 670 Ser Val His Wing Ser 675 Leu Gly Lys Ile Tyr 680 Asn Gln Leu Lys Gln 685 Tyr Asp Lys Wing Val 690 Leu His Phe Gly Ile 695 Wing Leu Asp Leu Ser 700 Pro Ser Pro As As Wing Val Lys Ile Lys Wing Tyr Met Glu Arg Leu Ile Leu Pro Asp 705 710 715 720 Glu Leu Val Thr Glu Glu Asn Leu

725725

<210> 135<210> 135

<211> 1835<211> 1835

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<220><220>

<221> misc_feature <222> (729)..(732) <223> η is a, c, g, ou t <400> 135<221> misc_feature <222> (729) .. (732) <223> η is a, c, g, or t <400> 135

atggaaaccc taatggtgga ccgcgtccac ggcagcctcc gccgtcttcc tctgcgagcg cctctgcgcc cagttccccg tagcaacttg ctaccttcac aacaaccagc catatgctgc agaagctgcc agagtcccgg tacttgtttg ctatgtcatg gggaagctga agaagccttg tgtcctgtca atgaaccaaa caacagggca ctaccttctt ggagtaattt acaggtacac ctgagcaatt tgtacaagct ctgactcttg atcctcttct tgtgcatact aggtgttgct gaagatgcaa atgaatgttt gtcttcagca ggaactcaca tccacatcaa atgtggaaaa atcggtttct atcttccaat gtgtcagcaa gttttggtga agctgcatgc taacaccact gcagaagtat ctggttatcc tgcatatgca gaacggtgca ccatctaatt tatcacagtt caacgcagnn nnataatgta acttcaactt cgtcttctac atcccgagca agagaaatct gaacgagttc tgtcacagga tcagggagct aatggcactc ttgcggacac taggggaagg ttaagtgtca ggaagcattg gaagtatata gaaagctccc gatgggttct ttgccaggtt gggaagacat attttgaact atcatttttt tgagttagcg catcgactat caccatgcac actccactgt tctttatcat ttgaatgagg aaatgcggct ttgtttctat tgatcgacta tctccccaag catggtgtgc tgaggaaaga tcatgagact gccttgaaga attttcaacg gagttgcata cgctcacacg ctatgcggtc acgatataaa aggtagatga aagacactac aatgcctggt atggccttgg aaaagtttga gtttgctgag catcatttca gaagggcatt ctgttcttat gtgctatctt gggatggcct tgcatgcttt tggaaatgat ggagaaggct atatttgctg ataagaagaa aggctttaat ccttctaggc ctacaaaaat accctgatgc taaaggaaat tgcacctcat gaaagtagta tgtatgcact aacttaacat tcttgacaag gctgtatttt gctttggcat ctgctgctga cgttgctata atacaatctg caatggagaa ttatggatga tgatgatgat gatgatgaga tttaa <210> 136 <211> 757 <212> PRTatggaaaccc taatggtgga ccgcgtccac ggcagcctcc gccgtcttcc tctgcgagcg cctctgcgcc cagttccccg tagcaacttg ctaccttcac aacaaccagc catatgctgc agaagctgcc agagtcccgg tacttgtttg ctatgtcatg gggaagctga agaagccttg tgtcctgtca atgaaccaaa caacagggca ctaccttctt ggagtaattt acaggtacac ctgagcaatt tgtacaagct ctgactcttg atcctcttct tgtgcatact aggtgttgct gaagatgcaa atgaatgttt gtcttcagca ggaactcaca tccacatcaa atgtggaaaa atcggtttct atcttccaat gtgtcagcaa gttttggtga agctgcatgc taacaccact gcagaagtat ctggttatcc tgcatatgca gaacggtgca ccatctaatt tatcacagtt caacgcagnn nnataatgta acttcaactt cgtcttctac atcccgagca agagaaatct gaacgagttc tgtcacagga tcagggagct aatggcactc ttgcggacac taggggaagg ttaagtgtca ggaagcattg gaagtatata gaaagctccc gatgggttct ttgccaggtt gggaagacat attttgaact atcatttttt tgagttagcg catcgactat caccatgcac actccactgt tctttatcat ttgaatgagg aaatgcggct ttgtttctat tgatcgacta tctccccaag catggtgtgc tgaggaaaga tcatgagact gccttgaaga attttcaacg gagttgcata cgctcacacg ctatgcggtc acgatataaa aggtagatga aagacactac aatgcctggt atggccttgg aaaagtttga gtttgctgag catcatttca gaagggcatt ctgttcttat gtgctatctt gggatggcct tgcatgcttt tggaaatgat ggagaaggct atatttgctg ataagaagaa aggctttaat ccttctaggc ctacaaaaat accctgatgc taaaggaaat tgcacctcat gaaagtagta tgtatgcact aacttaacat tcttgacaag gctgtatttt gctttggcat ctgctgctga cgttgctata atacaatctg caatggagaa ttatggatga tgatgatgat gatgatgaga tttaa <210> 136 <211> 757 <212> PRT

<213> Oryza sativa <400> 136<213> Oryza sativa <400> 136

Met Glu Thr Leu Met Val Asp Arg Val His Gly 1 5 10Met Glu Thr Read Met Val Val Asp Arg Val His Gly 1 5 10

Met His Arg Asn Ala Val Phe Leu Cys Glu ArgMet His Arg Asn Ala Val Phe Leu Cys Glu Arg

gcctcttcat gcaccgcaac 60 ccgagacaaa tgtccagttg 120 ataccacatc ttgaaaggaa 180 cttccgaatg aacctcttac 240 tattgaggtt ccaagtggtg 300 tggcagagtg gaagctgcag 360 atgggcagca tacgaggaat 420 cagtgaagca acagctctac 480 gtcaaacttt gttaatgaaa 540 tagtcctaag caaattaaac 600 tcatgtaaag tcaactgcat 660 tgacactcca tcgccaactt 720 aagtatagtt gatggaagat 780 ctccaaatta gctattggta 840 gtataggctt tcttgcttgt 900 agaggcacaa tttaatactg 960 cgtcaattat ttagaagccg 1020 gttggaggga atggacattt 1080 aagttacctt gctcaagatc 1140 tgtgggaaat tgctttgcct 1200 tgctgtacag cttgactcaa 1260 actataccga tctgcacttc 1320 agtggtgtac cttcgccagg 1380 ccagataaat ccttgctctt 1440 aaagaggaat gaggaagcct 1500 tccactcccc aagtatcaaa 1560 tctggatgag ttggaacggc 1620 gatgggaaag atttacaagc 1680 tgccctggat ttgaaacctc 1740 agtacacctt ccagatgaac 1800 1835gcctcttcat gcaccgcaac 60 ccgagacaaa tgtccagttg 120 ataccacatc ttgaaaggaa 180 cttccgaatg aacctcttac 240 tattgaggtt ccaagtggtg 300 tggcagagtg gaagctgcag 360 atgggcagca tacgaggaat 420 cagtgaagca acagctctac 480 gtcaaacttt gttaatgaaa 540 tagtcctaag caaattaaac 600 tcatgtaaag tcaactgcat 660 tgacactcca tcgccaactt 720 aagtatagtt gatggaagat 780 ctccaaatta gctattggta 840 gtataggctt tcttgcttgt 900 agaggcacaa tttaatactg 960 cgtcaattat ttagaagccg gttggaggga atggacattt 1020 1080 1140 aagttacctt gctcaagatc tgtgggaaat tgctttgcct tgctgtacag cttgactcaa 1200 1260 1320 actataccga tctgcacttc agtggtgtac cttcgccagg ccagataaat ccttgctctt 1380 1440 1500 aaagaggaat gaggaagcct tccactcccc aagtatcaaa tctggatgag ttggaacggc 1560 1620 1680 gatgggaaag atttacaagc tgccctggat ttgaaacctc 1740 1800 1835 agtacacctt ccagatgaac

Ser Leu Arg Leu Phe 15Ser Leu Arg Leu Phe 15

Leu Cys Ala Gln Phe 20 25 30Read Cys Wing Gln Phe 20 25 30

Pro Ala Glu Val Asn Val Gln Leu Leu Ala Thr Cys Tyr Leu His AsnPro Glu Val Wing Asn Val Gln Leu Read Leu Thr Thr Cys Tyr Leu His Asn

35 40 4535 40 45

Asn Gln Pro Tyr Ala Ala Tyr His Ile Leu Lys Gly Lys Lys Leu ProAsn Gln Pro Tyr Wing Tyr Wing His Ile Leu Lys Gly Lys Lys Leu Pro

50 55 6050 55 60

Glu Ser Arg Tyr Leu Phe Ala Met Ser Cys Phe Arg Met Asn Leu Leu 65 70 75 80Glu Ser Arg Tyr Leu Phe Ala Met Ser Cys Phe Arg Met Asn Leu Leu 65 70 75 80

Arg Glu Ala Glu Glu Ala Leu Cys Pro Val Asn Glu Pro Asn Ile GluGlu Arg Glu Wing Glu Wing Leu Cys Pro Val Asn Glu Pro Asn Ile Glu

85 90 9585 90 95

Val Pro Ser Gly Ala Thr Gly His Tyr Leu Leu Gly Val Ile Tyr ArgVal Pro Be Gly Wing Thr Gly His Tyr Leu Read Gly Val Ile Tyr Arg

100 105 110100 105 110

Tyr Thr Gly Arg Val Glu Ala Ala Ala Glu Gln Phe Val Gln Ala LeuTyr Thr Gly Arg Val Glu Wing Wing Glu Wing Gln Phe Val Gln Wing Leu

115 120 125115 120 125

Thr Leu Asp Pro Leu Leu Trp Ala Ala Tyr Glu Glu Leu Cys Ile LeuThr Leu Asp Pro Leu Leu Trp Wing Tyr Wing Glu Glu Leu Cys Ile Leu

130 135 140130 135 140

Gly Val Ala Glu Asp Ala Asn Glu Cys Phe Ser Glu Ala Thr Ala Leu 145 150 155 160Gly Val Wing Glu Asp Wing Asn Glu Cys Phe Ser Glu Wing Thr Wing Leu 145 150 155 160

Arg Leu Gln Gln Glu Leu Thr Ser Thr Ser Asn Val Glu Lys Ser AsnArg Leu Gln Gln Glu Leu Thr Be Thr Be Asn Val Glu Lys Be Asn

165 170 175165 170 175

Phe Val Asn Glu Asn Arg Phe Leu Ser Ser Asn Val Ser Ala Ser PhePhe Val Asn Glu Asn Arg Phe Read Be Ser Asn Val Ser Ala Be Phe

180 185 190180 185 190

Gly Asp Ser Pro Lys Gln Ile Lys Gln Leu His Ala Asn Thr Thr AlaGly Asp Be Pro Lys Gln Ile Lys Gln Read His Wing Asn Thr Thr Wing

195 200 205195 200 205

Glu Val Ser Gly Tyr Pro His Val Lys Ser Thr Ala Leu His Met GlnGlu Val Ser Gly Tyr Pro His Val Lys Ser Thr Wing Read His Met Gln

210 215 220210 215 220

Asn Gly Ala Pro Ser Asn Leu Ser Gln Phe Asp Thr Pro Ser Pro Thr 225 230 235 240Asn Gly Ala Pro Be Asn Read Be Gln Phe Asp Thr Pro Be Pro Thr 225 230 235 240

Ser Thr Gln Val Ser Gly Ile Ala Pro Pro Pro Leu Phe Arg Asn MetSer Thr Gln Val Ser Gly Ile Pro Wing Pro Pro Read Phe Arg Asn Met

245 250 255245 250 255

His Ala Tyr Gln Asn Thr Ala Gly Gly Asn Ala Pro Ser Lys Pro LysHis Wing Tyr Gln Asn Thr Wing Gly Gly Asn Wing Pro Be Lys Pro Lys

260 265 270260 265 270

Val Asn Ala Pro Asn Leu Thr Leu Arg Arg Lys Tyr Ile Asp Glu AlaVal Asn Ala Pro Asn Leu Thr Read Le Arg Arg Lys Tyr Ile Asp Glu Wing

275 280 285275 280 285

Gly Leu Lys Lys Val Ser Gly Arg Leu Phe Asn Gln Ser Ser Asp SerGly Leu Lys Lys Val Ser Gly Arg Leu Phe Asn Gln Ser Asp Ser

290 295 300290 295 300

Val Pro Arg Arg Ser Ala Arg Leu Ser Arg Asp Thr Thr Ile Asn Ser 305 310 315 320Val Pro Arg Arg Be Wing Arg Read Le Arg Asp Thr Thr Ile Asn Ser 305 310 315 320

Asn Ser Asn Ile Ser Gln Phe Gly Gly Asn Gly Thr Asp His Ser SerAsn Be Asn Ile Be Gln Phe Gly Gly Asn Gly Thr Asp His Be Ser

325 330 335325 330 335

Gly Lys Leu Arg Val Asn Ser Ser Thr Pro Ser Lys Leu Cys Ser ThrGly Lys Leu Arg Val Asn Be Ser Thr Thr Be Lys Leu Cys Ser Thr

340 345 350340 345 350

Ala Leu Arg Ser Val Gln Val Arg Lys Gly Lys Pro Gln Ala Thr GluWing Leu Arg Be Val Gln Val Arg Lys Gly Lys Pro Gln Wing Thr Glu

355 360 365355 360 365

Asn Phe Asp Glu Gly Asp Tyr His Phe Asp Met Asp Asp Ser Val ThrAsn Phe Asp Glu Gly Asp Tyr His Phe Asp Met Asp Asp Ser Val Thr

370 375 380370 375 380

Ser Thr Ser Ser Ser Thr Ser Ile Val Asp Gly Arg Tyr Pro Glu Gln 385 390 395 400Be Thr Be Be Be Thr Be Ile Val Asp Gly Arg Tyr Pro Glu 385 390 395 400

Glu Lys Ser Glu Arg Val Leu Ser Gln Asp Ser Lys Leu Ala Ile GlyGlu Lys Be Glu Arg Val Leu Be Gln Asp Be Lys Leu Wing Ile Gly

405 410 415405 410 415

Ile Arg Glu Leu Met Ala Leu Leu Arg Thr Leu Gly Glu Gly Tyr ArgIle Arg Glu Leu Met Wing Leu Read Le Arg Thr Read Le Gly Glu Gly Tyr Arg

420 425 430420 425 430

Leu Ser Cys Leu Phe Lys Cys Gln Glu Ala Leu Glu Val Tyr Arg LysLeu Ser Cys Leu Phe Lys Cys Gln Glu Wing Leu Glu Val Tyr Arg Lys

435 440 445435 440 445

Leu Pro Glu Ala Gln Phe Asn Thr Gly Trp Val Leu Cys Gln Val GlyLeu Pro Glu Wing Gln Phe Asn Thr Gly Trp Val Leu Cys Gln Val Gly

450 455 460450 455 460

Lys Thr Tyr Phe Glu Leu Val Asn Tyr Leu Glu Ala Asp His Phe Phe 465 470 475 480Lys Thr Tyr Phe Glu Read Val Asn Tyr Read Glu Wing Asp His Phe Phe 465 470 475 480

Glu Leu Ala His Arg Leu Ser Pro Cys Thr Leu Glu Gly Met Asp IleGlu Leu Wing His Arg Leu Ser Pro Cys Thr Leu Glu Gly Met Asp Ile

485 490 495485 490 495

Tyr Ser Thr Val Leu Tyr His Leu Asn Glu Glu Met Arg Leu Ser TyrTyr Ser Thr Val Leu Tyr His Leu Asn Glu Glu Met Arg Leu Ser Tyr

500 505 510500 505 510

Leu Ala Gln Asp Leu Val Ser Ile Asp Arg Leu Ser Pro Gln Ala Trp 515 520 525 530Leu Wing Gln Asp Leu Val Val Ile Asp Arg Leu Ser Pro Gln Wing Trp 515 520 525 530

545545

550550

565565

580580

595595

610610

625625

630630

645645

660660

675675

690690

705705

710710

725725

740740

Asp Asp Asp Glu IleAsp Asp Asp Glu Ile

755 <210> 137 <211> 2253 <212> DNA755 <210> 137 <211> 2253 <212> DNA

<213> Solanum tuberosum <4 00> 137<213> Solanum tuberosum <4 00> 137

atggaaaccc tactagctga atctgtgcaa aacagccttg gccattttca tgtgtgaacg actctgtgcc gagttcccca ttagctggct gctacctgca caaccaacag gcttatgctg acaagtatgg ctcaatcccg ctacttgttt gcactatcat actgaagctg agacagcact ttgccctcct aatgagccaa gcagctgggc attaccttct tggtcttatt tacaggtata atccagcatt tcaatcaggc attgttattg gatccattgc ttgtgtatac taggtgctgc agaagaagca gctgcagttt tgcattcaga aacaacacat agaccaaggg aaccaatctc gatgatcaga atgtagcttc tacgaatatt gtctcaggcg aaacatacac acagccataa tcttcgagaa atgtctggaa atccagaatt taggtggggt ttctactaac atgtcattct gcatcacagt tgtcaggagt ggttccacct ccagtttgta actaatgcat ctgtggctgg tgctgataat tctccacgag caggcccctc ggagaaagtt tgttgatgag gggaagttaa ttttctgatt ctggccctcg acgaaattca aggcttgctg aattcaaatg tatctggtgc ttctggaaat ggaacaattc agttcgaagc tgagctcaat gactttacgt tccatgacaa gctaccgaaa actatggtga agggactcgc aatgacattt atgactatgt cacacccttc tggagatgct agacctcttg tctgcttctg gggttaatgt aagcagcaca tctatccctc gcccttttca ggtttcttgg ggaaggctat agactttctt gcactggatg tttataacaa actcccacac aaacattatc cagattggaa gagcatactt cgaaatggtt gattacctag cttgctcgtc tggcctcacc ttatagttta gaaggaatgg tttcatctca aggaggacat gaagttgagc tatctggcgc agattagctc ctcaatcttg gtgtgctatg gggaattgct gaaactgctc ttaaaaattt tcaacgagct gtacaactaaatggaaaccc tactagctga atctgtgcaa aacagccttg gccattttca tgtgtgaacg actctgtgcc gagttcccca ttagctggct gctacctgca caaccaacag gcttatgctg acaagtatgg ctcaatcccg ctacttgttt gcactatcat actgaagctg agacagcact ttgccctcct aatgagccaa gcagctgggc attaccttct tggtcttatt tacaggtata atccagcatt tcaatcaggc attgttattg gatccattgc ttgtgtatac taggtgctgc agaagaagca gctgcagttt tgcattcaga aacaacacat agaccaaggg aaccaatctc gatgatcaga atgtagcttc tacgaatatt gtctcaggcg aaacatacac acagccataa tcttcgagaa atgtctggaa atccagaatt taggtggggt ttctactaac atgtcattct gcatcacagt tgtcaggagt ggttccacct ccagtttgta actaatgcat ctgtggctgg tgctgataat tctccacgag caggcccctc ggagaaagtt tgttgatgag gggaagttaa ttttctgatt ctggccctcg acgaaattca aggcttgctg aattcaaatg tatctggtgc ttctggaaat ggaacaattc agttcgaagc tgagctcaat gactttacgt tccatgacaa gctaccgaaa actatggtga agggactcgc aatgacattt atgactatgt cacacccttc tggagatgct agacctcttg tctgcttctg gggttaatgt aagcagcaca tctatccctc gcccttttca ggtttcttgg ggaaggctat agactttctt gcactggatg tttataacaa actcccacac aaacattatc cagattggaa gagcatactt cgaaatggtt gattacctag cttgctcgtc tggcctcacc ttatagttta gaaggaatgg tttcatctca aggaggacat gaagttggcgc agattagctc gtggctg

Phe Ala Leu Arg Lys Asp His Glu Thr Ala 535 540 Ala Val Gln Leu Asp 555 Ser Arg Val Ala Tyr 560 His Glu Tyr Ser 570 Ala Leu Glu Asp Tyr 575 Glu Arg Ser Ala 585 Leu Gln Val Asp Glu 590 Arg His Leu Gly 600 Val Val Tyr Leu Arg 605 Gln Glu Lys His Phe Arg Arg Ala Phe Gln Ile Asn Pro 615 620 Cys Tyr Leu Gly Met 635 Ala Leu His Ala Leu 640 Leu Glu Met Met 650 Glu Asn Ala Ile Phe 655 Ala Pro Lys Tyr 665 Gln Lys Ala Leu Ile 670 Leu Leu Asp Ala 680 Leu Asp Glu Leu Glu 685 Arg Leu Lys Ser Ser Met Tyr Ala Leu Met Gly Lys Ile 695 700 Leu Asp Lys Ala Val 715 Phe Cys Phe Gly Ile 720 Pro Ala Ala Asp 730 Val Ala Ile Ile Lys 735 Ser Leu Pro Asp 745 Glu Leu Met Asp Asp 750 Asp AspPhe Wing Leu Arg Lys Asp His Glu Thr Wing 535 540 Wing Val Gln Leu Asp 555 Ser Arg Val Wing Tyr 560 His Glu Tyr Ser 570 Wing Leu Glu Asp Tyr 575 Glu Arg Ser Wing 585 Leu Gln Val Asp Glu 590 Arg His Leu Gly 600 Val Val Tyr Leu Arg 605 Gln Glu Lys His Phe Arg Arg Wing Phe Gln Ile Asn Pro 615 620 Cys Tyr Leu Gly Met 635 Wing Leu His Wing Leu 640 Leu Glu Met Met 650 Glu Asn Wing Ile Phe 655 Wing Pro Lys Tyr 665 Gln Lys Wing Leu Ile 670 Leu Leu Asp Wing 680 Leu Asp Glu Leu Glu 685 Arg Leu Lys To Be Met Tyr Wing Leu Met Gly Lys Ile 695 700 Leu Asp Lys Wing Val 715 Phe Cys Phe Gly Ile 720 Pro Wing Ile Ile Lys 735 Ser Leu Pro Asp 745 Glu Leu Met Asp Asp 750 Asp Asp

gccaatttat gtaccacaac 60 ctgagacaaa tatgcagctt 120 catatcatct tctcaagggg 180 gctttcagat ggatcttctc 240 ctgcagaggt tccaaatggt 300 cagatagaag aaatagttcc 360 tatgggctgc atatgaggag 420 ttggggaagc atctttgctt 480 aaaatttaca agcatccact 540 acatcagccc tatgcaatca 600 attataatgg agcagctgct 660 acaacactcc ctcaccaatg 720 gaaattttca gcaaaatgga 780 caactgtcaa ttcaaccatt 840 gaaagatatc tgggaggtta 900 gagaatctac tggaaacaca 960 attcttccaa atattatggt 1020 gtcgaaaggc acaatcttgg 1080 ctaatgattc tcggctaaat 1140 aacaagaaag gccccgaact 1200 tcagtgcttc agagatattg 1260 gtttatatag atgtcaggat 1320 acactggatg ggttctttct 1380 aagcagatca tgcatttggc 1440 acgtgtactc gacagtgttg 1500 aggtgctggt atcaactgat 1560 atagtttaca gaaagaccat 1620 atcctagatt tgcatacggg 1680 cacacgcttt gtggtcatga atatgttgct ttagaagatt ttgaaaatgc tattaagagc 1740 tatcagagtg cacttcgtgt ggatgccagg cattacaatg cctggtatgg gcttggaatg 1800 atctatctcc gacaggagaa gtttgaattt tcagagcatc actttcgaat ggctttgggt 1860 ataaatccac agtcttctgt tatcatgtca tatcttggca ctgcattaca cgctctgaag 1920 aaaaatgaag aggcattgga agtgatggag ctggctattg tagcagacaa gaaaaaccct 1980 cttccaatgt atcagaaggc taacatcctt gtgagcacgg aaagttttga tgccgcttta 2040 gaagtcttag aggaacttaa agagcatgct cctcgtgaga gcagtgtcta tgctttgatg 2100 ggtcggatat acaagaggcg taatatgtac gacaaagcca tgcttcattt tggagtggca 2160 ttagatttaa aaccatctgc aactgatgtt gctaccatta aggctgccat tgaaaagctg 2220 catgtaccag atgagatgga agatgaatta taa 2253gccaatttat gtaccacaac 60 ctgagacaaa tatgcagctt 120 catatcatct tctcaagggg 180 gctttcagat ggatcttctc 240 ctgcagaggt tccaaatggt 300 cagatagaag aaatagttcc 360 tatgggctgc atatgaggag 420 ttggggaagc atctttgctt 480 aaaatttaca agcatccact 540 acatcagccc tatgcaatca 600 attataatgg agcagctgct 660 acaacactcc ctcaccaatg 720 gaaattttca gcaaaatgga 780 caactgtcaa ttcaaccatt 840 gaaagatatc tgggaggtta 900 gagaatctac tggaaacaca 960 attcttccaa atattatggt 1020 gtcgaaaggc acaatcttgg 1080 ctaatgattc tcggctaaat 1140 aacaagaaag gccccgaact 1200 tcagtgcttc agagatattg 1260 gtttatatag atgtcaggat 1320 acactggatg ggttctttct 1380 aagcagatca tgcatttggc 1440 acgtgtactc gacagtgttg 1500 aggtgctggt atcaactgat 1560 atagtttaca gaaagaccat 1620 atcctagatt tgcatacggg 1680 cacacgcttt gtggtcatga atatgttgct ttagaagatt ttgaaaatgc tattaagagc 1740 tatcagagtg cacttcgtgt ggatgccagg cattacaatg cctggtatgg gcttggaatg 1800 atctatctcc gacaggagaa gtttgaattt tcagagcatc actttcgaat ggctttgggt 1860 ataaatccac agtcttctgt tatcatgtca tatcttggca ctgcattaca cgctctgaag 1920 aaaaatgaag aggcattgga agtgatggag ctggctattg tagcagacaa gaaaaaccct 1980 cttccaatgt atcagaaggc taacatcctt gtgagcacgg aaagttttga tgccgcttta 2040 gaagtcttag aggaacttaa agagcatgct cctcgtgaga gcagtgtcta tgctttgatg 2100 ggtcggatat acaagaggcg taatatgtac gacaaagcca tgcttcattt tggagtggca 2160 ttagatttaa aaccatctgc aactgatgtt gctaccatta aggctgccat tgaaaagctg 2220 catgtaccag atgagatgga agatgaatta cup 2253

<210> 138 <211> 750 <212> PRT<210> 138 <211> 750 <212> PRT

<213> Solanum tuberosum <4 00> 138<213> Solanum tuberosum <4 00> 138

Met Glu Thr Leu Leu Ala Glu Ser Val Gln Asn Ser Leu Gly Gln Phe 1 5 10 15Met Glu Thr Read Leu Wing Glu Ser Val Gln Asn Ser Leu Gly Gln Phe 1 5 10 15

Met Tyr His Asn Ala Ile Phe Met Cys Glu Arg Leu Cys Ala Glu PheMet Tyr His Asn Ala Ile Phe Met Cys Glu Arg Leu Cys Ala Glu Phe

20 25 3020 25 30

Pro Thr Glu Thr Asn Met Gln Leu Leu Ala Gly Cys Tyr Leu His AsnPro Thr Glu Thr Asn Met Gln Read Leu Wing Gly Cys Tyr Leu His Asn

35 40 4535 40 45

Gln Gln Ala Tyr Ala Ala Tyr His Leu Leu Lys Gly Thr Ser Met AlaGln Gln Wing Tyr Wing Wing Tyr His Read Leu Lys Gly Thr Be Met Wing

50 55 6050 55 60

Gln Ser Arg Tyr Leu Phe Ala Leu Ser Cys Phe Gln Met Asp Leu Leu 65 70 75 80Gln Be Arg Tyr Leu Phe Wing Read Be Cys Phe Gln Met Asp Leu Read 65 70 75 80

Thr Glu Ala Glu Thr Ala Leu Cys Pro Pro Asn Glu Pro Thr Ala GluThr Glu Wing Glu Thr Wing Leu Cys Pro Asn Glu Pro Thr Glu Wing

85 90 9585 90 95

Val Pro Asn Gly Ala Ala Gly His Tyr Leu Leu Gly Leu Ile Tyr ArgVal Pro Asn Gly Wing Gly Wing His Tyr Leu Leu Gly Leu Ile Tyr Arg

100 105 110100 105 110

Tyr Thr Asp Arg Arg Asn Ser Ser Ile Gln His Phe Asn Gln Ala LeuTyr Thr Asp Arg Arg Asn Be Ser Ile Gln His Phe Asn Gln Wing Leu

115 120 125115 120 125

Leu Leu Asp Pro Leu Leu Trp Ala Ala Tyr Glu Glu Leu Cys Ile LeuLeu Leu Asp Pro Leu Leu Trp Wing Tyr Wing Glu Glu Leu Cys Ile Leu

130 135 140130 135 140

Gly Ala Ala Glu Glu Ala Ala Ala Val Phe Gly Glu Ala Ser Leu Leu 145 150 155 160Gly Wing Glu Wing Glu Wing Wing Val Phe Wing Gly Glu Wing Ser Leu Leu 145 150 155 160

Cys Ile Gln Lys Gln His Ile Asp Gln Gly Asn Gln Ser Gln Asn LeuCys Ile Gln Lys Gln His Ile Asp Gln Gly Asn Gln Being Gln Asn Leu

165 170 175165 170 175

Gln Ala Ser Thr Asp Asp Gln Asn Val Ala Ser Thr Asn Ile Val SerGln Wing Be Thr Asp Asp Gln Asn Val Wing Be Thr Asn Ile Val Ser

180 185 190180 185 190

Gly Asp Ile Ser Pro Met Gln Ser Lys His Thr His Ser His Asn LeuGly Asp Ile Be Pro Met Gln Be Lys His Thr His Be His Asn Leu

195 200 205195 200 205

Arg Glu Met Ser Gly Asn Tyr Asn Gly Ala Ala Ala Ile Gln Asn LeuArg Glu Met Ser Gly Asn Tyr Asn Gly Wing Wing Wing Ile Gln Asn Leu

210 215 220210 215 220

Gly Gly Val Ser Thr Asn Met Ser Phe Tyr Asn Thr Pro Ser Pro Met 225 230 235 240Gly Gly Val Be Thr Asn Met Be Phe Tyr Asn Thr Pro Be Met 225 230 235 240

Ala Ser Gln Leu Ser Gly Val Val Pro Pro Pro Val Cys Arg Asn PheAla Ser Gln Read Ser Gly Val Val Pro Pro Val Val Cys Arg Asn Phe

245 250 255245 250 255

Gln Gln Asn Gly Thr Asn Ala Ser Val Ala Gly Ala Asp Asn Ser ProGln Gln Asn Gly Thr Asn Wing Ser Val Wing Gly Wing Asp Asn Ser Pro

260 265 270260 265 270

Arg Ala Thr Val Asn Ser Thr Ile Gln Ala Pro Arg Arg Lys Phe ValArg Wing Thr Val Asn Be Thr Ile Gln Pro Wing Arg Arg Lys Phe Val

275 280 285275 280 285

Asp Glu Gly Lys Leu Arg Lys Ile Ser Gly Arg Leu Phe Ser Asp SerAsp Glu Gly Lys Read Arg Lys Ile Be Gly Arg Read Phe Ser Asp Ser

290 295 300290 295 300

Gly Pro Arg Arg Asn Ser Arg Leu Ala Gly Glu Ser Thr Gly Asn Thr 305 310 315 320Gly Pro Arg Arg Asn Be Arg Leu Wing Gly Glu Be Thr Gly Asn Thr 305 310 315 320

Asn Ser Asn Val Ser Gly Ala Ser Gly Asn Gly Thr Ile His Ser SerAsn Be Asn Val Be Gly Wing Be Gly Asn Gly Thr Ile His Be Be

325 330 335325 330 335

Lys Tyr Tyr Gly Ser Ser Lys Leu Ser Ser Met Thr Leu Arg Ser MetLys Tyr Tyr Gly Be Be Lys Tyr Be Be Met Thr Read Le Be Arg Be Met

340 345 350340 345 350

Thr Ser Arg Lys Ala Gln Ser Trp Ala Thr Glu Asn Tyr Gly Glu GlyThr Be Arg Lys Wing Gln Be Trp Wing Thr Glu Asn Tyr Gly Glu Gly

355 360 365355 360 365

Thr Arg Asn Asp Ile Ser Asn Asp Ser Arg Leu Asn Met Thr Met Ser 370 375 380 His Pro Ser Gly Asp Ala Arg Pro Leu Glu Gln Glu Arg Pro Arg Thr 385 390 395 400 Ser Ala Ser Gly Val Asn Val Ser Ser Thr Ser Ile Pro Leu Ser Ala 405 410 415 Ser Glu Ile Leu Ala Leu Phe Arg Phe Leu Gly Glu Gly Tyr Arg Leu 420 425 430 Ser Cys Leu Tyr Arg Cys Gln Asp Ala Leu Asp Val Tyr Asn Lys Leu 435 440 445 Pro His Lys His Tyr His Thr Gly Trp Val Leu Ser Gln Ile Gly Arg 450 455 460 Ala Tyr Phe Glu Met Val Asp Tyr Leu Glu Ala Asp His Ala Phe Gly 465 470 475 480 Leu Ala Arg Leu Ala Ser Pro Tyr Ser Leu Glu Gly Met Asp Val Tyr 485 490 495 Ser Thr Val Leu Phe His Leu Lys Glu Asp Met Lys Leu Ser Tyr Leu 500 505 510 Ala Gln Val Leu Val Ser Thr Asp Arg Leu Ala Pro Gln Ser Trp Cys 515 520 525 Ala Met Gly Asn Cys Tyr Ser Leu Gln Lys Asp His Glu Thr Ala Leu 530 535 540 Lys Asn Phe Gln Arg Ala Val Gln Leu Asn Pro Arg Phe Ala Tyr Gly 545 550 555 560 His Thr Leu Cys Gly His Glu Tyr Val Ala Leu Glu Asp Phe Glu Asn 565 570 575 Ala Ile Lys Ser Tyr Gln Ser Ala Leu Arg Val Asp Ala Arg His Tyr 580 585 590 Asn Ala Trp Tyr Gly Leu Gly Met Ile Tyr Leu Arg Gln Glu Lys Phe 595 600 605 Glu Phe Ser Glu His His Phe Arg Met Ala Leu Gly Ile Asn Pro Gln 610 615 620 Ser Ser Val Ile Met Ser Tyr Leu Gly Thr Ala Leu His Ala Leu Lys 625 630 635 640 Lys Asn Glu Glu Ala Leu Glu Val Met Glu Leu Ala Ile Val Ala Asp 645 650 655 Lys Lys Asn Pro Leu Pro Met Tyr Gln Lys Ala Asn Ile Leu Val Ser 660 665 670 Thr Glu Ser Phe Asp Ala Ala Leu Glu Val Leu Glu Glu Leu Lys Glu 675 680 685 His Ala Pro Arg Glu Ser Ser Val Tyr Ala Leu Met Gly Arg Ile Tyr 690 695 700 Lys Arg Arg Asn Met Tyr Asp Lys Ala Met Leu His Phe Gly Val Ala 705 710 715 720 Leu Asp Leu Lys Pro Ser Ala Thr Asp Val Ala Thr Ile Lys Ala Ala 725 730 735 Ile Glu Lys Leu His Val Pro Asp Glu Met Glu Asp Glu Leu 740 745 750 <210> 139 <211> 1998Thr Arg Asn Asp Ile Be Asn Asp Be Arg Read Asn Met Thr Met Be 370 375 380 His Pro Be Gly Asp Wing Arg Pro Read Glu Gln Glu Arg Pro Arg Thr 385 390 395 400 Ser Wing Be Gly Val Asn Val Ser Be Thr Be Ile Pro Leu Sera Wing 405 410 415 Ser Glu Ile Leu Wing Leu Phe Arg Phe Leu Gly Glu Gly Tyr Arg Leu 420 425 430 Ser Cys Leu Tyr Arg Cys Gln Asp Wing Leu Asp Val Tyr Asn Lys Leu 435 440 445 Pro His Lys His Tyr His Thr Gly Trp Val Leu Ser Gln Ile Gly Arg 450 455 460 Wing Tyr Phe Glu Met Val Asp Tyr 485 490 495 Ser Thr Val Leu Phe His Leu Lys Glu Asp Met Lys Leu Ser Tyr Leu 500 505 510 Wing Gln Val Leu Val Ser Thr Asp Arg Leu Pro Gln Ser Trp Cys 515 520 525 Wing Met Gly Asn Cys Tyr Be Leu Gln Lys Asp His Glu Thr Wing Leu 530 535 540 Lys Asn Phe Gln Arg Wing Val Gln Leu Asn Pro Arg Phe Wing Tyr Gly 545 550 555 560 His Thr Leu Cys Gly His Glu Tyr Val Wing Leu Glu Asp Phe Glu Asn 565 570 575 Wing Ile Lys Ser Tyr Gln Be Wing Leu Arg Val Asp Wing Ala Arg His Tyr 580 585 590 Asn Wing Trp Tyr Gly Leu Gly Met Ile Tyr Leu Arg Gln Glu Lys Phe 595 600 605 Glu Phe Ser Glu His His Phe Arg Met Wing Leu Gly Ile Asn Pro Gln 610 615 620 Ser Ser Val Ile Met Ser Tyr Leu Gly Thr Wing Read His His Wing Read Lys 625 630 635 640 Lys Asn Glu Glu Wing Read Leu Glu Val Met Glu Leu Wing Ile Val Wing Asp 645 650 655 Lys Lys Asn Pro Leu Pro Met Tyr Gln Lys Wing Asn Ile Leu Val Ser 660 665 670 Thr Ser Phe Asp Wing Ala Leu Glu Val Leu Glu Glu Leu Lys Glu 675 680 685 His Wing Pro Arg Glu Being Ser Val Tyr Wing Leu Met Gly Arg Ile Tyr 690 695 700 Lys Arg Arg Asn Met Tyr Asp Lys Wing Met His Le Phe Gly Val Wing 705 710 715 720 Leu Asp Leu Lys Pro Be Wing Thr Asp Val Wing Thr Ile Lys Wing Wing 725 730 735 Ile Glu Lys Read His Val Pro Asp Glu Met

<212> DNA<212> DNA

<213> Schizosaccharomyces pombe<213> Schizosaccharomyces pombe

<400> 139<400> 139

atgacagatc gattgaaatg tttaatatgg tattgcattg ataatcagaa ttatgataat 60atgacagatc gattgaaatg tttaatatgg tattgcattg ataatcagaa ttatgataat 60

tcaatttttt attcagaacg tttacatgca attgaagatt caaacgagag tttgtatctt 120tcaatttttt attcagaacg tttacatgca attgaagatt caaacgagag tttgtatctt 120

ttggcatatt cgcatttcct aaacctcgat tacaatattg tatacgactt attagataga 180ttggcatatt cgcatttcct aaacctcgat tacaatattg tatacgactt attagataga 180

gtaattagtc atgttccttg cacatactta tttgcaagga ccagccttat tttaggcaga 240gtaattagtc atgttccttg cacatactta tttgcaagga ccagccttat tttaggcaga 240

tataaacaag gaataagtgc tgtggaggcc tgtcgatcga attggcgctc cattcagcca 300tataaacaag gaataagtgc tgtggaggcc tgtcgatcga attggcgctc cattcagcca 300

aacataaatg actcaattag cagtcgtgga catccagatg cctcttgcat gcttgatgtt 360aacataaatg actcaattag cagtcgtgga catccagatg cctcttgcat gcttgatgtt 360

ttgggtacta tgtataaaaa ggcagggttc ctcaaaaaag ctacagattg ttttgtagaa 420ttgggtacta tgtataaaaa ggcagggttc ctcaaaaaag ctacagattg ttttgtagaa 420

gctgtctcca ttaacccata taatttctct gctttccaga atttaactgc aataggcgtg 480gctgtctcca ttaacccata taatttctct gctttccaga atttaactgc aataggcgtg 480

ccactcgatg ctaataatgt atttgttatt ccaccctacc ttacggcaat gaagggtttt 540ccactcgatg ctaataatgt atttgttatt ccaccctacc ttacggcaat gaagggtttt 540

gaaaaatctc aaacgaatgc tacagcttcg gtaccagaac cgtctttttt gaagaaaagt 600gaaaaatctc aaacgaatgc tacagcttcg gtaccagaac cgtctttttt gaagaaaagt 600

aaagagtctt cctcatcttc caacaagttt tcggtttctg aatcgatagc aaatagttat 660aaagagtctt cctcatcttc caacaagttt tcggtttctg aatcgatagc aaatagttat 660

tcaaactcat ccatttcagc atttactaag tggtttgata gggttgacgc ttctgagctt 720 ccaggaagtg agaaggaacg acatcaaagc ttgaaattac aatctcaatc tcagactagc 780tcaaactcat ccatttcagc atttactaag tggtttgata gggttgacgc ttctgagctt 720 ccaggaagtg agaaggaacg acatcaaagc ttgaaattac aatctcaatc tcagactagc 780

aaaaaccttt tggctttcaa tgatgctcaa aaagctgatt ctaacaatag ggatacgtct 840aaaaaccttt tggctttcaa tgatgctcaa aaagctgatt ctaacaatag ggatacgtct 840

ttaaaatccc actttgtgga acctagaacc caagcattaa gaccaggagc tcgtttaaca 900ttaaaatccc actttgtgga acctagaacc caagcattaa gaccaggagc tcgtttaaca 900

tataaattac gcgaagcgag aagttctaaa agaggagaga gcacacctca aagcttccgc 960tataaattac gcgaagcgag aagttctaaa agaggagaga gcacacctca aagcttccgc 960

gaagaggaca ataatttgat ggaattacta aagttattcg gtaagggtgt ttacctgctc 1020gaagaggaca ataatttgat ggaattacta aagttattcg gtaagggtgt ttacctgctc 1020

gcccagtata agttacgaga ggctttaaat tgtttccaaa gcttgcccat cgaacagcaa 1080gcccagtata agttacgaga ggctttaaat tgtttccaaa gcttgcccat cgaacagcaa 1080

aatacacctt ttgttcttgc aaagcttgga ataacctact ttgaactggt tgattacgaa 1140aatacacctt ttgttcttgc aaagcttgga ataacctact ttgaactggt tgattacgaa 1140

aaatctgaag aagtgtttca aaaattaagg gacttgtcgc cttcacgtgt caaagatatg 1200aaatctgaag aagtgtttca aaaattaagg gacttgtcgc cttcacgtgt caaagatatg 1200

gaagtctttt caactgcact ttggcatttg caaaagtctg ttcctttatc ttaccttgcc 1260gaagtctttt caactgcact ttggcatttg caaaagtctg ttcctttatc ttaccttgcc 1260

catgaaactt tggaaactaa tccttattcc ccagaatcat ggtgcattct tgctaattgc 1320catgaaactt tggaaactaa tccttattcc ccagaatcat ggtgcattct tgctaattgc 1320

ttctcacttc aacgtgaaca ctcgcaggca ttaaaatgta ttaatagagc tattcaattg 1380ttctcacttc aacgtgaaca ctcgcaggca ttaaaatgta ttaatagagc tattcaattg 1380

gatccaactt ttgaatatgc ttatacgctt caagggcacg agcattctgc aaacgaagaa 1440gatccaactt ttgaatatgc ttatacgctt caagggcacg agcattctgc aaacgaagaa 1440

tacgaaaaat cgaaaacatc tttccgcaaa gcaattagag taaatgttcg acattacaat 1500tacgaaaaat cgaaaacatc tttccgcaaa gcaattagag taaatgttcg acattacaat 1500

gcatggtatg gcctgggaat ggtttattta aaaacagggc gaaatgatca agcagacttt 1560gcatggtatg gcctgggaat ggtttattta aaaacagggc gaaatgatca agcagacttt 1560

cattttcaac gtgctgcaga gatcaatcct aacaactctg tactcatcac ttgtattggt 1620cattttcaac gtgctgcaga gatcaatcct aacaactctg tactcatcac ttgtattggt 1620

atgatttacg aacgctgcaa agattacaaa aaagcacttg atttttatga tcgggcatgt 1680atgatttacg aacgctgcaa agattacaaa aaagcacttg atttttatga tcgggcatgt 1680

aaactggatg aaaagtcttc gcttgccagg ttcaagaaag ccaaagtgct tattttatta 1740aaactggatg aaaagtcttc gcttgccagg ttcaagaaag ccaaagtgct tattttatta 1740

catgatcacg ataaagcact cgttgaattg gaacaattaa aggcaattgc gccagatgaa 1800catgatcacg ataaagcact cgttgaattg gaacaattaa aggcaattgc gccagatgaa 1800

gcaaatgttc attttttgct cggcaaaatt ttcaagcaaa tgcggaaaaa aaatttagcc 1860gcaaatgttc attttttgct cggcaaaatt ttcaagcaaa tgcggaaaaa aaatttagcc 1860

ttaaagcact tcactatagc atggaactta gacggcaagg ctacgcatat tattaaggaa 1920ttaaagcact tcactatagc atggaactta gacggcaagg ctacgcatat tattaaggaa 1920

tcgattgaaa atctggatat tcccgaagaa aatttgttaa ctgaaacagg tgaaatttat 1980tcgattgaaa atctggatat tcccgaagaa aatttgttaa ctgaaacagg tgaaatttat 1980

aggaatctgg aaacttaa 1998 <210> 140 <211> 665 <212> PRTaggaatctgg aaacttaa 1998 <210> 140 <211> 665 <212> PRT

<213> Schizosaccharomyces pombe <400> 140<213> Schizosaccharomyces pombe <400> 140

Met Thr Asp Arg Leu Lys Cys Leu Ile Trp Tyr Cys Ile Asp Asn Gln 1 5 10 15 Asn Tyr Asp Asn Ser Ile Phe Tyr Ser Glu Arg Leu His Ala Ile Glu 20 25 30 Asp Ser Asn Glu Ser Leu Tyr Leu Leu Ala Tyr Ser His Phe Leu Asn 35 40 45 Leu Asp Tyr Asn Ile Val Tyr Asp Leu Leu Asp Arg Val Ile Ser His 50 55 60 Val Pro Cys Thr Tyr Leu Phe Ala Arg Thr Ser Leu Ile Leu Gly Arg 65 70 75 80 Tyr Lys Gln Gly Ile Ser Ala Val Glu Ala Cys Arg Ser Asn Trp Arg 85 90 95 Ser Ile Gln Pro Asn Ile Asn Asp Ser Ile Ser Ser Arg Gly His Pro 100 105 110 Asp Ala Ser Cys Met Leu Asp Val Leu Gly Thr Met Tyr Lys Lys Ala 115 120 125 Gly Phe Leu Lys Lys Ala Thr Asp Cys Phe Val Glu Ala Val Ser Ile 130 135 140 Asn Pro Tyr Asn Phe Ser Ala Phe Gln Asn Leu Thr Ala Ile Gly Val 145 150 155 160 Pro Leu Asp Ala Asn Asn Val Phe Val Ile Pro Pro Tyr Leu Thr Ala 165 170 175 Met Lys Gly Phe Glu Lys Ser Gln Thr Asn Ala Thr Ala Ser Val Pro 180 185 190 Glu Pro Ser Phe Leu Lys Lys Ser Lys Glu Ser Ser Ser Ser Ser Asn 195 200 205 Lys Phe Ser Val Ser Glu Ser Ile Ala Asn Ser Tyr Ser Asn Ser Ser 210 215 220 Ile Ser Ala Phe Thr Lys Trp Phe Asp Arg Val Asp Ala Ser Glu Leu 225 230 235 240 Pro Gly Ser Glu Lys Glu Arg His Gln Ser Leu Lys Leu Gln Ser Gln 245 250 255 Ser Gln Thr Ser Lys Asn Leu Leu Ala Phe Asn Asp Ala Gln Lys Ala 260 265 270 Asp Ser Asn Asn Arg Asp Thr Ser Leu Lys Ser His Phe Val Glu Pro 275 280 285 Arg Thr Gln Ala Leu Arg Pro Gly Ala Arg Leu Thr Tyr Lys Leu ArgMet Thr Asp Arg Leu Lys Cys Leu Ile Trp Tyr Cys Ile Asp Asn Gln 1 5 10 15 Asn Tyr Asp Asn Ser Ile Phe Tyr Ser Glu Arg Leu His Ala Ile Glu 20 25 30 Asp Ser Asn Glu Ser Leu Tyr Leu Alu Tyr Be His Phe Read Asn 35 40 45 Read Asp Tyr Asn Ile Val Tyr Asp Read Leu Asp Arg Val Ile Be His 50 55 60 Val Pro Cys Thr Tyr Leu Phe Ala Thr Thr Be Read Ile Leu Gly Arg 65 70 75 80 Tyr Lys Gln Gly Ile Be Ala Val Glu Wing Cys Arg Be Asn Trp Arg 85 90 95 Be Ile Gln Pro Asn Ile Asn Asp Be Ile Be Be Arg Gly His Pro 100 105 110 Asp Wing Be Cys Met Leu Asp Val Leu Wing 115 120 125 Gly Phe Leu Lys Lys Wing Thr Asp Cys Phe Val Glu Wing Val Ser Ile 130 135 140 Asn Pro Tyr Asn Phe Be Wing Phe Gln Asn Leu Thr Wing Ile Gly Val 145 150 155 160 Pro Leu Asp Wing Asn Asn Val Phe Val Ile Pro Tyr Leu Thr Wing 165 170 175 Met Lys Gly r Asn Wing Thr Thr Wing Be Val Pro 180 185 190 Glu Pro Be Phe Leu Lys Lys Be Lys Glu Be Ser Be Ser Be Asn 195 200 205 Lys Phe Ser Val Be Glu Ser Ile Be Ala Phe Thr Lys Trp Phe Asp Arg Val Asp Ala Be Glu Leu 225 230 235 240 Pro Gly Be Glu Lys Glu Arg His Gln Gln Wing Lys Wing 260 265 270 Asp Be Asn Asn Arg Asp Thr Be Leu Lys Be His Phe Val Glu Pro 275 280 285 Arg Thr Gln Wing Leu Arg Pro Gly Wing Arg Leu Thr Tyr Lys Leu Arg

290 295 300290 295 300

Glu Ala Arg Ser Ser Lys Arg Gly Glu Ser Thr Pro Gln Ser Phe Arg 305 310 315 320Glu Wing Arg Be Be Lys Arg Gly Glu Be Thr Pro Gln Be Phe Arg 305 310 315 320

Glu Glu Asp Asn Asn Leu Met Glu Leu Leu Lys Leu Phe Gly Lys GlyGlu Glu Asp Asn Asn Leu Met Glu Leu Leu Lys Leu Phe Gly Lys Gly

325 330 335325 330 335

Val Tyr Leu Leu Ala Gln Tyr Lys Leu Arg Glu Ala Leu Asn Cys PheVal Tyr Leu Leu Wing Gln Tyr Lys Leu Arg Glu Wing Leu Asn Cys Phe

340 345 350340 345 350

Gln Ser Leu Pro Ile Glu Gln Gln Asn Thr Pro Phe Val Leu Ala LysGln Be Leu Pro Ile Glu Gln Gln Asn Thr Pro Phe Val Leu Wing Lys

355 360 365355 360 365

Leu Gly Ile Thr Tyr Phe Glu Leu Val Asp Tyr Glu Lys Ser Glu GluRead Gly Ile Thr Tyr Phe Glu Read Val Asp Tyr Glu Lys Be Glu Glu

370 375 380370 375 380

Val Phe Gln Lys Leu Arg Asp Leu Ser Pro Ser Arg Val Lys Asp Met 385 390 395 400Val Phe Gln Lys Read Arg Asp Read Be Pro Be Arg Val Lys Asp Met 385 390 395 400

Glu Val Phe Ser Thr Ala Leu Trp His Leu Gln Lys Ser Val Pro LeuGlu Val Phe Ser Thr Wing Leu Trp His Leu Gln Lys Ser Val Pro Leu

405 410 415405 410 415

Ser Tyr Leu Ala His Glu Thr Leu Glu Thr Asn Pro Tyr Ser Pro GluSer Tyr Leu Wing His Glu Thr Leu Glu Thr Asn Pro Tyr Ser Pro Glu

420 425 430420 425 430

Ser Trp Cys Ile Leu Ala Asn Cys Phe Ser Leu Gln Arg Glu His SerSer Trp Cys Ile Leu Wing Asn Cys Phe Ser Leu Gln Arg Glu His Ser

435 440 445435 440 445

Gln Ala Leu Lys Cys Ile Asn Arg Ala Ile Gln Leu Asp Pro Thr PheGln Wing Read Lys Cys Ile Asn Arg Wing Ile Gln Read Asp Pro Thr Phe

450 455 460450 455 460

Glu Tyr Ala Tyr Thr Leu Gln Gly His Glu His Ser Ala Asn Glu Glu 465 470 475 480Glu Tyr Wing Tyr Thr Read Gln Gly His Glu His Ser Wing Asn Glu Glu 465 470 475 480

Tyr Glu Lys Ser Lys Thr Ser Phe Arg Lys Ala Ile Arg Val Asn ValTyr Glu Lys Be Lys Thr Be Phe Arg Lys Wing Ile Arg Val Asn Val

485 490 495485 490 495

Arg His Tyr Asn Ala Trp Tyr Gly Leu Gly Met Val Tyr Leu Lys ThrArg His Tyr Asn Wing Trp Tyr Gly Leu Gly Met Val Tyr Leu Lys Thr

500 505 510500 505 510

Gly Arg Asn Asp Gln Ala Asp Phe His Phe Gln Arg Ala Ala Glu IleGly Arg Asn Asp Gln Wing Asp Phe His Phe Gln Arg Wing Wing Glu Ile

515 520 525515 520 525

Asn Pro Asn Asn Ser Val Leu Ile Thr Cys Ile Gly Met Ile Tyr GluAsn Pro Asn Asn Be Val Leu Ile Thr Cys Ile Gly Met Ile Tyr Glu

530 535 540530 535 540

Arg Cys Lys Asp Tyr Lys Lys Ala Leu Asp Phe Tyr Asp Arg Ala Cys 545 550 555 560Arg Cys Lys Asp Tyr Lys Lys Wing Read Asp Phe Tyr Asp Arg Cys Wing 545 550 555 560

Lys Leu Asp Glu Lys Ser Ser Leu Ala Arg Phe Lys Lys Ala Lys ValLys Leu Asp Glu Lys Being Ser Leu Wing Arg Phe Lys Lys Wing Lys Val

565 570 575565 570 575

Leu Ile Leu Leu His Asp His Asp Lys Ala Leu Val Glu Leu Glu GlnLeu Ile Leu Leu His Asp His Asp Lys Wing Leu Val Glu Leu Glu Gln

580 585 590580 585 590

Leu Lys Ala Ile Ala Pro Asp Glu Ala Asn Val His Phe Leu Leu GlyLeu Lys Wing Ile Wing Pro Asp Glu Wing Asn Val His Phe Leu Leu Gly

595 600 605595 600 605

Lys Ile Phe Lys Gln Met Arg Lys Lys Asn Leu Ala Leu Lys His PheLys Ile Phe Lys Gln Met Arg Lys Lys Asn Leu Wing Leu Lys His Phe

610 615 620610 615 620

Thr Ile Ala Trp Asn Leu Asp Gly Lys Ala Thr His Ile Ile Lys Glu 625 630 635 640Thr Ile Wing Trp Asn Leu Asp Gly Lys Wing Thr His Ile Ile Lys Glu 625 630 635 640

Ser Ile Glu Asn Leu Asp Ile Pro Glu Glu Asn Leu Leu Thr Glu ThrSer Ile Asu Leu Asu Leu Asp Ile Pro Glu Asn Leu Asu Leu Thr Glu Thr

645 650 655645 650 655

Gly Glu Ile Tyr Arg Asn Leu Glu Thr 660 665Gly Glu Ile Tyr Arg Asn Read Glu Thr 660 665

<210> 141 <211> 2421 <212> DNA<210> 141 <211> 2421 <212> DNA

<213> Aspergillus niger <4 00> 141<213> Aspergillus niger <4 00> 141

atgactccgt ccacatcaca tatttcgagc cagctaaggc agctgatata ttaccatctt 60atgactccgt ccacatcaca tatttcgagc cagctaaggc agctgatata ttaccatctt 60

gacaacaacc ttgctcggaa cgcgctgttc cttgccggtc gtttacacgc ctacgaacct 120 cggacgtcgg aagcttcgta cctattagct ctgtgttacc tacaaaatgg tcaggtgaaa 180 gcagcatggg aaactagcaa gcattttggg tcgaggggtg cgcatcttgg atgttcttac 240 gtctacgcgc aggcttgtct tgacctcggg aaatatacgg acggtattaa cgcgctagag 300 cgaagtaagg gacaatggac ttcgcgaaac cactggaata aacacagtga gacgcgacga 360 caacacttgc cggatgctgc ggcagtttta tgtttgcaag gaaaattatg gcaggcacac 420 aaggaacaca acaaggctgt ggagtgttac gctgcagctt taaagctgaa tcccttcatg 480 tgggatgcat tcttgaatct gtgcgaaact ggtgttgatt tgcgtgtttc aaacatatat 540 aagatgagcc cggaattgta cagcatggta tcgtctgctg cgctcgaaga tgttgaatcc 600 caggttctac ctccggacgg tccactccag acacaagtta acccaaatcc gagcttggac 660gacaacaacc ttgctcggaa cgcgctgttc cttgccggtc gtttacacgc ctacgaacct 120 cggacgtcgg aagcttcgta cctattagct ctgtgttacc tacaaaatgg tcaggtgaaa 180 gcagcatggg aaactagcaa gcattttggg tcgaggggtg cgcatcttgg atgttcttac 240 gtctacgcgc aggcttgtct tgacctcggg aaatatacgg acggtattaa cgcgctagag 300 cgaagtaagg gacaatggac ttcgcgaaac cactggaata aacacagtga gacgcgacga 360 caacacttgc cggatgctgc ggcagtttta tgtttgcaag gaaaattatg gcaggcacac 420 aaggaacaca acaaggctgt ggagtgttac gctgcagctt taaagctgaa tcccttcatg 480 tgggatgcat tcttgaatct gtgcgaaact ggtgttgatt tgcgtgtttc aaacatatat 540 aagatgagcc cggaattgta cagcatggta tcgtctgctg cgctcgaaga tgttgaatcc 600 caggttctac ctccggacgggccacggccgcctcc 6cc

ccgttcactg ccggtacgac tcgcagcgat tcgacctcta ctcacgggag ctcagctttg 720ccgttcactg ccggtacgac tcgcagcgat tcgacctcta ctcacgggag ctcagctttg 720

tgggaaaagt tgaatggaag cacagttagt gtggcatctt caggaacagg accgcatctt 780tgggaaaagt tgaatggaag cacagttagt gtggcatctt caggaacagg accgcatctt 780

ccgcgggaag gcatggagac tcctggtggc caaagtagcg aatctgatga tccacgtgta 840ccgcgggaag gcatggagac tcctggtggc caaagtagcg aatctgatga tccacgtgta 840

accaacggta atggcacaga tgtttttgag ccgccgctag cccctgcaaa gaagaatcga 900accaacggta atggcacaga tgtttttgag ccgccgctag cccctgcaaa gaagaatcga 900

acgatccaaa caataggcgg cgatcatccg atggatcccc cgccaaagat gcggccaacc 960acgatccaaa caataggcgg cgatcatccg atggatcccc cgccaaagat gcggccaacc 960

ggtattcgac cgaggacccg aaccaaattc gagtcagatg aaggtcatac tgagagagac 1020ggtattcgac cgaggacccg aaccaaattc gagtcagatg aaggtcatac tgagagagac 1020

gcgggcatgg gtcacaggtt aggcgatcgg aaacgaacgg tctctggaca agttgcgcat 1080gcgggcatgg gtcacaggtt aggcgatcgg aaacgaacgg tctctggaca agttgcgcat 1080

ccgtcggtac cgcattcaac cgaccaaggt gtcgggcaac ggcgaagtgt acgtctcttt 1140ccgtcggtac cgcattcaac cgaccaaggt gtcgggcaac ggcgaagtgt acgtctcttt 1140

aaccagataa agccatcaac gaacaaaata tctagcacgg cattaggagt gaaagagggc 1200aaccagataa agccatcaac gaacaaaata tctagcacgg cattaggagt gaaagagggc 1200

cgggaggtga aaaaggtgag aactacgggg aataaggcgc gcacaacaac aagctcaaat 1260cgggaggtga aaaaggtgag aactacgggg aataaggcgc gcacaacaac aagctcaaat 1260

gtgggccgtg ttgttagcgg caacaatcga cgacacgctg gggagatcca tgacggagac 1320gtgggccgtg ttgttagcgg caacaatcga cgacacgctg gggagatcca tgacggagac 1320

agcaaagaat accgtggaac atcttcaaca tcaaatggct ctcagaacgc atcgtctaag 1380agcaaagaat accgtggaac atcttcaaca tcaaatggct ctcagaacgc atcgtctaag 1380

ctcgctatat ctgagcggac caaatcggtt gaagccttgg cttggatttt ggacttgttt 1440ctcgctatat ctgagcggac caaatcggtt gaagccttgg cttggatttt ggacttgttt 1440

ttcaagatag cctccggcta tttctgtctc agccggtaca aatgctccga tgctatccag 1500ttcaagatag cctccggcta tttctgtctc agccggtaca aatgctccga tgctatccag 1500

attttcagct ctctatccca gggccaacgg gagacaccgt gggttcttgc tcaaattgga 1560attttcagct ctctatccca gggccaacgg gagacaccgt gggttcttgc tcaaattgga 1560

cgagcttact acgagcaagc aatgtataca gaggccgaga aatactttgt ccgggtgaag 1620cgagcttact acgagcaagc aatgtataca gaggccgaga aatactttgt ccgggtgaag 1620

gccatggcgc cttcccggtt agaagatatg gagatctact cgacggttct ttggcatttg 1680gccatggcgc cttcccggtt agaagatatg gagatctact cgacggttct ttggcatttg 1680

aagaatgatg tcgaacttgc ttacctggcc catgagttaa tggatgtcga tcgcttatca 1740aagaatgatg tcgaacttgc ttacctggcc catgagttaa tggatgtcga tcgcttatca 1740

ccagaagctt ggtgtgctgt cggtaactcg ttctcacacc agcgggacca cgatcaagct 1800ccagaagctt ggtgtgctgt cggtaactcg ttctcacacc agcgggacca cgatcaagct 1800

ctgaagtgct tcaagcgtgc cactcaattg gatcctcatt tcgcgtatgg gttcacgcta 1860ctgaagtgct tcaagcgtgc cactcaattg gatcctcatt tcgcgtatgg gttcacgcta 1860

cagggccatg agtatgttgc caacgaggaa tatgacaagg cattggatgc ctatagaagc 1920cagggccatg agtatgttgc caacgaggaa tatgacaagg cattggatgc ctatagaagc 1920

ggcatcaacg cggacagtcg acattataat gcctggtacg ggctgggaac ggtctacgat 1980ggcatcaacg cggacagtcg acattataat gcctggtacg ggctgggaac ggtctacgat 1980

aagatgggca aacttgactt tgctgaacag cacttccgta atgcggccaa gattaatcct 2040aagatgggca aacttgactt tgctgaacag cacttccgta atgcggccaa gattaatcct 2040

tctaatgctg ttttaatatg ctgcattggc ttggtcttag agaagatgaa caatccgaag 2100tctaatgctg ttttaatatg ctgcattggc ttggtcttag agaagatgaa caatccgaag 2100

tcagcgttga tccagtacaa cagggcctgc accctcgcgc ctcattctgt tcttgctcga 2160tcagcgttga tccagtacaa cagggcctgc accctcgcgc ctcattctgt tcttgctcga 2160

ttccgaaaag cccgtgcgtt gatgaaattg caggatctca agtcagcgct tacggagctg 2220ttccgaaaag cccgtgcgtt gatgaaattg caggatctca agtcagcgct tacggagctg 2220

aaggttctga aggacatggc gccggatgag gcaaacgttc attacctcct gggcaaactg 2280aaggttctga aggacatggc gccggatgag gcaaacgttc attacctcct gggcaaactg 2280

tataagatgc ttcgtgacaa gggaaatgcc attaagcact tcacaactgc attaaacctt 2340tataagatgc ttcgtgacaa gggaaatgcc attaagcact tcacaactgc attaaacctt 2340

gatcccaagg cggcgcagta catcaaagat gcaatggaag cccttgacga cgatgaagag 2400gatcccaagg cggcgcagta catcaaagat gcaatggaag cccttgacga cgatgaagag 2400

gatgaagaag atatggcgtg a 2421 <210> 142 <211> 806 <212> PRTgatgaagaag atatggcgtg at 2421 <210> 142 <211> 806 <212> PRT

<213> Aspergillus niger <4 00> 142<213> Aspergillus niger <4 00> 142

Met Thr Pro Ser Thr Ser His Ile Ser Ser Gln Leu Arg Gln Leu Ile 1 5 10 15 Tyr Tyr His Leu Asp Asn Asn Leu Ala Arg Asn Ala Leu Phe Leu Ala 20 25 30 Gly Arg Leu His Ala Tyr Glu Pro Arg Thr Ser Glu Ala Ser Tyr Leu 35 40 45 Leu Ala Leu Cys Tyr Leu Gln Asn Gly Gln Val Lys Ala Ala Trp Glu 50 55 60 Thr Ser Lys His Phe Gly Ser Arg Gly Ala His Leu Gly Cys Ser Tyr 65 70 75 80 Val Tyr Ala Gln Ala Cys Leu Asp Leu Gly Lys Tyr Thr Asp Gly Ile 85 90 95 Asn Ala Leu Glu Arg Ser Lys Gly Gln Trp Thr Ser Arg Asn His Trp 100 105 110 Asn Lys His Ser Glu Thr Arg Arg Gln His Leu Pro Asp Ala Ala Ala 115 120 125 Val Leu Cys Leu Gln Gly Lys Leu Trp Gln Ala His Lys Glu His Asn 130 135 140 Lys Ala Val Glu Cys Tyr Ala Ala Ala Leu Lys Leu Asn Pro Phe Met 145 150 155 160 Trp Asp Ala Phe Leu Asn Leu Cys Glu Thr Gly Val Asp Leu Arg Val 165 170 175 Ser Asn Ile Tyr Lys Met Ser Pro Glu Leu Tyr Ser Met Val Ser Ser 180 185 190 Ala Ala Leu Glu Asp Val Glu Ser Gln Val Leu Pro Pro Asp Gly Pro 195 200 205 Leu Gln Thr Gln Val Asn Pro Asn Pro Ser Leu Asp Pro Phe Thr Ala 210 215 220Met Thr Pro Be Thr Be His Ile Be Be Gln Leu Arg Gln Leu Ile 1 5 10 15 Tyr Tyr His Leu Asp Asn Asn Leu Arg Wing Asn Leu Phe Leu Wing 20 25 30 Gly Arg Leu His Wing Tyr Glu Pro Arg Thr Glu Wing Ser Tyr Leu 35 40 45 Leu Wing Leu Cys Tyr Leu Gln Asn Gly Gln Val Lys Wing Trp Glu 50 55 60 Thr Be Lys His Phe Gly Be Arg Gly Wing His Leu Gly Cys Ser Tyr 65 70 75 80 Val Tyr Wing Gln Ala Cys Leu Asp Leu Gly Lys Tyr Thr Asp Gly Ile 85 90 95 Asn Ala Leu Glu Arg Be Lys Gly Gln Trp Thr Be Arg Asn His Trp 100 105 110 Asn Lys His Be Glu Thr Arg Arg Wing 115 120 125 Val Leu Cys Leu Gln Gly Lys Leu Trp Gln Wing His Lys Glu His Asn 130 135 140 Lys Wing Val Glu Cys Tyr Wing Wing Leu Lys Leu Asn Pro Phe Met 145 150 155 160 Trp Asp Wing Phe Leu Asn Leu Cys Glu Thr Gly Val Asp Leu Arg Val 165 170 175 Ser Asn Ile Tyr Lys Met Ser G lu Leu Tyr Ser Met Val Ser Ser 180 185 190 Wing Wing Leu Glu Asp Val Glu Ser Gln Val Leu Pro Pro Asp Gly Pro 195 200 205 Leu Gln Thr Gln Val Asn Pro Asn Pro Seru Asp Pro Phe Thr Wing 210 215 220

Gly Thr Thr Arg Ser Asp Ser Thr Ser Thr His Gly Ser Ser Ala Leu 225 230 235 240 Trp Glu Lys Leu Asn Gly Ser Thr Val Ser Val Ala Ser Ser Gly Thr 245 250 255 Gly Pro His Leu Pro Arg Glu Gly Met Glu Thr Pro Gly Gly Gln Ser 260 265 270 Ser Glu Ser Asp Asp Pro Arg Val Thr Asn Gly Asn Gly Thr Asp Val 275 280 285 Phe Glu Pro Pro Leu Ala Pro Ala Lys Lys Asn Arg Thr Ile Gln Thr 290 295 300 Ile Gly Gly Asp His Pro Met Asp Pro Pro Pro Lys Met Arg Pro Thr 305 310 315 320 Gly Ile Arg Pro Arg Thr Arg Thr Lys Phe Glu Ser Asp Glu Gly His 325 330 335 Thr Glu Arg Asp Ala Gly Met Gly His Arg Leu Gly Asp Arg Lys Arg 340 345 350 Thr Val Ser Gly Gln Val Ala His Pro Ser Val Pro His Ser Thr Asp 355 360 365 Gln Gly Val Gly Gln Arg Arg Ser Val Arg Leu Phe Asn Gln Ile Lys 370 375 380 Pro Ser Thr Asn Lys Ile Ser Ser Thr Ala Leu Gly Val Lys Glu Gly 385 390 395 400 Arg Glu Val Lys Lys Val Arg Thr Thr Gly Asn Lys Ala Arg Thr Thr 405 410 415 Thr Ser Ser Asn Val Gly Arg Val Val Ser Gly Asn Asn Arg Arg His 420 425 430 Ala Gly Glu Ile His Asp Gly Asp Ser Lys Glu Tyr Arg Gly Thr Ser 435 440 445 Ser Thr Ser Asn Gly Ser Gln Asn Ala Ser Ser Lys Leu Ala Ile Ser 450 455 460 Glu Arg Thr Lys Ser Val Glu Ala Leu Ala Trp Ile Leu Asp Leu Phe 465 470 475 480 Phe Lys Ile Ala Ser Gly Tyr Phe Cys Leu Ser Arg Tyr Lys Cys Ser 485 490 495 Asp Ala Ile Gln Ile Phe Ser Ser Leu Ser Gln Gly Gln Arg Glu Thr 500 505 510 Pro Trp Val Leu Ala Gln Ile Gly Arg Ala Tyr Tyr Glu Gln Ala Met 515 520 525 Tyr Thr Glu Ala Glu Lys Tyr Phe Val Arg Val Lys Ala Met Ala Pro 530 535 540 Ser Arg Leu Glu Asp Met Glu Ile Tyr Ser Thr Val Leu Trp His Leu 545 550 555 560 Lys Asn Asp Val Glu Leu Ala Tyr Leu Ala His Glu Leu Met Asp Val 565 570 575 Asp Arg Leu Ser Pro Glu Ala Trp Cys Ala Val Gly Asn Ser Phe Ser 580 585 590 His Gln Arg Asp His Asp Gln Ala Leu Lys Cys Phe Lys Arg Ala Thr 595 600 605 Gln Leu Asp Pro His Phe Ala Tyr Gly Phe Thr Leu Gln Gly His Glu 610 615 620 Tyr Val Ala Asn Glu Glu Tyr Asp Lys Ala Leu Asp Ala Tyr Arg Ser 625 630 635 640 Gly Ile Asn Ala Asp Ser Arg His Tyr Asn Ala Trp Tyr Gly Leu Gly 645 650 655 Thr Val Tyr Asp Lys Met Gly Lys Leu Asp Phe Ala Glu Gln His Phe 660 665 670 Arg Asn Ala Ala Lys Ile Asn Pro Ser Asn Ala Val Leu Ile Cys Cys 675 680 685 Ile Gly Leu Val Leu Glu Lys Met Asn Asn Pro Lys Ser Ala Leu Ile 690 695 700 Gln Tyr Asn Arg Ala Cys Thr Leu Ala Pro His Ser Val Leu Ala Arg 705 710 715 720 Phe Arg Lys Ala Arg Ala Leu Met Lys Leu Gln Asp Leu Lys Ser AlaGly Thr Thr Arg Be Asp Be Thr Be His Thr Gly Be Ser Wing Leu 225 230 235 240 Trp Glu Lys Leu Asn Gly Thr Thr Val Be Val Wing Be Gly Thr 245 250 255 Gly Pro His Leu Pro Glu Gly Met Glu Thr Pro Gly Gly Gln Be 260 265 270 Be Glu Be Asp Asp Pro Arg Val Thr Asn Gly Asn Gly Thr Asp Val 275 280 285 Phe Glu Pro Pro Read Wing Ala Pro Lys Lys Asn Arg Thr Ile Gln Thr 290 295 300 His Pro Met Asp Pro Pro Pro Lys Met Arg Pro Thr 305 310 315 320 Gly Ile Arg Pro Arg Thr Arg Lys Phe Glu Being Asp Glu Gly His 325 330 335 Thr Glu Arg Asp Wing Gly Met Gly His Arg Leu Gly Asp Arg Lys Arg 340 345 350 Thr Val Be Gly Gln Val Wing His Pro Be Val Pro His Be Thr Asp 355 360 365 Gln Gly Val Gly Gln Arg Arg Be Val Arg Leu Phe Asn Gln Ile Lys 370 375 380 Pro Be Thr Asn Lys Ile Be Thr Wing Leu Gly Val Lys Glu Gly 385 390 395 400 Arg Glu Val Lys Lys Val Arg Thr Thr Gly Asn Lys Wing Arg Thr Thr 405 410 415 Thr Be Ser Asn Val Gly Arg Val Val Be Gly Asn Arg Arg His 420 425 430 Wing Gly Glu Ile His Asp Gly Asp Be Lys Glu Tyr Arg Gly Thr Ser 435 440 445 Ser Thr Be Asn Gly Ser Gln Asn Wing Ser Be Lys Leu Wing Ile Ser 450 455 460 Glu Arg Thr Lys Ser Val Glu Wing Leu Wing Trp Ile Leu Asp Leu Phe 465 470 475 480 Phe Lys Ile Wing Ser Gly Tyr Phe Cys Leu To Be Arg Tyr Lys Cys To 485 490 495 Asp Ala Ile Gln Ile Phe To Be Leu To Be Gln Gly Gln Arg Glu Thr 500 505 510 Pro Trp Val Leu Ala Gln Ile Gly Arg Wing Tyr Tyr Glu Gln Ala Met 515 520 525 Tyr Thr Glu Wing Glu Lys Tyr Phe Val Arg Val Lys Wing Met Pro Wing 530 535 540 Ser Arg Leu Glu Asp Met Glu Ile Glu Read Met Asp Val 565 570 575 Asp Arg Read Le Pro Glu Wing Trp Cys Ala Val Gly Asn Ser Phe Ser 580 585 590 His Gln Arg Asp His Asp Gln Ala Leu Read Lys Cys Phe Lys Arg Ala Thr 595 600 605 Gln Read Asp Pro His Phe Ala Tyr Gly Phe Thr Tyr Val Wing Asn Glu Glu Tyr Asp Lys Wing Leu Asp Wing Tyr Arg Ser 625 630 635 640 Gly Ile Asn Wing Asp Being Arg His Tyr Asn Wing Trp Tyr Gly Leu Gly 645 650 655 Thr Val Tyr Asp Lys Met Gly Lys Leu Asp Phe Glu Wing Gln His Phe 660 665 670 Arg Asn Wing Wing Lys Ile Wing Asn Pro Ser Asn Wing Val Leu Wing Ile Cys 675 680 685 Ile Gly Leu Val Leu Glu Met Wing Asn Pro Lys Wing Wing Ile 690 695 700 Gln Tyr Asn Arg Wing Cys Thr Leu Pro Wing His Be Val Leu Wing Arg 705 710 715 720 Phe Arg Lys Wing Arg Wing Wing Met Lys Leu Gln Asp Leu Lys Ser Wing

725 730 735725 730 735

Leu Thr Glu Leu Lys Val Leu Lys Asp Met Ala Pro Asp Glu Ala AsnLeu Thr Glu Leu Lys Val Leu Lys Asp Met Wing Pro Asp Glu Wing Asn

740 745 750740 745 750

Val His Tyr Leu Leu Gly Lys Leu Tyr Lys Met Leu Arg Asp Lys GlyVal His Tyr Leu Read Gly Lys Leu Tyr Lys Met Leu Arg Asp Lys Gly

755 760 765755 760 765

Asn Ala Ile Lys His Phe Thr Thr Ala Leu Asn Leu Asp Pro Lys AlaAsn Ala Ile Lys His Phe Thr Thr Wing Read Asn Leu Asp Pro Lys Wing

770 775 780770 775 780

Ala Gln Tyr Ile Lys Asp Ala Met Glu Ala Leu Asp Asp Asp Glu Glu 785 790 795 800Gln Wing Tyr Ile Lys Asp Wing Met Glu Wing Read Le Asp Asp Asp Glu Glu 785 790 795 800

Asp Glu Glu Asp Met Ala 805Asp Glu Glu Asp Met Wing 805

<210> 143<210> 143

<211> 2472<211> 2472

<212> DNA<212> DNA

<213> Homo sapiens<213> Homo sapiens

<4 00> 143<4 00> 143

atgacggtgc tgcaggaacc cgtccaggct gctatatggc aagcactaaa ccactatgct 60atgacggtgc tgcaggaacc cgtccaggct gctatatggc aagcactaaa ccactatgct 60

taccgagatg cggttttcct cgcagaacgc ctttatgcag aagtacactc agaagaagcc 120taccgagatg cggttttcct cgcagaacgc ctttatgcag aagtacactc agaagaagcc 120

ttgtttttac tggcaacctg ttattaccgc tcaggaaagg catataaagc atatagactc 180ttgtttttac tggcaacctg ttattaccgc tcaggaaagg catataaagc atatagactc 180

ttgaaaggac acagttgtac tacaccgcaa tgcaaatacc tgcttgcaaa atgttgtgtt 240ttgaaaggac acagttgtac tacaccgcaa tgcaaatacc tgcttgcaaa atgttgtgtt 240

gatctcagca agcttgcaga aggggaacaa atcttatctg gtggagtgtt taataagcag 300gatctcagca agcttgcaga aggggaacaa atcttatctg gtggagtgtt taataagcag 300

aaaagccatg atgatattgt tactgagttt ggtgattcag cttgctttac tctttcattg 360aaaagccatg atgatattgt tactgagttt ggtgattcag cttgctttac tctttcattg 360

ttgggacatg tatattgcaa gacagatcgg cttgccaaag gatcagaatg ttaccaaaag 420ttgggacatg tatattgcaa gacagatcgg cttgccaaag gatcagaatg ttaccaaaag 420

agccttagtt taaatccttt cctctggtct ccctttgaat cattatgtga aataggtgaa 480agccttagtt taaatccttt cctctggtct ccctttgaat cattatgtga aataggtgaa 480

aagccagatc ctgaccaaac atttaaattc acatctttac agaactttag caactgtctg 540aagccagatc ctgaccaaac atttaaattc acatctttac agaactttag caactgtctg 540

cccaactctt gcacaacaca agtacctaat catagtttat ctcacagaca gcctgagaca 600cccaactctt gcacaacaca agtacctaat catagtttat ctcacagaca gcctgagaca 600

gttcttacgg aaacacccca ggacacaatt gaattaaaca gattgaattt agaatcttcc 660gttcttacgg aaacacccca ggacacaatt gaattaaaca gattgaattt agaatcttcc 660

aattcaaagt actccttgaa tacagattcc tcagtgtctt atattgattc agctgtaatt 720aattcaaagt actccttgaa tacagattcc tcagtgtctt atattgattc agctgtaatt 720

tcacctgata ctgtcccact gggaacagga acttccatat tatctaaaca ggttcaaaat 780tcacctgata ctgtcccact gggaacagga acttccatat tatctaaaca ggttcaaaat 780

aaaccaaaaa ctggtcgaag tttattagga ggaccagcag ctcttagtcc attaacccca 840aaaccaaaaa ctggtcgaag tttattagga ggaccagcag ctcttagtcc attaacccca 840

agttttggga ttttgccatt agaaacccca agtcctggag atggatccta tttacaaaac 900agttttggga ttttgccatt agaaacccca agtcctggag atggatccta tttacaaaac 900

tacactaata cacctcctgt aattgatgtg ccatccaccg gagccccttc aaaaaagtct 960tacactaata cacctcctgt aattgatgtg ccatccaccg gagccccttc aaaaaagtct 960

gttgccagaa tcggccaaac tggaacaaag tctgtcttct cacagagtgg aaatagccga 1020gttgccagaa tcggccaaac tggaacaaag tctgtcttct cacagagtgg aaatagccga 1020

gaggtaactc caattcttgc acaaacacaa agttctggtc cacaaacaag tacaacacct 1080gaggtaactc caattcttgc acaaacacaa agttctggtc cacaaacaag tacaacacct 1080

caggtattga gccccactat tacatctccc ccaaacgcac tacctcgaag aagttcacga 1140caggtattga gccccactat tacatctccc ccaaacgcac tacctcgaag aagttcacga 1140

ctctttacta gtgacagctc cacaaccaag gagaatagca aaaaattaaa aatgaagttt 1200ctctttacta gtgacagctc cacaaccaag gagaatagca aaaaattaaa aatgaagttt 1200

ccacctaaaa tcccaaacag aaaaacaaaa agtaaaacta ataaaggagg aataactcaa 1260ccacctaaaa tcccaaacag aaaaacaaaa agtaaaacta ataaaggagg aataactcaa 1260

cctaacataa atgatagcct ggaaattaca aaattggact cttccatcat ttcagaaggg 1320cctaacataa atgatagcct ggaaattaca aaattggact cttccatcat ttcagaaggg 1320

aaaatatcca caatcacacc tcagattcag gcctttaatc tacaaaaagc agcagcaggt 1380aaaatatcca caatcacacc tcagattcag gcctttaatc tacaaaaagc agcagcaggt 1380

ttgatgagcc ttcttcgtga aatggggaaa ggttatttag ctttgtgttc atacaactgc 1440ttgatgagcc ttcttcgtga aatggggaaa ggttatttag ctttgtgttc atacaactgc 1440

aaagaagcta taaatatttt gagccatcta ccttctcacc actacaatac tggttgggta 1500aaagaagcta taaatatttt gagccatcta ccttctcacc actacaatac tggttgggta 1500

ctgtgccaaa ttggaagggc ctattttgaa ctttcagagt acatgcaagc tgaaagaata 1560ctgtgccaaa ttggaagggc ctattttgaa ctttcagagt acatgcaagc tgaaagaata 1560

ttctcagagg ttagaaggat tgagaattat agagttgaag gcatggagat ctactctaca 1620ttctcagagg ttagaaggat tgagaattat agagttgaag gcatggagat ctactctaca 1620

acactttggc atcttcaaaa agatgttgct ctttcagttc tgtcaaaaga cttaacagac 1680acactttggc atcttcaaaa agatgttgct ctttcagttc tgtcaaaaga cttaacagac 1680

atggataaaa attcgccaga ggcctggtgt gctgcaggga actgtttcag tctgcaacgg 1740atggataaaa attcgccaga ggcctggtgt gctgcaggga actgtttcag tctgcaacgg 1740

gaacatgata ttgcaattaa attcttccag agagctatcc aagttgatcc aaattacgct 1800gaacatgata ttgcaattaa attcttccag agagctatcc aagttgatcc aaattacgct 1800

tatgcctata ctctattagg gcatgagttt gtcttaactg aagaattgga caaagcatta 1860tatgcctata ctctattagg gcatgagttt gtcttaactg aagaattgga caaagcatta 1860

gcttgttttc gaaatgctat cagagtcaat cctagacatt ataatgcatg gtatggttta 1920gcttgttttc gaaatgctat cagagtcaat cctagacatt ataatgcatg gtatggttta 1920

ggaatgattt attacaagca agaaaaattc agccttgcag aaatgcattt ccaaaaagcg 1980ggaatgattt attacaagca agaaaaattc agccttgcag aaatgcattt ccaaaaagcg 1980

cttgatatca accctcaaag ttcagtttta ctttgccaca ttggagtagt tcaacatgca 2040cttgatatca accctcaaag ttcagtttta ctttgccaca ttggagtagt tcaacatgca 2040

ctgaaaaaat cagagaaggc tttggatacc ctaaacaaag ccattgtcat tgatcccaag 2100ctgaaaaaat cagagaaggc tttggatacc ctaaacaaag ccattgtcat tgatcccaag 2100

aaccctctat gcaaatttca cagagcctca gttttatttc gaaatgaaaa atataagtct 2160aaccctctat gcaaatttca cagagcctca gttttatttc gaaatgaaaa atataagtct 2160

gctttacaag aacttgaaga attgaaacaa attgttccca aagaatccct cgtttacttc 2220gctttacaag aacttgaaga attgaaacaa attgttccca aagaatccct cgtttacttc 2220

ttaataggaa aggtttacaa gaagttaggt caaacgcacc tcgccctgat gaatttctct 2280ttaataggaa aggtttacaa gaagttaggt caaacgcacc tcgccctgat gaatttctct 2280

tgggctatgg atttagatcc taaaggagcc aataaccaga ttaaagaggc aattgataag 2340tgggctatgg atttagatcc taaaggagcc aataaccaga ttaaagaggc aattgataag 2340

cgttatcttc cagatgatga ggagccaata acccaagaag aacagatcat gggaacagat 2400cgttatcttc cagatgatga ggagccaata acccaagaag aacagatcat gggaacagat 2400

gaatcccagg agagcagcat gacagatgcg gatgacacac aacttcatgc agctgaaagt 2460gaatcccagg agagcagcat gacagatgcg gatgacacac aacttcatgc agctgaaagt 2460

gatgaatttt aa 2472 <210> 144 <211> 824 <212> PRTgatgaatttt aa 2472 <210> 144 <211> 824 <212> PRT

<213> Homo sapiens <400> 144 Met Thr Val Leu 1<213> Homo sapiens <400> 144 Met Thr Val Leu 1

Asn His Tyr Ala 20Asn His Tyr Wing 20

Ala Glu Val His 35Glu Val His Wing 35

Tyr Arg Ser Gly 50Tyr Arg Ser Gly 50

Ser Cys Thr Thr 65Ser Cys Thr Thr 65

Asp Leu Ser LysAsp Read Ser Lys

Phe Asn Lys Gln 100Phe Asn Lys Gln 100

Ser Ala Cys Phe 115Ser Ala Cys Phe 115

Asp Arg Leu Ala 130Asp Arg Leu Wing 130

Asn Pro Phe Leu 145Asn Pro Phe Leu 145

Lys Pro Asp ProLys Pro Asp Pro

Ser Asn Cys Leu 180Ser Asn Cys Leu 180

Leu Ser His Arg 195Read Ser His Arg 195

Thr Ile Glu Leu 210Thr Ile Glu Leu 210

Ser Leu Asn Thr 225Ser Leu Asn Thr 225

Ser Pro Asp ThrBe Pro Asp Thr

Gln Val Gln Asn 260Gln Val Gln Asn 260

Ala Ala Leu Ser 275Wing Wing Read Ser 275

Thr Pro Ser Pro 290Thr Pro Ser Pro 290

Pro Pro Val Ile 305Pro Pro Val Ile 305

Val Ala Arg IleVal Wing Arg Ile

Gly Asn Ser Arg 340Gly Asn Ser Arg 340

Gly Pro Gln Thr 355Gly Pro Gln Thr 355

Ser Pro Pro Asn 370Ser Pro Pro Asn 370

Asp Ser Ser Thr 385Asp Ser Ser Thr 385

Pro Pro Lys IlePro Pro Lys Ile

Gly Ile Thr Gln 420Gly Ile Thr Gln 420

Asp Ser Ser Ile 435Asp Ser Ser Ile 435

Ile Gln Ala Phe 450Ile Gln Wing Phe 450

Leu Leu Arg Glu 465Leu Leu Arg Glu 465

Cys Lys Glu AlaCys Lys Glu Wing

Gln Glu Pro Val 5Gln Glu Pro Val 5

Tyr Arg Asp AlaTyr Arg Asp Wing

Ser Glu Glu Ala 40Be Glu Glu Wing 40

Lys Ala Tyr Lys 55Lys Wing Tyr Lys 55

Pro Gln Cys Lys 70Pro Gln Cys Lys 70

Leu Ala Glu Gly 85Read Wing Glu Gly 85

Lys Ser His AspLys Ser His Asp

Thr Leu Ser Leu 120Thr Leu Ser Leu 120

Lys Gly Ser Glu 135Lys Gly Ser Glu 135

Trp Ser Pro Phe 150Trp Ser Pro Phe 150

Asp Gln Thr Phe 165Asp Gln Thr Phe 165

Pro Asn Ser CysPro Asn Ser Cys

Gln Pro Glu Thr 200Gln Pro Glu Thr 200

Asn Arg Leu Asn 215Asn Arg Read Asn 215

Asp Ser Ser Val 230Asp Ser Ser Val 230

Val Pro Leu Gly 245Val Pro Leu Gly 245

Lys Pro Lys ThrLys Pro Lys Thr

Pro Leu Thr Pro 280Pro Leu Thr Pro 280

Gly Asp Gly Ser 295Gly Asp Gly Ser 295

Asp Val Pro Ser 310Asp Val Pro Ser 310

Gly Gln Thr Gly 325Gly Gln Thr Gly 325

Glu Val Thr ProGlu Val Thr Pro

Ser Thr Thr Pro 360Ser Thr Thr Pro 360

Ala Leu Pro Arg 375Wing Read Pro Arg 375

Thr Lys Glu Asn 390Thr Lys Glu Asn 390

Pro Asn Arg Lys 405Pro Asn Arg Lys 405

Pro Asn Ile AsnPro Asn Ile Asn

Ile Ser Glu Gly 440Ile Ser Glu Gly 440

Asn Leu Gln Lys 455Asn Leu Gln Lys 455

Met Gly Lys Gly 470Met Gly Lys Gly 470

Ile Asn Ile Leu 485Ile Asn Ile Leu 485

Gln Ala Ala Ile 10Gln Wing Wing Ile 10

Val Phe Leu Ala 25Val Phe Leu Wing 25

Leu Phe Leu LeuLeu Phe Leu Leu

Ala Tyr Arg Leu 60Wing Tyr Arg Leu 60

Tyr Leu Leu Ala 75Tyr Leu Leu Wing 75

Glu Gln Ile Leu 90Glu Gln Ile Leu 90

Asp Ile Val Thr 105Asp Ile Val Thr 105

Leu Gly His ValRead Gly His Val

Cys Tyr Gln Lys 140Cys Tyr Gln Lys 140

Glu Ser Leu Cys 155Glu Ser Leu Cys 155

Lys Phe Thr Ser 170Lys Phe Thr Ser 170

Thr Thr Gln Val 185Thr Thr Gln Val 185

Val Leu Thr GluVal Leu Thr Glu

Leu Glu Ser Ser 220Read Glu Ser Ser 220

Ser Tyr Ile Asp 235Ser Tyr Ile Asp 235

Thr Gly Thr Ser 250Thr Gly Thr Ser 250

Gly Arg Ser Leu 265Gly Arg Ser Leu 265

Ser Phe Gly IleTo be Phe Gly Ile

Tyr Leu Gln Asn 300Tyr Leu Gln Asn 300

Thr Gly Ala Pro 315Thr Gly Wing Pro 315

Thr Lys Ser Val 330Thr Lys Ser Val 330

Ile Leu Ala Gln 345Ile Leu Wing Gln 345

Gln Val Leu SerGln Val Leu Ser

Arg Ser Ser Arg 380Arg Ser Ser Arg 380

Ser Lys Lys Leu 395Ser Lys Lys Leu 395

Thr Lys Ser Lys 410Thr Lys Ser Lys 410

Asp Ser Leu Glu 425Asp Ser Leu Glu 425

Lys Ile Ser ThrLys Ile Ser Thr

Ala Ala Ala Ala 460Wing Wing Wing Wing 460

Tyr Leu Ala Leu 475Tyr Leu Wing Leu 475

Ser His Leu Pro 490Be His Leu Pro 490

Trp Gln Ala Leu 15 Glu Arg Leu Tyr 30 Ala Thr Cys Tyr 45 Leu Lys Gly His Lys Cys Cys Val 80 Ser Gly Gly Val 95 Glu Phe Gly Asp 110 Tyr Cys Lys Thr 125 Ser Leu Ser Leu Glu Ile Gly Glu 160 Leu Gln Asn Phe 175 Pro Asn His Ser 190 Thr Pro Gln Asp 205 Asn Ser Lys Tyr Ser Ala Val Ile 240 Ile Leu Ser Lys 255 Leu Gly Gly Pro 270 Leu Pro Leu Glu 285 Tyr Thr Asn Thr Ser Lys Lys Ser 320 Phe Ser Gln Ser 335 Thr Gln Ser Ser 350 Pro Thr Ile Thr 365 Leu Phe Thr Ser Lys Met Lys Phe 400 Thr Asn Lys Gly 415 Ile Thr Lys Leu 430 Ile Thr Pro Gln 445 Gly Leu Met Ser Cys Ser Tyr Asn 480 Ser His His TyrTrp Gln Wing Leu 15 Glu Arg Leu Tyr 30 Wing Thr Cys Tyr 45 Leu Lys Gly His Lys Cys Val 80 Ser Gly Gly Val 95 Glu Phe Gly Asp 110 Tyr Cys Lys Thr 125 Ser Leu Ser Leu Glu Ile Gly Glu 160 Leu Gln Asn Phe 175 Pro Asn His Ser 190 Thr Pro Gln Asp 205 Asn Ser Lys Tyr Ser Ala Val Ile 240 Ile Read Ser Lys 255 Leu Gly Gly Pro 270 Leu Pro Leu Glu 285 Tyr Thr Asn Thr Ser Lys Lys Ser 320 Phe Ser Gln Ser 335 Thr Gln Ser Ser 350 Pro Thr Ile Thr 365 Leu Phe Thr Ser Lys Met Lys Phe 400 Thr Asn Lys Gly 415 Ile Thr Lys Leu 430 Ile Thr Pro Gln 445 Gly Leu Met Ser Cys Ser Tyr Asn 480 Ser His His Tyr

495 Asn Thr Gly Trp Val Leu Cys Gln Ile Gly Arg Ala Tyr Phe Glu Leu 500 505 510 Ser Glu Tyr Met Gln Ala Glu Arg Ile Phe Ser Glu Val Arg Arg Ile 515 520 525 Glu Asn Tyr Arg Val Glu Gly Met Glu Ile Tyr Ser Thr Thr Leu Trp 530 535 540 His Leu Gln Lys Asp Val Ala Leu Ser Val Leu Ser Lys Asp Leu Thr 545 550 555 560 Asp Met Asp Lys Asn Ser Pro Glu Ala Trp Cys Ala Ala Gly Asn Cys 565 570 575 Phe Ser Leu Gln Arg Glu His Asp Ile Ala Ile Lys Phe Phe Gln Arg 580 585 590 Ala Ile Gln Val Asp Pro Asn Tyr Ala Tyr Ala Tyr Thr Leu Leu Gly 595 600 605 His Glu Phe Val Leu Thr Glu Glu Leu Asp Lys Ala Leu Ala Cys Phe 610 615 620 Arg Asn Ala Ile Arg Val Asn Pro Arg His Tyr Asn Ala Trp Tyr Gly 625 630 635 640 Leu Gly Met Ile Tyr Tyr Lys Gln Glu Lys Phe Ser Leu Ala Glu Met 645 650 655 His Phe Gln Lys Ala Leu Asp Ile Asn Pro Gln Ser Ser Val Leu Leu 660 665 670 Cys His Ile Gly Val Val Gln His Ala Leu Lys Lys Ser Glu Lys Ala 675 680 685 Leu Asp Thr Leu Asn Lys Ala Ile Val Ile Asp Pro Lys Asn Pro Leu 690 695 700 Cys Lys Phe His Arg Ala Ser Val Leu Phe Ala Asn Glu Lys Tyr Lys 705 710 715 720 Ser Ala Leu Gln Glu Leu Glu Glu Leu Lys Gln Ile Val Pro Lys Glu 725 730 735 Ser Leu Val Tyr Phe Leu Ile Gly Lys Val Tyr Lys Lys Leu Gly Gln 740 745 750 Thr His Leu Ala Leu Met Asn Phe Ser Trp Ala Met Asp Leu Asp Pro 755 760 765 Lys Gly Ala Ás η Asn Gln Ile Lys Glu Ala Ile Asp Lys Arg Tyr Leu 770 775 780 Pro Asp Asp Glu Glu Pro Ile Thr Gln Glu Glu Gln Ile Met Gly Thr 785 790 795 800 Asp Glu Ser Gln Glu Ser Ser Met Thr Asp Ala Asp Asp Thr Gln Leu 805 810 815 His Ala Ala Glu Ser Asp Glu Phe 820 <210> 145495 Asn Thr Gly Trp Val Leu Cys Gln Ile Gly Arg Wing Tyr Phe Glu Leu 500 505 510 Ser Glu Tyr Met Gln Wing Glu Arg Ile Phe Ser Glu Val Arg Arg Ile 515 520 525 Glu Asn Tyr Arg Val Glu Gly Met Glu Ile Tyr Ser Thr Thr Leu Trp 530 535 540 His Leu Gln Lys Asp Val Ala Leu Ser Val Leu Ser Lys Asp Leu Thr 545 550 555 560 Asp Met Asp Lys Asn Ser Pro Glu Ala Trp Cys Ala Wing Gly Asn Cys 565 570 575 Phe Ser Leu Gln Arg Glu His Asp Ile Ala Ile Lys Phe Phe Gln Arg 580 585 590 Ala Ile Gln Val Asp Pro Asn Tyr Ala Tyr Tyr Thr Leu Leu Gly 595 600 605 His Glu Phe Val Leu Thr Glu Leu Asp Lys Ala Leu Cys Wing Phe 610 615 620 Arg Asn Ala Ile Arg Val Asn Pro Arg His Tyr Asn Ala Trp Tyr Gly 625 630 635 640 Leu Gly Met Ile Tyr Lyr Glu Lys Phe Ser Leu Ala Glu Met 645 650 655 His Phe Gln Lys Ala Leu Asp Ile Asn Pro Gln Ser Ser Val Leu 660 665 670 Cys His Ile Gly Val Val Gln His Wing Leu Lys Lys Ser Glu Lys Wing 675 680 685 Leu Asp Thr Leu Asn Lys Wing Ile Val Ile Asp Pro Lys Asn Pro Leu 690 695 700 Cys Lys Phe His Arg Wing Ser Val Leu Phe Asn Glu Lys Tyr Lys 705 710 715 720 Ser Wing Leu Gln Glu Leu Glu Glu Leu Lys Gln Ile Val Pro Lys Glu 725 730 735 Ser Leu Val Tyr Phe Leu Ile Gly Lys Val Tyr Lys Lys Leu Gly Gln 740 745 750 Thr His Leu Ala Leu Met Asn Phe Ser Trp Wing Met Asp Leu Asp Pro 755 760 765 Lys Gly Wing Ace η Asn Gln Ile Lys Glu Wing Ile Asp Lys Arg Tyr Leu 770 775 780 Pro Asp Asp Glu Glu Pro Ile Thr Gln Glu Gln Ile Met Gly Thr 785 790 795 800 Asp Glu Being Gln Glu Being Met Thr Asp Wing Asp Asp Thr Gln Leu 805 810 815 His Wing Glu Wing Being Asp Glu Phe 820 <210> 145

<211> 783 <212> DNA<211> 783 <212> DNA

<213> Saccharum officinarum <220><213> Saccharum officinarum <220>

<221> misc_feature <222> (780)..(783) <223> η is a, c, g, ou t <400> 145<221> misc_feature <222> (780) .. (783) <223> η is a, c, g, or t <400> 145

atggaaaccc taatggtgga ccgcgtccac agcagcctcc gcctcttcat gcaccgcaac 60atggaaaccc taatggtgga ccgcgtccac agcagcctcc gcctcttcat gcaccgcaac 60

gccgtattcc tctgcgagcg cctctgcgcg cagttcccct ccgagaccaa tgtgcaattg 120gccgtattcc tctgcgagcg cctctgcgcg cagttcccct ccgagaccaa tgtgcaattg 120

ttagcgacct gctacctcca caacaatcag ccatatgctg cataccacat tttgaaaggg 180ttagcgacct gctacctcca caacaatcag ccatatgctg cataccacat tttgaaaggg 180

aagaagctgc cggagtcccg gtacttgttt gctacatcat gctttcgaat gaacctcttg 240aagaagctgc cggagtcccg gtacttgttt gctacatcat gctttcgaat gaacctcttg 240

cgtgaagcag aagaaactct atgtccagtc aatgaaccaa acatggaggt tccaagtgga 300cgtgaagcag aagaaactct atgtccagtc aatgaaccaa acatggaggt tccaagtgga 300

gcaacaggac actacctcct tggagtgatt tacaggtgca caggcagaat ttcagctgca 360gcaacaggac actacctcct tggagtgatt tacaggtgca caggcagaat ttcagctgca 360

gctgaacaat ttacacaagc gttgactcta gatcctcttt tatgggcggc atatgaggaa 420gctgaacaat ttacacaagc gttgactcta gatcctcttt tatgggcggc atatgaggaa 420

ttgtgtatat taggtattgc tgaagatact gatgagtgtt ttagtgaatc gactgctcta 480ttgtgtatat taggtattgc tgaagatact gatgagtgtt ttagtgaatc gactgctcta 480

cgtctccagc aggaacacac atccacggcc actctggtga agtcgaactt cgccaatgaa 540cgtctccagc aggaacacac atccacggcc actctggtga agtcgaactt cgccaatgaa 540

aatcgagttc tatcatccag ggtctctgca aatcttgggg atattagtcc taagcaaatc 600aatcgagttc tatcatccag ggtctctgca aatcttgggg atattagtcc taagcaaatc 600

aaacagcttc atgctaacaa catagcagaa gtatctggct atcctcatgt aagaccaact 660aaacagcttc atgctaacaa catagcagaa gtatctggct atcctcatgt aagaccaact 660

gcattgcatg tgcagaacag ttcaacctct aatgtagcac agtttgacac cccatcacca 720 actgcagcac agacttctag tatcatgcca ccaccactct ttaggaatgt ccatgcttan 780 nnn 7 83gcattgcatg tgcagaacag ttcaacctct aatgtagcac agtttgacac cccatcacca 720 actgcagcac agacttctag tatcatgcca ccaccactct ttaggaatgt ccatgcttan 780 nnn 7 83

<210> 146 <211> 259 <212> PRT<210> 146 <211> 259 <212> PRT

<213> Saccharum officinarum <4 00> 146<213> Saccharum officinarum <4 00> 146

Met Glu Thr Leu Met Val Asp Arg Val His Ser Ser Leu Arg Leu Phe 1 5 10 15Met Glu Thr Leu Met Val Asp Arg Val His Being Ser Leu Arg Leu Phe 1 5 10 15

Met His Arg Asn Ala Val Phe Leu Cys Glu Arg Leu Cys Ala Gln PheMet His Arg Asn Ala Val Phe Leu Cys Glu Arg Leu Cys Ala Gln Phe

20 25 3020 25 30

Pro Ser Glu Thr Asn Val Gln Leu Leu Ala Thr Cys Tyr Leu His AsnTo Be Glu Thr Asn Val Gln Read Leu Wing Thr Cys Tyr Leu His Asn

35 40 4535 40 45

Asn Gln Pro Tyr Ala Ala Tyr His Ile Leu Lys Gly Lys Lys Leu ProAsn Gln Pro Tyr Wing Tyr Wing His Ile Leu Lys Gly Lys Lys Leu Pro

50 55 6050 55 60

Glu Ser Arg Tyr Leu Phe Ala Thr Ser Cys Phe Arg Met Asn Leu Leu 65 70 75 80Glu Ser Arg Tyr Leu Phe Ala Thr Be Cys Phe Arg Met Asn Leu Leu 65 70 75 80

Arg Glu Ala Glu Glu Thr Leu Cys Pro Val Asn Glu Pro Asn Met GluArg Glu Wing Glu Glu Thr Read Cys Pro Val Asn Glu Pro Asn Met Glu

85 90 9585 90 95

Val Pro Ser Gly Ala Thr Gly His Tyr Leu Leu Gly Val Ile Tyr ArgVal Pro Be Gly Wing Thr Gly His Tyr Leu Read Gly Val Ile Tyr Arg

100 105 110100 105 110

Cys Thr Gly Arg Ile Ser Ala Ala Ala Glu Gln Phe Thr Gln Ala LeuCys Thr Gly Arg Ile Being Wing Wing Wing Glu Gln Phe Thr Gln Wing Leu

115 120 125115 120 125

Thr Leu Asp Pro Leu Leu Trp Ala Ala Tyr Glu Glu Leu Cys Ile LeuThr Leu Asp Pro Leu Leu Trp Wing Tyr Wing Glu Glu Leu Cys Ile Leu

130 135 140130 135 140

Gly Ile Ala Glu Asp Thr Asp Glu Cys Phe Ser Glu Ser Thr Ala Leu 145 150 155 160Gly Ile Glu Wing Asp Thr Asp Glu Cys Phe Be Glu Be Thr Wing Leu 145 150 155 160

Arg Leu Gln Gln Glu His Thr Ser Thr Ala Thr Leu Val Lys Ser AsnArg Read Gln Gln Glu His Thr Be Thr Wing Thr Read Le Val Lys Ser Asn

165 170 175165 170 175

Phe Ala Asn Glu Asn Arg Val Leu Ser Ser Arg Val Ser Ala Asn LeuPhe Ala Asn Glu Asn Arg Val Leu Be Ser Arg Val Be Ala Asn Leu

180 185 190180 185 190

Gly Asp Ile Ser Pro Lys Gln Ile Lys Gln Leu His Ala Asn Asn IleGly Asp Ile Be Pro Lys Gln Ile Lys Gln Read His Wing Asn Asn Ile

195 200 205195 200 205

Ala Glu Val Ser Gly Tyr Pro His Val Arg Pro Thr Ala Leu His ValGlu Val Wing Ser Gly Tyr Pro His Val Arg Pro Thr Wing Leu His Val

210 215 220210 215 220

Gln Asn Ser Ser Thr Ser Asn Val Ala Gln Phe Asp Thr Pro Ser Pro 225 230 235 240Gln Asn Be Thr Be Asn Val Wing Gln Phe Asp Thr Be Pro 225 230 235 240

Thr Ala Ala Gln Thr Ser Ser Ile Met Pro Pro Pro Leu Phe Arg Asn 245 250 255Thr Wing Wing Gln Thr Be Ser Ile Met Pro Pro Leu Phe Arg Asn 245 250 255

Val His AlaVal His Wing

<210> 147 <211> 1314 <212> DNA<210> 147 <211> 1314 <212> DNA

<213> Saccharum officinarum <220><213> Saccharum officinarum <220>

<221> misc_feature <222> (416)..(416) <223> η is a, c, g, ou t <220><221> misc_feature <222> (416) .. (416) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (881)..(881) <223> η is a, c, g, ou t <4 00> 147<221> misc_feature <222> (881) .. (881) <223> η is a, c, g, or t <4 00> 147

attcaaattc aaatacctgg ggtttggagg gaatggtaca ggttattcgt cagggaaatt 60attcaaattc aaatacctgg ggtttggagg gaatggtaca ggttattcgt cagggaaatt 60

gcgagtaaac tcgtccacac catcaaaatg gtgttaacca ccatacgttc cgtgcaagtt 120 aggaaaggaa aaccacgggc tacagaaaat tttgatgaag gaagtagata tgaagtcatt 180 gatgaaatgt ggacagacaa tatatcagga acttcatctt ctgtaagtac agctgatgga 240 agatcctttg agcaagataa agctgaacga attctgttgc aagactccaa attggcactt 300 ggtattaggg agatattggg acttgtccga acactcggtg aaggttgtag gctttcttgc 360 ttgtttaagt gccatgaagc cttggaagtc tacagaagac tccctgagac ccattntagc 420 actggatgga gcatatgcca ggttggtaag gcatatttcg aattagttga ttatttggaa 480 gctgatcgtt actttgaatt ggcacaccga ctgtcgcctt gtacgcttga tggaatggac 540 atctattcta ctgttcttta tcatctgaat gaggaaatga gactaagcta ccttgctcaa gagcttattt ccattgatcg actatctcct caagcatggt gtgcagtggg caattgcttt gccttgagga aagatcatga gactgctttg aagaattttc aacgttcggt acagcttgac tcaagatttg catatgctca cactctatgt ggtcatgagt attctgcatt ggaggattat gagaatagta tcaaattcta ccggtgtgca ctgcaggtag atgaaaggca ctacaatgcc tggtatggcc ttggggtggt gtatcttcgc caggaaaagt ntgagtttgc tgagcatcat ttcagaaggg catttcagat aaatcctcgc tcttctgttc tcatgtgcta tcttgggatg gcgttgcatt ctcttaagag gaaggaggag gcattggaaa tgatggagaa agctatagca gctgataaga agaatccact gcccaagtat cagaaggcct taatccttct aggtcttcag aagtatcaag aagctctgga tgagttggag cggctaaagg agattgcacc tcatgagagc agtatgtatg cactgatggg aaagatttac aagcaactca atatccttga caaagctgtt ttctgctttg gcattgccct ggatttgaaa cctcctgctg ctgatcttgc tataattaag tccgcaatgg agaaagtaca tctccctgat gaactgatgg aggatgacct gtaagcgagtaaac tcgtccacac catcaaaatg gtgttaacca ccatacgttc cgtgcaagtt 120 aggaaaggaa aaccacgggc tacagaaaat tttgatgaag gaagtagata tgaagtcatt 180 gatgaaatgt ggacagacaa tatatcagga acttcatctt ctgtaagtac agctgatgga 240 agatcctttg agcaagataa agctgaacga attctgttgc aagactccaa attggcactt 300 ggtattaggg agatattggg acttgtccga acactcggtg aaggttgtag gctttcttgc 360 ttgtttaagt gccatgaagc cttggaagtc tacagaagac tccctgagac ccattntagc 420 actggatgga gcatatgcca ggttggtaag gcatatttcg aattagttga ttatttggaa 480 gctgatcgtt actttgaatt ggcacaccga ctgtcgcctt gtacgcttga tggaatggac 540 atctattcta ctgttcttta tcatctgaat gaggaaatga gactaagcta ccttgctcaa gagcttattt ccattgatcg actatctcct caagcatggt gtgcagtggg caattgcttt gccttgagga aagatcatga gactgctttg aagaattttc aacgttcggt acagcttgac tcaagatttg catatgctca cactctatgt ggtcatgagt attctgcatt ggaggattat gagaatagta tcaaattcta ccggtgtgca ctgcaggtag atgaaaggca ctacaatgcc tggtatggcc ttggggtggt gtatcttcgc caggaaaagt ntgagtttgc tgagcatcat ttcagaaggg catttcagat aaatcctcgc tcttctg ttc tcatgtgcta tcttgggatg gcgttgcatt ctcttaagag gaaggaggag gcattggaaa tgatggagaa agctatagca gctgataaga agaatccact gcccaagtat cagaaggcct taatccttct aggtcttcag aagtatcaag aagctctgga tgagttggag cggctaaagg agattgcacc tcatgagagc agtatgtatg cactgatggg aaagatttac aagcaactca atatccttga caaagctgtt ttctgctttg gcattgccct ggatttgaaa cctcctgctg ctgatcttgc tataattaag tccgcaatgg agaaagtaca tctccctgat gaactgatgg aggatgacct GTAA

<210> 148 <211> 437 <212> PRT<210> 148 <211> 437 <212> PRT

<213> Saccharum officinarum <220><213> Saccharum officinarum <220>

<221> INSEGURO <222> (139)..(139)<221> UNSAFE <222> (139) .. (139)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220><223> Xaa can be any naturally occurring amino acid <220>

<221> INSEGURO <222> (294)..(294)<221> UNSAFE <222> (294) .. (294)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 148<223> Xaa can be any naturally occurring amino acid <400> 148

Ile Gln Ile Gln Ile Pro Gly Val Trp Arg Glu Trp Tyr Arg Leu Phe 1 5 10 15Glle Ile Glle Ile Pro Gly Val Trp Arg Glu Trp Tyr Arg Leu Phe 1 5 10 15

Val Arg Glu Ile Ala Ser Lys Leu Val His Thr Ile Lys Met Val LeuVal Arg Glu Ile Wing Ser Lys Leu Val His Thr Ile Lys Met Val Leu

20 25 3020 25 30

Thr Thr Ile Arg Ser Val Gln Val Arg Lys Gly Lys Pro Arg Ala ThrThr Thr Ile Arg Be Val Gln Val Arg Lys Gly Lys Pro Arg Wing Thr

35 40 4535 40 45

Glu Asn Phe Asp Glu Gly Ser Arg Tyr Glu Val Ile Asp Glu Met TrpGlu Asn Phe Asp Glu Gly Ser Arg Tyr Glu Val Ile Asp Glu Met Trp

50 55 6050 55 60

Thr Asp Asn Ile Ser Gly Thr Ser Ser Ser Val Ser Thr Ala Asp Gly 65 70 75 80Thr Asp Asn Ile Be Gly Thr Be Be Val Be Thr Wing Asp Gly 65 70 75 80

Arg Ser Phe Glu Gln Asp Lys Ala Glu Arg Ile Leu Leu Gln Asp SerArg Ser Phe Glu Gln Asp Lys Glu Wing Arg Ile Leu Read Gln Asp Ser

85 90 9585 90 95

Lys Leu Ala Leu Gly Ile Arg Glu Ile Leu Gly Leu Val Arg Thr LeuLys Leu Wing Leu Gly Ile Arg Glu Ile Leu Gly Leu Val Arg Thr Leu

100 105 110100 105 110

Gly Glu Gly Cys Arg Leu Ser Cys Leu Phe Lys Cys His Glu Ala LeuGly Glu Gly Cys Arg Leu Be Cys Leu Phe Lys Cys His Glu Wing Leu

115 120 125115 120 125

Glu Val Tyr Arg Arg Leu Pro Glu Thr His Xaa Ser Thr Gly Trp SerGlu Val Tyr Arg Arg Read Leu Glu Thr His Xaa Ser Thr Gly Trp Ser

130 135 140130 135 140

Ile Cys Gln Val Gly Lys Ala Tyr Phe Glu Leu Val Asp Tyr Leu Glu 145 150 155 160Ile Cys Gln Val Gly Lys Wing Tyr Phe Glu Leu Val Asp Tyr Leu Glu 145 150 155 160

Ala Asp Arg Tyr Phe Glu Leu Ala His Arg Leu Ser Pro Cys Thr LeuAsp Arg Wing Tyr Phe Glu Read His Arg Wing Read Be Pro Cys Thr Leu

165 170 175165 170 175

Asp Gly Met Asp Ile Tyr Ser Thr Val Leu Tyr His Leu Asn Glu GluAsp Gly Met Asp Ile Tyr Ser Thr Val Leu Tyr His Leu Asn Glu Glu

180 185 190180 185 190

Met Arg Leu Ser Tyr Leu Ala Gln Glu Leu Ile Ser Ile Asp Arg LeuMet Arg Leu Ser Tyr Leu Wing Gln Glu Leu Ile Ser Ile Asp Arg Leu

195 200 205195 200 205

Ser Pro Gln Ala Trp Cys Ala Val Gly Asn Cys Phe Ala Leu Arg LysSer Pro Gln Wing Trp Cys Wing Val Gly Asn Cys Phe Wing Read Arg Lys

210 215 220210 215 220

Asp His Glu Thr Ala Leu Lys Asn Phe Gln Arg Ser Val Gln Leu Asp 225 230 235 240Asp His Glu Thr Wing Leu Lys Asn Phe Gln Arg Ser Val Gln Leu Asp 225 230 235 240

Ser Arg Phe Ala Tyr Ala His Thr Leu Cys Gly His Glu Tyr Ser AlaSer Arg Phe Ala Tyr Ala His Thr Read Cys Gly His Glu Tyr Ser Ala

245 250 255245 250 255

Leu Glu Asp Tyr Glu Asn Ser Ile Lys Phe Tyr Arg Cys Ala Leu GlnGlu Asp Tyr Glu Asn Ser Ile Lys Phe Tyr Arg Cys Wing Glu Asu

260 265 270260 265 270

Val Asp Glu Arg His Tyr Asn Ala Trp Tyr Gly Leu Gly Val Val TyrVal Asp Glu Arg His Tyr Asn Wing Trp Tyr Gly Leu Gly Val Val Tyr

275 280 285275 280 285

Leu Arg Gln Glu Lys Xaa Glu Phe Ala Glu His His Phe Arg Arg AlaLeu Arg Gln Glu Lys Xaa Glu Phe Ala Glu His His Phe Arg Arg Ala

600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1314 290 295600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1314 290 295

Phe Gln Ile Asn Pro Arg Ser Ser Val Leu Met 305 310 315Phe Gln Ile Asn Pro Arg Be Ser Val Leu Met 305 310 315

Ala Leu His Ser Leu Lys Arg Lys Glu Glu AlaWing Read His Ser Read Lys Arg Lys Glu Glu Wing

325 330325 330

Lys Ala Ile Ala Ala Asp Lvs Lys Asn Pro LeuLys Wing Ile Wing Wing Asp Lvs Wing Lys Asn Pro Leu

340 345340 345

Ala Leu Ile Leu Leu Gly Leu Gln Lys Tyr GlnWing Leu Ile Leu Leu Gly Leu Gln Lys Tyr Gln

355 360355 360

Leu Glu Arg Leu Lys Glu Ile Ala Pro His GluRead Glu Arg Read Leu Lys Glu Ile Wing Pro His Glu

370 375370 375

Leu Met Gly Lys Ile Tyr Lys Gln Leu Asn Ile 385 390 395Read Met Gly Lys Ile Tyr Lys Gln Read Asn Ile 385 390 395

Phe Cys Phe Gly Ile Ala Leu Asp Leu Lys ProPhe Cys Phe Gly Ile Wing Leu Asp Leu Lys Pro

405 410405 410

Ala Ile Ile Lys Ser Ala Met Glu Lys Val HisWing Ile Ile Lys Ser Wing Met Glu Lys Val His

420 425420 425

Met Glu Asp Asp LeuMet Glu Asp Asp Leu

435 <210> 149 <211> 54 <212> DNA435 <210> 149 <211> 54 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm00778 <400> 149<223> initiator: prm00778 <400> 149

ggggacaagt ttgtacaaaa aagcaggctt <210> 150 <211> 49 <212> DNAggggacaagt ttgtacaaaa aagcaggctt <210> 150 <211> 49 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm00779 <400> 150<223> initiator: prm00779 <400> 150

ggggaccact ttgtacaaga aagctgggtt <210> 151 <211> 1042 <212> DNA <213> Oryza sativa <400> 151ggggaccact ttgtacaaga aagctgggtt <210> 151 <211> 1042 <212> DNA <213> Oryza sativa <400> 151

ggggagttag gaaccttgac atacaaccaa tgataccatt tacagaggtt catatttttt agatggctca ttagtgatat gtacggccac gggtgatggc ctgaactaat attttattcg ctaaagtaca cgcaagattc aacggaaaaa agaaaccgat atgaaataac tagatcaact catgtcgtca aaaacaaaag cacgctgatg attcgatcat caaacaaagg tggtagtagt tcatcagaaa gaagaattaa agaaaaaact aatcccgtct ctacaaaagc cactcctttg atttgacatg caaaagcaag tacaactaca caacactgtc tctctatctc caaaggcagt tttcctctct acctctaatg atagcttgga gcaagttcaa tctaattcat ctataatcaa tctaatagct tattcataca taatatctgg tcccatctat catacacact gagtctgtgc tagcccgctg ctcttctctc ttcatttatc ttcttaaaat gcttatagct tgatattgag agggagagga gtgagagcta aacaacaagg cacactcttc ctacctcttc tccggttctt gtccaagaac ttcacctcaa tagctcgagc tacggcctaa gctcgatcgc tgcaccaata cttcactgga gatcgcctag ctgcgtgtct tgagcttctc tc <210> 152 <211> 951 <212> DNA <213> Oryza sativa <400> 152ggggagttag gaaccttgac atacaaccaa tgataccatt tacagaggtt catatttttt agatggctca ttagtgatat gtacggccac gggtgatggc ctgaactaat attttattcg ctaaagtaca cgcaagattc aacggaaaaa agaaaccgat atgaaataac tagatcaact catgtcgtca aaaacaaaag cacgctgatg attcgatcat caaacaaagg tggtagtagt tcatcagaaa gaagaattaa agaaaaaact aatcccgtct ctacaaaagc cactcctttg atttgacatg caaaagcaag tacaactaca caacactgtc tctctatctc caaaggcagt tttcctctct acctctaatg atagcttgga gcaagttcaa tctaattcat ctataatcaa tctaatagct tattcataca taatatctgg tcccatctat catacacact gagtctgtgc tagcccgctg ctcttctctc ttcatttatc ttcttaaaat gcttatagct tgatattgag agggagagga gtgagagcta aacaacaagg cacactcttc ctacctcttc tccggttctt gtccaagaac ttcacctcaa tagctcgagc tacggcctaa gctcgatcgc tgcaccaata cttcactgga gatcgcctag ctgcgtgtct tgagcttctc tc <210> 152 <211> 951 <212> DNA <213> Oryza sativa <400> 152

300300

Cys TyrCys tyr

Leu GluRead Glu

Pro LysPro lys

Glu Ala 365 Ser Ser 380Glu Wing 365 Ser Ser 380

Leu Asp Pro Ala Leu ProLeu Asp Pro Wing Leu Pro

Leu Gly Met 320Read Gly Met 320

Met Met GluMet Met Glu

335 Tyr Gln Lys 350335 Tyr Gln Lys 350

Leu Asp GluRead Asp Glu

Met Tyr AlaMet Tyr Wing

Lys Ala Val 400Lys Wing Val 400

Ala Asp Leu 415Wing Asp Leu 415

Asp Glu Leu 430Asp Glu Leu 430

cacaatgcaa caactgtcaa cttccacaatgcaa caactgtcaa cttc

ggagtagcta tggtttcacggagtagcta tggtttcac

ttttttcaag tttagtcaaa aggtgccgct cgatcgagat atgctcatct agtaaagcgt cgcgagccag gctccactcc agctgtattg tagtatagct atagttatat tatagctgac atatttgcag gctcagctca cctttttcctttttttcaag tttagtcaaa aggtgccgct cgatcgagat atgctcatct agtaaagcgt cgcgagccag gctccactcc agctgtattg tagtatagct atagttatat tatagctgac atatttgcag gctcagctca ccttt

cagctagagg aatttcagaa acatcatcgt cagttagtta atggacaaca atcgtgtttc agaaaattcc tctactaccc gcttccagct aactactagc actacattat tacaaatctg ctggcttatg gctcaaggta ctttctcttccagctagagg aatttcagaa acatcatcgt cagttagtta atggacaaca atcgtgtttc agaaaattcc tctactaccc gcttccagct aactactagc actacattat tacaaatctg ctggcttatg gctcaaggta ctttctcttc

cttttgcgtt gcgcaggaga ctgcagctag ctagcttatccttttgcgtt gcgcaggaga ctgcagctag ctagcttatc

5454

4949

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1042 atggatccgg tcacggcatc aatacacggt caccatcttc ctccaccgtt caacacccgc 6060 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1042 atggatccgg tcacggcatc aatacacggt caccatcttc ctccaccgtt caacacccgc 60

gacttccatc accatctcca gcagcagcag caccagctgc atctcaagac cgaggatgac 120gacttccatc accatctcca gcagcagcag caccagctgc atctcaagac cgaggatgac 120

caaggcggcg gcactccggg tgtcttcggc agccgcggca ccaagcgcga ccacgacgac 180caaggcggcg gcactccggg tgtcttcggc agccgcggca ccaagcgcga ccacgacgac 180

gacgagaaca gtggcaacgg ccatggaagc ggtggtgacg gcggtgacct cgcgctggta 240gacgagaaca gtggcaacgg ccatggaagc ggtggtgacg gcggtgacct cgcgctggta 240

cccccctcgg gtggcgggcc ggacggcgcc gggagcgaga gcgccacgcg ccgcccgagg 300cccccctcgg gtggcgggcc ggacggcgcc gggagcgaga gcgccacgcg ccgcccgagg 300

ggacgcccgg cggggtccaa gaacaagccg aagccaccga tcatcatcac cagggacagc 360ggacgcccgg cggggtccaa gaacaagccg aagccaccga tcatcatcac cagggacagc 360

gccaacacgc tccggacgca tgtcatggag gtggccggcg gctgcgacat ctccgagagc 420gccaacacgc tccggacgca tgtcatggag gtggccggcg gctgcgacat ctccgagagc 420

atcaccacgt tcgcgcgacg ccggcagcgc ggggtttgcg tgctcagcgg cgccggcacc 480atcaccacgt tcgcgcgacg ccggcagcgc ggggtttgcg tgctcagcgg cgccggcacc 480

gtcactaacg tcacgctgcg gcagcccgca tcgcagggag cggtcgttgc gctccacggc 540gtcactaacg tcacgctgcg gcagcccgca tcgcagggag cggtcgttgc gctccacggc 540

cggttcgaga tactctccct ctccggctcc ttcctcccgc cgcccgcccc gccggaggcc 600cggttcgaga tactctccct ctccggctcc ttcctcccgc cgcccgcccc gccggaggcc 600

acggggctca ccgtctacct ggccggaggc cagggccagg tcgtgggcgg cagcgtcgtc 660acggggctca ccgtctacct ggccggaggc cagggccagg tcgtgggcgg cagcgtcgtc 660

ggcgcgctga ccgcggctgg gcctgtggtg ataatggcgg cgtcttttgc gaacgcggtg 720ggcgcgctga ccgcggctgg gcctgtggtg ataatggcgg cgtcttttgc gaacgcggtg 720

tacgagcggc tgccgttgga ggacgacgag ctactggcgg ctcaagggca agccgacagc 780tacgagcggc tgccgttgga ggacgacgag ctactggcgg ctcaagggca agccgacagc 780

gctgggttgc tcgccgcggg gcagcaagcg gcgcagctcg ccggcggggc cgtcgatcca 840gctgggttgc tcgccgcggg gcagcaagcg gcgcagctcg ccggcggggc cgtcgatcca 840

agcctcttcc aaggactacc accaaaccta ctcggaaacg tgcagctgcc gccggaagcc 900agcctcttcc aaggactacc accaaaccta ctcggaaacg tgcagctgcc gccggaagcc 900

gcctacggat ggaaccctgg cgccggcggt ggccgcccgg cgccgttctg a 951 <210> 153gcctacggat ggaaccctgg cgccggcggt ggccgcccgg cgccgttctg a 951 <210> 153

<211> 316 <212> PRT <213> Oryza sativa <4 00> 153 Met Asp Pro Val Thr Ala Ser Ile His Gly His His Leu Pro Pro Pro 1 5 10 15 Phe Asn Thr Arg Asp Phe His His His Leu Gln Gln Gln Gln His Gln 20 25 30 Leu His Leu Lys Thr Glu Asp Asp Gln Gly Gly Gly Thr Pro Gly Val 35 40 45 Phe Gly Ser Arg Gly Thr Lys Arg Asp His Asp Asp Asp Glu Asn Ser 50 55 60 Gly Asn Gly His Gly Ser Gly Gly Asp Gly Gly Asp Leu Ala Leu Val 65 70 75 80 Pro Pro Ser Gly Gly Gly Pro Asp Gly Ala Gly Ser Glu Ser Ala Thr 85 90 95 Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro 100 105 110 Pro Ile Ile Ile Thr Arg Asp Ser Ala Asn Thr Leu Arg Thr His Val 115 120 125 Met Glu Val Ala Gly Gly Cys Asp Ile Ser Glu Ser Ile Thr Thr Phe 130 135 140 Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ala Gly Thr 145 150 155 160 Val Thr Asn Val Thr Leu Arg Gln Pro Ala Ser Gln Gly Ala Val Val 165 170 175 Ala Leu His Gly Arg Phe Glu Ile Leu Ser Leu Ser Gly Ser Phe Leu 180 185 190 Pro Pro Pro Ala Pro Pro Glu Ala Thr Gly Leu Thr Val Tyr Leu Ala 195 200 205 Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ala Leu Thr 210 215 220 Ala Ala Gly Pro Val Val Ile Met Ala Ala Ser Phe Ala Asn Ala Val 225 230 235 240 Tyr Glu Arg Leu Pro Leu Glu Asp Asp Glu Leu Leu Ala Ala Gln Gly 245 250 255 Gln Ala Asp Ser Ala Gly Leu Leu Ala Ala Gly Gln Gln Ala Ala Gln 260 265 270 Leu Ala Gly Gly Ala Val Asp Pro Ser Leu Phe Gln Gly Leu Pro Pro 275 280 285 Asn Leu Leu Gly Asn Val Gln Leu Pro Pro Glu Ala Ala Tyr Gly Trp 290 295 300 Asn Pro Gly Ala Gly Gly Gly Arg Pro Ala Pro Phe 305 310 315 <210> 154 <211> 918 <212> DNA<211> 316 <212> PRT <213> Oryza sativa <4 00> 153 Met Asp Pro Val Thr Ala Ser Ile His Gly His His Leu Pro Pro 1 5 10 15 Phe Asn Thr Arg Asp Phe His His Leu Gln Gln Gln Gln His Gln 20 25 30 Leu His Leu Lys Thr Glu Asp Asp Gln Gly Gly Gly Thr Pro Gly Val 35 40 45 Phe Gly Being Arg Gly Thr Be Gly Gly Asp Gly Gly Asp Leu Wing Leu Val 65 70 75 80 Pro Pro Be Gly Gly Gly Pro Asp Gly Wing Gly Be Glu Be Wing Thr 85 90 95 Arg Arg Pro Arg Gly Arg Wing Gly Be Lys Asn Lys Pro Lys Pro 100 105 110 Pro Ile Ile Ile Thr Arg Asp Be Wing Asn Thr Read Le Arg Thr His Val 115 120 125 Met Glu Val Wing Gly Gly Cys Asp Ile Be Glu Ser Ile Thr Thr Phe 130 135 140 Wing Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Wing Gly Thr 145 150 155 160 Val Thr Asn Val Thr Leu Arg Gln Pro Wing Be Gln Gly Val Val Wing 165 170 175 Wing Read His Gly Arg Phe Glu Ile Read Le Be Ser Gly Be Phe Leu 180 185 190 Pro Pro Wing Pro Pro Glu Wing Thr Gly Leu Thr Val Tyr Leu Wing 195 200 205 Gly Gly Gln Gly Gln Val Val Gly Gly Val Val Gly Val Wing Gly Leu Thr 210 215 220 Wing Gly Pro Val Val Ile Met Wing Wing Be Phe Wing Asn Wing Val 225 230 235 240 Tyr Glu Arg Leu Pro Leu Glu Asp Glu Leu Leu Wing Wing Gln Gly 245 250 255 Gln Wing Asp Ser Wing Gly Leu Leu Wing Wing Gly Wing Gln Gln Wing Wing Gln 260 265 270 Leu Wing Wing Gly Gly Wing Val Asp Pro Ser Leu Phe Gln Gly Leu Pro 275 280 285 Asn Val Gln Leu Pro Pro Glu Wing Tyr Gly Wing Trp 290 295 300 Asn Pro Gly Wing Gly Gly Gly Arg Wing Pro Phe 305 310 315 <210> 154 <211> 918 <212> DNA

<213> Oryza sativa<213> Oryza sativa

<4 00> 154<4 00> 154

atggcaggtc tcgacctcgg caccgccgcg acgcgctacg tccaccagct ccaccacctc 60atggcaggtc tcgacctcgg caccgccgcg acgcgctacg tccaccagct ccaccacctc 60

caccccgacc tccagctgca gcacagctac gccaagcagc acgagccgtc cgacgacgac 120 cccaacggca gcggcggcgg cggcaacagc aacggcgggc cgtacgggga ccatgacggc 180caccccgacc tccagctgca gcacagctac gccaagcagc acgagccgtc cgacgacgac 120 cccaacggca gcggcggcgg cggcaacagc aacggcgggc cgtacgggga ccatgacggc 180

gggtcctcgt cgtcaggccc tgccaccgac ggcgcggtcg gcgggcccgg cgacgtggtg 240gggtcctcgt cgtcaggccc tgccaccgac ggcgcggtcg gcgggcccgg cgacgtggtg 240

gcgcgccggc cgcgggggcg cccgcctggc tccaagaaca agccgaagcc gccggtgatc 300gcgcgccggc cgcgggggcg cccgcctggc tccaagaaca agccgaagcc gccggtgatc 300

atcacgcggg agagcgccaa cacgctgcgc gcccacatcc tggaggtcgg gagcggctgc 360atcacgcggg agagcgccaa cacgctgcgc gcccacatcc tggaggtcgg gagcggctgc 360

gacgtgttcg agtgcgtctc cacgtacgcg cgccggcggc agcgcggcgt gtgcgtgctg 420gacgtgttcg agtgcgtctc cacgtacgcg cgccggcggc agcgcggcgt gtgcgtgctg 420

agcggcagcg gcgtggtcac caacgtgacg ctgcgtcagc cgtcggcgcc cgcgggcgcc 4 80agcggcagcg gcgtggtcac caacgtgacg ctgcgtcagc cgtcggcgcc cgcgggcgcc 4 80

gtcgtgtcgc tgcacgggag gttcgagatc ctgtcgctct cgggctcctt cctcccgccg 540gtcgtgtcgc tgcacgggag gttcgagatc ctgtcgctct cgggctcctt cctcccgccg 540

ccggctcccc ccggcgccac cagcctcacc atcttcctcg ccgggggcca gggacaggtc 600ccggctcccc ccggcgccac cagcctcacc atcttcctcg ccgggggcca gggacaggtc 600

gtcggcggca acgtcgtcgg cgcgctctac gccgcgggcc cggtcatcgt catcgcggcg 660gtcggcggca acgtcgtcgg cgcgctctac gccgcgggcc cggtcatcgt catcgcggcg 660

tccttcgcca acgtcgccta cgagcgcctc ccactggagg aggaggaggc gccgccgccg 720tccttcgcca acgtcgccta cgagcgcctc ccactggagg aggaggaggc gccgccgccg 720

caggccggcc tgcagatgca gcagcccggc ggcggcgccg atgctggtgg catgggtggc 780caggccggcc tgcagatgca gcagcccggc ggcggcgccg atgctggtgg catgggtggc 780

gcgttcccgc cggacccgtc tgccgccggc ctcccgttct tcaacctgcc gctcaacaac 840gcgttcccgc cggacccgtc tgccgccggc ctcccgttct tcaacctgcc gctcaacaac 840

atgcccggtg gcggcggctc acagctccct cccggcgccg acggccatgg ctgggccggc 900atgcccggtg gcggcggctc acagctccct cccggcgccg acggccatgg ctgggccggc 900

gcacggccac cgttctga 918 <210> 155 <211> 305 <212> PRTgcacggccac cgttctga 918 <210> 155 <211> 305 <212> PRT

<213> Oryza sativa <4 00> 155<213> Oryza sativa <4 00> 155

Met Ala Gly Leu Asp Leu Gly Thr Ala Ala Thr Arg Tyr Val His Gln 1 5 10 15 Leu His His Leu His Pro Asp Leu Gln Leu Gln His Ser Tyr Ala Lys 20 25 30 Gln His Glu Pro Ser Asp Asp Asp Pro Asn Gly Ser Gly Gly Gly Gly 35 40 45 Asn Ser Asn Gly Gly Pro Tyr Gly Asp His Asp Gly Gly Ser Ser Ser 50 55 60 Ser Gly Pro Ala Thr Asp Gly Ala Val Gly Gly Pro Gly Asp Val Val 65 70 75 80 Ala Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys 85 90 95 Pro Pro Val Ile Ile Thr Arg Glu Ser Ala Asn Thr Leu Arg Ala His 100 105 110 Ile Leu Glu Val Gly Ser Gly Cys Asp Val Phe Glu Cys Val Ser Thr 115 120 125 Tyr Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ser Gly 130 135 140 Val Val Thr Asn Val Thr Leu Arg Gln Pro Ser Ala Pro Ala Gly Ala 145 150 155 160 Val Val Ser Leu His Gly Arg Phe Glu Ile Leu Ser Leu Ser Gly Ser 165 170 175 Phe Leu Pro Pro Pro Ala Pro Pro Gly Ala Thr Ser Leu Thr Ile Phe 180 185 190 Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Asn Val Val Gly Ala 195 200 205 Leu Tyr Ala Ala Gly Pro Val Ile Val Ile Ala Ala Ser Phe Ala Asn 210 215 220 Val Ala Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu Ala Pro Pro Pro 225 230 235 240 Gln Ala Gly Leu Gln Met Gln Gln Pro Gly Gly Gly Ala Asp Ala Gly 245 250 255 Gly Met Gly Gly Ala Phe Pro Pro Asp Pro Ser Ala Ala Gly Leu Pro 260 265 270 Phe Phe Asn Leu Pro Leu Asn Asn Met Pro Gly Gly Gly Gly Ser Gln 275 280 285 Leu Pro Pro Gly Ala Asp Gly His Gly Trp Ala Gly Ala Arg Pro Pro 290 295 300Met Wing Gly Leu Asp Leu Gly Thr Wing Ala Thr Arg Tyr Val His Gln 1 5 10 15 Leu His His Leu His Pro Asp Leu Gln Leu Gln His Ser Tyr Ala Lys 20 25 30 Gln His Glu Pro Ser Asp Asp Pro Asn Gly Be Gly Gly Gly Gly 35 40 45 Asn Be Asn Gly Gly Pro Tyr Gly Asp His Asp Gly Gly Ser Be Ser 50 55 60 Be Gly Pro Wing Thr Asp Gly Val Wing Gly Gly Pro Val Gly Asp Val 65 70 75 80 Wing Arg Arg Pro Arg Gly Arg Pro Pro Gly Be Lys Asn Lys Pro Lys 85 90 95 Pro Pro Val Ile Ile Thr Arg Glu Be Wing Asn Thr Read Arg Wing His 100 105 110 Ile Leu Glu Val Gly Be Gly Cys Asp Val Phe Glu Cys Val Ser Thr 115 120 125 Tyr Wing Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Ser Gly 130 135 140 Val Val Thr Asn Val Thr Leu Arg Gln Pro Ser Wing Pro Gly Wing 145 150 155 160 Val Val Ser Leu His Gly Arg Phe Glu Ile Leu To Be Leu To Be Gly Ser 165 170 175 y Wing Thr Be Leu Thr Ile Phe 180 185 190 Leu Wing Gly Gly Gln Gly Gln Val Val Gly Gn Asn Val Val Gly Wing 195 200 205 Leu Tyr Wing Gly Pro Val Ile Wing Wing Ser Phe Wing Asn 210 215 220 Val Wing Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu Wing Pro Pro Pro 225 230 235 240 Gln Wing Gly Leu Gln Met Gln Pro Gly Gly Wing Asp Wing Gly 245 250 255 Gly Met Gly Gly Wing Phe Pro Pro Asp Pro Be Wing Wing Gly Leu Pro 260 265 270 Phe Phe Asn Leu Pro Leu Asn Asn Met Pro Gly Gly Gly Gly Ser Gln 275 280 285 Leu Pro Gly Wing Asp Gly His Gly Trp Wing Gly Wing Pro Pro 290 295 300 300

Phe 305Phe 305

<210> 156<210> 156

<211> 906<211> 906

<212> DNA<212> DNA

<213> Lotus<213> Lotus

<400> 156<400> 156

atggatccatatggatccat

caacaccaaccaacaccaac

accccagcagaccccagcag

aacaacaacaaacaacaaca

agaagacctcagaagacctc

acccgcgacaacccgcgaca

atcgtcgacaatcgtcgaca

ggcactggaaggcactggaa

accctccacgaccctccacg

ccaccggcagccaccggcag

ggaagtgttgggaagtgttg

agcaacgctgagcaacgctg

ggaggttcaaggaggttcaa

cagcagcaaccagcagcaac

cttctcaattcttctcaatt

tactgatactga

<210> 157<210> 157

<211> 301<211> 301

<212> PRT<212> PRT

<213> Lotus<213> Lotus

<400> 157<400> 157

corniculatuscorniculatus

tatcagcaca accagcagca aagatgaaca gccatgacgg gaggaaggcc gcgccaacgc gcgtctccaa ccgtcaccaa gaaggtttga catcaggttt tgggagctct cgtatgagag tgggttcacc agcttttagg ctgttcagattatcagcaca accagcagca aagatgaaca gccatgacgg gaggaaggcc gcgccaacgc gcgtctccaa ccgtcaccaa gaaggtttga catcaggttt tgggagctct cgtatgagag tgggttcacc agcttttcag ctg

cggccactct gcatcagcag gagtggaagc caaagaaggc cgccggatcg acttaagacc ctttgcaaga cgtcactctc gattctctcc gaccatttac cattgcttcg gcttcctttg acccggtggt ggatgcaact gccaaactcccggccactct gcatcagcag gagtggaagc caaagaaggc cgccggatcg acttaagacc ctttgcaaga cgtcactctc gattctctcc gaccatttac cattgcttcg gcttcctttg acccggtggt ggatgcacc gccaact

cttcctcctc catcagttcc agcggcggca tccggaggcg aagaacaagc cacgtcatgg cgccgccagc aggcagccag ctggcaggat ttggctggtg ggacctgtgg gaagatgagg agtggtggtg gccccacttt gataacttctcttcctcctc catcagttcc agcggcggca tccggaggcg aagaacaagc cacgtcatgg cgccgccagc aggcagccag ctggcaggat ttggctggtt ggacctgtgg gaagatgagg agtggtggtg gcct

cttttctcca actctttaca tcaaaaggga gaggcgaaag ctaagccgcc aggtcgccga gcggcgtctg cttcttccgg cgttcctgcc gacaagggca ttatcatggc acccttcatt gtggtggagt ttcatggttt ggccatctggcttttctcca actctttaca tcaaaaggga gaggcgaaag ctaagccgcc aggtcgccga gcggcgtctg cttcttccgg cgttcctgcc gacaagggca ttatcatggc acccttcatt gtggtggagt ttggcatctg

tctgcaccac gcagcagcaa acgcgatgaa cgagaattca catcatcatc cggctgcgac catcatgagc cgctgttgtc gccgcctgct ggttgttgga agcttcgttc ggcaatgcaa tggtcagcaa gcctccgaat ccgctctccttctgcaccac gcagcagcaa acgcgatgaa cgagaattca catcatcatc cggctgcgac catcatgagc cgctgttgtc gccgcctgct ggttgttgga agcttcgttc ggcaatgcaa tggtcagcaa cccctcctcc

corniculatuscorniculatus

Met Asp Pro Leu Ser Ala His Gly His Ser Leu Pro Pro Pro Phe Leu 1 5 10 15 His Leu His His Gln His Gln His Gln Gln Gln His Gln Gln His Gln 20 25 30 Phe His Ser Leu Gln Gln Gln Gln Thr Pro Ala Glu Asp Glu Gln Ser 35 40 45 Gly Ser Ser Gly Gly Ile Lys Arg Glu Arg Asp Glu Asn Asn Asn Ser 50 55 60 His Asp Gly Lys Glu Gly Ser Gly Gly Gly Gly Glu Ser Glu Asn Ser 65 70 75 80 Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro 85 90 95 Pro Ile Ile Ile Thr Arg Asp Ser Ala Asn Ala Leu Lys Thr His Val 100 105 110 Met Glu Val Ala Asp Gly Cys Asp Ile Val Asp Ser Val Ser Asn Phe 115 120 125 Ala Arg Arg Arg Gln Arg Gly Val Cys Ile Met Ser Gly Thr Gly Thr 130 135 140 Val Thr Asn Val Thr Leu Arg Gln Pro Ala Ser Ser Gly Ala Val Val 145 150 155 160 Thr Leu His Gly Arg Phe Glu Ile Leu Ser Leu Ala Gly Ser Phe Leu 165 170 175 Pro Pro Pro Ala Pro Pro Ala Ala Ser Gly Leu Thr Ile Tyr Leu Ala 180 185 190 Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Ala Leu Ile 195 200 205 Ala Ser Gly Pro Val Val Ile Met Ala Ala Ser Phe Ser Asn Ala Ala 210 215 220 Tyr Glu Arg Leu Pro Leu Glu Asp Glu Asp Pro Ser Leu Ala Met Gln 225 230 235 240 Gly Gly Ser Met Gly Ser Pro Pro Gly Gly Ser Gly Gly Gly Gly Gly 245 250 255 Val Gly Gln Gln Gln Gln Gln Gln Leu Leu Gly Asp Ala Thr Ala Pro 260 265 270 Leu Phe His Gly Leu Pro Pro Asn Leu Leu Asn Ser Val Gln Met Pro 275 280 285Met Asp Pro Read His Ala His Gly His His Leu Pro Pro His Phe Leu 1 5 10 15 His Leu His His Gln His Gln His Gln His Gln His Gln His Gln His Gln 20 25 30 Phe His His Leu His Gln Gln Gln Thr Pro Ala Glu Asp Glu Gln Be 35 40 45 Gly Be Ser Gly Gly Ile Lys Arg Glu Arg Asp Glu Asn Asn Asn Ser 50 55 60 His Asp Gly Lys Glu Gly Gly Gly Gly Glu Be Glu Asn Ser 65 70 75 80 Arg Arg Pro Arg Gly Arg Pro Wing Gly Be Lys Asn Lys Pro Lys Pro 85 90 95 Pro Ile Ile Ile Thr Arg Asp Be Wing Asn Wing Read Le Lys Thr His Val 100 105 110 Met Glu Val Wing Asp Gly Cys Asp Ile Val Asp Be Val Ser Asn Phe 115 120 125 Wing Arg Arg Arg Gln Arg Gly Val Cys Ile Met Be Gly Thr Gly Thr 130 135 140 Val Thr Asn Val Thr Read Leu Arg Gln Pro Wing Be Gly Wing Val Val 145 150 155 160 Thr Read His Gly Arg Phe Glu Ile Leu Be Leu Wing Gly Ser Phe Leu 165 170 175 Pro Pro er Gly Leu Thr Ile Tyr Leu Wing 180 185 190 Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Wing Leu Ile 195 200 205 Wing Ser Gly Pro Val Val Ile Met Wing Wing Be Phe Ser Asn Wing Wing 210 215 220 Tyr Glu Arg Leu Pro Leu Glu Asp Glu Asp Pro Be Leu Wing Met Gln 225 230 235 240 Gly Gly Be Met Gly Pro Pro Gly Gly Gly Gly Gly Gly 245 250 255 Val Gly Gln Gln Gln Gln Gln Leu Leu Gly Asp Wing Thr Wing Wing 260 265 270 Leu Phe His Gly Leu Pro Pro Asn Leu Leu Asn Ser Val Gln Met Pro 275 280 285

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 906 Asn Ser Asp Asn Phe Trp Pro Ser Gly Arg Ser Pro Tyr60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 906 Asn Be Asp Asn Phe Trp Pro Be Gly Arg Be Pro Tyr

290 295 300290 295 300

<210> 158 <211> 1020 <212> DNA<210> 158 <211> 1020 <212> DNA

<213> Arabidopsis thaliana <400> 158<213> Arabidopsis thaliana <400> 158

atggatccag ttcaatctca tggatcacaa agctctcttc gatttccaat tacatcttca acaacaacaa caacatcaac caacaacagt tctttctcca ccatcatcag caaccacaaa gagcagcaag gagggtcaat attgaataga tctatcaaga gataacatgg acaacatcgc taataccaac agcggtagcg cacggaggag aaggaggaag cggtggtgga ggaagtggag agaggaagac cagcaggatc caagaacaaa cctaaagctc agcgcaaacg cgcttcgaac tcacgtcatg gagataggag tgtatggcta cgttcgctag acgccgccaa agaggcgttt agcgttacta acgtcactat acgtcagcct ggatcgccac cacggccggt ttgaaatcct ctctctttcg ggatctttct gcagccaccg gactaagcgt ttacctagcc ggaggacaag gtggtgggac ctttgttgtg ttcgggtcct gtggtggtta gcggcgtacg aaaggctgcc tttggaagaa gatgagatgc ggtggaggag gaggaggtgg tggtggaatg ggatctcccc gctatggcag ctatggcggc ggctcaagga ctaccaccga ttgccaccgc cacaacagaa tgatcagcag tattggtcta <210> 159 <211> 339 <212 > PRTatggatccag ttcaatctca tggatcacaa agctctcttc gatttccaat tacatcttca acaacaacaa caacatcaac caacaacagt tctttctcca ccatcatcag caaccacaaa gagcagcaag gagggtcaat attgaataga tctatcaaga gataacatgg acaacatcgc taataccaac agcggtagcg cacggaggag aaggaggaag cggtggtgga ggaagtggag agaggaagac cagcaggatc caagaacaaa cctaaagctc agcgcaaacg cgcttcgaac tcacgtcatg gagataggag tgtatggcta cgttcgctag acgccgccaa agaggcgttt agcgttacta acgtcactat acgtcagcct ggatcgccac cacggccggt ttgaaatcct ctctctttcg ggatctttct gcagccaccg gactaagcgt ttacctagcc ggaggacaag gtggtgggac ctttgttgtg ttcgggtcct gtggtggtta gcggcgtacg aaaggctgcc tttggaagaa gatgagatgc ggtggaggag gaggaggtgg tggtggaatg ggatctcccc gctatggcag ctatggcggc ggctcaagga ctaccaccga ttgccaccgc cacaacagaa tgatcagcag tattggtcta <210> 159 <211> 339 <212> PRT

<213> Arabidopsis thaliana <400> 159<213> Arabidopsis thaliana <400> 159

Met Asp Pro Val Gln Ser His Gly Ser Gln Ser 15 10Met Asp Pro Val Gln Ser His Gly Ser Gln Ser 15 10

Phe His Ala Arg Asp Phe Gln Leu His Leu GlnPhe His Wing Arg Asp Phe Gln Read His Leu Gln

20 2520 25

Gln Gln Gln His Gln Gln Gln Gln Gln Gln GlnGln Gln Gln His Gln Gln Gln Gln Gln Gln Gln Gln

35 4035 40

His Gln Gln Pro Gln Arg Asn Leu Asp Gln Asp HisHis Gln Gln Pro Gln Arg Asn Read Asp Gln Asp His

50 55 6050 55 60

Gly Ser Ile Leu Asn Arg Ser Ile Lys Met Asp Arg 65 70 75Gly Ser Ile Read Asn Arg Be Ile Lys Met Asp Arg 65 70 75

Asp Asn Met Asp Asn Ile Ala Asn Thr Asn SerAsp Asn Met Asp Asn Ile Wing Asn Thr Asn Ser

85 9085 90

Glu Met Ser Leu His Gly Gly Glu Gly Gly SerGlu Met Ser Read His Gly Gly Glu Met Gly Ser

ctcctccttt ccatgctaga aacaacatca acaacaacaactcctccttt ccatgctaga aacaacatca acaacaacaa

gaaaccttga tggatcgcga aaggtaaaga aacagatgac caataatcat acggatgtga gcgttatgag ctggctcggt tgcctccgcc ggcaggtcgt tggcggcttc agacgccagt cgatgatggg atcttcttgg cgggtcggccgaaaccttga tggatcgcga aaggtaaaga aacagatgac caataatcat acggatgtga gcgttatgag ctggctcggt tgcctccgcc ggcaggtcgt tggcggcttc agacgccagt cgatgatgggg cgggggg

tcaagatcac agagacaagc gatgagttta aagaaggcca aacaagagac catagttgac cggtacagga ggttagcctt tgcgccgcct tggaggtagt ttttagcaat tcaaggaggc acagcaacaa ttcggttcag accgtattgatcaagatcac agagacaagc gatgagttta aagaaggcca aacaagagac catagttgac cggtacagga ggttagcctt tgcgccgcct tggaggtagt tcaaggaggc acagcaacaa ttcggttcag accgtattga

Ser Leu ProBe Leu Pro

Gln Gln Gln 30Gln Gln Gln 30

Phe Phe Leu 45Phe Phe Leu 45

Glu GlnGlu Gln

Gly GlyGly Gly

Gly Glu Gln Met Thr Arg Arg Pro Arg Gly Arg ProGly Glu Met Gln Arg Thr Arg Pro Arg Gly Arg Pro

100100

105105

115115

120120

Asn Lys Pro Lys Ala Pro Ile Ile Ile Thr ArgAsn Lys Pro Lys Pro Wing Ile Ile Ile Thr Arg

130130

135135

Leu Arg Thr His Val Met Glu Ile Gly Asp GlyRead Arg Thr His Val Met Glu Ile Gly Asp Gly

Asp 140 CysAsp 140 Cys

145145

150150

155155

Cys Met Ala Thr Phe Ala Arg Arg Arg Gln Arg GlyCys Met Wing Thr Phe Wing Arg Arg Arg Gln Arg Gly

165 170165 170

Ser Gly Thr Gly Ser Val Thr Asn Val Thr Ile ArgBe Gly Thr Gly Be Val Thr Asn Val Thr Ile Arg

180 185180 185

Pro Pro Gly Ser Val Val Ser Leu His Gly Arg PhePro Pro Gly Be Val Val Be Read His Gly Arg Phe

195195

200200

Leu Ser Gly Ser Phe Leu Pro Pro Pro Ala ProLeu Ser Gly Ser Phe Leu Pro Pro Pro Wing Pro

210210

215215

Leu Ser Val Tyr Leu Ala Gly Gly Gln Gly GlnRead Ser Val Tyr Read Wing Gly Gly Gln Gly Gln

Pro 220 ValPro 220 Val

225225

230230

235235

Val Val Gly Pro Leu Leu Cys Ser Gly Pro Val ValVal Val Gly Pro Read Leu Cys Ser Gly Pro Val Val

245 250245 250

Ser Phe Ser Asn Ala Ala Tyr Glu Arg Leu Pro LeuSer Phe Ser Asn Wing Wing Tyr Glu Arg Leu Pro Leu

260260

265265

Glu GluGlu Glu

Ser GluBe glu

Gly Gly 110 Ala Gly 125Gly Gly 110 Wing Gly 125

Ser AlaTo be a wing

Asp IleAsp Ile

Val CysVal cys

Gln Pro 190 Glu Ile 205Gln Pro 190 Glu Ile 205

Ala AlaWing wing

Val GlyVal gly

Val MetVal met

Glu Glu 270Glu Glu 270

Pro Pro 15Pro Pro 15

Gln HisGln his

His HisHis his

Gln GlyGln gly

Thr Ser 80 Gly Lys 95Thr Ser 80 Gly Lys 95

Gly SerGly ser

Ser LysTo be lys

Asn AlaAsn wing

Val Asp 160 Val Met 175Val Asp 160 Val Met 175

Gly SerGly ser

Leu SerRead Ser

Thr GlyThr gly

Gly Ser 240 Ala Ala 255Gly Ser 240 Wing 255 Wing

Asp GluAsp Glu

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 Met Gln Thr 275 Pro Val Gln Gly Gly 280 Gly Gly Gly Gly Gly 285 Gly Gly Gly Gly Met 290 Gly Ser Pro Pro Met 295 Met Gly Gln Gln Gln 300 Ala Met Ala Ala Met Ala Ala Ala Gln Gly Leu Pro Pro Asn Leu Leu Gly Ser Val Gln 305 310 315 320 Leu Pro Pro Pro Gln 325 Gln Asn Asp Gln Gln 330 Tyr Trp Ser Thr Gly 335 Arg Pro Pro Tyr60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 Met Gln Thr 275 Pro Val Gln Gly Gly 280 Gly Gly Gly Gly 285 Gly Gly Gly Met 290 290 Gly Ser Pro Pro 295 Met Gly Gln Gln Gln 300 Wing Met Wing Wing Met Wing Wing Wing Wing Gln Gly Leu Pro Pro Asn Leu Leu Gly Ser Val Gln 305 310 315 320 Leu Pro Pro Gln 325 Gln Asn Asp Gln Gln 330 Tyr Trp Be Thr Gly 335 Arg Pro Pro Tyr

<210> 160 <211> 975 <212> DNA<210> 160 <211> 975 <212> DNA

<213> Arabidopsis thaliana <400> 160<213> Arabidopsis thaliana <400> 160

atggatccag tacaatctca tggatcacaa agctctctac gactttcaat tacatcttca acaacagcaa caagagttct caaagaaacc aaaccgatgg tgaccaacaa ggaggatcag atggatcgtg aagagacaag cgacaacata gacaacatag ggtaaagaca tagatataca cggtggttca ggagaaggag catcagatga caagaagacc aagaggaaga ccagcgggat ccgattatca tcacacggga cagcgcaaac gcgcttagaa gatggctgcg acttagtcga aagcgttgcc acttttgcac tgcgttatga gcggtactgg aaatgttact aacgtcacta ccttctcctg gctcggtagt tagtcttcac ggaaggttcg tcttttctcc ctcctccggc tcctcctaca gccaccggat ggácaaggac aggtggttgg aggaagcgta gttggtccgt gttgtcatgg ctgcgtcttt tagcaatgcg gcgtacgaaa gagatgcaga cgccggttca tggcggagga ggaggaggat atgggacaac aactgcaaca tcagcaacaa gctatgtcag aatcttcttg gttcggttca gttgcagcag caacatgatc cgaccaccgt attga <210> 161 <211> 324 <212> PRTatggatccag tacaatctca tggatcacaa agctctctac gactttcaat tacatcttca acaacagcaa caagagttct caaagaaacc aaaccgatgg tgaccaacaa ggaggatcag atggatcgtg aagagacaag cgacaacata gacaacatag ggtaaagaca tagatataca cggtggttca ggagaaggag catcagatga caagaagacc aagaggaaga ccagcgggat ccgattatca tcacacggga cagcgcaaac gcgcttagaa gatggctgcg acttagtcga aagcgttgcc acttttgcac tgcgttatga gcggtactgg aaatgttact aacgtcacta ccttctcctg gctcggtagt tagtcttcac ggaaggttcg tcttttctcc ctcctccggc tcctcctaca gccaccggat ggácaaggac aggtggttgg aggaagcgta gttggtccgt gttgtcatgg ctgcgtcttt Tagcaatgcg gcgtacgaaa gagatgcaga cgccggttca

<213> Arabidopsis thaliana <4 00> 161<213> Arabidopsis thaliana <4 00> 161

Met Asp Pro Val Gln Ser His Gly Ser Gln Ser 15 10Met Asp Pro Val Gln Ser His Gly Ser Gln Ser 15 10

Phe His Ala Arg Asp Phe Gln Leu His Leu GlnPhe His Wing Arg Asp Phe Gln Read His Leu Gln

20 2520 25

Phe Phe Leu His His His Gln Gln Gln Arg AsnPhe Phe Read His His His Gln Gln Gln Arg Asn

35 4035 40

Gln Gln Gly Gly Ser Gly Gly Asn Arg Gln IleGln Gln Gly Gly Be Gly Gly Asn Arg Gln Ile

50 5550 55

Glu Thr Ser Asp Asn Ile Asp Asn Ile Ala Asn 65 70 75Glu Thr Be Asp Asn Ile Asp Asn Ile Wing Asn 65 70 75

Gly Lys Asp Ile Asp Ile His Gly Gly Ser GlyGly Lys Asp Ile Asp Ile His Gly Gly Ser Gly

85 9085 90

Ser Gly Gly Asp His Gln Met Thr Arg Arg ProBe Gly Gly Asp His Gln Met Thr Arg Arg Pro

100 105100 105

Gly Ser Lys Asn Lys Pro Lys Pro Pro Ile IleGly Ser Lys Asn Lys Pro Lys Pro Ile Ile

115 120115 120

Ala Asn Ala Leu Arg Thr His Val Met Glu IleWing Asn Wing Read Arg Thr His Val Met Glu Ile

ctcctccttt tcctccacca gaggaaaccg ctaacaacag gtggtggctc ccaagaacaa cccacgtgat gaagacgcca tacgtcagcc agattctatc tgagtgttta tgttatgtgc ggttgccttt cattggagtc gtcatcaagg agtcttattgctcctccttt tcctccacca gaggaaaccg ctaacaacag gtggtggctc ccaagaacaa cccacgtgat gaagacgcca tacgtcagcc agattctatc tgagtgttta tgttatgtgc ggttgccttt cattggagtg gtcat

ccacgcaaga tcaccagcaa acaaatcaag cggtagtgaa cggaggagat accaaaacca ggagatcgga acgcggcgtt tggatctcat tctctcagga cctcgctgga tggtcctgtc agaggaagat gccgccaatg gttaccacct gtcaacgggaccacgcaaga tcaccagcaa acaaatcaag cggtagtgaa cggaggagat accaaaacca ggagatcgga acgcggcgtt tggatctcat tctctcagga cctcgctgga tggtcctgtc agaggaagat gccgccagg

130130

135135

Leu Val Glu Ser Val Ala Thr Phe Ala Arg Arg 145 150 155Leu Val Glu Ser Val Wing Thr Phe Wing Arg Arg 145 150 155

Cys Val Met Ser Gly Thr Gly Asn Val Thr AsnCys Val Met Being Gly Thr Gly Asn Val Thr Asn

165 170165 170

Pro Gly Ser His Pro Ser Pro Gly Ser Val ValPro Gly Be His Pro Be Pro Gly Be Val Val

180 185180 185

Phe Glu Ile Leu Ser Leu Ser Gly Ser Phe Leu 195 200Phe Glu Ile Leu To Be Leu To Be Gly To Be Phe Leu 195 200

Ser LeuTo be read

Gln GlnGln Gln

Gln ThrGln thr

45 Lys Met 6045 Lys Met 60

Asn SerAsn ser

Glu GlyGlu Gly

Arg GlyArg Gly

Ile Thr 125 Gly Asp 140Ile Thr 125 Gly Asp 140

Arg GlnArg Gln

Val ThrVal thr

Ser LeuTo be read

Pro Pro 205Pro Pro 205

Pro Pro Pro 15 Gln Gln Glu 30 Asp Gly Asp Asp Arg Glu Gly Ser Glu 80 Gly Gly Gly 95 Arg Pro Ala 110 Arg Asp Ser Gly Cys Asp Arg Gly Val 160 Ile Arg Gln 175 His Gly Arg 190 Pro Ala ProPro Pro Pro 15 Gln Gln Glu 30 Asp Gly Asp Asp Arg Glu Gly Be Glu 80 Gly Gly Gly 95 Arg Pro Wing 110 Arg Asp Be Gly Cys Asp Arg Gly Val 160 Ile Arg Gln 175 His Gly Arg 190 Pro Ala Pro

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 975 Pro Thr Ala Thr Gly Leu Ser Val Tyr Leu Ala Gly Gly Gln Gly Gln 210 215 220 Val Val Gly Gly Ser Val Val Gly Pro Leu Leu Cys Ala Gly Pro Val 225 230 235 240 Val Val Met Ala Ala Ser Phe Ser Asn Ala Ala Tyr Glu Arg Leu Pro 245 250 255 Leu Glu Glu Asp Glu Met Gln Thr Pro Val His Gly Gly Gly Gly Gly 260 265 270 Gly Ser Leu Glu Ser Pro Pro Met Met Gly Gln Gln Leu Gln His Gln 275 280 285 Gln Gln Ala Met Ser Gly His Gln Gly Leu Pro Pro Asn Leu Leu Gly 290 295 300 Ser Val Gln Leu Gln Gln Gln His Asp Gln Ser Tyr Trp Ser Thr Gly 305 310 315 32060 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 975 Pro Thr Wing Thr Gly Leu Ser Val Tyr Leu Wing Gly Gly Gln 210 215 220 Val Val Gly Gly Ser Val Val Gly Pro Leu Cys Wing Gly Pro Val 225 230 235 240 Val Val Val Wing Ala Ser Phe Ser Asn Wing Ala Tyr Glu Arg Leu Pro 245 250 255 Leu Glu Glu Asp Glu Met Gln Thr Pro Val His Gly Gly Gly Gly Gly 260 265 270 Gly Ser Leu Glu Ser Pro Pro Met Met Gly Gln Gln Leu Gln His Gln 275 280 285 Gln Gln Gln Wing Met Ser Gly His Gln Gly Leu Pro Pro Asn Leu Leu Gly 290 295 300 Ser Val Gln Leu Gln Gln His Asp Gln Ser Tyr Trp Ser Thr Gly 305 310 315 320

Arg Pro Prο TyrArg Pro Prο Tyr

<210> 162 <211> 954 <212> DNA<210> 162 <211> 954 <212> DNA

<213> Arabidopsis thaliana <4 00> 162<213> Arabidopsis thaliana <4 00> 162

atggatcagg tctctcgctc ccacaccatc aattccagca gaccagcacc gaatcggtgg cactcttcag ccggaaaaga ggaggaggag ataatcacat aaaccaaaac cgccaatcat atggaagtag caaacggatg caacgtggca tctgcgtttt ccagcttcag tacctggtgg ctttctctct cgggatcatt atttacttag ccggtggtca gcttcaggac ctgtagtgat ccgttggagg aagacgatca ggaaacgcaa caatgggtgg caacagttga tgcaagatcc tctgttcaat tgccagctga <210> 163 <211> 317 <212> PRTatggatcagg tctctcgctc ccacaccatc aattccagca gaccagcacc gaatcggtgg cactcttcag ccggaaaaga ggaggaggag ataatcacat aaaccaaaac cgccaatcat atggaagtag caaacggatg caacgtggca tctgcgtttt ccagcttcag tacctggtgg ctttctctct cgggatcatt atttacttag ccggtggtca gcttcaggac ctgtagtgat ccgttggagg aagacgatca ggaaacgcaa caatgggtgg caacagttga tgcaagatcc tctgttcaat tgccagctga <210> 163 <211> 317 <212> PRT

<213> Arabidopsis thaliana <4 00> 163 Met Asp Gln Val Ser Arg Ser Leu Pro Pro Pro Phe Leu Ser Arg Asp 1 5 10 15 Leu His Leu His 20 Pro His His Gln Phe 25 Gln His Gln Gln Gln 30 Gln Gln Gln Gln Asn 35 His Gly His Asp Ile 40 Asp Gln His Arg Ile 45 Gly Gly Leu Lys Arg 50 Asp Arg Asp Ala Asp 55 Ile Asp Pro Asn Glu 60 His Ser Ser Ala Gly Lys Asp Gln Ser Thr Pro Gly Ser Gly Gly Glu Ser Gly Gly Gly 65 70 75 80 Gly Gly Gly Asp Asn 85 His Ile Thr Arg Arg 90 Pro Arg Gly Arg Pro 95 Ala Gly Ser Lys Asn 100 Lys Pro Lys Pro Pro 105 Ile Ile Ile Thr Arg 110 Asp Ser Ala Asn Ala Leu Lys Ser His Val Met Glu Val Ala Asn Gly Cys Asp<213> Arabidopsis thaliana <4 00> 163 Met Asp Gln Val Ser Arg Be Leu Pro Pro Phe Leu Be Arg Asp 1 5 10 15 Leu His Leu His 20 Pro His His Gln Phe 25 Gln His Gln Gln 30 Gln Gln Gln Gln Asn 35 His Gly His Asp Ile 40 Asp Gln His Arg Ile 45 Gly Gly Leu Lys Arg 50 Asp Arg Asp Wing Asp 55 Ile Asp Pro Asn Glu 60 His Ser Be Wing Gly Lys Asp Gln Ser Thr Gly Gly Gly 65 70 75 80 Gly Gly Gly Asp Asn 85 His Ile Thr Arg Arg 90 Pro Arg Gly Arg Pro 95 Wing Gly Ser Lys Asn 100 Lys Pro Pro 105 Ile Ile Ile Thr Arg 110 Asp Be Wing Asn Wing Leu Lys Being His Val Met Glu Val Wing Asn Gly Cys Asp

115 120 125115 120 125

Val Met Glu Ser Val Thr Val Phe Ala Arg Arg Arg Gln Arg Gly IleVal Met Glu Ser Val Thr Val Phe Wing Arg Arg Arg Gln Arg Gly Ile

130 135 140130 135 140

Cys Val Leu Ser Gly Asn Gly Ala Val Thr Asn Val Thr Ile Arg Gln 145 150 155 160Cys Val Leu Ser Gly Asn Gly Wing Val Thr Asn Val Thr Ile Arg Gln 145 150 155 160

Pro Ala Ser Val Pro Gly Gly Gly Ser Ser Val Val Asn Leu His GlyPro Wing Being Val Pro Gly Gly Gly Being Val Val Asn Read His Gly

tcttcctcca tcagcagcag gctaaaacgt tcaaagtact cacgagaagg catcactcga tgacgtcatg gagcggaaac tggctcatct ccttcctcct gggacaggtt tatggcagct agaagagcaa tggaacgcaa gacgtcgttt agcttattggtcttcctcca tcagcagcag gctaaaacgt tcaaagtact cacgagaagg catcactcga tgacgtcatg gagcggaaac tggctcatct ccttcctcct gggacaggtt tatggcagct agaagagcaa tggaacgcagggggggggtgg

ccttttctct cagcagcaac gaccgagatg cctggctccg ccacgtggca gacagcgcaa gaaagtgtca ggcgccgtta gtcgttaact ccggctccac gttggaggaa tcgtttggaa acagctggag acgcaaactc atacaagggt ggaactccgaccttttctct cagcagcaac gaccgagatg cctggctccg ccacgtggca gacagcgcaa gaaagtgtca ggcgccgtta gtcgttaact ccggctccac gttggaggaa tcgtttggaa acagcgaggag acgga

caagagatct agaatcacgg ctgatatcga gtggagaaag gaccagcggg acgctctcaa ccgtcttcgc ccaacgttac tacacggacg cagctgcgtc gcgtggttgg acgctgcgta cggttgctaa agacgcagca tgcctccgaa gaccatctttcaagagatct agaatcacgg ctgatatcga gtggagaaag gaccagcggg acgctctcaa ccgtcttcgc ccaacgttac tacacggacg cagctgcgtc gcgtggttgg acgctgcgta cggttgccca tga

ccatcttcac ccacgatata tcccaacgag cggcggcgga atctaagaac atctcatgtc tcgccgtcgc cataagacaa tttcgagatt aggtctaacg tccactcatg tgagagactg taatatcgat gcaacagcaa tcttatgaat ctaaccatcttcac ccacgatata tcccaacgag cggcggcgga atctaagaac atctcatgtc tcgccgtcgc cataagacaa tttcgagatt aggtctaacg tccactcatg tgagagactg taatatcgat gcaacagcaa tcttatgaat cta

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 954 165 170 175 Arg Phe Glu Ile 180 Leu Ser Leu Ser Gly 185 Ser Phe Leu Pro Pro 190 Pro Ala Pro Pro Ala 195 Ala Ser Gly Leu Thr 200 Ile Tyr Leu Ala Gly 205 Gly Gln Gly Gln Val 210 Val Gly Gly Ser Val 215 Val Gly Pro Leu Met 220 Ala Ser Gly Pro Val Val Ile Met Ala Ala Ser Phe Gly Asn Ala Ala Tyr Glu Arg Leu 225 230 235 240 Pro Leu Glu Glu Asp 245 Asp Gln Glu Glu Gln 250 Thr Ala Gly Ala Val 255 Ala Asn Asn Ile Asp 260 Gly Asn Ala Thr Met 265 Gly Gly Gly Thr Gln 270 Thr Gln Thr Gln Thr 275 Gln Gln Gln Gln Gln 280 Gln Gln Leu Met Gln 285 Asp Pro Thr Ser Phe 290 Ile Gln Gly Leu Pro 295 Pro Asn Leu Met Asn 300 Ser Val Gln Leu Pro Ala Glu Ala Tyr Trp Gly Thr Pro Arg Pro Ser Phe 305 310 315 <210> 1( 5460 120 180 240 300 360 420 480 540 600 660 720 780 840 900 954 165 170 175 Arg Phe Glu Ile 180 Read Be Read Gly 185 Be Phe Read Pro Pro 190 Pro Wing Pro 195 Wing Be Gly Leu Thr 200 Ile Tyr Leu Wing Gly 205 Gly Gln Gly Gln Val 210 Val Gly Gly Ser Val 215 Val Gly Pro Leu Met 220 Wing Ser Gly Pro Val Val Ile Met Wing Wing Ser Phe Gly Asn Wing Tyr Glu Arg Leu 225 230 235 240 Pro Leu Glu Glu Asp 245 Asp Gln Glu Glu Gln 250 Thr Wing Gly Wing Val 255 Wing Wing Asn Asn Ile Asp 260 Gly Wing Asn Wing Thr Met 265 Gly Gly Finger Gln 270 Thr Gln Thr Finger 275 Gln Gln Finger Gln 280 Gln Finger Leu Asp Pro Thr Be Phe 290 Ile Gln Gly Leu Pro 295 Pro Asn Leu Met Met Asn 300 Ser Val Gln Leu Pro Wing Glu Wing Tyr Trp Gly Thr Pro Arg Pro Be Phe 305 310 315 <210> 1 (54

<211> 798 <212> DNA<211> 798 <212> DNA

<213> Arabidopsis thaliana <400> 164<213> Arabidopsis thaliana <400> 164

atggatgagg tatctcgttc tcatacaccg caatttctat caagtgatca tcagcactat 60atggatgagg tatctcgttc tcatacaccg caatttctat caagtgatca tcagcactat 60

caccatcaaa acgctggacg acaaaaacgc ggcagagaag aagaaggagt tgaacccaac 120 aatatagggg aagacctagc cacctttcct tccggagaag agaatatcaa gaagagaagg 180 ccacgtggca gacctgctgg ttccaagaac aaacccaaag caccaatcat agtcactcgc 240 gactccgcga acgccttcag atgtcacgtc atggagataa ccaacgcctg cgatgtaatg 300 gaaagcctag ccgtcttcgc tagacgccgt cagcgtggcg tttgcgtctt gaccggaaac 360 ggggccgtta caaacgtcac cgttagacaa cctggcggag gcgtcgtcag tttacacgga 420 cggtttgaga ttctttctct ctcgggttcg tttcttcctc caccggcacc accagctgcg 480 tctggtttaa aggtttactt agccggtggt caaggtcaag tgatcggagg cagtgtggtg 540 ggaccgctta cggcatcaag tccggtggtc gttatggcag cttcatttgg aaacgcatct 600 tacgagaggc tgccactaga ggaggaggag gaaactgaaa gagaaataga tggaaacgcg 660 gctagggcga ttggaacgca aacgcagaaa cagttaatgc aagatgcgac atcgtttatt 720 gggtcgccgt cgaatttaat taactctgtt tcgttgccag gtgaagctta ttggggaacg 780 caacgaccgt ctttctaa 798caccatcaaa acgctggacg acaaaaacgc ggcagagaag aagaaggagt tgaacccaac 120 aatatagggg aagacctagc cacctttcct tccggagaag agaatatcaa gaagagaagg 180 ccacgtggca gacctgctgg ttccaagaac aaacccaaag caccaatcat agtcactcgc 240 gactccgcga acgccttcag atgtcacgtc atggagataa ccaacgcctg cgatgtaatg 300 gaaagcctag ccgtcttcgc tagacgccgt cagcgtggcg tttgcgtctt gaccggaaac 360 ggggccgtta caaacgtcac cgttagacaa cctggcggag gcgtcgtcag tttacacgga 420 cggtttgaga ttctttctct ctcgggttcg tttcttcctc caccggcacc accagctgcg 480 tctggtttaa aggtttactt agccggtggt caaggtcaag tgatcggagg cagtgtggtg 540 ggaccgctta cggcatcaag tccggtggtc gttatggcag cttcatttgg aaacgcatct 600 tacgagaggc tgccactaga ggaggaggag gaaactgaaa gagaaataga tggaaacgcg 660 gctagggcga ttggaacgca aacgcagaaa cagttaatgc aagatgcgac atcgtttatt 720 gggtcgccgt cgaatttaat taactctgtt tcgttgccag gtgaagctta ttggggaacg 780 798 caacgaccgt ctttctaa

<210> 165 <211> 265 <212> PRT<210> 165 <211> 265 <212> PRT

<213> Arabidopsis thaliana<213> Arabidopsis thaliana

<400> 165 Met Asp Glu Val Ser Arg Ser His Thr Pro Gln Phe Leu Ser Ser Asp 1 5 10 15 His Gln His Tyr His His Gln Asn Ala Gly Arg Gln Lys Arg Gly Arg 20 25 30 Glu Glu Glu Gly Val Glu Pro Asn Asn Ile Gly Glu Asp Leu Ala Thr 35 40 45 Phe Pro Ser Gly Glu Glu Asn Ile Lys Lys Arg Arg Pro Arg Gly Arg 50 55 60 Pro Ala Gly Ser Lys Asn Lys Pro Lys Ala Pro Ile Ile Val Thr Arg 65 70 75 80 Asp Ser Ala Asn Ala Phe Arg Cys His Val Met Glu Ile Thr Asn Ala 85 90 95 Cys Asp Val Met Glu Ser Leu Ala Val Phe Ala Arg Arg Arg Gln Arg 100 105 110 Gly Val Cys Val Leu Thr Gly Asn Gly Ala Val Thr Asn Val Thr Val 115 120 125 Arg Gln Pro Gly Gly Gly Val Val Ser Leu His Gly Arg Phe Glu Ile 130 135 140 Leu Ser Leu Ser Gly Ser Phe Leu Pro Pro Pro Ala Pro Pro Ala Ala 145 150 155 160 Ser Gly Leu Lys Val Tyr Leu Ala Gly Gly Gln<400> 165 Met Asp Glu Val Be Arg Be His Thr Pro Gln Phe Read Be Be Asp 1 5 10 15 His Gln His Tyr His His Gln Asn Wing Gly Arg Gln Lys Arg Gly Arg 20 25 30 Glu Glu Glu Gly Val Glu Pro Asn Asn Ile Gly Glu Asp Leu Wing Thr 35 40 45 Phe Pro Be Gly Glu Glu Asn Ile Lys Lys Arg Arg Arg Gly Arg 50 55 60 Pro Wing Gly Be Lys Asn Lys Pro Lys Ala Pro Ile Val Thr Arg 65 70 75 80 Asp Ser Wing Asn Wing Phe Arg Cys His Val Met Glu Ile Thr Asn Wing 85 90 95 Cys Asp Val Met Glu Being Read Ala Val Phe Wing Arg Arg Arg Gln Arg 100 105 110 Gly Val Cys Val Leu Thr Gly Asn Gly Val Val Thr Asn Val Thr Val 115 120 125 Arg Gln Pro Gly Gly Gly Val Val Be Read His Gly Arg Phe Glu Ile 130 135 140 Leu Be Leu Be Gly Be Phe Leu Pro Pro Wing Pro Pro Wing 145 150 155 160 Ser Gly Leu Lys Val Tyr Leu Wing Gly Gly Gln

165 170165 170

Gly Ser Val Val Gly Pro Leu Thr Ala Ser SerGly Ser Val Val Gly Pro Read Thr Wing Be Ser

180 185180 185

Ala Ala Ser Phe Gly Asn Ala Ser Tyr Glu ArgWing Wing Be Phe Gly Asn Wing Wing Be Tyr Glu Arg

195195

200200

Glu Glu Glu Thr Glu Arg Glu Ile Asp Gly AsnGlu Glu Glu Thr Glu Arg Glu Ile Asp Gly Asn

210210

215215

Gly Thr Gln Thr Gln Lys Gln Leu Met Gln AspGly Thr Gln Thr Gln Lys Gln Read Met Gln Asp

Gly GlnGly Gln

Pro ValPro val

Leu Pro 205 Ala Ala 220Leu Pro 205 Wing 220 Wing

Ala ThrThr wing

225225

230230

235235

Gly Ser Pro Ser Asn Leu Ile Asn Ser Val Ser Leu ProGly Ser Pro Ser Asn Leu Ile Asn Ser Val Ser Leu Pro

245245

250250

Val Ile GlyVal Ile Gly

175 Val Val Met 190175 Val Val Met 190

Leu Glu GluRead Glu Glu

Arg Ala IleArg Wing Ile

Ser Phe Ile 240Ser Phe Ile 240

Gly Glu Ala 255Gly Glu Wing 255

Tyr Trp Gly Thr Gln Arg Pro Ser Phe 260 265Tyr Trp Gly Thr Gln Arg Pro Ser Phe 260 265

<210> 166<210> 166

<211> 933<211> 933

<212> DNA<212> DNA

<213> Arabidopsis thaliana<213> Arabidopsis thaliana

<400> 166<400> 166

atggcgaatc cttggtgggt agggaatgtt gcgatcggtg tcatcagctc cttctttgca ccacagaaac agtaacaaca cgttcggatc caagattgga ccatgacttc accaccaaca cagactcaga gccaagaaga acagaacagc agagacgagc tccggatccg ggtctacggg tcgtcgtcct agaggtagac ccaaagagtc cagttgttgt taccaaagaa agccctaact gagattgcta cgggagctga cgtggcggaa agcttaaacg cggggcgttt cggtgctgag cggtagtggt ttggttacta gctgcatccg gtggagttgt tagtttacgt ggtcagtttg gcttttcttc ctacgtctgg ctctcctgct gcagccgctg ggagctcaag gtcaagttgt gggaggtgga gttgctggcc gttattgtga tagctgctac gttttgcaat gccacttatg gaacaacagc aagagcagcc gcttcaacta gaagatggga gatgataacg agagtgggaa taacggaaac gaaggatcga atgcctccta attttatccc aaatggtcat caaatggctc ggtcctccgc ctcgtgctcc tccttcgtat tgaatggcgaatc cttggtgggt agggaatgtt gcgatcggtg tcatcagctc cttctttgca ccacagaaac agtaacaaca cgttcggatc caagattgga ccatgacttc accaccaaca cagactcaga gccaagaaga acagaacagc agagacgagc tccggatccg ggtctacggg tcgtcgtcct agaggtagac ccaaagagtc cagttgttgt taccaaagaa agccctaact gagattgcta cgggagctga cgtggcggaa agcttaaacg cggggcgttt cggtgctgag cggtagtggt ttggttacta gctgcatccg gtggagttgt tagtttacgt ggtcagtttg gcttttcttc ctacgtctgg ctctcctgct gcagccgctg ggagctcaag gtcaagttgt gggaggtgga gttgctggcc gttattgtga tagctgctac gttttgcaat gccacttatg gaacaacagc aagagcagcc gcttcaacta gaagatggga gatgataacg agagtgggaa taacggaaac gaaggatcga atgcctccta attttatccc aaatggtcat caaatggctc ggtcctccgc ctcgtgctcc tccttcgtat tga

<210> 167<210> 167

<211> 310<211> 310

<212> PRT<212> PRT

<213> Arabidopsis thaliana<213> Arabidopsis thaliana

<400> 167<400> 167

Met Ala Asn Pro Trp Trp Val Gly Asn Val AlaMet Asn Pro Wing Trp Trp Val Gly Asn Val Wing

gagttgagag acaacccacc acagtggaag aaccagctgt ctcctggttc ctctccagag cctttgctcg atgttactct agatcttgtc gtttaaccat cgcttattgc agaggttacc agaagcagaa tgcagccgcc aacacgacgtgagttgagag acaacccacc acagtggaag aaccagctgt ctcctggttc ctctccagag cctttgctcg atgttactct agatcttgtc gtttaaccat cgcttattgc agaggttacc agaagcagaa tgcagccgcctac

tccagtgacg gactatgact ccctaatacc tgaacccgga caagaacaaa ccatgttctt tagacgcggc gcgtcagcct tatgtgtggg ttacttagct ctctggaccc gattgaggaa agaagagaat gatgtataat gtattggggttccagtgacg gactatgact ccctaatacc tgaacccgga caagaacaaa ccatgttctt tagacgcggc gcgtcagcct tatgtgtggg ttacttagct ctctggaccc gattgaggaa agaagagaat gatgtataat gtattgggt

Ile GlyIle gly

Ser Pro Val Thr Ser Ser Ala Pro Ser Leu His His ArgBe Pro Val Thr Be Be Pro Wing Be Read His His Arg

1010

Gly Val Glu 15Gly Val Glu 15

Asn Ser AsnAsn Ser Asn

20 25 30 Asn Asn Asn 35 Pro Pro Thr Met Thr 40 Arg Ser Asp Pro Arg 45 Leu Asp His Asp Phe 50 Thr Thr Asn Asn Ser 55 Gly Ser Pro Asn Thr 60 Gln Thr Gln Ser Gln Glu Glu Gln Asn Ser Arg Asp Glu Gln Pro Ala Val Glu Pro Gly 65 70 75 80 Ser Gly Ser Gly Ser 85 Thr Gly Arg Arg Pro 90 Arg Gly Arg Pro Pro 95 Gly Ser Lys Asn Lys 100 Pro Lys Ser Pro Val 105 Val Val Thr Lys Glu 110 Ser Pro Asn Ser Leu 115 Gln Ser His Val Leu 120 Glu Ile Ala Thr Gly 125 Ala Asp Val Ala Glu 130 Ser Leu Asn Ala Phe 135 Ala Arg Arg Arg Gly 140 Arg Gly Val Ser Val Leu Ser Gly Ser Gly Leu Val Thr Asn Val Thr Leu Arg Gln Pro 145 150 155 160 Ala Ala Ser Gly Gly 165 Val Val Ser Leu Arg 170 Gly Gln Phe Glu Ile 175 Leu Ser Met Cys Gly Ala Phe Leu Pro Thr Ser Gly Ser Pro Ala Ala Ala20 25 30 Asn Asn Asn 35 Pro Thr Met Thr 40 Arg Be Asp Pro Arg 45 Read Asp His Asp Phe 50 Thr Thr Asn Asn Ser 55 Gly Be Pro Asn Thr 60 Gln Thr Gln Be Gln Glu Gln Gln Asn Be Arg Asp Glu Gln Pro Wing Val Glu Pro Gly 65 70 75 80 Ser Gly Ser Gly Ser 85 Thr Gly Arg Arg Pro 90 Arg Gly Arg Pro Pro 95 Gly Ser Lys Asn Lys 100 Pro Lys Ser Pro Val 105 Val Val Thr Lys Glu 110 Ser Pro Asn Ser Leu 115 Gln Be His Val Leu 120 Glu Ile Wing Thr Thr Gly 125 Wing Asp Val Wing Glu 130 Ser Read Asn Wing Phe 135 Wing Arg Arg Arg Gly 140 Arg Gly Val Ser Val Leu Ser Gly Ser Gly Leu Val Thr Asn Val Thr Leu Arg Gln Pro 145 150 155 160 Wing Wing Be Gly Gly 165 Val Val Be Leu Arg 170 Gly Gln Phe Glu Ile 175 Leu Be Met Cys Gly Wing Phe Leu Pro Thr Be Gly Ser Pro Wing Wing

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 933 180 185 19060 120 180 240 300 360 420 480 540 600 660 720 780 840 900 933 180 185 190

Ala Gly Leu Thr Ile Tyr Leu Ala Gly Ala Gln Gly Gln Val Val GlyGly Wing Leu Thr Ile Tyr Leu Gly Wing Gln Gly Wing Gln Val Val Gly

195 200 205 Gly Gly 210 Val Ala Gly Pro Leu 215 Ile Ala Ser Gly Pro 220 Val Ile Val Ile Ala Ala Thr Phe Cys Asn Ala Thr Tyr Glu Arg Leu Pro Ile Glu Glu 225 230 235 240 Glu Gln Gln Gln Glu 245 Gln Pro Leu Gln Leu 250 Glu Asp Gly Lys Lys 255 Gln Lys Glu Glu Asn 260 Asp Asp Asn Glu Ser 265 Gly Asn Asn Gly Asn 270 Glu Gly Ser Met Gln 275 Pro Pro Met Tyr Asn 280 Met Pro Pro Asn Phe 285 Ile Pro Asn Gly His Gln Met Ala Gln His Asp Val Tyr Trp Gly Gly Pro Pro Pro195 200 205 Gly Gly 210 Val Wing Gly Pro Leu 215 Ile Wing Ser Gly Pro 220 Val Ile Val Ile Wing Thr Thr Phe Cys Asn Wing Thr Tyr Glu Arg Leu Pro Ile Glu Glu 225 230 235 240 Glu Gln Gln Gln Glu 245 Gln Pro Leu Gln Leu 250 Glu Asp Gly Lys Lys 255 Gln Lys Glu Glu Asn 260 Asp Asp Asn Glu Ser 265 Gly Asn Gly Asn 270 Glu Gly Ser Met Gln 275 Pro Met Tyr Asn 280 Met Pro Asn Phe 285 His Gln Met Gln Wing His Asp Val Tyr Trp Gly Gly Pro Pro

290 295 300290 295 300

Arg Ala Pro Pro Ser Tyr 305 310Arg Wing Pro Pro Ser Tyr 305 310

<210> 168 <211> 987 <212> DNA <213> Oryza sativa <4 00> 168<210> 168 <211> 987 <212> DNA <213> Oryza sativa <4 00> 168

atggatccgg tgacggcggc ggcggcgcat gggggtgggc accaccacca ccaccacttc 60atggatccgg tgacggcggc ggcggcgcat gggggtgggc accaccacca ccaccacttc 60

ggagcgccac cggtggcggc gttccaccac cacccgttcc accacggcgg cggggcgcac 120ggagcgccac cggtggcggc gttccaccac cacccgttcc accacggcgg cggggcgcac 120

tacccggcgg cgttccagca gtttcaggag gagcagcagc agcttgtggc ggcggcggcg 180tacccggcgg cgttccagca gtttcaggag gagcagcagc agcttgtggc ggcggcggcg 180

gcggctggtg ggatggcgaa gcaggagctg gtggatgaga gcaacaacac catcaacagc 240gcggctggtg ggatggcgaa gcaggagctg gtggatgaga gcaacaacac catcaacagc 240

ggcgggagca acgggagcgg cggggaggag cagaggcagc agtccgggga ggagcagcac 300ggcgggagca acgggagcgg cggggaggag cagaggcagc agtccgggga ggagcagcac 300

cagcaagggg cggcggcgcc ggtggtgatc cggcgtccca ggggccgccc cgccggctcc 360cagcaagggg cggcggcgcc ggtggtgatc cggcgtccca ggggccgccc cgccggctcc 360

aagaacaagc ccaagcctcc ggtcatcatc acgcgcgaca gcgccagcgc gctgcgggcg 420aagaacaagc ccaagcctcc ggtcatcatc acgcgcgaca gcgccagcgc gctgcgggcg 420

cacgtcctcg aggtcgcctc cgggtgcgac ctcgtcgaca gcgtcgccac gttcgcgcgc 480cacgtcctcg aggtcgcctc cgggtgcgac ctcgtcgaca gcgtcgccac gttcgcgcgc 480

cgccgccagg tcggtgtctg cgtgctcagc gccaccggcg ccgtcaccaa cgtctccgtc 540cgccgccagg tcggtgtctg cgtgctcagc gccaccggcg ccgtcaccaa cgtctccgtc 540

cggcagcccg gcgcgggccc cggcgccgtc gtcaacctca ccggccgctt cgacatcctc 600cggcagcccg gcgcgggccc cggcgccgtc gtcaacctca ccggccgctt cgacatcctc 600

tcgctgtccg gctccttcct cccgccgccg gcgcctccct ccgccaccgg cctcaccgtc 660tcgctgtccg gctccttcct cccgccgccg gcgcctccct ccgccaccgg cctcaccgtc 660

tacgtctccg gcggccaggg gcaggtcgtg ggcggcacgg tcgccggacc gctcatcgcc 720tacgtctccg gcggccaggg gcaggtcgtg ggcggcacgg tcgccggacc gctcatcgcc 720

gtcggccccg tcgtcatcat ggccgcctcg ttcgggaacg ccgcctacga gcgcctcccg 780gtcggccccg tcgtcatcat ggccgcctcg ttcgggaacg ccgcctacga gcgcctcccg 780

ctcgaggacg acgagccgcc gcagcacatg gcgggcggcg gccagtcctc gccgccgccg 840ctcgaggacg acgagccgcc gcagcacatg gcgggcggcg gccagtcctc gccgccgccg 840

ccgccgctgc cattaccacc acaccagcag ccgattcttc aagaccatct gccacacaac 900ccgccgctgc cattaccacc acaccagcag ccgattcttc aagaccatct gccacacaac 900

ctgatgaacg gaatccacct ccccggcgac gccgcctacg gctggaccag cggcggcggc 960ctgatgaacg gaatccacct ccccggcgac gccgcctacg gctggaccag cggcggcggc 960

ggcggcggcc gcgcggcgcc gtactga 987ggcggcggcc gcgcggcgcc gtactga 987

<210> 169 <211> 328 <212> PRT<210> 169 <211> 328 <212> PRT

<213> Oryza sativa <4 00> 169 Met Asp Pro Val Thr Ala Ala Ala Ala His Gly Gly Gly His His His 1 5 10 15 His His His Phe 20 Gly Ala Pro Pro Val 25 Ala Ala Phe His His 30 His Pro Phe His His 35 Gly Gly Gly Ala His 40 Tyr Pro Ala Ala Phe 45 Gln Gln Phe Gln Glu 50 Glu Gln Gln Gln Leu 55 Val Ala Ala Ala Ala 60 Ala Ala Gly Gly Met Ala Lys Gln Glu Leu Val Asp Glu Ser Asn Asn Thr Ile Asn Ser 65 70 75 80 Gly Gly Ser Asn Gly 85 Ser Gly Gly Glu Glu 90 Gln Arg Gln Gln Ser 95 Gly Glu Glu Gln His 100 Gln Gln Gly Ala Ala 105 Ala Pro Val Val Ile 110 Arg Arg Pro Arg Gly 115 Arg Pro Ala Gly Ser 120 Lys Asn Lys Pro Lys 125 Pro Pro Val Ile Ile 130 Thr Arg Asp Ser Ala 135 Ser Ala Leu Arg Ala 140 His Val Leu Glu Val Ala Ser Gly Cys Asp Leu Val Asp Ser Val Ala Thr Phe Ala Arg 97 145 150 155 160 Arg Arg Gln Val Gly Val Cys Val Leu Ser Ala Thr Gly Ala Val Thr 165 170 175 Asn Val Ser Val Arg Gln Pro Gly Ala Gly Pro Gly Ala Val Val Asn 180 185 190 Leu Thr Gly Arg Phe Asp Ile Leu Ser Leu Ser Gly Ser Phe Leu Pro 195 200 205 Pro Pro Ala Pro Pro Ser Ala Thr Gly Leu Thr Val Tyr Val Ser Gly 210 215 220 Gly Gln Gly Gln Val Val Gly Gly Thr Val Ala Gly Pro Leu Ile Ala 225 230 235 240 Val Gly Pro Val Val Ile Met Ala Ala Ser Phe Gly Asn Ala Ala Tyr 245 250 255 Glu Arg Leu Pro Leu Glu Asp Asp Glu Pro Pro Gln His Met Ala Gly 260 265 270 Gly Gly Gln Ser Ser Pro Pro Pro Pro Pro Leu Pro Leu Pro Pro His 275 280 285 Gln Gln Pro Ile Leu Gln Asp His Leu Pro His Asn Leu Met Asn Gly 290 295 300 Ile His Leu Pro Gly Asp Ala Ala Tyr Gly Trp Thr Ser Gly Gly Gly 305 310 315 320<213> Oryza sativa <4 00> 169 Met Asp Pro Val Thr Wing Ala Wing Ala His Gly Gly Gly His His 1 5 10 15 His His Phe 20 Gly Pro Pro Val 25 Phe Wing His 30 His Pro Phe His His 35 Gly Gly Gly Wing His 40 Tyr Pro Wing Phe Wing 45 Gln Phe Gln Glu 50 Glu Gln Gln Gln Leu 55 Val Wing Wing Wing 60 Wing Wing Gly Gly Met Wing Lys Gln Glu Read Val Asp Glu Be Asn Asn Thr Ile Asn Ser 65 70 75 80 Gly Gly Ser Asn Gly 85 Ser Gly Gly Glu Glu 90 Gln Arg Gln Gln Ser 95 Gly Glu Glu His 100 Gln Gln Gly Wing 105 Wing Pro Val Val Ile 110 Arg Arg Pro Arg Gly 115 Arg Pro Wing Gly Ser 120 Lys Asn Lys Pro Lys 125 Pro Pro Val Ile Ile 130 Thr Arg Asp Ser Wing 135 Ser Wing Leu Arg Wing 140 His Val Leu Glu Val Wing Ser Gly Cys Asp Leu Val Asp Ser Val Wing Thr Phe Ala Arg 97 145 150 155 160 Arg Arg Gln Val Gly Val Cys Val Leu Ser Wing Thr Gly Wing Val Thr 165 170 175 Asn Val Ser Val Arg Gln Pro Gly Wing Gly Pro Gly Wing Val Val Asn 180 185 190 Leu Thr Gly Arg Phe Asp Ile Leu To Be Leu To Be Gly To Be Phe Leu Pro 195 200 205 Pro Pro Wing To Pro To Be Wing Thr Gly Leu Thr Val Tyr Val To Gly 210 215 220 Gly Gln Gly Gln Val Val Val Gly Gly Thr Val Wing Gly Pro Leu Ile Wing 225 230 235 240 Val Gly Pro Val Val Ile Met Wing Al Ser Be Phe Gly Asn Wing Wing Tyr 245 250 255 Glu Arg Leu Pro Leu Glu Asp Asp Glu Pro Pro Gln His Met Wing Gly 260 265 270 Gly Gly Glly Be Ser Pro Pro Pro Pro Leu Pro Leu Pro Pro His 275 280 285 Gln Gln Pro Ile Leu Gln Asp His Leu Pro His Asn Leu Met Asn Gly 290 295 300 Ile His Leu Pro Gly Asp Wing Tyr Gly Wing Trp Thr Be Gly Gly Gly 305 310 315 320

Gly Gly Gly Arg Ala Ala Pro Tyr 325Gly Gly Gly Arg Wing Pro Wing Tyr 325

<210> 170<210> 170

<211> 777<211> 777

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<4 00> 170<4 00> 170

atggggagca tcgacggcca ctcgctgcag cagcatcagg ggtactccca cggcggcggc 60atggggagca tcgacggcca ctcgctgcag cagcatcagg ggtactccca cggcggcggc 60

gcgggaggga gcaacgagga ggaggaggcg tcgccgccgc ccggcggtgg ctcggctacg 120 gggtcggcgg gccgccggcc gagggggagg ccgccgggct ccaagaacaa gccgaagccg 180 cccgtcgtgg tgacgcggga gagccccaac gcgatgcgtt cccacgtgct ggagatcgcc 240 agcggcgccg acatcgtcga ggccatcgcg ggcttctccc gccgcaggca gcgcggcgtc 300 tccgtgctca gcgggagcgg cgccgtcacc aacgtcacgc tccggcagcc cgcggggact 360 ggggccgccg ccgtcgcgct gcgggggagg ttcgagatat tgtccatgtc tggcgccttc 420 ctcccggcgc cggcgccgcc aggggccacg gggctcgccg tgtacctcgc cggcgggcag 480 gggcaggtgg tgggtgggag cgtcatgggg gagctgatcg cgtcgggccc cgtcatggtg 540 atcgcggcca cgttcggcaa cgccacgtac gagaggctgc cgctggacca ggaaggcgag 600 gagggcgccg tgctgtccgg gtcggagggc gccgccgcgc agatggagca gcagagcagc 660 ggaggcgccg tcgtgccccc gccgatgtac gccgccgtcc agcagacgcc gccgcacgac 720 atgttcgggc agtgggggca tgcagcggtg gctcggccgc cgccgacatc gttctag 777gcgggaggga gcaacgagga ggaggaggcg tcgccgccgc ccggcggtgg ctcggctacg 120 gggtcggcgg gccgccggcc gagggggagg ccgccgggct ccaagaacaa gccgaagccg 180 cccgtcgtgg tgacgcggga gagccccaac gcgatgcgtt cccacgtgct ggagatcgcc 240 agcggcgccg acatcgtcga ggccatcgcg ggcttctccc gccgcaggca gcgcggcgtc 300 tccgtgctca gcgggagcgg cgccgtcacc aacgtcacgc tccggcagcc cgcggggact 360 ggggccgccg ccgtcgcgct gcgggggagg ttcgagatat tgtccatgtc tggcgccttc 420 ctcccggcgc cggcgccgcc aggggccacg gggctcgccg tgtacctcgc cggcgggcag 480 gggcaggtgg tgggtgggag cgtcatgggg gagctgatcg cgtcgggccc cgtcatggtg 540 atcgcggcca cgttcggcaa cgccacgtac gagaggctgc cgctggacca ggaaggcgag 600 gagggcgccg tgctgtccgg gtcggagggc gccgccgcgc agatggagca gcagagcagc 660 ggaggcgccg tcgtgccccc gccgatgtac gccgccgtcc agcagacgcc gccgcacgac 720 atgttcgggc agtgggggca tgcagcggtg gctcggccgc cgccgacatc gttctag 777

<210> 171 <211> 258 <212> PRT<210> 171 <211> 258 <212> PRT

<213> Oryza sativa <4 00> 171 Met Gly Ser Ile Asp Gly His Ser Leu Gln Gln His Gln Gly Tyr Ser 1 5 10 15 His Gly Gly Gly 20 Ala Gly Gly Ser Asn 25 Glu Glu Glu Glu Ala 30 Ser Pro Pro Pro Gly 35 Gly Gly Ser Ala Thr 40 Gly Ser Ala Gly Arg 45 Arg Pro Arg Gly Arg 50 Pro Pro Gly Ser Lys 55 Asn Lys Pro Lys Pro 60 Pro Val Val Val Thr Arg Glu Ser Pro Asn Ala Met Arg Ser His Val Leu Glu Ile Ala 65 70 75 80 Ser Gly Ala Asp Ile 85 Val Glu Ala Ile Ala 90 Gly Phe Ser Arg Arg 95 Arg Gln Arg Gly Val 100 Ser Val Leu Ser Gly 105 Ser Gly Ala Val Thr 110 Asn Val Thr Leu Arg 115 Gln Pro Ala Gly Thr 120 Gly Ala Ala Ala Val 125 Ala Leu Arg Gly Arg Phe Glu Ile Leu Ser Met Ser Gly Ala Phe Leu Pro Ala Pro 130 135 140<213> Oryza sativa <4 00> 171 Met Gly Ser Ile Asp Gly His Ser Leu Gln His Gln Gly Tyr Ser 1 5 10 15 His Gly Gly Gly 20 Wing Gly Gly Ser Asn 25 Glu Glu Glu Glu Wing 30 Ser Pro Pro Gly 35 Gly Gly Be Ward Thr 40 Gly Be Ward Gly Arg 45 Arg Pro Arg Gly Arg 50 Pro Pro Gly Ser Lys 55 Asn Lys Pro Lys Pro 60 Pro Val Val Val Thr Arg Glu Be Pro Asn Wing Met Arg Be His Val Leu Glu Ile Wing 65 70 75 80 Ser Gly Wing Asp Ile 85 Val Glu Ile Wing 90 Gly Phe Ser Arg Arg 95 Arg Gln Arg Gly Val 100 Ser Val Leu Ser Gly 105 Ser Gly Wing Val Thr 110 Asn Val Thr Leu Arg 115 Gln Pro Wing Gly Thr 120 Gly Wing Wing Wing Val 125 Wing Wing Leu Arg Gly Arg Phe Glu Ile Leu Be Met Ser Gly Wing Phe Leu Pro Wing Pro 130 135 140

Ala Pro Pro Gly Ala Thr Gly Leu Ala Val Tyr Leu Ala Gly Gly Gln 145 150 155 160Pro Pro Wing Gly Wing Thr Gly Leu Wing Val Tyr Leu Wing Gly Gly Gln 145 150 155 160

Gly Gln Val Val Gly Gly Ser Val Met Gly Glu Leu Ile Ala Ser GlyGly Gln Val Val Gly Gly Ser Val Met Gly Glu Leu Ile Wing Ser Gly

165 170 175165 170 175

Pro Val Met Val Ile Ala Ala Thr Phe Gly Asn Ala Thr Tyr Glu ArgPro Val Met Val Ile Wing Wing Thr Thr Phe Gly Wing Wing Thr Tyr Glu Arg

180 185 190180 185 190

Leu Pro Leu Asp Gln Glu Gly Glu Glu Gly Ala Val Leu Ser Gly SerLeu Pro Leu Asp Gln Glu Gly Glu Glu Gly Wing Val Leu Ser Gly Ser

195 200 205195 200 205

Glu Gly Ala Ala Ala Gln Met Glu Gln Gln Ser Ser Gly Gly Ala ValGlu Gly Wing Wing Wing Gln Met Glu Gln Gln Be Ser Gly Gly Wing Val

210 215 220210 215 220

Val Pro Pro Pro Met Tyr Ala Ala Val Gln Gln Thr Pro Pro His Asp 225 230 235 240Val Pro Pro Pro Met Tyr Wing Val Val Gln Thr Pro Pro His Asp 225 230 235 240

Met Phe Gly Gln Trp Gly His Ala Ala Val Ala Arg Pro Pro Pro Thr 245 250 255Met Phe Gly Gln Trp Gly His Wing Val Wing Arg Wing Pro Pro Pro 245 250 255

Ser PheTo be Phe

<210> 172 <211> 798 <212> DNA<210> 172 <211> 798 <212> DNA

<213> Lycopersicon esculentum <4 00> 172<213> Lycopersicon esculentum <4 00> 172

atggctggtt tggacttagg ttccgcttct catcatcgtt ttctccctcg tcatctccac 60atggctggtt tggacttagg ttccgcttct catcatcgtt ttctccctcg tcatctccac 60

gatcctcaag acgatgaaat caatcgcaac aacactcaat tttccgatga tgacaacaac 120gatcctcaag acgatgaaat caatcgcaac aacactcaat tttccgatga tgacaacaac 120

aacaacgata acaataacaa taatagcccc ggggtagcac gtagacctag aggtcgtccc 180aacaacgata acaataacaa taatagcccc ggggtagcac gtagacctag aggtcgtccc 180

gcggggtcca aaaataagcc taagcctccc gtgatcataa cacgggagag cgctaacgcg 240gcggggtcca aaaataagcc taagcctccc gtgatcataa cacgggagag cgctaacgcg 240

ctccgtgcgc atattttaga agtgagtagc ggacatgatg tctttgaatc agttgctact 300ctccgtgcgc atattttaga agtgagtagc ggacatgatg tctttgaatc agttgctact 300

tatgctagaa aaagacaaag aggaatttgc atactgagcg ggagcggtac ggtgaataac 360tatgctagaa aaagacaaag aggaatttgc atactgagcg ggagcggtac ggtgaataac 360

gtcaccatac ggcagccaca ggctgccggt tctgtggtga cgttacacgg aagattcgag 420gtcaccatac ggcagccaca ggctgccggt tctgtggtga cgttacacgg aagattcgag 420

atattatctt tatccggatc tttcctacca ccacccgctc cccctggggc caccagctta 480atattatctt tatccggatc tttcctacca ccacccgctc cccctggggc caccagctta 480

acgatttatt tagcgggtgg tcaaggtcaa gttgttggtg gaaacgttgt gggtgcgcta 540acgatttatt tagcgggtgg tcaaggtcaa gttgttggtg gaaacgttgt gggtgcgcta 540

attgcatcag gaccggttat tgttattgct tcgtcattta ctaatgttgc ttatgagaga 600attgcatcag gaccggttat tgttattgct tcgtcattta ctaatgttgc ttatgagaga 600

ttgcctttgg atgaagaaaa tgagtcaatt cagatgcagc aacaaggaca aagtggtaat 660ttgcctttgg atgaagaaaa tgagtcaatt cagatgcagc aacaaggaca aagtggtaat 660

tttgctgatc catctaatat tggattacct tttcttaatt tgccattaaa catgccaaat 720tttgctgatc catctaatat tggattacct tttcttaatt tgccattaaa catgccaaat 720

ggtggtggtc aactacaatt ggaaagtgga ggaggtgaag gttggaatgg aaacacaaca 780ggtggtggtc aactacaatt ggaaagtgga ggaggtgaag gttggaatgg aaacacaaca 780

aacaggccac aatattag 798 <210> 173 <211> 265 <212> PRTaacaggccac aatattag 798 <210> 173 <211> 265 <212> PRT

<213> Lycopersicon esculentum <4 00> 173<213> Lycopersicon esculentum <4 00> 173

Met Ala Gly Leu Asp Leu Gly Ser Ala Ser His His Arg Phe Leu Pro 1 5 10 15 Arg His Leu His 20 Asp Pro Gln Asp Asp 25 Glu Ile Asn Arg Asn 30 Asn Thr Gln Phe Ser 35 Asp Asp Asp Asn Asn 40 Asn Asn Asp Asn Asn 45 Asn Asn Asn Ser Pro 50 Gly Val Ala Arg Arg 55 Pro Arg Gly Arg Pro 60 Ala Gly Ser Lys Asn Lys Pro Lys Pro Pro Val Ile Ile Thr Arg Glu Ser Ala Asn Ala 65 70 75 80 Leu Arg Ala His Ile 85 Leu Glu Val Ser Ser 90 Gly His Asp Val Phe 95 Glu Ser Val Ala Thr 100 Tyr Ala Arg Lys Arg 105 Gln Arg Gly Ile Cys 110 Ile Leu Ser Gly Ser 115 Gly Thr Val Asn Asn 120 Val Thr Ile Arg Gln 125 Pro Gln Ala Ala Gly 130 Ser Val Val Thr Leu 135 His Gly Arg Phe Glu 140 Ile Leu Ser Leu Ser Gly Ser Phe Leu Pro Pro Pro Ala Pro Pro Gly Ala Thr Ser Leu 145 150 155 160 Thr Ile Tyr Leu Ala 165 Gly Gly Gln Gly Gln 170 Val Val Gly Gly Asn 175 Val Val Gly Ala Leu Ile Ala Ser Gly Pro Val IleMet Ala Gly Leu Asp Leu Gly Be Ala Be His His Arg Phe Leu Pro 1 5 10 15 Arg His Leu His 20 Asp Pro Gln Asp 25 Glu Ile Asn Arg Asn 30 Asn Thr Gln Phe Ser 35 Asp Asp Asp Asn 40 Asn Asn Asp Asn Asn 45 Asn Asn Asn Ser Pro 50 Gly Val Wing Arg Arg 55 Pro Arg Gly Arg Pro 60 Wing Gly Ser Lys Pro Lys Pro Lys Pro Val Ile Ile Thr Arg Glu Ser Wing Asn Wing 65 70 75 80 Leu Arg Wing His Ile 85 Leu Glu Val Ser Ser 90 Gly His Asp Val Phe 95 Glu Ser Val Val Wing Thr 100 Tyr Wing Arg Lys Arg 105 Gln Arg Gly Ile Cys 110 Ile Leu Ser Gly Ser 115 Gly Thr Val Asn 120 Val Thr Ile Arg Gln 125 Pro Gln Ala Wing Gly 130 Ser Val Val Thr Leu 135 His Gly Arg Phe Glu 140 Ile Leu Ser Leu Ser Gly Ser Phe Leu Pro Pro Ala Pro Pro Gly Ala Thr Ser Leu 145 150 155 160 Thr Ile Tyr Leu Ala 165 Gly Gly Gln Gly Gln 170 Val Val Gly Gly Asn 175 Val Val Gly Wing Leu Ile Wing Ser Gly Pro Val Ile

180 185180 185

Phe Thr Asn Val Ala Tyr Glu Arg Leu Pro LeuPhe Thr Asn Val Wing Tyr Glu Arg Leu Pro Leu

195 200195 200

Ser Ile Gln Met Gln Gln Gln Gly Gln Ser GlySer Ile Gln Met Gln Gln Gln Gly Gln Be Gly

210 215210 215

Ser Asn Ile Gly Leu Pro Phe Leu Asn Leu Pro 225 230 235Ser Asn Ile Gly Leu Pro Phe Leu Asn Leu Pro 225 230 235

Gly Gly Gly Gln Leu Gln Leu Glu Ser Gly GlyGly Gly Gly Gln Gave Gln Gave Glu Ser Gly Gly

245 250245 250

Gly Asn Thr Thr Asn Arg Pro Gln Tyr 260 265Gly Asn Thr Thr Asn Arg Pro Gln Tyr 260 265

<210> 174 <211> 813 <212> DNA<210> 174 <211> 813 <212> DNA

<213> Arabidopsis thaliana <4 00> 174<213> Arabidopsis thaliana <4 00> 174

atggaactta acagatctga agcagacgaa gcaaaggccg gccaccagct cagccacagc ctctggctct tcctccggac gcaggttcca aaaacaaacc caaacctccg acgattataa cttagatcac acgttcttga agtcacctcc ggttcggaca tacgccactc gtcgcggctg cggcgtttgc attataagcg gtcacgatac ggcaacctgc ggctccggct ggtggaggtg tttgacattt tgtctttgac cggtactgcg cttccaccgc ggtttgacgg tgtatctagc cggaggtcaa ggacaagttg tcgttaattg cttcgggacc ggtagtgttg atggctgctt gataggttac cgattgaaga ggaagaaacc ccaccgccga cagcagccgg aggcgtctca gtcgtcggag gttacgggga tcaaacctcc aaggtggaaa tggtggagga ggtgttgctt atgaacaatt ttcaattctc cgggggagat atttacggta ggtggtggcg gtgcgactag acccgcgttt tag <210> 175 <211> 270 <212> PRTatggaactta acagatctga agcagacgaa gcaaaggccg gccaccagct cagccacagc ctctggctct tcctccggac gcaggttcca aaaacaaacc caaacctccg acgattataa cttagatcac acgttcttga agtcacctcc ggttcggaca tacgccactc gtcgcggctg cggcgtttgc attataagcg gtcacgatac ggcaacctgc ggctccggct ggtggaggtg tttgacattt tgtctttgac cggtactgcg cttccaccgc ggtttgacgg tgtatctagc cggaggtcaa ggacaagttg tcgttaattg cttcgggacc ggtagtgttg atggctgctt gataggttac cgattgaaga ggaagaaacc ccaccgccga cagcagccgg aggcgtctca gtcgtcggag gttacgggga tcaaacctcc aaggtggaaa tggtggagga ggtgttgctt atgaacaatt ttcaattctc cgggggagat atttacggta ggtggtggcg gtgcgactag acccgcgttt tag <210> 175 <211> 270 <212> PRT

<213> Arabidopsis thaliana <400> 175<213> Arabidopsis thaliana <400> 175

Met Glu Leu Asn Arg Ser Glu Ala Asp Glu Ala 15 10Met Glu Read Asn Arg Be Glu Wing Asp Glu Wing 15 10

Pro Thr Gly Gly Ala Thr Ser Ser Ala Thr AlaPro Thr Gly Gly Ala Thr Be Ser Ala Thr Ala

20 2520 25

Gly Arg Arg Pro Arg Gly Arg Pro Ala Gly SerGly Arg Arg Arg Arg Gly Arg Arg Wing Gly Ser

35 4035 40

Pro Pro Thr Ile Ile Thr Arg Asp Ser Pro AsnPro Pro Thr Ile Ile Thr Arg Asp Be Pro Asn

50 5550 55

Val Leu Glu Val Thr Ser Gly Ser Asp Ile Ser 65 70 75Val Leu Glu Val Thr Gly Ser Asp Ile Ser 65 70 75

Tyr Ala Thr Arg Arg Gly Cys Gly Val Cys IleTyr Wing Thr Arg Arg Gly Cys Gly Val Cys Ile

85 9085 90

Ala Val Thr Asn Val Thr Ile Arg Gln Pro AlaVal Thr Wing Asn Val Thr Ile Arg Gln Pro Wing

100 105100 105

Gly Val Ile Thr Leu His Gly Arg Phe Asp IleGly Val Ile Thr Read His Gly Arg Phe Asp Ile

115 120115 120

Thr Ala Leu Pro Pro Pro Ala Pro Pro Gly AlaThr Wing Leu Pro Pro Pro Wing Pro Pro Gly Wing

130 135130 135

Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly 145 150 155Tyr Leu Wing Gly Gly Gln Gly Gln Val Val Gly 145 150 155

Ser Leu Ile Ala Ser Gly Pro Val Val Leu MetSer Leu Ile Ala Ser Gly Pro Val Val Leu Met

165 170165 170

Asn Ala Val Tyr Asp Arg Leu Pro Ile Glu GluAsn Wing Val Tyr Asp Arg Leu Pro Ile Glu Glu

180 185180 185

Pro Arg Thr Thr Gly Val Gln Gln Gln Gln ProPro Arg Thr Thr Gly Val Gln Gln Gln Gln

195 200195 200

Ser Glu Val Thr Gly Ser Gly Ala Gln Ala CysBe Glu Val Thr Gly Be Gly Wing Gln Wing Cys

Val Ile Ala Ser Ser 190Val Ile Ser Ser 190

Asp Glu Glu Asn Glu 205Asp Glu Glu Asn Glu 205

Asn Phe Ala Asp Pro 220Asn Phe Ala Asp Pro 220

Leu Asn Met Pro Asn 240Read Asn Met Pro Asn 240

Gly Glu Gly Trp Asn 255Gly Glu Gly Trp Asn 255

agaccactcc gtcgtccacg ctagagatag tatccgaggc gcacgggtgc tgattaccct ctgcaccacc taggagggaa cttttgcaaa gaaccaccgg gtggggccca tctacaatct tgagcggcggagaccactcc gtcgtccacg ctagagatag tatccgaggc gcacgggtgc tgattaccct ctgcaccacc taggagggaa cttttgcaaa gaaccaccgg gtggggccca tctacaatct tgagcggcgg

caccggtgga tggtcgtcct tcctaacgtc agtctccacc ggtcactaac gcatggtcgg gggagcagga tgtggctggt cgcagtttat ggtgcagcag ggcgtgtgag tggaatgaat tagcggaggacaccggtgga tggtcgtcct tcctaacgtc agtctccacc ggtcactaac gcatggtcgg gggagcagga tgtggctggt cgcagtttat ggtgcagcag ggcgtgtgag tggaatgaat tagcggag

Lys Ala GluLys Wing Glu

Ser Gly Ser 30Ser Gly Ser 30

Lys Asn Lys 45Lys Asn Lys 45

Val Leu Arg 60Val Leu Arg 60

Glu Ala ValGlu Wing Val

Ile Ser GlyIle Ser Gly

Ala Pro Ala 110Pro Wing 110 Wing

Leu Ser LeuLeu Ser Leu

125 Gly Gly Leu 140125 Gly Gly Leu 140

Gly Asn ValGly Asn Val

Ala Ala SerWing Wing Wing

Glu Glu Thr 190Glu Glu Thr 190

Glu Ala SerGlu Ala Ser

205 Glu Ser Asn205 Glu Ser Asn

Thr Thr 15Thr Thr 15

Ser SerTo be to be

Pro LysPro lys

Ser HisTo be his

Ser Thr 80 Thr Gly 95Ser Thr 80 Thr Gly 95

Gly GlyGly Gly

Thr GlyThr gly

Thr ValThr val

Ala Gly 160 Phe Ala 175Gly Wing 160 Phe 175 Wing

Pro Pro Gln Ser Leu GlnPro Pro Gln Being Read Gln

60 120 180 240 300 360 420 480 540 600 660 720 780 813 210 21560 120 180 240 300 360 420 480 540 600 660 720 780 813 210 215

Gly Gly Asn Gly Gly Gly Gly Val Ala Phe Tyr 225 230 235Gly Gly Asn Gly Gly Gly Gly Val Wing Phe Tyr 225 230 235

Met Asn Asn Phe Gln Phe Ser Gly Gly Asp IleMet Asn Asn Phe Gln Phe Ser Gly Gly Asp Ile

245 250245 250

Gly Ser Gly Gly Gly Gly Gly Gly Ala Thr Arg 260 265Gly Gly Gly Gly Gly Gly Gly Gly Wing Thr Arg 260 265

<210> 176 <211> 948 <212> DNA<210> 176 <211> 948 <212> DNA

<213> Arabidopsis thaliana <4 00> 176<213> Arabidopsis thaliana <4 00> 176

atggcgaatc catggtggac aggacaagtg aacctatccg ggttcctctc agttaaagaa accagatctc cacatctcca ggtcacaata atcatcacca tcaccaagaa gtcgataaca gacaacttga gtggagacga ccacgagcca cgtgaaggag cgtccacgtg gacgtcctgc tggttccaag aacaaaccaa cgcgattctc caaatgctct caagagccat gtcatggaga atcgaaaccc tagctacttt tgctaggcgg cgtcaacgtg aatggcacag tggctaacgt caccctccgt caaccctcga cctggtggtg cggctgtttt ggctttacaa gggaggtttg tctttcttgc caggaccggc tccacctggt tccaccggtt ggtcaaggtc aggttgttgg aggaagcgtg gtgggcccat atgctgatcg ccgccacgtt ctctaacgcg acttacgaga gaggcagcag agagaggcgg tggtggaggc agcggaggag ggcggaggtt cgccactaag cagcggtgct ggtggaggcg gtgtataata tgccgggaaa tcttgtttct aatggtggca agcggccaag aagcttatgg ttgggctcaa gctaggtcag <210> 177 <211> 315 <212> PRTatggcgaatc catggtggac aggacaagtg aacctatccg ggttcctctc agttaaagaa accagatctc cacatctcca ggtcacaata atcatcacca tcaccaagaa gtcgataaca gacaacttga gtggagacga ccacgagcca cgtgaaggag cgtccacgtg gacgtcctgc tggttccaag aacaaaccaa cgcgattctc caaatgctct caagagccat gtcatggaga atcgaaaccc tagctacttt tgctaggcgg cgtcaacgtg aatggcacag tggctaacgt caccctccgt caaccctcga cctggtggtg cggctgtttt ggctttacaa gggaggtttg tctttcttgc caggaccggc tccacctggt tccaccggtt ggtcaaggtc aggttgttgg aggaagcgtg gtgggcccat atgctgatcg ccgccacgtt ctctaacgcg acttacgaga gaggcagcag agagaggcgg tggtggaggc agcggaggag ggcggaggtt cgccactaag cagcggtgct ggtggaggcg gtgtataata tgccgggagaa tcttgtttct aatggtggca agcggccaag aagcttatgg <tg2> <tg2>

<213> Arabidopsis thaliana <4 00> 177<213> Arabidopsis thaliana <4 00> 177

Met Ala Asn Pro Trp Trp Thr Gly Gln Val Asn 15 10Met Wing Asn Pro Trp Trp Thr Gly Gln Val Asn 15 10

Thr Thr Pro Pro Gly Ser Ser Gln Leu Lys LysThr Thr Pro Pro Gly Ser Be Gln Read Lys Lys

20 2520 25

Ser Met Asn Met Ala Met Asp Ser Gly His AsnBe Met Asn Met Ala Met Asp Be Gly His Asn

35 4035 40

Gln Glu Val Asp Asn Asn Asn Asn Asp Asp AspGln Glu Val Asp Asn Asn Asn Asn Asn Asp Asp Asp

50 5550 55

Gly Asp Asp His Glu Pro Arg Glu Gly Ala Val 65 70 75Gly Asp Asp His Glu Pro Arg Glu Gly Wing Val 65 70 75

Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys AsnArg Pro Arg Gly Arg Pro Wing Gly Ser Lys Asn

85 9085 90

Ile Phe Val Thr Arg Asp Ser Pro Asn Ala LeuIle Phe Val Thr Arg Asp Be Pro Asn Ala Leu

100 105100 105

Glu Ile Ala Ser Gly Thr Asp Val Ile Glu ThrGlu Ile Wing Ser Gly Thr Asp Val Ile Glu Thr

115 120115 120

Arg Arg Arg Gln Arg Gly Ile Cys Ile Leu SerArg Arg Arg Gln Arg Gly Ile Cys Ile Read Ser

130 135130 135

Ala Asn Val Thr Leu Arg Gln Pro Ser Thr Ala 145 150 155Wing Asn Val Thr Read Le Arg Gln Pro Ser Thr Wing 145 150 155

Pro Gly Gly Ala Ala Val Leu Ala Leu Gln GlyPro Gly Gly Wing Val Val Wing Wing Wing Glu Gly Wing

165 170165 170

Ser Leu Thr Gly Ser Phe Leu Pro Gly Pro AlaBe Gave Thr Gly Be Phe Gave Pro Gly Pro Wing

180 185180 185

Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln GlyGly Leu Thr Ile Tyr Leu Wing Gly Gly Gln Gly

195 200195 200

Ser Val Val Gly Pro Leu Met Ala Ala Gly ProSer Val Val Gly Pro Read Met Wing Gly Pro Wing

210 215210 215

Ala Thr Phe Ser Asn Ala Thr Tyr Glu Arg Leu 225 230 235Wing Thr Phe Ser Asn Wing Thr Tyr Glu Arg Leu 225 230 235

220220

Asn Leu Gly Met Asn 240Asn Leu Gly Met Asn 240

Tyr Gly Met Ser Gly 255Tyr Gly Met Ser Gly 255

Pro Ala Phe 270Pro Wing Phe 270

gcctcgaaac tgaacatggc acaacaacga ccgtagaagc agccaccgat tcgctagtgg gcatctgcat ccgctgccgt agattctttc taacgattta tgatggcagc gattgccatt tggttccggg acggtaacca gtggtggagg gattttaagcctcgaaac tgaacatggc acaacaacga ccgtagaagc agccaccgat tcgctagtgg gcatctgcat ccgctgccgt agattctttc taacgattta tgatggcagc gattgccatt tggttccggg acggtaacca gtgtta

gacgccgcct catggactca cgacgataga ccccacgcgc cttcgtcact gactgacgtc cttgagcgga tgcggcggct tttaaccggt cttagccggt aggtccggtg ggaggaggaa gcagctcgga aggacttccg aggacagatggacgccgcct catggactca cgacgataga ccccacgcgc cttcgtcact gactgacgtc cttgagcgga tgcggcggct tttaaccggt cttagccggt aggtccggtg ggaggaggaa gcagctcgg aggact aggact

Leu Ser Gly Leu Glu 15 Pro Asp Leu His Ile 30 Asn His His His His 45 Arg Asp Asn Leu Ser 60 Glu Ala Pro Thr Arg 80 Lys Pro Lys Pro Pro 95 Lys Ser His Val Met 110 Leu Ala Thr Phe Ala 125 Gly Asn Gly Thr Val 140 Ala Val Ala Ala Ala 160 Arg Phe Glu Ile Leu 175 Pro Pro Gly Ser Thr 190 Gln Val Val Gly Gly 205 Val Met Leu Ile Ala 220 Pro Leu Glu Glu GluLeu Ser Gly Leu Glu 15 Pro Asp Leu His Ile 30 Asn His His His His 45 Arg Asp Asn Leu Ser 60 Glu Pro Thr Arg 80 Lys Pro Lys Pro 95 Lys Pro His Val Met 110 Leu Wing Thr Phe Ala 125 Gly Asn Gly Thr Val 140 Wing Val Wing Wing Wing Wing 160 Arg Phe Glu Ile Leu 175 Pro Pro Gly Ser Thr 190 Gln Val Val

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 94860 120 180 240 300 360 420 480 540 600 660 720 780 840 900 948

240 Glu Ala Ala Glu Arg Gly Gly Gly Gly Gly Ser Gly Gly Val Val Pro240 Glu Wing Glu Wing Gly Gly Gly Gly Gly Gly Serly Gly Val Val Pro

245 250 255245 250 255

Gly Gln Leu Gly Gly Gly Gly Ser Pro Leu Ser Ser Gly Ala Gly GlyGly Gln Read Gly Gly Gly Gly Be Pro Pro Read Be Ser Gly Wing Gly Gly

260 265 270260 265 270

Gly Asp Gly Asn Gln Gly Leu Pro Val Tyr Asn Met Pro Gly Asn LeuGly Asp Gly Asn Gln Gly Leu For Val Tyr Asn Met Pro Gly Asn Leu

275 280 285275 280 285

Val Ser Asn Gly Gly Ser Gly Gly Gly Gly Gln Met Ser Gly Gln GluVal Ser Asn Gly Gly Gly Gly Gly Gly Gly Gln Met Ser Gly Gln Glu

290 295 300290 295 300

Ala Tyr Gly Trp Ala Gln Ala Arg Ser Gly Phe 305 310 315Wing Tyr Gly Trp Wing Gln Wing Arg Be Gly Phe 305 310 315

<210> 178 <211> 708 <212> DNA <213> Oryza sativa <4 00> 178<210> 178 <211> 708 <212> DNA <213> Oryza sativa <4 00> 178

atggcgtcca aggagccaag cggcgaccac gaccacgaga tgaacgggac cagcgccggg 60atggcgtcca aggagccaag cggcgaccac gaccacgaga tgaacgggac cagcgccggg 60

ggcggcgagc ccaaggacgg cgcggtggtg accggccgca accggcgccc ccgcggacgg 120 ccgccgggct ccaagaacaa gcccaagccg cccatcttcg tgacgcggga cagcccgaac 180 gcgctgcgca gccacgtcat ggaggtggcc ggcggcgccg atgtcgccga gtccatcgcg 240 cacttcgcgc -ggcggcggca gcgcggcgtc tgcgtgctca gcggggccgg caccgtgacc 300 gacgtggccc tgcgccagcc ggccgcgccg agcgccgtgg tggcgctccg tgggcggttc 360 gagatcctgt ccctgacggg gacgttcctg ccggggccgg cgccgccggg ctccaccggg 420 ctgaccgtgt acctcgccgg cgggcagggg caggtggtgg gcggcagcgt ggtggggacg 480 ctcaccgcgg cggggccggt catggtgatc gcctccacct tcgccaacgc cacctacgag 540 aggctgccgc tggatcagga ggaggaggaa gcagcggcag gcggcatgat ggcgccgccg 600 ccactcatgg ccggcgccgc cgatccacta cttttcggcg ggggaatgca cgacgccggg 660 cttgctgcat ggcaccatgc ccgccctccg ccgccgccgc cctactag 708ggcggcgagc ccaaggacgg cgcggtggtg accggccgca accggcgccc ccgcggacgg 120 ccgccgggct ccaagaacaa gcccaagccg cccatcttcg tgacgcggga cagcccgaac 180 gcgctgcgca gccacgtcat ggaggtggcc ggcggcgccg atgtcgccga gtccatcgcg 240 cacttcgcgc -ggcggcggca gcgcggcgtc tgcgtgctca gcggggccgg caccgtgacc 300 gacgtggccc tgcgccagcc ggccgcgccg agcgccgtgg tggcgctccg tgggcggttc 360 gagatcctgt ccctgacggg gacgttcctg ccggggccgg cgccgccggg ctccaccggg 420 ctgaccgtgt acctcgccgg cgggcagggg caggtggtgg gcggcagcgt 480 ggtggggacg ctcaccgcgg cggggccggt catggtgatc gcctccacct tcgccaacgc cacctacgag 540 aggctgccgc tggatcagga ggaggaggaa gcagcggcag gcggcatgat ggcgccgccg 600 ccactcatgg ccggcgccgc cgatccacta cttttcggcg ggggaatgca cgacgccggg 660 cttgctgcat ggcaccatgc ccgccctccg ccgccgccgc cctactag 708

<210> 179 <211> 235 <212> PRT<210> 179 <211> 235 <212> PRT

<213> Oryza sativa <4 00> 179<213> Oryza sativa <4 00> 179

Met Ala Ser Lys Glu Pro Ser Gly Asp His Asp His Glu Met Asn Gly 15 10 15Met Ala Ser Lys Glu Pro Ser Gly Asp His Asp His Glu Met Asn Gly 15 10 15

Thr Ser Ala Gly Gly Gly Glu Pro Lys Asp Gly Ala Val Val Thr GlyThr Be Wing Gly Gly Gly Glu Pro Lys Asp Gly Wing Val Val Thr Gly

20 25 3020 25 30

Arg Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys ProArg Asn Arg Arg Arg Arg Gly Arg Pro Gly Ser Lys Asn Lys Pro

35 40 4535 40 45

Lys Pro Pro Ile Phe Val Thr Arg Asp Ser Pro Asn Ala Leu Arg SerLys Pro Pro Ile Phe Val Thr Arg Asp Be Pro Asn Wing Read Arg Be

50 55 6050 55 60

His Val Met Glu Val Ala Gly Gly Ala Asp Val Ala Glu Ser Ile Ala 65 70 75 80His Val Met Glu Val Wing Gly Gly Wing Asp Val Wing Glu Ser Ile Wing 65 70 75 80

His Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly AlaHis Phe Wing Arg Arg Arg Gln Arg Gly Val Cys Val Leu Ser Gly Wing

85 90 9585 90 95

Gly Thr Val Thr Asp Val Ala Leu Arg Gln Pro Ala Ala Pro Ser AlaGly Thr Val Thr Asp Val Wing Read Arg Gln Pro Wing Wing Pro Be Wing

100 105 110100 105 110

Val Val Ala Leu Arg Gly Arg Phe Glu Ile Leu Ser Leu Thr Gly ThrVal Val Wing Read Arg Gly Arg Phe Glu Ile Read Be Read Thr Gly Thr

115 120 125115 120 125

Phe Leu Pro Gly Pro Ala Pro Pro Gly Ser Thr Gly Leu Thr Val TyrPhe Leu Pro Gly Pro Pro Wing Gly Ser Thr Thr Gly Leu Thr Val Tyr

130 135 140130 135 140

Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Thr 145 150 155 160Leu Wing Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Thr 145 150 155 160

Leu Thr Ala Ala Gly Pro Val Met Val Ile Ala Ser Thr Phe Ala AsnRead Thr Wing Wing Gly Pro Val Val Val Ile Wing Ser Thr Phe Wing Asn

165 170 175165 170 175

Ala Thr Tyr Glu Arg Leu Pro Leu Asp Gln Glu Glu Glu Glu Ala AlaWing Thr Tyr Glu Arg Leu Pro Leu Asp Gln Glu Glu Glu Glu Wing

180 185 190180 185 190

Ala Gly Gly Met Met Ala Pro Pro Pro Leu Met Ala Gly Ala Ala AspGly Wing Gly Met Met Pro Wing Pro Pro Read Met Gly Wing Wing Asp Wing

195 200 205195 200 205

Pro Leu Leu Phe Gly Gly Gly Met His Asp Ala Gly Leu Ala Ala TrpPro Read Leu Phe Gly Gly Gly Met His Asp Wing Gly Leu Wing Wing Trp

210 215 220210 215 220

His His Ala Arg Pro Pro Pro Pro Pro Pro Tyr 225 230 235His His Wing Arg Pro Pro Pro Pro Pro Pro Tyr 225 230 235

<210> 180 <211> 846 <212> DNA<210> 180 <211> 846 <212> DNA

<213> Arabidopsis thaliana <400> 180<213> Arabidopsis thaliana <400> 180

atggcaaacc cttggtggac gaaccagagt ggtttagcgg gcatggtgga ccattcggtc 60 tcctcaggcc atcaccaaaa ccatcaccac caaagtcttc ttaccaaagg agatcttgga 120 atagccatga atcagagcca agacaacgac caagacgaag aagatgatcc tagagaagga 180 gccgttgagg tggtcaaccg tagaccaaga ggtagaccac caggatccaa aaacaaaccc 240 aaagctccaa tctttgtgac aagagacagc cccaacgcac tccgtagcca tgtcttggag 300 atctccgacg gcagtgacgt cgccgacaca atcgctcact tctcaagacg caggcaacgc 360 ggcgtttgcg ttctcagcgg gacaggctca gtcgctaacg tcaccctccg ccaagccgcc 420 gcaccaggag gtgtggtctc tctccaaggc aggtttgaaa tcttatcttt aaccggtgct 480 ttcctccctg gaccttcccc acccgggtca accggtttaa cggtttactt agccggggtc 540 cagggtcagg tcgttggagg tagcgttgta ggcccactct tagccatagg gtcggtcatg 600 gtgattgctg ctactttctc taacgctact tatgagagat tgcccatgga agaagaggaa 660 gacggtggcg gctcaagaca gattcacgga ggcggtgact caccgcccag aatcggtagt 720 aacctgcctg atctatcagg gatggccggg ccaggctaca atatgccgcc gcatctgatt 780 ccaaatgggg ctggtcagct agggcacgaa ccatatacat gggtccacgc aagaccacct 840 tactga 846atggcaaacc cttggtggac gaaccagagt ggtttagcgg gcatggtgga ccattcggtc 60 tcctcaggcc atcaccaaaa ccatcaccac caaagtcttc ttaccaaagg agatcttgga 120 atagccatga atcagagcca agacaacgac caagacgaag aagatgatcc tagagaagga 180 gccgttgagg tggtcaaccg tagaccaaga ggtagaccac caggatccaa aaacaaaccc 240 aaagctccaa tctttgtgac aagagacagc cccaacgcac tccgtagcca tgtcttggag 300 atctccgacg gcagtgacgt cgccgacaca atcgctcact tctcaagacg caggcaacgc 360 ggcgtttgcg ttctcagcgg gacaggctca gtcgctaacg tcaccctccg ccaagccgcc 420 gcaccaggag gtgtggtctc tctccaaggc aggtttgaaa tcttatcttt aaccggtgct 480 ttcctccctg gaccttcccc acccgggtca accggtttaa cggtttactt agccggggtc 540 cagggtcagg tcgttggagg tagcgttgta ggcccactct tagccatagg gtcggtcatg 600 gtgattgctg ctactttctc taacgctact tatgagagat tgcccatgga agaagaggaa 660 gacggtggcg gctcaagaca gattcacgga ggcggtgact caccgcccag aatcggtagt 720 aacctgcctg atctatcagg gatggccggg ccaggctaca atatgccgcc gcatctgatt 780 ccaaatgggg ctggtcagct agggcacgaa ccatatacat gggtccacgc aagaccacct 840 tactga 846

<210> 181 <211> 281 <212> PRT<210> 181 <211> 281 <212> PRT

<213> Arabidopsis thaliana <400> 181<213> Arabidopsis thaliana <400> 181

Met Ala Asn Pro Trp Trp Thr Asn Gln Ser Gly 15 10Met Wing Asn Pro Trp Trp Thr Asn Gln Ser Gly 15 10

Leu AlaRead Wing

Asp His Ser Val Ser Ser Gly His His Gln Asn His HisAsp His Be Val Ser Be Gly His His Gln Asn His His

2020

2525

Leu Leu Thr Lys Gly Asp Leu Gly Ile Ala MetLeu Leu Thr Lys Gly Asp Leu Gly Ile Ala Met

3535

4040

Asn Asp Gln Asp Glu Glu Asp Asp Pro Arg GluAsp Asp Gln Asp Glu Asp Asp Asp Pro Arg Glu

50 5550 55

Val Asn Arg Arg Pro Arg Gly Arg Pro Pro Gly 65 70 75Val Asn Arg Arg Arg Arg Gly Arg Pro Gly 65 70 75

Lys Ala Pro Ile Phe Val Thr Arg Asp Ser ProLys Wing Pro Ile Phe Val Thr Arg Asp Ser Pro

85 9085 90

His Val Leu Glu Ile Ser Asp Gly Ser Asp ValHis Val Leu Glu Ile Ser Asp Gly Ser Asp Val

100 105100 105

His Phe Ser Arg Arg Arg Gln Arg Gly Val CysHis Phe Ser Arg Arg Arg Gln Arg Gly Val Cys

115 120115 120

Gly Ser Val Ala Asn Val Thr Leu Arg Gln AlaGly Ser Val Wing Asn Val Thr Read Le Arg Gln Wing

130 135130 135

Val Val Ser Leu Gln Gly Arg Phe Glu Ile Leu 145 150 155Val Val Ser Leu Gln Gly Arg Phe Glu Ile Leu

Phe Leu Pro Gly Pro Ser Pro Pro Gly Ser ThrPhe Leu Pro Pro Gly Pro Pro Pro Gly Ser Thr

165 170165 170

Leu Ala Gly Val Gln Gly Gln Val Val Gly GlyRead Wing Gly Val Gln Gly Gln Val Val Gly Gly

180 185180 185

Leu Leu Ala Ile Gly Ser Val Met Val Ile AlaLeu Leu Wing Ile Gly Ser Val Val Val Ile Wing

195 200195 200

Ala Thr Tyr Glu Arg Leu Pro Met Glu Glu GluThr Wing Tyr Glu Arg Leu Pro Met Glu Glu Glu

210 215210 215

Ser Arg Gln Ile His Gly Gly Gly Asp Ser Pro 225 230 235Ser Arg Gln Ile His Gly Gly Gly Asp Ser Pro 225 230 235

Asn Leu Pro Asp Leu Ser Gly Met Ala Gly ProAsn Leu Pro Asp Leu Ser Gly Met Wing Gly Pro

245 250245 250

Pro His Leu Ile Pro Asn Gly Ala Gly Gln LeuPro His Leu Ile Pro Asn Gly Wing Gly Gln Leu

260 265260 265

Thr Trp Val His Ala Arg Pro Pro TyrThr Trp Val His Wing Arg Pro Pro Tyr

275 280275 280

<210> 182 <211> 879 <212> DNA<210> 182 <211> 879 <212> DNA

Asn GlnAsn gln

45 Gly Ala 6045 Gly Wing 60

Ser LysTo be lys

Asn AlaAsn wing

Ala AspAsp wing

Val Leu 125 Ala Ala 140Val Leu 125 Wing Wing 140

Ser LeuTo be read

Gly LeuGly Leu

Ser ValTo be val

Ala Thr 205 Glu Asp 220Wing Thr 205 Glu Asp 220

Pro Arg Gly Tyr Gly HisPro Arg Gly Tyr Gly His

Gly Met Val 15Gly Met Val 15

His Gln Ser 30His Gln Ser 30

Ser Gln AspBe Gln Asp

Val Glu ValVal Glu Val

Asn Lys Pro 80Asn Lys Pro 80

Leu Arg Ser 95Read Arg Ser 95

Thr Ile Ala 110Thr Ile Wing 110

Ser Gly ThrBe gly thr

Pro Gly GlyPro gly gly

Thr Gly Ala 160Thr Gly Wing 160

Thr Val Tyr 175Thr Val Tyr 175

Val Gly Pro 190Val Gly Pro 190

Phe Ser AsnPhe Ser Asn

Gly Gly GlyGly Gly Gly

Ile Gly Ser 240Ile Gly Ser 240

Asn Met ProAsn met pro

255 Glu Pro Tyr 270 <213> Arabidopsis thaliana <400> 182 atggctggtc gatctccacc catttcaccg ggtggaggat ggtcgtcgtc atcacgcgcg gatgttttcg agcggtagcg gtgacgctac gcacctcccg ggaggaagcg tttactaatg ggaggaggat ggacttccgt ggttggccgg <210> 183 <211> 292 <212> PRT <213> Arabidopsis thaliana <400> 183255 Glu Pro Tyr 270 <213> Arabidopsis thaliana <400> 182 atggctggtc gatctccacc catttcaccg ggtggaggat ggtcgtcgtc atcacgcgcg gatgttttcg agcggtagcg gtgacgctac gcacctcccg ggaggaagcg tttactaatg ggaggaggat ggacttccgt ggttggccgg <210> 183 <211> 292 <212> PRT <213> Arabidopsis thaliana <400> 183

Met Ala Gly Leu Asp Leu Gly Thr Ala Phe Arg Tyr Val Asn His Gln 1 5 10 15 Leu His Arg Pro Asp Leu His Leu His His Asn Ser Ser Ser Asp Asp 20 25 30 Val Thr Pro Gly Ala Gly Met Gly His Phe Thr Val Asp Asp Glu Asp 35 40 45 Asn Asn Asn Asn His Gln Gly Leu Asp Leu Ala Ser Gly Gly Gly Ser 50 55 60 Gly Ser Ser Gly Gly Gly Gly Gly His Gly Gly Gly Gly Asp Val Val 65 70 75 80 Gly Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser Lys Asn Lys Pro Lys 85 90 95 Pro Pro Val Ile Ile Thr Arg Glu Ser Ala Asn Thr Leu Arg Ala His 100 105 110 Ile Leu Glu Val Thr Asn Gly Cys Asp Val Phe Asp Cys Val Ala Thr 115 120 125 Tyr Ala Arg Arg Arg Gln Arg Gly Ile Cys Val Leu Ser Gly Ser Gly 130 135 140 Thr Val Thr Asn Val Ser Ile Arg Gln Pro Ser Ala Ala Gly Ala Val 145 150 155 160 Val Thr Leu Gln Gly Thr Phe Glu Ile Leu Ser Leu Ser Gly Ser Phe 165 170 175 Leu Pro Pro Pro Ala Pro Pro Gly Ala Thr Ser Leu Thr Ile Phe Leu 180 185 190 Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Glu Leu 195 200 205 Thr Ala Ala Gly Pro Val Ile Val Ile Ala Ala Ser Phe Thr Asn Val 210 215 220 Ala Tyr Glu Arg Leu Pro Leu Glu Glu Asp Glu Gln Gln Gln Gln Leu 225 230 235 240 Gly Gly Gly Ser Asn Gly Gly Gly Asn Leu Phe Pro Glu Val Ala Ala 245 250 255 Gly Gly Gly Gly Gly Leu Pro Phe Phe Asn Leu Pro Met Asn Met Gln 260 265 270 Pro Asn Val Gln Leu Pro Val Glu Gly Trp Pro Gly Asn Ser Gly Gly 275 280 285Met Ally Gly Leu Asp Leu Gly Thr Ala Phe Arg Tyr Val Asn His Gln 1 5 10 15 Leu His Arg Pro Asp Leu His Leu His His Asn Be Ser Asp Asp 20 25 30 Val Thr Pro Gly Ala Gly Met Gly His Phe Thr Val Asp Asp Glu Asp 35 40 45 Asn Asn Asn Asn Asn His Gln Gly Leu Asp Leu Wing Be Gly Gly Gly Be 50 55 60 Gly Be Gly Gly Gly Gly Gly Gly Gly Gly Asp Val Val 70 70 75 80 Gly Arg Arg Pro Gly Arg Pro Gly Pro Pro Gly As Lys Asn Lys Pro 90 90 95 Pro Pro Val Ile Ile Thr Arg Glu Be Wing Asn Thr Leu Arg Wing His 100 105 110 Ile Leu Glu Val Thr Asn Gly Cys Asp Val Phe Asp Cys Val Ala Thr 115 120 125 Tyr Wing Arg Arg Arg Gln Arg Gly Ile Cys Val Leu Be Gly Ser Gly 130 135 140 Thr Val Thr Asn Val Ser Ile Arg Gln Pro Be Wing Gly Wing Val 145 150 155 160 Val Thr Leu Gln Gly Thr Phe Glu Ile Read It Be Read It Be Gly Be Phe 165 170 175 Read It Pro Pro Pro Wing Pro Pro Gly A la Thr Be Leu Thr Ile Phe Leu 180 185 190 Wing Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val Val Gly Glu Leu 195 200 205 Thr Wing Wing Gly Pro Val Ile Val Ile Wing Wing Be Phe Thr Asn Val 210 215 220 Wing Gyr Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gn Met Asn Met Gln 260 265 270 Pro Asn Val Gln Read Pro Val Glu Gly Trp Pro Gly Asn Ser Gly Gly 275 280 285

Arg Gly Pro PheArg Gly Pro Phe

290 <210> 184 <211> 918 <212> DNA290 <210> 184 <211> 918 <212> DNA

ttgatctagg cacagctttt cgttacgtta atcaccagct ccatcgtccc 60ttgatctagg cacagctttt cgttacgtta atcaccagct ccatcgtccc 60

ttcaccacaa ttcctcctcc gatgacgtca ctcccggagc cgggatgggt 120ttcaccacaa ttcctcctcc gatgacgtca ctcccggagc cgggatgggt 120

tcgacgacga agacaacaac aacaaccatc aaggtcttga cttagcctct 180tcgacgacga agacaacaac aacaaccatc aaggtcttga cttagcctct 180

caggaagctc tggaggagga ggaggtcacg gcgggggagg agacgtcgtt 240caggaagctc tggaggagga ggaggtcacg gcgggggagg agacgtcgtt 240

cacgtggcag accaccggga tccaagaaca aaccgaaacc tccggtaatt 300cacgtggcag accaccggga tccaagaaca aaccgaaacc tccggtaatt 300

agagcgcaaa cactctaaga gctcacattc ttgaagtaac aaacggctgc 360agagcgcaaa cactctaaga gctcacattc ttgaagtaac aaacggctgc 360

actgcgttgc gacttatgct cgtcggagac agcgagggat ctgcgttctg 420actgcgttgc gacttatgct cgtcggagac agcgagggat ctgcgttctg 420

gaacggtcac gaacgtcagc atacgtcagc catctgcggc tggagcggtt 480gaacggtcac gaacgtcagc atacgtcagc catctgcggc tggagcggtt 480

aaggaacgtt cgagattctt tctctctccg gatcgtttct tcctcctccg 540aaggaacgtt cgagattctt tctctctccg gatcgtttct tcctcctccg 540

gagcaacgag tttgacaatt ttcttagccg gaggacaagg tcaggtggtt 600gagcaacgag tttgacaatt ttcttagccg gaggacaagg tcaggtggtt 600

ttgtgggtga gcttacggcg gctggaccgg tgattgtgat tgcagcttcg 660ttgtgggtga gcttacggcg gctggaccgg tgattgtgat tgcagcttcg 660

ttgcttatga gagacttcct ttagaagaag atgagcagca gcaacagctt 720ttgcttatga gagacttcct ttagaagaag atgagcagca gcaacagctt 720

ctaacggcgg aggtaatttg tttccggagg tggcagctgg aggaggagga 780ctaacggcgg aggtaatttg tttccggagg tggcagctgg aggaggagga 780

tctttaattt accgatgaat atgcaaccaa atgtgcaact tccggtggaa 840tctttaattt accgatgaat atgcaaccaa atgtgcaact tccggtggaa 840

ggaattccgg tggaagaggt cctttctga 879 <213> Oryza sativa <400> 184ggaattccgg tggaagaggt cctttctga 879 <213> Oryza sativa <400> 184

atggcaggtc tcgacctcgg caccgccgcg acgcgctacg tccaccagct caccccgacc tccagctgca gcacagctac gccaagcagc acgagccgtc cccaacggca gcggcggcgg cggcaacagc aacggcgggc cgtacgggga gggtcctcgt cgtcaggtcc tgccaccgac ggcgcggtcg gcgggcccgg gcgcgccggc cgcgggggcg cccgcctggc tccaagaaca agccgaagcc atcacgcggg agagcgccaa cacgctgcgc gcccacatcc tggaggtcgg gacgtgttcg agtgcgtctc cacgtacgcg cgccggcggc agcgcggcgt agcggcagcg gcgtggtcac caacgtgacg ctgcgtcagc cgtcggcgcc gtcgtgtcgc tgcacgggag gttcgagatc ctgtcgctct cgggctcctt ccggctcccc ccggcgccac cagcctcacc atcttcctcg ccgggggcca gtcggcggca acgtcgtcgg cgcgctctac gccgcgggcc cggtcatcgt tccttcgcca acgtcgccta cgagcgcctc ccactggagg aggaggaggc caggccggcc tgcagatgca gcagcccggc ggcggcgccg atgctggtgg gcgttcccgc cggacccgtc tgccgccggc ctcccgttct tcaacctgcc atgcccggtg gcggcggctc acagctccct cccggcgccg acggccatgg gcacggccac cgttctga <210> 185 <211> 305 <212> PRTatggcaggtc tcgacctcgg caccgccgcg acgcgctacg tccaccagct caccccgacc tccagctgca gcacagctac gccaagcagc acgagccgtc cccaacggca gcggcggcgg cggcaacagc aacggcgggc cgtacgggga gggtcctcgt cgtcaggtcc tgccaccgac ggcgcggtcg gcgggcccgg gcgcgccggc cgcgggggcg cccgcctggc tccaagaaca agccgaagcc atcacgcggg agagcgccaa cacgctgcgc gcccacatcc tggaggtcgg gacgtgttcg agtgcgtctc cacgtacgcg cgccggcggc agcgcggcgt agcggcagcg gcgtggtcac caacgtgacg ctgcgtcagc cgtcggcgcc gtcgtgtcgc tgcacgggag gttcgagatc ctgtcgctct cgggctcctt ccggctcccc ccggcgccac cagcctcacc atcttcctcg ccgggggcca gtcggcggca acgtcgtcgg cgcgctctac gccgcgggcc cggtcatcgt tccttcgcca acgtcgccta cgagcgcctc ccactggagg aggaggaggc caggccggcc tgcagatgca gcagcccggc ggcggcgccg atgctggtgg gcgttcccgc cggacccgtc tgccgccggc ctcccgttct tcaacctgcc atgcccggtg gcggcggctc acagctccct cccggcgccg acggccatgg gcacggccac cgttctga <210> 185 <211> 305 <212> PRT

<213> Oryza sativa <400> 185<213> Oryza sativa <400> 185

Met Ala Gly Leu Asp Leu Gly Thr Ala Ala Thr Arg 15 10Met Wing Gly Leu Asp Leu Gly Thr Wing Ala Thr Arg 15 10

Leu His His Leu His Pro Asp Leu Gln Leu Gln HisLeu His His Leu His Pro Asp Leu Gln Leu Gln His

20 2520 25

Gln His Glu Pro Ser Asp Asp Asp Pro Asn Gly SerGln His Glu Pro As Asp Asp Asp Pro Asn Gly Ser

35 4035 40

Asn Ser Asn Gly Gly Pro Tyr Gly Asp His Asp GlyAsn Ser Asn Gly Gly Pro Tyr Gly Asp His Asp Gly

50 55 6050 55 60

Ser Gly Pro Ala Thr Asp Gly Ala Val Gly Gly Pro 65 70 75Ser Gly Pro Wing Thr Asp Gly Wing Val Gly Gly Pro 65 70 75

Ala Arg Arg Pro Arg Gly Arg Pro Pro Gly Ser LysWing Arg Arg Pro Arg Gly Arg Pro Gly Ser Lys

85 9085 90

Pro Pro Val Ile Ile Thr Arg Glu Ser' Ala Asn ThrPro Pro Val Ile Ile Thr Arg Glu Be 'Wing Asn Thr

100 105100 105

Ile Leu Glu Val Gly Ser Gly Cys Asp Val Phe GluIle Leu Glu Val Gly Ser Gly Cys Asp Val Phe Glu

115 120115 120

Tyr Ala Arg Arg Arg Gln Arg Gly Val Cys Val Leu 130 135 140Tyr Wing Arg Arg Arg Gln Arg Gly Val Cys Val Leu 130 135 140

Val Val Thr Asn Val Thr Leu Arg Gln Pro Ser Ala 145 150 155Val Val Thr Asn Val Thr Read Arg Gln Pro Ser Wing 145 150 155

Val Val Ser Leu His Gly Arg Phe Glu Ile Leu SerVal Val Ser Read His Gly Arg Phe Glu Ile Read Ser

165 170165 170

Phe Leu Pro Pro Pro Ala Pro Pro Gly Ala Thr SerPhe Leu Pro Pro Pro Pro Wing Gly Pro Wing Thr

180 185180 185

Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly AsnRead Wing Gly Gly Gly Gln Gly Gly Val Gly Gly Asn

195 200195 200

Leu Tyr Ala Ala Gly Pro Val Ile Val Ile Ala Ala 210 215 220Leu Tyr Wing Gly Pro Wing Val Ile Val Ile Wing 210 215 220

Val Ala Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu 225 230 235Val Wing Tyr Glu Arg Leu Pro Leu Glu Glu Glu Glu 225 230 235

Gln Ala Gly Leu Gln Met Gln Gln Pro Gly Gly GlyGln Wing Gly Leu Gln Met Gln Gln Pro Gly Gly Gly

■ 245 250■ 245 250

Gly Met Gly Gly Ala Phe Pro Pro Asp Pro Ser AlaGly Met Gly Gly Wing Phe Pro Pro Asp Pro Be Wing

260 265260 265

Phe Phe Asn Leu Pro Leu Asn Asn Met Pro Gly GlyPhe Phe Asn Leu Pro Leu Asn Asn Met Pro Gly Gly

275 280275 280

Leu Pro Pro Gly Ala Asp Gly His Gly Trp Ala Gly 290 295 300Read Pro Pro Gly Wing Asp Gly His Gly Trp Wing Gly 290 295 300

Phe 305Phe 305

ccaccacctc cgacgacgac ccatgacggc cgacgtggtg gccggtgatc gagcggctgc gtgcgtgctg cgcgggcgcc cctcccgccg gggacaggtc catcgcggcg gccgccgccg catgggtggc gctcaacaac ctgggccggcccccacctc cgacgacgac ccatgacggc cgacgtggtg gccggtgatc gagcggctgc gtgcgtgctg cgcgggcgcc cctcccgccg gggacaggtc catcgcggcg gccgccgcggggggggg

Tyr Val His 15Tyr Val His 15

Ser Tyr Ala 30Ser Tyr Wing 30

Gly Gly Gly 45Gly Gly Gly 45

Gly Ser SerGly Ser Ser

Gly Asp ValGly Asp Val

Asn Lys Pro 95Asn Lys Pro 95

Leu Arg Ala 110 Cys Val Ser 125Read Arg Wing 110 Cys Val Ser 125

Ser Gly SerBe gly be

Pro Ala GlyPro Wing Gly

Leu Ser Gly 175Read Ser Gly 175

Leu Thr Ile 190Read Thr Ile 190

Val Val Gly 205Val Val Gly 205

Ser Phe AlaBe Phe Ala

Ala Pro ProPro Pro Wing

Ala Asp Ala 255Wing Asp Wing 255

Ala Gly LeuWing Gly Leu

270 Gly Gly Ser 285270 Gly Gly Ser 285

Ala Arg ProArg Pro Wing

GlnGln

LysLys

GlyGly

SerTo be

Val 80 LysVal 80 Lys

HisHis

ThrThr

GlyGly

Ala 160 SerWing 160 Ser

PhePhe

AlaAllah

AsnAsn

Pro 240 GlyPro 240 Gly

ProPro

GlnGln

ProPro

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 918 <210> 186 <211> 858 <212> DNA60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 918 <210> 186 <211> 858 <212> DNA

<213> Arabidopsis thaliana <400> 186<213> Arabidopsis thaliana <400> 186

atggctggtc tcgatctagg cacaacttct cgctacgtcc acaacgtcga tggtggcggc 60atggctggtc tcgatctagg cacaacttct cgctacgtcc acaacgtcga tggtggcggc 60

ggcggacagt tcaccaccga caaccaccac gaagatgacg gtggcgctgg aggaaaccac 120ggcggacagt tcaccaccga caaccaccac gaagatgacg gtggcgctgg aggaaaccac 120

catcatcacc atcataatca taatcaccat caaggtttag atttaatagc ttctaatgat 180catcatcacc atcataatca taatcaccat caaggtttag atttaatagc ttctaatgat 180

aactctggac taggcggcgg tggaggagga gggagcggtg acctcgtcat gcgtcggcca 240aactctggac taggcggcgg tggaggagga gggagcggtg acctcgtcat gcgtcggcca 240

cgtggccgtc cagctggatc gaagaacaaa ccgaagccgc cggtgattgt cacgcgcgag 300cgtggccgtc cagctggatc gaagaacaaa ccgaagccgc cggtgattgt cacgcgcgag 300

agcgcaaaca ctcttagggc tcacattctt gaagttggaa gtggctgcga cgttttcgaa 360agcgcaaaca ctcttagggc tcacattctt gaagttggaa gtggctgcga cgttttcgaa 360

tgtatctcca cttacgctcg tcggagacag cgcgggattt gcgttttatc cgggacggga 420tgtatctcca cttacgctcg tcggagacag cgcgggattt gcgttttatc cgggacggga 420

accgtcacta acgtcagcat ccgtcagcct acggcggccg gagctgttgt gactctgcgg 480accgtcacta acgtcagcat ccgtcagcct acggcggccg gagctgttgt gactctgcgg 480

ggtacttttg agattctttc cctctccgga tcttttcttc cgccacctgc tcctccaggg 540ggtacttttg agattctttc cctctccgga tcttttcttc cgccacctgc tcctccaggg 540

gcgactagct tgacgatatt cctcgctgga gctcaaggac aggtcgtcgg aggtaacgta 600gcgactagct tgacgatatt cctcgctgga gctcaaggac aggtcgtcgg aggtaacgta 600

gttggtgagt taatggcggc ggggccggta atggtcatgg cagcgtcttt tacaaacgtg 660gttggtgagt taatggcggc ggggccggta atggtcatgg cagcgtcttt tacaaacgtg 660

gcttacgaaa ggttgccttt ggacgagcat gaggagcact tgcaaagtgg cggcggcgga 720gcttacgaaa ggttgccttt ggacgagcat gaggagcact tgcaaagtgg cggcggcgga 720

ggtggaggga atatgtactc ggaagccact ggcggtggcg gagggttgcc tttctttaat 780ggtggaggga atatgtactc ggaagccact ggcggtggcg gagggttgcc tttctttaat 780

ttgccgatga gtatgcctca gattggagtt gaaagttggc aggggaatca cgccggcgcc 840ttgccgatga gtatgcctca gattggagtt gaaagttggc aggggaatca cgccggcgcc 840

ggtagggctc cgttttag 858 <210> 187 <211> 285ggtagggctc cgttttag 858 <210> 187 <211> 285

<212> PRT <213> Arabidopsis thaliana <400> 187<212> PRT <213> Arabidopsis thaliana <400> 187

Met Ala Gly Leu Asp Leu Gly Thr Thr Ser Arg Tyr Val His Asn Val 1 5 10 15 Asp Gly Gly Gly Gly Gly Gln Phe Thr Thr Asp Asn His His Glu Asp 20 25 30 Asp Gly Gly Ala Gly Gly Asn His His His His His His Asn His Asn 35 40 45 His His Gln Gly Leu Asp Leu Ile Ala Ser Asn Asp Asn Ser Gly Leu 50 55 60 Gly Gly Gly Gly Gly Gly Gly Ser Gly Asp Leu Val Met Arg Arg Pro 65 70 75 80 Arg Gly Arg Pro Ala Gly Ser Lys Asn Lys Pro Lys Pro Pro Val Ile 85 90 95 Val Thr Arg Glu Ser Ala Asn Thr Leu Arg Ala His Ile Leu Glu Val 100 105 110 Gly Ser Gly Cys Asp Val Phe Glu Cys Ile Ser Thr Tyr Ala Arg Arg 115 120 125 Arg Gln Arg Gly Ile Cys Val Leu Ser Gly Thr Gly Thr Val Thr Asn 130 135 140 Val Ser Ile Arg Gln Pro Thr Ala Ala Gly Ala Val Val Thr Leu Arg 145 150 155 160 Gly Thr Phe Glu Ile Leu Ser Leu Ser Gly Ser Phe Leu Pro Pro Pro 165 170 175 Ala Pro Pro Gly Ala Thr Ser Leu Thr Ile Phe Leu Ala Gly Ala Gln 180 185 190 Gly Gln Val Val Gly Gly Asn Val Val Gly Glu Leu Met Ala Ala Gly 195 200 205 Pro Val Met Val Met Ala Ala Ser Phe Thr Asn Val Ala Tyr Glu Arg 210 215 220 Leu Pro Leu Asp Glu His Glu Glu His Leu Gln Ser Gly Gly Gly Gly 225 230 235 240 Gly Gly Gly Asn Met Tyr Ser Glu Ala Thr Gly Gly Gly Gly Gly Leu 245 250 255 Pro Phe Phe Asn Leu Pro Met Ser Met Pro Gln Ile Gly Val Glu Ser 260 265 270 Trp Gln Gly Asn His Ala Gly Ala Gly Arg Ala Pro Phe 275 280 285 <210> 188 <211> 978 <212> DNAMet Wing Gly Leu Asp Leu Gly Thr Thr Be Arg Tyr Val His Asn Val 1 5 10 15 Asp Gly Gly Gly Gly Gly Gln Phe Thr Asp Asn His His His His Asn His Asn 35 40 45 His His Gln Gly Leu Asp Leu Ile Ala Ser Asn Asp Asn As Gn Leu 50 55 60 Gly Gly Gly Gly Gly Gly Gly Gly Asp Leu Val Met Arg Pro 65 70 75 80 Arg Gly Arg Pro Wing Gly Ser Lys Asn Lys Pro Pro Lys Pro Val Ile 85 90 95 Val Thr Arg Glu Ser Wing Asn Thr Read Arg Wing His Ile Leu Glu Val 100 105 110 Gly Ser Gly Cys Asp Val Phe Glu Cys Ile Ser Thr Tyr Ala Arg Arg 115 120 125 Arg Gln Arg Gly Ile Cys Val Leu Ser Gly Thr Gly Thr Val Thr Asn 130 135 140 Val Ser Ile Arg Gln Pro Thr Wing Gly Wing Val Val Thr Leu Arg 145 150 155 160 Gly Thr Phe Glu Ile Leu Ser Leu Be Gly Ser Phe Leu Pro Pro 165 170 175 Wing Pro Pro Gly Wing Thr Be Leu Thr Ile Phe L i Wing Gly Wing Gln 180 185 190 Gly Gln Val Val Gly Gly Asn Val Val Gly Glu Leu Met Wing Wing Gly 195 200 205 Pro Val Met Val Wing Wing Ser Phe Thr Asn Val Wing Tyr Glu Arg 210 215 220 Leu Pro Leu Asp Glu His Glu His Glu His Leu Gln Be Gly Gly Gly Gly 225 230 235 240 Gly Gly Gly Gly Asn Met Tyr Be Glu Wing Thr Gly Gly Gly Gly Leu 245 250 255 Pro Phe Phe Asn Leu Pro Met Be Met Ser 260 265 270 Trp Gln Gly Asn His Wing Gly Wing Gly Wing Pro Wing Pro Phe 275 280 285 <210> 188 <211> 978 <212> DNA

<213> Medicago truncatula <4 00> 188<213> Medicago truncatula <4 00> 188

atggatcaag tagcacaagg tcgtcctctt ccacctccat cttcatcctc accatcaatt tcacaccaac caccaaacca ggcaatggga gcttaagccg aggccaaaaa agagaacgaa actcccaccg gaggaga.agg aaaagacgac ggtggtagcg ggtggtgaga tgggaagaag accaagagga agaccagcag ccacctatca tcatcacgag ggacagcgcg aacgcactcc gcaaatggat gtgacatcat ggaaagtgtg acggtctttg gtctgcatcc ttagcggaag tgggaccgtc acaaacgtga cctggtgcgg tagtcacact tcatggaaga tttgagatat ctgccgccgc ctgctccacc agcggcgtca ggattagcca ggacaggtcg tcggtggtag cgtggtggga ccgttgttag atggcagctt cctttggaaa tgctgcttat gaaaggctac ccagtgaatg tgccaggaaa tggagggtta gggtcaccgg caacagcagc agaaccagca acagcaacaa cttgtagcag ttccatggag ttcctcaaaa tcttctcaat tcatgccaat ggtggaagtg ctcgtcctcc ttttttaacc aaaaatgtta atcatgtttt tcgtttaa <210> 189 <211> 325 <212> PRTatggatcaag tagcacaagg tcgtcctctt ccacctccat cttcatcctc accatcaatt tcacaccaac caccaaacca ggcaatggga gcttaagccg aggccaaaaa agagaacgaa actcccaccg gaggaga.agg aaaagacgac ggtggtagcg ggtggtgaga tgggaagaag accaagagga agaccagcag ccacctatca tcatcacgag ggacagcgcg aacgcactcc gcaaatggat gtgacatcat ggaaagtgtg acggtctttg gtctgcatcc ttagcggaag tgggaccgtc acaaacgtga cctggtgcgg tagtcacact tcatggaaga tttgagatat ctgccgccgc ctgctccacc agcggcgtca ggattagcca ggacaggtcg tcggtggtag cgtggtggga ccgttgttag atggcagctt cctttggaaa tgctgcttat gaaaggctac ccagtgaatg tgccaggaaa tggagggtta gggtcaccgg caacagcagc agaaccagca acagcaacaa cttgtagcag ttccatggag ttcctcaaaa tcccccaat ggtggaagtg ctcggt12tctct2a2a

<213> Medicago truncatula <4 00> 189<213> Medicago truncatula <4 00> 189

ttctcactag atgaagagga acaacgaaga gaagtgctgg gttcgaaaaa gatcccacgt cgcgaaggag ctctccgtca tatcattatc tatatctagc cttccggtcc ctttagaaga gaaccatggg atcctaatgc taccagctga ttcacttaatttctcactag atgaagagga acaacgaaga gaagtgctgg gttcgaaaaa gatcccacgt cgcgaaggag ctctccgtca tatcattatc tatatctagc cttcctagaaga gaaccatggg atcctaatgc taccagctga tcc

agaccttcat acaacaaagt cggcaacaac tggaggaagt caaaccaaaa gatggaagtt gcagcgtggt accagcatcg tggctctttc tggtggacaa ggttgttatc tgaagaaaca aagtcaacaa ttcatcactt aggttattgg cacttttctcagaccttcat acaacaaagt cggcaacaac tggaggaagt caaaccaaaa gatggaagtt gcagcgtggt accagcatcg tggctctttc tggtggacaa ggttgttatc tgaagaaaca aagtcaacaa ttcatcactt aggttt

Met Asp Gln Val Ala Gln Gly Arg Pro Leu Pro Pro Pro Phe Leu Thr .1 5 10 15 Arg Asp Leu His Leu His Pro His His Gln Phe His Thr Asn His Gln 20 25 30 Thr Asn Glu Glu Glu Gln Gln Ser Gly Asn Gly Ser Leu Ser Arg Gly 35 40 45 Gln Lys Arg Glu Arg Asn Asn Glu Asp Gly Asn Asn Thr Pro Thr Gly 50 55 60 Gly Glu Gly Lys Asp Asp Gly Gly Ser Gly Ser Ala Gly Gly Gly Ser 65 70 75 80 Gly Gly Glu Met Gly Arg Arg Pro Arg Gly Arg Pro Ala Gly Ser Lys 85 90 95 Asn Lys Pro Lys Pro Pro Ile Ile Ile Thr Arg Asp Ser Ala Asn Ala 100 105 110 Leu Arg Ser His Val Met Glu Val Ala Asn Gly Cys Asp Ile Met Glu 115 120 125 Ser Val Thr Val Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Ile Leu 130 135 140 Ser Gly Ser Gly Thr Val Thr Asn Val Thr Leu Arg Gln Pro Ala Ser 145 150 155 160 Pro Gly Ala Val Val Thr Leu His Gly Arg Phe Glu Ile Leu Ser Leu 165 170 175 Ser Gly Ser Phe Leu Pro Pro Pro Ala Pro Pro Ala Ala Ser Gly Leu 180 185 190 Ala Ile Tyr Leu Ala Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val 195 200 205 Val Gly Pro Leu Leu Ala Ser Gly Pro Val Val Ile Met Ala Ala Ser 210 215 220 Phe Gly Asn Ala Ala Tyr Glu Arg Leu Pro Leu Glu Asp Glu Glu Thr 225 230 235 240 Pro Val Asn Val Pro Gly Asn Gly Gly Leu Gly Ser Pro Gly Thr Met 245 250 255 Gly Ser Gln Gln Gln Gln Gln Gln Asn Gln Gln Gln Gln Gln Leu Val 260 265 270 Ala Asp Pro Asn Ala Ser Ser Leu Phe His Gly Val Pro Gln Asn Leu 275 280 285 Leu Asn Ser Cys Gln Leu Pro Ala Glu Gly Tyr Trp Gly Gly Ser Ala 290 295 300Met Asp Gln Val Vala Gln Gly Arg Pro Pro Leu Pro Pro Phe Leu Thr .1 5 10 15 Arg Asp Leu His Leu His Pro His His Gln Phe His Thr Asn His Gln 20 25 30 Thr Asn Glu Glu Glu Gln Gln Ser Gly Asn Gly Be Read Gly Arg 35 40 45 Gln Lys Arg Glu Arg Asn Asn Glu Asp Gly Asn Asn Thr Pro Thr Gly 50 55 60 Gly Glu Gly Lys Asp Asp Gly Gly Be Wing Gly Gly Gly Be 65 70 75 80 Gly Gly Glu Met Gly Arg Arg Pro Arg Gly Arg Pro Wing Gly Ser Lys 85 90 95 Asn Lys Pro Lys Pro Ile Ile Ile Thr Arg Asp Ser Wing Asn Wing 100 105 110 Leu Arg Be His Val Met Glu Val Wing Asn Gly Cys Asp Ile Met Glu 115 120 125 Ser Val Thr Val Phe Ala Arg Arg Arg Gln Arg Gly Val Cys Ile Leu 130 135 140 Ser Gly Ser Gly Thr Val Thr Asn Val Thr Leu Arg Gln Pro Wing Ser 145 150 155 160 Pro Gly Ala Val Val Thr He Read His Gly Arg Phe Glu Ile He Read Be Leu 165 170 175 Be Gly Be Phe Leu Pro Pro A la Pro Pro Wing Wing Ser Gly Leu 180 185 190 Wing Ile Tyr Leu Wing Gly Gly Gln Gly Gln Val Val Gly Gly Ser Val 195 200 205 Val Gly Pro Leu Wing Ser Gly Pro Val Val Ile Met Wing Ala Ser 210 215 220 Phe Gly Asn Ala Wing Tyr Glu Arg Leu Pro Leu Glu Asp Glu Glu Thr 225 230 235 240 Pro Val Asn Val Pro Gly Asn Gly Gly Leu Gly Pro Gly Thr Met 245 250 255 Gly Ser Gln Gln Gln Gln Gln Gln Gln Leu Val 260 265 270 Wing Asp Pro Asn Wing Be Ser Leu Phe His Gly Val Pro Gln Asn Leu 275 280 285 Leu Asn Ser Cys Gln Leu Pro Wing Glu Gly Tyr Trp Gly Gly Ser Wing 290 295 300

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 978 Arg 30560 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 978 Arg 305

Ile MetIle met

<221> <222> <223> <400><221> <222> <223> <400>

Gly GlyGly Gly

Pro Pro Phe Leu Thr Lys Asn Val Ile His Leu Ile Thr 310 315Pro Pro Phe Leu Thr Lys Asn Val Ile His Leu Ile Thr 310 315

Phe Phe Val 325Phe Phe Val 325

<210> 190 <211> 6 <212> PRT<210> 190 <211> 6 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 1 <220><223> reason 1 <220>

VARIANTE (4) . . (4)VARIANT (4). . (4)

/substituir="Ile" 190/ replace = "Ile" 190

Gln Gly Gln Val 1Gln Gly Gln Val 1

<210> 191 <211> 15 <212> PRT<210> 191 <211> 15 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 2 <4 00> 191 Ile Leu Ser Leu 1<223> reason 2 <4 00> 191 Ile Leu Ser Leu 1

<210> 192 <211> 8 <212> PRT<210> 192 <211> 8 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 3 <4 00> 192 Asn Ala Thr Tyr 1<223> reason 3 <4 00> 192 Asn Wing Thr Tyr 1

<210> 193 <211> 12 <212> PRT <213> Seqüência <220><210> 193 <211> 12 <212> PRT <213> String <220>

<223> motivo 4 <400> 193<223> reason 4 <400> 193

Ser Phe Thr Asn Val Ala Tyr Glu Arg Leu Pro LeuSer Phe Thr Asn Val Wing Tyr Glu Arg Leu Pro Leu

PhePhe

Leu 320Read 320

Ser 5To be 5

Gly Ser Phe LeuGly Ser Phe Leu

Pro Pro 10Pro Pro 10

Pro Ala ProPro Wing Pro

Pro 15Pro 15

Glu Arg Leu Pro 5Glu Arg Leu Pro 5

artificialartificial

11

<210> 194 <211> 42 <212> PRT <213> Seqüência <220><210> 194 <211> 42 <212> PRT <213> String <220>

<223> motivo 5 <400> 194 Gly Arg Phe,Glu 1<223> reason 5 <400> 194 Gly Arg Phe, Glu 1

Ala Pro ProPro Pro Wing

1010

artificialartificial

Ile Leu Ser Leu Thr Gly Ser Phe Leu Pro Gly ProIle Leu Be Leu Thr Gly Be Phe Leu Pro Gly Pro

5 10 155 10 15

Gly Ser Thr Gly Leu Thr Ile Tyr Leu Ala Gly Gly Gln 20 25 30Gly Ser Thr Gly Leu Thr Ile Tyr Leu Wing Gly Gly Gln 20 25 30

Val Gly Gly Ser Val Val Gly 40Val Gly Gly Ser Val Val Gly 40

Gly Gln Val 35Gly Gln Val 35

<210> 195<210> 195

<211> 654<211> 654

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 195<400> 195

cttctacatc ggcttaggtg tagcaacacg actttattat tattattatt attattatta Asn Ile Pro Pro 15 Ser Asn Thr Lys 30 Arg His Phe Cys 45 Leu Arg Asn Val Gly Lys Asn Gly 80 Ser Ser Val Asn 95 His Gln Phe Procttctacatc ggcttaggtg tagcaacacg actttattat tattattatt attattatta Asn Ile Pro 15 Ser Asn Thr Lys 30 Arg His Phe Cys 45 Leu Arg Asn Val Gly Lys Asn Gly 80 Ser Ser Val Asn 95 His Gln Phe Pro

ttattttaca aaaatataaa atagatcagt ccctcaccac aagtagagca agttggtgag 120 ttattgtaaa gttctacaaa gctaatttaa aagttattgc attaacttat ttcatattac 180 aaacaagagt gtcaatggaa caatgaaaac catatgacat actataattt tgtttttatt 240 attgaaatta tataattcaa agagaataaa tccacatagc cgtaaagttc tacatgtggt 300 gcattaccaa aatatatata gcttacaaaa catgacaagc ttagtttgaa aaattgcaat 360 ccttatcaca ttgacacata aagtgagtga tgagtcataa tattattttc tttgctaccc 420 atcatgtata tatgatagcc acaaagttac tttgatgatg atatcaaaga acatttttag 480 gtgcacctaa cagaatatcc aaataatatg actcacttag atcataatag agcatcaagt 540 aaaactaaca ctctaaagca accgatggga aagcatctat aaatagacaa gcacaatgaa 600 aatcctcatc atccttcacc acaattcaaa tattatagtt gaagcatagt agta 654ttattttaca aaaatataaa atagatcagt ccctcaccac aagtagagca agttggtgag 120 ttattgtaaa gttctacaaa gctaatttaa aagttattgc attaacttat ttcatattac 180 aaacaagagt gtcaatggaa caatgaaaac catatgacat actataattt tgtttttatt 240 attgaaatta tataattcaa agagaataaa tccacatagc cgtaaagttc tacatgtggt 300 gcattaccaa aatatatata gcttacaaaa catgacaagc ttagtttgaa aaattgcaat 360 ccttatcaca ttgacacata aagtgagtga tgagtcataa tattattttc tttgctaccc 420 atcatgtata tatgatagcc acaaagttac tttgatgatg atatcaaaga acatttttag 480 gtgcacctaa cagaatatcc aaataatatg actcacttag atcataatag agcatcaagt 540 aaaactaaca ctctaaagca accgatggga aagcatctat aaatagacaa gcacaatgaa 600 aatcctcatc atccttcacc acaattcaaa tattatagtt gaagcatagt agta 654

<210> 196 <211> 51 <212> DNA<210> 196 <211> 51 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador <400> 196<223> primer <400> 196

ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga tccggtcacg g 51ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga tccggtcacg g 51

<210> 197 <211> 49 <212> DNA<210> 197 <211> 49 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador <400> 197<223> primer <400> 197

ggggaccact ttgtacaaga aagctgggtg gaatcgatcc atctcagaa 4 9ggggaccact ttgtacaaga aagctgggtg gaatcgatcc atctcagaa 4 9

<210> 198 <211> 828 <212> DNA<210> 198 <211> 828 <212> DNA

<213> Arabidopsis thaliana <400> 198<213> Arabidopsis thaliana <400> 198

atgggtggat cgatgtcgga gagagcaagg caggccaaca ttcctccact agcgggaccc 60atgggtggat cgatgtcgga gagagcaagg caggccaaca ttcctccact agcgggaccc 60

ctaaagtgtc ctcgatgcga ctccagcaac actaagttct gttactacaa caactataac 120 ctcactcagc ctcgtcactt ctgcaaaggt tgccgtcgct actggacaca agggggcgcc 180 ctgagaaacg tccctgtagg tggaggctgc cggaggaata acaagaaggg caaaaatgga 240 aatttaaaat cttcttcttc ttcgtccaaa cagtcttcct cggtcaacgc tcaaagtcct 300 agctcaggac agctaaggac aaatcatcag ttcccttttt caccaactct ttacaatctc 360 actcaactcg gaggtattgg tttgaactta gccgctacta atggcaacaa ccaagctcac 420 cagatcggtt ccagtttgat gatgagcgat ctagggtttc tccatggacg aaatacttca 480 actccgatga cgggaaacat tcatgaaaac aacaacaata ataacaatga aaacaaccta 540 atggcatccg ttggatcttt gagccccttt gctctcttcg atccaacgac ggggctatac 600 gctttccaga acgacggtaa tatcgggaac aacgttggga tatctggctc ttctacttcc 660 atggttgatt ctagggttta tcagacgcct ccggtgaaga tggaagaaca acctaatttg 720 gctaacttgt ctagaccggt ctccggtttg acgtctcctg ggaatcaaac aaatcagtac 780 ttttggcctg gttcggattt ctcgggtcct tctaatgatc tcttgtga 828ctaaagtgtc ctcgatgcga ctccagcaac actaagttct gttactacaa caactataac 120 ctcactcagc ctcgtcactt ctgcaaaggt tgccgtcgct actggacaca agggggcgcc 180 ctgagaaacg tccctgtagg tggaggctgc cggaggaata acaagaaggg caaaaatgga 240 aatttaaaat cttcttcttc ttcgtccaaa cagtcttcct cggtcaacgc tcaaagtcct 300 agctcaggac agctaaggac aaatcatcag ttcccttttt caccaactct ttacaatctc 360 actcaactcg gaggtattgg tttgaactta gccgctacta atggcaacaa ccaagctcac 420 cagatcggtt ccagtttgat gatgagcgat ctagggtttc tccatggacg aaatacttca 480 actccgatga cgggaaacat tcatgaaaac aacaacaata ataacaatga aaacaaccta 540 atggcatccg ttggatcttt gagccccttt gctctcttcg atccaacgac ggggctatac 600 gctttccaga acgacggtaa tatcgggaac aacgttggga tatctggctc ttctacttcc 660 atggttgatt ctagggttta tcagacgcct ccggtgaaga tggaagaaca acctaatttg 720 gctaacttgt ctagaccggt ctccggtttg acgtctcctg ggaatcaaac aaatcagtac 780 ttttggcctg gttcggattt ctcgggtcct tctaatgatc 828 tcttgtga

<210> 199 <211> 275 <212> PRT<210> 199 <211> 275 <212> PRT

<213> Arabidopsis thaliana <400> 199<213> Arabidopsis thaliana <400> 199

Met Gly Gly Ser Met Ser Glu Arg Ala Arg Gln Ali 15 10Met Gly Gly Be Met Be Glu Arg Wing Arg Gln Ali 15 10

Leu Ala Gly Pro Leu Lys Cys Pro Arg Cys Asp SeiRead Ally Gly Pro Read Lys Cys Pro Arg Cys Asp I Know

20 2520 25

Phe Cys Tyr Tyr Asn Asn Tyr Asn Leu Thr Gln PrcPhe Cys Tyr Tyr Asn Asn Tyr Asn Read Thr Gln Prc

35 4035 40

Lys Gly Cys Arg Arg Tyr Trp Thr Gln Gly Gly Alc 50 55 60Lys Gly Cys Arg Arg Tyr Trp Thr Gln

Pro Val Gly Gly Gly Cys Arg Arg Asn Asn Lys Lyi 65 70 75Pro Val Gly Gly Gly Cys Arg Asn Asn Lys Asn 65 70 75

Asn Leu Lys Ser Ser Ser Ser Ser Ser Lys Gln SejAsn Leu Lys Being Being Being Being Being Being Lys Gln Sej

85 9085 90

Ala Gln Ser Pro Ser Ser Gly Gln Leu Arg Thr Asr 100 105 110 Phe Ser Pro 115 Thr Leu Tyr Asn Leu 120 Thr Gln Leu Gly Gly 125 Ile Gly Leu Asn Leu 130 Ala Ala Thr Asn Gly 135 Asn Asn Gln Ala His 140 Gln Ile Gly Ser Ser Leu Met Met Ser Asp Leu Gly Phe Leu His Gly Arg Asn Thr Ser 145 150 155 160 Thr Pro Met Thr Gly 165 Asn Ile His Glu Asn 170 Asn Asn Asn Asn Asn 175 Asn Glu Asn Asn Leu 180 Met Ala Ser Val Gly 185 Ser Leu Ser Pro Phe 190 Ala Leu Phe Asp Pro 195 Thr Thr Gly Leu Tyr 200 Ala Phe Gln Asn Asp 205 Gly Asn Ile Gly Asn 210 Asn Val Gly Ile Ser 215 Gly Ser Ser Thr Ser 220 Met Val Asp Ser Arg Val Tyr Gln Thr Pro Pro Val Lys Met Glu Glu Gln Pro Asn Leu 225 230 235 240 Ala Asn Leu Ser Arg 245 Pro Val Ser Gly Leu 250 Thr Ser Pro Gly Asn 255 Gln Thr Asn Gln Tyr 260 Phe Trp Pro Gly Ser 265 Asp Phe Ser Gly Pro 270 Ser AsnGln Wing Be Pro Be Ser Gly Gln Leu Arg Thr Asr 100 105 110 Phe Be Pro 115 Thr Leu Tyr Asn Leu 120 Thr Gln Leu Gly Gly 125 Ile Gly Leu Asn Leu 130 Wing Ala Thr Asn Gly 135 Asn Gln Wing His 140 Gln Ile Gly Be Being Read Met Met Be Asp Read Gly Phe Read His Gly Arg Asn Thr Be 145 150 155 160 Thr Pro Met Thr Gly 165 Asn Ile His Glu Asn 170 Asn Asn Asn Asn Asn 175 Asn Glu Asn Asn Leu 180 Met Ala Ser Val Gly 185 Ser Leu Ser Pro Phe 190 Wing Leu Phe Asp Pro 195 Thr Thr Gly Leu Tyr 200 Wing Phe Gln Asn Asp 205 Gly Asn Ile Gly Asn 210 Asn Val Gly Ile Ser 215 Gly Ser Ser Thr Thr 220 Met Val Asp Ser Arg Val Tyr Gln Pro Pro Val Lys Met Glu Pro Gln Gln Pro Asn Leu 225 230 235 240 Wing Asn Leu Ser Arg 245 Pro Val Ser Gly Leu 250 Thr Ser Pro Gly Asn 255 Gln Thr Asn Gln Tyr 260 Phe Trp Pro Gly Ser 265 Asp Phe Ser Gly Pro 270 Ser Asn

Asp Leu Leu 275 <210> 200Asp Leu Leu 275 <210> 200

<211> <212><211> <212>

63 PRT63 PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> Domínio DOF <400> 200<223> DOF domain <400> 200

Pro Leu Ala Gly Pro Leu Lys Cys Pro Arg Cys 15 10Pro Read Gly Wing Pro Read Lys Cys Pro Arg Cys 15 10

Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Leu ThrLys Phe Cys Tyr Tyr Asn Asn Tyr Asn Leu Thr

2020

2525

Cys Lys Gly Cys Arg Arg Tyr Trp Thr Gln GlyCys Lys Gly Cys Arg Arg Tyr Trp Thr Gln Gly

3535

4040

Val Pro Val Gly Gly Gly Cys Arg Arg Asn AsnVal Pro Val Gly Gly Gly Cys Arg Arg Asn Asn

50 5550 55

<210> 201 <211> 684 <212> DNA<210> 201 <211> 684 <212> DNA

<213> Arabidopsis thaliana <400> 201<213> Arabidopsis thaliana <400> 201

atggcggaga gagcaaggca ggccaacatt cctccactag cgatgcgact ccagcaacac taagttctgt tactacaaca cgtcacttct gcaaaggttg ccgtcgctac tggacacaag cctgtaggtg gaggctgccg gaggaataac aagaagggca tcttcttctt cgtccaaaca gtcttcctcg gtcaacgctc ctaaggacaa atcatcagtt ccctttttca ccaactcttt ggtattggtt tgaacttagc cgctactaat ggcaacaacc agtttgatga tgagcgatct agggtttctc catggacgaa ggaaacattc atgaaaacaa caacaataat aacaatgaaa ggatctttga gcccctttgc tctcttcgat ccaacgacgg gacggtaata tcgggaacaa cgttgggata tctggttctt agggtttatc agacgctccg gtga <210> 202 <211> 227 <212> PRTatggcggaga gagcaaggca ggccaacatt cctccactag cgatgcgact ccagcaacac taagttctgt tactacaaca cgtcacttct gcaaaggttg ccgtcgctac tggacacaag cctgtaggtg gaggctgccg gaggaataac aagaagggca tcttcttctt cgtccaaaca gtcttcctcg gtcaacgctc ctaaggacaa atcatcagtt ccctttttca ccaactcttt ggtattggtt tgaacttagc cgctactaat ggcaacaacc agtttgatga tgagcgatct agggtttctc catggacgaa ggaaacattc atgaaaacaa caacaataat aacaatgaaa ggatctttga gcccctttgc tctcttcgat ccaacgacgg gacggtaata tcgggaacaa cgttgggata tctggttctt agggtttatc agacgctccg GTGA <210> 202 <211> 227 <212> PRT

<213> Arabidopsis thaliana <400> 202<213> Arabidopsis thaliana <400> 202

Met Ala Glu Arg Ala Arg Gln Ala Asn Ile Pro 15 10Met Glu Wing Arg Wing Arg Gln Wing Asn Ile Pro 15 10

Leu Lys Cys Pro Arg Cys Asp Ser Ser Asn ThrRead Lys Cys Pro Arg Cys Asp Being Ser Asn Thr

Asp Ser Ser Asn Thr 15Asp Ser Ser Asn Thr 15

Gln Pro Arg His Phe 30Gln Pro Arg His Phe 30

Gly Ala Leu Arg Asn 45Gly Wing Read Arg Asn 45

Lys Lys Gly Lys 60Lys Lys Gly Lys 60

cgggacccct actataacct ggggcgccct aaaatggaaa aaagtcctag acaatctcac aagctcacca atacttcaac acaacctaat ggctatacgc ctacttccatcgggacccct actataacct ggggcgccct aaaatggaaa aaagtcctag acaatctcac aagctcacca atacttcaac acaacctaat ggctatacgc ctacttccat

aaagtgtcct cactcagcct gagaaacgtc tttaaaatct ctcaggacag tcaactcgga gatcggttcc tccgatgacg ggcatccgtt tttccagaac ggttgattctaaagtgtcct cactcagcct gagaaacgtc tttaaaatct ctcaggacag tcaactcgga gatcggttcc tccgatgacg ggcatccgtt tttccagaac ggttgattct

60 120 180 240 300 360 420 480 540 600 660 68460 120 180 240 300 360 420 480 540 600 660 684

Pro Leu Ala Gly Pro 15Pro Leu Wing Gly Pro 15

Lys Phe Cys Tyr Tyr 20 25Lys Phe Cys Tyr Tyr 20 25

Asn Asn Tyr Asn Leu Thr Gln Pro Arg His PheAsn Asn Tyr Asn Read Thr Gln Pro Arg His Phe

35 4035 40

Arg Tyr Trp Thr Gln Gly Gly Ala Leu Arg AsnArg Tyr Trp Thr Gln Gly Gly Wing Read Arg Asn

50 5550 55

Gly Cys Arg Arg Asn Asn Lys Lys Gly Lys Asn 65 70 75Gly Cys Arg Arg Asn Asn Lys Lys Gly Lys Asn 65 70 75

Ser Ser Ser Ser Ser Lys Gln Ser Ser Ser ValSer Ser Ser Ser Ser Lys Gln Ser Ser Ser Val

85 9085 90

Ser Ser Gly Gln Leu Arg Thr Asn His Gln PheBeing Being Gly Gln Read Arg Thr Asn His Gln Phe

100 105100 105

Leu Tyr Asn Leu Thr Gln Leu Gly Gly Ile GlyLeu Tyr Asn Leu Thr Gln Leu Gly Gly Ile Gly

115 120115 120

Thr Asn Gly Asn Asn Gln Ala His Gln Ile GlyThr Asn Gly Asn Asn Gln Wing His Gln Ile Gly

130 135130 135

Ser Asp Leu Gly Phe Leu His Gly Arg Asn Thr 145 150 155Ser Asp Read Gly Phe Read His Gly Arg Asn Thr 145 150 155

Gly Asn Ile His Glu Asn Asn Asn Asn Asn AsnGly Asn Ile His Glu Asn Asn Asn Asn Asn Asn

165 170165 170

Met Ala Ser Val Gly Ser Leu Ser Pro Phe AlaMet Ala Ser Val Gly Ser Leu Ser Pro Phe Ala

180 185180 185

Thr Gly Leu Tyr Ala Phe Gln Asn Asp Gly AsnThr Gly Leu Tyr Ala Phe Gln Asn Asp Gly Asn

195 200195 200

Gly Ile Ser Gly Ser Ser Thr Ser Met Val AspGly Ile Be Gly Be Be Thr Be Met Val Asp

210 215210 215

Thr Leu Arg 225Thr Leu Arg 225

<210> 203 <211> 993 <212> DNA<210> 203 <211> 993 <212> DNA

<213> Arabidopsis thaliana <400> 203<213> Arabidopsis thaliana <400> 203

atgcctacga attcgaatca tcagcatcat cttcaacacc ataataagtg gccacggact agtactctct caccaacttc aaccctaacc accaccatgt cgctacctct gctggtcttc atggcggaga gagcaaggca ggccaacatt cctccactag cgatgcgact ccagcaacac taagttctgt tactacaaca cgttacttct gcaaaggttg ccgtcgctac tggacacaag cctgtaggtg gaggctgccg gaggaataac aagaagggca tcttcttctt cgtccaaaca gtcttcctcg gtcaacgctc ctaaggacaa atcatcagtt ccctttttca ccaactcttt ggtattggtt tgaacttagc cgctactaat ggcaacaacc agtttgatga tgagcgatct agggtttctc catggacgaa ggaaacattc atgaaaacaa caacaataat aacaatgaaa ggatctttga gcccctttgc tctcttcgat ccaacgacgg gacggtaata tcgggaacaa cgttgggata tctggttctt agggtttatc agacgcctcc ggtgaagatg gaagaacaac agaccggtct ccggtttgac gtctcctggg aatcaaacaa tcggatttct cgggtccttc taatgatatc ttg <210> 204 <211> 331 <212> PRTatgcctacga attcgaatca tcagcatcat cttcaacacc ataataagtg gccacggact agtactctct caccaacttc aaccctaacc accaccatgt cgctacctct gctggtcttc atggcggaga gagcaaggca ggccaacatt cctccactag cgatgcgact ccagcaacac taagttctgt tactacaaca cgttacttct gcaaaggttg ccgtcgctac tggacacaag cctgtaggtg gaggctgccg gaggaataac aagaagggca tcttcttctt cgtccaaaca gtcttcctcg gtcaacgctc ctaaggacaa atcatcagtt ccctttttca ccaactcttt ggtattggtt tgaacttagc cgctactaat ggcaacaacc agtttgatga tgagcgatct agggtttctc catggacgaa ggaaacattc atgaaaacaa caacaataat aacaatgaaa ggatctttga gcccctttgc tctcttcggggggggggggggggggggggggg

<213> Arabidopsis thaliana <400> 204<213> Arabidopsis thaliana <400> 204

Met Pro Thr Asn Ser Asn His Gln His His Leu 15 10Met Pro Thr Asn Ser Asn His Gln His His Leu 15 10

Glu Asn Gly Ser Ile Ile Ser Gly His Gly LeuGlu Asn Gly Be Ile Ile Be Gly His Gly Leu

30 Cys Lys Gly Cys Arg 45 Val Pro Val Gly Gly 60 Gly Asn Leu Lys Ser 80 Asn Ala Gln Ser Pro 95 Pro Phe Ser Pro Thr 110 Leu Asn Leu Ala Ala 125 Ser Ser Leu Met Met 140 Ser Thr Pro Met Thr 160 Asn Glu Asn Asn Leu 175 Leu Phe Asp Pro Thr 190 Ile Gly Asn Asn Val 205 Ser Arg Val Tyr Gln 22030 Cys Lys Gly Cys Arg 45 Val Pro Val Gly Gly 60 Gly Asn Leu Lys Ser 80 Asn Wing Gln Ser Pro 95 Phe Ser Pro Thr 110 Leu Asn Leu Wing Ala 125 Ser Ser Leu Met Met 140 Ser Thr Pro Met Thr 160 Asn Glu Asn Asn Leu 175 Leu Phe Asp Pro Thr 190

agcttaacga cacctctcca cgtcaaggat cgggacccct actataacct ggggcgccct aaaatggaaa aaagtcctag acaatctcac aagctcacca atacttcaac acaacctaat ggctatacgc ctacttccat ctaatttggc atcaatacttagcttaacga cacctctcca cgtcaaggat cgggacccct actataacct ggggcgccct aaaatggaaa aaagtcctag acaatctcac aagctcacca atacttcaac acaacctaat ggctatacgc ctacttccat ctaattccat

aaatggaagt agcaaaccct gggtggatcg aaagtgtcct cactcagcct gagaaacgtc tttaaaatct ctcaggacag tcaactcgga gatcggttcc tccgatgacg ggcatccgtt tttccagaac ggttgattct taacttgtct ttggcctggtaaatggaagt agcaaaccct gggtggatcg aaagtgtcct cactcagcct gagaaacgtc tttaaaatct ctcaggacag tcaactcgga gatcggttcc tccgatgacg ggcatccgtt tttccagaac ggttgattct tggtg tactgg

2020

2525

Leu Pro Pro Leu Gln Ala Asn Pro Asn Pro AsnRead Pro Pro Read Gln Wing Asn Pro Asn Pro Asn

3535

4040

Thr Ser Ala Gly Leu Pro Ser Arg Met Gly GlyThr Be Gly Wing Read Pro Be Arg Met Gly Gly

5050

5555

Ala Arg Gln Ala Asn Ile Pro Pro Leu Ala GlyWing Arg Gln Wing Asn Ile Pro Pro Read Wing Gly

Gln His Gln Leu Asn 15Gln His Gln Leu Asn 15

Val Leu Ser His Gln 30Val Leu Ser His Gln 30

His His His Val Ala 45His His His Val Wing 45

Ser Met Ala Glu Arg 60Be Met Wing Glu Arg 60

Pro Leu Lys Cys ProPro Read Lys Cys Pro

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 993 65 70 75 80 Arg Cys Asp Ser Ser 85 Asn Thr Lys Phe Cys 90 Tyr Tyr Asn Asn Tyr 95 Asn Leu Thr Gln Pro 100 Arg Tyr Phe Cys Lys 105 Gly Cys Arg Arg Tyr 110 Trp Thr Gln Gly Gly 115 Ala Leu Arg Asn Val 120 Pro Val Gly Gly Gly 125 Cys Arg Arg Asn Asn 130 Lys Lys Gly Lys Asn 135 Gly Asn Leu Lys Ser 140 Ser Ser Ser Ser Ser Lys Gln Ser Ser Ser Val Asn Ala Gln Ser Pro Ser Ser Gly Gln 145 150 155 160 Leu Arg Thr Asn His 165 Gln Phe Pro Phe Ser 170 Pro Thr Leu Tyr Asn 175 Leu Thr Gln Leu Gly 180 Gly Ile Gly Leu Asn 185 Leu Ala Ala Thr Asn 190 Gly Asn Asn Gln Ala 195 His Gln Ile Gly Ser 200 Ser Leu Met Met Ser 205 Asp Leu Gly Phe Leu 210 His Gly Arg Asn Thr 215 Ser Thr Pro Met Thr 220 Gly Asn Ile His Glu Asn Asn Asn Asn Asn Asn Asn Glu Asn Asn Leu Met Ala Ser Val 225 230 235 240 Gly Ser Leu Ser Pro 245 Phe Ala Leu Phe Asp 250 Pro Thr Thr Gly Leu 255 Tyr Ala Phe Gln Asn 260 Asp Gly Asn Ile Gly 265 Asn Asn Val Gly Ile 270 Ser Gly Ser Ser Thr 275 Ser Met Val Asp Ser 280 Arg Val Tyr Gln Thr 285 Pro Pro Val Lys Met 290 Glu Glu Gln Pro Asn 295 Leu Ala Asn Leu Ser 300 Arg Pro Val Ser Gly Leu Thr Ser Pro Gly Asn Gln Thr Asn Gln Tyr Phe Trp Pro Gly 305 310 315 320 Ser Asp Phe Ser Gly 325 Pro Ser Asn Asp Ile 330 Leu60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 993 65 70 75 80 Arg Cys Asp To Ser 85 Asn Thr Lys Phe Cys 90 105 Gly Cys Arg Arg Tyr 110 Trp Thr Gln Gly Gly 115 Wing Read Le Arg Asn Val 120 Pro Val Gly Gly 125 Cys Arg Arg Asn Asn 130 Lys Lys Gly Lys Asn 135 Gly Asn Leu Lys Be 140 Ser Be Ser Be Ser Lys Gln Ser Ser Ser Val Asn Ala Gln Ser Pro Ser Ser Gly Gln 145 150 155 160 Leu Arg Thr Asn His 165 Gln Phe Pro Phe Ser 170 Pro Thr Leu Tyr Asn 175 Leu Thr Gln Leu Gly 180 Gly Ile Gly Leu Asn 185 Leu Ala Wing Thr Asn 190 Gly Asn Asn Gln Wing 195 His Gln Ile Gly Be 200 Ser Leu Met Met Ser 205 Asp Leu Gly Phe Leu 210 His Gly Arg Asn Thr 215 Ser Thr Pro Met Thr 220 Gly Asn Asn Asn Asn Asn Asn Asn Asn Glu Asn Asn Leu Met Ala Ser Val 225 230 235 240 Gly Be Leu Ser Pro 245 Phe Ala Leu Phe Asp 250 Pro Thr Thr Gly Leu 255 Tyr Ala Phe Gln Asn 260 Asp Gly Asn Ile Gly 265 Asn Asn Val Gly Ile 270 Ser Gly Ser Ser Thr 275 Ser Met Val Asp Ser 280 Arg Val Tyr Gln Thr 285 Pro Val Lys Met 290 Glu Glu Gln Pro Asn 295 Leu Wing Asn Leu Ser 300 Arg Pro Val Ser Gly Leu Thr Be Pro Gly Asn Gln Thr Asn Gln Tyr Phe Trp Pro Gly 305 310 315 320 Be Asp Phe Be Gly 325 Pro Be Asn Asp Ile 330 Leu

<210> 205<210> 205

<211> 873<211> 873

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 205<400> 205

atgattccgg gcacgcttgc cgatggcggc ggcggaggcg ccgatgtcga tgtcggagag ggcgcggctg gcgaggatcc aagtgcccgc gctgcgactc caccaacacc aagttctgct tcccagcccc gccacttctg ccgcgcctgc cgccgctact cgcaacgtcc ccgtcggcgg cggctaccgc cgccacgcca gcgtccgcgg cgggctccgc ctcagccgcc accaccaccg tcgacgacga cgacgacgac gtcctccacc tgcgccacgc gcgatgctgg gcggcaacct ctccatcctg ccgccgctgc gccatgagcc tcggctccac cttctctggc atggcggcgg gtcgacgcgg ccggctgcta ctccgtcggc gccgccaccg cagcagatgc agagcttccc gttcttccac gccatggatc ccaccgccgg caatggcaat gccggggatg ttccagctag ggcagcggcg gcggcgaaga cggtggagag ctccaccatg gaaggctacc caaggggcat gtatggcgat catcacctcg tccagtgcaa ccacaggtaa ccatctcttg taa <210> 206 <211> 290 <212> PRTatgattccgg cgatggcggc ggcggaggcg ccgatgtcga gcacgcttgc tgtcggagag ggcgcggctg gcgaggatcc aagtgcccgc gctgcgactc caccaacacc aagttctgct tcccagcccc gccacttctg ccgcgcctgc cgccgctact cgcaacgtcc ccgtcggcgg cggctaccgc cgccacgcca gcgtccgcgg cgggctccgc ctcagccgcc accaccaccg tcgacgacga cgacgacgac gtcctccacc tgcgccacgc gcgatgctgg gcggcaacct ctccatcctg ccgccgctgc gccatgagcc tcggctccac cttctctggc atggcggcgg gtcgacgcgg ccggctgcta ctccgtcggc gccgccaccg cagcagatgc agagcttccc gttcttccac gccatggatc ccaccgccgg caatggcaat gccggggatg ttccagctag ggcagcggcg gcggcgaaga cggtggagag ctccaccatg gaaggctacc caaggggcat gtatggcgat catcacctcg tccagtgcaa ccacaggtaa ccatctcttg taa <210> 206 <211> 290 <212> PRT

<213> Oryza sativa <400> 206<213> Oryza sativa <400> 206

Met Ile Pro Gly Thr Leu Ala Asp Gly Gly Gly 15 10Met Ile Pro Gly Thr Read Wing Asp Gly Gly Gly 15 10

Gly Pro Ala Lys Pro Met Ser Met Ser Glu ArgGly Pro Wing Lys Pro Met Be Met Be Glu Arg

20 2520 25

Ile Pro Leu Pro Glu Pro Gly Leu Lys Cys ProIle Pro Read Pro Glu Pro Gly Read Lys Cys Pro

gcgcggtggg cgctgccgga acttcaacaa ggacccgcgg agcgcgccaa ccggctcgac ccaacgcgcc tccgcctcgc ccgccggcaa gcctcgagca accaggcggc gcctagacgg cgatgccatc ctggaggatagcgcggtggg cgctgccgga acttcaacaa ggacccgcgg agcgcgccaa ccggctcgac ccaacgcgcc tccgcctcgc ccgccggcaa gcctcgagca accaggcggc gcctagacgg cgatgcgcata

gccggcgaag gccggggctc ctactccctc cggcgcgctc gcccaagccg gccagcgggg cgccctcccg cgacttcgac gccaccgccc atggagacta gatggcggcg cgacggccat atcgaagaga cacctcctacgccggcgaag gccggggctc ctactccctc cggcgcgctc gcccaagccg gccagcgggg cgccctcccg cgacttcgac gccaccgccc atggagacta gatggcggcg cgacggccat atcgaagaga cact

60 120 180 240 300 360 420 480 540 600 660 720 780 840 87360 120 180 240 300 360 420 480 540 600 660 720 780 840 873

Gly Gly Gly Ala Val 15Gly Gly Gly Wing Val 15

Ala Arg Leu Ala Arg 30Arg Wing Leu Arg Wing 30

Arg Cys Asp Ser Thr 35 40 45 Asn Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Ser Leu Ser Gln Pro Arg 50 55 60 His Phe Cys Arg Ala Cys Arg Arg Tyr Trp Thr Arg Gly Gly Ala Leu 65 70 75 80 Arg Asn Val Pro Val Gly Gly Gly Tyr Arg Arg His Ala Lys Arg Ala 85 90 95 Lys Pro Lys Pro Ala Ser Ala Ala Gly Ser Ala Ser Ala Ala Thr Thr 100 105 110 Thr Ala Gly Ser Thr Pro Ala Gly Ser Thr Thr Thr Thr Thr Thr Ser 115 120 125 Ser Thr Cys Ala Thr Pro Asn Ala Pro Ala Leu Pro Ala Met Leu Gly 130 135 140 Gly Asn Leu Ser Ile Leu Pro Pro Leu Leu Arg Leu Ala Asp Phe Asp 145 150 155 160 Ala Met Ser Leu Gly Ser Thr Phe Ser Gly Met Ala Ala Ala Ala Gly 165 170 175 Lys Pro Pro Pro Val Asp Ala Ala Gly Cys Tyr Ser Val Gly Ala Ala 180 185 190 Thr Gly Leu Glu Gln Trp Arg Leu Gln Gln Met Gln Ser Phe Pro Phe 195 200 205 Phe His Ala Met Asp His Gln Ala Ala Met Ala Ala Pro Pro Pro Ala 210 215 220 Met Ala Met Pro Gly Met Phe Gln Leu Gly Leu Asp Gly Asp Gly HisArg Cys Asp Be Thr 35 40 45 Asn Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Be Read Ser Gln Pro Arg 50 55 60 His Phe Cys Arg Wing Cys Arg Arg Tyr Trp Thr Gly Gly Wing Leu 65 70 75 80 Arg Asn Val Pro Val Gly Gly Gly Tyr Arg Arg His Wing Lys Arg Wing 85 90 95 Lys Pro Lys Pro Wing Be Wing Gly Be Wing Be Wing Wing Thr Thr 100 105 110 Thr Wing Gly Wing Thr Pro Wing Gly Wing Thr Thr Ser 115 120 125 Ser Thr Cys Ala Thr Pro Asn Ala Pro Ala Leu Pro Ala Met Leu Gly 130 135 140 Gly Asn Leu Ser Ile Leu Pro Pro Leu Arg Leu Asp Phe Asp 145 150 155 160 Alle Met Ser Leu Gly Ser Thr Phe Ser Gly Met Wing Ala Wing Gly Wing 165 170 175 Lys Pro Pro Pro Val Asp Wing Gly Cys Wing Tyr Be Val Gly Wing Wing 180 185 190 Thr Gly Leu Glu Gln Trp Arg Leu Gln Met Gln Ser Phe Pro Phe 195 200 205 Phe His Wing Met Asp His Gln Wing Met Wing Wing Pro Wing Pro Pro Wing 210 215 220 Met Wing Met Pro Gly Met Phe Gln Leu Gly Leu Asp Gly Asp Gly His

225 230 235225 230 235

Gly Ser Gly Gly Gly Glu Asp Gly Gly Glu LeuGly Ser Gly Gly Gly Glu Asp Gly Gly Glu Leu

245 250245 250

Ser Ser Lys Arg Glu Gly Tyr Pro Arg Gly MetBeing Being Lys Arg Glu Gly Tyr

260 265260 265

Leu Ala Gly Gly Tyr Thr Ser Tyr Ser Ser Ala 275 280Read Wing Gly Gly Tyr Thr Be Tyr Ser Be Wing 275 280

Leu Leu 290 <210> 207 <211> 1068 <212> DNA <213> Oryza sativa <400> 207Leu Leu 290 <210> 207 <211> 1068 <212> DNA <213> Oryza sativa <400> 207

atgccgccgc atcacggcgg cctcatggcg cctcggcctg gcggcgagcg gcggcggcgg tggcggcggc ggcccgaccg ggctcgatga cggaacgggc tcggctggcg aagatcccgc tgcccgcgct gcgagtccac caacaccaag ttctgctact cagccgcgcc acttctgcaa gacgtgccgc cgctactgga aacgtccccg tcggcggcgg gtgccgccgc aacaagcgca tcgtcgacgt cggccgccgg ctcggcctcc gccaccggcg tcgaccgcca cgggtggcag cagcagcgcc gcggcggccg gcgcagctgc cgttcctggc ctcgttgcac cacccgctcg tccggtgcgt ccaggctagg gtttcccgga ttgagctcgc ctcggcggcg gcgccgccgc cgccgccgcc atcgggctag atacagcaat tccccttctt gagccgcaac gacgccatgc tacccgttcg acgcggaggc cgccgccgac gccgccggct ggcaccaagg tgcccggctc gtcgggcctg atcacgcagc gacagcaacg ctcagtccgc ggcgatgaac agctcgccga ggcaacctcc aattctgggg cggtggcaac ggcgcgggac gccaccggcg gcagcggcgc cggtgtcgct ccgggaggcg gctgatctct ccggattcaa ctcgtcgtcg tcggggaaca <210> 208 <211> 355 <212> PRTatgccgccgc atcacggcgg cctcatggcg cctcggcctg gcggcgagcg gcggcggcgg tggcggcggc ggcccgaccg ggctcgatga cggaacgggc tcggctggcg aagatcccgc tgcccgcgct gcgagtccac caacaccaag ttctgctact cagccgcgcc acttctgcaa gacgtgccgc cgctactgga aacgtccccg tcggcggcgg gtgccgccgc aacaagcgca tcgtcgacgt cggccgccgg ctcggcctcc gccaccggcg tcgaccgcca cgggtggcag cagcagcgcc gcggcggccg gcgcagctgc cgttcctggc ctcgttgcac cacccgctcg tccggtgcgt ccaggctagg gtttcccgga ttgagctcgc ctcggcggcg gcgccgccgc cgccgccgcc atcgggctag atacagcaat tccccttctt gagccgcaac gacgccatgc tacccgttcg acgcggaggc cgccgccgac gccgccggct ggcaccaagg tgcccggctc gtcgggcctg atcacgcagc gacagcaacg ctcagtccgc ggcgatgaac agctcgccga ggcaacctcc aattctgggg cggtggcaac ggcgcgggac gccaccggcg gcagcggcgc cggtgtcgct ccgggaggcg gctgatctct ccggattcaa ctcgtcgtcg tcggggaaca <210> 208 <211> 355 <212> PRT

<213> Oryza sativa <400> 208<213> Oryza sativa <400> 208

Met Pro Pro His His Gly Gly Leu Met Ala Pro 15 10Met Pro Pro His Gly Gly Leu Met Pro Wing 15 10

His HisHis his

Tyr GlyTyr gly

Thr Thr 285Thr Thr 285

Ala Met 255 Asp His 270Ala Met 255 Asp His 270

Gly AsnGly asn

240 Pro240 Pro

HisHis

HisHis

acatggtagc gcggcacggc agccggagcc tcaacaacta cgcgcggcgg ccaagtcgtc gcacgtcgtc cggcgatgat gcggcggcga tggatcccgt agcagtggcg cgccgccaat tcgccggcca tcgcatccgt gggagttctt ccggcggcaa gcggcagcgg tactgtgaacgggtagc gcggcacggc agccggagcc tcaacaacta cgcgcggcgg ccaagtcgtc gcacgtcgtc cggcgatgat gcggcggcga tggatcccgt aggaggggggggggcggggggggggggggggggggggggggg

agcggccgtc ggtgcggccg ggggctcaag ctcgctctcg agcgctccgc caagtcgtcc gtccacatcg gccgccgcag tcactacagc cgactaccag cctcccgcag gtccggcatt gttgctggcc caagatggag gggcctcccc tggagacggc cggcggatggagcggccgtc ggtgcggccg ggggctcaag ctcgctctcg agcgctccgc caagtcgtcc gtccacatcg gccgccgcag tcactacagc cgactaccag cctcccgcag gtccggcgggggggggggggggggggggg

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 106860 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1068

Arg Pro Asp Met Val 15 Ala Ala Ala Val Ala Ala Ser Gly Gly Gly Gly Gly Gly Gly Gly Pro 20 25 30 Thr Gly Gly Thr Ala Val Arg Pro Gly Ser Met Thr Glu Arg Ala Arg 35 40 45 Leu Ala Lys Ile Pro Gln Pro Glu Pro Gly Leu Lys Cys Pro Arg Cys 50 55 60 Glu Ser Thr Asn Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Ser Leu Ser 65 70 75 80 Gln Pro Arg His Phe Cys Lys Thr Cys Arg Arg Tyr Trp Thr Arg Gly 85 90 95 Gly Ala Leu Arg Asn Val Pro Val Gly Gly Gly Cys Arg Arg Asn Lys 100 105 110 Arg Thr Lys Ser Ser Lys Ser Ser Ser Ser Thr Ser Ala Ala Gly Ser 115 120 125 Ala Ser Ala Thr Gly Gly Thr Ser Ser Ser Thr Ser Ser Thr Ala Thr 130 135 140 Gly Gly Ser Ser Ser Ala Ala Ala Ala Ala Ala Met Met Pro Pro Gln 145 150 155 160 Ala Gln Leu Pro Phe Leu Ala Ser Leu His His Pro Leu Gly Gly Gly 165 170 175 Asp His Tyr Ser Ser Gly Ala Ser Arg Leu Gly Phe Pro Gly Leu Ser 180 185 190 Ser Leu Asp Pro Val Asp Tyr Gln Leu Gly Gly Gly Ala Ala Ala Ala 195 200 205 Ala Ala Ile Gly Leu Glu Gln Trp Arg Leu Pro Gln Ile Gln Gln Phe 210 215 220 Pro Phe Leu Ser Arg Asn Asp Ala Met Pro Pro Pro Met Ser Gly Ile 225 230 235 240 Tyr Pro Phe Asp Ala Glu Ala Ala Ala Asp Ala Ala Gly Phe Ala Gly 245 250 255 Gln Leu Leu Ala Gly Thr Lys Val Pro Gly Ser Ser Gly Leu Ile Thr 260 265 270 Gln Leu Ala Ser Val Lys Met Glu Asp Ser Asn Ala Gln Ser Ala Ala 275 280 285 Met Asn Ser Ser Pro Arg Glu Phe Leu Gly Leu Pro Gly Asn Leu Gln 290 295 300 Phe Trp Gly Gly Gly Asn Gly Ala Gly Pro Gly Gly Asn Gly Asp Gly 305 310 315 320 Ala Thr Gly Gly Ser Gly Ala Gly Val Ala Pro Gly Gly Gly Gly Ser 325 330 335 Gly Gly Gly Trp Ala Asp Leu Ser Gly Phe Asn Ser Ser Ser Ser GlyArg Pro Asp Met Val 15 Ala Wing Ala Val Wing Ala Wing Be Gly Gly Gly Gly Gly Gly Pro 20 25 30 Thr Gly Gly Thr Val Val Pro Gly Be Met Thr Glu Arg Wing Arg 35 40 45 Leu Wing Lys Ile Pro Gln Pro Glu Pro Gly Read Lys Cys Pro Arg Cys 50 55 60 Glu Be Thr Asn Thr Lys Phe Cys Tyr Phe Asn Tyr Be Read Le Ser 65 70 75 80 Gln Pro Arg His Phe Cys Lys Thr Cys Arg Tyr Trp Thr Arg Gly 85 90 95 Gly Wing Read Le Arg Asn Val Pro Val Gly Gly Gly Cys Arg Arg Asn Lys 100 105 110 Arg Thr Lys Be Be Lys Be Be Be Thr Be Wing Gly Wing 115 115 125 Wing Be Wing Thr Gly Gly Thr Be Be Thr Be Be Thr Thr Wing 130 135 140 Gly Gly Be Be Be Wing Wing Wing Wing Wing Wing Wing Met Met Pro Pro Gln 145 150 155 160 Wing Gln Leu Pro Phe Leu Wing Be His His Pro Leu Gly Gly Gly 165 170 175 Asp His Tyr Ser Ser Gly Al Ser Ser Arg Read Gly Phe Pro Gly Ser Ser 180 180 190 Ser Leu Asp Pro Val Asp Tyr Gln Leu Gly Gly Gly Wing Ala Wing Ala Wing 195 200 205 Ala Wing Ile Gly Leu Glu Gln Trp Arg Leu Pro Gln Ile Gln Phe 210 215 220 Pro Phe Leu Ser Arg Asn Asp Ala Met Pro Pro Met Ser Gly Ile 225 230 235 240 Tyr Pro Phe Asp Wing Glu Wing Wing Wing Asp Wing Gly Wing Phe Wing Gly 245 250 255 Gln Leu Leu Wing Gly Thr Lys Val Pro Gly Being Ser Gly Leu Ile Thr 260 265 270 Gln Leu Wing Ser Val Lys Met Glu Asp To Be Asn Wing Gln To Be Wing 275 280 285 Met Asn To Be Pro Arg Glu Phe Leu Gly Leu Pro Gly Asn Leu Gln 290 295 300 Phe Trp Gly Gly Gly Asn Gly Wing Gly Asn Gly Asp Gly 305 310 315 320 Wing Thr Gly Gly Be Gly Wing Gly Val Val Wing Pro Gly Gly Gly Gly Ser 325 325 335 Gly Gly Gly Gly Trp Wing Asp Read Gly Phe Asn Be Ser Be Ser Gly

340 345 350340 345 350

Asn Ile Leu 355 <210> 209 <211> 1000 <212> DNAAsn Ile Leu 355 <210> 209 <211> 1000 <212> DNA

<213> Triticum aestivum <400> 209<213> Triticum aestivum <400> 209

ctcctagctc gtcgacaagc atgcccacaa agccactgat aacaagcgca tagcagcgca 60ctcctagctc gtcgacaagc atgcccacaa agccactgat aacaagcgca tagcagcgca 60

cgctctctta tagtagaatg ttctgaactc cacaccagcc catgcaagac ttccagtcca 120cgctctctta tagtagaatg ttctgaactc cacaccagcc catgcaagac ttccagtcca 120

tcccgggcct cgccgggcgg ctgttcggcg gcgcggccgc ggcagacatc cggcgcgtgc 180tcccgggcct cgccgggcgg ctgttcggcg gcgcggccgc ggcagacatc cggcgcgtgc 180

agggcccggc gtcccggtgc ggcgtgttct cgcaggcggc gtccgcgcag ccggaggcgg 240agggcccggc gtcccggtgc ggcgtgttct cgcaggcggc gtccgcgcag ccggaggcgg 240

ccgtcaagtg cccgcggtgc gagtccacca acaccaagtt ctgctactac aacaactaca 300ccgtcaagtg cccgcggtgc gagtccacca acaccaagtt ctgctactac aacaactaca 300

acctgtcgca gccgcgccac ttctgcaaga gctgccgccg gtactggacc aagggcggcg 360acctgtcgca gccgcgccac ttctgcaaga gctgccgccg gtactggacc aagggcggcg 360

tcctccgcaa cgtccccgtc ggcggcggct gccgcaaggc caagcgcagc tcctcgtcgg 420tcctccgcaa cgtccccgtc ggcggcggct gccgcaaggc caagcgcagc tcctcgtcgg 420

cgtccgcacc gtcgacgccc gcggccacgg acgccaagag ccagcggcgc gcgtccgcgt 480cgtccgcacc gtcgacgccc gcggccacgg acgccaagag ccagcggcgc gcgtccgcgt 480

cgtcctcctc ccgctccaac agcggcagcg gcagcgccag ccccacggcc gctgcggaag 540cgtcctcctc ccgctccaac agcggcagcg gcagcgccag ccccacggcc gctgcggaag 540

agacgacgac aacggagacc gagccccctc ctccgcccac gccgtcgtcc aactccaact 600agacgacgac aacggagacc gagccccctc ctccgcccac gccgtcgtcc aactccaact 600

ccaacgcggt ctccttcgcc aaccgcatga cgaactaccc cttcgcggca gacgtgccac 660ccaacgcggt ctccttcgcc aaccgcatga cgaactaccc cttcgcggca gacgtgccac 660

ctctggcgcc gatattcgcc gaccaggccg ccgcgctcgc gtccctcttc gcgccgcctc 720ctctggcgcc gatattcgcc gaccaggccg ccgcgctcgc gtccctcttc gcgccgcctc 720

ctccaccgcc tctcccggtg ttcagcttct cggcggagcc caagatggag gaggcgatcg 780ctccaccgcc tctcccggtg ttcagcttct cggcggagcc caagatggag gaggcgatcg 780

ggtcactgct gctcccgggg caggaggcgt cgcaggagcc agaggagccc acctgcacct 840 ccaccgtcgc ggacatggcg ccgttcatgt cgctggacgc ggggatcttc gagctcggcg 900ggtcactgct gctcccgggg caggaggcgt cgcaggagcc agaggagccc acctgcacct 840 ccaccgtcgc ggacatggcc ccgttcatgt cgctggacgc ggggatcttc gagctcggcg 900

acgcgtcgcc ggccgattac tggaacggcg ggagctgctg gacggacgtc caggacccgt 960acgcgtcgcc ggccgattac tggaacggcg ggagctgctg gacggacgtc caggacccgt 960

ccgtctacct accctagttt ggcttagttc ctcatcacga 1000 <210> 210ccgtctacct accctagttt ggcttagttc ctcatcacga 1000 <210> 210

<211> 291 <212> PRT <213> Triticum , aestivum <400> 210 Met Gln Asp Phe Gln Ser Ile Pro Gly Leu Ala Gly Arg Leu Phe Gly 1 5 10 15 Gly Ala Ala Ala Ala Asp Ile Arg Arg Val Gln Gly Pro Ala Ser Arg 20 25 30 Cys Gly Val Phe Ser Gln Ala Ala Ser Ala Gln Pro Glu Ala Ala Val 35 40 45 Lys Cys Pro Arg Cys Glu Ser Thr Asn Thr Lys Phe Cys Tyr Tyr Asn 50 55 60 Asn Tyr Asn Leu Ser Gln Pro Arg His Phe Cys Lys Ser Cys Arg Arg 65 70 75 80 Tyr Trp Thr Lys Gly Gly Val Leu Arg Asn Val Pro Val Gly Gly Gly 85 90 95 Cys Arg Lys Ala Lys Arg Ser Ser Ser Ser Ala Ser Ala Pro Ser Thr 100 105 110 Pro Ala Ala Thr Asp Ala Lys Ser Gln Arg Arg Ala Ser Ala Ser Ser 115 120 125 Ser Ser Arg Ser Asn Ser Gly Ser Gly Ser Ala Ser Pro Thr Ala Ala 130 135 140 Ala Glu Glu Thr Thr Thr Thr Glu Thr Glu Pro Pro Pro Pro Pro Thr 145 150 155 160 Pro Ser Ser Asn Ser Asn Ser Asn Ala Val Ser Phe Ala Asn Arg Met 165 170 175 Thr Asn Tyr Pro Phe Ala Ala Asp Val Pro Pro Leu Ala Pro Ile Phe 180 185 190 Ala Asp Gln Ala Ala Ala Leu Ala Ser Leu Phe Ala Pro Pro Pro Pro 195 200 205 Pro Pro Leu Pro Val Phe Ser Phe Ser Ala Glu Pro Lys Met Glu Glu 210 215 220 Ala Ile Gly Ser Leu Leu Leu Pro Gly Gln Glu Ala Ser Gln Glu Pro 225 230 235 240 Glu Glu Pro Thr Cys Thr Ser Thr Val Ala Asp Met Ala Pro Phe Met 245 250 255 Ser Leu Asp Ala Gly Ile Phe Glu Leu Gly Asp Ala Ser Pro Ala Asp 260 265 270 Tyr Trp Asn Gly Gly Ser Cys Trp Thr Asp Val Gln Asp Pro Ser Val 275 280 285 Tyr Leu Pro 290<211> 291 <212> PRT <213> Triticum, aestivum <400> 210 Met Gln Asp Phe Gln Being Ile Pro Gly Leu Wing Gly Arg Leu Phe Gly 1 5 10 15 Gly Wing Wing Wing Asp Ile Arg Arg Val Gln Gly Pro Wing Be Arg 20 25 30 Cys Gly Val Phe Be Gln Wing Wing Be Wing Gln Pro Glu Wing Wing Val 35 40 45 Lys Cys Pro Wing Wing Arg Thr Cys Tyr Tyr Asn 50 55 60 Asn Tyr Asn Leu Ser Gln Pro Arg His Phe Cys Lys Be Cys Arg 65 65 75 80 Tyr Trp Thr Lys Gly Gly Val Leu Arg Asn Val Pro Val Gly Gly Gly 85 90 95 Cys Arg Lys Ala Lys Arg Be Ser Be Ala Ser Ala Pro Be Thr 100 105 110 Pro Wing Wing Thr Asp Wing Lys Be Gln Arg Arg Wing Be Wing Be Ser 115 115 125 Be Wing Arg Be Asn Wing Gly Be Gly Wing Wing Be Pro Thr Wing Wing 130 135 140 Wing Glu Wing Glu Thr Wing Wing Glu Pro Pro Pro Pro Pro 145 150 155 160 Pro Ser Ser Asn Ser Asn Ser Asn Ala Val Wing Ser Phe Ala Asn Arg Met 165 170 175 Thr Asn Tyr Pro Ala Asp Val Pro Ala Wing Ala Pro Ala Ile Phe 180 185 190 Ala Asp Gln Ala Ala Leu Ala Ala Phe Ala Pro Pro Pro Pro 195 200 205 Pro Pro Leu Pro Val Phe Ser Phe Ser Glu Wing Pro Lys Met Glu Glu 210 215 220 Wing Ile Gly Ser Leu Leu Pro Gly Gln Glu Wing Ser Gln Glu Pro 225 230 235 240 Glu Glu Pro Thr Cys Thr Ser Thr Val Wing Asp Met Pro Wing Phe Met 245 250 255 Ser Leu Asp Wing Gly Ile Phe Glu Leu Gly Asp Wing Ser Pro Wing Asp 260 265 270 Tyr Trp Asn Gly Gly Ser Cys Trp Thr Asp Val Gln Asp Pro Ser Val 275 280 285 Tyr Leu Pro 290

<210> 211 <211> 1230 <212> DNA <213> Zea mays <400> 211<210> 211 <211> 1230 <212> DNA <213> Zea mays <400> 211

aggtggtggc gggggacagg ttgggggccc cgccaagccc atgtccatgg cggagcgcgc 60aggtggtggc gggggacagg ttgggggccc cgccaagccc atgtccatgg cggagcgcgc 60

gcgcctcgcg aggatcccac tgccggagcc gggactcaag tgcccgcgct gcgactcaac 120gcgcctcgcg aggatcccac tgccggagcc gggactcaag tgcccgcgct gcgactcaac 120

caacaccaag ttctgctact tcaacaacta ctccctcacg cagccgcgcc acttctgccg 180caacaccaag ttctgctact tcaacaacta ctccctcacg cagccgcgcc acttctgccg 180

ggcctgccgc cgctactgga cgcgtggcgg cgcgctccgc aacgtgccgg tcggtggcgg 240ggcctgccgc cgctactgga cgcgtggcgg cgcgctccgc aacgtgccgg tcggtggcgg 240

ataccgccgc cacgccaagc gcgccaagcc caagcagcag cagcagcacg cggccgccgg 300ataccgccgc cacgccaagc gcgccaagcc caagcagcag cagcagcacg cggccgccgg 300

gaccggagct gccaacggcg cgatgcagca gcctcccgct gggtctatgg cgtcgtcggc 360gaccggagct gccaacggcg cgatgcagca gcctcccgct gggtctatgg cgtcgtcggc 360

cgccgcctgc accgcgacca cgacgatgac gaccaacgcg ctggacgccg ggcccggcgg 420cgccgcctgc accgcgacca cgacgatgac gaccaacgcg ctggacgccg ggcccggcgg 420

catgctgccc atgctgccgc cgctcgtccg cctagcagac ttcgacgcaa tgagcctcgg 480catgctgccc atgctgccgc cgctcgtccg cctagcagac ttcgacgcaa tgagcctcgg 480

ctccagcttc tccgggatat cgtccatggg gaagcccgga tccatcggcg cggcctgcta 540ctccagcttc tccgggatat cgtccatggg gaagcccgga tccatcggcg cggcctgcta 540

cccgcactct gtcggcgggc tggagcagtg gagggtgcag cagatgcaga gcttcccgtt 600cccgcactct gtcggcgggc tggagcagtg gagggtgcag cagatgcaga gcttcccgtt 600

cttgcatgcg atggaccagg gcccgctggg gccacctctg gccatggcga tggcggcgcc 660cttgcatgcg atggaccagg gcccgctggg gccacctctg gccatggcga tggcggcgcc 660

aggagggatg ttccagctag gtctagacac caccagtgat aacagccgtg gcggtggcgg 720 cggcggctgc ggcgaagacg ggtcgtctgc gggagaggcg caccaagagg gagagctacc cggcaccacc aagagccatg tcacctcgct gctgctggtg gctacacttc ctattccacc tctcttgtaa tggccggccg atcgatcgat cgagagctca tagctagcta ctacgacgtc gtgctacgat cgtatcggtt tagcctagag atagagtgtc tctgtctgtg tgatcgatgg aaagaccagt gtagcatgca tgcacttgtt gcaatgtttg ggaggagagg ctcggtttgg atgctgatca tgcacaaata tacttcatta taaaaaaaaa aaaaaaaaaa <210> 212 <211> 302 <212> PRT <213> Zea mays <400> 212aggagggatg ttccagctag gtctagacac caccagtgat aacagccgtg gcggtggcgg 720 cggcggctgc ggcgaagacg ggtcgtctgc gggagaggcg caccaagagg gagagctacc cggcaccacc aagagccatg tcacctcgct gctgctggtg gctacacttc ctattccacc tctcttgtaa tggccggccg atcgatcgat cgagagctca tagctagcta ctacgacgtc gtgctacgat cgtatcggtt tagcctagag atagagtgtc tctgtctgtg tgatcgatgg aaagaccagt gtagcatgca tgcacttgtt gcaatgtttg ggaggagagg ctcggtttgg atgctgatca tgcacaaata tacttcatta taaaaaaaaa aaaaaaaaaa <210> 212 <211> 302 <212> PRT <213> Zea mays <400> 212

Gly Gly Gly Gly Gly Gln Val Gly Gly Pro Ala 15 10Gly Gly Gly Gly Gly Gly Gln Val Gly Gly Pro Wing 15 10

Ala Glu Arg Ala Arg Leu Ala Arg Ile Pro LeuGlu Wing Arg Wing Arg Leu Arg Wing Arg Ile Pro Leu

20 2520 25

Lys Cys Pro Arg Cys Asp Ser Thr Asn Thr LysLys Cys Pro Arg Cys Asp Being Thr Asn Thr Lys

35 4035 40

Asn Tyr Ser Leu Thr Gln Pro Arg His Phe CysAsn Tyr Being Read Thr Gln Pro Arg His Phe Cys

50 5550 55

Tyr Trp Thr Arg Gly Gly Ala Leu Arg Asn Val 65 70 75Tyr Trp Thr Arg Gly Gly Wing Read Arg Asn Val 65 70 75

Tyr Arg Arg His Ala Lys Arg Ala Lys Pro LysTyr Arg Arg His Wing Lys Arg Wing Lys Pro Lys

85 9085 90

Ala Ala Ala Gly Thr Gly Ala Ala Asn Gly AlaWing Wing Wing Wing Gly Thr Wing Wing Wing Wing Wing Wing Gly Wing

100 105100 105

Ala Gly Ser Met Ala Ser Ser Ala Ala Ala CysWing Gly Be Met Wing Be Being Wing Wing Cys Wing

115 120115 120

Met Thr Thr Asn Ala Leu Asp Ala Gly Pro GlyMet Thr Thr Asn Wing Read Asp Wing Gly Pro Gly

130 135130 135

Leu Pro Pro Leu Val Arg Leu Ala Asp Phe Asp 145 150 155Leu Pro Pro Leu Val Arg Leu Wing Asp Phe Asp 145 150 155

Ser Ser Phe Ser Gly Ile Ser Ser Met Gly LysBe Ser Phe Ser Gly Ile Ser Ser Met Gly Lys

165 170165 170

Ala Ala Cys Tyr Pro His Ser Val Gly Gly LeuWing Cys Wing Tyr Pro His Ser Val Gly Gly Leu

180 185180 185

Gln Gln Met Gln Ser Phe Pro Phe Leu His AlaGln Gln Met Gln Be Phe Pro Phe Read His Wing

195 200195 200

Leu Gly Pro Pro Leu Ala Met Ala Met Ala Ala 210 215Read Gly Pro Pro Read Met Wing Met Wing Met Wing 210 210

ctccatatga tacggcgacc aatgctgctg acaattcaag tcggttcgtt tattgttatg ctttcaagaa ttactagtgtctccatatga tacggcgacc aatgctgctg acaattcaag tcggttcgtt tattgttatg ctttcaagaa ttactagtgt

tgcaagcagc aacaccacaa caggtaacca tgtcctgcta cctacaaata atcatataga gaaactggag ctacagctgctgcaagcagc aacaccacaa caggtaacca tgtcctgcta cctacaaata atcatataga gaaactggag ctacagctgc

Gln Leu Gly Leu Asp Thr Thr Ser Asp Asn Ser 225 230 235 Gly Gly Cys Gly Glu Asp Gly Ser Ser Ala Gly 245 250 Met Gln Ala Ala Thr Lys Arg Glu Ser Tyr Pro 260 265 Met Tyr Gly Asp Gln His His Asn His Leu AlaGln Leu Gly Leu Asp Thr Thr Be Asp Asn Ser 225 230 235 Gly Gly Cys Gly Glu Asp Gly Be Ser Wing Gly 245 250 Met Gln Wing Wing Thr Lys Arg Glu Ser Tyr Pro 260 265 Met Tyr Gly Asp Allah

275275

280280

Thr Ser Tyr Ser Thr Asn Ala Ala Ala Gly AsnThr Be Tyr Be Thr Asn Wing Wing Wing Gly Wing

290 <210> 213 <211> <212>290 <210> 213 <211> <212>

295295

Lys Pro Met Ser Met 15 Pro Glu Pro Gly Leu 30 Phe Cys Tyr Phe Asn 45 Arg Ala Cys Arg Arg 60 Pro Val Gly Gly Gly 80 Gln Gln Gln Gln His 95 Met Gln Gln Pro Pro 110 Thr Ala Thr Thr Thr 125 Gly Met Leu Pro Met 140 Ala Met Ser Leu Gly 160 Pro Gly Ser Ile Gly 175 Glu Gln Trp Arg Val 190 Met Asp Gln Gly Pro 205 Pro Gly Gly Met Phe 220 Arg Gly Gly Gly Gly 240 Glu Ala Leu His Met 255 Ala Pro Pro Arg Ala 270 Ala Ala Gly Gly Tyr 285 His Leu Leu 300Lys Pro Met Be Met 15 Pro Glu Pro Gly Leu 30 Phe Cys Tyr Phe Asn 45 Arg Wing Cys Arg Arg 60 Pro Val Gly Gly 80 Gln Gln Gln His 95 Met Gln Gln Pro Pro 110 Thr Wing Thr Thr Thr 125 Gly Met Leu Pro Met 140 Wing Met Ser Leu Gly 160 Pro Gly Ser Ile Gly 175 Glu Gln Trp Arg Val 190 Met Asp Gln Gly Pro 205 Pro Gly Gly Met Phe 220 Arg Gly Gly Gly Gly Gly 240 Glu Wing Read His Met 255 Ala Pro Pro Arg Wing 270 Wing Wing Gly Gly Tyr 285 His Leu Leu 300

1243 DNA1243 DNA

<213> Solanum tuberosum <400> 213<213> Solanum tuberosum <400> 213

gaggacttat caaccttttt atataaaaga gataaagatc atcatggttt tctcatcttt tcctgtgtat ctagatcatc cagccagacg gccatcaaca aggaaatact gggctggaga cctatgcagg tgggggctag tccgggctca atcagaccag cggttagcta agattccact accggaagct ggattaaagt aacacaaagt tctgctactt caacaactac aacctttcccgaggacttat caaccttttt atataaaaga gataaagatc atcatggttt tctcatcttt tcctgtgtat ctagatcatc cagccagacg gccatcaaca aggaaatact gggctggaga cctatgcagg tgggggctag tccgggctca atcagaccag cggttagcta agattccact accggaagct ggattaaagt aacacaaagt tctgctactt caacaactac aacctttccc

aaagagatca ccaatttgca atccaactct gttctatggt gtccaaggtg aaccaagacaaaagagatca ccaatttgca atccaactct gttctatggt gtccaaggtg aaccaagaca

aagaaagaaa tcagttacaa gcagccccca ggatcgagcc tgattcaaca cttctgcaagaagaaagaaa tcagttacaa gcagccccca ggatcgagcc tgattcaaca cttctgcaag

780 840 900 960 1020 1080 1140 1200 1230780 840 900 960 1020 1080 1140 1200 1230

60 120 180 240 300 360 acctgtcgcc ggtactggac tagagggggc gccttgagaa gcgtgccggt aggaggagga 42060 120 180 240 300 360 acctgtcgcc ggtactggac tagaggggggc gccttgagaa gcgtgccggt aggaggagga 420

tgccggagga acaagagaag caaaagtaat aacaacaaca acagctcaaa gacagctggc 4 80tgccggagga acaagagaag caaaagtaat aacaacaaca acagctcaaa gacagctggc 4 80

agtaatgtca atactaatac tattgcttcc ggtacttcaa caagtgcaag tccttcaagc 540agtaatgtca atactaatac tattgcttcc ggtacttcaa caagtgcaag tccttcaagc 540

tgcagcacgg aaataatgaa tggtcgccat cacttctctc atgagcaacc accgcagtta 600tgcagcacgg aaataatgaa tggtcgccat cacttctctc atgagcaacc accgcagtta 600

actcctctca tggctgcttt ccaaaatctt aatcatcact atggcggatt tcaacctcct 660actcctctca tggctgcttt ccaaaatctt aatcatcact atggcggatt tcaacctcct 660

cctttggttt caacacacca tgggaatgga accggcgcgc ttggtcatca tcatgaaatg 720cctttggttt caacacacca tgggaatgga accggcgcgc ttggtcatca tcatgaaatg 720

ggatttcaaa tagggagtag tactaatact aacaatttac ctgtaccccc aggaggagga 780ggatttcaaa tagggagtag tactaatact aacaatttac ctgtaccccc aggaggagga 780

tctgatcatc agtggagatt accatctttg gcagcaaaca caaatttgta cccttttcaa 840tctgatcatc agtggagatt accatctttg gcagcaaaca caaatttgta cccttttcaa 840

cacggtactg atcaaggaat tcatgaatca tcatctgtta acaataataa tattaatgct 900cacggtactg atcaaggaat tcatgaatca tcatctgtta acaataataa tattaatgct 900

catgatgacc aagggttaaa ttcgaccaaa cagtttttgg gaacaatgga aaataatact 960catgatgacc aagggttaaa ttcgaccaaa cagtttttgg gaacaatgga aaataatact 960

aatcaatatt ggggtggaaa cgcatggaca gggttttctg gattaaactc atcttcttca 1020aatcaatatt ggggtggaaa cgcatggaca gggttttctg gattaaactc atcttcttca 1020

gcaagccatc tactttgatt tcattcatgt aagtcaattt gtgtacttga ctctcaacga 1080gcaagccatc tactttgatt tcattcatgt aagtcaattt gtgtacttga ctctcaacga 1080

ttaaaatgtt gtatgtgttg ggaggggggt ctaaattaga tatatagtat actgggggca 1140ttaaaatgtt gtatgtgttg ggaggggggt ctaaattaga tatatagtat actgggggca 1140

tgtttaagtc tttgttattc catggtcatt atcaccactt gtaattttac tggatgtttt 1200tgtttaagtc tttgttattc catggtcatt atcaccactt gtaattttac tggatgtttt 1200

ttttttataa cttaggtgtg tgaagttgta ttgtgagttt taa 1243 <210> 214 <211> 324 <212> PRTttttttataa cttaggtgtg tgaagttgta ttgtgagttt taa 1243 <210> 214 <211> 324 <212> PRT

<213> Solanum tuberosum <400> 214<213> Solanum tuberosum <400> 214

Met Val Phe Ser Ser Phe Pro Val Tyr Leu Asp His Pro Asn Leu His 1 5 10 15 Gln Leu Gln Gln Pro Asp Gly His Gln Gln Gly Asn Thr Gly Leu Glu 20 25 30 Asn Pro Thr Leu Gln Pro Pro Pro Met Gln Val Gly Ala Ser Pro Gly 35 40 45 Ser Ile Arg Pro Gly Ser Met Val Asp Arg Ala Arg Leu Ala Lys Ile 50 55 60 Pro Leu Pro Glu Ala Gly Leu Lys Cys Pro Arg Cys Asp Ser Thr Asn 65 70 75 80 Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Asn Leu Ser Gln Pro Arg His 85 90 95 Phe Cys Lys Thr Cys Arg Arg Tyr Trp Thr Arg Gly Gly Ala Leu Arg 100 105 110 Ser Val Pro Val Gly Gly Gly Cys Arg Arg Asn Lys Arg Ser Lys Ser 115 120 125 Asn Asn Asn Asn Asn Ser Ser Lys Thr Ala Gly Ser Asn Val Asn Thr 130 135 140 Asn Thr Ile Ala Ser Gly Thr Ser Thr Ser Ala Ser Pro Ser Ser Cys 145 150 155 160 Ser Thr Glu Ile Met Asn Gly Arg His His Phe Ser His Glu Gln Pro 165 170 175 Pro Gln Leu Thr Pro Leu Met Ala Ala Phe Gln Asn Leu Asn His His 180 185 190 Tyr Gly Gly Phe Gln Pro Pro Pro Leu Val Ser Thr His His Gly Asn 195 200 205 Gly Thr Gly Ala Leu Gly His His His Glu Met Gly Phe Gln Ile Gly 210 215 220 Ser Ser Thr Asn Thr Asn Asn Leu Pro Val Pro Pro Gly Gly Gly Ser 225 230 235 240 Asp His Gln Trp Arg Leu Pro Ser Leu Ala Ala Asn Thr Asn Leu Tyr 245 250 255 Pro Phe Gln His Gly Thr Asp Gln Gly Ile His Glu Ser Ser Ser Val 260 265 270 Asn Asn Asn Asn Ile Asn Ala His Asp Asp Gln Gly Leu Asn Ser Thr 275 280 285 Lys Gln Phe Leu Gly Thr Met Glu Asn Asn Thr Asn Gln Tyr Trp Gly 290 295 300 Gly Asn Ala Trp Thr Gly Phe Ser Gly Leu Asn Ser Ser Ser Ser AlaMet Val Phe Be Ser Phe Pro Val Tyr Leu Asp His Pro Asn Leu His 1 5 10 15 Gln Leu Gln Gln Pro Asp Gly His Gln Gly Asn Thr Gly Leu Glu 20 25 30 Asn Pro Thr Leu Gln Pro Pro Met Gln Val Gly Wing Be Pro Gly 35 40 45 Be Ile Arg Pro Gly Be Met Val Asp Arg Wing Arg Leu Wing Lys Ile 50 55 60 Pro Leu Pro Glu Wing Gly Leu Lys Cys Pro Arg Cys Asp Ser Thr Asn 65 70 75 80 Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Asn Leu Be Gln Pro Arg His 85 90 95 Phe Cys Lys Thr Cys Arg Arg Tyr Trp Thr Gly Gly Wing Leu Arg 100 105 110 Ser Val Pro Val Gly Gly Gly Cys Arg Asn Lys Arg Be Lys Ser 115 120 125 Asn Asn Asn Asn Asn Being Ser Lys Thr Wing Gly Being Asn Val Asn Thr 130 135 140 Asn Thr Ile Wing Being Gly Thr Being Thr Being Wing Being Pro Being Cys 145 150 155 160 Being Glu Ile Met Thr Asn Gly Arg His His Phe Be His Glu Gln Pro 165 170 175 Pro Gln Leu Thr Pro Leu Met Wing Al a Phe Gln Asn Leu Asn His His 180 185 190 Tyr Gly Gly Phe Gln Pro Pro Pro Leu Val Ser Thr His His Gly Asn 195 200 205 Gly Thr Gly Wing Leu Gly His His Glu Met Gly Phe Gln Ile Gly 210 215 220 Ser Ser Thr Asn Thr Asn Asn Leu Pro Val Pro Gly Gly Gly Ser 225 230 235 240 Asp His Gln Trp Arg Leu Pro Ser Leu Wing Asn Thr Asn Leu Tyr 245 250 255 Pro Phe Gln His Gly Thr Asp Gln Gly Ile His Glu Ser Ser Ser Val 260 265 270 Asn Asn Asn Asn Ile Asn Wing His Asp Asp Gln Gly Leu Asn Ser Thr 275 280 285 Lys Gln Phe Leu Gly Thr Met Glu Asn Asn Thr Asn Gln Tyr Trp Gly 290 295 300 Gly Asn Wing Trp Thr Gly Phe Ser Gly Leu Asn Ser Ser Ser Ala

305305

Ser His Leu LeuTo be his leu leu

310310

315315

320320

<210> 215 <211> 996 <212> PRT<210> 215 <211> 996 <212> PRT

<213> Arabidopsis thaliana <400> 215<213> Arabidopsis thaliana <400> 215

Ala Thr Gly Cys Cys Thr Ala Cys 1 5 Ala Thr Cys Ala Thr Cys Ala Gly 20 Thr Cys Ala Ala Cys Ala Cys Cys 35 40 Gly Ala Ala Ala Ala Thr Gly Gly 50 55 Thr Ala Ala Gly Thr Gly Gly Cys 65 70 Ala Gly Thr Ala Cys Thr Cys Thr 85 Cys Thr Thr Cys Cys Ala Cys Cys 100 Cys Ala Ala Ala Cys Cys Cys Thr 115 120 Cys Cys Ala Cys Cys Ala Cys Cys 130 135 Ala Cys Cys Thr Cys Thr Gly Cys 145 150 Cys Gly Thr Cys Ala Ala Gly Gly 165 Ala Thr Cys Gly Ala Thr Gly Gly 180 Gly Cys Ala Ala Gly Gly Cys Ala 195 200 Thr Thr Cys Cys Thr Cys Cys Ala 210 215 Ala Cys Cys Cys Cys Thr Ala Ala 225 230 Cys Gly Ala Thr Gly Cys Gly Ala 245 Ala Cys Ala Cys Thr Ala Ala Gly 260 Cys Thr Ala Cys Ala Ala Cys Ala 275 280 Cys Thr Cys Ala Cys Thr Cys Ala 290 295 Ala Cys Thr Thr Cys Thr Gly Cys 305 310 Cys Cys Gly Thr Cys Gly Cys Thr 325 Cys Ala Ala Gly Gly Gly Gly Gly 340 Gly Ala Ala Ala Cys Gly Thr Cys 355 360 Thr Gly Gly Ala Gly Gly Cys Thr 370 375 Ala Ala Thr Ala Ala Cys Ala Ala 385 390 Ala Ala Ala Ala Thr Gly Gly Ala 405 Ala Thr Cys Thr Thr Cys Thr Thr 420 Thr Cys Cys Ala Ala Ala Cys Ala 435 440 Cys Gly Gly Thr Cys Ala Ala Cys 450 455 Thr Cys Cys Thr Ala Gly Cys ThrWing Thr Gly Cys Cys Thr Wing Cys 1 5 Wing Thr Cys Wing Thr Thr Cys Wing Gly 20 Thr Cys Wing Wing Cys Wing Cys Cys 35 40 Gly Wing Wing Wing Thr Gly Gly 50 55 Wing Wing Gly Thr Gly Cys 65 70 Wing Gly Thr Cys Wing Cys Thr Cys Thr 85 Cys Thr Thr Cys Cys Wing Cys Cys 100 Cys Wing Cys Wing Cys Cys Thr 115 120 Cys Cys Wing Cys Cys Thr 130 130 Cys Wing Cys Thr Cys Thr Gly Cys 145 150 Cys Gly Thr Cys Wing Gly Wing Gly 165 Wing Thr Cys Gly Wing Gly Thr Thr Wing Gly 180 Gly Cys Wing Gly Wing Gly Cys Wing 195 200 Thr Thr Cys Wing Cys Cys Wing 210 215 Wing Cys Cys Wing Cys Thr Wing Wing 225 230 Cys Gly Wing Wing Thr Gly Cys Gly Ala 245 Cys Ala Cys Ala Cys Thr Ala Ala Gly 260 Cys Ala Cys Ala Cys Ala 275 280 Cys Ala Cys Ala Cys Thr Ala 290 295 Ala Cys Ala Cys Thr Ala Cly 305 310 Cys Ala Cys Gly Ala Cys Thr 325 Cys Wing Gly Wing Gly Gly Gly Gly 340 Gly Wing Cly Wing Cys Gly Thr Cys 355 360 Thr Wing Gly Gly Wing Gly Cly Thr 370 375 Wing Wing Thr Wing Wing Cys Wing Wing 385 390 Wing Wing Wing Wing Thr Wing Gly Gly Wing 405 Wing Wing Thr Cys Thr Wing 420 Thr Cys Wing Wing Wing Cys Wing Wing 435 440 Cys Gly Gly Thr Cys Wing Cys Wing 450 455 Thr Cys Cys Thr Wing Gly Cys Thr

117117

Gly Ala Ala Thr Thr Cys Gly Ala 10 15 Cys Ala Thr Cys Ala Thr Cys Thr 25 30 Ala Gly Cys Thr Thr Ala Ala Cys 45 Ala Ala Gly Thr Ala Thr Ala Ala 60 Cys Ala Cys Gly Gly Ala Cys Thr 75 80 Cys Thr Cys Ala Cys Cys Ala Ala 90 95 Thr Cys Thr Cys Cys Ala Ala Gly 105 110 Ala Ala Cys Cys Cys Thr Ala Ala 125 Ala Thr Gly Thr Cys Gly Cys Thr 140 Thr Gly Gly Thr Cys Thr Thr Cys 155 160 Ala Thr Gly Gly Gly Thr Gly Gly 170 175 Cys Gly Gly Ala Gly Ala Gly Ala 185 190 Gly Gly Cys Cys Ala Ala Cys Ala 205 Cys Thr Ala Gly Cys Gly Gly Gly 220 Ala Gly Thr Gly Thr Cys Cys Thr 235 240 Cys Thr Cys Cys Ala Gly Cys Ala 250 255 Thr Thr Cys Thr Gly Thr Thr Ala 265 270 Ala Cys Thr Ala Thr Ala Ala Cys 285 Gly Cys Cys Thr Cys Gly Thr Cys 300 Ala Ala Ala Gly Gly Thr Thr Gly 315 320 Ala Cys Thr Gly Gly Ala Cys Ala 330 335 Cys Gly Cys Cys Cys Thr Gly Ala 345 350 Cys Cys Thr Gly Thr Ala Gly Gly 365 Gly Cys Cys Gly Gly Ala Gly Gly 380 Gly Ala Ala Gly Gly Gly Cys Ala 395 400 Ala Ala Thr Thr Thr Ala Ala Ala 410 415 Cys Thr Thr Cys Thr Thr Cys Gly 425 430 Gly Thr Cys Thr Thr Cys Cys Thr 445 Gly Cys Thr Cys Ala Ala Ala Gly 460 Cys Ala Gly Gly Ala Cys Ala Gly 465 470 Cys Thr Ala Ala Gly Gly Ala Cys 485 Ala Gly Thr Thr Cys Cys Cys Thr 500 Ala Ala Cys Thr Cys Thr Thr Thr 515 520 Ala Cys Thr Cys Ala Ala Cys Thr 530 535 Thr Thr Gly Gly Thr Thr Thr Gly 545 550 Cys Gly Cys Thr Ala Cys Thr Ala 565 Ala Ala Cys Cys Ala Ala Gly Cys 580 Thr Cys Gly Gly Thr Thr Cys Cys 595 600 Gly Ala Thr Gly Ala Gly Cys Gly 610 615 Thr Thr Thr Cys Thr Cys Cys Ala 625 630 Ala Thr Ala Cys Thr Thr Cys Ala 645 Gly Ala Cys Gly Gly Gly Ala Ala 660 Gly Ala Ala Ala Ala Cys Ala Ala 675 680 Ala Thr Ala Ala Cys Ala Ala Thr 690 695 Cys Cys Thr Ala Ala Thr Gly Gly 705 710 Gly Gly Ala Thr Cys Thr Thr Thr 725 Thr Thr Gly Cys Thr Cys Thr Cys 740 Ala Ala Cys Gly Ala Cys Gly Gly 755 760 Gly Cys Thr Thr Thr Cys Cys Ala 770 775 Gly Thr Ala Ala Thr Ala Thr Cys 785 790 Cys Gly Thr Thr Gly Gly Gly Ala 805 Thr Cys Thr Thr Cys Thr Ala Cys 820 Thr Thr Gly Ala Thr Thr Cys Thr 835 840 Thr Cys Ala Gly Ala Cys Gly Cys 850 855 Ala Ala Gly Ala Thr Gly Gly Ala 865 870 Cys Thr Ala Ala Thr Thr Thr Gly 885 Gly Thr Cys Thr Ala Gly Ala Cys 900 Gly Gly Thr Thr Thr Gly Ala Cys 915 920 Gly Gly Ala Ala Thr Cys Ala Ala 930 935 Gly Thr Ala Cys Thr Thr Thr Thr 945 950 Thr Cys Gly Gly Ala Thr Thr ThrGly Wing Ward Thr Thr Cys Gly Wing 10 15 Cys Wing Thr Cys Wing Thr Cys Thr 25 30 Wing Gly Cys Wing Thr Thr Wing Cys 45 Wing Gly Thr Wing Wing Thr 60 Wing Cys Gly Gly Wing Wing Cys Thr 75 80 Cys Thr Cys Wing Cys Cys Wing Cys Wing 90 95 Cys Thr Wing Cys Cys Wing Gly Wing 105 110 Wing Cys Wing Cys Cys Wing Wing 125 Wing Gly Thr Wing Cys Gly Cys 140 Wing Gys Thr Thr Cly 155 Wing Wing Gys Thr Gly Gly Gly Thr Gly Gly 170 175 Cys Gly Gly Wing Gly Wing Gly Wing 185 190 Gly Gly Cys Wing Cys Wing 205 Cys Thr Wing Gly Cys Gly Gly 220 Wing Gly Thr Gly Thr Cys Thr 235 240 Cys Thr Cys Cys Wing Gly Cys Wing 250 255 Thr Thr Cys Thr Gly Thr Thr Wing 265 270 Wing Cys Thr Wing Thr Thr Wing Cys 285 Gly Cys Cys Thr Cys Gly Thr Cys 300 Wing Wing Gly Gly Thr Thr Gly 315 320 Wing Cys Thr Gly Gly Wing Cys Wing 330 335 Cys Gly Cys Cys Cys Thr Gly Wing 345 350 Cys Cys Thr Gly Th r Wing Gly Gly 365 Gly Cys Cys Gly Gly Wing Gly Gly 380 380 Gly Wing Gly Gly Gly Cys Wing 395 400 Wing Wing Thr Thr Thr Wing Wing 410 415 Cys Thr Thr Cys Thr Thr Cys 425 430 Gly Thr Cys Thr Thr Cys Cys Thr 445 Gly Cys Thr Cys Wing Gly Wing 460 Cys Wing Gly Gly Wing Cys Wing Gly 465 470 Cys Thr Wing Gly Wing Gly Cys 485 Wing Gly Thr Thr Cys Cys Thr 500 Wing Cys Thr Wing Cys Thr Thr Thr 515 520 Wing Cys Thr Cys Wing Wing Cys Thr Wing 530 535 Thr Thr Gly Gly Wing Thr Thr Gly 545 550 Cys Gly Wing Cys Thr Wing Wing 565 Wing Cys Wing Cys Wing Wing Gly Cys Wing 580 Thr Cys Gly Wing Wings Thr Cys 595 600 Gly Wing Wing Thr Gly Wing Gly Cys Gly 610 615 Thr Thr Thr Cys Thr Cys Cys Wing 625 630 Wing Thr Thr Cys Wing Thr Thr Cys Wing 645 Gly Wing Cys Gly Gly Wing 660 Gly Wing Wing Cys Wing Wing 675 680 Wing Thr Wing Wing Cys Wing Ala Thr 690 695 Cys Wing Ala Thr Gly Gly 705 710 Gly Gly Wing Thr Thr Cys Thr Thr 725 Thr Thr Gly Cys Thr Thr Cys 740 Wing Gly Cys Wing Thr Cys Gly 755 760 Gly Cys Wing Thr Thr Cys Wing 770 775 Gly Wing Wing Thr Thr Cys 785 790 Cys Gly Thr Thr Gly Gly Wing 805 Thr Cys Thr Thr Cys Thr Wing Cys 820 Thr Thr Gly Wing Thr Thr Cys Thr 835 840 Thr Cys Wing Gly Wing Cys Gly Cys 850 855 Wing Gly Wing Thr Gly Gly Wing 865 870 Cys Thr Wing Thr Thr Wing Gly 885 Gly Thr Cys Thr Wing Gly Wing Cys 900 Gly Wing Thr Thr Thr Gly Wing Cys 915 920 Gly Wing Wing Thr Thr Cys Wing 930 935 Gly Wing Wing Cys Thr Thr Thr Wing 945 950 Thr Cys Gly Gly Wing Wing Thr Thr Thr

965965

475 480 Ala Ala Ala Thr Cys Ala Thr Cys 490 495 Thr Thr Thr Thr Cys Ala Cys Cys 505 510 Ala Cys Ala Ala Thr Cys Thr Cys 525 Cys Gly Gly Ala Gly Gly Thr Ala 540 Ala Ala Cys Thr Thr Ala Gly Cys 555 560 Ala Thr Gly Gly Cys Ala Ala Cys 570 575 Thr Cys Ala Cys Cys Ala Gly Ala 585 590 Ala Gly Thr Thr Thr Gly Ala Thr 605 Ala Thr Cys Thr Ala Gly Gly Gly 620 Thr Gly Gly Ala Cys Gly Ala Ala 635 640 Ala Cys Thr Cys Cys Gly Ala Thr 650 655 Ala Cys Ala Thr Thr Cys Ala Thr 665 670 Cys Ala Ala Cys Ala Ala Thr Ala 685 Gly Ala Ala Ala Ala Cys Ala Ala 700 Cys Ala Thr Cys Cys Gly Thr Thr 715 720 Gly Ala Gly Cys Cys Cys Cys Thr 730 735 Thr Thr Cys Gly Ala Thr Cys Cys 745 750 Gly Gly Cys Thr Ala Thr Ala Cys 765 Gly Ala Ala Cys Gly Ala Cys Gly 780 Gly Gly Gly Ala Ala Cys Ala Ala 795 800 Thr Ala Thr Cys Thr Gly Gly Thr 810 815 Thr Thr Cys Cys Ala Thr Gly Gly 825 830 Ala Gly Gly Gly Thr Thr Thr Ala 845 Cys Thr Cys Cys Gly Gly Thr Gly 860 Ala Gly Ala Ala Cys Ala Ala Cys 875 880 Gly Cys Thr Ala Ala Cys Thr Thr 890 895 Cys Gly Gly Thr Cys Thr Cys Cys 905 910 Gly Thr Cys Thr Cys Cys Thr Gly 925 Ala Cys Ala Ala Ala Thr Cys Ala 940 Gly Gly Cys Cys Thr Gly Gly Thr 955 960 Cys Thr Cys Gly Gly Gly Thr Cys 970 975 Cys Thr Thr Cys Thr Ala Ala Thr Gly Ala Thr Cys Thr Cys Thr Thr 980 985 990 Gly Thr Gly Ala 995 <210> 216 <211> 275 <212> PRT <213> Arabidopsis thaliana <400> 216 Met Gly Gly Ser Met Ala Glu Arg Ala Arg Gln Ala Asn Ile Pro Pro 1 5 10 15 Leu Ala Gly Pro Leu Lys Cys Pro Arg Cys Asp Ser Ser Asn Thr Lys 20 25 30 Phe Cys Tyr Tyr Asn Asn Tyr Asn Leu Thr Gln Pro Arg His Phe Cys 35 40 45 Lys Gly Cys Arg Arg Tyr Trp Thr Gln Gly Gly Ala Leu Arg Asn Val 50 55 60 Pro Val Gly Gly Gly Cys Arg Arg Asn Asn Lys Lys Gly Lys Asn Gly 65 70 75 80 Asn Leu Lys Ser Ser Ser Ser Ser Ser Lys Gln Ser Ser Ser Val Asn 85 90 95 Ala Gln Ser Pro Ser Ser Gly Gln Leu Arg Thr Asn His Gln Phe Pro 100 105 110 Phe Ser Pro Thr Leu Tyr Asn Leu Thr Gln Leu Gly Gly Ile Gly Leu 115 120 125 Asn Leu Ala Ala Thr Asn Gly Asn Asn Gln Ala His Gln Ile Gly Ser 130 135 140 Ser Leu Met Met Ser Asp Leu Gly Phe Leu His Gly Arg Asn Thr Ser 145 150 155 160 Thr Pro Met Thr Gly Asn Ile His Glu Asn Asn Asn Asn Asn Asn Asn 165 170 175 Glu Asn Asn Leu Met Ala Ser Val Gly Ser Leu Ser Pro Phe Ala Leu 180 185 190 Phe Asp Pro Thr Thr Gly Leu Tyr Ala Phe Gln Asn Asp Gly Asn Ile 195 200 205 Gly Asn Asn Val Gly Ile Ser Gly Ser Ser Thr Ser Met Val Asp Ser 210 215 220 Arg Val Tyr Gln Thr Pro Pro Val Lys Met Glu Glu Gln Pro Asn Leu 225 230 235 240 Ala Asn Leu Ser Arg Pro Val Ser Gly Leu Thr Ser Pro Gly Asn Gln 245 250 255 Thr Asn Gln Tyr Phe Trp Pro Gly Ser Asp Phe Ser Gly Pro Ser Asn 260 265 270 Asp Leu Leu475 480 Wing Thr Cys Wing Thr Cys Wing 490 495 Thr Thr Thr Cys Wing Cys Cys 505 510 Wing Cys Wing Cys Thr Thr Wing 525 Cys Gly Gly Wing Gly Gly Thr Wing 540 Wing Cys Wing Thr Thr Wing Gly Cys 555 560 Wing Gly Gly Cys Wing Wing Cys Wing 570 575 Thr Cys Wing Cys Cys Wing Wing Gly Wing 585 590 Wing Gly Wing Thr Thr Gly Wing Wing 605 Wing Thr Thr Cys Wing Wing Gly Gly Wing 620 Wing Gly Gly Wing Cys Gly Wing Wing 635 640 Wing Cys Wing Thr Cys Cly Wing Gly Wing Thr 650 655 Cys Wing Wing Thr Thr Cys Wing Wing Thr 665 670 Cys Wing Cys Wing Wing Thr Thr Wing 685 Gly Wing Wing Cys Wing Wing 700 Cys Wing Thr Cys Wing Cly Gly Thr Thr 715 720 Gly Wing Gly Cys Wing Cys Cys Cys Thr 730 735 Thr Cys Thr Gly Wing Cys Cys Thr 745 750 Gly Gly Cys Thr Wing Thr Cys 765 Gly Wing Cys Gly Wing Cys Gly 780 Gly Gly Wing Cys Wing 795 800 Thr Thr Wing Cys Thr Gly Gly Thr 810 815 Thr Thr Cys Cys Wing Thr Gly Gly 825 830 Wing Gly Gly Gly Thr Thr Wing Wing 845 Cys Thr Cys Wing Cys Gly Gly Thr Wing 860 Gly Wing Wing Cys Wing Wing Cys Wing 875 880 Gly Cys Wing Wing Cys Thr Wing Wing 890 895 Cys Gly Gly Wing Wing Cys 905 910 Gly Thr Wing Cys Thr Cys Cys Thr Gly 925 Wing Cys Ward Wing Cys Thr Wing 940 Gly Gly Cys Wing Cys Thr Gly Gly 955 960 Cys Thr Cys Gly Gly Thr 970 975 Cys Thr Thr Cys Wing Gly Thr Cys Thr Wing Thr Thr 980 985 990 Gly Thr Gly Wing 995 <210> 216 <211> 275 <212> PRT <213> Arabidopsis thaliana <400> 216 Met Gly Gly Be Met Wing Glu Arg Wing Arg Gln Wing Asn Ile Pro Pro 1 5 10 15 Leu Wing Gly Pro Leu Lys Cys Pro Arg Cys Asp Being Ser Asn Thr Lys 20 25 30 Phe Tys Tyr Asn Asn Tyr Asn Leu Thr Gln Pro His Phe Cys 35 40 45 Lys Gly Cys Arg Tyr Trp Thr Gln Gly Gly Wing Read Arg A sn Val 50 55 60 Pro Val Gly Gly Gly Cys Arg Arg Asn Asn Lys Lys Gly Lys Asn Gly 65 70 75 80 Asn Leu Lys Be Ser Ser Ser Ser Ser Lys Gln Ser Ser Ser Val Asn 85 90 95 Gly Gln Leu Arg Thr Asn His Gln Phe Pro 100 105 110 Phe Ser Pro Thr Leu Tyr Asn Leu Thr Gln Leu Gly Ile Gly Leu 115 120 125 Asn Leu Wing Ala Thr Asn Gly Asn Gln Wing His Gln Ile Gly Ser 130 135 140 Be Read Met Met Be Asp Read Gly Phe Read His Gly Arg Asn Thr Be 145 150 155 160 Thr Pro Met Thr Gly Asn Ile His Glu Asn Asn Asn Asn Asn Asn Asn 165 170 175 Glu Asn Asn Leu Met Ala Be Val Gly Ser Leu Ser Pro Phe Wing Leu 180 185 190 Phe Asp Pro Thr Thr Gly Gln Thr Pro Pro Val Lys Met Glu Glu Pro Gln Asn Leu 225 230 2 35 240 Wing Asn Leu Be Arg Pro Val Be Gly Leu Thr Be Pro Gly Asn Gln 245 250 255 Thr Asn Gln Tyr Phe Trp Pro Gly Be Asp Phe Be Gly Pro Ser Asn 260 265 270 Asp Leu Leu

275275

<210> 217 <211> 993 <212> DNA<210> 217 <211> 993 <212> DNA

<213> Arabidopsis thaliana <400> 217<213> Arabidopsis thaliana <400> 217

atggttttct cctccatcca agcctatctt gattcatcca actggcaaca ggctcctccg 60atggttttct cctccatcca agcctatctt gattcatcca actggcaaca ggctcctccg 60

agcaattata atcatgacgg aacaggcgcc tcagcaaatg gaggtcatgt tcttcgtcct 120agcaattata atcatgacgg aacaggcgcc tcagcaaatg gaggtcatgt tcttcgtcct 120

cagctgcagc cacagcagca gccacagcag cagccgcatc ctaatgggag cgggggcgga 180cagctgcagc cacagcagca gccacagcag cagccgcatc ctaatgggag cgggggcgga 180

ggtggaggtg gaggcggctc gatccgagca ggatcaatgg tggacagagc aagacaagca 240ggtggaggtg gaggcggctc gatccgagca ggatcaatgg tggacagagc aagacaagca 240

aacgtagcct tgccagaagc agcactgaaa tgtccgagat gcgaatccac caacaccaag 300aacgtagcct tgccagaagc agcactgaaa tgtccgagat gcgaatccac caacaccaag 300

ttctgctact tcaacaacta cagcctcact caaccacgcc acttctgcaa gacctgccgg 360ttctgctact tcaacaacta cagcctcact caaccacgcc acttctgcaa gacctgccgg 360

agatactgga cacgtggcgg agctctccgc aacgtcccag tcggcggtgg ctgccggaga 420agatactgga cacgtggcgg agctctccgc aacgtcccag tcggcggtgg ctgccggaga 420

aacaggcgta ccaaaagcaa cagcaacaac aacaataaca gcactgctac tagcaataac 480aacaggcgta ccaaaagcaa cagcaacaac aacaataaca gcactgctac tagcaataac 480

accagtttct cctccgggaa tgcatccacc atcagcacga ttctctcctc ccactatgga 540accagtttct cctccgggaa tgcatccacc atcagcacga ttctctcctc ccactatgga 540

ggaaaccaag agagtatctt aagccagatt ttgtctccgg cgaggctaat gaatcctact 600ggaaaccaag agagtatctt aagccagatt ttgtctccgg cgaggctaat gaatcctact 600

tacaatcatc tcggagatct cacaagtaat acaaaaacag acaacaacat gagcttgttg 660tacaatcatc tcggagatct cacaagtaat acaaaaacag acaacaacat gagcttgttg 660

aactatggag gattgagtca agacttgagg tcaatccaca tgggagcttc tggtggctcg 720aactatggag gattgagtca agacttgagg tcaatccaca tgggagcttc tggtggctcg 720

cttatgagct gtgttgatga atggagatcg gcgtcttatc atcagcagtc aagtatgggc 780 ggtgggaact tggaggattc ttctaatcct aatccatccg caaatgggtt ttactctttt 840 gagtcgccga ggataacttc agcgtcaatc tcttctgctt tagcatcgca gttttcttcg 900 gttaaagttg aagataatcc ttacaaatgg gttaatgtca atggtaattg ctcttcctgg 960 aatgatcttt ctgctttcgg ctcttctcgt tga 993cttatgagct gtgttgatga atggagatcg gcgtcttatc atcagcagtc aagtatgggc 780 ggtgggaact tggaggattc ttctaatcct aatccatccg caaatgggtt ttactctttt 840 gagtcgccga ggataacttc agcgtcaatc tcttctgctt tagcatcgca gttttcttcg 900 gttaaagttg aagataatcc ttacaaatgg gttaatgtca atggtaattg ctcttcctgg 960 tga 993 aatgatcttt ctgctttcgg ctcttctcgt

<210> 218 <211> 330 <212> PRT<210> 218 <211> 330 <212> PRT

<213> Arabidopsis thaliana <400> 218<213> Arabidopsis thaliana <400> 218

Met Val Phe Ser Ser Ile Gln Ala Tyr Leu Asp Ser Ser Asn Trp Gln 1 5 10 15 Gln Ala Pro Pro Ser Asn Tyr Asn His Asp Gly Thr Gly Ala Ser Ala 20 25 30 Asn Gly Gly His Val Leu Arg Pro Gln Leu Gln Pro Gln Gln Gln Pro 35 40 45 Gln Gln Gln Pro His Pro Asn Gly Ser Gly Gly Gly Gly Gly Gly Gly 50 55 60 Gly Gly Ser Ile Arg Ala Gly Ser Met Val Asp Arg Ala Arg Gln Ala 65 70 75 80 Asn Val Ala Leu Pro Glu Ala Ala Leu Lys Cys Pro Arg Cys Glu Ser 85 90 95 Thr Asn Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Ser Leu Thr Gln Pro 100 105 110 Arg His Phe Cys Lys Thr Cys Arg Arg Tyr Trp Thr Arg Gly Gly Ala 115 120 125 Leu Arg Asn Val Pro Val Gly Gly Gly Cys Arg Arg Asn Arg Arg Thr 130 135 140 Lys Ser Asn Ser Asn Asn Asn Asn Asn Ser Thr Ala Thr Ser Asn Asn 145 150 155 160 Thr Ser Phe Ser Ser Gly Asn Ala Ser Thr Ile Ser Thr Ile Leu Ser 165 170 175 Ser His Tyr Gly Gly Asn Gln Glu Ser Ile Leu Ser Gln Ile Leu Ser 180 185 190 Pro Ala Arg Leu Met Asn Pro Thr Tyr Asn His Leu Gly Asp Leu Thr 195 200 205 Ser Asn Thr Lys Thr Asp Asn Asn Met Ser Leu Leu Asn Tyr Gly Gly 210 215 220 Leu Ser Gln Asp Leu Arg Ser Ile His Met Gly Ala Ser Gly Gly Ser 225 230 235 240 Leu Met Ser Cys Val Asp Glu Trp Arg Ser Ala Ser Tyr His Gln Gln 245 250 255 Ser Ser Met Gly Gly Gly Asn Leu Glu Asp Ser Ser Asn Pro Asn Pro 260 265 270 Ser Ala Asn Gly Phe Tyr Ser Phe Glu Ser Pro Arg Ile Thr Ser Ala 275 280 285 Ser Ile Ser Ser Ala Leu Ala Ser Gln Phe Ser Ser Val Lys Val Glu 290 295 300 Asp Asn Pro Tyr Lys Trp Val Asn Val Asn Gly Asn Cys Ser Ser Trp 305 310 315 320 Asn Asp Leu Ser Ala Phe Gly Ser Ser Arg 325 330Met Val Phe Ser Be Ile Gln Wing Tyr Leu Asp Ser As Asn Trp Gln 1 5 10 15 Gln Wing Pro Pro As As Tyr Asn His Asp Gly Thr Wing Ally Ser Wing 20 25 30 Asn Gly Gly His Val Leu Arg Pro Gln Leu Gln Pro Gln Gln Gln Pro 35 40 45 Gln Gln Gln Pro His Pro Asn Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly 50 50 60 60 Gly Gly Be Ile Arg Wing Gly Be Met Val Wing Asp Arg Wing Aln 65 70 75 80 Asn Val Wing Leu Pro Glu Ala Wing Leu Lys Cys Pro Arg Cys Glu Ser 85 90 95 Thr Asn Thr Lys Phe Cys Tyr Phe Asn Tyr Be Leu Thr Gln Pro 100 105 110 Arg His Phe Cys Lys Thr Cys Arg Tyr Trp Thr Gly Gly Wing 115 120 125 Leu Arg Asn Val Pro Val Gly Gly Gly Cys Arg Arg Asn Arg Arg Thr 130 135 140 Lys Be Asn Be Asn Asn Asn Asn As Thr Be Wing Ala Thr Be Asn Asn 145 150 155 160 Thr Be Phe Be Be Gly Asn Wing Be Thr Ile Be Thr Ile Read Be 165 170 175 Be His Tyr Gly Gly Asn Gln Glu Se r Ile Leu Be Gln Ile Leu Be 180 185 190 Pro Ala Arg Leu Met Asn Pro Thr Tyr Asn His Leu Gly Asp Leu Thr 195 200 205 Ser Asn Thr Lys Thr Asp Asn Met Ser Leu Asn Tyr Gly Gly 210 215 220 Leu Be Gln Asp Leu Arg Be Ile His Met Gly Ala Be Gly Gly Ser 225 230 235 240 Leu Met Ser Cys Val Asp Glu Trp Arg Be Ala Ser Tyr His Gln Gln 245 250 255 Be Ser Met Gly Gly Gly Asn Leu Glu Asp Ser Ser Asn Pro Asn Pro 260 265 270 Ser Asa Asn Gly Phe Tyr Ser Phe Glu Ser Pro Arg Ile Thr Ser Ala 275 280 285 Ser Ile Ser Ser Ala Leu Wing Ser Gln Phe Ser Ser Val Lys Val Glu 290 295 300 Asp Asn Pro Tyr Lys Trp Val Asn Val Asn Gly Asn Cys Be Ser Trp 305 310 315 320 Asn Asp Read Be Ala Phe Gly Be Ser Arg 325 330

<210> 219 <211> 972 <212> DNA<210> 219 <211> 972 <212> DNA

<213> Arabidopsis thaliana <400> 219<213> Arabidopsis thaliana <400> 219

atggttttct catctcttcc agtgaatcag ttcgattccc aaaattggca gcagcaaggg 60atggttttct catctcttcc agtgaatcag ttcgattccc aaaattggca gcagcaaggg 60

aaccaacatc agctagaatg tgtcacaact gaccagaacc ctaataatta cttacggcag 120aaccaacatc agctagaatg tgtcacaact gaccagaacc ctaataatta cttacggcag 120

ctctcatcac caccgacttc tcaggttgca ggttcgagtc aagctagagt gaattcaatg 180ctctcatcac caccgacttc tcaggttgca ggttcgagtc aagctagagt gaattcaatg 180

gtggaacgtg ctcggatcgc aaaagtccca ttgcctgaag cagctctaaa ttgccctaga 240gtggaacgtg ctcggatcgc aaaagtccca ttgcctgaag cagctctaaa ttgccctaga 240

tgtgactcaa ccaatactaa gttctgttac ttcaataact atagccttac tcaacctcgc 300tgtgactcaa ccaatactaa gttctgttac ttcaataact atagccttac tcaacctcgc 300

catttctgca aaacatgtcg tcgctattgg acacgtggcg gttccttgag gaatgttcct 360catttctgca aaacatgtcg tcgctattgg acacgtggcg gttccttgag gaatgttcct 360

gttggaggag gctttaggag gaacaagaga agcaaatcca gatcgaaatc tacggtcgtg 420 gtctcgactg ataatactac tagtacttca tcacttactt ctcgcccaag ttactcaaac 480gttggaggag gctttaggag gaacaagaga agcaaatcca gatcgaaatc tacggtcgtg 420 gtctcgactg ataatactac tagtacttca tcacttactt ctcgcccaag ttactcaaac 480

cctagcaagt ttcatagcta cggtcaaatc ccggagttta attccaactt gcccatcttg 540cctagcaagt ttcatagcta cggtcaaatc ccggagttta attccaactt gcccatcttg 540

cctcctctcc aaagccttgg agattacaat tcaagcaaca ctggattaga ttttggtgga 600cctcctctcc aaagccttgg agattacaat tcaagcaaca ctggattaga ttttggtgga 600

actcaaataa gcaacatgat aagtggtatg agttctagtg gtgggatctt ggatgcatgg 660actcaaataa gcaacatgat aagtggtatg agttctagtg gtgggatctt ggatgcatgg 660

agaatacctc catcacaaca agctcagcaa ttccctttct tgatcaacac taccggattg 720agaatacctc catcacaaca agctcagcaa ttccctttct tgatcaacac taccggattg 720

gtgcaatctt caaacgcgtt atatccatta ctagaaggcg gggttagcgc cacgcaaaca 780gtgcaatctt caaacgcgtt atatccatta ctagaaggcg gggttagcgc cacgcaaaca 780

agaaatgtga aggcggaaga gaatgatcag gatcggggta gggatgggga tggagtgaat 840agaaatgtga aggcggaaga gaatgatcag gatcggggta gggatgggga tggagtgaat 840

aacttatcaa gaaacttttt gggtaatatc aacataaact caggcaggaa cgaggaatac 900aacttatcaa gaaacttttt gggtaatatc aacataaact caggcaggaa cgaggaatac 900

acatcatggg gaggtaacag ttcttggacc ggtttcacct ccaacaactc aacaggccat 960acatcatggg gaggtaacag ttcttggacc ggtttcacct ccaacaactc aacaggccat 960

ctctcattct aa 972 <210> 220 <211> 323 <212> PRTctctcattct aa 972 <210> 220 <211> 323 <212> PRT

<213> Arabidopsis thaliana <400> 220<213> Arabidopsis thaliana <400> 220

Met Val Phe Ser Ser Leu Pro Val Asn Gln Phe Asp Ser Gln Asn Trp 1 5 10 15 Gln Gln Gln Gly Asn Gln His Gln Leu Glu Cys Val Thr Thr Asp Gln 20 25 30 Asn Pro Asn Asn Tyr Leu Arg Gln Leu Ser Ser Pro Pro Thr Ser Gln 35 40 45 Val Ala Gly Ser Ser Gln Ala Arg Val Asn Ser Met Val Glu Arg Ala 50 55 60 Arg Ile Ala Lys Val Pro Leu Pro Glu Ala Ala Leu Asn Cys Pro Arg 65 70 75 80 Cys Asp Ser Thr Asn Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Ser Leu 85 90 95 Thr Gln Pro Arg His Phe Cys Lys Thr Cys Arg Arg Tyr Trp Thr Arg 100 105 110 Gly Gly Ser Leu Arg Asn Val Pro Val Gly Gly Gly Phe Arg Arg Asn 115 120 125 Lys Arg Ser Lys Ser Arg Ser Lys Ser Thr Val Val Val Ser Thr Asp 130 135 140 Asn Thr Thr Ser Thr Ser Ser Leu Thr Ser Arg Pro Ser Tyr Ser Asn 145 150 155 160 Pro Ser Lys Phe His Ser Tyr Gly Gln Ile Pro Glu Phe Asn Ser Asn 165 170 175 Leu Pro Ile Leu Pro Pro Leu Gln Ser Leu Gly Asp Tyr Asn Ser Ser 180 185 190 Asn Thr Gly Leu Asp Phe Gly Gly Thr Gln Ile Ser Asn Met Ile Ser 195 200 205 Gly Met Ser Ser Ser Gly Gly Ile Leu Asp Ala Trp Arg Ile Pro Pro 210 215 220 Ser Gln Gln Ala Gln Gln Phe Pro Phe Leu Ile Asn Thr Thr Gly Leu 225 230 235 240 Val Gln Ser Ser Asn Ala Leu Tyr Pro Leu Leu Glu Gly Gly Val Ser 245 250 255 Ala Thr Gln Thr Arg Asn Val Lys Ala Glu Glu Asn Asp Gln Asp Arg 260 265 270 Gly Arg Asp Gly Asp Gly Val Asn Asn Leu Ser Arg Asn Phe Leu Gly 275 280 285 Asn Ile Asn Ile Asn Ser Gly Arg Asn Glu Glu Tyr Thr Ser Trp Gly 290 295 300 Gly Asn Ser Ser Trp Thr Gly Phe Thr Ser Asn Asn Ser Thr Gly His 305 310 315 320 Leu Ser PheMet Val Phe Ser Serenu Pro Val Asn Gln Phe Ser Serenator Asp Trn 1 5 10 15 Gln Serenator Gln Gly Asn Serenier Gln His Gln Serenator Valu Thr Thr Asp Serenator 25 25 30 Asn Serenator Asn Tyr Leu Serenator Seren Pro Pro Thr Be Gln 35 40 45 Val Wing Gly Be Ser Gln Wing Arg Val Asn Be Met Val Glu Arg Wing 50 55 60 Arg Ile Wing Lys Val Pro Leu Pro Glu Wing Wing Read Asn Cys Pro Arg 65 70 75 80 Cys Asp Ser Thr Asn Thr Lys Phe Cys Tyr Phe Asn Asn Tyr Ser Leu 85 90 95 Thr Gln Pro Arg His Phe Cys Lys Thr Cys Arg Arg Tyr Trp Thr 100 105 110 Gly Gly Ser Leu Arg Asn Val Pro Val Gly Gly Ply Arg Arg Asn 115 120 125 Lys Arg Be Lys Be Arg Be Lys Be Thr Val Val Val Be Thr Asp 130 135 140 Asn Thr Thr Be Thr Be Read Read Thr Be Arg Pro Be Tyr Asn 145 150 155 160 Pro Be Lys Phe His Be Tyr Gly Gln Ile Pro Glu Phe Asn Ser Asn 165 170 175 Leu Pro Ile Leu Pro Pro Leu Gln Se r Read Gly Asp Tyr Asn Be Ser 180 185 190 Asn Thr Gly Read Asp Phe Gly Gly Thr Gln Ile Be Asn Met Ile Ser 195 200 205 Gly Met Be Ser Gly Gly Ile Read Asp Wing Trp Arg Ile Pro 210 210 220 Ser Gln Gln Wing Gln Gln Phe Pro Phe Leu Ile Asn Thr Thr Gly Leu 225 230 235 240 Val Gln Being Ser Asn Wing Leu Tyr Pro Leu Read Glu Gly Gly Val Ser 245 250 255 Wing Thr Gln Thr Arg Asn Val Lys Wing Glu Glu Asn Asp Gln Asp Arg 260 265 270 Gly Arg Asp Gly Asp Gly Val Asn Asn Leu Be Arg Asn Phe Leu Gly 275 280 285 Asn Ile Asn Ile Asn Ile Asn Be Gly Arg Asn Glu Glu Tyr Thr Be Trp Gly 290 295 300 Gly Asn Be Ser Trp Thr Gly Phe Thr Be Asn Asn Be Thr Gly His 305 310 315 320 Leu Be Phe

<210> 221 <211> 1200 <212> DNA<210> 221 <211> 1200 <212> DNA

<213> Arabidopsis thaliana <400> 221<213> Arabidopsis thaliana <400> 221

atggtttttt cttcatttcc tacttatcct gatcattcat caaactggca acaacaacat 60 caaccaatca caaccaccgt tggattcacg ggaaataaca caccatcccc tcccaccgca acagcaacaa acgcctccgc aacggcggag tcgctgttcc cggtggacct ggcgggttaa gaaagagcaa ggctagccaa cataccatta cctgaaacag gactcaacta acaccaaatt ctgttacttc aacaactaca ttctgcaaag catgccgtcg ttactggaca cgtggcggtg ggtggcggtt gccgtagaaa caaaagaacc aaaaacagca accagtagcg gtaacagcaa gtcacaagac agcgccacga cgagccatgg ctaacaatca gatgggacca ccttcttcgt ctgtcttctt acaacgcagg gttaatcccc ggacatgatc atacttggac ttggatcatc tttgcctcct cttaagctta gacaacttca ccttacaata cggtgccgtt tcagctcctt agcagtggag gagcggcggc tcttttaaac ggttttgacc aaccaacttc ctttaggcgg tttagacccg tttgatcaac aatccaggtt acggattggt taccgggtcg ggtcagtatc aaccttatct cctcttcttc gtctgcttca tcagctatgg ttagcttcag tgaaaatgga agatagtaac aatcagctca ggagacgaac aacagctctg gaatattcat ggcgctgctg acaagttcgt ggagtgaagt ctctaataat ttcagttctt <210> 222 <211> 399 <212> PRTatggtttttt cttcatttcc tacttatcct gatcattcat caaactggca acaacaacat 60 caaccaatca caaccaccgt tggattcacg ggaaataaca caccatcccc tcccaccgca acagcaacaa acgcctccgc aacggcggag tcgctgttcc cggtggacct ggcgggttaa gaaagagcaa ggctagccaa cataccatta cctgaaacag gactcaacta acaccaaatt ctgttacttc aacaactaca ttctgcaaag catgccgtcg ttactggaca cgtggcggtg ggtggcggtt gccgtagaaa caaaagaacc aaaaacagca accagtagcg gtaacagcaa gtcacaagac agcgccacga cgagccatgg ctaacaatca gatgggacca ccttcttcgt ctgtcttctt acaacgcagg gttaatcccc ggacatgatc atacttggac ttggatcatc tttgcctcct cttaagctta gacaacttca ccttacaata cggtgccgtt tcagctcctt agcagtggag gagcggcggc tcttttaaac ggttttgacc aaccaacttc ctttaggcgg tttagacccg tttgatcaac aatccaggtt acggattggt taccgggtcg ggtcagtatc aaccttatct cctcttcttc gtctgcttca tcagctatgg ttagcttcag tgaaaatgga agatagtaac aatcagctca ggagacgaac aacagctctg gaatattcat ggcgctgctg acaagttcgt ggagtgaagt ctctaataat ttcagttctt <210> 222 <211> 399 <212> PRT

<213> Arabidopsis thaliana <400> 222<213> Arabidopsis thaliana <400> 222

Met Val Phe Ser Ser Phe Pro Thr Tyr Pro Asp 15 10Met Val Phe Be Ser Phe Pro Thr Tyr Pro Asp 15 10

Gln Gln Gln His Gln Pro Ile Thr Thr Thr ValGln Gln Gln His Gln Pro Ile Thr Thr Thr

20 2520 25

Asn Ile Asn Gln Gln Phe Leu Pro His His ProAsn Ile Asn Gln Gln Phe Leu Pro His His Pro

35 4035 40

Gln Gln Thr Pro Pro Gln Leu His His Asn AsnGln Gln Thr Pro Pro Gln Read His His Asn Asn

tcaaccaaca agcttcacca tccgaccagg ccttgaagtg gtctcactca ctctaaggag gcggtggagg gcaacgacca catcgtctct ataacagcaa tgcctccttt cttatcatat agtggagatt aacatcaaat gacctaagaa ttacagccac acttgtctag cagcatccac cttctactagtcaaccaaca agcttcacca tccgaccagg ccttgaagtg gtctcactca ctctaaggag gcggtggagg gcaacgacca catcgctct ataacagcaa tgcctccttt cttatcatat agtggagatt

gtttcttcct caacaacggt ttcgatggcg tccaagatgt acctcgccac cgttcccgtc tggcggtagc ataccaccac aagctcgttg taacaacaac agacttcaca aggcggtgga cccggcaaca ggagcagcag cattttccat cgcgtcgcaa acaacttttt cgcagctgca caatatataagtttcttcct caacaacggt ttcgatggcg tccaagatgt acctcgccac cgttcccgtc tggcggtagc attackcaccac aagctcgttg taacaacaac agacttcaca aggcggtgga cccggcaaca ggagcagcaggata cggcatcata cgtcgctc

His Ser Gly PheHis Ser Gly Phe

Ser Asn Trp 15Ser Asn Trp 15

Thr Gly Asn 30Thr Gly Asn 30

Pro Gln GlnPro Gln Gln

5050

5555

Leu Pro 45Read pro 45

Gly Asn Gly Gly Val 60Gly Asn Gly Gly Val 60

Ala Val Pro Gly Gly Pro Gly Gly Leu Ile Arg Pro Gly Ser Met Ala 65 70 75 80 Glu Arg Ala Arg Leu 85 Ala Asn Ile Pro Leu 90 Pro Glu Thr Ala Leu 95 Lys Cys Pro Arg Cys 100 Asp Ser Thr Asn Thr 105 Lys Phe Cys Tyr Phe 110 Asn Asn Tyr Ser Leu Thr Gln Pro Arg His Phe Cys Lys Ala Cys Arg Arg TyrVal Wing Gly Pro Gly Gly Gly Gly Leu Ile Arg Pro Gly Be Met Wing 65 70 75 80 Glu Arg Wing Arg Leu 85 Wing Asn Ile Pro Leu 90 Pro Glu Thr Wing Read 95 Lys Cys Lys Phe Cys Tyr Phe 110 Asn Asn Tyr Being Read Thr Gln Pro Arg His Phe Cys Lys Cys Wing Arg Arg Tyr

115115

120120

Trp Thr Arg Gly Gly Ala Leu 130 135 Arg Arg Asn Lys Arg Thr Lys 145 150 Thr Ser Ser Gly Asn Ser Lys 165 Gln Tyr His His Arg Ala MetTrp Thr Arg Gly Gly Wing Leu 130 135 Arg Arg Asn Lys Arg Thr Lys 145 150 Thr Be Ser Gly Asn Ser Lys 165 Gln

125125

Val Gly Gly Gly Cys 140Val Gly Gly Gly Cys 140

Gly GlyGly Gly

155155

170170

180180

185185

Ser Ser Ser Ser Leu Ser Ser Leu Leu Ser SerSer Ser Ser Ser Ser Ser Ser Ser Leu Ser Ser

195195

200200

Ile Pro Gly His Asp His Asn Ser Asn Asn AsnIle Pro Gly His Asp His Asn Ser Asn Asn Asn

210 215210 215

Gly Ser Ser Leu Pro Pro Leu Lys Leu Met ProGly Ser Ser Leu Pro Pro Leu Lys Leu Met Pro

225 230 235225 230 235

Asp Asn Phe Thr Leu Gln Tyr Gly Ala Val SerAsp Asn Phe Thr Read Gln Tyr Gly Wing Val Ser

245 250245 250

Ile Gly Gly Gly Ser Ser Gly Gly Ala Ala AlaIle Gly Gly Gly Be Ser Gly Gly Wing Wing

260 265260 265

Asp Gln Trp Arg Phe Pro Ala Thr Asn Gln LeuAsp Gln Trp Arg Phe Pro Wing Thr Asn Gln Leu

275 280275 280

Asp Pro Phe Asp Gln Gln His Gln Met Glu GlnAsp Pro Phe Asp Gln Gln His Gln Met Glu Gln

290 295290 295

Gly Leu Val Thr Gly Ser Gly Gln Tyr Arg ProGly Leu Val Thr Gly Ser Gly Gln Tyr Arg Pro

Ala ThrThr wing

Met GlyMet gly

Tyr Asn 205 Asn Ile 220Tyr Asn 205 Asn Ile 220

Pro LeuPro leu

Ala ProPro Wing

Leu LeuLeu Leu

Pro Leu 285 Gln Asn 300Pro Leu 285 Gln Asn 300

Lys AsnLys asn

Gly Gly Ser 160Gly Gly Ser 160

Ser Asn AspTo be asn asp

175 Pro Pro Ser 190175 Pro Pro Ser 190

Ala Gly LeuWing Gly Leu

Leu Gly LeuLeu Gly Leu

Asp Phe Thr 240Asp Phe Thr 240

Ser Tyr HisBe tyr his

255 Asn Gly Phe 270255 Asn Gly Phe 270

Gly Gly Leu Pro Gly Tyr Ile Phe HisGly Gly Read Pro Gly Tyr Ile Phe His

120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 305120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 305

Asn Leu Ile Ser Ser 325Asn Leu Ile Ser Ser 325

Thr Ala Ser Gln Leu 340Thr Wing Ser Gln Leu 340

Leu Asn Leu Ser Arg 355Leu Asn Leu Ser Arg 355

Ile His Gly Ala Ala 370Ile His Gly Wing Wing 370

Ser Glu Val Ser Asn 385Ser Glu Val Ser Asn 385

<210> 223 <211> 52 <212> DNA <213> Seqüência artificial <220><210> 223 <211> 52 <212> DNA <213> Artificial Sequence <220>

<223> iniciador: prm07315 <400> 223<223> initiator: prm07315 <400> 223

ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg tggatcgatg gc 52ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg tggatcgatg gc 52

<210> 224 <211> 50 <212> DNA<210> 224 <211> 50 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm07316 <400> 224<223> initiator: prm07316 <400> 224

ggggaccact ttgtacaaga aagctgggtc gttaatgatc cgacaaaaca 50ggggaccact ttgtacaaga aagctgggtc gttaatgatc cgacaaaaca 50

<210> 225<210> 225

<211> 2193<211> 2193

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 225<400> 225

aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60

aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaac the gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattg attgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860

310 315 320310 315 320

Ser Ser Ser Ala Ser Ser Ala Met Val Thr AlaSer Ser Ser Ala Ser Ser Ala Met Val Thr Ala

330 335330 335

Ala Ser Val Lys Met Glu Asp Ser Asn Asn GlnWing Ser Val Lys Met Glu Asp Ser Asn Asn Gln

345 350345 350

Gln Leu Phe Gly Asp Glu Gln Gln Leu Trp AsnGln Leu Phe Gly Asp Glu Gln Gln Leu Trp Asn

360 365360 365

Ala Ala Ser Thr Ala Ala Ala Thr Ser Ser TrpWing Wing Be Thr Wing Wing Wing Thr Be Being Trp

375 380375 380

Asn Phe Ser Ser Ser Ser Thr Ser Asn Ile 390 395 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttc 2193Asn Phe Ser Ser Ser Ser Thr Ser Asn Ile 390,395 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttc 2193

<210> 226 <211> 1344 <212> DNA<210> 226 <211> 1344 <212> DNA

<213> Arabidopsis thaliana <220><213> Arabidopsis thaliana <220>

<221> misc_feature <222> (196)..(196) <223> η is a, c, g, ou t <220><221> misc_feature <222> (196) .. (196) <223> η is a, c, g, or t <220>

<221> misc_feature <222> (461)..(461) <223> η is a, c, g, ou t <400> 226<221> misc_feature <222> (461) .. (461) <223> η is a, c, g, or t <400> 226

atgatgatgg agactagaga tccagctatt aagcttttcg gtatgaaaat cccttttccg 60 tcggtttttg aatcggcagt tacggtggag gatgacgaag aagatgactg gagcggcgga 120 gatgacaaat caccagagaa ggtaactcca gagttatcag ataagaacaa caacaactgt 180 aacgacaaca gttttnacaa ttcgaaaccc gaaaccttgg acaaagagga agcgacatca 240 actgatcaga tagagagtag tgacacgcct gaggataatc agcagacgac acctgatggt 300 aaaaccctaa agaaaccgac taagattcta ccgtgtccga gatgcaaaag catggagacc 360 aagttctgtt attacaacaa ctacaacata aaccagcctc gtcatttctg caaggcttgt 420 cagagatatt ggactgctgg agggactatg aggaatgttc ntgtgggggc aggacgtcgt 480 aagaacaaaa gcttatcttc tcattaccgt cacatcacta tttccgaggc tcttgaggct 540 gcgaggcttg acccgggctt acaggcaaac acaagggtct tgagttttgg tctcgaagct 600 cagcagcagc acgttgctgc tcccatgaca cctgtgatga agctacaaga agatcaaaag 660 gtctcaaacg gtgctaggaa caggtttcac gggttagcgg atcaacggct tgtagctcgg 720 gtagagaatg gagatgattg ctcaagcgga tcctctgtga ccacctctaa caatcactca 780 gtggatgaat caagagcaca aagcggcagt gttgttgaag cacaaatgaa caacaacaac 840 aataacatga atggttatgc ttgcatccca ggtgttccat ggccttacac gtggaatcca 900 gcgatgcctc caccaggttt ttacccgcct ccagggtatc caatgccgtt ttacccttac 960 tggaccatcc caatgctacc accgcatcaa tcctcatcgc ctataagcca aaagtgttca 1020 aatacaaact ctccgactct cggaaagcat ccgagagatg aaggatcatc gaaaaaggac 1080 aacgagacag agcgaaaaca gaaggccggg tgcgttctgg tcccgaaaac gttgagaata 1140 gatgatccta acgaagcagc aaagagctcg atatggacaa cattgggaat caagaacgag 1200 gcgatgtgca aagccggtgg tatgttcaaa gggtttgatc ataagacaaa gatgtataac 1260 aacgacaaag ctgagaactc ccctgttctt tctgctaacc ctgctgctct atcaagatca 1320 cacaatttcc atgaacagat ttag 1344atgatgatgg agactagaga tccagctatt aagcttttcg gtatgaaaat cccttttccg 60 tcggtttttg aatcggcagt tacggtggag gatgacgaag aagatgactg gagcggcgga 120 gatgacaaat caccagagaa ggtaactcca gagttatcag ataagaacaa caacaactgt 180 aacgacaaca gttttnacaa ttcgaaaccc gaaaccttgg acaaagagga agcgacatca 240 actgatcaga tagagagtag tgacacgcct gaggataatc agcagacgac acctgatggt 300 aaaaccctaa agaaaccgac taagattcta ccgtgtccga gatgcaaaag catggagacc 360 aagttctgtt attacaacaa ctacaacata aaccagcctc gtcatttctg caaggcttgt 420 cagagatatt ggactgctgg agggactatg aggaatgttc ntgtgggggc aggacgtcgt 480 aagaacaaaa gcttatcttc tcattaccgt cacatcacta tttccgaggc tcttgaggct 540 gcgaggcttg acccgggctt acaggcaaac acaagggtct tgagttttgg tctcgaagct 600 cagcagcagc acgttgctgc tcccatgaca cctgtgatga agctacaaga agatcaaaag 660 gtctcaaacg gtgctaggaa caggtttcac gggttagcgg atcaacggct tgtagctcgg 720 gtagagaatg gagatgattg ctcaagcgga tcctctgtga ccacctctaa caatcactca 780 gtggatgaat caagagcaca aagcggcagt gttgttgaag cacaaatgaa caacaacaac 840 aataacatga atggttatgc ttgcatccca ggtgttccat ggccttacac gtggaatcca 900 gcgatgcctc caccaggttt ttacccgcct ccagggtatc caatgccgtt ttacccttac 960 tggaccatcc caatgctacc accgcatcaa tcctcatcgc ctataagcca aaagtgttca 1020 aatacaaact ctccgactct cggaaagcat ccgagagatg aaggatcatc gaaaaaggac 1080 aacgagacag agcgaaaaca gaaggccggg tgcgttctgg tcccgaaaac gttgagaata 1140 gatgatccta acgaagcagc aaagagctcg atatggacaa cattgggaat caagaacgag 1200 gcgatgtgca aagccggtgg tatgttcaaa gggtttgatc ataagacaaa gatgtataac 1260 aacgacaaag ctgagaactc ccctgttctt tctgctaacc ctgctgctct atcaagatca 1320 cacaatttcc atgaacagat ttag 1344

<210> 227 <211> 447 <212> PRT<210> 227 <211> 447 <212> PRT

<213> Arabidopsis thaliana <220><213> Arabidopsis thaliana <220>

<221> INSEGURO <222> (66)..(66)<221> UNSAFE <222> (66) .. (66)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220><223> Xaa can be any naturally occurring amino acid <220>

<221> INSEGURO <222> (154) . . (154)<221> UNSAFE <222> (154). . (154)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 227<223> Xaa can be any naturally occurring amino acid <400> 227

Met Met Met Glu Thr Arg Asp Pro Ala Ile Lys Leu Phe Gly Met Lys 1 5 10 15Met Met Met Met Glu Thr Asp Pro Wing Ile Lys Leu Phe Gly Met Lys 1 5 10 15

Ile Pro Phe Pro Ser Val Phe Glu Ser Ala Val Thr Val Glu Asp AspIle Pro Phe Pro Be Val Phe Glu Be Wing Val Thr Val Glu Asp Asp

20 25 3020 25 30

Glu Glu Asp Asp Trp Ser Gly Gly Asp Asp Lys Ser Pro Glu Lys ValGlu Glu Asp Asp Trp Being Gly Gly Asp Asp Lys Being Pro Glu Lys Val

35 40 4535 40 45

Thr Pro Glu Leu Ser Asp Lys Asn Asn Asn Asn Cys Asn Asp Asn Ser 50 55 60 Phe Xaa Asn Ser Lys Pro Glu Thr Leu Asp Lys Glu Glu Ala Thr Ser 65 70 75 80 Thr Asp Gln Ile Glu Ser Ser Asp Thr Pro Glu Asp Asn Gln Gln Thr 85 90 95 Thr Pro Asp Gly Lys Thr Leu Lys Lys Pro Thr Lys Ile Leu Pro Cys 100 105 110 Pro Arg Cys Lys Ser Met Glu Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr 115 120 125 Asn Ile Asn Gln Pro Arg His Phe Cys Lys Ala Cys Gln Arg Tyr Trp 130 135 140 Thr Ala Gly Gly Thr Met Arg Asn Val Xaa Val Gly Ala Gly Arg Arg 145 150 155 160 Lys Asn Lys Ser Leu Ser Ser His Tyr Arg His Ile Thr Ile Ser Glu 165 170 175 Ala Leu Glu Ala Ala Arg Leu Asp Pro Gly Leu Gln Ala Asn Thr Arg 180 185 190 Val Leu Ser Phe Gly Leu Glu Ala Gln Gln Gln His Val Ala Ala Pro 195 200 205 Met Thr Pro Val Met Lys Leu Gln Glu Asp Gln Lys Val Ser Asn Gly 210 215 220 Ala Arg Asn Arg Phe His Gly Leu Ala Asp Gln Arg Leu Val Ala Arg 225 230 235 240 Val Glu Asn Gly Asp Asp Cys Ser Ser Gly Ser Ser Val Thr Thr Ser 245 250 255 Asn Asn His Ser Val Asp Glu Ser Arg Ala Gln Ser Gly Ser Val Val 260 265 270 Glu Ala Gln Met Asn Asn Asn Asn Asn Asn Met Asn Gly Tyr Ala Cys 275 280 285 Ile Pro Gly Val Pro Trp Pro Tyr Thr Trp Asn Pro Ala Met Pro Pro 290 295 300 Pro Gly Phe Tyr Pro Pro Pro Gly Tyr Pro Met Pro Phe Tyr Pro Tyr 305 310 315 320 Trp Thr Ile Pro Met Leu Pro Pro His Gln Ser Ser Ser Pro Ile Ser 325 330 335 Gln Lys Cys Ser Asn Thr Asn Ser Pro Thr Leu Gly Lys His Pro Arg 340 345 350 Asp Glu Gly Ser Ser Lys Lys Asp Asn Glu Thr Glu Arg Lys Gln Lys 355 360 365 Ala Gly Cys Val Leu Val Pro Lys Thr Leu Arg Ile Asp Asp Pro Asn 370 375 380 Glu Ala Ala Lys Ser Ser Ile Trp Thr Thr Leu Gly Ile Lys Asn Glu 385 390 395 400 Ala Met Cys Lys Ala Gly Gly Met Phe Lys Gly Phe Asp His Lys Thr 405 410 415 Lys Met Tyr Asn Asn Asp Lys Ala Glu Asn Ser Pro Val Leu Ser Ala 420 425 430 Asn Pro Ala Ala Leu Ser Arg Ser His Asn Phe His Glu Gln Ile 435 440 445 <210> 228 <211> 63 <212> PRTThr Pro Glu Read Asp Lys Asn Asn Asn Asn Asn Cys Asn Asp Asn Ser 50 55 60 Phe Xaa Asn Be Lys Pro Glu Thr Read Asp Lys Glu Ala Thr Be 65 70 75 80 Thr Asp Gln Ile Glu Be Ser Asp Thr Pro Glu Asp Asn Gln Gln Thr 85 90 95 Thr Pro Asp Gly Lys Thr Read Lys Lys Pro Thr Lys Ile Leu Pro Cys 100 105 110 Pro Arg Cys Lys Be Met Glu Thr Lys Phe Cys Tyr Tyr Asn Tyr 115 120 125 Asn Ile Asn Gln Pro Arg His Phe Cys Lys Cys Wing Gln Arg Tyr Trp 130 135 140 Thr Gly Wing Gly Thr Met Arg Asn Val Xaa Val Gly Wing Gly Arg Arg 145 150 155 160 Lys Asn Lys Be Read To Be His Tyr Arg His Ile Thr Ile Be Glu 165 170 175 Wing Leu Glu Wing Wing Arg Wing Read Asp Pro Gly Leu Gln Wing Asn Thr Arg 180 185 190 Val Leu Be Phe Gly Leu Glu Wing Gln Gln His Val Wing Pro Wing 195 200 205 Met Thr Pro Val Met Lys Leu Gln Glu Asp Gln Lys Val Ser Asn Gly 210 215 220 Wing Arg Asn Arg Phe His Gly the Asp Gln Arg Leu Val Wing Arg 225 230 235 240 Val Glu Asn Gly Asp Asp Cys Ser Ser Gly Ser Ser Val Thr Thr 245 250 255 Asn Asn His Ser Val Asp Glu Ser Arg Wing Gln Ser Gly Val Val 260 265 270 Glu Wing Gln Met Asn Asn Asn Asn Asn Asn Asn Met Asn Gly Tyr Cys 275 280 285 Ile Pro Gly Val Pro Trp Pro Tyr Thr Trp Asn Pro Ala Met Pro Pro 290 295 300 Pro Gly Phe Tyr Pro Pro Phe Tyr Pro Tyr 305 310 315 320 Trp Thr Ile Pro Met Leu Pro Pro His Gln Be Ser Pro Ile Ser 325 330 335 Gln Lys Cys Ser Asn Thr Asn Ser Pro Thr Read Gly Lys His Pro Arg 340 345 350 Asp Glu Gly Ser Ser Lys Lys Asp Asn Glu Thr Glu Arg Lys Gln Lys 355 360 365 Wing Gly Cys Val Leu Val Pro Lys Thr Leu Arg Ile Asp Pro Asn 370 375 380 Glu Wing Ala Lys Being Ser Ile Trp Thr Thr Leu Gly Ile Lys Asn Glu 385 390 395 400 Met Cys Lys Wing Gly Gly Met Phe Lys Gly Ph Wing and Asp His Lys Thr 405 410 415 Lys Met Tyr Asn Asn Asp Lys Wing Glu Asn Be Pro Val Leu Be Wing 420 425 430 Asn Pro Wing Wing Leu Be Arg Be His Asn Phe His Glu Gln Ile 435 440 445 <210> 228 < 211> 63 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> Domínio DOF <220><223> DOF domain <220>

<221> INSEGURO <222> (50)..(50)<221> UNSAFE <222> (50) .. (50)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 228<223> Xaa can be any naturally occurring amino acid <400> 228

Lys Pro Thr Lys Ile Leu Pro Cys Pro Arg Cys Lys Ser Met Glu Thr 15 10 15Lys Pro Thr Lys Ile Leu Pro Cys Pro Arg Cys Lys Be Met Glu Thr 15 10 15

Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Ile Asn Gln Pro Arg His Phe 20 25 30 Cys Lys Ala Cys Gln Arg Tyr Trp Thr Ala Gly Gly Thr Met Arg AsnLys Phe Cys Tyr Tyr Asn Asn Tyr Asn Ile Asn Gln Pro Arg His Phe 20 25 30 Cys Lys Cys Wing Gln Arg Tyr Trp Thr Wing Gly Gly Thr Met Arg Asn

35 40 4535 40 45

Val Xaa Val Gly Ala Gly Arg Arg Lys Asn Lys Ser Leu Ser SerVal Xaa Val Gly Ala Gly Arg Arg Lys Asn Lys To Be To Be To Be

50 55 6050 55 60

<210> 229 <211> 11 <212> PRT<210> 229 <211> 11 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 1 <400> 229<223> reason 1 <400> 229

Lys Ala Leu Lys Lys Pro Asp Lys Ile Leu Pro 1 5 10Lys Wing Leu Lys Lys Pro Asp Lys Ile Leu Pro 1 5 10

<210> 230 <211> 14 <212> PRT<210> 230 <211> 14 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 2 <400> 230<223> reason 2 <400> 230

Asp Asp Pro Gly Ile Lys Leu Phe Gly Lys Thr Ile Pro Phe 1 5 10Asp Asp Pro Gly Ile Lys Read Phe Gly Lys Thr Ile Pro Phe 1 5 10

<210> 231 <211> 11 <212> PRT<210> 231 <211> 11 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 3 <400> 231<223> reason 3 <400> 231

Ser Pro Thr Leu Gly Lys His Ser Arg Asp Glu 1 5 10Ser Pro Thr Read Gly Lys His Ser Arg Asp Glu 1 5 10

<210> 232 <211> 16 <212> PRT<210> 232 <211> 16 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 4 <400> 232<223> reason 4 <400> 232

Leu Gln Ala Asn Pro Ala Ala Leu Ser Arg Ser Gln Asn Phe Gln Glu 1 5 10 15Read Gln Wing Asn Pro Wing Wing Read Be Arg Be Gln Asn Phe Gln Glu 1 5 10 15

<210> 233 <211> 32 <212> PRT<210> 233 <211> 32 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 5 <400> 233<223> reason 5 <400> 233

Lys Gly Glu Gly Cys Leu Trp Val Pro Lys Thr Leu Arg Ile Asp Asp 1 5 10 15Lys Gly Glu Gly Cys Leu Trp Val Pro Lys Thr Leu Arg Ile Asp Asp 1 5 10 15

Pro Asp Glu Ala Ala Lys Ser Ser Ile Trp Thr Thr Leu Gly Ile Lys 20 25 30Pro Asp Glu Wing Wing Lys Be Ser Ile Trp Thr Thr Read Gly Ile Lys 20 25 30

<210> 234<210> 234

<211> 1263<211> 1263

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 234<400> 234

atgaacaacg ttgaagagaa agcagcatca gactcaaaag atgaaaatga aaagacagca 60atgaacaacg ttgaagagaa agcagcatca gactcaaaag atgaaaatga aaagacagca 60

aatgatgaat caggccagga caaagtactt aagaagccag ataagattct cccttgccct 120 cggtgcaaca gtatggacac aaagttttgt tattacaaca actacaatgt taatcaaccc 180 aggcacttct gtaagaactg ccaaaggtat tggactgccg ggggaaccat gagaaatgta 240 cctgttggtg ctgggaggcg caaaagcaag agctcatcgt tgcactaccg tcacttactg 300 atggcccctg attgcatgat ggggtctaga gtggaaatat ccaagtcaat gaaccctgaa 360 gctttcgcat ctgcgcattc gacccctata caaccaattg gcagaaacga aacagttctc 420 aaatttgggc cagaatggaa atctcttcaa agcacgccgg tacatgtacc atgccagagt atgaactccc ctagtgccac ccgtggatca tcaggcaatg gacaaggagg gcggcgaaga aagccgttcc cgtgctctta tgaaatgatgaat caggccagga caaagtactt aagaagccag ataagattct cccttgccct 120 cggtgcaaca gtatggacac aaagttttgt tattacaaca actacaatgt taatcaaccc 180 aggcacttct gtaagaactg ccaaaggtat tggactgccg ggggaaccat gagaaatgta 240 cctgttggtg ctgggaggcg caaaagcaag agctcatcgt tgcactaccg tcacttactg 300 atggcccctg attgcatgat ggggtctaga gtggaaatat ccaagtcaat gaaccctgaa 360 gctttcgcat ctgcgcattc gacccctata caaccaattg gcagaaacga aacagttctc 420 aaatttgggc cagaatggaa atctcttcaa agcacgccgg tacatgtacc atgccagagt atgaactccc ctagtgccac ccgtggatca tcaggcaatg gacaaggagg gcggcgaaga aagccgttcc cgtgctctta tga

<210> 235 <211> 420 <212> PRT <213> Oryza <400> 235 Met Asn Asn 1<210> 235 <211> 420 <212> PRT <213> Oryza <400> 235 Met Asn Asn 1

Glu Lys ThrGlu Lys Thr

Pro Asp Lys 35Pro Asp Lys 35

Phe Cys Tyr 50Phe Cys Tyr 50

Lys Asn Cys 65Lys Asn Cys 65

Pro Val GlyFor Val Gly

ctgaggtgcc ccaatgctgc tcacatcaca tgtattgcaa catggaacat ctgcttccca ccatgatgcc ctgcactatg gaacgaatgg gctcccctct agaaatcact gctccatctg agtccaaagg aggcaaacccctgaggtgcc ccaatgctgc tcacatcaca tgtattgcaa catggaacat ctgcttccca ccatgatgcc ctgcactatg gaacgaatgg gctcccctct agaaatcact gctccatctg agtccaaagg aggcaaaccc

actctgtgaa agcagtacca caacgtgtta cggagtcggc aggatggaac atctgagagc ggttgcctcg gggttgctta cggctgcatg ggggaagcat gtgggttccc ggccaccctg tgagagcaaa agctgcattgactctgtgaa agcagtacca caacgtgtta cggagtcggc aggatggaac atctgagagc ggttgcctcg gggttgctta cggctgcatg ggggaagcat gtgggttccc ggccaccctg tgagagcac

tcgatggcat acgggtgaaa cctgaaaatg ccagtgccgc aacgttccta tgcagcacca aggctttctg tccagctggc tctccatcgt tccagggact aagacgctcc gggatcaagc ggccaagcag tcgcggtcgctcgatggcat acgggtgaaa cctgaaaatg ccagtgccgc aacgttccta tgcagcacca aggctttctg tccagctggc tctccatcgt tccagggact aagacgctcc gggatcaagc ggccaagcgtcgccc

cagtgctgaa atcaggaaga cagcccaagt agtactacct tgatggtgcc gttcagctcc caccaccatt cggccacggc cgtcgagcaa cctctctccc gcatcgacga ctggagaccc catcagagac agtcgttccacagtgctgaa atcaggaaga cagcccaagt agtactacct tgatggtgcc gttcagctcc caccaccatt cggccacggc cgtcgagcaa cctctctccc gcatcgacga ctggagaccc catcagagac agtcgttcca

cattcaggag taactcttgc tgacaagaac tggagctcct aggtacaagc atggatgaac tccataccct atggaacata cagcagctgt actgaaggag tcccgacgag tggcatcttc tcgtcctgct ggagacttctcattcaggag taactcttgc tgacaagaac tggagctcct aggtacaagc atggatgaac tccataccct atggaacata cagcagctgt actgaaggag tcccgacgag tggcatcttc tcgtcctgct ggagacttct

ArgArg

IleIle

ProPro

Glu 145 GlnGlu 145 Gln

AspAsp

AsnAsn

ValVal

Trp 225 MetTrp 225 Met

ProPro

SerTo be

CysCys

Thr 305 SerThr 305 Ser

ProPro

HisHis

SerTo be

Ile 130 ValIle 130 Val

AsnAsn

AsnAsn

AlaAllah

Gly 210 AsnGly 210 Asn

ProPro

TrpTrp

AlaAllah

Leu 290 AsnRead 290 Asn

GlyGly

LeuRead

LeuRead

Lys 115 GlnLys 115 Gln

ProPro

GlyGly

SerTo be

Ala 195 ProWing 195 Pro

IleIle

GluGlu

MetMet

Pro 275 SerPro 275 Ser

GlyGly

AsnAsn

LysLys

sativasativa

Val Glu 5Val Glu 5

Ala Asn 20Asn Wing 20

Ile LeuIle leu

Tyr AsnTyr asn

Gln ArgGln arg

Ala GlyGly wing

8585

Leu Met 100Read Met 100

Ser MetBe met

Pro IleTo Ile

Leu CysRead Cys

Thr Asn 165 Cys Ile 180Thr Asn 165 Cys Ile 180

Gln ValGln Val

Val ProVal pro

Gly TrpGly trp

Ser Ala 245 Asn Met 260Ser Ala 245 Asn Met 260

Pro PhePro phe

Ser TrpBe trp

Gly CysGly cys

Gly Ser 325 Glu AspGly Ser 325 Glu Asp

Glu Lys Ala Ala Asp Glu Pro CysGlu Lys Wing Asp Wing Glu Pro Cys

Asn TyrAsn tyr

55 Tyr Trp 7055 Tyr Trp 70

Arg ArgArg Arg

Ala ProPro Wing

Asn ProAsn pro

Gly Arg 135 Glu Ser 150Gly Arg 135 Glu Ser 150

Ala AlaWing wing

Ser SerTo be to be

Asp LysAsp Lys

Gln Tyr 215 Asn Asn 230Gln Tyr 215 Asn Asn 230

Ser GlnBe gln

Asn SerAsn ser

Pro TyrPro tyr

Pro Ala 295 Met Ser 310Pro Wing 295 Met Ser 310

Pro LeuPro leu

Ser GlyBe gly

25 Pro Arg 4025 Pro Arg 40

Asn ValAsn val

Thr AlaThr wing

Lys SerLys Ser

Asp Cys 105 Glu Ala 120Asp Cys 105 Glu Wing 120

Asn GluAsn glu

Met AlaMet wing

Ala ValVal Wing

Ile Thr 185 Asn Ser 200Ile Thr 185 Asn Ser 200

Tyr LeuTyr leu

Val ProVal pro

Ser GluBe glu

Pro Met 265 Pro Leu 280Pro Met 265 Pro Leu 280

Thr AlaThr wing

Pro Ser Gly Lys Lys Glu Glu LysTo Be Gly Lys Lys Glu

Ser Asp 10Ser Asp 10

Gln AspGln asp

Cys AsnCys asn

Asn GlnAsn gln

Gly Gly 75Gly Gly 75

Lys Ser 90Lys Ser 90

Met MetMet met

Phe AlaPhe wing

Thr ValThr val

Ser Val 155 Pro Thr 170Ser Val 155 Pro Thr 170

Ser HisTo be his

Thr ProThr pro

Gly AlaGly Wing

Met Met 235 Ser Cys 250Met Met 235 Ser Cys 250

Met ProMet pro

Val ProVal pro

Trp AsnTrp asn

Ser Ser 315 His Ser 330Ser Ser 315 His Ser 330

Ser LeuTo be read

Ser LysTo be lys

Lys ValLys val

Ser MetBe met

45 Pro Arg 6045 Pro Arg 60

Thr MetThr met

Ser SerTo be to be

Gly SerGly ser

Ser Ala 125 Leu Lys 140Ser Ala 125 Leu Lys 140

Leu AsnRead asn

Gly GluGly Glu

Asn ValAsn val

Val Tyr 205 Pro Tyr 220Val Tyr 205 Pro Tyr 220

Val ProVal pro

Ser ThrTo be thr

Val AlaVal Wing

Pro Ala 285 Ile Pro 300Pro Wing 285 Ile Pro 300

Ser Asn Arg Asp Trp ValSer Asn Arg Asp Trp Val

Asp Glu Asn 15Asp Glu Asn 15

Leu Lys Lys 30Read Lys Lys 30

Asp Thr LysAsp Thr Lys

His Phe CysHis Phe Cys

Arg Asn Val 80Arg Asn Val 80

Leu His Tyr 95Read His Tyr 95

Arg Val Glu 110Arg Val Glu 110

His Ser ThrHis ser thr

Phe Gly ProPhe Gly Pro

Ile Gln Glu 160Ile Gln Glu 160

Asn Gln GluAsn Gln Glu

175 Leu Pro Glu 190175 Leu Pro Glu 190

Cys Asn GlyCys Asn Gly

Met Tyr ProMet tyr pro

Gly Thr Ser 240Gly Thr Ser 240

Ser Ser AlaBe Be Wing

255 Ser Arg Leu 270255 Ser Arg Leu 270

Leu Trp GlyRead Trp Gly

Trp Ile ArgTrp Ile Arg

Ser Ser Cys 320Ser Ser Cys 320

Ser Ser LeuSer Ser Leu

335 Pro Lys Thr335 Pro Lys Thr

480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1263 340 345 350 Leu Arg Ile 355 Asp Asp Pro Asp Glu 360 Ala Ala Lys Ser Ser 365 Ile Trp Ala Thr Leu 370 Gly Ile Lys Pro Gly 375 Asp Pro Gly Ile Phe 380 Lys Pro Phe Gln Ser Lys Gly Glu Ser Lys Gly Gln Ala Ala Ser Glu Thr Arg Pro Ala 385 390 395 400 Arg Ala Leu Lys Ala 405 Asn Pro Ala Ala Leu 410 Ser Arg Ser Gln Ser 415 Phe Gln Glu Thr Ser 420480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1263 340 345 350 Leu Arg Ile 355 Asp Asp Pro Asp Glu 360 Wing Lys Ser Ser 365 Ile Trp Thr Wing Leu 370 Gly Ile Lys Pro Gly 375 Asp Pro Gly Ile Phe 380 Lys Pro Phe Gln Be Lys Gly Glu Be Lys Gly Gln Wing Wing Be Glu Thr Arg Pro Wing 385 390 395 400 Arg Wing Leu Lys Wing 405 Asn Pro Wing Wing Leu 410 Be Arg Be Gln Ser 415 Phe Gln Glu Thr Be 420

<210> 236<210> 236

<211> 1365<211> 1365

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 236<400> 236

atgcctaatt taggaaatgg tgtaaaaacc aataatgact tacctttagt ctcagacaag 60 cttttgattg tcaaaggtat tcctttttgt cccaacaata gtaagaaaaa tgatttacaa 120atgcctaatt taggaaatgg tgtaaaaacc aataatgact tacctttagt ctcagacaag 60 cttttgattg tcaaaggtat tcctttttgt cccaacaata gtaagaaaaa tgatttacaa 120

ggcatcagca gaccggatgg aagaatagaa atcgattcca tgactgagga tgttaagact 180 gagcctgatg gatctgtccc tgagaagata ctcaagaagc cagataagat tctgccatgt 240ggcatcagca gaccggatgg aagaatagaa atcgattcca tgactgagga tgttaagact 180 gagcctgatg gatctgtccc tgagaagata ctcaagaagc cagataagat tctgccatgt 240

ccacgctgca atagcatgga aacaaagttc tgctacttca acaactacaa tgttcaccag 300ccacgctgca atagcatgga aacaaagttc tgctacttca acaactacaa tgttcaccag 300

cccaggcact tctgcaggaa ctgccaaaga tattggaccg ctggtggagc tatgaggaat 360cccaggcact tctgcaggaa ctgccaaaga tattggaccg ctggtggagc tatgaggaat 360

gtcccagttg gtgctggaag acgcagaaat aagcatgtgt caaaatactg tcaggcgatg 420gtcccagttg gtgctggaag acgcagaaat aagcatgtgt caaaatactg tcaggcgatg 420

atgacgtgca ataatactgt agctcctgga gatgtttctg atgtggttca ccatcaggtt 480atgacgtgca ataatactgt agctcctgga gatgtttctg atgtggttca ccatcaggtt 480

attacacatg gatcttctct ccttccagca acactgaagg aaaatgaaac acctacagaa 540attacacatg gatcttctct ccttccagca acactgaagg aaaatgaaac acctacagaa 540

ttcatatcag aagtaccacc atgtaagtct tcagcttcaa tccttgatat tggagagccg 600ttcatatcag aagtaccacc atgtaagtct tcagcttcaa tccttgatat tggagagccg 600

aatgatactg accttgttcc cttggcctct ggtgataaca aggaagaaaa atcatgtgca 660aatgatactg accttgttcc cttggcctct ggtgataaca aggaagaaaa atcatgtgca 660

tcttctgtgg tagtatccag ctgttcagag aatctgatgc cagataatgc aattatgaaa 720tcttctgtgg tagtatccag ctgttcagag aatctgatgc cagataatgc aattatgaaa 720

gagccaaaca acaggtcagg atgttgtaat ggtgtggcat tgcctttccc tactggacct 780gagccaaaca acaggtcagg atgttgtaat ggtgtggcat tgcctttccc tactggacct 780

gctttggtgc tcccctggag tcttggatgg aacagtgttg ctctcatgcc agctacccag 840gctttggtgc tcccctggag tcttggatgg aacagtgttg ctctcatgcc agctacccag 840

tgctcgatgc agcccgttct tgggttaaaa gatgggatac cctgcccgcc ttcatggcca 900tgctcgatgc agcccgttct tgggttaaaa gatgggatac cctgcccgcc ttcatggcca 900

ccgcaactga tggtgccggc cccaggaatc tgtactcctg ttgttccaat ccctcttgtg 960ccgcaactga tggtgccggc cccaggaatc tgtactcctg ttgttccaat ccctcttgtg 960

ccacctctgt ggagctgctt ccctggctgg cctaatggaa tgtggaatgc acaatgccct 1020ccacctctgt ggagctgctt ccctggctgg cctaatggaa tgtggaatgc acaatgccct 1020

ggaggtaata ctactgtgct gccgtcaacc gctccaaaca aaatttcttg ttcaggaagc 1080ggaggtaata ctactgtgct gccgtcaacc gctccaaaca aaatttcttg ttcaggaagc 1080

agttctctgg tgttgggaaa gcattcaaga gaagaaagct tgcaggaaga agagaagacg 1140agttctctgg tgttgggaaa gcattcaaga gaagaaagct tgcaggaaga agagaagacg 1140

agaaattact tatgggtacc taaaactctt aggattgatg atccagctga ggctgcaaag 1200agaaattact tatgggtacc taaaactctt aggattgatg atccagctga ggctgcaaag 1200

agttcaatct gggcgaccct tggcatcaag cctgacgata aaggcatatt caagtctttc 1260agttcaatct gggcgaccct tggcatcaag cctgacgata aaggcatatt caagtctttc 1260

cagccaaatg ttgcgaaaaa tggcacggca ccagaatcgc ctcaggctct gcaggccaat 1320cagccaaatg ttgcgaaaaa tggcacggca ccagaatcgc ctcaggctct gcaggccaat 1320

ccagcagcat tttcgcgttc tcaatcgttt caagagacga cttga 1365 <210> 237 <211> 454 <212> PRTccagcagcat tttcgcgttc tcaatcgttt caagagacga cttga 1365 <210> 237 <211> 454 <212> PRT

<213> Oryza sativa <400> 237 Met 1<213> Oryza sativa <400> 237 Met 1

Pro Asn Leu Gly Asn Gly Val Lys Thr Asn Asn Asp 5 10Pro Asn Leu Gly Asn Gly Val Lys Thr Asn Asn Asp 5 10

Val Ser Asp Lys Leu Leu Ile Val Lys Gly Ile Pro PheVal Ser Asp Lys Leu Leu Ile Val Lys Gly Ile Pro Phe

2020

2525

Leu Pro Leu 15Leu Pro Leu 15

Cys Pro Asn 30Cys Pro Asn 30

Asn Ser Lys 35 Lys Asn Asp Leu Gln 40 Gly Ile Ser Arg Pro 45 Asp Gly Arg Ile Glu 50 Ile Asp Ser Met Thr 55 Glu Asp Val Lys Thr 60 Glu Pro Asp Gly Ser 65 Val Pro Glu Lys Ile 70 Leu Lys Lys Pro Asp 75 Lys Ile Leu Pro Cys 80 Pro Arg Cys Asn Ser 85 Met Glu Thr Lys Phe 90 Cys Tyr Phe Asn Asn 95 Tyr Asn Val His Gln 100 Pro Arg His Phe Cys 105 Arg Asn Cys Gln Arg 110 Tyr Trp Thr Ala Gly 115 Gly Ala Met Arg Asn 120 Val Pro Val Gly Ala 125 Gly Arg Arg Arg Asn 130 Lys His Val Ser Lys 135 Tyr Cys Gln Ala Met 140 Met Thr Cys Asn Asn Thr Val Ala Pro Gly Asp Val Ser Asp Val Val His His Gln Val 145 150 155Asn Ser Lys 35 Lys Asn Asp Leu Gln 40 Gly Ile Ser Arg Pro 45 Asp Gly Arg Ile Glu 50 Ile Asp Ser Met Thr 55 Glu Asp Val Lys Thr 60 Glu Pro Asp Gly Ser 65 Val Pro Glu Lys Ile 70 Leu Lys Lys Pro Asp 75 Lys Ile Leu Pro Cys 80 Pro Arg Cys Asn Ser 85 Met Glu Thr Lys Phe 90 Cys Tyr Phe Asn Asn 95 Tyr Asn Val His Gln 100 Pro Arg His Phe Cys 105 Arg Asn Cys Gln Arg 110 Tyr Trp Thr Wing Gly 115 Gly Wing Met Arg Asn 120 Val Pro Val Gly Wing 125 Gly Arg Arg Arg Asn 130 Lys His Val Ser Lys 135 Tyr Cys Gln Met Wing 140 Met Thr Cys Asn As Val Thr Pro Wing Val Gly Asp Val Be Asp Val Val His His Val Gln 145 150 155

Ile Thr His Gly Ser Ser Leu Leu Pro Ala ThrIle Thr His Gly Ser Serve Leu Pro Wing Ward

165 170165 170

Thr Pro Thr Glu Phe Ile Ser Glu Val Pro ProThr Pro Thr Glu Phe Ile Be Glu Val Pro

180 185180 185

Ser Ile Leu Asp Ile Gly Glu Pro Asn Asp ThrSer Ile Read Asp Ile Gly Glu Pro Asn Asp Thr

195 200195 200

Ala Ser Gly Asp Asn Lys Glu Glu Lys Ser CysAla Ser Gly Asp Asn Lys Glu Glu Lys Ser Cys

210 215210 215

Val Ser Ser Cys Ser Glu Asn Leu Met Pro Asp 225 230 235Val Ser Ser Cys Ser Glu Asn Leu Met Pro Asp 225 230 235

Glu Pro Asn Asn Arg Ser Gly Cys Cys Asn GlyGlu Pro Asn Asn Arg Be Gly Cys Cys Asn Gly

245 250245 250

Pro Thr Gly Pro Ala Leu Val Leu Pro Trp SerPro Thr Gly Pro Wing Leu Val Leu Pro Trp Ser

260 265260 265

Val Ala Leu Met Pro Ala Thr Gln Cys Ser MetVal Wing Read Met Pro Wing Pro Gln Cys Ser Met

275 280275 280

Leu Lys Asp Gly Ile Pro Cys Pro Pro Ser TrpRead Lys Asp Gly Ile Pro Cys Pro Pro Ser Trp

290290

295295

Val Pro Ala Pro Gly Ile Cys 305Val Pro Pro Wing Gly Ile Cys 305

ThrThr

Leu Lys GluRead Lys Glu

Cys Lys Ser 190Cys Lys Ser 190

Asp Leu ValAsp Leu Val

205 Ala Ser Ser 220205 Ser Ser Wing 220

Asn Ala IleAsn Ala Ile

Val Ala LeuVal Wing Leu

Leu Gly Trp 270Read Gly Trp 270

Gln Pro ValGln Pro Val

285 Pro Pro Gln 300285 Pro Pro Gln 300

Pro Ile ProPro Ile Pro

Pro Val ValPro val val

310 315 Pro Pro Leu Trp Ser Cys Phe Pro Gly Trp Pro Asn Gly Met310 315 Pro Pro Read Trp Be Cys Phe Pro Gly Trp Pro Asn Gly Met

325 330325 330

Ala Gln Cys Pro Gly Gly Asn Thr Thr Val LeuGln Cys Pro Wing Gly Gly Asn Thr Thr Val Leu

340340

345345

Asn Lys Ile Ser Cys Ser Gly Ser Ser Ser LeuAsn Lys Ile To Be Cys To Be Gly To Be To Be Leu

355355

360360

Ser Arg Glu Glu Ser Leu Gln Glu Glu Glu LysBe Arg Glu Glu Be Leu Gln Glu Glu Glu Lys

370370

375375

Trp Val Pro Lys Thr Leu Arg Ile Asp Asp ProTrp Val Pro Lys Thr Leu Arg Ile Asp Asp Pro

Pro Ser Thr 350Pro Ser Thr 350

Val Leu GlyVal Leu Gly

365 Thr Arg Asn 380365 Thr Arg Asn 380

Ala Glu AlaWing Glu Wing

385385

390390

395395

Ser Ser Ile Trp Ala Thr Leu Gly Ile Lys Pro Asp Asp LysBe Ser Ile Trp Wing Thr Gly Ile Lys Pro Asp Asp Lys

405405

410410

Phe Lys Ser Phe Gln Pro Asn Val Ala Lys AsnPhe Lys Ser Phe Gln Pro Asn

420420

425425

Ser Pro Gln Ala Leu Gln Ala Asn Pro Ala AlaSer Pro Gln Wing Read Gln Wing Asn Pro Wing Wing

435 440435 440

Ser Phe Gln Glu Thr ThrBe Phe Gln Glu Thr Thr

450 <210> 238 <211> 1461 <212> DNA <213> Oryza sativa <400> 238450 <210> 238 <211> 1461 <212> DNA <213> Oryza sativa <400> 238

atgggagggg gtggtaagtg caaaagaggg aaaagaggaa aggggccagt gttgcagcag cagcagcagc agcggaggcg agagaatcag aggagagctt gggtgagatg ggtgagtgca gatgggctga tcaagctgtt cgggaagacg atcccggtgc cagcagcata gtggcagtag cagcagctca accgaatccg gtcgccgtcg ccgacccctc cccgcggtcg gaggtcgtcg ccgggcggcg aggcggcgag ccatcagcag cagcagaagg gacaagatcc tgccatgccc gcggtgcagc agcatggaca aactacaacg tcaaccagcc tcgccacttc tgcaagcact ggcggcgcca tgcgcaacgt ccccgtcggc gccggccgcc gccgccgccc acttcctcca ccgcgtccgc gcctgcgccg gcgccccacg acgccaccaa cgccaccgtg ctcagcttcg gacgcgccgc cggtcaccct ggacctcgcc gacaagatga ctcgtcgccc atgcccggaa cgccgacgcc gccgccgcgt agggacgacg agcagatcgg caacactgta gcaaaacctg cctcctcctc ctcatcatca tcatcattca gccatgaacg tacacctcgg ggatcgcgat cccgatatac ccggcggcgc attccacctc ctggagcttg gagcctccca tggccggcca tcatcatcat caccacctac aagtgctaca ccttcagtctatgggagggg gtggtaagtg caaaagaggg aaaagaggaa aggggccagt gttgcagcag cagcagcagc agcggaggcg agagaatcag aggagagctt gggtgagatg ggtgagtgca gatgggctga tcaagctgtt cgggaagacg atcccggtgc cagcagcata gtggcagtag cagcagctca accgaatccg gtcgccgtcg ccgacccctc cccgcggtcg gaggtcgtcg ccgggcggcg aggcggcgag ccatcagcag cagcagaagg gacaagatcc tgccatgccc gcggtgcagc agcatggaca aactacaacg tcaaccagcc tcgccacttc tgcaagcact ggcggcgcca tgcgcaacgt ccccgtcggc gccggccgcc gccgccgccc acttcctcca ccgcgtccgc gcctgcgccg gcgccccacg acgccaccaa cgccaccgtg ctcagcttcg gacgcgccgc cggtcaccct ggacctcgcc gacaagatga ctcgtcgccc atgcccggaa cgccgacgcc gccgccgcgt agggacgacg agcagatcgg caacactgta gcaaaacctg cctcctcctc ctcatcatca tcatcattca gccatgaacg tacacctcgg ggatcgcgat cccgatatac ccggcggcgc attccacctc ctggagcttg gagcctccca tggccggcca tcatcatcat caccacctac aagtgctaca ccttcagtct

Gly Thr Ala 430Gly Thr Wing 430

Phe Ser Arg 445Phe Ser Arg 445

160 Asn Glu 175160 Asn Glu 175

Ser AlaTo be a wing

Pro LeuPro leu

Val ValVal Val

Met Lys 240 Pro Phe 255Met Lys 240 Pro Phe 255

Asn SerAsn ser

Leu GlyRead gly

Leu MetRead met

Leu Val 320 Trp Asn 335Leu Val 320 Trp Asn 335

Ala ProPro Wing

Lys HisLys his

Tyr LeuTyr leu

Ala Lys 400 Gly Ile 415Lys 400 Wing Gly Ile 415

Pro Glu Ser GlnPro Glu Ser Gln

agattgcagc caagaagacg gaggaggagg agccggatgc acgtccaaga acggcgagag agatgaagct ccaagttctg gccagcgcta gcaagaacaa ccgccgccgc gcggcggcgg cgcgcctcgg gcagcgaggt caaacgggtt gtggcggcat cggcgtactg cagtccagtc cctccttcacagattgcagc caagaagacg gaggaggagg agccggatgc acgtccaaga acggcgagag agatgaagct ccaagttctg gccagcgcta gcaagaacaa ccgccgccgc gcggcggcgg cgcgcctcgg gcagcgaggt caaacgggtt gtggcggcat cggcgtactg cagtccagtc cctccttcac

caagcgaaga agctagagag aggaggagga caaggatgtt aaccgccgct cccgccgcag gaagaagccg ctacttcaac ctggaccgcc gaacgccacc catgcccgcg aggcggacac caaggagggg gtcgagcaac gcagcagcat ctggccctac gggctgcatg tcaggccatc actaggcaagcaagcgaaga agctagagag aggaggagga caaggatgtt aaccgccgct cccgccgcag gaagaagccg ctacttcaac ctggaccgcc gaacgccacc catgcccggacac caaggagggacg gtcgagcaac gcgggcaggagcaggagcaggaggaggag

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 catcccagag agggtggtga tcatgaggca agagatcacc atggcaatgg taaagtgtgg 120060 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 catcccagag agggtggtga tcatgaggca agagatcacc atggcaatgg taaagtgtgg 1200

gtgccgaaga cgatccggat cgacaacgcc gacgaggttg cccggagctc aatccggtca 1260gtgccgaaga cgatccggat cgacaacgcc gacgaggttg cccggagctc aatccggtca 1260

ctcttcgcct tcagaggcgg cgacaaggcg gatgataaca acgacgacga tggcaccggc 1320ctcttcgcct tcagaggcgg cgacaaggcg gatgataaca acgacgacga tggcaccggc 1320

gtgcacaagc tcgccaccac ggtgttcgag ccaaagaggg acagcaagac ggcgaaacat 1380gtgcacaagc tcgccaccac ggtgttcgag ccaaagaggg acagcaagac ggcgaaacat 1380

ccggcgatca cgagcttgcc gctcttgcac accaaccccg tcgcgcttac ccgatccgcg 1440ccggcgatca cgagcttgcc gctcttgcac accaaccccg tcgcgcttac ccgatccgcg 1440

accttccagg agggatcttg a 1461 <210> 239 <211> 486accttccagg agggatcttg at 1461 <210> 239 <211> 486

<212> PRT <213> Oryza sativa <400> 239 Met Gly Gly Gly Gly Lys Cys Lys Arg Gly Lys Arg Gly Lys Ile Ala 1 5 10 15 Ala Lys Arg Arg Arg Gly Gln Cys Cys Ser Ser Ser Ser Ser Ser Gly 20 25 30 Gly Ala Arg Arg Arg Ala Arg Glu Arg Glu Ser Glu Glu Ser Leu Gly 35 40 45 Glu Met Gly Glu Cys Arg Gly Gly Gly Gly Gly Gly Asp Gly Leu Ile 50 55 60 Lys Leu Phe Gly Lys Thr Ile Pro Val Gln Pro Asp Ala Lys Asp Val 65 70 75 80 Gln Gln His Ser Gly Ser Ser Ser Ser Ser Thr Glu Ser Asp Val Gln 85 90 95 Glu Thr Ala Ala Val Ala Val Ala Asp Pro Ser Pro Arg Ser Glu Val 100 105 110 Val Asp Gly Glu Ser Pro Pro Gln Pro Gly Gly Glu Ala Ala Ser His 115 120 125 Gln Gln Gln Gln Lys Glu Met Lys Leu Lys Lys Pro Asp Lys Ile Leu 130 135 140 Pro Cys Pro Arg Cys Ser Ser Met Asp Thr Lys Phe Cys Tyr Phe Asn 145 150 155 160 Asn Tyr Asn Val Asn Gln Pro Arg His Phe Cys Lys His Cys Gln Arg 165 170 175 Tyr Trp Thr Ala Gly Gly Ala Met Arg Asn Val Pro Val Gly Ala Gly 180 185 190 Arg Arg Lys Asn Lys Asn Ala Thr Ala Ala Ala His Phe Leu His Arg 195 200 205 Val Arg Ala Cys Ala Ala Ala Ala Ala Met Pro Ala Ala Pro His Asp 210 215 220 Ala Thr Asn Ala Thr Val Leu Ser Phe Gly Gly Gly Gly Gly Gly His 225 230 235 240 Asp Ala Pro Pro Val Thr Leu Asp Leu Ala Asp Lys Met Thr Arg Leu 245 250 255 Gly Lys Glu Gly Leu Val Ala His Ala Arg Asn Ala Asp Ala Ala Ala 260 265 270 Ala Cys Ser Glu Val Ser Ser Asn Arg Asp Asp Glu Gln Ile Gly Asn 275 280 285 Thr Val Ala Lys Pro Ala Asn Gly Leu Gln Gln His Pro Pro Pro Pro 290 295 300 His His His His His Ser Ala Met Asn Gly Gly Gly Ile Trp Pro Tyr 305 310 315 320 Tyr Thr Ser Gly Ile Ala Ile Pro Ile Tyr Pro Ala Ala Pro Ala Tyr 325 330 335 Trp Gly Cys Met Ile Pro Pro Pro Gly Ala Trp Ser Leu Pro Trp Pro 340 345 350 Ala Thr Val Gln Ser Gln Ala Ile Ser Ser Ser Ser Pro Pro Thr Ser 355 360 365 Ala Thr Pro Ser Val Ser Ser Phe Thr Leu Gly Lys His Pro Arg Glu 370 375 380 Gly Gly Asp His Glu Ala Arg Asp His His Gly Asn Gly Lys Val Trp 385 390 395 400 Val Pro Lys Thr Ile Arg Ile Asp Asn Ala Asp Glu Val Ala Arg Ser 405 410 415 Ser Ile Arg Ser 420 Leu Phe Ala Phe Arg 425 Gly Gly Asp Lys Ala 430 Asp Asp Asn Asn Asp 435 Asp Asp Gly Thr Gly 440 Val His Lys Leu Ala 445 Thr Thr Val Phe Glu 450 Pro Lys Arg Asp Ser 455 Lys Thr Ala Lys His 460 Pro Ala Ile Thr Ser Leu Pro Leu Leu His Thr Asn Pro Val Ala Leu Thr Arg Ser Ala 465 470 475 480 Thr Phe Gln Glu Gly Ser<212> PRT <213> Oryza sativa <400> 239 Met Gly Gly Gly Gly Lys Cys Lys Arg Gly Lys Cys Lys Ily Wing 1 5 10 15 Wing Lys Arg Arg Gly Gln Cys Cys Ser Ser Ser Ser Ser Gly 20 25 30 Gly Wing Arg Arg Arg Wing Arg Arg Arg Glu Arg Glu Be Glu Glu Be Leu Gly 35 40 45 Glu Met Gly Gly Gly Gly Gly Gly Gly Gly Asly Gly Leu Ile 50 55 60 Lys Leu Phe Gly Lys Thr Ile Pro Val Gln Pro Asp Wing Lys Asp Val 65 70 75 80 Gln Gln His Be Gly Being Being Being Being Being Being Thr Glu Being Asp Val Gln 85 90 95 Glu Thr Ward Wing Val Val Wing Wing Asp Pro Being Pro Arg Being Glu Val 100 105 110 Val Asp Gly Glu Be Pro Pro Gln Gly Gly Glu Wing Ala Be His 115 120 125 Gln Gln Gln Gln Lys Glu Met Lys Leu Lys Pro Asp Lys Ile Leu 130 135 140 Pro Cys Pro Arg Cys Be Met Asp Thr Lys Phe Cys Tyr Phe Asn 145 150 155 160 Asn Tyr Asn Val Asn Gln Pro Arg His Phe Cys Lys His Cys Gln Arg 165 170 175 Tyr Trp Thr Wing Gly Gly Wing Met Arg Asn Val Pro Val Gly Wing Gly 180 185 190 Arg Arg Lys Asn Lys Asn Wing Thr Wing Wing His Phe Leu His Arg 195 200 205 Val Arg Wing Cys Ala Ala Ala Ala Met Ala Pro Ala Ala Pro Asp 210 215 220 Ala Thr Asn Ala Thr Val Leu Be Phe Gly Gly Gly Gly Gly His 225 230 235 240 Asp Ala Pro Pro Val Leu Asp Leu Asp Lys Met Thr Arg Leu 245 250 255 Gly Lys Glu Gly Leu Val Wing His Wing Arg Asn Wing Asp Wing Wing Wing 260 265 270 Cys Wing Be Glu Val Ser Be Asn Arg Asp Glu Gln Ile Gly Asn 275 280 285 Thr Val Wing Lys Pro Wing Asn Gly Leu Gln Gln His Pro Pro Pro 290 295 300 His His His His His Be Ala Met Asn Gly Gly Gly Ile Trp Pro Tyr 305 310 315 320 Tyr Thr Be Gly Ile Alle Ile Pro Ile Tyr Pro Ala Pro Ala Tyr 325 330 335 Trp Gly Cys Met Ile Pro Pro Gly Wing Trp Ser Leu Pr the Trp Pro 340 345 350 Wing Thr Val Gln Be Gln Wing Ile Be Ser Be Be Pro Pro Thr Be 355 360 365 Wing Thr Pro Be Val Be Phe Thr Read Gly Lys His Pro Arg Glu 370 375 380 Gly Gly Asp His Glu Wing Arg Asp His His Gly Asn Gly Lys Val Trp 385 390 395 400 Val Pro Lys Thr Ile Arg Ile Asp Asn Wing Asp Glu Val Wing Arg Be 405 410 415 Ser Ile Arg Ser 420 Leu Phe Wing Phe Arg 425 Gly Gly Asp Lys Wing 430 Asp Asp Asn Asn Asp 435 Asp Asp Gly Thr Gly 440 Val His Lys Leu Wing 445 Thr Thr Val Phe Glu 450 Pro Lys Arg Asp Ser 455 Lys Thr Wing Lys His 460 Pro Ala Ile Thr Be Read Leu Read His Thr Asn Pro Val Wing Read Thr Thr Ser Wing 465 470 475 480 Thr Phe Gln Glu Gly Ser

485485

<210> 240<210> 240

<211> 1461<211> 1461

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 240<400> 240

atgggagggg gtggtaagtg caaaagaggg aaaagaggaaatgggagggg gtggtaagtg caaaagaggg aaaagaggaa

aggggccagt gttgcagcag cagcagcagc agcggaggcgaggggccagt gttgcagcag cagcagcagc agcggaggcg

agagaatcag aggagagctt gggtgagatg ggtgagtgcaagagaatcag aggagagctt gggtgagatg ggtgagtgca

gatgggctga tcaagctgtt cgggaagacg atcccggtgcgatgggctga tcaagctgtt cgggaagacg atcccggtgc

cagcagcata gtggcagtag cagcagctca accgaatccgcagcagcata gtggcagtag cagcagctca accgaatccg

gtcgccgtcg ccgacccctc cccgcggtcg gaggtcgtcggtcgccgtcg ccgacccctc cccgcggtcg gaggtcgtcg

ccgggcggcg aggcggcgag ccatcagcag cagcagaaggccgggcggcg aggcggcgag ccatcagcag cagcagaagg

gacaagatcc tgccatgccc gcggtgcagc agcatggacagacaagatcc tgccatgccc gcggtgcagc agcatggaca

aactacaacg tcaaccagcc tcgccacttc tgcaagcactaactacaacg tcaaccagcc tcgccacttc tgcaagcact

ggcggcgcca tgcgcaacgt ccccgtcggc gccggccgccggcggcgcca tgcgcaacgt ccccgtcggc gccggccgcc

gccgccgccc acttcctcca ccgcgtccgc gcctgcgccggccgccgccc acttcctcca ccgcgtccgc gcctgcgccg

gcgccccacg acgccaccaa cgccaccgtg ctcagcttcggcgccccacg acgccaccaa cgccaccgtg ctcagcttcg

gacgcgccgc cggtcaccct ggacctcgcc gacaagatgagacgcgccgc cggtcaccct ggacctcgcc gacaagatga

ctcgtcgccc atgcccggaa cgccgacgcc gccgccgcgtctcgtcgccc atgcccggaa cgccgacgcc gccgccgcgt

agggacgacg agcagatcgg caacactgta gcaaaacctgagggacgacg agcagatcgg caacactgta gcaaaacctg

cctcctcctc ctcatcatca tcatcattca gccatgaacgcctcctcctc ctcatcatca tcatcattca gccatgaacg

tacacctcgg ggatcgcgat cccgatatac ccggcggcgctacacctcgg ggatcgcgat cccgatatac ccggcggcgc

attccacctc ctggagcttg gagcctccca tggccggccaattccacctc ctggagcttg gagcctccca tggccggcca

tcatcatcat caccacctac aagtgctaca ccttcagtcttcatcatcat caccacctac aagtgctaca ccttcagtct

catcccagag agggtggtga tcatgaggca agagatcacccatcccagag agggtggtga tcatgaggca agagatcacc

gtgccgaaga cgatccggat cgacaacgcc gacgaggttggtgccgaaga cgatccggat cgacaacgcc gacgaggttg

ctcttcgcct tcagaggcgg cgacaaggcg gatgataacactcttcgcct tcagaggcgg cgacaaggcg gatgataaca

gtgcacaagc tcgccaccac ggtgttcgag ccaaagaggggtgcacaagc tcgccaccac ggtgttcgag ccaaagaggg

ccggcgatca cgagcttgcc gctcttgcac accaaccccgccggcgatca cgagcttgcc gctcttgcac accaaccccg

accttccagg agggatcttg a <210> 241 <211> 440 <212> PRTaccttccagg agggatcttg at <210> 241 <211> 440 <212> PRT

<213> Oryza sativa <400> 241<213> Oryza sativa <400> 241

Met Gly Glu Cys Lys Val Gly Gly Gly Gly GlyMet Gly Glu Cys Lys Val Gly Gly Gly

15 10 Ile Lys Leu Phe Gly Lys Thr Ile Pro Val Pro15 10 Ile Lys Leu Phe Gly Lys Thr Ile Pro Val Pro

20 2520 25

Ala Ala Gly Asp Val Asp Lys Asp Leu Gln HisWing Wing Gly Asp Val Asp Lys Asp Read Gln His

35 4035 40

Thr Glu Pro Lys Thr Gln Glu Asn Thr Val GlnThr Glu Pro Lys Thr Gln Glu Asn

50 5550 55

Pro Pro Gln Pro Glu Val Val Asp Thr Glu AspPro Pro Gln Pro Pro Glu Val Val Asp Thr Glu Asp

agattgcagc caagaagacg gaggaggagg agccggatgc acgtccaaga acggcgagag agatgaagct ccaagttctg gccagcgcta gcaagaacaa ccgccgccgc gcggcggcgg cgcgcctcgg gcagcgaggt caaacgggtt gtggcggcat cggcgtactg cagtccagtc cctccttcac atggcaatgg cccggagctc acgacgacga acagcaagac tcgcgcttacagattgcagc caagaagacg gaggaggagg agccggatgc acgtccaaga acggcgagag agatgaagct ccaagttctg gccagcgcta gcaagaacaa ccgccgccgc gcggcggcgg cgcgcctcgg gcagcgaggt caaacgggtt gtggcggcat cggcgtactg cagtccagtc cctccttcac atggcaatgg cccggagctc acgacgacga acagcaagac tcgcgcttac

caagcgaaga agctagagag aggaggagga caaggatgtt aaccgccgct cccgccgcag gaagaagccg ctacttcaac ctggaccgcc gaacgccacc catgcccgcg aggcggacac caaggagggg gtcgagcaac gcagcagcat ctggccctac gggctgcatg tcaggccatc actaggcaag taaagtgtgg aatccggtca tggcaccggc ggcgaaacat ccgatccgcgcaagcgaaga agctagagag aggaggagga caaggatgtt aaccgccgct cccgccgcag gaagaagccg ctacttcaac ctggaccgcc gaacgccacc catgcccgcg aggcggacac caaggagggg gtcgagcaac gcagcagcat ctggccctac gggctgcatg tcaggccatc actaggcaag taaagtgtgg aatccggtca tggcaccggc ggcgaaacat ccgatccgcg

Gly GlyGly Gly

Glu ProGlu Pro

Ser Gly 45Ser Gly 45

Asp Ser 60Asp Ser 60

Ser SerTo be to be

6565

7070

7575

Asn Ser Ser Glu Asn Gln Gln Gln Gln Gly Asp Thr AlaAsn Be Ser Glu Asn Gln Gln Gln Gln Gly Asp Thr Wing

85 9085 90

Glu Lys Leu Lys Lys Pro Asp Lys Ile Leu Pro Cys ProGlu Lys Leu Lys Pro Asp Lys Ile Leu Pro Cys Pro

100100

105105

Ser Met Asp Thr Lys Phe Cys Tyr Tyr Asn AsnBeing Met Asp Thr Lys Phe Cys Tyr Tyr Asn Asn

115 120115 120

Pro Arg His Phe Cys Lys Asn Cys Gln Arg Tyr 130 135Pro Arg His Phe Cys Lys Asn Cys Gln Arg Tyr 130 135

Tyr Asn 125 Trp Thr 140Tyr Asn 125 Trp Thr 140

Asp Cys Leu 15Asp Cys Leu 15

Gly Ala Cys 30Gly Wing Cys 30

Ser Ser ThrBe Ser Thr

Thr Ser ProThr ser pro

Ala Asp Lys 80Wing Asp Lys 80

Asn Gln Lys 95Asn Gln Lys 95

Arg Cys Ser 110Arg Cys Ser 110

Ile Asn Gln Ala Gly GlyIle Asn Gln Wing Gly Gly

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1461 Ala Met Arg Asn Val Pro Val Gly 145 15060 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1461 Met Arg Wing Asn Val Pro Val Gly 145 150

Val Ser Ala Ala Ser His Phe Leu 165Val Ser Wing Al Ser Ser Phe Leu 165

Gly Asp Pro Pro Leu Tyr Ala Pro 180Gly Asp Pro Pro Read Tyr Wing Pro 180

Ser Phe Gly Ser Asp Leu Ser Thr 195 200Ser Phe Gly Ser Asp Read Ser Thr 195 200

His Leu Lys Asp Lys Phe Ile ProHis Leu Lys Asp Lys Phe Ile Pro

Ala Gly Arg 155Gly Arg Wing 155

Gln Arg ValGln Arg Val

170 Val Lys Thr 185170 Val Lys Thr 185

Leu Asp Leu Thr Thr GlyRead Asp Read Thr Thr Gly

210210

215215

Glu Met Pro Val Gly Leu Cys Ala Glu Gly LeuGlu Met Pro Val Gly Leu Cys Wing Glu Gly Leu

ArgArg

ArgArg

AsnAsn

ThrThr

Ile 220 SerIle 220 Ser

LysLys

AlaAllah

GlyGly

Glu 205 LysGlu 205 Lys

SerTo be

AlaAllah

Thr 190 GlnThr 190 Gln

AsnAsn

Lys ThrLys thr

225225

230230

235235

Lys Ser 160 Leu Pro 175Lys Ser 160 Leu Pro 175

Val LeuVal leu

Met LysMet lys

Thr AspThr asp

Glu Glu 240Glu Glu 240

Ser Asn Gln Thr Asn 245 Leu Lys Glu Lys Val 250 Ser Ala Asp Arg Ser 255 Pro Asn Val Ala Gln 260 His Pro Cys Met Asn 265 Gly Gly Ala Met Trp 270 Pro Phe Gly Val Ala 275 Pro Pro Pro Ala Tyr 280 Tyr Thr Ser Ser Ile 285 Ala Ile Pro Phe Tyr 290 Pro Ala Ala Ala Ala 295 Ala Val Ala Ala Tyr 300 Trp Gly Cys Met Val Pro Gly Ala Trp Asn Ala Pro Trp Pro Pro Gln Ser Gln Ser Gln 305 310 315 320 Ser Val Ser Ser Ser 325 Ser Ala Ala Ser Pro 330 Val Ser Thr Met Thr 335 Asn Cys Phe Arg Leu 340 Gly Lys His Pro Arg 345 Asp Gly Asp Glu Glu 350 Leu Asp Ser Lys Gly 355 Asn Gly Lys Val Trp 360 Val Pro Lys Thr Val 365 Arg Ile Asp Asp Val Asp Glu Val Ala Arg Ser Ser Ile Trp Ser Leu Ile Gly IleSer Asn Gln Thr Asn 245 Leu Lys Glu Lys Val 250 Ser Asp Wing Asp Arg Ser 255 Pro Asn Val Wing Gln 260 His Pro Cys Met Asn 265 Gly Gly Wing Met Trp 270 Pro Phe Gly Val Wing 275 Pro Pro Wing Tyr 280 Tyr Thr Ser Ser Ile 285 Ile Pro Wing Phe Tyr 290 Pro Wing Wing Wing Wing 295 Wing Val Wing Wing Tyr 300 Trp Gly Cys Met Val Pro Gly Wing Trp Asn Pro Pro Wing Gln Ser Gln Ser Gln 305 310 315 320 Ser Val Ser Ser Ser 325 Ser Wing Ala Ser Pro 330 Val Ser Thr Thr Thr 335 Asn Cys Phe Arg Leu 340 Gly Lys His Pro 345 Asp Gly Asp Glu Glu 350 Leu Asp Ser Lys Gly 355 Asn Gly Lys Val Trp 360 Val Pro Lys Thr Val 365 Arg Ile Asp Asp Val Asp Glu Val Wing Arg Be Ser Ile Trp Ser Leu Ile Gly Ile

370370

375375

Lys 385Lys 385

Gly Asp Lys Val Gly Ala Asp 390Gly Asp Lys Val Gly Wing Asp 390

Lys Val Phe Glu Ser Lys Asp Glu 405Lys Val Phe Glu Ser Lys Asp Glu 405

Ile Ser Ser Leu Pro Phe Met Gln 420Ile Ser Ser Leu Pro Phe Met Gln 420

Ser Val Thr Phe Gln Glu Gly Ser 435 440Ser Val Thr Phe Gln Glu Gly Ser 435 440

<210> 242 <211> 1803 <212> DNA <213> Oryza sativa <400> 242<210> 242 <211> 1803 <212> DNA <213> Oryza sativa <400> 242

acttgtcgga tctctctctc tctctctctc catggacgac ctcgccgccg cctcccctcc cgtgcctccg cccccgcaga cgccggagaa gatcagtgaa gaaaagccat gcacagatca tagctttaat agttccagcg agtgtgagaa atcagagtcc aaatctgagg cagctcaaac cctgaagaag ccagacaaga tcctgccttg ctgctactac aacaactaca acattaacca atattggacg gcaggtggaa gcatgaggaa taagagctcc actgcaaatt accgcagtat tgctggagat gctcccctct atcaactctc taaatttgca cctgattccc cactctgtaa gcagagtaag aatgccaagc ctacctcaac ctgcccggct tcaggaacaa cttcagatag tagtgggcat caaaatggaa ttgttgggca atgcttccct ggtcctcctt ttgtgtaccc catggcacca ccggtatgca cagcaccagc cacagctagt gttcagtgga gcatgccacc aattccatct tcagtttggc ccttcatttc atggattcaa cctaattgca gcgtgtcagcacttgtcgga tctctctctc tctctctctc catggacgac ctcgccgccg cctcccctcc cgtgcctccg cccccgcaga cgccggagaa gatcagtgaa gaaaagccat gcacagatca tagctttaat agttccagcg agtgtgagaa atcagagtcc aaatctgagg cagctcaaac cctgaagaag ccagacaaga tcctgccttg ctgctactac aacaactaca acattaacca atattggacg gcaggtggaa gcatgaggaa taagagctcc actgcaaatt accgcagtat tgctggagat gctcccctct atcaactctc taaatttgca cctgattccc cactctgtaa gcagagtaag aatgccaagc ctacctcaac ctgcccggct tcaggaacaa cttcagatag tagtgggcat caaaatggaa ttgttgggca atgcttccct ggtcctcctt ttgtgtaccc catggcacca ccggtatgca cagcaccagc cacagctagt gttcagtgga gcatgccacc aattccatct tcagtttggc ccttcatttc atggattcaa cctaattgca gcgtgtcagc

His Gly Arg 395His Gly Arg 395

Ala Lys AlaWing Lys Wing

410 Gly Asn Pro 425410 Gly Asn Pro 425

380 Gly380 Gly

SerTo be

AlaAllah

Cys Thr AlaCys Thr Wing

LysLys

HisHis

Leu 430Read 430

Leu Ala 400 Thr Ala 415Leu Wing 400 Thr Wing 415

Thr ArgThr arg

tccctctctc tcacccgccg ggattcatgt ggagttagat tcaaacacct agagggtggt tcctcgttgc gccaagacat cctccctgtt attaatcacg tataaaagga ttccatggcc agcacaaccc tccccggaat tagtggagtc atggagtcca tgaaccagca agtgatgccg tccctggcca ttcatctccttccctctctc tcacccgccg ggattcatgt ggagttagat tcaaacacct agagggtggt tcctcgttgc gccaagacat cctccctgtt attaatcacg tataaaagga ttccatggcc agcacaaccc tggagcgtgtcgtgtgtcgctg

tctcgcccat ccgccgccgc gaggatacag gctgatcaga agcaatgatg ggatcgagtg aacagcatgg ttttgcaaga ggtgctggta ggcagcaatc gatcaaacag tctgtgctga agaaatggag gaaccagtta cctcccatgc gcatggaatg aattcttcag gtaccaggat aatggtgcat acaagcactatctcgcccat ccgccgccgc gaggatacag gctgatcaga agcaatgatg ggatcgagtg aacagcatgg ttttgcaaga ggtgctggta ggcagcaatc gatcaaacag tctgtgctga agaaatggag gagcaggagcatgagcgtgagcgggccat

gtaccatctc cggaatccca gagacatgag tgaatagttc aaatgactgg aagagaaggt atacaaagtt gttgtcagag ggcgcaagag tagctgctcc caacggcagt aaattggaga aaacccagac atggagcagt atcccatacc gcattcctgc acaatggaag actttccggt ggagctcgcc gtacatgttcgtaccatctc cggaatccca gagacatgag tgaatagttc aaatgactgg aagagaaggt atacaaagtt gttgtcagag ggcgcaagag tagctgctcc caacggcagt aaattggaga aaacccagac atggagcagt atcccatacc ggggcccctggccccgggccccgtg

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 agacaacggc tctcctgtcc taggaaagca ctccagggac tccaaaccgc aaggagatga 1260 caaggcagag aaaaacttgt ggattccgaa aacgcttcgg atcgatgatc ctgacgaagc 1320 tgcaaagagc tcaatctgga caacccttgg cattgaacct ggtgaccgta gcatgttcag 1380 atcattccag tcgaaacctg aaagcaggga gcagatatcc ggtgctgcac gagtcctgca 1440 ggcgaatcca gcagctctat ctcgatctca atctttccag gagacaacgt gatgtatatt 1500 gaagaaatcg tgtgacaatt gtagaacatg ttactactat aatttaagca agtgctacag 1560 cctgaaggat gattggcgat gtaggcgctg ctgcaaacat ggaggcagcg tgatctgtac 1620 tattgaaacc tgaagagtac tattcttgac atttttctat aatttgcctg tggagcatgc 1680 accagtctac tgggttcatg atcaggctgt cagcatatgt tttgttgtac aataataata 1740 attgttaata gctttgccta aaggatactg atagtattct gctgatcctt cagctctgtg 1800 ate 180360 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 agacaacggc tctcctgtcc taggaaagca ctccagggac tccaaaccgc aaggagatga 1260 caaggcagag aaaaacttgt ggattccgaa aacgcttcgg atcgatgatc ctgacgaagc 1320 tgcaaagagc tcaatctgga caacccttgg cattgaacct ggtgaccgta gcatgttcag 1380 atcattccag tcgaaacctg aaagcaggga gcagatatcc ggtgctgcac gagtcctgca 1440 ggcgaatcca gcagctctat ctcgatctca atctttccag gagacaacgt gatgtatatt 1500 gaagaaatcg tgtgacaatt gtagaacatg ttactactat aatttaagca agtgctacag 1560 cctgaaggat gattggcgat gtaggcgctg ctgcaaacat ggaggcagcg tgatctgtac 1620 tattgaaacc tgaagagtac tattcttgac atttttctat aatttgcctg tggagcatgc 1680 accagtctac tgggttcatg atcaggctgt cagcatatgt tttgttgtac aataataata 1740 attgttaata gctttgccta aaggatactg atagtattct gctgatcctt cagctctgtg 1800 to 1803

<210> 243 <211> 476 <212> PRT<210> 243 <211> 476 <212> PRT

<213> Oryza sativa <400> 243<213> Oryza sativa <400> 243

Met Asp Asp Leu Ala Ala Ala Ser Pro Pro His Pro Pro Pro Pro Pro 1 5 10 15Met Asp Asp Read Wing Wing Wing Wing Be Pro Pro His Pro Pro Pro Pro 1 5 10 15

Pro Glu Ser His Val Pro Pro Pro Pro Gln Thr Pro Glu Lys Asp SerPro Glu Be His Val Pro Pro Pro Pro Gln Thr Pro Pro Glu Lys Asp Ser

20 25 3020 25 30

Cys Glu Asp Thr Gly Asp Met Arg Ile Ser Glu Glu Lys Pro Cys ThrCys Glu Asp Thr Gly Asp Met Arg Ile Be Glu Glys Lys Pro Cys Thr

35 40 4535 40 45

Asp Gln Glu Leu Asp Ala Asp Gln Met Asn Ser Ser Ser Phe Asn SerAsp Gln Glu Read Asp Wing Asp Gln Met Asn Ser Be Ser Phe Asn Ser

50 55 6050 55 60

Ser Ser Glu Cys Glu Asn Gln Thr Pro Ser Asn Asp Glu Met Thr Gly 65 70 75 80Be Be Glu Cys Glu Asn Gln Thr Pro Be Asn Glu Met Asp Gn 65 70 75 80

Ser Glu Ser Lys Ser Glu Ala Ala Gln Thr Glu Gly Gly Gly Ser SerBe Glu Be Lys Be Glu Ward Wing Gln Thr Glu Gly Gly Gly Be Ser

85 90 9585 90 95

Glu Glu Lys Val Leu Lys Lys Pro Asp Lys Ile Leu Pro Cys Pro ArgGlu Glu Lys Val Leu Lys Lys Pro Asp Lys Ile Leu Pro Cys Pro Arg

100 105 110100 105 110

Cys Asn Ser Met Asp Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn IleCys Asn Be Met Asp Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Ile

115 120 125115 120 125

Asn Gln Pro Arg His Phe Cys Lys Ser Cys Gln Arg Tyr Trp Thr AlaAsn Gln Pro Arg His Phe Cys Lys Be Cys Gln Arg Tyr Trp Thr Wing

130 135 140130 135 140

Gly Gly Ser Met Arg Asn Leu Pro Val Gly Ala Gly Arg Arg Lys Ser 145 150 155 160Gly Gly Ser Met Arg Asn Leu Pro Val Gly Wing Gly Arg Arg Lys Ser 145 150 155 160

Lys Ser Ser Thr Ala Asn Tyr Arg Ser Ile Leu Ile Thr Gly Ser AsnLys Be Be Thr Wing Asn Tyr Arg Be Ile Read Ile Thr Gly Be Asn

165 170 175165 170 175

Leu Ala Ala Pro Ala Gly Asp Ala Pro Leu Tyr Gln Leu Ser Ile LysLeu Wing Pro Wing Gly Asp Wing Pro Wing Leu Tyr Gln Leu Ser Ile Lys

180 185 190180 185 190

Gly Asp Gln Thr Ala Thr Ala Val Lys Phe Ala Pro Asp Ser Pro LeuGly Asp Gln Thr Wing Thr Wing Val Lys Phe Wing Pro Asp Be Pro Leu

195 200 205195 200 205

Cys Asn Ser Met Ala Ser Val Leu Lys Ile Gly Glu Gln Ser Lys AsnCys Asn Be Met Wing Be Val Leu Lys Ile Gly Glu Gln Be Lys Asn

210 215 220210 215 220

Ala Lys Pro Thr Ser Thr Ala Gln Pro Arg Asn Gly Glu Thr Gln Thr 225 230 235 240Wing Lys Pro Thr Be Thr Wing Gln Pro Arg Asn Gly Glu Thr Gln Thr 225 230 235 240

Cys Pro Ala Ser Gly Thr Thr Ser Asp Ser Pro Arg Asn Glu Pro ValCys Pro Wing Be Gly Thr Thr Be Asp Be Pro Arg Asn Glu Pro Val

245 250 255245 250 255

Asn Gly Ala Val Ser Gly His Gln Asn Gly Ile Val Gly His Ser GlyAsn Gly Ala Val Ser Gly His Gln Asn Gly Ile Val Gly His Ser Gly

260 265 270260 265 270

Val Pro Pro Met His Pro Ile Pro Cys Phe Pro Gly Pro Pro Phe ValVal Pro Pro Met His Pro Ile Pro Cys Phe Pro Gly Pro Pro Phe Val

275 280 285275 280 285

Tyr Pro Trp Ser Pro Ala Trp Asn Gly Ile Pro Ala Met Ala Pro ProTyr Pro Trp Be Pro Wing Trp Asn Gly Ile Pro Wing Met Wing Pro Pro

290 295 300290 295 300

Val Cys Thr Ala Pro Ala Glu Pro Ala Asn Ser Ser Asp Asn Gly Ser 305 310 315 320Val Cys Thr Wing Pro Wing Glu Pro Wing Asn Be Ser Asp Asn Gly Ser 305 310 315 320

Thr Ala Ser Val Gln Trp Ser Met Pro Pro Val Met Pro Val Pro GlyThr Wing Be Val Gln Trp Be Met Pro Pro Val Met Pro Val Gly

325 330 335325 330 335

Tyr Phe Pro Val Ile Pro Ser Ser Val Trp Pro Phe Ile Ser Pro TrpTyr Phe Pro Val Ile Pro Ser Be Val Trp Pro Phe Ile Pro Val Ser

340 345 350340 345 350

Pro Asn Gly Ala Trp Ser Ser Pro Trp Ile Gln Pro Asn Cys Ser ValPro Asn Gly Wing Trp Be Ser Pro Trp Ile Gln Pro Asn Cys Ser Val

355 360 365355 360 365

Ser Ala Ser Ser Pro Thr Ser Thr Ser Thr Cys Ser Asp Asn Gly Ser 370 375 380 Pro Val Leu Gly Lys His Ser Arg Asp Ser Lys Pro Gln Gly Asp Asp 385 390 395 400 Lys Ala Glu Lys Asn Leu Trp Ile Pro Lys Thr Leu Arg Ile Asp Asp 405 410 415 Pro Asp Glu Ala Ala Lys Ser Ser Ile Trp Thr Thr Leu Gly Ile Glu 420 425 430 Pro Gly Asp Arg Ser Met Phe Arg Ser Phe Gln Ser Lys Pro Glu Ser 435 440 445 Arg Glu Gln Ile Ser Gly Ala Ala Arg Val Leu Gln Ala Asn Pro Ala 450 455 460 Ala Leu Ser Arg Ser Gln Ser Phe Gln Glu Thr Thr 465 470 475 <210> 244 <211> 1817Be Ala Ser Be Pro Thr Be Thr Be Thr Cys Be Asp Asn Gly Be 370 375 380 Pro Val Leu Gly Lys His Be Arg Asp Be Lys Pro Gln Gly Asp 385 390 395 400 Lys Wing Glu Lys Asn Leu Trp Ile Pro Lys Thr Leu Arg Ile Asp Asp 405 410 415 Pro Asp Glu Wing Ala Lys Be Ser Ile Trp Thr Thr Read Le Gly Ile Glu 420 425 430 Pro Gly Asp Arg Be Met Ser Gly Wing Arg Wing Val Leu Gln Wing Asn Pro Wing 450 455 460 Wing Read Le Ser Arg Be Gln Ser Phe Gln Glu Thr Thr 465 470 475 <210> 244 <211> 1817

<212> DNA<212> DNA

<213> Hordeum vulgare <400> 244<213> Hordeum vulgare <400> 244

ctagacatga ttgccaagct cgaaaataac cctcacaaag ggaacaaaac tggtaccggg 60ctagacatga ttgccaagct cgaaaataac cctcacaaag ggaacaaaac tggtaccggg 60

ccccccctcg aggtcgacaa ggtcggtgtc catgccccct ccccctcctc ctttgtgttc 120ccccccctcg aggtcgacaa ggtcggtgtc catgccccct ccccctcctc ctttgtgttc 120

ttgtgtatga aatcccggga attttgattg gtttctaata gagcctgtga aaaaaaaaaa 180ttgtgtatga aatcccggga attttgattg gtttctaata gagcctgtga aaaaaaaaaa 180

ggccatttcg aggcctgctt tctttggctt tggagccgat catggcgacg agtcgtgttt 240ggccatttcg aggcctgctt tctttggctt tggagccgat catggcgacg agtcgtgttt 240

ggtctagtca tcaggtctta agcatggagt tccctgcctg ttttgggagg tactagtaag 300ggtctagtca tcaggtctta agcatggagt tccctgcctg ttttgggagg tactagtaag 300

cgctaagcag gcaggtttag cttccattag caagggaatt tcgcctttgc tggtctctaa 360cgctaagcag gcaggtttag cttccattag caagggaatt tcgcctttgc tggtctctaa 360

taataatagc agtttcaaca gttttagtat tgcatgatct agtcgtctga acatctggac 420taataatagc agtttcaaca gttttagtat tgcatgatct agtcgtctga acatctggac 420

ttctgaaaga caggcctttc taggttatta tcttgcctct tttaataggt cgttttcgcg 480ttctgaaaga caggcctttc taggttatta tcttgcctct tttaataggt cgttttcgcg 480

tgctcccaag gattttgctg aaagtggcta ctgatatgtg ttgccgtaac ctactggact 540tgctcccaag gattttgctg aaagtggcta ctgatatgtg ttgccgtaac ctactggact 540

tcagaagttc agatgcgtcc gactctgagt acatcaccca ctgcaaatca aagcaccata 600tcagaagttc agatgcgtcc gactctgagt acatcaccca ctgcaaatca aagcaccata 600

gcttcttttt ttcattaaca agatataaga actgggaata tgaacaaact ttgtcaaatt 660gcttcttttt ttcattaaca agatataaga actgggaata tgaacaaact ttgtcaaatt 660

ttacacttgg gtcagatggg ggaaagcatg ttgtaatcac cggtcaataa cccgaatatt 720ttacacttgg gtcagatggg ggaaagcatg ttgtaatcac cggtcaataa cccgaatatt 720

acaccgtgtt tgtggacctc taattcacaa caaaattatt tcaaagttag actatatata 780acaccgtgtt tgtggacctc taattcacaa caaaattatt tcaaagttag actatatata 780

tatacaagga actcatcgag attttctgaa tgtttacagg accttcagca cagaggaagc 840tatacaagga actcatcgag attttctgaa tgtttacagg accttcagca cagaggaagc 840

accacggctg aaccgaaagt acaagaaagc gccccacagg actccacggg ctcgcctccg 900accacggctg aaccgaaagt acaagaaagc gccccacagg actccacggg ctcgcctccg 900

cagccggagg ttgtggacgt cgaggatcca tctgctgtca agaactcagc agcagatcaa 960cagccggagg ttgtggacgt cgaggatcca tctgctgtca agaactcagc agcagatcaa 960

caagaagaag aagaagaaca gggtgacacg gccaaccaga aggagaagct caagaagcct 1020caagaagaag aagaagaaca gggtgacacg gccaaccaga aggagaagct caagaagcct 1020

gacaagatcc tgccctgccc acgctgtagc agcatggaca ccaagttctg ctactacaac 1080gacaagatcc tgccctgccc acgctgtagc agcatggaca ccaagttctg ctactacaac 1080

aactacaaca tcaaccagcc gcgccacttc tgcaagaact gccagaggta ctggacggcc 1140aactacaaca tcaaccagcc gcgccacttc tgcaagaact gccagaggta ctggacggcc 1140

ggcggggcca tgcgcaacgt gcccgtgggc gcgggccgcc gcaagagcaa gagcatatcg 1200ggcggggcca tgcgcaacgt gcccgtgggc gcgggccgcc gcaagagcaa gagcatatcg 1200

gcagcgtccc acttccttca gaggataagg gccgctctgc ccggtgatcc tctctgcacc 1260gcagcgtccc acttccttca gaggataagg gccgctctgc ccggtgatcc tctctgcacc 1260

ccggtcaaca ctaacggcac ggtgctcagc ttcggctccg acgcatccac cttggacgtc 1320ccggtcaaca ctaacggcac ggtgctcagc ttcggctccg acgcatccac cttggacgtc 1320

gtctcagaac agatgaagca catgaaggag ctcagctcag taacccggac cgagaacacc 1380gtctcagaac agatgaagca catgaaggag ctcagctcag taacccggac cgagaacacc 1380

gatgccccgt cagtagggtc ttgtgctgaa ggatgggcaa agggagaaga gtcgagccag 1440gatgccccgt cagtagggtc ttgtgctgaa ggatgggcaa agggagaaga gtcgagccag 1440

atgaactcga gggagagagt tgcagcagat agatcgccaa attttgcgca gcacccgtgc 1500atgaactcga gggagagagt tgcagcagat agatcgccaa attttgcgca gcacccgtgc 1500

atgaacgggg cagccatgtg gccattcagt tgtgcaccat cgcctgccta tttcacccca 1560atgaacgggg cagccatgtg gccattcagt tgtgcaccat cgcctgccta tttcacccca 1560

aacgtagcaa ttccattcta tccagctgct gctgctgcct actggggctg catggttccg 1620aacgtagcaa ttccattcta tccagctgct gctgctgcct actggggctg catggttccg 1620

ggagcctgga acactccatg gcagccgcag ccgcagccgc agtctcagtg tcaatctagc 1680ggagcctgga acactccatg gcagccgcag ccgcagccgc agtctcagtg tcaatctagc 1680

tcaccaccta gtgccgcttc tccggtatca acaatgtcca gttgcttcca atcccggaag 1740tcaccaccta gtgccgcttc tccggtatca acaatgtcca gttgcttcca atcccggaag 1740

catcctagag atggtgatga ggaaagagat accaagggta atggcaaggt gtgggtgccc 1800catcctagag atggtgatga ggaaagagat accaagggta atggcaaggt gtgggtgccc 1800

aagacgatcg agtcgac 1817 <210> 245 <211> 270 <212> PRTaagacgatcg agtcgac 1817 <210> 245 <211> 270 <212> PRT

<213> Hordeiam vulgare <400> 245<213> Hordeiam vulgare <400> 245

Leu 1 Lys Lys Pro Asp 5 Lys Ile Leu Pro Cys 10 Pro Arg Cys Ser Ser 15 Met Asp Thr Lys Phe 20 Cys Tyr Tyr Asn Asn 25 Tyr Asn Ile Asn Gln 30 Pro Arg His Phe Cys 35 Lys Asn Cys Gln Arg 40 Tyr Trp Thr Ala Gly 45 Gly Ala Met Arg Asn 50 Val Pro Val Gly Ala 55 Gly Arg Arg Lys Ser 60 Lys Ser Ile Ser Ala Ala Ser His Phe Leu Gln Arg Ile Arg Ala Ala Leu Pro Gly Asp 65 70 75Leu 1 Lys Lys Pro Asp 5 Lys Ile Leu Pro Cys 10 Pro Arg Cys Ser Be 15 Met Asp Thr Lys Phe 20 Cyr Tyr Asn 25 Tyr Asn Ile Asn Gln 30 Pro Arg His Phe Cys 35 Lys Asn Cys Gln Arg 40 Tyr Trp Thr Wing Gly 45 Gly Wing Met Arg Asn 50 Val Pro Val Gly Wing 55 Gly Arg Arg Lys Be 60 Lys Be Ile Be Wing Wing Be His Phe Leu Gln Arg Ile Arg Wing Wing Read Gly Asp 65 70 75

Pro Leu Cys Thr Pro Val Asn Thr Asn Gly ThrPro Read Cys Thr Pro Val Asn Thr Asn Gly Thr

85 9085 90

Ser Asp Ala Ser Thr Leu Asp Val Val Ser GluBe Asp Wing Be Thr Read Asp Val Val Be Glu

100 105100 105

Lys Glu Leu Ser Ser Val Thr Arg Thr Glu AsnLys Glu Read Be Ser Val Thr Arg Thr Glu Asn

115 120115 120

Val Gly Ser Cys Ala Glu Gly Trp Ala Lys GlyVal Gly Ser Cys Wing Glu Gly Trp Wing Lys Gly

130 135130 135

Met Asn Ser Arg Glu Arg Val Ala Ala Asp Arg 145 150 155Met Asn Be Arg Glu Arg Val Wing Wing Asp Arg 145 150 155

Gln His Pro Cys Met Asn Gly Ala Ala Met TrpGln His Pro Met Cys Asn Gly Wing Met Trp Wing

165 170165 170

Pro Ser Pro Ala Tyr Phe Thr Pro Asn Val AlaPro Ser Pro Wing Tyr Phe Thr Pro Asn Val Wing

180 185180 185

Ala Ala Ala Ala Ala Tyr Trp Gly Cys Met ValWing Wing Wing Wing Wing Tyr Trp Gly Cys Met Val

195 200195 200

Thr Pro Trp Gln Pro Gln Pro Gln Pro Gln SerThr Pro Trp Gln Pro Gln Pro Gln Pro Gln Ser

210 215210 215

Ser Pro Pro Ser Ala Ala Ser Pro Val Ser Thr 225 230 235Ser Pro Pro Ser Wing Al Ser Ser Pro Val Ser Thr 225 230 235

Gln Ser Arg Lys His Pro Arg Asp Gly Asp GluGln Being Arg Lys His Pro Arg Asp Gly Asp Glu

245 250245 250

Gly Asn Gly Lys Val Trp Val Pro Lys Thr Ile 260 265Gly Asn Gly Lys Val Trp Val Pro Lys Thr Ile 260 265

<210> 246 <211> 1485 <212> DNA<210> 246 <211> 1485 <212> DNA

<213> Cucurbita maxima <400> 246<213> Cucurbita maxima <400> 246

cagctgcaaa agaggaaact cttcatgatt cagaggatta atgaggcgca catgaatcct gaagtgttat caacagatga ggaaaactga gaaagaacag aatgatgccc ccaactcgaa ataagatact tccatgtccc cgctgcaata gcatggaaac attataatgt caatcaacca cgccattttt gcaaagcctg gcggtaccat caggaatgtc cctgttggag ctggccgccg cacactaccg acacattaca atctcagagg ctctccgagc ttgaggtcaa ccacctagca tcaaaaggca atggacgagt cacctgtatg tgaatctatg gtcaatgtat cacatcctgc gaacaaggaa tgaatttgag ggagccaaag gaccttgtga attgttctag tgcatcttca gtaacaatgt caagctcaat tccctcaaga accacatatg cagaacatca atggttttcc ctggtgttcc ttggccttgt tcatggactg caccaatacc ctggagttcc tttatcattc taccctgcaa catattggag ggaatattcc ttgggtcact ccacaaccct gtcctccaat cgctaggcaa gcattcgaga gatggcgatg aactccaggc atcctccaaa acagaaaaat ggatctgttt tggttcccaa caaacgaagc tgctaagagt tcaatatggg agacacttgg aagctgttga tctgtctaat gttttccaat caaagggcga aagtgttgtc tccagttttg caagccaacc ctgcagcctt acgagcggtc gtgaatggta tttttgattt tccaggttca ttaagaagct taagcatgaa gtggatacaa gcatcaatct agcaatccag tttttcaaga atcccggaat tgttctctct tatcaagcca tccttttgta cataacttta catatgtgaa ctaaagattc tcagatgtat aaaaatgcag ccaaaagttt <210> 247 <211> 380 <212> PRTcagctgcaaa agaggaaact cttcatgatt cagaggatta atgaggcgca catgaatcct gaagtgttat caacagatga ggaaaactga gaaagaacag aatgatgccc ccaactcgaa ataagatact tccatgtccc cgctgcaata gcatggaaac attataatgt caatcaacca cgccattttt gcaaagcctg gcggtaccat caggaatgtc cctgttggag ctggccgccg cacactaccg acacattaca atctcagagg ctctccgagc ttgaggtcaa ccacctagca tcaaaaggca atggacgagt cacctgtatg tgaatctatg gtcaatgtat cacatcctgc gaacaaggaa tgaatttgag ggagccaaag gaccttgtga attgttctag tgcatcttca gtaacaatgt caagctcaat tccctcaaga accacatatg cagaacatca atggttttcc ctggtgttcc ttggccttgt tcatggactg caccaatacc ctggagttcc tttatcattc taccctgcaa catattggag ggaatattcc ttgggtcact ccacaaccct gtcctccaat cgctaggcaa gcattcgaga gatggcgatg aactccaggc atcctccaaa acagaaaaat ggatctgttt tggttcccaa caaacgaagc tgctaagagt tcaatatggg agacacttgg aagctgttga tctgtctaat gttttccaat caaagggcga aagtgttgtc tccagttttg caagccaacc ctgcagcctt acgagcggtc gtgaatggta tttttgattt tccaggttca ttaagaagct taagcatgaa gtggatacaa gcatcaatct agcaatccag tttttcaaga atcccggaat tgttctctct tatcaagcca tccttttgta cataacttta catatgtgaa ctaaagattc tcagatgtat aaaaatgcag ccaaaagttt <210> 247 <211> 380 <212> PRT

<213> Cucurbita maxima <400> 247<213> Cucurbita maxima <400> 247

Met Asn Pro Glu Val Leu Ser Thr Asp Glu Asn 15 10Met Asn Pro Glu Val Leu Being Thr Asp Glu Asn 15 10

Arg Lys Thr Glu Lys Glu Gln Asn Asp Ala ProArg Lys Thr Glu Lys Glu Gln Asn Asp Wing Pro

Val LeuVal leu

Gln MetGln met

Thr Asp 125 Glu Glu 140Thr Asp 125 Glu Glu 140

Ser ProTo be pro

Pro PhePro phe

Ile ProIle pro

Pro Gly 205 Gln Cys 220Pro Gly 205 Gln Cys 220

Met Ser Glu Arg Glu SerMet Ser Glu Arg Glu Ser

Ser PheTo be Phe

95 Lys His 11095 Lys His 110

Ala ProPro Wing

Ser SerTo be to be

Asn PheAsn phe

Ser Cys 175 Phe Tyr 190Ser Cys 175 Phe Tyr 190

Ala TrpTrp wing

Gln SerGln Ser

Ser CysBe cys

Asp Thr 255Asp Thr 255

Thr 270Thr 270

80 Gly80 Gly

MetMet

SerTo be

GlnGln

Ala 160 AlaWing 160 Wing

ProPro

AsnAsn

SerTo be

Phe 240 LysPhe 240 Lys

tgcatgtgta aaatgataag agagaaactg caagttttgt tcaaagatat aaaaaacaag tgcacaaatt cctcaatttc agaaagaaag gggtggggaa gaagaatgga ttctcaaatc tccaccagcc ttgcagtgct ccctggtcca tgataattct aactttaagg tattaagaat cctaaagagt gtcaagatct ttgtaaaaga caagcttctt atagaaagag taaccgatgt gcttctgcatgtgta aaatgataag agagaaactg caagttttgt tcaaagatat aaaaaacaag tgcacaaatt cctcaatttc agaaagaaag gggtggggaa gaagaatgga ttctcaaatc tccaccagcc ttgcagtgct ccctggtcca tgataattct aactttaagg tattaagaat cctaaagagt gtcaagatct ttgtaaaaga caagcttctt atagaaagag taaccgatgt gcttc

aaaacagcaa ctcgcaacaa aagaaaccag tattataata tggactgaag aactcagcct gatgttccta agtgtaagcc gtcttgaatg actggtgatg gccaggaggt ccatgtcttc ttgtgccctc tcaggttctt aattctccga gagatgaaag attgatgatc gattcaatca aacgtttctg cttactttcc aatctttaag ctgctcaaga tagctgccat agagtggcagaaaacagcaa ctcgcaacaa aagaaaccag tattataata tggactgaag aactcagcct gatgttccta agtgtaagcc gtcttgaatg actggtgatg gccaggaggt ccatgtcttc ttgtgccctc tcaggttctt aattctccga gagatgaaag attgatgatc gattcaatca aacgtttctg cttactttcc aatctttaag ctgctcaaga tagctgccat agagtggcag

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 148560 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1485

Asp Lys Leu Ala Thr 15Asp Lys Leu Wing Thr 15

Asn Ser Lys Glu Lys 20 25 30Asn Ser Lys Glu Lys 20 25 30

Leu Lys Lys Pro Asp Lys Ile Leu Pro Cys Pro Arg Cys Asn Ser MetLeu Lys Lys Pro Asp Lys Ile Leu Pro Cys Pro Arg Cys Asn Be Met

35 40 4535 40 45

Glu Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln Pro ArgGlu Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln Pro Arg

50 55 6050 55 60

His Phe Cys Lys Ala Cys Gln Arg Tyr Trp Thr Glu Gly Gly Thr Ile 65 70 75 80His Phe Cys Lys Cys Wing Gln Arg Tyr Trp Thr Glu Gly Gly Thr Ile 65 70 75 80

Arg Asn Val Pro Val Gly Ala Gly Arg Arg Lys Asn Lys Asn Ser AlaArg Asn Val Pro Val Gly Ala Gly Arg Arg Lys Asn Lys Asn Ser Ala

85 90 9585 90 95

Ser His Tyr Arg His Ile Thr Ile Ser Glu Ala Leu Arg Ala Ala GlnBe His Tyr Arg His Ile Thr Ile Be Glu Wing Read Le Arg Wing Wing Gln

100 105 110100 105 110

Ile Asp Val Pro Ile Glu Val Asn His Leu Ala Ser Lys Gly Asn GlyIle Asp Val Pro Ile Glu Val Asn His Leu Wing Ser Lys Gly Asn Gly

115 120 125115 120 125

Arg Val Leu Asn Phe Ser Val Ser Pro Pro Val Cys Glu Ser Met ValArg Val Leu Asn Phe Ser Val Ser Pro Pro Val Cys Glu Ser Met Val

130 135 140130 135 140

Asn Val Ser His Pro Ala Glu Arg Lys Val Leu Asn Gly Thr Arg Asn 145 150 155 160Asn Val Be His Pro Wing Glu Arg Lys Val Leu Asn Gly Thr Arg Asn 145 150 155 160

Glu Phe Glu Gly Ala Lys Gly Pro Cys Glu Gly Gly Glu Thr Gly AspGlu Phe Glu Gly Wing Lys Gly Pro Cys Glu Gly Gly Gly Glu Thr Gly Asp

165 170 175165 170 175

Asp Cys Ser Ser Ala Ser Ser Val Thr Met Ser Ser Ser Met Lys AsnAsp Cys Be Be Wing Be Be Val Thr Met Be Be Met Lys Asn

180 185 190180 185 190

Gly Ala Arg Arg Phe Pro Gln Glu Pro His Met Gln Asn Ile Asn GlyGly Wing Arg Arg Phe Pro Gln Glu Pro His Met Gln Asn Ile Asn Gly

195 200 205195 200 205

Phe Pro Ser Gln Ile Pro Cys Leu Pro Gly Val Pro Trp Pro Cys SerPhe Pro Ser Gln Ile Pro Cys Leu Pro Gly Val Pro Trp Pro Cys Ser

210 215 220210 215 220

Trp Thr Ala Pro Ile Pro Pro Pro Ala Leu Cys Pro Pro Gly Val Pro 225 230 235 240Trp Thr Wing Pro Ile Pro Pro Pro Leu Cys Pro Pro Gly Val Pro 225 230 235 240

Leu Ser Phe Tyr Pro Ala Thr Tyr Trp Ser Cys Ser Ala Ser Gly SerRead Be Phe Tyr Pro Wing Thr Tyr Trp Be Cys Be Wing Be Gly Ser

245 250 255245 250 255

Trp Asn Ile Pro Trp Val Thr Pro Gln Pro Cys Pro Pro Ile Pro GlyTrp Asn Ile Pro Trp Val Thr Pro Gln Pro Cys Pro Ile Pro Gly

260 265 270260 265 270

Pro Asn Ser Pro Thr Leu Gly Lys His Ser Arg Asp Gly Asp Glu LeuPro Asn Be Pro Thr Read Gly Lys His Be Arg Asp Gly Asp Glu Leu

275 280 285275 280 285

Gln Ala Asp Asn Ser Glu Met Lys Asp Pro Pro Lys Gln Lys Asn GlyGln Wing Asp Asn Be Glu Met Lys Asp Pro Pro Lys Gln Lys Asn Gly

290 295 300290 295 300

Ser Val Leu Val Pro Lys Thr Leu Arg Ile Asp Asp Pro Asn Glu Ala 305 310 315 320Ser Val Leu Val Pro Lys Thr Leu Arg Ile Asp Asp Pro Asn Glu Wing 305 310 315 320

Ala Lys Ser Ser Ile Trp Glu Thr Leu Gly Ile Lys Asn Asp Ser IleWing Lys Being Ser Ile Trp Glu Thr Read Gly Ile Lys Asn Asp Being Ile

325 330 335325 330 335

Lys Ala Val Asp Leu Ser Asn Val Phe Gln Ser Lys Gly Asp Leu LysLys Wing Val Asp Leu Be Asn Val Phe Gln Be Lys Gly Asp Leu Lys

340 345 350340 345 350

Ser Asn Val Ser Glu Val Leu Ser Pro Val Leu Gln Ala Asn Pro AlaSer Asn Val Ser Glu Val Leu Ser Pro Val Leu Gln Wing Asn Pro Wing

355 360 365355 360 365

Ala Leu Ser Arg Ser Leu Thr Phe His Glu Arg Ser 370 375 380Wing Read Be Arg Be Read Thr Phe His Glu Arg Be 370 375 380

<210> 248 <211> 1191 <212> DNA<210> 248 <211> 1191 <212> DNA

<213> Arabidopsis thaliana <400> 248<213> Arabidopsis thaliana <400> 248

atgtggctct ctcatctctt catgtccctc tctaagctga cgtgtaattt ctccattttc 60atgtggctct ctcatctctt catgtccctc tctaagctga cgtgtaattt ctccattttc 60

tctgtcttta tggcttgtgg ctctattggt atgtctcaag ttagagatac tccggttaaa 120 ttgtttggct ggacaattac accggtttct catgatccat actcttcttc gtcccatgtt 180 cttcctgatt cttcctcgtc ttcctcgtct tcttctctat cacttcgacc acacatgatg 240 aataaccaat ctgttactga caatacaagt cttaagctgt catctaatct taacaacgag 300 tcaaaagaaa catctgagaa cagtgatgac caacacagcg agatcacaac aattacatcg 360 gaagaagaga aaacaactga actgaagaaa ccagacaaga ttcttccatg tccgagatgc 420 aacagcgcag acaccaaatt ctgttactac aacaactaca acgttaacca gccacgtcac 480 ttctgtagaa aatgccagag gtattggacc gctggtggat ccatgaggat cgtcccggtt 540 ggctcaggcc gtcgcaagaa caagggatgg gtttcttcag accagtacct gcacatcact 600 tccgaggata ctgacaatta caatagctcc tcaacaaaga ttctaagctt cgagtcttcg 660 gactctttgg taactgagag gcctaagcat caatcaaacg aagtgaagat aaacgctgaa 720 cctgtttcac aagaacccaa caacttccaa gggttacttc ctccccaagc atcccctgtt 780 tcgcctcctt ggccttacca ataccctcca aaccctagtt tctaccacat gcccgtctac 840 tggggctgcg cgataccggt ttggtctacc ctcgacactt ctacatgtct tgggaaaagg 900 acaagagacg aaacttctca tgaaactgtt aaagagagta aaaatgcttt tgagagaaca 960 agcttgcttt tggaatctca gagcatcaaa aatgaaacaa gtatggctac aaataaccat 1020 gtgtggtatc cagtaccgat gacccgcgag aagacacaag aattcagctt tttcagtaat 1080 ggagctgaaa caaagagcag caacaacaga ttcgtccctg aaacgtatct taacctgcaa 1140 gcaaaccctg cagccatggc aagatctatg aacttcagag agagcatata a 1191tctgtcttta tggcttgtgg ctctattggt atgtctcaag ttagagatac tccggttaaa 120 ttgtttggct ggacaattac accggtttct catgatccat actcttcttc gtcccatgtt 180 cttcctgatt cttcctcgtc ttcctcgtct tcttctctat cacttcgacc acacatgatg 240 aataaccaat ctgttactga caatacaagt cttaagctgt catctaatct taacaacgag 300 tcaaaagaaa catctgagaa cagtgatgac caacacagcg agatcacaac aattacatcg 360 aaacaactga actgaagaaa ccagacaaga gaagaagaga ttcttccatg tccgagatgc 420 aacagcgcag acaccaaatt ctgttactac aacaactaca acgttaacca gccacgtcac 480 ttctgtagaa aatgccagag gtattggacc gctggtggat ccatgaggat cgtcccggtt 540 ggctcaggcc gtcgcaagaa caagggatgg gtttcttcag accagtacct gcacatcact 600 tccgaggata ctgacaatta caatagctcc tcaacaaaga ttctaagctt cgagtcttcg 660 gactctttgg taactgagag gcctaagcat caatcaaacg aagtgaagat aaacgctgaa 720 cctgtttcac aagaacccaa caacttccaa gggttacttc ctccccaagc atcccctgtt 780 tcgcctcctt ggccttacca ataccctcca aaccctagtt tctaccacat gcccgtctac 840 tggggctgcg cgataccggt ttggtctacc ctcgacactt ctacatgtct tgggaaaagg 900 acaagagacg aaact tctca tgaaactgtt aaagagagta aaaatgcttt tgagagaaca 960 agcttgcttt tggaatctca gagcatcaaa aatgaaacaa gtatggctac aaataaccat 1020 gtgtggtatc cagtaccgat gacccgcgag aagacacaag aattcagctt tttcagtaat 1080 ggagctgaaa caaagagcag caacaacaga ttcgtccctg aaacgtatct taacctgcaa 1140 gcaaaccctg cagccatggc aagatctatg aacttcagag the agagcatata 1191

<210> 249 <211> 396 <212> PRT<210> 249 <211> 396 <212> PRT

<213> Arabidopsis thaliana <400> 249<213> Arabidopsis thaliana <400> 249

Met Trp Leu Ser His Leu Phe Met Ser Leu Ser Lys Leu Thr Cys Asn 1 5 10 15Met Trp Read Be His Read Phe Met Be Read His Be Read Lys Thr Cys Asn 1 5 10 15

Phe Ser Ile Phe Ser Val Phe Met Ala Cys Gly Ser Ile Gly Met SerPhe Ser Ile Phe Ser Val Val Phe Met Cly Gly Ser Ile Gly Met Ser

20 25 3020 25 30

Gln Val Arg Asp Thr Pro Val Lys Leu Phe Gly Trp Thr Ile Thr ProGln Val Arg Asp Thr Pro Val Lys Read Phe Gly Trp Thr Ile Thr Pro

35 40 4535 40 45

Val Ser His Asp Pro Tyr Ser Ser Ser Ser His Val Leu Pro Asp SerVal Be His Asp Pro Tyr Be Be Ser Be His Val Leu Pro Asp Be

50 55 6050 55 60

Ser Ser Ser Ser Ser Ser Ser Ser Leu Ser Leu Arg Pro His Met Met 65 70 75 80To Be To Be To Be To Be To Be To Be To Be To Be To Be To Be For Arg To His Met 65 70 75 80

Asn Asn Gln Ser Val Thr Asp Asn Thr Ser Leu Lys Leu Ser Ser AsnAsn Asn Gln Be Val Thr Asp Asn Thr Be Read Lys Read Be Ser Asn

85 90 9585 90 95

Leu Asn Asn Glu Ser Lys Glu Thr Ser Glu Asn Ser Asp Asp Gln HisLeu Asn Asn Glu Be As Lys Glu Thr Be Glu Asn Be Asp Asp Gln His

100 105 110100 105 110

Ser Glu Ile Thr Thr Ile Thr Ser Glu Glu Glu Lys Thr Thr Glu LeuBe Glu Ile Thr Thr Ile Thr Be Glu Glu Glu Lys Thr Thr Glu Leu

115 120 125115 120 125

Lys Lys Pro Asp Lys Ile Leu Pro Cys Pro Arg Cys Asn Ser Ala AspLys Lys Pro Asp Lys Ile Leu Pro Cys Pro Arg Cys Asn Ser Asp Wing

130 135 140130 135 140

Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln Pro Arg His 145 150 155 160Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln Pro Arg His 145 150 155 160

Phe Cys Arg Lys Cys Gln Arg Tyr Trp Thr Ala Gly Gly Ser Met ArgPhe Cys Arg Lys Cys Gln Arg Tyr Trp Thr Wing Gly Gly Be Met Arg

165 170 175165 170 175

Ile Val Pro Val Gly Ser Gly Arg Arg Lys Asn Lys Gly Trp Val SerIle Val Pro Val Gly Ser Gly Arg Arg Lys Asn Lys Gly Trp Val Ser

180 185 190180 185 190

Ser Asp Gln Tyr Leu His Ile Thr Ser Glu Asp Thr Asp Asn Tyr AsnBe Asp Gln Tyr Read His Ile Thr Be Glu Asp Thr Asp Asn Tyr Asn

195 200 205195 200 205

Ser Ser Ser Thr Lys Ile Leu Ser Phe Glu Ser Ser Asp Ser Leu ValBe Ser Be Thr Lys Ile Leu Be Phe Glu Ser Be Asp Ser Leu Val

210 215 220210 215 220

Thr Glu Arg Pro Lys His Gln Ser Asn Glu Val Lys Ile Asn Ala Glu 225 230 235 240Thr Glu Arg Pro Lys His Gln Ser Asn Glu Val Lys Ile Asn Glu Wing 225 230 235 240

Pro Val Ser Gln Glu Pro Asn Asn Phe Gln Gly Leu Leu Pro Pro GlnPro Val Ser Gln Glu Pro Asn Ashe Phe Gln Gly Leu Leu Pro Pro Gln

245 250 255245 250 255

Ala Ser Pro Val Ser Pro Pro Trp Pro Tyr Gln Tyr Pro Pro Asn ProWing Pro Pro Val Pro Pro Trp Pro Tyr Gln Tyr Pro Pro Asn Pro

260 265 270260 265 270

Ser Phe Tyr His Met Pro Val Tyr Trp Gly Cys Ala Ile Pro Val TrpBe Phe Tyr His Met Pro Val Tyr Trp Gly Cys Wing Ile Pro Val Trp

275 280 285275 280 285

Ser Thr Leu Asp Thr Ser Thr Cys Leu Gly Lys Arg Thr Arg Asp GluBe Thr Read Asp Thr Be Thr Cys Read Gly Lys Arg Thr Asp Glu

290 295 300290 295 300

Thr Ser His Glu Thr Val Lys Glu Ser Lys Asn Ala Phe Glu Arg Thr 305 310 315 320Thr Be His Glu Thr Val Lys Glu Be Lys Asn Wing Phe Glu Arg Thr 305 310 315 320

Ser Leu Leu Leu Glu Ser Gln Ser Ile Lys Asn Glu Thr Ser Met AlaSer Leu Leu Leu Glu Ser Gln Ser Ile Lys Asn Glu Thr Be Met Wing

325 330 335325 330 335

Thr Asn Asn His Val Trp Tyr Pro Val Pro Met Thr Arg Glu Lys ThrThr Asn Asn His Val Trp Tyr Pro Val Met Thr Thr Arg Glu Lys Thr

340 345 350340 345 350

Gln Glu Phe Ser Phe Phe Ser Asn Gly Ala Glu Thr Lys Ser Ser AsnGln Glu Phe Be As Phe Phe Be Asn Gly Wing Glu Thr Lys Be Asn

355 360 365355 360 365

Asn Arg Phe Val Pro Glu Thr Tyr Leu Asn Leu Gln Ala Asn Pro AlaAsn Arg Phe Val Pro Glu Thr Tyr Leu Asn Leu Gln Wing Asn Pro Wing

370 375 380370 375 380

Ala Met Ala Arg Ser Met Asn Phe Arg Glu Ser Ile 385 390 395Wing Met Wing Arg Be Met Asn Phe Arg Glu Ser Ile 385 390 395

<210> 250 <211> 1200 <212> DNA<210> 250 <211> 1200 <212> DNA

<213> Arabidopsis thaliana <400> 250<213> Arabidopsis thaliana <400> 250

atgtctaaat ctagagatac ggagataaag ttgtttggga ggacaatcac gatgtgaatt gttatgatcc gtcgtcgttg tcccctgttc acgatgtttc agcaaggagg attcgtcttc ttcttcatct tcttgttctc caactattgg gttccggtta aaaaaagtga gcaagagagt aacaaattca aagatccata gatctaaacg aaccaccaaa agcagtatct gagatttcat caccaagaag aactgtgatc aacagagcga gatcacaaca acaactacca caagtactac aaatcaacgg ctctcaagaa accggacaag cttattccat gtcctagatg aacaccaaat tctgttatta caacaactac aacgtgaacc agccacgtta aactgtcaga ggtattggac agctggtgga tctatgagga acgttcctgt cgtcgcaaga acaaaggatg gccttcttca aaccattact tgcaagtcac tgtgataata ataactcggg gacgatcctt agtttcggtt cttcggagtc gagactggta agcatcagtc aggtgataca gcaaagataa gtgctgattc gaaaataaaa gctaccaagg gtttcttcct ccgcaagtaa tgttacctaa ccttggcctt accaatggag tccaacgggt cctaacgcta gtttctaccc tactggggat gcacggttcc gatataccct acctcagaga cttcatcatg cggtcaagag atcaaactga aggaagaatc aatgatacta atacaacaat agagcaagat tggtctcaga atctcttaga atgaatatcg tggtctaagt taccgacaaa acccgagaaa aaaacgcaag tttgacacaa agggaaacag caacagaagt agcttggtct caagcaaacc ctgcagcgat gtctagagct atgaacttca <210> 251 <211> 399 <212> PRTatgtctaaat ctagagatac ggagataaag ttgtttggga ggacaatcac gatgtgaatt gttatgatcc gtcgtcgttg tcccctgttc acgatgtttc agcaaggagg attcgtcttc ttcttcatct tcttgttctc caactattgg gttccggtta aaaaaagtga gcaagagagt aacaaattca aagatccata gatctaaacg aaccaccaaa agcagtatct gagatttcat caccaagaag aactgtgatc aacagagcga gatcacaaca acaactacca caagtactac aaatcaacgg ctctcaagaa accggacaag cttattccat gtcctagatg aacaccaaat tctgttatta caacaactac aacgtgaacc agccacgtta aactgtcaga ggtattggac agctggtgga tctatgagga acgttcctgt cgtcgcaaga acaaaggatg gccttcttca aaccattact tgcaagtcac tgtgataata ataactcggg gacgatcctt agtttcggtt cttcggagtc gagactggta agcatcagtc aggtgataca gcaaagataa gtgctgattc gaaaataaaa gctaccaagg gtttcttcct ccgcaagtaa tgttacctaa ccttggcctt accaatggag tccaacgggt cctaacgcta gtttctaccc tactggggat gcacggttcc gatataccct acctcagaga cttcatcatg cggtcaagag atcaaactga aggaagaatc aatgatacta atacaacaat agagcaagat tggtctcaga atctcttaga atgaatatcg tggtctaagt taccgacaaa acccgagaaa aaaacgcaag tttgacacaa agggaaacag caacagaagt agcttggtct caagcaaacc ctgcagcgat gtctagagct atgaacttca <210> 251 <211> 399 <212> PRT

<213> Arabidopsis thaliana <400> 251<213> Arabidopsis thaliana <400> 251

Met Ser Lys Ser Arg Asp Thr Glu Ile Lys Leu Phe Gly 15 10Met Be Lys Be Arg Asp Thr Glu Ile Lys Read Phe Gly 15 10

Thr Ser Leu Leu Asp Val Asn Cys Tyr Asp Pro Ser SerThr Be Leu Read Asp Val Asn Cys Tyr Asp Pro Be Ser

20 2520 25

Val His Asp Val Ser Ser Asp Pro Ser Lys Glu Asp SerVal His Asp Val Ser Be Asp Pro Be Lys Glu Asp Ser

35 40 4535 40 45

Ser Ser Ser Cys Ser Pro Thr Ile Gly Pro Ile Arg ValBe Ser Be Cys Be Pro Thr Ile Gly Pro Ile Arg Val

50 55 6050 55 60

Lys Ser Glu Gln Glu Ser Asn Lys Phe Lys Asp Pro Tyr 65 70 75Lys Be Glu Gln Glu Be Asn Lys Phe Lys Asp Pro Tyr 65 70 75

Asp Leu Asn Glu Pro Pro Lys Ala Val Ser Glu Ile SerAsp Leu Asn Glu Pro Pro Lys Wing Val Ser Glu Ile Ser

85 9085 90

Ser Ser Lys Asn Asn Cys Asp Gln Gln Ser Glu Ile ThrBe Ser Lys Asn Asn Cys Asp Gln Gln Be Glu Ile Thr

100 105100 105

Thr Thr Ser Thr Thr Ser Gly Glu Lys Ser Thr Ala Leu 115 120 125Thr Thr Be Thr Thr Be Gly Glu Lys Be Thr Wing Leu 115 120 125

Asp Lys Leu Ile Pro Cys Pro Arg Cys Glu Ser Ala AsnAsp Lys Leu Ile Pro Cys Pro Arg Cys Glu Ser Asn Wing

130 135 140130 135 140

Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln Pro Arg Tyr 145 150 155Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln Pro Arg Tyr 145 150 155

Asn Cys Gln Arg Tyr Trp Thr Ala Gly Gly Ser Met ArgAsn Cys Gln Arg Tyr Trp Thr Wing Gly Gly Ser Met Arg

165 170165 170

Val Gly Ser Gly Arg Arg Lys Asn Lys Gly Trp Pro SerVal Gly Ser Gly Arg Arg Lys Asn Lys Gly Trp Pro Ser

180 185180 185

Tyr Leu Gln Val Thr Ser Glu Asp Cys Asp Asn Asn Asn 195 200 205Tyr Leu Gln Val Thr Be Glu Asp Cys Asp Asn Asn Asn 195 200 205

Ile Leu Ser Phe Gly Ser Ser Glu Ser Ser Val Thr GluIle Read Be Phe Gly Be Be Glu Be Be Val Thr Glu

210 215 220210 215 220

His Gln Ser Gly Asp Thr Ala Lys Ile Ser Ala Asp Ser 225 230 235His Gln Ser Gly Asp Thr Wing Lys Ile Ser Wing Asp Ser 225 230 235

Glu Asn Lys Ser Tyr Gln Gly Phe Leu Pro Pro Gln ValGlu Asn Lys Ser Tyr Gln Gly Phe Leu Pro Pro Gln Val

245 250245 250

Asn Asn Ser Ser Pro Trp Pro Tyr Gln Trp Ser Pro Thr 260 265Asn Asn Ser Ser Pro Trp Pro Tyr Gln Ser Ser Pro Thr 260 265

atctctttta 60atctctttta 60

ttctgatcca 120ttctgatcca 120

accaatcagg 180accaatcagg 180

tatattatcc 240tatattatcc 240

ttccaagaac 300ttccaagaac 300

atcaggagag 360atcaggagag 360

tgaaagcgca 420tgaaagcgca 420

cttctgcagg 480cttctgcagg 480

tggctcaggt 540tggctcaggt 540

ttctgaggat 600ttctgaggat 600

ttcggttaca 660ttcggttaca 660

agtttctcaa 720agtttctcaa 720

taattcttct 780taattcttct 780

tgtccccttc 840tgtccccttc 840

tttaggaaaa 900tttaggaaaa 900

aactactaca 960aactactaca 960

aagctagtaa gagcgctgtg 1020aagctagtaa gagcgctgtg 1020

gattcagttt gttcaatgga 1080gattcagttt gttcaatgga 1080

ccgaaacttc tcacagtcta 1140ccgaaacttc tcacagtcta 1140

gggagagcat gcaacaataa 1200gggagagcat gcaacaataa 1200

Arg Thr Ile 15Arg Thr Ile 15

Leu Ser Pro 30Read Ser Pro 30

Ser Ser SerTo be to be

Pro Val LysPro Val Lys

Ile Leu Ser 80Ile Leu Ser 80

Ser Pro Arg 95Ser Pro Arg 95

Thr Thr Thr 110Thr Thr Thr 110

Lys Lys ProLys Lys Pro

Thr Lys PheThr lys phe

Phe Cys Arg 160Phe Cys Arg 160

Asn Val ProAsn val pro

175 Ser Asn His 190175 Ser Asn His 190

Ser Gly ThrBe gly thr

Thr Gly LysThr Gly Lys

Val Ser Gln 240Val Ser Gln 240

Met Leu ProMet Leu Pro

255 Gly Pro Asn 270 Ala Ser Phe Tyr Pro Val Pro Phe Tyr Trp Gly Cys Thr Val Pro Ile 275 280 285 Tyr Pro Thr Ser Glu Thr Ser Ser Cys Leu Gly Lys Arg Ser Arg Asp 290 295 300 Gln Thr Glu Gly Arg Ile Asn Asp Thr Asn Thr Thr Ile Thr Thr Thr 305 310 315 320 Arg Ala Arg Leu Val Ser Glu Ser Leu Arg Met Asn Ile Glu Ala Ser 325 330 335 Lys Ser Ala Val Trp Ser Lys Leu Pro Thr Lys Pro Glu Lys Lys Thr 340 345 350 Gln Gly Phe Ser Leu Phe Asn Gly Phe Asp Thr Lys Gly Asn Ser Asn 355 360 365 Arg Ser Ser Leu Val Ser Glu Thr Ser His Ser Leu Gln Ala Asn Pro 370 375 380 Ala Ala Met Ser Arg Ala Met Asn Phe Arg Glu Ser Met Gln Gln255 Gly Pro Asn 270 Wing Be Phe Tyr Pro Val Pro Phe Tyr Trp Gly Cys Thr Val Ile 275 280 285 Tyr Pro Thr Be Glu Thr Be Cys Leu Gly Lys Arg Be Asp 290 295 300 Gln Thr Glu Gly Arg Ile Asn Asp Thr Asn Thr Thr Ile Thr Thr 305 310 315 320 Arg Wing Arg Leu Val Be Glu Be Read Arg Met Asn Ile Glu Wing Be 325 330 335 Lys Be Wing Val Trp Be Lys Leu Pro Thr Lys Pro Lys Lys Thr 340 345 350 Gln Gly Phe Be Leu Phe Asn Gly Phe Asp Thr Lys Gly Asn Be Asn 355 360 365 Arg Be Be Read Le Val Be Glu Thr Be His Be Read Gln Wing Asn Pro 370 375 380 Wing Ala Met Be Ala Met Asn Phe Arg Glu Being Met Gln Gln

390390

395395

385 <210> 252 <211> 1347 <212> DNA385 <210> 252 <211> 1347 <212> DNA

<213> Arabidopsis thaliana <400> 252<213> Arabidopsis thaliana <400> 252

atgatgatgg agactagaga tccagctatt aagcttttcgatgatgatgg agactagaga tccagctatt aagcttttcg

tcggtttttg aatcggcagt tacggtggag gatgacgaagtcggtttttg aatcggcagt tacggtggag gatgacgaag

gatgacaaat caccagagaa ggtaactcca gagttatcaggatgacaaat caccagagaa ggtaactcca gagttatcag

aacgacaaca gttttaacaa ttcgaaaccc gaaaccttgg actgatcaga tagagagtag tgacacgcct gaggataatcaacgacaaca gttttaacaa ttcgaaaccc gaaaccttgg actgatcaga tagagagtag tgacacgcct gaggataatc

aaaaccctaa agaaaccgac taagattcta ccgtgtccgaaaaaccctaa agaaaccgac taagattcta ccgtgtccga

aagttctgtt attacaacaa ctacaacata aaccagcctc cagagatatt ggactgctgg agggactatg aggaatgttcaagttctgtt attacaacaa ctacaacata aaccagcctc cagagatatt ggactgctgg agggactatg aggaatgttc

aagaacaaaa gctcatcttc tcattaccgt cacatcactaaagaacaaaa gctcatcttc tcattaccgt cacatcacta

gcgaggcttg acccgggctt acaggcaaac acaagggtctgcgaggcttg acccgggctt acaggcaaac acaagggtct

cagcagcagc acgttgctgc tcccatgaca cctgtgatgacagcagcagc acgttgctgc tcccatgaca cctgtgatga

gtctcaaacg gtgctaggaa caggtttcac gggttagcgggtctcaaacg gtgctaggaa caggtttcac gggttagcgg

gtagagaatg gagatgattg ctcaagcgga tcctctgtgagtagagaatg gagatgattg ctcaagcgga tcctctgtga

gtggatgaat caagagcaca aagcggcagt gttgttgaaggtggatgaat caagagcaca aagcggcagt gttgttgaag

aacaataaca tgaatggtta tgcttgcatc ccaggtgttcaacaataaca tgaatggtta tgcttgcatc ccaggtgttc

ccagcgatgc ctccaccagg tttttacccg cctccagggtccagcgatgc ctccaccagg tttttacccg cctccagggt

tactggacca tcccaatgct accaccgcat caatcctcattactggacca tcccaatgct accaccgcat caatcctcat

tcaaatacaa actctccgac tctcggaaag catccgagagtcaaatacaa actctccgac tctcggaaag catccgagag

gacaacgaga cagagcgaaa acagaaggcc gggtgcgttcgacaacgaga cagagcgaaa acagaaggcc gggtgcgttc

atagatgatc ctaacgaagc agcaaagagc tcgatatggaatagatgatc ctaacgaagc agcaaagagc tcgatatgga

gaggcgatgt gcaaagccgg tggtatgttc aaagggtttggaggcgatgt gcaaagccgg tggtatgttc aaagggtttg

aacaacgaca aagctgagaa ctcccctgtt ctttctgctaaacaacgaca aagctgagaa ctcccctgtt ctttctgcta

tcacacaatt tccatgaaca gatttag <210> 253 <211> 448 <212> PRTtcacacaatt tccatgaaca gatttag <210> 253 <211> 448 <212> PRT

<213> Arabidopsis thaliana <400> 253<213> Arabidopsis thaliana <400> 253

Met Met Met Glu Thr Arg Asp Pro Ala Ile LysMet Met Met Met Glu Thr Arg Asp Pro Ile Lys Wing

gtatgaaaat aagatgactg ataagaacaa acaaagagga agcagacgac gatgcaaaag gtcatttctg ctgtgggggc tttccgaggc tgagttttgg agctacaaga atcaacggct ccacctctaa cacaaatgaa catggcctta atccaatgcc cgcctataag atgaaggatc tggtcccgaa caacattggg atcataagac accctgctgcgtatgaaaat aagatgactg ataagaacaa acaaagagga agcagacgac gatgcaaaag gtcatttctg ctgtgggggc tttccgaggc tgagttttgg agctacaaga atcaacggct ccacccgggggccgggggggtggggtg

cccttttccg gagcggcgga caacaactgt agcgacatca acctgatggt catggagacc caaggcttgt aggacgtcgt tcttgaggct tctcgaagct agatcaaaag tgtagctcgg caatcactca caacaacaac cacgtggaat gttttaccct ccaaaagtgt atcgaaaaag aacgttgaga aatcaagaac aaagatgtat tctatcaagacccttttccg gagcggcgga caacaactgt agcgacatca acctgatggt catggagacc caaggcttgt aggacgtcgt tcttgaggct tctcgaagct agatcaaaag tgtagctcgg caatcacgagagatggagtga

11

IleIle

5 105 10

Pro Phe Pro Ser Val Phe Glu Ser Ala ValPro Phe Pro Ser Val Phe Glu Ser Val Wing

2020

2525

Glu Glu Asp Asp Trp Ser Gly Gly Asp Asp LysGlu Glu Asp Asp Trp Being Gly Gly Asp Asp Lys

3535

1010

Thr Pro Glu Leu Ser Asp Lys Asn Asn Asn AsnThr Pro Glu Read Being Asp Lys Asn Asn Asn Asn

5050

5555

6060

Phe Asn Asn Ser Lys Pro Glu Thr Leu Asp LysPhe Asn Asn Ser Lys Pro Glu Thr Read Asp Lys

6565

7070

7575

Thr Asp Gln Ile Glu Ser Ser Asp Thr Pro GluThr Asp Gln Ile Glu Be Ser Asp Thr Pro Glu

8585

9090

Thr Pro Asp Gly Lys Thr Leu Lys Lys Pro ThrThr Pro Asp Gly Lys Thr Read Lys Lys Pro Thr

100100

105105

Phe Gly Met Lys 15 Val Glu Asp Asp 30 Pro Glu Lys Val 45 Asn Asp Asn Ser Glu Ala Thr Ser 80 Asn Gln Gln Thr 95 Ile Leu Pro Cys 110Phe Gly Met Lys 15 Val Glu Asp Asp 30 Pro Glu Lys Val 45 Asn Asp Asn Be Glu Wing Thr Be 80 Asn Gln Thr 95 Ile Leu Pro Cys 110

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1347 Pro Arg Cys Lys Ser Met Glu Thr Lys60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1347 Pro Arg Cys Lys Be Met Glu Thr Lys

115 120115 120

Asn Ile Asn Gln Pro Arg His Phe CysAsn Ile Asn Pro Gln Arg His Phe Cys

130 135130 135

Thr Ala Gly Gly Thr Met Arg Asn Val 145 150Thr Wing Gly Gly Thr Met Arg Asn Val 145 150

Lys Asn Lys Ser Ser Ser Ser His Tyr 165Lys Asn Lys Being Being Being Being His Tyr 165

Ala Leu Glu Ala Ala Arg Leu Asp Pro 180 ~ 185Wing Read Glu Wing Wing Arg Wing Read Asp Pro 180 ~ 185

Val Leu Ser Phe Gly Leu Glu Ala GlnVal Leu Ser Phe Gly Leu Glu Wing Gln

195 200195 200

Met Thr Pro Val Met Lys Leu Gln GluMet Thr Pro Val Met Lys Leu Gln Glu

AlaAllah

SerTo be

Phe Cys Tyr Tyr Asn Asn Tyr 125Phe Cys Tyr Tyr Asn Asn Tyr 125

210210

215215

Ala Arg Asn Arg Phe His Gly Leu 225 230Arg Wing Asn Arg Phe His Gly Leu 225 230

Val Glu Asn Gly Asp Asp Cys Ser 245Val Glu Asn Gly Asp Asp Cys Ser 245

Asn Asn His Ser Val Asp Glu Ser Arg 260 265Asn Asn His Ser Val Asp Glu Ser Arg 260 265

Glu Ala Gln Met Asn Asn Asn Asn AsnGlu Ala Gln Met Asn Asn Asn Asn Asn

275 280275 280

Cys Ile Pro Gly Val Pro Trp Pro TyrCys Ile Pro Gly Val Pro Trp Pro Tyr

290 295290 295

Pro Pro Gly Phe Tyr Pro Pro Pro Gly 305 310Pro Pro Gly Phe Tyr Pro Pro Pro Gly 305 310

Tyr Trp Thr Ile Pro Met Leu Pro Pro 325Tyr Trp Thr Ile Pro Met Leu Pro Pro 325

Ser Gln Lys Cys Ser Asn Thr Asn Ser 340 345Ser Gln Lys Cys Ser Asn Thr Asn Ser 340 345

Arg Asp Glu Gly Ser Ser Lys Lys AspArg Asp Glu Gly Being Ser Lys Lys Asp

355 360355 360

Lys Ala Gly Cys Val Leu Val Pro LysLys Wing Gly Cys Val Leu Val Pro Lys

370 375370 375

Asn Glu Ala Ala Lys Ser Ser Ile Trp 385 390Asn Glu Wing Wing Lys Ser Ser Ile Trp 385 390

Glu Ala Met Cys Lys Ala Gly Gly Met 405Glu Wing Met Cys Lys Wing Gly Gly Met 405

Thr Lys Met Tyr Asn Asn Asp Lys Ala 420 425Thr Lys Met Tyr Asn Asn Asp Lys Wing 420 425

Ala Asn Pro Ala Ala Leu Ser Arg SerWing Asn Pro Wing Wing Read Be Arg Be

435 440435 440

<210> 254 <211> 1374 <212> DNA<210> 254 <211> 1374 <212> DNA

<213> Arabidopsis thaliana <400> 254<213> Arabidopsis thaliana <400> 254

atggctgatc cggcgattaa gctctttgga aagacgattc gttgattctt cttctagcta taccggattt ttaaccgaaa tcagattcgt gtaccggcga tgatgatgat gaagagatgg gaagaaggtg atgatgttgg tgatggtgga ggagagagcg aaagatagtg agtgtcagga agagtcattg aggaatgaat acatcgggta taactgaaaa aacggaaaca acaaaagctg ggtggtactg cttgctctca agaggggaag ttaaagaaac ccgcgatgta acagcatgga aaccaagttc tgttactaca cctcgccatt tctgcaagaa atgtcagaga tattggacag gttccggttg gtgctgggag acgtaagaat aagagtccag gtaagtataa catctgcgga agctatgcag aaggtggcga aatggtgcaa atcttctcac ttttggctct gattctgtgc ggattgaatc ttgttgagaa gtcattgttg aagacacaaa gaaggcttga agattacggt tccgttaaac cagacaaacg ccgttaccaa aagttccatg ctttccagga ccaccaccaa ggagtttcgt ggacgatttt accgttttac cctccaccggatggctgatc cggcgattaa gctctttgga aagacgattc gttgattctt cttctagcta taccggattt ttaaccgaaa tcagattcgt gtaccggcga tgatgatgat gaagagatgg gaagaaggtg atgatgttgg tgatggtgga ggagagagcg aaagatagtg agtgtcagga agagtcattg aggaatgaat acatcgggta taactgaaaa aacggaaaca acaaaagctg ggtggtactg cttgctctca agaggggaag ttaaagaaac ccgcgatgta acagcatgga aaccaagttc tgttactaca cctcgccatt tctgcaagaa atgtcagaga tattggacag gttccggttg gtgctgggag acgtaagaat aagagtccag gtaagtataa catctgcgga agctatgcag aaggtggcga aatggtgcaa atcttctcac ttttggctct gattctgtgc ggattgaatc ttgttgagaa gtcattgttg aagacacaaa gaaggcttga agattacggt tccgttaaac cagacaaacg ccgttaccaa aagttccatg ctttccagga ccaccaccaa ggagtttcgt ggacgatttt accgttttac cctccaccgg

Lys Ala Cys Gln Arg Tyr Trp 140 Pro Val Gly Ala Gly Arg Arg 155 160 Arg His Ile Thr Ile Ser Glu 170 175 Gly Leu Gln Ala Asn Thr Arg 190 Gln Gln His Val Ala Ala Pro 205 Asp Gln Lys Val Ser Asn Gly 220 Asp Gln Arg Leu Val Ala Arg 235 240 Gly Ser Ser Val Thr Thr Ser 250 255 Ala Gln Ser Gly Ser Val Val 270 Asn Asn Met Asn Gly Tyr Ala 285 Thr Trp Asn Pro Ala Met Pro 300 Tyr Pro Met Pro Phe Tyr Pro 315 320 His Gln Ser Ser Ser Pro Ile 330 335 Pro Thr Leu Gly Lys His Pro 350 Asn Glu Thr Glu Arg Lys Gln 365 Thr Leu Arg Ile Asp Asp Pro 380 Thr Thr Leu Gly Ile Lys Asn 395 400 Phe Lys Gly Phe Asp His Lys 410 415 Glu Asn Ser Pro Val Leu Ser 430 His Asn Phe His Glu Gln IleLys Cys Wing Gln Arg Tyr Trp 140 Pro Val Gly Gly Wing Gly Arg Arg 155 160 Arg His Ile Thr Ile Ser Glu 170 175 Gly Leu Gln Wing Asn Thr Arg 190 Gln His Val Wing Ala Pro 205 Asp Gln Lys Val Ser Asn Gly 220 Asp Gln Arg Read Le Val Wing Arg 235 240 Gly Be Ser Val Thr Thr Be 250 255 Wing Gln Be Gly Ser Val Val 270 Asn Asn Met Asn Gly Tyr Wing 285 Thr Trp Asn Pro Wing Met Pro 300 Tyr Pro Met Pro Phe Tyr Pro 315 320 His Gln Be Ser Be Pro Ile 330 335 Pro Thr Read Gly Lys His Pro 350 Asn Glu Thr Glu Arg Lys Gln 365 Thr Read Le Arg Ile Asp Asp Pro 380 Thr Thr Read Gly Ile Lys Asn 395 400 Phe Lys Gly Phe Asp His Lys 410 415 Glu Asn Be Pro Val Valu Be 430 His Asn Phe His Glu Gln Ile

145145

ctttacctga ctcagattcc gtgattccgg agactgataa ctaatgatgt caaagacgaa ctgataagat acaactataa ctggtggaac cttctcatta gaactgatct tttgtgaatc ctgtattgca aagaagctgg cttggcctta cttactggagctttacctga ctcagattcc gtgattccgg agactgataa ctaatgatgt caaagacgaa ctgataagat acaactataa ctggtggaac cttctcatta gaactgatct tttgtgaatc ctgtattgca aagaagctgg cttggggag

gcttggtgtt tgttcggtta tttaggacga aaaggaagaa tactactact tgaagagtca tctaccgtgt tgttaaccaa gatgaggaat taaccgtcat tcaacatcct tatggcttct agaacccaat aacagtcagc cgcttggaac ctgcccgggggcttggtgtt tgttcggtta tttaggacga aaaggaagaa tactactact tgaagagtca tctaccgtgt tgttaaccaa gatgaggaat taaccgtcat tcaacatcct tatggcttct agaacccaat aacagtcagc cgggccgg cgggccgg

60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 gtttcaccgg gggcatggaa cagcttcaca tggatgccac aacccaattc accatctggt 1020 tccaatccaa attctcctac actaggtaaa cattcacgtg acgagaacgc tgctgaacca 1080 ggaaccgctt ttgatgaaac cgagtcactt ggtagggaga aaagcaaacc cgagagatgc 1140 ttgtgggttc ccaagacgct gaggattgat gatccagagg aagctgctaa aagttccatc 1200 tgggaaacat tagggatcaa aaaagacgaa aatgcggata ctttcggagc tttcagatca 1260 tcaaccaaag aaaaaagcag tctttctgaa ggaagacttc cgggaagaag accggagttg 1320 caagcgaatc ctgctgctct ttctaggtca gcaaacttcc atgagagctc atag 137460 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 gtttcaccgg gggcatggaa cagcttcaca tggatgccac aacccaattc accatctggt 1020 tccaatccaa attctcctac actaggtaaa cattcacgtg acgagaacgc tgctgaacca 1080 ggaaccgctt ttgatgaaac cgagtcactt ggtagggaga aaagcaaacc cgagagatgc 1140 ttgtgggttc ccaagacgct gaggattgat gatccagagg aagctgctaa aagttccatc 1200 tgggaaacat tagggatcaa aaaagacgaa aatgcggata ctttcggagc tttcagatca 1260 tcaaccaaag aaaaaagcag tctttctgaa ggaagacttc cgggaagaag accggagttg 1320 caagcgaatc ctgctgctct ttctaggtca gcaaacttcc atgagagctc atag 1374

<210> 255 <211> 457 <212> PRT<210> 255 <211> 457 <212> PRT

<213> Arabidopsis thaliana <400> 255<213> Arabidopsis thaliana <400> 255

Met Ala Asp Pro Ala Ile Lys Leu Phe Gly Lys Thr Ile Pro Leu Pro 1 5 10 15Met Wing Asp Pro Wing Ile Lys Leu Phe Gly Lys Thr Ile Pro Leu Pro 1 5 10 15

Glu Leu Gly Val Val Asp Ser Ser Ser Ser Tyr Thr Gly Phe Leu ThrGlu Leu Gly Val Val Asp Be Ser Ser Ser Ser Tyr Thr Gly Phe Leu Thr

20 25 3020 25 30

Glu Thr Gln Ile Pro Val Arg Leu Ser Asp Ser Cys Thr Gly Asp AspGlu Thr Gln Ile Pro Val Arg Read Asp Be Cys Thr Gly Asp Asp

35 40 4535 40 45

Asp Asp Glu Glu Met Gly Asp Ser Gly Leu Gly Arg Glu Glu Gly AspAsp Asp Glu Glu Met Gly Asp Being Gly Leu Gly Arg Glu Glu Gly Asp

50 55 6050 55 60

Asp Val Gly Asp Gly Gly Gly Glu Ser Glu Thr Asp Lys Lys Glu Glu 65 70 75 80Asp Val Gly Asp Gly Gly Gly Glu Be Glu Thr Asp Lys Lys Glu Glu 65 70 75 80

Lys Asp Ser Glu Cys Gln Glu Glu Ser Leu Arg Asn Glu Ser Asn AspLys Asp Be Glu Cys Gln Glu Glu Be Read Arg Asn Glu Be Asn Asp

85 90 9585 90 95

Val Thr Thr Thr Thr Ser Gly Ile Thr Glu Lys Thr Glu Thr Thr LysVal Thr Thr Thr Thr Being Gly Ile Thr Glu Lys Thr Glu Thr Thr Lys

100 105 110100 105 110

Ala Ala Lys Thr Asn Glu Glu Ser Gly Gly Thr Ala Cys Ser Gln GluWing Wing Lys Thr Asn Glu Glu Being Gly Gly Wing Wing Cys Being Gln Glu

115 120 125115 120 125

Gly Lys Leu Lys Lys Pro Asp Lys Ile Leu Pro Cys Pro Arg Cys AsnGly Lys Read Lys Lys Pro Asp Lys Ile Read Cys Pro Arg Cys Asn

130 135 140130 135 140

Ser Met Glu Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln 145 150 155 160Being Met Glu Thr Lys Phe Cys Tyr Tyr Asn Asn Tyr Asn Val Asn Gln 145 150 155 160

Pro Arg His Phe Cys Lys Lys Cys Gln Arg Tyr Trp Thr Ala Gly GlyPro His Arg Phe Cys Lys Lys Cys Gln Arg Tyr Trp Thr Wing Gly Gly

165 170 175165 170 175

Thr Met Arg Asn Val Pro Val Gly Ala Gly Arg Arg Lys Asn Lys SerThr Met Arg Asn Val Pro Val Gly Ala Gly Arg Arg Lys Asn Lys Ser

180 185 190180 185 190

Pro Ala Ser His Tyr Asn Arg His Val Ser Ile Thr Ser Ala Glu AlaPro Wing Be His Tyr Asn Arg His Val Be Ile Thr Be Wing Glu Wing

195 200 205195 200 205

Met Gln Lys Val Ala Arg Thr Asp Leu Gln His Pro Asn Gly Ala AsnMet Gln Lys Val Wing Arg Thr Asp Read Gln His Pro Asn Gly Wing Asn

210 215 220210 215 220

Leu Leu Thr Phe Gly Ser Asp Ser Val Leu Cys Glu Ser Met Ala Ser 225 230 235 240Leu Leu Thr Phe Gly Be Asp Be Val Leu Cys Glu Be Met Wing Be 225 230 235 240

Gly Leu Asn Leu Val Glu Lys Ser Leu Leu Lys Thr Gln Thr Val LeuGly Leu Asn Leu Val Glu Lys Ser Leu Leu Lys Thr Gln Thr Val Leu

245 250 255245 250 255

Gln Glu Pro Asn Glu Gly Leu Lys Ile Thr Val Pro Leu Asn Gln ThrGln Glu Pro Asn Glu Gly Read Lys Ile Thr Val Pro Read Asn Gln Thr

260 265 270260 265 270

Asn Glu Glu Ala Gly Thr Val Ser Pro Leu Pro Lys Val Pro Cys PheAsn Glu Glu Wing Gly Thr Val Ser Pro Leu Pro Lys Val Pro Cys Phe

275 280 285275 280 285

Pro Gly Pro Pro Pro Thr Trp Pro Tyr Ala Trp Asn Gly Val Ser TrpGly Pro Pro Pro Pro Thr Trp Pro Tyr Wing Trp Asn Gly Val Ser Trp

290 295 300290 295 300

Thr Ile Leu Pro Phe Tyr Pro Pro Pro Ala Tyr Trp Ser Cys Pro Gly 305 310 315 320Thr Ile Leu Pro Phe Tyr Pro Pro Pro Tyr Wing Trp Ser Cys Pro Gly 305 310 315 320

Val Ser Pro Gly Ala Trp Asn Ser Phe Thr Trp Met Pro Gln Pro AsnVal Ser Pro Gly Wing Trp Asn Be Phe Thr Trp Met Pro Gln Pro Asn

325 330 335325 330 335

Ser Pro Ser Gly Ser Asn Pro Asn Ser Pro Thr Leu Gly Lys His SerBe Pro Be Gly Be Asn Pro Asn Be Pro Thr Read Gly Lys His Be

340 345 350340 345 350

Arg Asp Glu Asn Ala Ala Glu Pro Gly Thr Ala Phe Asp Glu Thr GluArg Asp Glu Asn Wing Glu Pro Wing Gly Thr Wing Phe Asp Glu Thr Glu

355 360 365355 360 365

Ser Leu Gly Arg Glu Lys Ser Lys Pro Glu Arg Cys Leu Trp Val ProBe Gly Gly Arg Glu Lys Be Gly Lys Pro Glu Arg Cys Read Trp Val Pro

370 375 380370 375 380

Lys Thr Leu Arg Ile Asp Asp Pro Glu Glu Ala Ala Lys Ser Ser Ile 385 390 395 400Lys Thr Leu Arg Ile Asp Asp Pro Glu Glu Wing Wing Lys Ser Ser Ile 385 390 395 400

Trp Glu Thr Leu Gly Ile Lys Lys Asp Glu Asn Ala Asp Thr Phe Gly 405Trp Glu Thr Read Gly Ile Lys Lys Asp Glu Asn Wing Asp Thr Phe Gly 405

Ala Phe Arg Ser Ser Thr Lys Glu 420Wing Phe Arg Ser Be Thr Lys Glu 420

Leu Pro Gly Arg Arg Pro Glu LeuLeu Pro Gly Arg Leu Pro Glu Leu

435435

440440

Arg Ser Ala Asn Phe His Glu SerArg Ser Ala Asn Phe His Glu Ser

450 455450 455

<210> 256 <211> 57 <212> DNA<210> 256 <211> 57 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm07303 <400> 256<223> initiator: prm07303 <400> 256

ggggacaagt ttgtacaaaa aagcaggctt <210> 257 <211> 53 <212> DNAggggacaagt ttgtacaaaa aagcaggctt <210> 257 <211> 53 <212> DNA

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> iniciador: prm07304 <400> 257<223> initiator: prm07304 <400> 257

ggggaccact ttgtacaaga aagctgggtcggggaccact ttgtacaaga aagctgggtc

<210> 258<210> 258

<211> 654<211> 654

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 258<400> 258

cttctacatc ggcttaggtg tagcaacacg ttattttaca aaaatataaa atagatcagt ttattgtaaa gttctacaaa gctaatttaa aaacaagagt gtcaatggaa caatgaaaac attgaaatta tataattcaa agagaataaa gcattaccaa aatatatata gcttacaaaa ccttatcaca ttgacacata aagtgagtga atcatgtata tatgatagcc acaaagttac gtgcacctaa cagaatatcc aaataatatg aaaactaaca ctctaaagca accgatggga aatcctcatc atccttcacc acaattcaaa <210> 259 <211> 1828 <212> DNA <213> Oryza sativa <400> 259cttctacatc ggcttaggtg tagcaacacg ttattttaca aaaatataaa atagatcagt ttattgtaaa gttctacaaa gctaatttaa aaacaagagt gtcaatggaa caatgaaaac attgaaatta tataattcaa agagaataaa gcattaccaa aatatatata gcttacaaaa ccttatcaca ttgacacata aagtgagtga atcatgtata tatgatagcc acaaagttac gtgcacctaa cagaatatcc aaataatatg aaaactaaca ctctaaagca accgatggga aatcctcatc atccttcacc acaattcaaa <210> 259 <211> 1828 <212> DNA <213> Oryza sativa <400> 259

gcttgagtca tagggagaaa acaaatcgat taccggcaaa aaaagtagta ctggtttata tccggcttaa tgcttttctt ttgtcacata cttctgccat cccattatat agcaactcaa ctagacatgt taaggctgag ttgggcagtc gcgcacatac ttttcaaact actaaatggt gttgctttaa aaaattatat tgatccattt tcacgtgtta aaagaccgct ccgttttgcg accgaacaca gcctaaatct tgttgtctag tctaagttac tatatactga gatgaataga gatgaagtta ctactagctg cgtttgggag agcacgtgat taattaagta ctagtttaaa ttaagtaact ctcctataga aaacttttac atgtcagtaa aaaataagag agtagaagtt gtatacagtt ataaactatt ccctctgttc catgtaccag taccatgaat cgaatccaga aatatatcac atctgctcta aatatcttat tctgcccgtt gctaagcaca cgccaccccc cgataattga atggaacttc cacattcagagcttgagtca tagggagaaa acaaatcgat taccggcaaa aaaagtagta ctggtttata tccggcttaa tgcttttctt ttgtcacata cttctgccat cccattatat agcaactcaa ctagacatgt taaggctgag ttgggcagtc gcgcacatac ttttcaaact actaaatggt gttgctttaa aaaattatat tgatccattt tcacgtgtta aaagaccgct ccgttttgcg accgaacaca gcctaaatct tgttgtctag tctaagttac tatatactga gatgaataga gatgaagtta ctactagctg cgtttgggag agcacgtgat taattaagta ctagtttaaa ttaagtaact ctcctataga aaacttttac atgtcagtaa aaaataagag agtagaagtt gtatacagtt ataaactatt ccctctgttc catgtaccag taccatgaat cgaatccaga aatatatcac atctgctcta aatatcttat tctgcccgtt gctaagcaca cgccaccccc cgataattga atggaacttc cacattcaga

410 Lys Ser Ser 425410 Lys Ser Ser 425

Gln Ala Asn SerGln Wing Asn Ser

415415

Leu Ser Glu Gly Arg 430Read Ser Glu Gly Arg 430

Pro Ala Ala Leu Ser 445Pro Wing Wing Leu Ser 445

aaacaatgat gatggagact agagatcaaacaatgat gatggagact agagatc

atatgtaact ctaaatctgt tcaatatgtaact ctaaatctgt tca

actttattat ccctcaccac aagttattgc catatgacat tccacatagc catgacaagc tgagtcataa tttgatgatg actcacttag aagcatctat tattatagttactttattat ccctcaccac aagttattgc catatgacat tccacatagc catgacaagc tgagtcataa tttgatgatg actcacttag aagcatctat tattatagtt

catatttgac tgtaaagtaa tactgcattg gaatggattg catcttccca gtgtttttta ttttaaaaaa tgcaggaggg attcgtagta ataagtaaaa gacttcccaa aaacttaaaa aaaattacac atgaaagtta taaaacataa caagtttttt atttcgaggt gatgcgggga ttcgataggtcatgttag

5757

5353

tattattatt attattatta 60 aagtagagca agttggtgag 120 attaacttat ttcatattac 180 actataattt tgtttttatt 240 cgtaaagttc tacatgtggt 300 ttagtttgaa aaattgcaat 360 tattattttc tttgctaccc 420 atatcaaaga acatttttag 480 atcataatag agcatcaagt 540 aaatagacaa gcacaatgaa 600 gaagcatagt agta 654tattattatt attattatta 60 aagtagagca agttggtgag 120 attaacttat ttcatattac 180 actataattt tgtttttatt 240 cgtaaagttc tacatgtggt 300 ttagtttgaa aaattgcaat 360 tattattttc tttgctaccc 420 atatcaaaga acatagagagagagagagagagata40ag 600

tcttttccct ccatctctct 60 gattctttaa ttatgtgaga 120 caacaattgc catatattca 180 atatatcccc tattactaat 240 acccaccacc ttcgtttttc 300 aaaatatttt caatacaaaa 360 aatagctaat acttaattaa 420 ataggttcac atcctgcatt 480 ctggatatat taaatcatgt 540 ttagacccac cttaagtctt 600 aaaaaaaagt attagccatt 660 aataaattaa tatgattctc 720 cgtttaatag tttggaaaat 780 gaaaaagaat tgttttagta 840 gggattatgg atggattcga 900 atgcatattt attctactat 960 ggagactgtc gctatgtttt 1020 cgcctctggc cttcttgcca 1080 gaccgtcgac tccaagtgct 1140 ttgcacaaaa caactccggc ctcccggcca ccagtcacac gactcacggc actaccaccc 1200 ctgactccct gaggcggacc tgccactgtt ctgcatgcga agctatctaa aattctgaag 1260 caaagaaagc acagcacatg ctccgggaca cgcgccaccc ggcggaaaag ggctcggtgt 1320 ggcgatctca cagccgcata tcgcatttca caagccgccc atctccaccg gcttcacgag 1380 gctcatcgcg gcacgaccgc gcacggaacg cacgcggccg acccgcgcgc ctcgatgcgc 1440 gagcccatcc gccgcgtcct ccctttgcct ttgccgctat cctctcggtc gtatcccgtt 1500 tctctgtctt ttgctccccg gcgcgcgcca gttcggagta ccagcgaaac ccggacacct 1560 ggtacacctc cgccggccac aacgcgtgtc ccccctacgt ggccgcgcag cacatgccca 1620 tgcgcgacac gtgcacctcc tcatccaaac tctcaagtct caacggtcct ataaatgcac 1680 ggatagcctc aagctgctcg tcacaaggca agaggcaaga ggcaagagca tccgtattaa 1740 ccagcctttt gagacttgag agtgtgtgtg actcgatcca gcgtagtttc agttcgtgtg 1800 ttggtgagtg attccagcca agtttgcg 1828tcttttccct ccatctctct 60 gattctttaa ttatgtgaga 120 caacaattgc catatattca 180 atatatcccc tattactaat 240 acccaccacc ttcgtttttc 300 aaaatatttt caatacaaaa 360 aatagctaat acttaattaa 420 ataggttcac atcctgcatt 480 ctggatatat taaatcatgt 540 ttagacccac cttaagtctt 600 aaaaaaaagt attagccatt 660 aataaattaa tatgattctc 720 cgtttaatag tttggaaaat 780 gaaaaagaat tgttttagta 840 gggattatgg atggattcga 900 atgcatattt attctactat 960 ggagactgtc gctatgtttt 1020 cgcctctggc cttcttgcca 1080th gaccgtcgac tccaagtgct 1140th ttgcacaaaa caactccggc ctcccggcca ccagtcacac gactcacggc actaccaccc 1200th ctgactccct gaggcggacc tgccactgtt ctgcatgcga agctatctaa aattctgaag 1260th caaagaaagc acagcacatg ctccgggaca cgcgccaccc ggcggaaaag ggctcggtgt 1320th ggcgatctca cagccgcata tcgcatttca caagccgccc atctccaccg gcttcacgag 1380th gctcatcgcg gcacgaccgc gcacggaacg cacgcggccg acccgcgcgc ctcgatgcgc 1440th gagcccatcc gccgcgtcct ccctttgcct ttgccgctat cctctcggtc gtatcccgtt 1500th tctctgtctt ttgctccccg gcgcgcgcca gttcggagta ccagcgaaac ccggacacct 1560 ggt acacctc cgccggccac aacgcgtgtc ccccctacgt ggccgcgcag cacatgccca 1620 tgcgcgacac gtgcacctcc tcatccaaac tctcaagtct caacggtcct ataaatgcac 1680 ggatagcctc aagctgctcg tcacaaggca agaggcaaga ggcaagagca tccgtattaa 1740 ccagcctttt gagacttgag agtgtgtgtg actcgatcca gcgtagtttc agttcgtgtg 1800 ttggtgagtg attccagcca agtttgcg 1828

<210> 260 <211> 1243 <212> DNA <213> Oryza sativa <400> 260<210> 260 <211> 1243 <212> DNA <213> Oryza sativa <400> 260

aaaaccaccg agggacctga tctgcaccgg ttttgatagt tgagggaccc gttgtgtctg 60aaaaccaccg agggacctga tctgcaccgg ttttgatagt tgagggaccc gttgtgtctg 60

gttttccgat cgagggacga aaatcggatt cggtgtaaag ttaagggacc tcagatgaac 120 ttattccgga gcatgattgg gaagggagga cataaggccc atgtcgcatg tgtttggacg 180 gtccagatct ccagatcact cagcaggatc ggccgcgttc gcgtagcacc cgcggtttga 240 ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gtagcttccg ccggaagcga 300 gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc cttgcacgcg atacatcggg 360 atagatagct actactctct ccgtttcaca atgtaaatca ttctactatt ttccacattc 420 atattgatgt taatgaatat agacatatat atctatttag attcattaac atcaatatga 480 atgtaggaaa tgctagaatg acttacattg tgaattgtga aatggacgaa gtacctacga 540 tggatggatg caggatcatg aaagaattaa tgcaagatcg tatctgccgc atgcaaaatc 600 ttactaattg cgctgcatat atgcatgaca gcctgcatgc gggcgtgtaa gcgtgttcat 660 ccattaggaa gtaaccttgt cattacttat accagtacta catactatat agtattgatt 720 tcatgagcaa atctacaaaa ctggaaagca ataagaaata cgggactgga aaagactcaa 780 cattaatcac caaatatttc gccttctcca gcagaatata tatctctcca tcttgatcac 840 tgtacacact gacagtgtac gcataaacgc agcagccagc ttaactgtcg tctcaccgtc 900 gcacactggc cttccatctc aggctagctt tctcagccac ccatcgtaca tgtcaactcg 960 gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc aaatcaaaac caccggagaa 1020 gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac gcacgcacgc acgcccaacc 1080 ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccacccgcgc cctcacctcg 1140 ccgactataa atacgtaggc atctgcttga tcttgtcatc catctcacca ccaaaaaaaa 1200 aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg aca 1243gttttccgat cgagggacga aaatcggatt cggtgtaaag ttaagggacc tcagatgaac 120 ttattccgga gcatgattgg gaagggagga cataaggccc atgtcgcatg tgtttggacg 180 gtccagatct ccagatcact cagcaggatc ggccgcgttc gcgtagcacc cgcggtttga 240 ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gtagcttccg ccggaagcga 300 gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc cttgcacgcg atacatcggg 360 atagatagct actactctct ccgtttcaca atgtaaatca ttctactatt ttccacattc 420 atattgatgt taatgaatat agacatatat atctatttag attcattaac atcaatatga 480 atgtaggaaa tgctagaatg acttacattg tgaattgtga aatggacgaa gtacctacga 540 tggatggatg caggatcatg aaagaattaa tgcaagatcg tatctgccgc atgcaaaatc 600 ttactaattg cgctgcatat atgcatgaca gcctgcatgc gggcgtgtaa gcgtgttcat 660 ccattaggaa gtaaccttgt cattacttat accagtacta catactatat agtattgatt 720 tcatgagcaa atctacaaaa ctggaaagca ataagaaata cgggactgga aaagactcaa 780 cattaatcac caaatatttc gccttctcca gcagaatata tatctctcca tcttgatcac 840 tgtacacact gacagtgtac gcataaacgc agcagccagc ttaactgtcg tctcaccgtc 900 gcacactggc cttccatct c aggctagctt tctcagccac ccatcgtaca tgtcaactcg 960 gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc aaatcaaaac caccggagaa 1020 gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac gcacgcacgc acgcccaacc 1080 ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccacccgcgc cctcacctcg 1140 ccgactataa atacgtaggc atctgcttga tcttgtcatc catctcacca ccaaaaaaaa 1200 aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg ACA 1243

<210> 261 <211> 8 <212> PRT<210> 261 <211> 8 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 1 <220><223> reason 1 <220>

<221> INSEGURO <222> (2)..(3)<221> UNSAFE <222> (2) .. (3)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 261<223> Xaa can be any naturally occurring amino acid <400> 261

Phe Xaa Xaa Lys Tyr Asn Phe Asp 1 5Phe Xaa Xaa Lys Tyr Asn Phe Asp 1 5

<210> 262 <211> 8 <212> PRT<210> 262 <211> 8 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 2 <220><223> reason 2 <220>

<221> VARIANTE <222> (1)..(1) <223> /substituir="Leu" <220><221> VARIANT <222> (1) .. (1) <223> / replace = "Read" <220>

<221> INSEGURO <222> (3)..(3)<221> UNSAFE <222> (3) .. (3)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 262<223> Xaa can be any naturally occurring amino acid <400> 262

Pro Leu Xaa Gly Arg Tyr Glu TrpPro Leu Xaa Gly Arg Tyr Glu Trp

1 51 5

<210> 263<210> 263

<211> 10<211> 10

<212> PRT<212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 3 <220><223> reason 3 <220>

<221> INSEGURO <222> (2) .. (2)<221> UNSAFE <222> (2) .. (2)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220><223> Xaa can be any naturally occurring amino acid <220>

<221> VARIANTE <222> (4)..(4) <223> /substituir="Glu" <220><221> VARIANT <222> (4) .. (4) <223> / replace = "Glu" <220>

<221> INSEGURO <222> (7)..(9)<221> UNSAFE <222> (7) .. (9)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 263<223> Xaa can be any naturally occurring amino acid <400> 263

Glu Xaa Glu Asp Phe Phe Xaa Xaa Xaa Glu 15 10Glu Xaa Glu Asp Phe Phe Xaa Xaa Xaa Glu 15 10

<210> 264 <211> 8 <212> PRT<210> 264 <211> 8 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 4 <220><223> reason 4 <220>

<221> INSEGURO <222> (2)..(2)<221> UNSAFE <222> (2) .. (2)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 264<223> Xaa can be any naturally occurring amino acid <400> 264

Tyr Xaa Gln Leu Arg Ser Arg ArgTyr Xaa Gln Read Arg Be Arg Arg

1 51 5

<210> 265<210> 265

<211> 9<211> 9

<212> PRT<212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 5 <220><223> reason 5 <220>

<221> VARIANTE<221> VARIANT

<222> (5)..(5)<222> (5) .. (5)

<223> /substituir="Ile"<223> / replace = "Ile"

<220><220>

<221> VARIANTE <222> (6)..(6) <223> /substituir="Arg" <220><221> VARIANT <222> (6) .. (6) <223> / replace = "Arg" <220>

<221> INSEGURO <222> (8)..(8)<221> UNSAFE <222> (8) .. (8)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220><223> Xaa can be any naturally occurring amino acid <220>

<221> VARIANTE<221> VARIANT

<222> (9)..(9)<222> (9) .. (9)

<223> /substituir="Arg"<223> / replace = "Arg"

<400> 265<400> 265

Met Gly Lys Tyr Met Lys Lys Xaa Lys <210> 266 <211> 8 <212> PRTMet Gly Lys Tyr Met Lys Lys Xaa Lys <210> 266 <211> 8 <212> PRT

<213> Seqüência artificial <220><213> Artificial sequence <220>

<223> motivo 6 <220><223> reason 6 <220>

<221> INSEGURO <222> (2)..(2)<221> UNSAFE <222> (2) .. (2)

<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <400> 266<223> Xaa can be any naturally occurring amino acid <400> 266

Ser Xaa Gly Val Arg Thr Arg AlaSer Xaa Gly Val Arg Thr Arg Wing

1 51 5

<210> 267<210> 267

<211> 585<211> 585

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 267<400> 267

atgggcaagt acatgcgcaa ggccaaggtg gtggtctccg gcgaggtggt ggccgccgcc gtcatggagc tcgccgcggc gccgctcggg gtgcgcaccc gcgcccgctc cctcgcgctg cagaagaggc agggcgggga gtacctcgag ctcaggagcc gcaggctcga gaagctccct cctcccccgc cgccgccgcc gaggaggagg gcgacggctg cggctgcgac tgctgatgcg acggcgacgg agagcgcgga ggcggaggtg tcgttcgggg gggagaacgt cctcgagctg gaggccatgg aaaggaatac cagggagacg acaccttgca gcttgatcag ggaccccgat acgattagca cccctggatc taccacaagg cgcagccact cgagttctca ttgcaaggtg caaacacccg tgcgccacaa cattattcca gcatcagcag agctggaagc gttcttcgcc gccgaagagc aacggcaacg acaggctttc atcgacaagt ataactttga tcctgtgaat gactgccctc ttcccggccg atttgaatgg gtcaagctag actga <210> 268 <211> 194 <212> PRTatgggcaagt acatgcgcaa ggccaaggtg gtggtctccg gcgaggtggt ggccgccgcc gtcatggagc tcgccgcggc gccgctcggg gtgcgcaccc gcgcccgctc cctcgcgctg cagaagaggc agggcgggga gtacctcgag ctcaggagcc gcaggctcga gaagctccct cctcccccgc cgccgccgcc gaggaggagg gcgacggctg cggctgcgac tgctgatgcg acggcgacgg agagcgcgga ggcggaggtg tcgttcgggg gggagaacgt cctcgagctg gaggccatgg aaaggaatac cagggagacg acaccttgca gcttgatcag ggaccccgat acgattagca cccctggatc taccacaagg cgcagccact cgagttctca ttgcaaggtg caaacacccg tgcgccacaa cattattcca gcatcagcag agctggaagc gttcttcgcc gccgaagagc aacggcaacg acaggctttc atcgacaagt ataactttga tcctgtgaat gactgccctc ttcccggccg atttgaatgg gtcaagctag actga <210> 268 <211> 194 <212> PRT

<213> Oryza sativa <400> 268<213> Oryza sativa <400> 268

Met Gly Lys Tyr Met Arg Lys Ala Lys Val Val Val Ser Gly Glu Val 1 5 10 15 Val Ala Ala Ala Val Met Glu Leu Ala Ala Ala Pro Leu Gly Val Arg 20 25 30 Thr Arg Ala Arg Ser Leu Ala Leu Gln Lys Arg Gln Gly Gly Glu Tyr 35 40 45 Leu Glu Leu Arg Ser Arg Arg Leu Glu Lys Leu Pro Pro Pro Pro Pro 50 55 60 Pro Pro Pro Arg Arg Arg Ala Thr Ala Ala Ala Ala Thr Ala Asp Ala 65 70 75 80 Thr Ala Thr Glu Ser Ala Glu Ala Glu Val Ser Phe Gly Gly Glu Asn 85 90 95 Val Leu Glu Leu Glu Ala Met Glu Arg Asn Thr Arg Glu Thr Thr Pro 100 105 110 Cys Ser Leu Ile Arg Asp Pro Asp Thr Ile Ser Thr Pro Gly Ser Thr 115 120 125 Thr Arg Arg Ser His Ser Ser Ser His Cys Lys Val Gln Thr Pro Val 130 135 140 Arg His Asn Ile Ile Pro Ala Ser Ala Glu Leu Glu Ala Phe Phe Ala 145 150 155 160 Ala Glu Glu Gln Arg Gln Arg Gln Ala Phe Ile Asp Lys Tyr Asn Phe 165 170 175 Asp Pro Val Asn Asp Cys Pro Leu Pro Gly Arg Phe Glu Trp Val Lys 180 185 190 Leu Asp <210> 269Met Gly Lys Tyr Met Arg Lys Wing Lys Val Val Val Ser Gly Glu Val 1 5 10 15 Val Wing Wing Wing Val Wing Met Glu Leu Wing Wing Pro Wing Leu Gly Val Arg 20 25 30 Thr Arg Wing Arg Be Leu Wing Leu Gln Lys Arg Gln Gly Gly Glu Tyr 35 40 45 Leu Glu Leu Arg Be Arg Arg Leu Glu Lys Leu Pro Pro Pro Pro 50 55 60 Pro Pro Arg Arg Wing Thr Wing Wing Wing Wing Wing Wing Wing Wing 65 Wing 75 Wing Wing Thr Wing Wing Glu Ser Wing Glu Wing Glu Val Val Phe Gly Gly Glu Asn 85 90 95 Val Leu Glu Leu Glu Wing Met Glu Arg Asn Thr Arg Glu Thr Thr Pro 100 105 110 Cys Ser Leu Ile Arg Asp Pro Asp Thr Ile Ser Thr Pro Gly Ser Thr 115 120 125 Thr Arg Arg Be His Be Be His Be Cys Lys Val Gln Thr Pro Val 130 135 140 Arg His Asn Ile Ile Pro Wing Be Wing Glu Leu Glu Wing Phe Phe Wing 145 150 155 160 Wing Glu Glu Gln Arg Gln Arg Gln Wing Phe Ile Asp Lys Tyr Asn Phe 165 170 175 Asp Pro Val Asn Asp Cys Pro the Gly Arg Phe Glu Trp Val Lys 180 185 190 Leu Asp

<211> 573 <212> DNA <213> Zea mays <400> 269<211> 573 <212> DNA <213> Zea mays <400> 269

atgggcaagt acatgcgcaa ggccaaggct tccagcgagg ttgtcatcat ggatgtcgcc 60atgggcaagt acatgcgcaa ggccaaggct tccagcgagg ttgtcatcat ggatgtcgcc 60

gccgctccgc tcggagtccg cacccgagcg cgcgccctcg cgctgcagcg tctgcaggag 120 caacagacgc agtgggaaga aggtgctggc ggcgagtacc tggagctaag gaaccggagg 180 ctcgagaagc tgccgccgcc gccggcgacc actaggaggt cgggcgggag gaaagcggca 240 gccgaggccg ccgcaactaa ggaggctgag gcgtcgtacg gggagaacat gctcgagttg 300 gaggccatgg agaggattac cagggagacg acgccttgca gcttgattaa cacccagatg 360 actagcactc ctgggtccac gagatccagc cactcttgcc accgcagggt gaacgctcct 420 ccggtgcacg ccgtcccaag ttctagggag atgaatgagt acttcgctgc cgaacagcga 480 cggcaacagc aggatttcat tgacaagtac aacttcgatc ctgcaaacga ctgccctctc 540 ccaggcaggt ttgagtgggt gaagctagac tga 573gccgctccgc tcggagtccg cacccgagcg cgcgccctcg cgctgcagcg tctgcaggag 120 caacagacgc agtgggaaga aggtgctggc ggcgagtacc tggagctaag gaaccggagg 180 ctcgagaagc tgccgccgcc gccggcgacc actaggaggt cgggcgggag gaaagcggca 240 gccgaggccg ccgcaactaa ggaggctgag gcgtcgtacg gggagaacat gctcgagttg 300 gaggccatgg agaggattac cagggagacg acgccttgca gcttgattaa cacccagatg 360 actagcactc ctgggtccac gagatccagc cactcttgcc accgcagggt gaacgctcct 420 ccggtgcacg ccgtcccaag ttctagggag atgaatgagt acttcgctgc cgaacagcga 480 cggcaacagc aggatttcat tgacaagtac aacttcgatc ctgcaaacga ctgccctctc 540 ccaggcaggt ttgagtgggt gaagctagac tga 573

<210> 270 <211> 190 <212> PRT <213> Zea mays <400> 270<210> 270 <211> 190 <212> PRT <213> Zea mays <400> 270

Met Gly Lys Tyr Met Arg Lys Ala Lys Ala Ser Ser 1 5 10Met Gly Lys Tyr Met Arg Lys Wing Lys Wing Ser Ser 1 5 10

Met Asp Val Ala Ala Ala Pro Leu Gly Val Arg ThrMet Asp Val Wing Pro Wing Wing Read Gly Val Arg Thr

20 2520 25

Leu Ala Leu Gln Arg Leu Gln Glu Gln Gln Thr GlnLeu Ala Leu Gln Arg Leu Gln Glu Gln Gln Thr Gln

35 4035 40

Ala Gly Gly Glu Tyr Leu Glu Leu Arg Asn Arg ArgWing Gly Gly Glu Tyr Leu Glu Leu Arg Asn Arg Arg

50 55 6050 55 60

Pro Pro Pro Pro Ala Thr Thr Arg Arg Ser Gly Gly 65 70 75Pro Pro Pro Pro Wing Thr Thr Arg Arg Be Gly Gly 65 70 75

Ala Glu Ala Ala Ala Thr Lys Glu Ala Glu Ala SerWing Glu Wing Wing Wing Thr Thr Lys Wing Glu Wing Wing Ser

85 9085 90

Met Leu Glu Leu Glu Ala Met Glu Arg Ile Thr ArgMet Leu Glu Leu Glu Wing Met Glu Arg Ile Thr Arg

100 105100 105

Cys Ser Leu Ile Asn Thr Gln Met Thr Ser Thr ProCys Be Read Ile Asn Thr Gln Met Thr Be Thr Pro

115 120115 120

Ser Gly His Ser Cys His Arg Arg Val Asn Ala Pro 130 135 140Be Gly His Be Cys His Arg Arg Val Asn Ala Pro 130 135 140

Val Pro Ser Ser Arg Glu Met Asn Glu Tyr Phe Ala 145 150 155Val Pro Be Ser Arg Glu Met Asn Glu Tyr Phe Wing 145 150 155

Arg Gln Gln Gln Asp Phe Ile Asp Lys Tyr Asn PheArg Gln Gln Gln Asp Phe Ile Asp Lys Tyr Asn Phe

165 170165 170

Asp Cys Pro Leu Pro Gly Arg Phe Glu Trp Val LysAsp Cys Pro Read Pro Gly Arg Phe Glu Trp Val Lys

180 185180 185

<210> 271 <211> 755 <212> DNA<210> 271 <211> 755 <212> DNA

<213> Triticum aestivum <400> 271<213> Triticum aestivum <400> 271

atgggcaagt acatgcgcaa gcccaaggtc tccggcgagg tggccgtcat ggaggtcgcc 60atgggcaagt acatgcgcaa gcccaaggtc tccggcgagg tggccgtcat ggaggtcgcc 60

gccgcgccgc taggggtccg cacccgcgca cgagcgctcg cgatgcagag gcagccgcag 120 ggggcggcgg tggccaagga ccagggggag tacctggagc tcaggagtcg gaagctcgag 180 aagctgcccc cgccgccgcc ggcggcgagg aggagggcgg ccgcggcgga gcgtgtcgag 24 0 gccgaggccg aggccgacga ggtgtccttc ggtgagaacg tgctcgagtc ggaggccatg 300 gggaggggta ccagggagac gacgccctgc agcttgatta gggactcggg aacgataagc 360 actcctggat ccacaacaag accgagccac tcgaattccc atcgcagggt gcaagctcca 420 gcgcgccata ttattccatg ttcagcagag atgaatgagt tcttctctgc tgcggagcaa 480 ccgcaacagc aagccttcat tgacaagtac aactttgatc ctgtgaacga ctgtcctctc 540 ccaggccgat acgagtgggt gaagctagac tgataattct ccaggaagga gagcaccatg 600 tacttctccg ctccctccac cttagcgtcg tggtaaaggc cgccccgtcg tgtagctttg 660 tttccgttgt aaaaagaata gttagctgta gtagcctcaa tggcgttaca tacagagtaa 720 tgctgattac acctaatcct caaaccatgt acgtt 755gccgcgccgc taggggtccg cacccgcgca cgagcgctcg cgatgcagag gcagccgcag 120 ggggcggcgg tggccaagga ccagggggag tacctggagc tcaggagtcg gaagctcgag 180 aagctgcccc cgccgccgcc ggcggcgagg aggagggcgg ccgcggcgga gcgtgtcgag 24 0 gccgaggccg aggccgacga ggtgtccttc ggtgagaacg tgctcgagtc ggaggccatg 300 gggaggggta ccagggagac gacgccctgc agcttgatta gggactcggg aacgataagc 360 actcctggat ccacaacaag accgagccac tcgaattccc atcgcagggt gcaagctcca 420 gcgcgccata ttattccatg ttcagcagag atgaatgagt tcttctctgc tgcggagcaa 480 ccgcaacagc aagccttcat tgacaagtac aactttgatc ctgtgaacga ctgtcctctc 540 ccaggccgat acgagtgggt gaagctagac tgataattct ccaggaagga gagcaccatg 600 tacttctccg ctccctccac cttagcgtcg tggtaaaggc cgccccgtcg tgtagctttg 660 tttccgttgt aaaaagaata gttagctgta gtagcctcaa tggcgttaca tacagagtaa 720 755 tgctgattac acctaatcct caaaccatgt acgtt

<210> 272 <211> 190 <212> PRT<210> 272 <211> 190 <212> PRT

<213> Triticum aestivum<213> Triticum aestivum

Glu Val Val Ile 15 Arg Ala Arg Ala 30 Trp Glu Glu Gly 45 Leu Glu Lys Leu Arg Lys Ala Ala 80 Tyr Gly Glu Asn 95 Glu Thr Thr Pro 110 Gly Ser Thr Arg 125 Pro Val His Ala Ala Glu Gln Arg 160 Asp Pro Ala Asn 175 Leu Asp 190 <400> 272Glu Val Val Ile 15 Arg Wing Arg Wing 30 Trp Glu Glu Gly 45 Leu Glu Lys Leu Arg Lys Wing 80 Tyr Gly Glu Asn 95 Glu Thr Thr Pro 110 Gly Ser Thr Arg 125 Pro Val His Wing Glu Gln Arg 160 Asp Pro Wing Asn 175 Leu Asp 190 <400> 272

Met Gly Lys Tyr Met Arg Lys Pro Lys Val Ser Gly Glu Val Ala Val 15 10 15Met Gly Lys Tyr Met Arg Lys Pro Lys Val Ser Gly Glu Val Wing Val 15 10 15

Met Glu Val Ala Ala Ala Pro Leu Gly Val Arg Thr Arg Ala Arg AlaMet Glu Val Wing Ward Wing Pro Wing Read Gly Val Arg Thr Arg Wing Arg Wing

20 25 3020 25 30

Leu Ala Met Gln Arg Gln Pro Gln Gly Ala Ala Val Ala Lys Asp GlnLeu Met Met Gln Arg Gln Pro Gln Gly Wing Val Wing Wing Lys Asp Gln

35 40 4535 40 45

Gly Glu Tyr Leu Glu Leu Arg Ser Arg Lys Leu Glu Lys Leu Pro ProGly Glu Tyr Leu Glu Leu Arg Be Arg Lys Leu Glu Lys Leu Pro

50 55 6050 55 60

Pro Pro Pro Ala Ala Arg Arg Arg Ala Ala Ala Ala Glu Arg Val Glu 65 70 75 80Pro Pro Pro Wing Arg Wing Arg Arg Wing Wing Wing Wing Wing Glu Arg Val Glu 65 70 75 80

Ala Glu Ala Glu Ala Asp Glu Val Ser Phe Gly Glu Asn Val Leu GluGlu Wing Glu Wing Asp Glu Wing Val Ser Phe Gly Glu Asn Val Leu Glu

85 90 9585 90 95

Ser Glu Ala Met Gly Arg Gly Thr Arg Glu Thr Thr Pro Cys Ser LeuBe Glu Ala Met Gly Arg Gly Thr Arg Glu Thr Thr Pro Cys Ser Leu

100 105 110100 105 110

Ile Arg Asp Ser Gly Thr Ile Ser Thr Pro Gly Ser Thr Thr Arg ProIle Arg Asp To Be Gly Thr Ile Arg To Be Gly Thr Thr

115 120 125115 120 125

Ser His Ser Asn Ser His Arg Arg Val Gln Ala Pro Ala Arg His IleBe His Be Asn Be His Arg Arg Val Gln Pro Wing Arg His Ile

130 135 140130 135 140

Ile Pro Cys Ser Ala Glu Met Asn Glu Phe Phe Ser Ala Ala Glu Gln 145 150 155 160Ile Pro Cys Be Wing Glu Met Asn Glu Phe Phe Be Wing Glu Gln 145 150 155 160

Pro Gln Gln Gln Ala Phe Ile Asp Lys Tyr Asn Phe Asp Pro Val AsnPro Gln Gln Gln Wing Phe Ile Asp Lys Tyr Asn Phe Asp Pro Val Asn

165 170 175165 170 175

Asp Cys Pro Leu Pro Gly Arg Tyr Glu Trp Val Lys Leu Asp 180 185 190Asp Cys Pro Leu Pro Gly Arg Tyr Glu Trp Val Lys Leu Asp 180 185 190

<210> 273<210> 273

<211> 666<211> 666

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 273<400> 273

atggggaagt acatgcggaa ggggaaggtg tcgggggagg tggcggtgat ggaggtgggc 60atggggaagt acatgcggaa ggggaaggtg tcgggggagg tggcggtgat ggaggtgggc 60

ggggcgctgc tcggcgtccg cacccgctcc cgcacgctcg cgctgcagcg gacgacctcg 120 tcgcagaagc cgccggagaa gggggagggg gaccccggtg cgggcgcggg cgcgggggcg 180 gagtacctcg agctcaggag ccggaggctc gagaagccgc ctccgcacac gccgccggcc 240 aaggagaagg agaccgccag gagggcttcc gccgccgccg ccgccgccgt gaggatgccg 300 gcggcgccgc aagcggccga ggagttcgag gcggaggtcg aggtgtcctt cggcgacaac 360 gttcttgacc tcgacggcga cgccatggag aggagtacca gggagacaac gccttgcagt 420 ttaattagga gctcagaaat gataagcacc cctggctcca caactaaaac caacacctcg 480 atcagttccc ggcgcagaat ggagacctct gtttgtcgtt acgttccgag ttctcttgag 540 atggaagagt tctttgcagc tgctgaacaa cagcaacatc aggctttcag agagaggtat 600 aacttctgtc ctgtgaacga ctgcccactt cctggacggt acgaatggac aaggctagac 660 tgctag 666ggggcgctgc tcggcgtccg cacccgctcc cgcacgctcg cgctgcagcg gacgacctcg 120 tcgcagaagc cgccggagaa gggggagggg gaccccggtg cgggcgcggg cgcgggggcg 180 gagtacctcg agctcaggag ccggaggctc gagaagccgc ctccgcacac gccgccggcc 240 aaggagaagg agaccgccag gagggcttcc gccgccgccg ccgccgccgt gaggatgccg 300 gcggcgccgc aagcggccga ggagttcgag gcggaggtcg aggtgtcctt cggcgacaac 360 gttcttgacc tcgacggcga cgccatggag aggagtacca gggagacaac gccttgcagt 420 ttaattagga gctcagaaat gataagcacc cctggctcca caactaaaac caacacctcg 480 atcagttccc ggcgcagaat ggagacctct gtttgtcgtt acgttccgag ttctcttgag 540 atggaagagt tctttgcagc tgctgaacaa cagcaacatc aggctttcag agaggtc 600 aacttctgtc ctgtgaacgg cgggggggggg 6

<210> 274 <211> 221 <212> PRT<210> 274 <211> 221 <212> PRT

<213> Oryza sativa <400> 274<213> Oryza sativa <400> 274

Met Gly Lys Tyr Met Arg Lys Gly Lys Val Ser Gly Glu Val Ala Val 15 10 15Met Gly Lys Tyr Met Arg Lys Gly Lys Val Ser Gly Glu Val Wing Val 15 10 15

Met Glu Val Gly Gly Ala Leu Leu Gly Val Arg Thr Arg Ser Arg ThrMet Glu Val Gly Gly Wing Read Leu Gly Val Arg Thr Arg Be Arg Thr

20 25 3020 25 30

Leu Ala Leu Gln Arg Thr Thr Ser Ser Gln Lys Pro Pro Glu Lys GlyRead Ala Read Le Gln Arg Thr Thr Be Being Gln Lys Pro Pro Glu Lys Gly

35 40 4535 40 45

Glu Gly Asp Pro Gly Ala Gly Ala Gly Ala Gly Ala Glu Tyr Leu GluGlu Gly Asp Pro Gly Wing Gly Wing Gly Wing Gly Wing Glu Tyr Leu Glu

50 55 6050 55 60

Leu Arg Ser Arg Arg Leu Glu Lys Pro Pro Pro His Thr Pro Pro Ala 65 70 75 80Read Arg Be Arg Arg Read Le Glu Lys Pro Pro His Thr Pro Pro Wing 65 70 75 80

Lys Glu Lys Glu Thr Ala Arg Arg Ala Ser Ala Ala Ala Ala Ala AlaLys Glu Lys Glu Thr Wing Arg Arg Wing Be Wing Wing Wing Wing Wing Wing

85 90 9585 90 95

Val Arg Met Pro Ala Ala Pro Gln Ala Ala Glu Glu Phe Glu Ala GluVal Arg Met Pro Wing Pro Wing Gln Wing Glu Wing Glu Phe Glu Wing Glu

100 105 110100 105 110

Val Glu Val Ser Phe Gly Asp Asn Val Leu Asp Leu Asp Gly Asp Ala 115 120 125 Met Glu Arg Ser Thr Arg Glu Thr Thr Pro CysVal Glu Val Ser Phe Gly Asp Asn Val Read Asp Leu Asp Read Asp Gly Asp Wing 115 120 125 Met Glu Arg Be Thr Arg Glu Thr Thr Pro Cys

130 135130 135

Ser Glu Met Ile Ser Thr Pro Gly Ser Thr Thr 145 150 155Be Glu Met Ile Be Thr Pro Gly Be Thr Thr 145 150 155

Ile Ser Ser Arg Arg Arg Met Glu Thr Ser ValIle Ser Be Arg Arg Arg Met Glu Thr Be Val

165 170165 170

Ser Ser Leu Glu Met Glu Glu Phe Phe Ala AlaBeing Being Read Glu Met Glu Glu Phe Phe Wing Wing

180 185180 185

His Gln Ala Phe Arg Glu Arg Tyr Asn Phe CysHis Gln Phe Arg Wing Glu Arg Tyr Asn Phe Cys

195 200195 200

Pro Leu Pro Gly Arg Tyr Glu Trp Thr Arg LeuPro Leu Pro Gly Arg Tyr Glu Trp Thr Arg Leu

210 215210 215

<210> 275 <211> 642 <212> DNA <213> Zea mays <400> 275<210> 275 <211> 642 <212> DNA <213> Zea mays <400> 275

atggggaagt acatgcgcaa gggcaaggtg tccggggagg ggcggcgcgc tgctcggcgt ccgcacccgc tcccgcacgc aggccgctcg acaagggcga cgcggaggac gccgccgcgg cggaggctcg agaagccgca caaggagcat ccgtcgccgc ggcgccggga ggaaggccgc cgccgccgcc gcggtgcagc gtcgaggtcg aggtctcgtt cggggacaac gtgcttgact accagagaga caacaccgtg cagcctgatt aggaacccag tccacaacta aaagcaaaac cagcagcaac tcgacgactt accccgagct gccggttcat accgagctcg ctcgagatgg gagcaacagg agcagcatag cttcagggag aagtacaact cctctccctg gccggtacga atgggcgagg ctagactgct <210> 276 <211> 213 <212> PRT <213> Zea mays <400> 276atggggaagt acatgcgcaa gggcaaggtg tccggggagg ggcggcgcgc tgctcggcgt ccgcacccgc tcccgcacgc aggccgctcg acaagggcga cgcggaggac gccgccgcgg cggaggctcg agaagccgca caaggagcat ccgtcgccgc ggcgccggga ggaaggccgc cgccgccgcc gcggtgcagc gtcgaggtcg aggtctcgtt cggggacaac gtgcttgact accagagaga caacaccgtg cagcctgatt aggaacccag tccacaacta aaagcaaaac cagcagcaac tcgacgactt accccgagct gccggttcat accgagctcg ctcgagatgg gagcaacagg agcagcatag cttcagggag aagtacaact cctctccctg gccggtacga atgggcgagg ctagactgct <210> 276 <211 > 213 <212> PRT <213> Zea mays <400> 276

Met Gly Lys Tyr Met Arg Lys Gly Lys Val Ser 15 10Met Gly Lys Tyr Met Arg Lys Gly Lys Val Ser 15 10

Met Glu Val Pro Gly Gly Ala Leu Leu Gly ValMet Glu Val Pro Gly Gly Wing Read Leu Gly Val

20 2520 25

Thr Leu Ala Leu Gln Arg Ala Gln Arg Pro LeuThr Leu Wing Leu Gln Arg Wing Gln Arg Pro Leu

35 4035 40

Glu Asp Ala Ala Ala Glu Tyr Leu Glu Leu ArgGlu Asp Wing Wing Wing Glu Tyr Leu Glu Leu Arg

50 5550 55

Lys Pro His Lys Glu His Pro Ser Pro Pro Ala 65 70 75Lys Pro His Lys Glu His Pro Ser Pro Pro Wing 65 70 75

Gly Ala Gly Arg Lys Ala Ala Ala Ala Ala AlaGly Wing Gly Arg Lys Wing Wing Wing Wing Wing Wing

85 9085 90

Met Gln Asp Glu Val Glu Val Glu Val Ser PheMet Gln Asp Glu Val Glu Val Glu Val Ser Phe

100 105100 105

Asp Leu Asp Thr Met Glu Arg Ser Thr Arg GluAsp Read Asp Thr Met Glu Arg Be Thr Arg Glu

115 120115 120

Leu Ile Arg Asn Pro Glu Met Ile Ser Thr ProRead Ile Arg Asn Pro Glu Met Ile Be Thr Pro

130 135130 135

Ser Lys Thr Ser Ser Asn Ser Thr Thr Ser Arg 145 150 155Be Lys Thr Be Ser Asn Be Thr Thr Be Arg 145 150 155

Thr Pro Ser Cys Arg Phe Ile Pro Ser Ser LeuThr Pro Be Cys Arg Phe Ile Pro Be Ser Read

165 170165 170

Phe Ser Ala Ala Glu Gln Gln Glu Gln His SerPhe Ser Wing Ala Glu Gln Gln Glu Gln His Ser

180 185180 185

Asn Phe Cys Pro Val Asn Asp Cys Pro Leu ProAsn Phe Cys Pro Val Asn Asp Cys Pro Leu Pro

195 200195 200

Ala Arg Leu Asp Cys 210 <210> 277 <211> 642Arg Wing Read Asp Cys 210 <210> 277 <211> 642

Ser Leu Ile Arg Ser 140Ser Leu Ile Arg Ser 140

Lys Thr Asn Thr Ser 160Lys Thr Asn Thr Ser 160

Cys Arg Tyr Val Pro 175Cys Arg Tyr Val Pro 175

Ala Glu Gln Gln Gln 190Glu Gln Wing Gln Gln 190

Pro Val Asn Asp CysPro Val Asn Asp Cys

205 Asp Cys 220205 Asp Cys 220

tcgccgtcat tcgcgctgca agtacctcga ccgcgaccgc acgtgctgat tggacaccat agatgataag cccgccgcag aggagttctt tctgtcccgt agtcgccgtcat tcgcgctgca agtacctcga ccgcgaccgc acgtgctgat tggacaccat agatgataag cccgccgcag aggagttctt tctgtcccgt ag

ggaggtaccc gcgcgcgcag gctcaggagc gaccaagagg gcaggacgag ggaaaggagt caccccagga aacggaggaa ctcggcggcc gaacgactgtggaggtaccc gcgcgcgcag gctcaggagc gaccaagagg gcaggacgag ggaaaggagt caccccagga aacggaggaa ctcggcggcc gaacgactgt

60 120 180 240 300 360 420 480 540 600 64260 120 180 240 300 360 420 480 540 600 642

Gly GluGly Glu

Arg ThrArg thr

Asp LysAsp Lys

45 Ser Arg 6045 Ser Arg 60

Thr AlaThr wing

Val GlnVal gln

Gly AspGly asp

Thr Thr 125 Gly Ser 140Thr Thr 125 Gly Ser 140

Arg ArgArg Arg

Glu MetGlu Met

Phe ArgPhe arg

Gly Arg 205Gly Arg 205

ValVal

ArgArg

3030

GlyGly

ArgArg

ThrThr

HisHis

Asn 110 ProAsn 110 pro

ThrThr

ThrThr

GluGlu

Glu 190 TyrGlu 190 Tyr

Ala Val 15Val Wing 15

Ser ArgTo be Arg

Asp AlaAsp Wing

Leu GluRead Glu

Lys Arg 80 Val Leu 95Lys Arg 80 Val Leu 95

Val LeuVal leu

Cys SerCys ser

Thr LysThr lys

Glu Glu 160 Glu Phe 175Glu Glu 160 Glu Phe 175

Lys Tyr Glu Trp <212> DNALys Tyr Glu Trp <212> DNA

<213> Sorghum bicolor <400> 277<213> Sorghum bicolor <400> 277

atggggaagt acatgcgcaa gggcaaggtg tccggggagg tcgccgtcat ggcggcgcgc tgctcggcgt ccgcacccgc tcccgcacgc tcgcgctgca aggccgctcg acaagggcga cgccgaggac gccgctgcgg agtacctcga cggaggctcg agaagccgca caaggacccg ttaccgccgc cgtctgcgcc aggggcgccg ggaggaaggt cgccaccgcc gccgccgccg ccgcggcgcc gcggaggacg acgtcgaggt ctccttcggc gagaacgtgc tcgacttcga aggagtacca gagagacaac accgtgcagt ttgattagga acccagagat ccaggatcca caactaagag taaaaccagc aactcgatga cctcccgtcg acctcaatct gccgtttcat accaagttcg catgagatgg aagagttctt gaaaaacagg agcagcaaag cttcagggag aagtataact tctgtcctgt cctcttccgg gtcggtatga atgggcgagg ctagactgct ag <210> 278 <211> 213 <212> PRTatggggaagt acatgcgcaa gggcaaggtg tccggggagg tcgccgtcat ggcggcgcgc tgctcggcgt ccgcacccgc tcccgcacgc tcgcgctgca aggccgctcg acaagggcga cgccgaggac gccgctgcgg agtacctcga cggaggctcg agaagccgca caaggacccg ttaccgccgc cgtctgcgcc aggggcgccg ggaggaaggt cgccaccgcc gccgccgccg ccgcggcgcc gcggaggacg acgtcgaggt ctccttcggc gagaacgtgc tcgacttcga aggagtacca gagagacaac accgtgcagt ttgattagga acccagagat ccaggatcca caactaagag taaaaccagc aactcgatga cctcccgtcg acctcaatct gccgtttcat accaagttcg catgagatgg aagagttctt gaaaaacagg agcagcaaag cttcagggag aagtataact tctgtcctgt cctcttccgg gtcggtatga atgggcgagg ctagactgct ag <210> 278 <211> 213 <212> PRT

<213> Sorghum bicolor <400> 278<213> Sorghum bicolor <400> 278

Met Gly Lys Tyr Met Arg Lys Gly Lys Val Ser Glj 1 5 10Met Gly Lys Tyr Met Arg Lys Gly Lys Val Ser Glj 1 5 10

Met Glu Val Pro Gly Gly Ala Leu Leu Gly Val ArcMet Glu Val Pro Gly Gly Wing Read Leu Gly Val Arc

20 2520 25

Thr Leu Ala Leu Gln Arg Ala Gln Arg Pro Leu AsjThr Leu Wing Leu Gln Arg Wing Gln Arg Pro Leu Asj

35 4035 40

Glu Asp Ala Ala Ala Glu Tyr Leu Glu Leu Arg Se: 50 55 60Glu Asp Wing Wing Wing Glu Tyr Leu Glu Leu Arg Se: 50 55 60

Lys Pro His Lys Asp Pro Leu Pro Pro Pro Ser Ale 65 70 75Lys Pro His Lys Asp Pro Read Pro Pro Pro Ser Ale 65 70 75

Arg Gly Ala Gly Arg Lys Val Ala Thr Ala Ala AlcArg Gly Wing Gly Arg Lys Val Wing Thr Wing Wing Alc Wing

85 9085 90

Pro His Gly Leu Ala Glu Asp Asp Val Glu Val SeiPro His Gly Leu Wing Glu Asp Asp Val Glu Val Sei

105105

ggaggtcccc gcgcgcgcag gctcaggagc tgcgaccaag gcacgggctg cgccatggaa gataagcacc cagaatggaa ctcagcagct gaacgactgtggaggtcccc gcgcgcgcag gctcaggagc tgcgaccaag gcacgggctg cgccatggaa gataagcacc cagaatggaa ctcagcagct gaacgactgt

100 Val Leu Asp 115 Phe Asp Ala Cys Ser 130 Leu Ile Arg Asn Thr Lys Ser Lys Thr Ser 145 150 Thr Ser Ile Cys Arg 165 Phe Phe Ser Ala Ala 180 Glu Lys Asn Phe Cys 195 Pro Val Asn Ala Arg Leu Asp Cys100 Val Leu Asp 115 Phe Asp Wing Cys Ser 130 Leu Ile Arg Asn

120120

135135

140140

155155

170170

185185

200200

Glu Val Ala Val 15 Thr Arg Ser Arg 30 Lys Gly Asp Ala 45 Arg Arg Leu Glu Pro Ala Thr Lys 80 Ala Ala Ala Ala 95 Phe Gly Glu Asn 110 Glu Thr Thr Pro 125 Pro Gly Ser Thr Arg Arg Met Glu 160 Met Glu Glu Phe 175 Arg Glu Lys Tyr 190 Arg Tyr Glu Trp 205Glu Val Wing Val 15 Thr Arg Be Arg 30 Lys Gly Asp Wing 45 Arg Arg Leu Glu Pro Wing Thr Lys 80 Wing Wing Wing 95 Phe Gly Glu Asn 110 Glu Thr Thr Pro 125 Pro Gly Be Thr Arg Arg Glu Phe 175 Arg Glu Lys Tyr 190

210 <210> 279 <211> 397 <212> DNA210 <210> 279 <211> 397 <212> DNA

<213> Saccharum officinarum <220><213> Saccharum officinarum <220>

<221> misc_feature <222> (342) . . (343) <223> η is a, c, g, ou t <400> 279<221> misc_feature <222> (342). . (343) <223> η is a, c, g, or t <400> 279

gtcgacccac gcgtccggta cttcgctgct gaacagcgac gacaagtaca actttgatcc tgtaaatgac tgccctctcc aagctagact gattgattca gaggacaaga gagcagcagc ctccaccacc gcagtgttgt ggcagaggcg cataccgtcg taaaaactta gtgttagcct gtagccttaa ttgtcgtgtg tgagttacaa caccctgatc tgatctgatc cctcaactca attctgtaag gaaccttacc cacccttgtt accagttgtcgacccac gcgtccggta cttcgctgct gaacagcgac gacaagtaca actttgatcc tgtaaatgac tgccctctcc aagctagact gattgattca gaggacaaga gagcagcagc ctccaccacc gcagtgttgt ggcagaggcg cataccgtcg taaaaactta gtgttagcct gtagccttaa ttgtcgtgtg tgagttacaa caccctgatc tgatctgatc cctcaactca attctgtaag gaaccttacc cacccttgtt accagtt

60 120 180 240 300 360 420 480 540 600 64260 120 180 240 300 360 420 480 540 600 642

gccaacaaca ggctttcatt 60 caggcaggtt tgaatgggtg 120 atggaactca cctccgctcc 180 tgttagcttt gtttctgttg 240 ttacagtaca aaactgatgc 300 gnngtaaccc ttaacagctt 360 397 <210> 280 <211> 37 <212> PRTgccaacaaca ggctttcatt 60 caggcaggtt tgaatgggtg 120 atggaactca cctccgctcc 180 tgttagcttt gtttctgttg 240 ttacagtaca aaactgatgc 300 gnngtaaccc ttaacagctt 360 397 <210> 280 <211> <12> 37

<213> Saccharum officinarum <400> 280<213> Saccharum officinarum <400> 280

Tyr Phe Ala Ala Glu Gln Arg Arg Gln Gln Gln 15 10Tyr Phe Wing Glu Wing Gln Arg Arg Gln Gln Gln 15 10

Tyr Asn Phe Asp Pro Val Asn Asp Cys Pro LeuTyr Asn Phe Asp Pro Val Asn Asp Cys Pro Leu

20 2520 25

Trp Val Lys Leu Asp 35Trp Val Lys Leu Asp 35

<210> 281<210> 281

<211> 654<211> 654

<212> DNA<212> DNA

<213> Oryza sativa<213> Oryza sativa

<400> 281<400> 281

cttctacatc ggcttaggtg tagcaacacg actttattat ttattttaca aaaatataaa atagatcagt ccctcaccac ttattgtaaa gttctacaaa gctaatttaa aagttattgc aaacaagagt gtcaatggaa caatgaaaac catatgacat attgaaatta tataattcaa agagaataaa tccacatagc gcattaccaa aatatatata gcttacaaaa catgacaagc ccttatcaca ttgacacata aagtgagtga tgagtcataa atcatgtata tatgatagcc acaaagttac tttgatgatg gtgcacctaa cagaatatcc aaataatatg actcacttag aaaactaaca ctctaaagca accgatggga aagcatctat aatcctcatc atccttcacc acaattcaaa tattatagtt <210> 282 <211> 1243 <212> DNA <213> Oryza sativa <400> 282cttctacatc ggcttaggtg tagcaacacg actttattat ttattttaca aaaatataaa atagatcagt ccctcaccac ttattgtaaa gttctacaaa gctaatttaa aagttattgc aaacaagagt gtcaatggaa caatgaaaac catatgacat attgaaatta tataattcaa agagaataaa tccacatagc gcattaccaa aatatatata gcttacaaaa catgacaagc ccttatcaca ttgacacata aagtgagtga tgagtcataa atcatgtata tatgatagcc acaaagttac tttgatgatg gtgcacctaa cagaatatcc aaataatatg actcacttag aaaactaaca ctctaaagca accgatggga aagcatctat aatcctcatc atccttcacc acaattcaaa tattatagtt <210> 282 <211 > 1243 <212> DNA <213> Oryza sativa <400> 282

aaaaccaccg agggacctga tctgcaccgg ttttgatagt gttttccgat cgagggacga aaatcggatt cggtgtaaag ttattccgga gcatgattgg gaagggagga cataaggccc gtccagatct ccagatcact cagcaggatc ggccgcgttc ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc atagatagct actactctct ccgtttcaca atgtaaatca atattgatgt taatgaatat agacatatat atctatttag atgtaggaaa tgctagaatg acttacattg tgaattgtga tggatggatg caggatcatg aaagaattaa tgcaagatcg ttactaattg cgctgcatat atgcatgaca gcctgcatgc ccattaggaa gtaaccttgt cattacttat accagtacta tcatgagcaa atctacaaaa ctggaaagca ataagaaata cattaatcac caaatatttc gccttctcca gcagaatata tgtacacact gacagtgtac gcataaacgc agcagccagc gcacactggc cttccatctc aggctagctt tctcagccac gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccgactataa atacgtaggc atctgcttga tcttgtcatc aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg <210> 283 <211> 315 <212> DNAaaaaccaccg agggacctga tctgcaccgg ttttgatagt gttttccgat cgagggacga aaatcggatt cggtgtaaag ttattccgga gcatgattgg gaagggagga cataaggccc gtccagatct ccagatcact cagcaggatc ggccgcgttc ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc atagatagct actactctct ccgtttcaca atgtaaatca atattgatgt taatgaatat agacatatat atctatttag atgtaggaaa tgctagaatg acttacattg tgaattgtga tggatggatg caggatcatg aaagaattaa tgcaagatcg ttactaattg cgctgcatat atgcatgaca gcctgcatgc ccattaggaa gtaaccttgt cattacttat accagtacta tcatgagcaa atctacaaaa ctggaaagca ataagaaata cattaatcac caaatatttc gccttctcca gcagaatata tgtacacact gacagtgtac gcataaacgc agcagccagc gcacactggc cttccatctc aggctagctt tctcagccac gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccgactataa atacgtaggc atctgcttga tcttgtcatc aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg <210> 283 <211> 315 <212> DNA

<213> Nicotiana tabacum <400> 283<213> Nicotiana tabacum <400> 283

ctgccattct ttagagggga tgcttgttta agaacaaaaa ccaagtcatt gcgtattttt ttaaaaatat ttgttccttc actttatggt tctttgtatt ctggctttgc tgtaaatcgt gaaattatta atacttggga tattttttta gaatcaagta tcgagctgct tttaaattca tattacagcc atataggcttctgccattct ttagagggga tgcttgttta agaacaaaaa ccaagtcatt gcgtattttt ttaaaaatat ttgttccttc actttatggt tctttgtatt ctggctttgc tgtaaatcgt gagatcagtagtagtagtagtagta

Ala Phe Ile Asp Lys 15Phe Ile Wing Asp Lys 15

Pro Gly Arg Phe Glu 30Pro Gly Arg Phe Glu 30

tattattatt attattatta 60 aagtagagca agttggtgag 120 attaacttat ttcatattac . 180 actataattt tgtttttatt 240 cgtaaagttc tacatgtggt 300 ttagtttgaa aaattgcaat 360 tattattttc tttgctaccc 420 atatcaaaga acatttttag 480 atcataatag agcatcaagt 540 aaatagacaa gcacaatgaa 600 gaagcatagt agta 654tattattatt attattatta 60 aagtagagca agttggtgag 120 attaacttat ttcatattac. 180 actataattt tgtttttatt 240 cgtaaagttc tacatgtggt 300 ttagtttgaa aaattgcaat 360 tattattttc tttgctaccc 420 atatcaaaga acatttttag 480 atcataatag agcatcaagt 540 aaatagacaa gcacaatgaa 600 gaagcatagt agga 654

tgagggaccc gttgtgtctg 60 ttaagggacc tcagatgaac 120 atgtcgcatg tgtttggacg 180 gcgtagcacc cgcggtttga 240 gtagcttccg ccggaagcga 300 cttgcacgcg atacatcggg 360 ttctactatt ttccacattc 420 attcattaac atcaatatga 480 aatggacgaa gtacctacga 540 tatctgccgc atgcaaaatc 600 gggcgtgtaa gcgtgttcat 660 catactatat agtattgatt 720 cgggactgga aaagactcaa 780 tatctctcca tcttgatcac 840 ttaactgtcg tctcaccgtc 900 ccatcgtaca tgtcaactcg 960 aaatcaaaac caccggagaa 1020 gcacgcacgc acgcccaacc 1080 ccacccgcgc cctcacctcg 1140 catctcacca ccaaaaaaaa 1200 aca 1243tgagggaccc gttgtgtctg 60 ttaagggacc tcagatgaac 120 atgtcgcatg tgtttggacg 180 gcgtagcacc cgcggtttga 240 gtagcttccg ccggaagcga 300 cttgcacgcg atacatcggg 360 ttctactatt ttccacattc 420 attcattaac atcaatatga 480 aatggacgaa gtacctacga 540 tatctgccgc atgcaaaatc 600 gggcgtgtaa gcgtgttcat 660 catactatat agtattgatt 720 cgggactgga aaagactcaa 780 tatctctcca tcttgatcac 840 ttaactgtcg tctcaccgtc 900 ccatcgtaca tgtcaactcg 960 aaatcaaaac caccggagaa 1020 gcacgcacgc acgcccaacc 1080 ccacccgcgc cctcacctcg 1140 catctcacca ccaaaaaaaa 1200 aca 1243

atatatcact ttcttttgtt 60 gtatatttcg agcttcaatc 120 agctaacctt cttcctagca 180 aattacatat taccaccaca 240 gattcatttt gcaaaatttc 300 caggatattg acaac 315atatatcact ttcttttgtt 60 gtatatttcg agcttcaatc 120 agctaacctt cttcctagca 180 aattacatat taccaccaca 240 gattcatttt gcaaaatttc 300 caggatattg acaac 315

<210> 284 <211> 53 <212> DNA <213> Seqüência artificial <220> <223> iniciador: prm00472 <400> 284<210> 284 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer: prm00472 <400> 284

ggggacaagt ttgtacaaaa aagcaggctt cacaatgggc aagtacatgc gca 53ggggacaagt ttgtacaaaa aagcaggctt cacaatgggc aagtacatgc gca 53

<210> 285 <211> 53 <212> DNA <213> Seqüência artificial <220> <223> iniciador: prm00473 <400> 285<210> 285 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer: prm00473 <400> 285

ggggaccact ttgtacaaga aagctgggtg gagcagagag gtccatggtg ccc 53ggggaccact ttgtacaaga aagctgggtg gagcagagag gtccatggtg ccc 53

Claims (206)

1. Proteína SYR isolada selecionada a partir do grupo, caracterizada pelo fato de consistir de: (a) um polipeptídeo como dado em SEQ ID NO 44; (b) um polipeptídeo com uma seqüência de aminoácidos que tem pelo menos, em ordem crescente de preferência, 85%, 86%, 87%, 88%, - 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% ou mais de identidade de seqüência com uma seqüência de aminoácidos como dada em SEQ ID NO 44; (c) um derivado de um polipeptídeo como definido em (a) ou b) uma seqüência de ácido nucleico isolada compreendendo: (a) uma seqüência de ácidos nucleicos representada por SEQ ID NO: 43, ou a fita complementar desta; (b) uma seqüência de ácidos nucleicos codificando a seqüência de aminoácidos representada por SEQ ID NO: 44; (c) uma seqüência de ácidos nucleicos capaz de hibridizar (preferivelmente em condições estringentes) com uma seqüência de ácidos nucleicos de (a) ou (b), cuja seqüência hibridizante codifica preferivelmente uma proteína SYR; (d) um ácido nucleico que é uma variante alélica para as seqüências de ácidos nucleicos de acordo com (a) ou (b); (e) um ácido nucleico que é uma variante alternativa de união para as seqüências de ácidos nucleicos de acordo com (a) ou (b); (f) uma seqüência de ácidos nucleicos que tem 50%, 60%, - 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência com a seqüência definida em (a) ou (b).1. Isolated SYR protein selected from the group, characterized in that it consists of: (a) a polypeptide as given in SEQ ID NO 44; (b) a polypeptide with an amino acid sequence having at least, in ascending order of preference, 85%, 86%, 87%, 88%, - 89%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98% or 99% or more of sequence identity with an amino acid sequence as given in SEQ ID NO 44; (c) a derivative of a polypeptide as defined in (a) or b) an isolated nucleic acid sequence comprising: (a) a nucleic acid sequence represented by SEQ ID NO: 43, or the complementary ribbon thereof; (b) a nucleic acid sequence encoding the amino acid sequence represented by SEQ ID NO: 44; (c) a nucleic acid sequence capable of hybridizing (preferably under stringent conditions) to a nucleic acid sequence of (a) or (b), whose hybridizing sequence preferably encodes a SYR protein; (d) a nucleic acid which is an allelic variant for nucleic acid sequences according to (a) or (b); (e) a nucleic acid which is an alternative splice variant for nucleic acid sequences according to (a) or (b); (f) a nucleic acid sequence that has 50%, 60%, - 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% sequence identity with the sequence defined in (a) or (b). 2. Método para aumentar produção de semente e/ou aumentar taxa de crescimento de plantas em relação a correspondentes plantas do tipo selvagem, caracterizado pelo fato de compreender modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo SYR ou um homólogo do mesmo, e opcionalmente selecionar plantas tendo características de crescimento melhoradas; contanto que dita proteína SYR ou homólogo desta não seja a proteína de SEQ ID NO: 26.A method for increasing seed production and / or increasing plant growth rate over corresponding wild-type plants, which comprises modulating expression in a plant of a nucleic acid encoding a SYR polypeptide or homologue thereof; and optionally selecting plants having improved growth characteristics; provided that said SYR protein or homologue thereof is not the protein of SEQ ID NO: 26. 3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que dita expressão modulada é efetuada introduzindo uma modificação genética preferivelmente no local de um gene codificando um polipeptídeo SYR ou um homólogo do mesmo, preferivelmente em que dita modificação genética é efetuada por um de: ativação de T-DNA, TILLING, mutagênese direcionada por sítio, recombinação homóloga ou evolução direta.Method according to claim 2, characterized in that said modulated expression is effected by introducing a genetic modification preferably at the site of a gene encoding a SYR polypeptide or a homologue thereof, preferably wherein said genetic modification is effected by a gene. de: T-DNA activation, TILLING, site-directed mutagenesis, homologous recombination or direct evolution. 4. Método para aumentar produção de semente e/ou aumentar taxa de crescimento em relação a correspondentes plantas do tipo selvagem, caracterizado pelo fato de compreender introduzir e expressar em uma planta um ácido nucleico SYR ou uma variante do mesmo; contanto que dita proteína SYR ou homólogo desta não seja a proteína de SEQ ID NO: 26.Method for increasing seed production and / or increasing growth rate relative to corresponding wild-type plants, comprising introducing and expressing into a plant a SYR nucleic acid or variant thereof; provided that said SYR protein or homologue thereof is not the protein of SEQ ID NO: 26. 5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que dito ácido nucleico codifica um homólogo da proteína SYR de SEQ ID NO: 2, preferivelmente dito ácido nucleico codifica um ortólogo ou parálogo da proteína SYR de SEQ ID NO: 2.A method according to claim 4, characterized in that said nucleic acid encodes a SYR protein homolog of SEQ ID NO: 2, preferably said nucleic acid encodes a SYR protein ortholog or analog of SEQ ID NO: 2. 6. Método de acordo com a reivindicação 4, caracterizado pelo fato de que dita variante é uma porção de um ácido nucleico SYR ou uma seqüência capaz de hibridizar com um ácido nucleico SYR, cuja porção ou seqüência hibridizante codifica um polipeptídeo de cerca de 65 a cerca de 200 aminoácidos, compreendendo um domínio rico em leucina, precedido pelo motivo conservado de tripeptídeo 1 (um de SEQ ID NO: 6, 7, 8 ou 9) e seguido pelo motivo conservado 2 (SEQ ID NO: 10) e preferivelmente também pelo motivo conservado 3 (SEQ ED NO: 11).The method of claim 4, wherein said variant is a portion of a SYR nucleic acid or sequence capable of hybridizing to a SYR nucleic acid, whose hybridizing portion or sequence encodes a polypeptide of about 65 to about 200 amino acids, comprising a leucine-rich domain, preceded by the conserved tripeptide motif 1 (one of SEQ ID NO: 6, 7, 8 or 9) and followed by the conserved motif 2 (SEQ ID NO: 10) and preferably also for retained reason 3 (SEQ ED NO: 11). 7. Método de acordo com qualquer uma das reivindicações 4 a -6, caracterizado pelo fato de que dito ácido nucleico compreende os motivos conservados de SEQ ID NO: 6, SEQ ID NO: 10 e SEQ ID NO: 11, em que o motivo de SEQ ID NO: 10 é VLAFMPT e em que o motivo de SEQ ID NO: -11 é PYL, preferivelmente em que dito ácido nucleico compreende a seqüência de SEQ ED NO: 1.A method according to any one of claims 4 to -6, characterized in that said nucleic acid comprises the conserved motifs of SEQ ID NO: 6, SEQ ID NO: 10 and SEQ ID NO: 11, wherein the motif of SEQ ID NO: 10 is VLAFMPT and wherein the motif of SEQ ID NO: -11 is PYL, preferably wherein said nucleic acid comprises the sequence of SEQ ED NO: 1. 8. Método de acordo com qualquer uma das reivindicações 4 a -7, caracterizado pelo fato de que dito ácido nucleico SYR ou variante do mesmo é superexpressado em uma planta.Method according to any one of claims 4 to 7, characterized in that said SYR nucleic acid or variant thereof is overexpressed in a plant. 9. Método de acordo com qualquer uma das reivindicações 4 a -8, caracterizado pelo fato de que dito ácido nucleico SYR ou variante do mesmo é de origem vegetal, preferivelmente de uma planta monocotiledônea, mais preferivelmente da família Poaceae, o mais preferivelmente o ácido nucleico é de Oryza sativa.Method according to any one of claims 4 to 8, characterized in that said SYR nucleic acid or variant thereof is of plant origin, preferably from a monocotyledonous plant, more preferably from the Poaceae family, most preferably acid. nucleic acid is from Oryza sativa. 10. Método de acordo com qualquer uma das reivindicações 4 a 9, caracterizado pelo fato de que dito ácido nucleico SYR ou variante do mesmo é operavelmente ligado a um promotor constitutivo, preferivelmente em que dito promotor constitutivo é um promotor GOS2 ou um promotor de proteína de alta mobilidade.A method according to any one of claims 4 to 9, characterized in that said SYR nucleic acid or variant thereof is operably linked to a constitutive promoter, preferably wherein said constitutive promoter is a GOS2 promoter or a protein promoter. high mobility. 11. Método de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que dita produção aumentada de sementes é selecionada a partir de: peso total aumentado de sementes, número aumentado de sementes cheias, taxa de enchimento de sementes ou índice de colheita aumentado, e em que dita taxa de crescimento aumentada compreende pelo menos produção aumentada de sementes obtida sem atraso em época de florescimento.A method according to any one of claims 1 to 10, characterized in that said increased seed yield is selected from: increased total seed weight, increased number of full seeds, seed filling rate or seed index. harvesting, and wherein said increased growth rate comprises at least increased seed production obtained without delay in flowering season. 12. Método de acordo com qualquer uma das reivindicações 1 ali, caracterizado pelo fato de que ditas plantas são crescidas em condições sem estresse, ou em que ditas plantas são crescidas em condições de estresse abiótico, preferivelmente em que ditas condições de estresse abiótico são condições de estresse osmótico.A method according to any one of claims 1 to 13, wherein said plants are grown under stress free conditions, or wherein said plants are grown under abiotic stress conditions, preferably wherein said abiotic stress conditions are conditions. of osmotic stress. 13. Célula vegetal, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações 1 a 12.Plant cell, characterized in that it is obtainable by a method as defined in any one of claims 1 to 12. 14. Construção, caracterizada pelo fato de compreender: (i) um ácido nucleico SYR ou uma variante do mesmo; (ii) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i); preferivelmente em que dita seqüência de controle é um promotor constitutivo ou um promotor de Proteína de Grupo de Alta Mobilidade (HMGP), e opcionalmente (iii) uma seqüência de término de transcrição, contanto que dito ácido nucleico SYR não codifique a proteína de SEQ ID NO: 26.Construction, characterized in that it comprises: (i) a nucleic acid SYR or a variant thereof; (ii) one or more control sequences capable of directing expression of the nucleic acid sequence of (i); preferably wherein said control sequence is a constitutive promoter or a High Mobility Group Protein (HMGP) promoter, and optionally (iii) a transcription termination sequence as long as said SYR nucleic acid does not encode the protein of SEQ ID NO: 26. 15. Célula vegetal, caracterizada pelo fato de ser transformada com uma construção como definida na reivindicação 14.Plant cell, characterized in that it is transformed with a construct as defined in claim 14. 16. Método para produzir uma planta transgênica tendo produção aumentada comparada com correspondentes plantas do tipo selvagem, caracterizado pelo fato de compreender: (i). introduzir e expressar em uma planta ou célula vegetal um ácido nucleico SYR ou variante do mesmo; e (ii). cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal, com a condição de que dito ácido nucleico SYR ou variante do mesmo não codifique a proteína de SEQ ID NO: 26.Method for producing a transgenic plant having increased yield compared to corresponding wild type plants, characterized in that it comprises: (i). introducing and expressing into a plant or plant cell a SYR nucleic acid or variant thereof; and (ii). cultivating the plant cell under conditions promoting plant growth and development, provided that said SYR nucleic acid or variant thereof does not encode the protein of SEQ ID NO: 26. 17. Método para melhorar características de crescimento de plantas em relação a plantas de controle, caracterizado pelo fato de compreender aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo FG-GAP ou um homólogo do mesmo, e opcionalmente selecionar plantas tendo características de crescimento melhoradas.A method for improving plant growth characteristics over control plants, comprising increasing expression in a plant of a nucleic acid encoding an FG-GAP polypeptide or homologue thereof, and optionally selecting plants having characteristics of improved growth. 18. Método de acordo com a reivindicação 17, caracterizado pelo fato de que dita expressão aumentada é efetuada introduzindo uma modificação genética preferivelmente no local de um gene codificando um polipeptídeo FG-GAP ou um homólogo do mesmo, preferivelmente em que dita modificação genética é efetuada por um de: ativação de T-DNA, TILLING, mutagênese direcionada por sítio, recombinação homóloga ou evolução direta.The method according to claim 17, characterized in that said increased expression is effected by introducing a genetic modification preferably at the site of a gene encoding an FG-GAP polypeptide or a homologue thereof, preferably wherein said genetic modification is effected. by one of: T-DNA activation, TILLING, site-directed mutagenesis, homologous recombination or direct evolution. 19. Método para melhorar características de crescimento em relação a correspondentes plantas do tipo selvagem, caracterizado pelo fato de compreender introduzir e expressar em uma planta um ácido nucleico FG- GAP ou uma variante do mesmo.A method for enhancing growth characteristics over corresponding wild-type plants, which comprises introducing and expressing a FG-GAP nucleic acid or variant thereof into a plant. 20. Método de acordo com a reivindicação 19, caracterizado pelo fato de que dito ácido nucleico codifica um homólogo da proteína FG- GAP de SEQ ID NO: 46, preferivelmente dito ácido nucleico codifica um ortólogo ou parálogo da proteína FG-GAP de SEQ ID NO: 46, preferivelmente em que dito ácido nucleico compreende um ou mais dos motivos conservados de SEQ ID NO: 50 a 52.Method according to claim 19, characterized in that said nucleic acid encodes an FG-GAP protein homolog of SEQ ID NO: 46, preferably said nucleic acid encodes an FG-GAP protein ortholog or analog of SEQ ID NO: 46, preferably wherein said nucleic acid comprises one or more of the conserved motifs of SEQ ID NO: 50 to 52. 21. Método de acordo com a reivindicação 19, caracterizado pelo fato de que dita variante é uma porção de um ácido nucleico FG-GAP ou uma seqüência capaz de hibridizar com um ácido nucleico FG-GAP, cuja porção ou seqüência hibridizante codifica um polipeptídeo compreendendo um peptídeo sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C-terminal da proteína.A method according to claim 19, wherein said variant is a portion of an FG-GAP nucleic acid or sequence capable of hybridizing to an FG-GAP nucleic acid, whose hybridizing portion or sequence encodes a polypeptide comprising a signal peptide, one or more FG-GAP domains, and a transmembrane domain located at the C-terminal half of the protein. 22. Método de acordo com qualquer uma das reivindicações -21 a 25, caracterizado pelo fato de que dita característica de crescimento melhorada é produção aumentada, preferivelmente produção aumentada de sementes, preferivelmente em que dita produção aumentada de sementes é selecionada a partir de: peso total aumentado de sementes, número aumentado de sementes cheias ou índice de colheita aumentado.A method according to any one of claims -21 to 25, characterized in that said improved growth characteristic is increased yield, preferably increased seed yield, preferably wherein said increased seed yield is selected from: weight. increased total seed, increased number of full seeds or increased harvest index. 23. Célula vegetal, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações 17 a 22.Plant cell, characterized in that it is obtainable by a method as defined in any one of claims 17 to 22. 24. Construção, caracterizada pelo fato de compreender: (i) um ácido nucleico FG-GAP ou uma variante do mesmo; (ii) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i), preferivelmente em que dita seqüência de controle é um promotor constitutivo, preferivelmente um promotor constitutivo é um promotor GOS2; e opcionalmente (iii) uma seqüência de término de transcrição, contanto que dita construção não seja uma construção de gene tipo pPZP.24. Construction, characterized in that it comprises: (i) an FG-GAP nucleic acid or variant thereof; (ii) one or more control sequences capable of directing expression of the nucleic acid sequence of (i), preferably wherein said control sequence is a constitutive promoter, preferably a constitutive promoter is a GOS2 promoter; and optionally (iii) a transcription termination sequence as long as said construct is not a pPZP-like gene construct. 25. Célula vegetal, caracterizada pelo fato de ser transformada com uma construção como definida na reivindicação 24.Plant cell, characterized in that it is transformed with a construct as defined in claim 24. 26. Método para produzir uma planta transgênica tendo produção aumentada comparada com correspondentes plantas do tipo selvagem, caracterizado pelo fato de compreender: (a) introduzir e expressar em a planta ou célula vegetal um ácido nucleico FG-GAP ou variante do mesmo; (b) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.A method for producing a transgenic plant having increased production compared to corresponding wild-type plants, comprising: (a) introducing and expressing into the plant or plant cell an FG-GAP nucleic acid or variant thereof; (b) cultivate the plant cell under conditions promoting plant growth and development. 27. Proteína FG-GAP isolada, caracterizada pelo fato de ser selecionada a partir do grupo consistindo de: (a) uma proteína codificada pelo ácido nucleico de SEQ ID NO: 72; (b) uma proteína compreendendo uma seqüência sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C-terminal da proteína, em que dita proteína compreende pelo menos um de SEQ ID NO: 73 a SEQ ID NO: 76; (c) um fragmento ativo de uma seqüência de aminoácidos como definido em (a) ou (b), cujo fragmento ativo compreende uma seqüência sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C-terminal da proteína, ou um ácido nucleico isolado codificando uma proteína FG- GAP, selecionado a partir do grupo consistindo de: (i) o ácido nucleico como representado em SEQ ID NO: 72; (ii) um ácido nucleico codificando uma proteína como definido em (a) a (c) acima; (iii) uma seqüência de ácidos nucleicos capaz de hibridizar (preferivelmente em condições estringentes) com uma seqüência de ácidos nucleicos de (i) ou (ii) acima, cuja seqüência hibridizante preferivelmente codifica uma proteína compreendendo um peptídeo sinal, um ou mais domínios FG-GAP e um domínio de transmembrana localizado na metade C- terminal da proteína; (iv) um ácido nucleico que é uma variante alélica para as seqüências de ácidos nucleicos de acordo com (i) a (iii); (v) um ácido nucleico que é uma variante alternativa de união para as seqüências de ácidos nucleicos de acordo com (i) a (iii); (vi) uma porção de uma seqüência de ácidos nucleicos de acordo com qualquer um de (i) a (v) acima, cuja porção preferivelmente codifica uma proteína compreendendo um peptídeo sinal, um ou mais domínios FG-GAP e um domínio transmembrana localizado na metade C- terminal da proteína.27. Isolated FG-GAP protein, characterized in that it is selected from the group consisting of: (a) a protein encoded by nucleic acid of SEQ ID NO: 72; (b) a protein comprising a signal sequence, one or more FG-GAP domains, and a transmembrane domain located at the C-terminal half of the protein, wherein said protein comprises at least one of SEQ ID NO: 73 to SEQ ID NO: 76 ; (c) an active fragment of an amino acid sequence as defined in (a) or (b), whose active fragment comprises a signal sequence, one or more FG-GAP domains, and a transmembrane domain located at the C-terminal half of the protein; or an isolated nucleic acid encoding an FG-GAP protein selected from the group consisting of: (i) the nucleic acid as represented by SEQ ID NO: 72; (ii) a nucleic acid encoding a protein as defined in (a) to (c) above; (iii) a nucleic acid sequence capable of hybridizing (preferably under stringent conditions) to a nucleic acid sequence of (i) or (ii) above, whose hybridizing sequence preferably encodes a protein comprising a signal peptide, one or more FG domains -GAP is a transmembrane domain located at the C-terminal half of the protein; (iv) a nucleic acid which is an allelic variant for nucleic acid sequences according to (i) to (iii); (v) a nucleic acid which is an alternative splice variant for nucleic acid sequences according to (i) to (iii); (vi) a portion of a nucleic acid sequence according to any one of (i) to (v) above, which portion preferably encodes a protein comprising a signal peptide, one or more FG-GAP domains, and a transmembrane domain located at the C-terminal half of the protein. 28. Proteína CYP90B isolada, caracterizada pelo fato de ser selecionada a partir do grupo consistindo de: (i) uma proteína codificada pelo ácido nucleico de SEQ ID NO: 117; (ii) uma proteína compreendendo o seguinte: (i) domínios CYP AaD; (ii) um domínio âncora hidrofóbico N-terminal; (iii) um domínio de transição; e (iv) dentro do domínio A, a seqüência consenso Phe-Ala-Gly- His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, e tendo em ordem crescente de preferência pelo menos 85%, 86%, -87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade com a seqüência de aminoácidos de SEQ ID NO: 118, ou um ácido nucleico isolado codificando uma proteína CYP90B, selecionado a partir do grupo consistindo de: (i) um ácido nucleico como representado por SEQ ID NO: 117; (ii) um ácido nucleico codificando uma proteína como definido em (i) e (ii) acima; (iii) um ácido nucleico tendo em ordem crescente de preferência pelo menos 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, -91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade com o ácido nucleico representado por SEQ ID NO: 117; (iv) uma seqüência de ácidos nucleicos capaz de hibridizar em condições estringentes com uma seqüência de ácidos nucleicos de (i) a (iii) acima, cuja seqüência hibridizante codifica uma proteína compreendendo (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe- Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, e tendo em ordem crescente de preferência pelo menos -85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, -98%, 99% ou mais de identidade com a seqüência de aminoácidos de SEQ ID NO: 118; (v) um ácido nucleico que é uma variante alélica ou uma variante de união das seqüências de ácidos nucleicos de acordo com (i) a (iv); (vi) uma porção de uma seqüência de ácidos nucleicos de acordo com qualquer uma de (i) a (v) acima, cuja porção codifica uma proteína compreendendo: (i) domínios CYP AaD; (ii) um domínio âncora hidrofóbico N-terminal; (iii) um domínio de transição; e (iv) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, e tendo em ordem crescente de preferência pelo menos 85%, 86%, 87%, 88%, 89%, 90%, -91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade com a seqüência de aminoácidos de SEQ ID NO: 118.28. Isolated CYP90B protein, characterized in that it is selected from the group consisting of: (i) a protein encoded by nucleic acid of SEQ ID NO: 117; (ii) a protein comprising the following: (i) CYP AaD domains; (ii) an N-terminal hydrophobic anchor domain; (iii) a transition domain; and (iv) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, and in ascending order of preference at least 85%. %, -87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identity with the SEQ amino acid sequence ID NO: 118, or an isolated nucleic acid encoding a CYP90B protein, selected from the group consisting of: (i) a nucleic acid as represented by SEQ ID NO: 117; (ii) a nucleic acid encoding a protein as defined in (i) and (ii) above; (iii) a nucleic acid having in ascending order preferably at least 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, -91%, 92%, 93% 94%, 95%, 96%, 97%, 98%, 99% or more nucleic acid identity represented by SEQ ID NO: 117; (iv) a nucleic acid sequence capable of hybridizing under stringent conditions to a nucleic acid sequence of (i) to (iii) above, whose hybridizing sequence encodes a protein comprising (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, and preferably increasing by at least -85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, -98%, 99% or more of sequence identity amino acids of SEQ ID NO: 118; (v) a nucleic acid which is an allelic variant or a splice variant of nucleic acid sequences according to (i) to (iv); (vi) a portion of a nucleic acid sequence according to any one of (i) to (v) above, whose portion encodes a protein comprising: (i) CYP AaD domains; (ii) an N-terminal hydrophobic anchor domain; (iii) a transition domain; and (iv) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, and preferably ascending at least 85%. %, 87%, 88%, 89%, 90%, -91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identity with the SEQ amino acid sequence ID NO: 118. 29. Método para aumentar produção vegetal em relação a plantas de controle adequadas, caracterizado pelo fato de compreender aumentar expressão não constitutiva em uma planta de um ácido nucleico codificando ácido nucleico codificando uma monooxigenase CYP90B de citocromo P450 (CYP) ou um homólogo do mesmo, e opcionalmente selecionar plantas tendo produção aumentada, em que dito polipeptídeo CYP90B ou homólogo compreende o seguinte: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr- Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição.29. A method for increasing plant yield over suitable control plants, which comprises increasing non-constitutive expression in a plant of a nucleic acid encoding a cytochrome P450 (CYP) monooxygenase (CYP) or a homologue thereof, and optionally selecting plants having increased yield, wherein said CYP90B or homologous polypeptide comprises the following: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, allowing an amino acid change at any position. 30. Método de acordo com a reivindicação 29, caracterizado pelo fato de que dito polipeptídeo CYP90B ou homólogo do mesmo compreende adicionalmente: (i) uma seqüência com mais do que 50% de identidade com SEQ ID NO: 78; e (ii) atividade enzimática de 22-alfa hidroxilase esteróide.A method according to claim 29, characterized in that said CYP90B polypeptide or homologue thereof further comprises: (i) a sequence with more than 50% identity to SEQ ID NO: 78; and (ii) enzymatic activity of steroid 22-alpha hydroxylase. 31. Método de acordo com a reivindicação 29 ou 30, caracterizado pelo fato de que dita expressão não constitutiva aumentada é efetuada introduzindo uma modificação genética preferivelmente no local de um gene codificando um polipeptídeo CYP90B ou um homólogo do mesmo, preferivelmente em que dita modificação genética é efetuada por um de: ativação de T-DNA, TILLING, mutagênese direcionada por sítio ou evolução direta.Method according to claim 29 or 30, characterized in that said increased non-constitutive expression is effected by introducing a genetic modification preferably at the site of a gene encoding a CYP90B polypeptide or a homologue thereof, preferably wherein said genetic modification. is performed by one of: T-DNA activation, TILLING, site-directed mutagenesis, or direct evolution. 32. Método para aumentar produção vegetal em relação a plantas de controle adequadas, caracterizado pelo fato de compreender introduzir e expressar não constitutivamente em uma planta um ácido nucleico CYP90B ou uma variante do mesmo, preferivelmente em que dita variante é uma porção de um ácido nucleico CYP90B, cuja porção codifica um polipeptídeo compreendendo: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, ou preferivelmente em que dita variante é uma seqüência capaz de hibridizar com um ácido nucleico CYP90B, cuja seqüência hibridizante codifica um polipeptídeo compreendendo: (a) domínios CYP AaD; (b) um domínio âncora hidrofóbico N-terminal; (c) um domínio de transição; e (d) dentro do domínio A, a seqüência consenso Phe-Ala-Gly-His-Glu-Thr-Ser-Ser, admitindo uma mudança de aminoácido em qualquer posição, ou preferivelmente em que dita variante codifica um ortólogo ou parálogo da proteína CYP90B de SEQ ID NO: 78.32. A method of increasing plant yield over suitable control plants, which comprises introducing and non-constitutively expressing in a plant a nucleic acid CYP90B or variant thereof, preferably wherein said variant is a portion of a nucleic acid. CYP90B, the portion of which encodes a polypeptide comprising: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, or preferably wherein said variant is a sequence capable of hybridizing to a CYP90B nucleic acid whose hybridizing sequence encodes a polypeptide comprising: (a) CYP AaD domains; (b) an N-terminal hydrophobic anchor domain; (c) a transitional domain; and (d) within domain A, the Phe-Ala-Gly-His-Glu-Thr-Ser-Ser consensus sequence, assuming an amino acid change at any position, or preferably wherein said variant encodes a protein ortholog or paralog CYP90B of SEQ ID NO: 78. 33. Método de acordo com a reivindicação 32, caracterizado pelo fato de que dito ácido nucleico CYP90B ou variante do mesmo é de origem vegetal, preferivelmente de uma planta monocotiledônea, ainda preferivelmente da família Poaceae, mais preferivelmente do gênero Oryza, o mais preferivelmente de Oryza sativa.A method according to claim 32, characterized in that said CYP90B nucleic acid or variant thereof is of plant origin, preferably from a monocotyledonous plant, still preferably from the Poaceae family, more preferably from the genus Oryza, most preferably from Oryza sativa. 34. Método de acordo com qualquer uma das reivindicações -31 a 33, caracterizado pelo fato de que dito ácido nucleico CYP90B ou variante do mesmo é operavelmente ligado a um promotor não constitutivo, preferivelmente em que dito promotor não constitutivo é um promotor específico de semente, preferivelmente dito promotor específico de semente é um promotor específico de endosperma, ainda preferivelmente o promotor específico de endosperma é um promotor de prolamina, preferivelmente em que dito promotor específico de endosperma é um promotor de prolamina RP6 de arroz, mais preferivelmente o promotor específico de endosperma é representado por uma seqüência de ácidos nucleicos substancialmente similar a SEQ ID NO: 109, o mais preferivelmente o promotor específico de endosperma é como representado por SEQ ID NO: 109, ou em que dito promotor não constitutivo é um promotor específico de semente, preferivelmente dito promotor específico de semente é um promotor específico de embrião/aleurona, ainda preferivelmente o promotor específico de embrião/aleurona é um promotor de oleosina, preferivelmente em que dito promotor específico de embrião/aleurona é um promotor de 18 kDa de oleosina de arroz, mais preferivelmente o promotor específico de embrião/aleurona é representado por uma seqüência de ácidos nucleicos substancialmente similar a SEQ ID NO: 110, o mais preferivelmente o promotor específico de embrião/aleurona é como representado por SEQ ID NO: 110.A method according to any one of claims 31 to 33, characterized in that said CYP90B nucleic acid or variant thereof is operably linked to a non-constitutive promoter, preferably wherein said non-constitutive promoter is a seed specific promoter. preferably said seed specific promoter is an endosperm specific promoter, still preferably the endosperm specific promoter is a prolamine promoter, preferably wherein said endosperm specific promoter is a rice RP6 prolamine promoter, more preferably the rice promoter specific promoter. endosperm is represented by a nucleic acid sequence substantially similar to SEQ ID NO: 109, most preferably the endosperm specific promoter is as represented by SEQ ID NO: 109, or wherein said non-constitutive promoter is a seed specific promoter, preferably said seed specific promoter is a promo embryo / aleurone specific promoter, still preferably the embryo / aleurone specific promoter is an oleosin promoter, preferably wherein said embryo / aleurone specific promoter is an 18 kDa rice oleosin promoter, more preferably the embryo specific promoter. / aleurone is represented by a nucleic acid sequence substantially similar to SEQ ID NO: 110, most preferably the embryo / aleurone specific promoter is as represented by SEQ ID NO: 110. 35. Método de acordo com qualquer uma das reivindicações -29 a 34, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou ambos de: produção total de sementes aumentada ou índice de colheita aumentado (HI), cada em relação a plantas de controle adequadas.A method according to any one of claims -29 to 34, characterized in that said increased yield is selected from one or both of: increased total seed yield or increased harvest index (HI) each with respect to each other. to appropriate control plants. 36. Método de acordo com qualquer uma das reivindicações -29 a 34, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou mais de: peso de mil sementes aumentado (TKW), área de semente aumentada ou comprimento de semente aumentado, cada em relação a plantas de controle adequadas.A method according to any one of claims -29 to 34, characterized in that said increased yield is selected from one or more of: increased thousand seed weight (TKW), increased seed area or seed length each in relation to appropriate control plants. 37. Método de acordo com qualquer uma das reivindicações -29 a 36, caracterizado pelo fato de que dita planta é uma planta monocotiledônea.A method according to any one of claims -29 to 36, characterized in that said plant is a monocotyledonous plant. 38. Célula vegetal, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações 29 a 37.Plant cell, characterized in that it is obtainable by a method as defined in any one of claims 29 to 37. 39. Célula vegetal, caracterizada pelo fato de ser transformada com uma construção compreendendo um ácido nucleico CYP90B ou variante do mesmo sob o controle de um promotor de prolamina RP6.39. Plant cell, characterized in that it is transformed with a construct comprising a CYP90B nucleic acid or variant thereof under the control of a RP6 prolamine promoter. 40. Método para produzir uma planta transgênica tendo produção aumentada em relação à planta de controle adequada, caracterizado pelo fato de compreender: (a) introduzir e expressar não constitutivamente em uma planta ou célula vegetal um ácido nucleico CYP90B ou variante do mesmo; (b) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal. -97. Planta transgênica, caracterizada pelo fato de ter produção aumentada em relação à planta de controle adequada, dito produção aumentada resultando de um ácido nucleico CYP90B ou uma variante do mesmo introduzido e expresso não constitutivamente em dita planta.40. A method of producing a transgenic plant having an increased yield over the appropriate control plant, comprising: (a) introducing and non-constitutively introducing into a plant or plant cell a CYP90B nucleic acid or variant thereof; (b) cultivate the plant cell under conditions promoting plant growth and development. -97. Transgenic plant, characterized in that it has increased yield over the appropriate control plant, said increased yield resulting from a nucleic acid CYP90B or a variant thereof introduced and expressed non-constitutively in said plant. 41. Método para aumentar número de sementes em plantas em relação a plantas de controle adequadas, caracterizado pelo fato de compreender aumentar preferivelmente expressão no tecido de meristema apical de broto de uma planta de um ácido nucleico codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, e opcionalmente selecionar plantas tendo número de sementes aumentado.41. A method of increasing plant seed count relative to suitable control plants, which comprises preferably increasing expression in the bud apical meristem tissue of a plant of a nucleic acid encoding a CDC27 polypeptide having at least one TPR domain. inactive in the NH2 terminal region of the polypeptide, and optionally select plants having increased seed numbers. 42. Método de acordo com a reivindicação 41, caracterizado pelo fato de que dita expressão aumentada é efetuada introduzindo uma modificação genética preferivelmente no local de um gene codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, preferivelmente em que dita modificação genética efetuada é mutagênese direcionada por sítio ou evolução direta.Method according to claim 41, characterized in that said increased expression is effected by introducing a genetic modification preferably at the site of a gene encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide, preferably at that said genetic modification effected is site-directed mutagenesis or direct evolution. 43. Método para aumentar número de sementes em plantas em relação a plantas de controle adequadas, caracterizado pelo fato de compreender introduzir e expressar preferencialmente no tecido de meristema apical de broto de uma planta um ácido nucleico codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, e/ou em que dito ácido nucleico introduzido é uma variante de união ou uma variante alélica de um ácido nucleico representado por SEQ ID NO: 129 ou SEQ ID NO: 131, cuja variante de união ou variante alélica codifica um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, e/ou em que dito ácido nucleico introduzido é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 129 ou SEQ ID NO: 131 ou com uma variante de união ou variante alélica como definida na reivindicação 110, em que dita seqüência hibridizante codifica um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, e/ou em que dito ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo codifica um ortólogo ou parálogo de um polipeptídeo CDC27 representado por SEQ ID NO: 130 ou SEQ ID NO: 132.43. A method for increasing the number of seeds in plants relative to suitable control plants, which comprises introducing and preferentially introducing into the bud apical meristem tissue of a plant a nucleic acid encoding a CDC27 polypeptide having at least one TPR domain. inactive in the NH2 terminal region of the polypeptide, and / or wherein said introduced nucleic acid is a splice variant or an allelic variant of a nucleic acid represented by SEQ ID NO: 129 or SEQ ID NO: 131, whose splice variant or variant allelic encodes a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide, and / or wherein said introduced nucleic acid is capable of hybridizing to a nucleic acid as represented by SEQ ID NO: 129 or SEQ ID NO: 131 or with a binding variant or allelic variant as defined in claim 110, wherein said hybridizing sequence encodes a polypep CDC27 peptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide, and / or wherein said CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the polypeptide NH2 terminal region encoding an ortholog or paralog of a polypeptide CDC27 represented by SEQ ID NO: 130 or SEQ ID NO: 132. 44. Método de acordo com qualquer uma das reivindicações -41 a 43, caracterizado pelo fato de que dito ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo, ou o próprio polipeptídeo, é de origem vegetal, preferivelmente de uma planta dicotiledônea, preferivelmente da família Brassicaceae, ainda preferivelmente de Arabidopsis thaliana.Method according to any one of claims -41 to 43, characterized in that said CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide, or the polypeptide itself, is of origin vegetable, preferably from a dicotyledonous plant, preferably from the Brassicaceae family, still preferably from Arabidopsis thaliana. 45. Método de acordo com qualquer uma das reivindicações -41 a 44, caracterizado pelo fato de que dito ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo é operavelmente ligado a um promotor de meristema apical de broto, preferivelmente a um promotor de meristema apical de broto precoce, preferivelmente em que dito promotor de meristema apical de broto é um promotor OSHl.A method according to any one of claims -41 to 44, characterized in that said CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the terminal NH2 region of the polypeptide is operably linked to an apical meristem promoter. preferably a bud early apical meristem promoter, preferably wherein said bud apical meristem promoter is an OSH1 promoter. 46. Célula vegetal, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações 41 a 45.Plant cell, characterized in that it is obtainable by a method as defined in any one of claims 41 to 45. 47. Célula vegetal transformada com uma construção, caracterizada pelo fato de compreender: (i) um ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo; e (ii) uma ou mais seqüências de controle capazes de aumentar preferencialmente expressão da seqüência de ácidos nucleicos de (i) em tecido de meristema apical de broto de uma planta, preferivelmente em que dita seqüência de controle é um promotor OSHl; e opcionalmente (iii) uma seqüência de término de transcrição47. A plant cell transformed with a construct comprising: (i) a CDC27 nucleic acid encoding a CDC27 polypeptide having at least one inactive TPR domain in the NH2 terminal region of the polypeptide; and (ii) one or more control sequences capable of preferentially enhancing expression of the nucleic acid sequence of (i) in plant apical meristem tissue of a plant, preferably wherein said control sequence is an OSH1 promoter; and optionally (iii) a transcription termination sequence 48. Método para produzir uma planta transgênica tendo número de sementes aumentado em relação a plantas de controle adequadas, caracterizado pelo fato de compreender: (a) introduzir e expressar em uma planta um ácido nucleico CDC27 codificando um polipeptídeo CDC27 tendo pelo menos um domínio TPR inativo na região NH2 terminal do polipeptídeo operavelmente ligado a um promotor meristema apical de broto específico; e (b) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.48. A method of producing a transgenic plant having an increased seed number relative to appropriate control plants, comprising: (a) introducing and expressing into a plant a CDC27 nucleic acid encoding a CDC27 polypeptide having at least one TPR domain inactive at the NH2 terminal region of the polypeptide operably linked to a specific bud apical meristem promoter; and (b) cultivate the plant cell under conditions promoting plant growth and development. 49. Método para aumentar produção de semente em uma planta monocotiledônea em relação à produção de sementes de plantas de controle adequadas, caracterizado pelo fato de compreender aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, preferivelmente em que dito polipeptídeo compreende adicionalmente um dos seguintes motivos: Motivo 1: QGQ V/I GG; ou Motivo 2: ILSLSGSFLPPPAPP; ou Motivo 3: NATYERLP; ou Motivo 4: SFTNVAYERLPL com nenhuma ou uma mudança de aminoácido em qualquer posição; ou Motivo 5: GRFEILSLTGSFLPGPAPPGSTGLTI YLAGGQGQVVGGSVVG com nenhuma, uma ou duas mudança de aminoácido em qualquer posição.49. A method for increasing seed production in a monocotyledonous plant over the production of suitable control plant seeds, characterized in that it preferably comprises increasing endosperm tissue expression of a monocotyledonous plant encoding a polypeptide domain comprising a domain. AT-hook is a DUF296 domain, preferably wherein said polypeptide further comprises one of the following reasons: Reason 1: QGQ V / I GG; or Reason 2: ILSLSGSFLPPPAPP; or Reason 3: NATYERLP; or Reason 4: SFTNVAYERLPL with none or an amino acid change at any position; or Reason 5: GRFEILSLTGSFLPGPAPPGSTGLTI YLAGGQGQVVGGSVVG with no, one or two amino acid changes at any position. 50. Método de acordo com a reivindicação 49, caracterizado pelo fato de que dita expressão aumentada é efetuada introduzindo uma modificação genética preferivelmente no local de um gene codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296.A method according to claim 49, characterized in that said increased expression is effected by introducing a genetic modification preferably at the site of a gene encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. 51. Método para aumentar produção de semente em uma planta monocotiledônea em relação à produção de sementes de plantas de controle adequadas, caracterizado pelo fato de compreender introduzir e expressar preferencialmente em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, e/ou em que dito polipeptídeo compreende adicionalmente um dos seguintes motivos: Motivo 1: QGQ V/l GG; ou Motivo 2: ILSLSGSFLPPPAPP; ou Motivo 3: NATYERLP; ou Motivo 4: SFTNVAYERLPL com nenhuma ou uma mudança de aminoácido em qualquer posição; ou Motivo 5: GRFEILSLTGSFLPGPAPPGSTGLTIY LAGGQGQVVGGSWG com nenhuma, uma ou duas mudança de aminoácido em qualquer posição.51. A method for increasing seed production in a monocotyledonous plant over the production of suitable control plant seeds, characterized in that it comprises introducing and expressing preferentially in endosperm tissue of a monocotyledonous plant of a nucleic acid encoding a polypeptide comprising a AT-hook domain and a DUF296 domain, and / or wherein said polypeptide further comprises one of the following reasons: Reason 1: QGQ V / 1 GG; or Reason 2: ILSLSGSFLPPPAPP; or Reason 3: NATYERLP; or Reason 4: SFTNVAYERLPL with none or an amino acid change at any position; or Reason 5: GRFEILSLTGSFLPGPAPPGSTGLTIY LAGGQGQVVGGSWG with no, one or two amino acid changes at any position. 52. Método de acordo com a reivindicação 51, caracterizado pelo fato de que dito ácido nucleico é operavelmente ligado a um promotor específico de endosperma, preferivelmente a um promotor de prolamina.A method according to claim 51, characterized in that said nucleic acid is operably linked to an endosperm specific promoter, preferably to a prolamine promoter. 53. Método de acordo com qualquer uma das reivindicações -127 a 133, caracterizado pelo fato de que dito ácido nucleico é uma porção ou uma variante alélica ou uma variante de união ou uma seqüência capaz de hibridizar com uma seqüência de acordo com qualquer uma de SEQ ED NO: -152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: -158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: -166, SEQ ID NO: 168 e SEQ ID NO: 170, em que dita porção, variante alélica, variante de união ou seqüência hibridizante codifica um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296, e/ou em que dita porção, variante alélica, variante de união ou seqüência hibridizante codifica um ortólogo ou parálogo da proteína AT-hook de SEQ ID NO: 153.A method according to any one of claims -127 to 133, characterized in that said nucleic acid is a portion or an allelic variant or a binding variant or a sequence capable of hybridizing to a sequence according to any of SEQ ID NO: -152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: -158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: -166, SEQ ID NO: 168 and SEQ ID NO: 170, wherein said portion, allelic variant, coupling variant, or hybridizing sequence encodes a polypeptide comprising an AT-hook domain and a DUF296 domain, and / or wherein said portion, allelic variant, splicing variant, or hybridizing sequence encodes an AT-hook protein ortholog or analog of SEQ ID NO: 153. 54. Método de acordo com qualquer uma das reivindicações -49 a 53, caracterizado pelo fato de que dito ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 é de origem vegetal, preferivelmente de uma planta monocotiledônea, ainda preferivelmente da família Poaceae, mais preferivelmente do gênero Oryza, o mais preferivelmente de Oryza sativa.A method according to any one of claims -49 to 53, characterized in that said nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain is of plant origin, preferably from a monocotyledonous plant, still preferably from Poaceae family, most preferably from the genus Oryza, most preferably from Oryza sativa. 55. Método de acordo com qualquer uma das reivindicações -49 a 54, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou mais de: peso total de sementes aumentado, número aumentado de sementes cheias, número total aumentado de sementes, número aumentado de flores por panícula, índice de colheita aumentado (HI).A method according to any one of claims -49 to 54, characterized in that said increased yield is selected from one or more of: increased total seed weight, increased full seed number, increased total seed number , increased number of flowers per panicle, increased harvest index (HI). 56. Célula vegetal, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações 49 a 55, em que dita planta ou parte da mesma compreende um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 cujo ácido nucleico é operavelmente ligado a um promotor específico de endosperma.Plant cell, characterized in that it is obtainable by a method as defined in any one of claims 49 to 55, wherein said plant or part thereof comprises a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain. whose nucleic acid is operably linked to an endosperm specific promoter. 57. Construção de gene, caracterizada pelo fato de compreender: (a) Um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296; (b) Uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i) em tecido de endosperma de uma planta monocotiledônea, preferivelmente em que dita seqüência de controle é um promotor de prolamina; e opcionalmente (c) uma seqüência de término de transcrição.57. A gene construct comprising: (a) a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain; (b) One or more control sequences capable of directing expression of the nucleic acid sequence of (i) in endosperm tissue of a monocotyledonous plant, preferably wherein said control sequence is a prolamine promoter; and optionally (c) a transcription termination sequence. 58. Célula vegetal, caracterizada pelo fato de ser transformada com uma construção como definida na reivindicação 57.Plant cell, characterized in that it is transformed with a construct as defined in claim 57. 59. Método para produzir uma planta transgênica monocotiledônea tendo produção aumentada de sementes em relação a plantas de controle adequadas, caracterizado pelo fato de compreender: (a) introduzir e aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296; e (b) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.59. A method for producing a monocotyledonous transgenic plant having increased seed production relative to appropriate control plants, characterized in that it comprises: (a) introducing and preferentially increasing endosperm tissue expression of a monocotyledonous plant of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain; and (b) cultivate the plant cell under conditions promoting plant growth and development. 60. Método para aumentar produção vegetal em relação a plantas de controle adequadas, caracterizado pelo fato de compreender aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo de fator de transcrição de domínio DOF (ligação de DNA com um dedo) compreendendo característica (i) como segue, e adicionalmente ou característica (ii) ou (iii) como seguem: (i) pelo menos 60% identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e (ii) pelo menos 70% identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou (iii) Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou (iv) Motivo II: DDPGIKLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição, e/ou em que dito polipeptídeo compreendendo característica (i) e característica (iii) compreende adicionalmente qualquer um, quaisquer dois ou todos os três dos seguintes motivos: (i) Motivo III: SPTLGKHSRDE (SEQ ID NO: 231) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou (ii) Motivo IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou (iii) Motivo V: KGEGCL WVPKTLRIDDPDEAAKSSIW TTLGIK (SEQ ID NO: 233) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas, três, quatro ou cinco mudança(s) não-conservativa(s) em qualquer posição, e/ou em que dito polipeptídeo compreendendo característica (i) e característica (iii) compreende tanto Motivo I como II.60. A method of increasing plant yield over suitable control plants, comprising increasing expression in a plant of a nucleic acid encoding a DOF (one-finger DNA binding) domain transcription factor polypeptide comprising ( i) as follows, and additionally or feature (ii) or (iii) as follows: (i) at least 60% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and (ii) at least 70% sequence identity with the DOF domain represented by SEQ ID NO: 200; or (iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or (iv) Reason II: DDPGIKLFGKTIPF (SEQ ID NO: 230) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position, and / or wherein said polypeptide comprising feature (i) and feature (iii) further comprises any, any two or all three of the (i) Reason III: SPTLGKHSRDE (SEQ ID NO: 231) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or (ii) Reason IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or (iii) Reason V: KGEGCL WVPKTLRIDDPDEAAKSSIW TTLGIK (SEQ ID NO: 233) without any change; or with one or more conservative changes in any position; or with one, two, three, four or five non-conservative change (s) at any position, and / or wherein said polypeptide comprising feature (i) and feature (iii) comprises both Reason I and II. 61. Método de acordo com a reivindicação 60, caracterizado pelo fato de que dita expressão aumentada é efetuada introduzindo uma modificação genética preferivelmente no local de um gene codificando um polipeptídeo de fator de transcrição DOF, preferivelmente em que dita modificação genética é efetuada por um de: ativação de T-DNA, TILLING e recombinação homóloga.A method according to claim 60, characterized in that said increased expression is effected by introducing a genetic modification preferably at the site of a gene encoding a DOF transcription factor polypeptide, preferably wherein said genetic modification is effected by one of. : T-DNA activation, TILLING and homologous recombination. 62. Método para aumentar produção vegetal em relação a plantas de controle adequadas, caracterizado pelo fato de compreender introduzir e expressar em uma planta um ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF compreendendo característica (i) como segue, e adicionalmente ou característica (ii) ou (iii) como seguem: (i) pelo menos 60% identidade de seqüência ou com o domínio DOF representado por SEQ ED NO: 200 ou SEQ ID NO: 228; e (ii) pelo menos 70% identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou (iii) Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou (iv) Motivo II: DDPGIKLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição, e/ou em que dito polipeptídeo compreendendo característica (i) e característica (iii) compreende adicionalmente qualquer um, quaisquer dois ou todos os três dos seguintes motivos: (i) Motivo III: SPTLGKHSRDE (SEQ ID NO: 231) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou (ii) Motivo IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou (iii) Motivo V: KGEGCLWVPKTLRIDDPDEAAKSSIWTTLIK (SEQ ID NO: 233) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas, três, quatro ou cinco mudança(s) não-conservativa(s) em qualquer posição, e/ou em que dito polipeptídeo compreende característica (i) e característica (iii) compreende tanto Motivo I como II.62. A method of increasing plant yield over suitable control plants, comprising introducing and expressing into a plant a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide comprising feature (i) as follows, and additionally or characteristic (ii) or (iii) as follows: (i) at least 60% sequence identity or with the DOF domain represented by SEQ ED NO: 200 or SEQ ID NO: 228; and (ii) at least 70% sequence identity with the DOF domain represented by SEQ ID NO: 200; or (iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or (iv) Reason II: DDPGIKLFGKTIPF (SEQ ID NO: 230) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position, and / or wherein said polypeptide comprising feature (i) and feature (iii) further comprises any, any two or all three of the (i) Reason III: SPTLGKHSRDE (SEQ ID NO: 231) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or (ii) Reason IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or (iii) Reason V: KGEGCLWVPKTLRIDDPDEAAKSSIWTTLIK (SEQ ID NO: 233) without any change; or with one or more conservative changes in any position; or with one, two, three, four or five non-conservative change (s) at any position, and / or wherein said polypeptide comprises feature (i) and feature (iii) comprises both Reason I and II. 63. Método de acordo com a reivindicação 62, caracterizado pelo fato de que dito ácido nucleico ou variante do mesmo fator de transcrição DOF é superexpressado em uma planta.63. The method of claim 62, wherein said nucleic acid or variant of the same DOF transcription factor is overexpressed in a plant. 64. Método de acordo com qualquer uma das reivindicações -62 a 63, caracterizado pelo fato de que dito ácido nucleico ou variante do mesmo é de origem vegetal, preferivelmente de uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae, mais preferivelmente o ácido nucleico é de Arabidopsis thaliana.A method according to any one of claims -62 to 63, characterized in that said nucleic acid or variant thereof is of plant origin, preferably from a dicotyledonous plant, still preferably from the Brassicaceae family, more preferably the nucleic acid is of Arabidopsis thaliana. 65. Método de acordo com qualquer uma das reivindicações -62 a 64, caracterizado pelo fato de que dita variante codifica um homólogo de uma proteína de fator de transcrição DOF de SEQ ID NO: 199 ou SEQ ID NO: 227, preferivelmente em que dito homólogo de uma proteína de fator de transcrição DOF de SEQ ID NO: 199 é representado por qualquer uma de SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220 e SEQ ID NO: 222, e/ou em que dito homólogo de uma proteína de fator de transcrição DOF de SEQ ID NO: 227 é representado por qualquer uma de SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253 e SEQ ID NO: 255.A method according to any one of claims -62 to 64, characterized in that said variant encodes a homologue of a DOF transcription factor protein of SEQ ID NO: 199 or SEQ ID NO: 227, preferably wherein homolog of a DOF transcription factor protein of SEQ ID NO: 199 is represented by any one of SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210 , SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220 and SEQ ID NO: 222, and / or wherein said homologue of a protein factor DOF transcription of SEQ ID NO: 227 is represented by any of SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253 and SEQ ID NO: 255. 66. Método de acordo com qualquer uma das reivindicações -62 a 65, caracterizado pelo fato de que dito ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF é operavelmente ligado a um promotor constitutivo, preferivelmente em que dito promotor constitutivo é um promotor GOS2, preferivelmente um promotor GOS2 de arroz, e/ou em que dito ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF é operavelmente ligado a um promotor específico de semente, e/ou em que dito promotor específico de semente é um promotor específico de endosperma, preferivelmente um promotor de prolamina, e/ou em que dito promotor constitutivo dirige expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF compreendendo ditas características (i) e (ii), e/ou em que dito promotor específico de semente dirige expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF compreendendo ditas características (i) e (iii).A method according to any one of claims -62 to 65, characterized in that said nucleic acid or variant thereof encoding a DOF transcription factor polypeptide is operably linked to a constitutive promoter, preferably wherein said constitutive promoter is. a GOS2 promoter, preferably a rice GOS2 promoter, and / or wherein said nucleic acid or variant thereof encoding a DOF transcription factor polypeptide is operably linked to a seed specific promoter, and / or wherein said seed specific promoter. The seed is an endosperm specific promoter, preferably a prolamine promoter, and / or wherein said constitutive promoter directs expression of a nucleic acid encoding a DOF transcription factor polypeptide comprising said characteristics (i) and (ii), and / or wherein said seed specific promoter directs expression of a nucleic acid encoding a polypeptide of DOF transcription comprising said features (i) and (iii). 67. Método de acordo com qualquer uma das reivindicações 59 a 66, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou mais de: número aumentado de sementes cheias, peso de semente aumentado, número aumentado de flores por panícula, taxa de enchimento de sementes aumentada, índice de colheita aumentado (HI), peso de mil sementes aumentado (TKW), biomassa de raiz aumentada, comprimento de raiz aumentado e diâmetro de raiz aumentado.A method according to any one of claims 59 to 66, characterized in that said increased yield is selected from one or more of: increased number of full seeds, increased seed weight, increased number of flowers per panicle, increased seed fill rate, increased harvest index (HI), increased one thousand seed weight (TKW), increased root biomass, increased root length and increased root diameter. 68. Método de acordo com qualquer uma das reivindicações 59 a 66, caracterizado pelo fato de que dita produção aumentada ocorre em condições de estresse suave à secoA method according to any one of claims 59 to 66, characterized in that said increased production occurs under mild dry stress conditions. 69. Célula vegetal, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações 59 a 68.Plant cell, characterized in that it is obtainable by a method as defined in any one of claims 59 to 68. 70. Construção, caracterizada pelo fato de compreender: (i) um ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF como definido em reivindicação 62; (ii) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (a) preferivelmente em que dita seqüência de controle é um promotor constitutivo, mais preferivelmente em que dita seqüência de controle é um promotor específico de semente; e opcionalmente (iii) uma seqüência de término de transcrição.70. A composition comprising: (i) a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide as defined in claim 62; (ii) one or more control sequences capable of directing expression of the nucleic acid sequence of (a) preferably wherein said control sequence is a constitutive promoter, more preferably wherein said control sequence is a seed specific promoter; and optionally (iii) a transcription termination sequence. 71. Célula vegetal, caracterizada pelo fato de ser transformada com uma construção como definida na reivindicação 70.71. Plant cell, characterized in that it is transformed with a construct as defined in claim 70. 72. Método para produzir uma planta transgênica tendo produção aumentada em relação à planta do tipo selvagem correspondente, caracterizado pelo fato de compreender: (a) introduzir e expressar em a planta, parte vegetal ou célula vegetal um ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF como definido na reivindicação 62; (b) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.72. A method of producing a transgenic plant having an increased yield over the corresponding wild-type plant, comprising: (a) introducing and expressing in the plant, plant part or plant cell a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide as defined in claim 62; (b) cultivate the plant cell under conditions promoting plant growth and development. 73. Método de acordo com a reivindicação 72, caracterizado pelo fato de que dita produção aumentada ocorre em condições de estresse suave à seco.73. The method of claim 72, wherein said increased production occurs under mild dry stress conditions. 74. Método para aumentar produção de semente em plantas em relação a plantas de controle adequadas, caracterizado pelo fato de compreender reduzir preferencialmente expressão de um gene CKI endógeno em tecido de endosperma de uma planta, e/ou reduzir preferencialmente expressão é efetuado por regulação negativa mediada por RNA de expressão gênica, e/ou em que dita regulação negativa mediada por RNA é efetuada por co-supressão, e/ou em que dita regulação negativa mediada por RNA é efetuada por uso de seqüências de ácidos nucleicos de CKI anti-sentido, e/ou em que dito reduzir preferencialmente expressão é efetuado usando uma repetição invertida de um gene CKI ou fragmento deste, preferivelmente capaz de formar uma estrutura em grampo, e/ou em que dito reduzir preferencialmente expressão é efetuado usando ribozimas com especificidade para um ácido nucleico de CKI, e/ou em que dito reduzir preferencialmente expressão é efetuado por mutagênese por inserção.74. A method for increasing plant seed production over suitable control plants, which comprises preferentially reducing expression of an endogenous CKI gene in endosperm tissue of a plant, and / or preferentially reducing expression is effected by down-regulation. RNA-mediated gene expression, and / or wherein said RNA-mediated negative regulation is effected by co-suppression, and / or wherein said RNA-mediated negative regulation is effected by use of antisense CKI nucleic acid sequences and / or wherein said preferentially reducing expression is effected using an inverted repeat of a CKI gene or fragment thereof, preferably capable of forming a staple structure, and / or wherein said preferentially reducing expression is effected using ribozymes with specificity for one or more. CKI nucleic acid, and / or wherein said preferentially reducing expression is effected by mutagenesis by sermon. 75. Método de acordo com a reivindicação 74, caracterizado pelo fato de que dito reduzir preferencialmente expressão de um gene CKI endógeno em tecido de endosperma de uma planta é efetuado por um promotor específico de endosperma, preferivelmente um promotor de prolamina.75. The method of claim 74 wherein said preferentially reducing expression of an endogenous CKI gene in plant endosperm tissue is effected by an endosperm specific promoter, preferably a prolamine promoter. 76. Método de acordo com qualquer uma das reivindicações -74 a 75, caracterizado pelo fato de que dito gene CKI endógeno é um gene CKI como encontrado em uma planta em sua forma natural ou é um gene CKI isolado subseqüentemente introduzido em uma planta.A method according to any one of claims -74 to 75, characterized in that said endogenous CKI gene is a CKI gene as found in a plant in its natural form or is an isolated CKI gene subsequently introduced into a plant. 77. Método de acordo com qualquer uma das reivindicações -74 a 76, caracterizado pelo fato de que dito gene/nucleico de CKI é de uma fonte vegetal ou fonte artificial, preferivelmente que seqüências de ácidos nucleicos de CKI de plantas monocotiledôneas são usadas para transformação de plantas monocotiledôneas, ainda preferivelmente que seqüências de CKI da família Poaceae são usadas para transformação em plantas da família Poaceae, mais preferivelmente que seqüências de ácidos nucleicos de CKI de arroz são usadas para transformar plantas de arroz.A method according to any one of claims -74 to 76, characterized in that said CKI gene / nucleic is from a plant source or artificial source, preferably that CKI nucleic acid sequences from monocotyledonous plants are used for transformation. of monocotyledonous plants, yet preferably that Poaceae CKI sequences are used for transformation into Poaceae family plants, more preferably that rice CKI nucleic acid sequences are used to transform rice plants. 78. Método de acordo com a reivindicação 77, caracterizado pelo fato de que dita seqüência de ácidos nucleicos de CKI de arroz compreende um comprimento suficiente de nucleotídeos substancialmente contíguos de SEQ ID NO: 267 (OsCKI4) ou compreende um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácidos nucleicos codificando um ortólogo ou parálogo de OsCKI4 (SEQ ID NO: 267), e/ou em que ditos ortólogos ou parálogos de OsCKI4 são representados por SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278 e SEQ ID NO: 280, e/ou em que ditos nucleotídeos substancialmente contíguos de uma seqüência de ácidos nucleicos codificando um ortólogo ou parálogo de OsCKI4 (SEQ ID NO: -267) são nucleotídeos substancialmente contíguos de seqüências de ácidos nucleicos representadas por SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: -273, SEQ ID NO: 275, SEQ ID NO: 277 e SEQ ID NO: 279.A method according to claim 77, characterized in that said rice CKI nucleic acid sequence comprises a sufficient length of substantially contiguous nucleotides of SEQ ID NO: 267 (OsCKI4) or comprises a sufficient length of substantially contiguous nucleotides. of a nucleic acid sequence encoding an OsCKI4 ortholog or paralog (SEQ ID NO: 267), and / or wherein said OsCKI4 ortholog or paralog is represented by SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO : 274, SEQ ID NO: 276, SEQ ID NO: 278 and SEQ ID NO: 280, and / or wherein said substantially contiguous nucleotides of a nucleic acid sequence encoding an OsCKI4 ortholog or paralog (SEQ ID NO: -267 ) are substantially contiguous nucleotides of nucleic acid sequences represented by SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: -273, SEQ ID NO: 275, SEQ ID NO: 277 and SEQ ID NO: 279. 79. Método de acordo com qualquer uma das reivindicações -74 a 78, caracterizado pelo fato de que dita produção aumentada de sementes é selecionada a partir de um ou mais dos seguintes: a) biomassa de semente aumentada; b) número aumentado de flores por planta; c) número aumentado de sementes (cheios); e d) índice de colheita aumentado.A method according to any one of claims -74 to 78, characterized in that said increased seed production is selected from one or more of the following: a) increased seed biomass; b) increased number of flowers per plant; c) increased number of seeds (full); and d) increased harvest index. 80. Método de acordo com qualquer uma das reivindicações -74 a 80, caracterizado pelo fato de que dita produção aumentada ocorre em condições suaves de estresse.Method according to any of claims -74 to 80, characterized in that said increased production occurs under mild stress conditions. 81. Célula vegetal, caracterizada pelo fato de ser obtenível por um método de acordo com qualquer uma das reivindicações 74 a 80.Plant cell, characterized in that it is obtainable by a method according to any one of claims 74 to 80. 82. Método para produzir uma planta transgênica tendo produção aumentada de sementes em relação a plantas de controle adequadas, caracterizado pelo fato de compreender: (a) introduzir e expressar em a planta, parte vegetal ou célula vegetal uma construção de gene, compreendendo uma ou mais seqüências de controle capazes de dirigir preferencialmente expressão de uma seqüência de ácidos nucleicos de CKI sentido e/ou anti-sentido CKI em tecido de endosperma de planta de forma a silenciar um gene CKI endógeno em tecido de endosperma de uma planta; e (b) cultivar a planta, parte vegetal ou célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.82. A method of producing a transgenic plant having increased seed production relative to appropriate control plants, comprising: (a) introducing and expressing in the plant, plant part or plant cell a gene construct comprising one or more more control sequences capable of preferentially directing expression of a CKI sense and / or antisense CKI nucleic acid sequence in plant endosperm tissue so as to silence an endogenous CKI gene in plant endosperm tissue; and (b) cultivate the plant, plant part or plant cell under conditions promoting plant growth and development. 83. <claim missing on the original document>83. <claim missing on the original document> 84. <claim missing on the original document>84. <claim missing on the original document> 85. <claim missing on the original document>85. <claim missing on the original document> 86. <claim missing on the original document>86. <claim missing on the original document> 87. <claim missing on the original document>87. <claim missing on the original document> 88. <claim missing on the original document>88. <claim missing on the original document> 89. <claim missing on the original document>89. <claim missing on the original document> 90. <claim missing on the original document>90. <claim missing on the original document> 91. <claim missing on the original document>91. <claim missing on the original document> 92. <claim missing on the original document>92. <claim missing on the original document> 93. <claim missing on the original document>93. <claim missing on the original document> 94. <claim missing on the original document>94. <claim missing on the original document> 95. <claim missing on the original document>95. <claim missing on the original document> 96. <claim missing on the original document>96. <claim missing on the original document> 97. <claim missing on the original document>97. <claim missing on the original document> 98. <claim missing on the original document>98. <claim missing on the original document> 99. <claim missing on the original document>99. <claim missing on the original document> 100. <claim missing on the original document>100. <claim missing on the original document> 101. <claim missing on the original document>101. <claim missing on the original document> 102. <claim missing on the original document>102. <claim missing on the original document> 103. <claim missing on the original document>103. <claim missing on the original document> 104. <claim missing on the original document>104. <claim missing on the original document> 105. <claim missing on the original document>105. <claim missing on the original document> 106. <claim missing on the original document>106. <claim missing on the original document> 107. <claim missing on the original document>107. <claim missing on the original document> 108. <claim missing on the original document>108. <claim missing on the original document> 109. <claim missing on the original document>109. <claim missing on the original document> 110. <claim missing on the original document>110. <claim missing on the original document> 111. <claim missing on the original document>111. <claim missing on the original document> 112. <claim missing on the original document>112. <claim missing on the original document> 113. <claim missing on the original document>113. <claim missing on the original document> 114. <claim missing on the original document>114. <claim missing on the original document> 115. <claim missing on the original document>115. <claim missing on the original document> 116. <claim missing on the original document>116. <claim missing on the original document> 117. <claim missing on the original document>117. <claim missing on the original document> 118. <claim missing on the original document>118. <claim missing on the original document> 119. <claim missing on the original document>119. <claim missing on the original document> 120. <claim missing on the original document>120. <claim missing on the original document> 121. <claim missing on the original document>121. <claim missing on the original document> 122. <claim missing on the original document>122. <claim missing on the original document> 123. <claim missing on the original document>123. <claim missing on the original document> 124. <claim missing on the original document>124. <claim missing on the original document> 125. <claim missing on the original document>125. <claim missing on the original document> 126. <claim missing on the original document>126. <claim missing on the original document> 127. <claim missing on the original document>127. <claim missing on the original document> 128. <claim missing on the original document>128. <claim missing on the original document> 129. <claim missing on the original document>129. <claim missing on the original document> 130. <claim missing on the original document>130. <claim missing on the original document> 131. <claim missing on the original document>131. <claim missing on the original document> 132. <claim missing on the original document>132. <claim missing on the original document> 133. <claim missing on the original document>133. <claim missing on the original document> 134. <claim missing on the original document>134. <claim missing on the original document> 135. <claim missing on the original document>135. <claim missing on the original document> 136. Método de acordo com qualquer uma das reivindicações -127 a 135, caracterizado pelo fato de que dito ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 é de origem vegetal, preferivelmente de uma planta monocotiledônea, ainda preferivelmente da família Poaceae, mais preferivelmente do gênero Oiyza, o mais preferivelmente de Oryza sativa.A method according to any one of claims -127 to 135, characterized in that said nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain is of plant origin, preferably from a monocotyledonous plant, still preferably from Poaceae family, most preferably from the genus Oiyza, most preferably from Oryza sativa. 137. Método de acordo com qualquer uma das reivindicações -127 a 136, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou mais de: peso total de sementes aumentado, número aumentado de sementes cheias, número total aumentado de sementes, número aumentado de flores por panícula, índice de colheita aumentado (HI).137. A method according to any one of claims -127 to 136, characterized in that said increased yield is selected from one or more of: increased total seed weight, increased full seed number, increased total seed number. , increased number of flowers per panicle, increased harvest index (HI). 138. Planta ou parte da mesma incluindo célula vegetal obtenível por um método como definido em qualquer uma das reivindicações -127 a 137, caracterizada pelo fato de que dita planta ou parte da mesma compreende um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296 cujo ácido nucleico é operavelmente ligado a um promotor específico de endosperma.Plant or part thereof including plant cell obtainable by a method as defined in any one of claims -127 to 137, characterized in that said plant or part thereof comprises a nucleic acid encoding a polypeptide comprising an AT-hook domain. and a DUF296 domain whose nucleic acid is operably linked to an endosperm specific promoter. 139. Construção de gene, caracterizada pelo fato de compreender: (a) Um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296; (b) Uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (i) em tecido de endosperma de uma planta monocotiledônea; e opcionalmente (c) uma seqüência de término de transcrição.139. A gene construct comprising: (a) A nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain; (b) One or more control sequences capable of directing expression of the nucleic acid sequence of (i) in endosperm tissue of a monocotyledonous plant; and optionally (c) a transcription termination sequence. 140. Uso de uma construção como definida na reivindicação -139, caracterizado pelo fato de ser para aumentar produção de sementes em plantas monocotiledôneas.Use of a construct as defined in claim -139, characterized in that it is for increasing seed production in monocotyledonous plants. 141. Construção de acordo com a reivindicação 139, caracterizada pelo fato de que dita seqüência de controle é um promotor de prolamina.141. Construction according to claim 139, characterized in that said control sequence is a prolamine promoter. 142. Planta, parte vegetal ou célula vegetal, caracterizada pelo fato de ser transformada com uma construção como definida na reivindicação 139.142. Plant, plant part or plant cell, characterized in that it is transformed with a construction as defined in claim 139. 143. Método para produzir uma planta transgênica monocotiledônea tendo produção aumentada de sementes em relação a plantas de controle adequadas, caracterizado pelo fato de compreender: (a) introduzir e aumentar preferencialmente expressão em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT-hook e um domínio DUF296; e (b) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.143. A method for producing a monocotyledonous transgenic plant having increased seed yield over appropriate control plants, characterized in that it comprises: (a) introducing and preferentially increasing endosperm tissue expression of a monocotyledonous plant of a nucleic acid encoding a polypeptide comprising an AT-hook domain and a DUF296 domain; and (b) cultivate the plant cell under conditions promoting plant growth and development. 144. Planta transgênica monocotiledônea, caracterizada pelo fato de ter produção aumentada de sementes em relação a plantas de controle adequadas, dita produção aumentada de sementes resultando de expressão preferencial em tecido de endosperma de uma planta monocotiledônea de um ácido nucleico codificando um polipeptídeo compreendendo um domínio AT- hook e um domínio DUF296.144. Transgenic monocotyledonous plant, characterized in that it has increased seed yield over appropriate control plants, said increased seed yield resulting from preferential expression in endosperm tissue of a monocotyledonous plant encoding a polypeptide domain comprising a domain. AT-hook is a DUF296 domain. 145. Planta transgênica monocotiledônea de acordo com a reivindicação 138, 142 ou 144, caracterizada pelo fato de que dita planta é um cereal, tal como arroz, milho, cana-de-açúcar, trigo, cevada, milheto, centeio, sorgo, gramíneas ou aveia.A monocotyledonous transgenic plant according to claim 138, 142 or 144, characterized in that said plant is a cereal, such as rice, corn, sugar cane, wheat, barley, millet, rye, sorghum, grasses. or oatmeal. 146. Partes que podem ser colhidas de uma planta como definida em qualquer uma das reivindicações 138, 142, 144 ou 145, caracterizadas pelo fato de que ditas partes que podem ser colhidas são sementes.146. Harvestable parts of a plant as defined in any one of claims 138, 142, 144 or 145, characterized in that said harvestable parts are seeds. 147. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 145 e/ou de partes que podem ser colhidas de uma planta como definidas na reivindicação 146.147. Products characterized in that they are derived from a plant as defined in claim 145 and / or parts which may be harvested from a plant as defined in claim 146. 148. Uso de um ácido nucleico codificando um polipeptídeo, compreendendo um domínio AT-hook e um domínio DUF296, cujo ácido nucleico é operavelmente ligado a um promotor específico de endosperma, caracterizado pelo fato de ser para aumentar produção de sementes em uma planta monocotiledônea comparada com produção de sementes em uma planta de controle adequada.148. Use of a polypeptide-encoding nucleic acid comprising an AT-hook domain and a DUF296 domain, whose nucleic acid is operably linked to an endosperm-specific promoter, characterized in that it is for increasing seed production in a monocotyledonous plant compared with seed production in a suitable control plant. 149. Uso de acordo com a reivindicação 148, caracterizado pelo fato de que dita produção aumentada de sementes é selecionada a partir de um ou mais de: peso total de sementes aumentado, número aumentado de sementes cheias, número total aumentado de sementes número aumentado de flores por panícula, índice de colheita aumentado (HI).Use according to claim 148, characterized in that said increased seed yield is selected from one or more of: increased total seed weight, increased full seed, increased total seed number flowers per panicle, increased harvest index (HI). 150. Método para aumentar produção vegetal em relação a plantas de controle adequadas, caracterizado pelo fato de compreender aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo de fator de transcrição de domínio DOF (ligação de DNA com um dedo) compreendendo característica (i) como segue, e adicionalmente ou característica (ii) ou (iii) como seguem: (i) pelo menos 60% identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e (ii) pelo menos 70% identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou (iii) Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou Motivo II: DDPGIKLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição.150. A method of increasing plant yield over suitable control plants, comprising increasing expression in a plant of a nucleic acid encoding a DOF (one-finger DNA binding) domain transcription factor polypeptide comprising ( i) as follows, and additionally or feature (ii) or (iii) as follows: (i) at least 60% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and (ii) at least 70% sequence identity with the DOF domain represented by SEQ ID NO: 200; or (iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or Reason II: DDPGIKLFGKTIPF (SEQ ID NO: 230) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position. 151. Método de acordo com a reivindicação 150, caracterizado pelo fato de que dito polipeptídeo compreendendo característica (i) e característica (iii) compreende adicionalmente qualquer um, quaisquer dois ou todos os três dos seguintes motivos: - Motivo III: SPTLGKHSRDE (SEQ ID NO: 231) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou - Motivo IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou - Motivo V: KGEGCL WVPKTLRIDDPDEAAKSSIW TTLGIK (SEQ ID NO: 233) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas, três, quatro ou cinco mudança(s) não-conservativa(s) em qualquer posição.151. The method of claim 150, wherein said polypeptide comprising feature (i) and feature (iii) further comprises any one, any two or all of the following reasons: - Reason III: SPTLGKHSRDE (SEQ ID NO: 231) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or - Reason IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or - Reason V: KGEGCL WVPKTLRIDDPDEAAKSSIW TTLGIK (SEQ ID NO: 233) without any change; or with one or more conservative changes in any position; or with one, two, three, four or five non-conservative change (s) in any position. 152. Método de acordo com a reivindicação 150 ou 151, caracterizado pelo fato de que dito polipeptídeo compreendendo característica (i) e característica (iii) compreende tanto Motivo I como II.Method according to claim 150 or 151, characterized in that said polypeptide comprising feature (i) and feature (iii) comprises both Reason I and II. 153. Método de acordo com qualquer uma das reivindicações -150 a 152, caracterizado pelo fato de que dita expressão aumentada é efetuada introduzindo uma modificação genética preferivelmente no local de um gene codificando um polipeptídeo de fator de transcrição DOF.A method according to any one of claims 150 to 152, characterized in that said increased expression is effected by introducing a genetic modification preferably at the site of a gene encoding a DOF transcription factor polypeptide. 154. Método de acordo com a reivindicação 153, caracterizado pelo fato de que dita modificação genética é efetuada por um de: ativação de T-DNA, TILLING e recombinação homóloga.154. The method of claim 153 wherein said genetic modification is effected by one of: T-DNA activation, TILLING and homologous recombination. 155. Método para aumentar produção vegetal em relação a plantas de controle adequadas, caracterizado pelo fato de compreender introduzir e expressar em uma planta um ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF compreendendo característica (i) como segue, e adicionalmente ou característica (ii) ou (iii) como seguem: (i) pelo menos 60% identidade de seqüência ou com o domínio DOF representado por SEQ ID NO: 200 ou SEQ ID NO: 228; e (ii) pelo menos 70% identidade de seqüência com o domínio DOF representado por SEQ ID NO: 200; ou (iii) Motivo I: KALKKPDKILP (SEQ ID NO: 229) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou Motivo II: DDPGUCLFGKTIPF (SEQ ID NO: 230) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição.155. A method of increasing plant yield over suitable control plants, comprising introducing and expressing into a plant a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide comprising feature (i) as follows, and additionally or characteristic (ii) or (iii) as follows: (i) at least 60% sequence identity or with the DOF domain represented by SEQ ID NO: 200 or SEQ ID NO: 228; and (ii) at least 70% sequence identity with the DOF domain represented by SEQ ID NO: 200; or (iii) Reason I: KALKKPDKILP (SEQ ID NO: 229) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or Reason II: DDPGUCLFGKTIPF (SEQ ID NO: 230) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position. 156. Método de acordo com a reivindicação 155, caracterizado pelo fato de que dito polipeptídeo compreendendo característica (i) e característica (iii) compreende adicionalmente qualquer um, quaisquer dois ou todos os três dos seguintes motivos: - Motivo III: SPTLGKHSRDE (SEQ ID NO: 231) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou - Motivo IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas ou três mudança(s) não-conservativa(s) em qualquer posição; e/ou - Motivo V: KGEGCLWVPKTLRIDDPDEAAKSSIWTTLIK (SEQ ID NO: 233) sem nenhuma mudança; ou com uma ou mais mudanças conservativas em qualquer posição; ou com uma, duas, três, quatro ou cinco mudança(s) não-conservativa(s) em qualquer posição.156. The method of claim 155, wherein said polypeptide comprising feature (i) and feature (iii) further comprises any one, any two or all three of the following reasons: Reason III: SPTLGKHSRDE (SEQ ID NO: 231) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or - Reason IV: LQANPAALSRSQNFQE (SEQ ID NO: 232) without any change; or with one or more conservative changes in any position; or with one, two or three non-conservative change (s) at any position; and / or - Reason V: KGEGCLWVPKTLRIDDPDEAAKSSIWTTLIK (SEQ ID NO: 233) without any change; or with one or more conservative changes in any position; or with one, two, three, four or five non-conservative change (s) in any position. 157. Método de acordo com a reivindicação 155 ou 156, caracterizado pelo fato de que dito polipeptídeo compreende característica (i) e característica (iii) compreende tanto Motivo I como II.157. The method of claim 155 or 156, wherein said polypeptide comprises feature (i) and feature (iii) comprises both Reason I and II. 158. Método de acordo com reivindicações 155 a 157, caracterizado pelo fato de que dito ácido nucleico ou variante do mesmo fator de transcrição DOF é superexpressado em uma planta.Method according to claims 155 to 157, characterized in that said nucleic acid or variant of the same transcription factor DOF is overexpressed in a plant. 159. Método de acordo com qualquer uma das reivindicações -155 a 158, caracterizado pelo fato de que dito ácido nucleico ou variante do mesmo é de origem vegetal, preferivelmente de uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae, mais preferivelmente o ácido nucleico é de Arabidopsis thaliana.A method according to any one of claims -155 to 158, characterized in that said nucleic acid or variant thereof is of plant origin, preferably from a dicotyledonous plant, still preferably from the Brassicaceae family, more preferably the nucleic acid is of Arabidopsis thaliana. 160. Método de acordo com qualquer uma das reivindicações -155 a 159, caracterizado pelo fato de que dita variante codifica um homólogo de uma proteína de fator de transcrição DOF de SEQ ID NO: 199 ou SEQ ID NO: 227.Method according to any of claims -155 to 159, characterized in that said variant encodes a homologue of a DOF transcription factor protein of SEQ ID NO: 199 or SEQ ID NO: 227. 161. Método de acordo com a reivindicação 160, caracterizado pelo fato de que dito homólogo de uma proteína de fator de transcrição DOF de SEQ ID NO: 199 é representado por qualquer uma de SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220 e SEQ ID NO: 222.161. The method of claim 160, wherein said homolog of a DOF transcription factor protein of SEQ ID NO: 199 is represented by any one of SEQ ID NO: 202, SEQ ID NO: 204, SEQ SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220 and SEQ ID NO : 222. 162. Método de acordo com a reivindicação 160, caracterizado pelo fato de que dito homólogo de uma proteína de fator de transcrição DOF de SEQ ID NO: 227 é representado por qualquer uma de SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253 e SEQ ID NO: 255.Method according to claim 160, characterized in that said homolog of a DOF transcription factor protein of SEQ ID NO: 227 is represented by any one of SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO: 253 and SEQ ID NO : 255. 163. Método de acordo com qualquer uma das reivindicações -155 a 162, caracterizado pelo fato de que dito ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF é operavelmente ligado a um promotor constitutivo.A method according to any one of claims -155 to 162, characterized in that said nucleic acid or variant thereof encoding a DOF transcription factor polypeptide is operably linked to a constitutive promoter. 164. Método de acordo com a reivindicação 163, caracterizado pelo fato de que dito promotor constitutivo é um promotor GOS2, preferivelmente um promotor GOS2 de arroz.164. The method of claim 163, wherein said constitutive promoter is a GOS2 promoter, preferably a rice GOS2 promoter. 165. Método de acordo com qualquer uma das reivindicações -155 a 162, caracterizado pelo fato de que dito ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF é operavelmente ligado a um promotor específico de semente.A method according to any one of claims -155 to 162, characterized in that said nucleic acid or variant thereof encoding a DOF transcription factor polypeptide is operably linked to a seed specific promoter. 166. Método de acordo com a reivindicação 165, caracterizado pelo fato de que dito promotor específico de semente é um promotor específico de endosperma, preferivelmente um promotor de prolamina.166. The method of claim 165, wherein said seed specific promoter is an endosperm specific promoter, preferably a prolamine promoter. 167. Método de acordo com a reivindicação 163 ou 164, caracterizado pelo fato de que dito promotor constitutivo dirige expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF compreendendo ditas características (i) e (ii).167. The method of claim 163 or 164, wherein said constitutive promoter directs expression of a nucleic acid encoding a DOF transcription factor polypeptide comprising said characteristics (i) and (ii). 168. Método de acordo com a reivindicação 165 ou 166, caracterizado pelo fato de que dito promotor específico de semente dirige expressão de um ácido nucleico codificando um polipeptídeo de fator de transcrição DOF compreendendo ditas características (i) e (iii).168. The method of claim 165 or 166, wherein said seed-specific promoter directs expression of a nucleic acid encoding a DOF transcription factor polypeptide comprising said characteristics (i) and (iii). 169. Método de acordo com qualquer uma das reivindicações -150 a 168, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou mais de: número aumentado de sementes cheias, peso de semente aumentado, número aumentado de flores por panícula, taxa de enchimento de sementes aumentada, índice de colheita aumentado (HI), peso de mil sementes aumentado (TKW)5 biomassa de raiz aumentada, comprimento de raiz aumentado e diâmetro de raiz aumentado.A method according to any one of claims 150 to 168, characterized in that said increased yield is selected from one or more of: increased number of full seeds, increased seed weight, increased number of flowers per panicle. , increased seed filling rate, increased harvest index (HI), increased one thousand seed weight (TKW) 5 increased root biomass, increased root length and increased root diameter. 170. Método de acordo com qualquer uma das reivindicações -150 a 169, caracterizado pelo fato de que dita produção aumentada ocorre em condições de estresse suave à seco170. A method according to any one of claims -150 to 169, characterized in that said increased production occurs under mild dry stress conditions. 171. Planta ou parte da mesma, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações -150 a 170.171. Plant or part thereof, characterized in that it is obtainable by a method as defined in any one of claims -150 to 170. 172. Construção, caracterizada pelo fato de compreender: (i) um ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF como definido em reivindicação 155; (ii) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (a), e opcionalmente (iii) uma seqüência de término de transcrição.Construction, characterized in that it comprises: (i) a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide as defined in claim 155; (ii) one or more control sequences capable of directing expression of the nucleic acid sequence of (a), and optionally (iii) a transcription termination sequence. 173. Construção de acordo com a reivindicação 172, caracterizada pelo fato de que dita seqüência de controle é um promotor constitutivo.173. Construction according to claim 172, characterized in that said control sequence is a constitutive promoter. 174. Construção de acordo com a reivindicação 172, caracterizada pelo fato de que dita seqüência de controle é um promotor específico de semente.174. Construction according to claim 172, characterized in that said control sequence is a seed specific promoter. 175. Planta, parte vegetal ou célula vegetal, caracterizada pelo fato de ser transformada com uma construção como definida em qualquer uma das reivindicações 172 a 174.175. Plant, plant part or plant cell, characterized in that it is transformed with a construction as defined in any one of claims 172 to 174. 176. Método para produzir uma planta transgênica tendo produção aumentada em relação à planta do tipo selvagem correspondente, caracterizado pelo fato de compreender: (a) introduzir e expressar em a planta, parte vegetal ou célula vegetal um ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF como definido na reivindicação 155; (b) cultivar a célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.176. A method for producing a transgenic plant having increased yield over the corresponding wild-type plant, characterized in that it comprises: (a) introducing and expressing into the plant, plant part or plant cell a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide as defined in claim 155; (b) cultivate the plant cell under conditions promoting plant growth and development. 177. Método de acordo com a reivindicação 176, caracterizado pelo fato de que dita produção aumentada ocorre em condições de estresse suave à seco.177. The method of claim 176 wherein said increased production occurs under mild dry stress conditions. 178. Planta transgênica, caracterizada pelo fato de ter produção aumentada em relação à planta do tipo selvagem correspondente, dita produção aumentada resultando de um ácido nucleico ou variante do mesmo codificando um polipeptídeo de fator de transcrição DOF como definido na reivindicação 155 introduzido em dita planta.178. Transgenic plant, characterized in that it has increased yield over the corresponding wild-type plant, said increased yield resulting from a nucleic acid or variant thereof encoding a DOF transcription factor polypeptide as defined in claim 155 introduced into said plant . 179. Planta transgênica de acordo com a reivindicação 171, -175 ou 178, caracterizada pelo fato de que dita planta é uma planta monocotiledônea, tal como cana-de-açúcar ou que a planta é um cereal, tal como arroz, milho, trigo, cevada, milheto, centeio, aveia ou sorgo.Transgenic plant according to claim 171, -175 or 178, characterized in that said plant is a monocotyledonous plant such as sugar cane or that the plant is a cereal such as rice, corn, wheat , barley, millet, rye, oats or sorghum. 180. Partes que podem ser colhidas de uma planta, caracterizadas por serem de acordo com qualquer uma das reivindicações 171, -175, 178 ou 179.Harvestable parts of a plant, characterized in that they are according to any one of claims 171, -175, 178 or 179. 181. Partes que podem ser colhidas de uma planta como definida em reivindicação 180, caracterizadas pelo fato de que ditas partes que podem ser colhidas são sementes.181. Harvestable parts of a plant as defined in claim 180, characterized in that said harvestable parts are seeds. 182. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 179 e/ou de partes que podem ser colhidas de uma planta como definidas nas reivindicações 180 ou 181.Products, characterized in that they are derived from a plant as defined in claim 179 and / or parts that can be harvested from a plant as defined in claims 180 or 181. 183. Uso de um ácido nucleico ou variante do mesmo codificando um polipeptídeo, ou uso de tal polipeptídeo, o polipeptídeo sendo de fator de transcrição DOF, caracterizado pelo fato de ser para aumentar produção vegetal em relação a plantas de controle adequadas.183. Use of a nucleic acid or variant thereof encoding a polypeptide, or use of such a polypeptide, the polypeptide being of DOF transcription factor, characterized in that it is for increasing plant yield over appropriate control plants. 184. Uso de acordo com a reivindicação 183, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou mais de: número aumentado de sementes cheias, peso de semente aumentado, número aumentado de flores por panícula, taxa de enchimento de sementes aumentada, índice de colheita aumentado (HI), peso de mil sementes aumentado (TKW), biomassa de raiz aumentada, comprimento de raiz aumentado e diâmetro de raiz aumentado.Use according to claim 183, characterized in that said increased yield is selected from one or more of: increased number of full seeds, increased seed weight, increased number of flowers per panicle, fill rate of increased seeds, increased harvest index (HI), increased one thousand seed weight (TKW), increased root biomass, increased root length and increased root diameter. 185. Uso de acordo com reivindicações 183 ou 184, caracterizado pelo fato de que dita produção aumentada ocorre em condições de estresse suave à seco.Use according to claim 183 or 184, characterized in that said increased production occurs under mild dry stress conditions. 186. Uso de um ácido nucleico ou variante do mesmo codificando um polipeptídeo, ou uso de tal polipeptídeo, o polipeptídeo sendo polipeptídeo de fator de transcrição DOF, caracterizado pelo fato de ser como um marcador molecular.186. Use of a nucleic acid or variant thereof encoding a polypeptide, or use of such a polypeptide, the polypeptide being a DOF transcription factor polypeptide, characterized in that it is a molecular marker. 187. Método para aumentar produção de semente em plantas em relação a plantas de controle adequadas, caracterizado pelo fato de compreender reduzir preferencialmente expressão de um gene CKJ endógeno em tecido de endosperma de uma planta.187. A method for increasing plant seed yield over suitable control plants, which comprises preferentially reducing expression of an endogenous CKJ gene in endosperm tissue of a plant. 188. Método de acordo com a reivindicação 187, caracterizado pelo fato de que dito reduzir preferencialmente expressão é efetuado por regulação negativa mediada por RNA de expressão gênica.188. The method of claim 187, wherein said preferentially reducing expression is effected by RNA-mediated down-regulation of gene expression. 189. Método de acordo com a reivindicação 188, caracterizado pelo fato de que dita regulação negativa mediada por RNA é efetuada por co- supressão.189. The method of claim 188, characterized in that said RNA-mediated down-regulation is effected by co-suppression. 190. Método de acordo com a reivindicação 188, caracterizado pelo fato de que dita regulação negativa mediada por RNA é efetuada por uso de seqüências de ácidos nucleicos de CKI anti-sentido.190. The method of claim 188, wherein said RNA-mediated down-regulation is effected by use of antisense CKI nucleic acid sequences. 191. Método de acordo com a reivindicação 187, caracterizado pelo fato de que dito reduzir preferencialmente expressão é efetuado usando uma repetição invertida de um gene CKI ou fragmento deste, preferivelmente capaz de formar uma estrutura em grampo.191. The method of claim 187, wherein said preferentially reducing expression is effected using an inverted repeat of a CKI gene or fragment thereof, preferably capable of forming a staple structure. 192. Método de acordo com a reivindicação 187, caracterizado pelo fato de que dito reduzir preferencialmente expressão é efetuado usando ribozimas com especificidade para um ácido nucleico de CKL192. The method of claim 187, wherein said preferentially reducing expression is effected using ribozymes with specificity for a CKL nucleic acid. 193. Método de acordo com a reivindicação 187, caracterizado pelo fato de que dito reduzir preferencialmente expressão é efetuado por mutagênese por inserção.Method according to claim 187, characterized in that said preferentially reducing expression is effected by insertion mutagenesis. 194. Método de acordo com qualquer uma das reivindicações -187 a 193, caracterizado pelo fato de que dito reduzir preferencialmente expressão de um gene CKI endógeno em tecido de endosperma de uma planta é efetuado por um promotor específico de endosperma, preferivelmente um promotor de prolamina.A method according to any one of claims -187 to 193, wherein said preferentially reducing expression of an endogenous CKI gene in plant endosperm tissue is effected by an endosperm-specific promoter, preferably a prolamine promoter. . 195. Método de acordo com qualquer uma das reivindicações -187 a 194, caracterizado pelo fato de que dito gene CKI endógeno é um gene CKI como encontrado em uma planta em sua forma natural ou é um gene CKI isolado subseqüentemente introduzido em uma planta.A method according to any one of claims -187 to 194, characterized in that said endogenous CKI gene is a CKI gene as found in a plant in its natural form or is an isolated CKI gene subsequently introduced into a plant. 196. Método de acordo com qualquer uma das reivindicações -187 a 197, caracterizado pelo fato de que dito gene/nucleico de CKI é de uma fonte vegetal ou fonte artificial, preferivelmente que seqüências de ácidos nucleicos de CKI de plantas monocotiledôneas são usadas para transformação de plantas monocotiledôneas, ainda preferivelmente que seqüências de CKI da família Poaceae são usadas para transformação em plantas da família Poaceae, mais preferivelmente que seqüências de ácidos nucleicos de CKI de arroz são usadas para transformar plantas de arroz.A method according to any one of claims -187 to 197, characterized in that said CKI gene / nucleic is from a plant source or artificial source, preferably that CKI nucleic acid sequences from monocotyledonous plants are used for transformation. of monocotyledonous plants, yet preferably that Poaceae CKI sequences are used for transformation into Poaceae family plants, more preferably that rice CKI nucleic acid sequences are used to transform rice plants. 197. Método de acordo com a reivindicação 196, caracterizado pelo fato de que dita seqüência de ácidos nucleicos de CKI de arroz compreende um comprimento suficiente de nucleotídeos substancialmente contíguos de SEQ ID NO: 267 (OsCKI4) ou compreende um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácidos nucleicos codificando um ortólogo ou parálogo de OsCKI4 (SEQ ID NO: 267).A method according to claim 196, characterized in that said rice CKI nucleic acid sequence comprises a sufficient length of substantially contiguous nucleotides of SEQ ID NO: 267 (OsCKI4) or comprises a sufficient length of substantially contiguous nucleotides. of a nucleic acid sequence encoding an OsCKI4 ortholog or paralog (SEQ ID NO: 267). 198. Método de acordo com a reivindicação 197, caracterizado pelo fato de que ditos ortólogos ou parálogos de OsCKI4 são representados por SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278 e SEQ ID NO: 280.A method according to claim 197, characterized in that said OsCKI4 orthologs or paralogs are represented by SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278 and SEQ ID NO: 280. 199. Método de acordo com a reivindicação 197 ou 198, caracterizado pelo fato de que ditos nucleotídeos substancialmente contíguos de uma seqüência de ácidos nucleicos codificando um ortólogo ou parálogo de OsCKI4 (SEQ ID NO: 267) são nucleotídeos substancialmente contíguos de seqüências de ácidos nucleicos representadas por SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277 e SEQ ID NO: 279.199. The method according to claim 197 or 198, wherein said substantially contiguous nucleotides of a nucleic acid sequence encoding an OsCKI4 ortholog or paralog (SEQ ID NO: 267) are substantially contiguous nucleotides of nucleic acid sequences. represented by SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277 and SEQ ID NO: 279. 200. Método de acordo com qualquer uma das reivindicações -187 a 199, caracterizado pelo fato de que dita produção aumentada de sementes é selecionada a partir de um ou mais dos seguintes: a) biomassa de semente aumentada; b) número aumentado de flores por planta; c) número aumentado de sementes (cheios); e d) índice de colheita aumentado.Method according to any one of claims -187 to 199, characterized in that said increased seed production is selected from one or more of the following: a) increased seed biomass; b) increased number of flowers per plant; c) increased number of seeds (full); and d) increased harvest index. 201. Método de acordo com qualquer uma das reivindicações -187 a 200, caracterizado pelo fato de que dita produção aumentada ocorre em condições suaves de estresse.Method according to any one of claims -187 to 200, characterized in that said increased production occurs under mild stress conditions. 202. Planta ou parte da mesma, caracterizada pelo fato de ser obtenível por um método de acordo com qualquer uma das reivindicações 187 a 201.Plant or part thereof, characterized in that it is obtainable by a method according to any one of claims 187 to 201. 203. Método para produzir uma planta transgênica tendo produção aumentada de sementes em relação a plantas de controle adequadas, caracterizado pelo fato de compreender: (a) introduzir e expressar em a planta, parte vegetal ou célula vegetal uma construção de gene, compreendendo uma ou mais seqüências de controle capazes de dirigir preferencialmente expressão de uma seqüência de ácidos nucleicos de CKI sentido e/ou anti-sentido CKI em tecido de endosperma de planta de forma a silenciar um gene CKI endógeno em tecido de endosperma de uma planta; e (b) cultivar a planta, parte vegetal ou célula vegetal em condições promovendo crescimento e desenvolvimento vegetal.203. A method of producing a transgenic plant having increased seed production relative to appropriate control plants, comprising: (a) introducing and expressing in the plant, plant part or plant cell a gene construct comprising one or more more control sequences capable of preferentially directing expression of a CKI sense and / or antisense CKI nucleic acid sequence in plant endosperm tissue so as to silence an endogenous CKI gene in plant endosperm tissue; and (b) cultivate the plant, plant part or plant cell under conditions promoting plant growth and development. 204. Uso de ácido nucleico CKÍ, caracterizado pelo fato de ser para a redução ou eliminação substancial de expressão de gene CKI endógeno em tecido de endosperma de planta para aumentar produção de sementes em plantas em relação a plantas de controle adequadas.204. Use of CKI nucleic acid, characterized in that it is for the reduction or substantial elimination of endogenous CKI gene expression in plant endosperm tissue to increase plant seed production relative to appropriate control plants. 205. Uso de acordo com a reivindicação 204, caracterizado pelo fato de que dita produção aumentada é selecionada a partir de um ou mais de: selecionado a partir de um ou mais dos seguintes: a) biomassa de semente aumentada; b) número aumentado de flores por planta; c) número aumentado de sementes (cheios); e d) índice de colheita aumentado.Use according to claim 204, characterized in that said increased production is selected from one or more of: selected from one or more of the following: a) increased seed biomass; b) increased number of flowers per plant; c) increased number of seeds (full); and d) increased harvest index. 206. Uso de acordo com a reivindicação 204 ou 205, caracterizado pelo fato de que dita produção de sementes ocorre em condições suaves de estresse.206. Use according to claim 204 or 205, characterized in that said seed production occurs under mild stress conditions.
BRPI0619242-4A 2005-12-01 2006-11-29 protein, methods for increasing seed production and / or increasing plant growth rate and growth rate, plant cell construction, and methods for producing a transgenic plant to improve plant growth characteristics and growth characteristics relative to corresponding wild type plants, to increase crop yield, plant seed count and plant seed yield BRPI0619242A2 (en)

Applications Claiming Priority (29)

Application Number Priority Date Filing Date Title
EP05111597 2005-12-01
EP05111597.0 2005-12-01
US74235205P 2005-12-05 2005-12-05
EP05111691.1 2005-12-05
US60/742352 2005-12-05
EP05111691 2005-12-05
EP05111786.9 2005-12-07
EP05111786 2005-12-07
US74890305P 2005-12-08 2005-12-08
US60/748903 2005-12-08
US74921905P 2005-12-09 2005-12-09
US60/749219 2005-12-09
EP05111996.4 2005-12-12
EP05111996 2005-12-12
US75014305P 2005-12-14 2005-12-14
US60/750143 2005-12-14
EP05112562.3 2005-12-21
EP05112562 2005-12-21
US75365005P 2005-12-23 2005-12-23
US60/753650 2005-12-23
EP05113111.8 2005-12-30
EP05113111 2005-12-30
EP05113110 2005-12-30
EP05113110.0 2005-12-30
US75604206P 2006-01-04 2006-01-04
US75608606P 2006-01-04 2006-01-04
US60/756042 2006-01-04
US60/756086 2006-01-04
PCT/US2006/045721 WO2007064724A2 (en) 2005-12-01 2006-11-29 Plants having improved growth characteristics and methods for making the same

Publications (1)

Publication Number Publication Date
BRPI0619242A2 true BRPI0619242A2 (en) 2011-11-08

Family

ID=44907597

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0619242-4A BRPI0619242A2 (en) 2005-12-01 2006-11-29 protein, methods for increasing seed production and / or increasing plant growth rate and growth rate, plant cell construction, and methods for producing a transgenic plant to improve plant growth characteristics and growth characteristics relative to corresponding wild type plants, to increase crop yield, plant seed count and plant seed yield

Country Status (1)

Country Link
BR (1) BRPI0619242A2 (en)

Similar Documents

Publication Publication Date Title
KR101662483B1 (en) Plants having enhanced yield-related traits and method for making the same
CN101495640B (en) Plants having regulated expression of an extensin receptor-like kinase having enhanced yield-related traits and methods for producing the same
CN101842489B (en) Plants having enhanced yield-related traits and a method for making the same
KR101647732B1 (en) Plants having enhanced yield-related traits and a method for making the same
CN101801998B (en) Plants having improved growth characteristics under reduced nutrient availability and method for making same
KR101105330B1 (en) Plants with modulated expression of NAC transcription factors having enhanced yield-related traits and a method for making the same
KR101754083B1 (en) Plants having enhanced yield-related traits and a method for making the same
CN101415829B (en) Plants having enhanced yield-related traits and methods for producing the same
BRPI0721100A2 (en) METHOD FOR INTENSIFYING CHARACTERISTICS RELATED TO YIELD ON PLANTS, AND FOR THE PRODUCTION OF A TRANSGENIC PLANT, PLANT OR PART OF THE SAME, ISOLATED NUCLEIC ACID MOLECULE, ISOLATED POLYPEPTIDE, CONSTRUCTION, USE OF A BUILDING OF A BUILDING CONSTRUCTION, NUCLEIC ACID, PLANT, PART OF PLANT OR PLANT CELL, HARVEST PARTS OF A PLANT, AND, PRODUCTS
US20030061637A1 (en) Polynucleotides for root trait alteration
BRPI0718977A2 (en) METHOD FOR INCREASING SEED Yield IN PLANTS IN RELATION TO CONTROL PLANTS, CONSTRUCTION, USE OF THE SAME, PLANT, PART OF PLANT OR PLANT CELL, METHOD FOR THE PRODUCTION OF A TRANSGENIC PLANT HAVING INCREASE IN PLANT SEED CONTROL , Transgenic plant, harvestable parts of a plant, products, and use of a nucleic acid
KR20120126061A (en) Plants having enhanced yield-related traits and a method for making the same
CN101868544A (en) Plants having improved yield-related traits and methods for producing the same
CN102027120A (en) Plants having enhanced yield-related traits and a method for making the same
KR101227432B1 (en) Plants having enhanced yield-related traits and a method for making the same
CN101365786B (en) Plants having improved growth characteristics and methods for making same
CN101883783A (en) Plants having enhanced yield-related traits and a method for making the same
CN101605902A (en) Plants having enhanced yield-related traits and/or increased resistance to abiotic stress and methods for producing such plants
KR101429468B1 (en) Plants with enhanced yield-related traits and producing method thereof
CN101563461A (en) Plants having improved characteristics and methods of making the same
CN101952441A (en) Plants with enhanced yield-related traits and methods for their preparation
CN101969759A (en) Plants having enhanced yield-related traits and a method for making the same
BRPI0618328A2 (en) method for improving plant growth characteristics over corresponding wild type plants, construction, host cell, method for producing a transgenic plant, plant part or plant cell having improved plant growth characteristics over wild type plants corresponding, and, uses of a construct and a nucleic acid
CN101778942A (en) Plants having enhanced yield-related traits and a method for making the same
CN101595222B (en) Plants having improved seed yield-related traits and methods for their preparation

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]