Sorghum Maturity Gene and Uses Thereof in Modulating Photoperiod Sensitivity

REFERENCE TO SEQUENCE LISTING

The Sequence Listing submitted Nov. 8, 2013 as a text file named “UGA_—1540_ST25.txt,” created on Nov. 8, 2013, and having a size of 140,800 bytes is hereby incorporated by reference pursuant to 37 C.F.R. §1.52(e)(5).

FIELD OF THE INVENTION

The invention is generally related to the field of plant genetics and molecular biology, more particularly to genes involved in plant photoperiod sensitivity, and methods for modifying photoperiod sensitivity in plants.

BACKGROUND OF THE INVENTION

Biomass yield is one of the most important attributes of a biomass or bioenergy crop designed for ligno-cellulosic conversion to biofuels or bioenergy. To maximize yield, it is essential to tailor the plants' life cycle to the agro-environments in which they are grown. The transition from vegetative to reproductive growth is a critical developmental switch and a key adaptive trait that ensures that plants set their flowers at an optimum time for pollination, seed development, and dispersal. For example, temperate environments with a long growing season allow cereal crops to exploit an extended vegetative period for resource storage. Conversely, early flowering has evolved as an adaptation to short growing seasons.

For example, once grain sorghum initiates flowering, growth of the vegetative plant (stem, leaves) decreases so that carbon and nitrogen compounds can be used for grain production. As a consequence, biomass accumulation overall decreases to some extent during the reproductive phase and largely ceases once grain filling has been completed.

In contrast, a late or non-flowering bioenergy sorghum crop grown for biomass production will continue to accumulate biomass by building larger vegetative plants until frost or adverse environmental conditions inhibit photosynthesis. It is estimated that late/non-flowering biomass sorghum will generate more than two times the biomass accumulated by grain sorghum per acre assuming reasonable growth conditions throughout the growing season.

Flowering is generally controlled by environmental factors, such as daylength. Daylength regulates flowering by a phenomenon known as photoperiod sensitivity, which allows plants to coordinate their reproduction with the environment or with other members of their species. Photoperiod sensitivity refers to the fact that some plants will not flower until they are exposed to day lengths that are less than a critical photoperiod (short day plants) or greater than a critical photoperiod (long day plants). Long day (LD) and short day (SD) plant designations refer to the day length required to induce flowering. Facultative LD or SD plants are those that show accelerated flowering in LD or SD but will eventually flower regardless of photoperiod.

Therefore, it is an object of the invention to provide a gene in sorghum responsible for genetic control of photoperiod sensitivity.

It is another object of the invention to provide late or non-flowering recombinant sorghum plants.

It is yet another object of the invention to provide methods for modifying photoperiod sensitivity in plants.

It is a further object of the invention to provide methods for imposing photoperiod sensitivity on a plant process.

SUMMARY OF THE INVENTION

Compositions including the nucleic acid sequence of the sorghum Maturity gene 1 (Ma1), and expression control sequences thereof are disclosed. The expression control sequence can be photoperiod sensitive or photoperiod insensitive. The compositions and methods can be used to modulating flowering in plants, particularly sorghum.

Methods of using the compositions for modulating photoperiod sensitivity for flowering and other plant processes in a plant are provided. For example, methods are provided for developing genetically modified plant varieties in which flowering is accelerated, or delayed or prevented. Methods are also provided for treating a plant in order to accelerate or delay flowering in the plant.

Methods and compositions for placing a polynucleotide of interest under photoperiod sensitive or photoperiod insensitive control are also disclosed. The compositions and methods and can be used, for example, to make photoperiod sensitive a gene that is normally or naturally photoperiod insensitive. In other embodiments, compositions and methods and can be used to make photoperiod insensitive a gene that is normally or naturally photoperiod sensitive.

Screening methods are also provided for identifying plants for photoperiod sensitivity and chemical agents that can modify photoperiod sensitivity.

BRIEF DESCRIPTION OF THE DRAWINGS

FIG. 1 is a bar graph showing frequency distribution of F₂population of S. bicolor×S. propinquum as a function of flowering time. Also shown is a boxed line indicating average day length (hrs) over the time period. Also shown are two lines indicating the high (solid line) and low (dashed) temperature during the time period. S. propinquum and most F₂s flowered when photoperiod was less than 12.5 hours. Segregation of the S. bicolor and S. propinquum alleles at the Ma1 locus imparts dichotomous phenotype when grown in a temperate environment.

FIG. 2A is a diagram mapping the 1.1 centiMorgan (cM) interval delineated by progeny testing of recombinants. FIG. 2B is a diagram showing the % of conversion at the DNA marker loci plotted along the sorghum genome sequence (on base pair, bp, scale). The diagram also maps the relative locations of the FT gene (Sb06g012260) and SbPRR37 (Sb06g012570). The dark line at the top of the diagram indicates the span of converted regions with approximate locations of genes in the sequence shown as cross-hatches along the axis. While the terminal regions that these data exclude from consideration are physically small, they contain the majority of genes.

FIG. 3A is a diagram illustrating two major S. bicolor haplotypes (each with two rare variants) for the gene Sb06g012260 identified from analysis of re-sequencing data. One of the haplotypes (haplotype 1) closely resembled the allele found in the short-day flowering accession of Sorghum propinquum. FIG. 3B is a physical map showing the positions of four insertion-deletion events relative to the coding region of Sb06g012260. FIG. 3C is a diagram comparing the PRR37 alleles in S. bicolor (top) and S. propinquum (bottom). The S. propinquum allele has an “AT” insertion between 97 and 98 nucleotides after the translation starting site. This insertion causes frameshift shortly before the beginning of the PRR domain (arrowhead), leading to numerous nonsense mutations (arrows) and resulting in premature protein termination near the end of the PRR domain. Coding regions are shown as boxes, introns as solid horizontal lines, vertical bars indicate nucleotide substitutions between the two alleles.

FIG. 4 is a series of pie graphs showing haplotype frequencies for the gene Sb06g012260 in sub-populations from West Africa, South Africa, Central/East Africa, and Asia/India.

FIG. 5A-5C are bar graphs showing flowering (days) for individuals having haplotype 1 of FIG. 3A (empty bars) or haplotype 2 of FIG. 3A (shaded bars) for the gene Sb06g012260 in West Africa (FIG. 5A, 2008 p=0.005; R²=0.13) and South Africa (FIG. 5B (2008), p=3.84 E-08; R²=0.33) and FIG. 5C (2007), p=0.0346; R²=0.08). These data show a statistically-significant association of the haplotypes with flowering in subpopulations in which the two haplotypes each occur at similar frequencies.

FIG. 6 is a line graph of log p value versus Ma1 region (Mbp) showing the association analysis of Ma1 region markers and photoperiod sensitive in Sorghum bicolor based on routine application of the software TASSEL (Bradbury, et al., Bioinformatics, 23:2633-2635 (2007)), as detailed below. (♦) single marker analysis; (▪) analysis considering population structure.

FIG. 7 is a diagram showing homologs identified by BLAST of a candidate Ma1 gene (Sb06g012260) in sorghum, rice, and Arabidopsis genomes; and maize and sugarcane ESTs.

DETAILED DESCRIPTION OF THE INVENTION
I. Definitions

Before describing the various embodiments, it is to be understood that the invention is not limited in its application to the details of construction and the arrangement of the components set forth in the following description. Other embodiments can be practiced or carried out in various ways. Also, it is to be understood that the phraseology and terminology employed herein is for the purpose of description and should not be regarded as limiting.

Unless otherwise indicated, the disclosure encompasses conventional techniques of plant breeding, microbiology, cell biology and recombinant DNA, which are within the skill of the art. See, e.g., Sambrook and Russell, Molecular Cloning: A Laboratory Manual, 3rd edition (2001); Current Protocols In Molecular Biology [(F. M. Ausubel, et al. eds., (1987)]; Plant Breeding: Principles and Prospects (Plant Breeding, Vol 1) M. D. Hayward, N. O. Bosemark, I. Romagosa; Chapman & Hall, (1993); Coligan, Dunn, Ploegh, Speicher and Wingfeld, eds. (1995) Current Protocols in Protein Science (John Wiley & Sons, Inc.); the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (M. J. MacPherson, B. D. Hames and G. R. Taylor eds. (1995)].

Unless otherwise noted, technical terms are used according to conventional usage. Definitions of common terms in molecular biology may be found in Lewin, Genes VII, published by Oxford University Press, 2000; Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Wiley-Interscience., 1999; and Robert A. Meyers (ed.), Molecular Biology and Biotechnology, a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995; Sambrook and Russell. (2001) Molecular Cloning: A Laboratory Manual 3rd. edition, Cold Spring Harbor Laboratory Press.

To facilitate understanding of the disclosure, the following definitions are provided:

The term “plant” is used in it broadest sense. It includes, but is not limited to, any species of woody, ornamental or decorative crop or cereal, and fruit or vegetable plant. It also refers to a plurality of plant cells that are largely differentiated into a structure that is present at any stage of a plant's development. Such structures include, but are not limited to, a fruit, shoot, stem, leaf, flower petal, etc.

The term “photoperiod” refers to the period of a plant's exposure to daylight every 24 hours.

The term “photoperiod sensitivity” refers to the photoperiod that is required to induce a specific response, such as flowering. Some plants will not flower until they are exposed to day lengths that are less than a critical photoperiod (short day plants) or greater than a critical photoperiod (long day plants). In some plant species, photoperiodic control enforces long-day flowering. Therefore, a photoperiod sensitive plant can have either short-day or long-day flowering, but in both cases, the flowering is controlled by day length.

A plant is “photoperiod insensitive” or “day neutral” if the day length does not impact when flowering occurs. In order to modulate flowering based on day length, photoperiod sensitivity can be increased.

A “non-flowering” plant does not flower under the agronomic conditions, regardless of the photoperiod.

“Delayed flowering” refers to a plant that flowers on average at least 1 day later, including at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 days later, than a wild-type plant of the same species.

The term “non-naturally occurring plant” refers to a plant that does not occur in nature without human intervention. Non-naturally occurring plants include transgenic plants and plants produced by non-transgenic means such as plant breeding.

The term “plant tissue” includes differentiated and undifferentiated tissues of plants including those present in roots, shoots, leaves, pollen, seeds and tumors, as well as cells in culture (e.g., single cells, protoplasts, embryos, callus, etc.). Plant tissue may be in planta, in organ culture, tissue culture, or cell culture. The term “plant part” as used herein refers to a plant structure, a plant organ, or a plant tissue.

The term “plant material” refers to leaves, stems, roots, flowers or flower parts, fruits, pollen, egg cells, zygotes, seeds, cuttings, cell or tissue cultures, or any other part or product of a plant.

The term “plant organ” refers to a distinct and visibly structured and differentiated part of a plant such as a root, stem, leaf, flower bud, or embryo.

The term “plant cell” refers to a structural and physiological unit of a plant, comprising a protoplast and a cell wall. The plant cell may be in form of an isolated single cell or a cultured cell, or as a part of higher organized unit such as, for example, a plant tissue, a plant organ, or a whole plant.

The term “plant cell culture” refers to cultures of plant units such as, for example, protoplasts, cell culture cells, cells in plant tissues, pollen, pollen tubes, ovules, embryo sacs, zygotes and embryos at various stages of development.

The term “transgenic plant” refers to a plant or tree that contains recombinant genetic material not normally found in plants or trees of this type and which has been introduced into the plant in question (or into progenitors of the plant) by human manipulation. Thus, a plant that is grown from a plant cell into which recombinant DNA is introduced by transformation is a transgenic plant, as are all offspring of that plant that contain the introduced transgene (whether produced sexually or asexually). It is understood that the term transgenic plant encompasses the entire plant or tree and parts of the plant or tree, for instance grains, seeds, flowers, leaves, roots, fruit, pollen, stems etc.

The term “construct” refers to a recombinant genetic molecule having one or more isolated polynucleotide sequences. Genetic constructs used for transgene expression in a host organism include in the 5′-3′ direction, a promoter sequence; a sequence encoding a gene of interest; and a termination sequence. The construct may also include selectable marker gene(s) and other regulatory elements for expression.

The term “gene” refers to a DNA sequence that encodes through its template or messenger RNA a sequence of amino acids characteristic of a specific peptide, polypeptide, or protein. The term “gene” also refers to a DNA sequence that encodes an RNA product. The term gene as used herein with reference to genomic DNA includes intervening, non-coding regions as well as regulatory regions and can include 5′ and 3′ ends.

The term “orthologous genes” or “orthologs” refer to genes that have a similar nucleic acid sequence because they were separated by a speciation event.

As used herein, “polypeptide” refers generally to peptides and proteins having more than about ten amino acids. The polypeptides can be “exogenous,” meaning that they are “heterologous,” i.e., foreign to the host cell being utilized, such as human polypeptide produced by a bacterial cell.

The term “isolated” is meant to describe a compound of interest (e.g., nucleic acids) that is in an environment different from that in which the compound naturally occurs, e.g., separated from its natural milieu such as by concentrating a peptide to a concentration at which it is not found in nature. “Isolated” is meant to include compounds that are within samples that are substantially enriched for the compound of interest and/or in which the compound of interest is partially or substantially purified. Isolated nucleic acids are at least 60% free, preferably 75% free, and most preferably 90% free from other associated components. An “isolated” nucleic acid molecule or polynucleotide is a nucleic acid molecule that is identified and separated from at least one contaminant nucleic acid molecule with which it is ordinarily associated in the natural source. The isolated nucleic can be, for example, free of association with all components with which it is naturally associated. An isolated nucleic acid molecule is other than in the form or setting in which it is found in nature.

As used herein, the term “linkage disequilibrium” or “LD” refers to the situation in which the alleles for two or more loci do not occur together in individuals sampled from a population at frequencies predicted by the product of their individual allele frequencies. Markers that are in LD do not follow Mendel's second law of independent random segregation. LD can be caused by any of several demographic or population artifacts as well as by the presence of genetic linkage between markers. However, when these artifacts are controlled and eliminated as sources of LD, then LD results directly from the fact that the loci involved are located close to each other on the same chromosome so that specific combinations of alleles for different markers (haplotypes) are inherited together. Markers that are in high LD can be assumed to be located near each other and a marker or haplotype that is in high LD with a genetic trait can be assumed to be located near the gene that affects that trait.

As used herein, the term “locus” refers to a specific position along a chromosome or DNA sequence. Depending upon context, a locus could be a gene, a marker, a chromosomal band or a specific sequence of one or more nucleotides.

The term “vector” refers to a replicon, such as a plasmid, phage, or cosmid, into which another DNA segment may be inserted so as to bring about the replication of the inserted segment. The vectors can be expression vectors.

The term “expression vector” refers to a vector that includes one or more expression control sequences

The term “expression control sequence” refers to a DNA sequence that controls and regulates the transcription and/or translation of another DNA sequence. Control sequences that are suitable for prokaryotes, for example, include a promoter, optionally an operator sequence, a ribosome binding site, and the like. Eukaryotic cells are known to utilize promoters, polyadenylation signals, and enhancers.

The term “promoter” refers to a regulatory nucleic acid sequence, typically located upstream (5′) of a gene or protein coding sequence that, in conjunction with various elements, is responsible for regulating the expression of the gene or protein coding sequence. The promoters suitable for use in the constructs of this disclosure are functional in plants and in host organisms used for expressing the disclosed polynucleotides. Many plant promoters are publicly known. These include constitutive promoters, inducible promoters, tissue- and cell-specific promoters and developmentally-regulated promoters. Exemplary promoters and fusion promoters are described, e.g., in U.S. Pat. No. 6,717,034, which is herein incorporated by reference in its entirety.

A nucleic acid sequence or polynucleotide is “operably linked” when it is placed into a functional relationship with another nucleic acid sequence. For example, DNA for a presequence or secretory leader is operably linked to DNA for a polypeptide if it is expressed as a preprotein that participates in the secretion of the polypeptide; a promoter or enhancer is operably linked to a coding sequence if it affects the transcription of the sequence; or a ribosome binding site is operably linked to a coding sequence if it is positioned so as to facilitate translation. Generally, “operably linked” means that the DNA sequences being linked are contiguous and, in the case of a secretory leader, contiguous and in reading frame. Linking can be accomplished by ligation at convenient restriction sites. If such sites do not exist, synthetic oligonucleotide adaptors or linkers are used in accordance with conventional practice.

“Transformed,” “transgenic,” “transfected” and “recombinant” refer to a host organism such as a bacterium or a plant into which a heterologous nucleic acid molecule has been introduced. The nucleic acid molecule can be stably integrated into the genome of the host or the nucleic acid molecule can also be present as an extrachromosomal molecule. Such an extrachromosomal molecule can be auto-replicating. Transformed cells, tissues, or plants are understood to encompass not only the end product of a transformation process, but also transgenic progeny thereof. A “non-transformed,” “non-transgenic,” or “non-recombinant” host refers to a wild-type organism, e.g., a bacterium or plant, which does not contain the heterologous nucleic acid molecule.

The term “endogenous” with regard to a nucleic acid refers to nucleic acids normally present in the host.

The term “heterologous” refers to elements occurring where they are not normally found. For example, a promoter may be linked to a heterologous nucleic acid sequence, e.g., a sequence that is not normally found operably linked to the promoter. When used herein to describe a promoter element, heterologous means a promoter element that differs from that normally found in the native promoter, either in sequence, species, or number. For example, a heterologous control element in a promoter sequence may be a control/regulatory element of a different promoter added to enhance promoter control, or an additional control element of the same promoter. The term “heterologous” thus can also encompasses “exogenous” and “non-native” elements.

The term “percent (%) sequence identity” is defined as the percentage of nucleotides or amino acids in a candidate sequence that are identical with the nucleotides or amino acids in a reference nucleic acid sequence, after aligning the sequences and introducing gaps, if necessary, to achieve the maximum percent sequence identity. Alignment for purposes of determining percent sequence identity can be achieved in various ways that are within the skill in the art, for instance, using publicly available computer software such as BLAST, BLAST-2, ALIGN, ALIGN-2 or Megalign (DNASTAR) software. Appropriate parameters for measuring alignment, including any algorithms needed to achieve maximal alignment over the full-length of the sequences being compared can be determined by known methods.

For purposes herein, the % sequence identity of a given nucleotides or amino acids sequence C to, with, or against a given nucleic acid sequence D (which can alternatively be phrased as a given sequence C that has or comprises a certain % sequence identity to, with, or against a given sequence D) is calculated as follows:

100 times the fraction W/Z,

where W is the number of nucleotides or amino acids scored as identical matches by the sequence alignment program in that program's alignment of C and D, and where Z is the total number of nucleotides or amino acids in D. It will be appreciated that where the length of sequence C is not equal to the length of sequence D, the % sequence identity of C to D will not equal the % sequence identity of D to C.

The term “stringent hybridization conditions” as used herein mean that hybridization will generally occur if there is at least 95% and preferably at least 97% sequence identity between the probe and the target sequence. Examples of stringent hybridization conditions are overnight incubation in a solution comprising 50% formamide, 5×SSC (150 mM NaCl, 15 mM trisodium citrate), 50 mM sodium phosphate (pH 7.6), 5×Denhardt's solution, 10% dextran sulfate, and 20 μg/ml denatured, sheared carrier DNA such as salmon sperm DNA, followed by washing the hybridization support in 0.1×SSC at approximately 65° C. Other hybridization and wash conditions are well known and are exemplified in Sambrook et al, Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor, N.Y. (2000).

II. Compositions

Photoperiod sensitivity refers to the fact that some plants will not flower until they are exposed to day lengths that are less than a critical photoperiod (short day plants) or greater than a critical photoperiod (long day plants). Long day (LD) and short day (SD) plant designations refer to the day length required to induce flowering. Facultative LD or SD plants are those that show accelerated flowering in LD or SD but will eventually flower regardless of photoperiod. Most plants including sorghum must pass through a juvenile stage (lasting about 14-21 days for sorghum) before they become sensitive to photoperiod.

In general, Sorghum is a facultative SD plant where long days inhibit flowering and short days accelerate flowering. The degree of flowering photoperiod sensitivity in sorghum refers to the length of the short days that are required to induce flowering. Different sorghum genotypes vary in their degree of photoperiod sensitivity. For example, Sorghum inbreds have been identified with photoperiod sensitivity ranging from ˜10.5 to ˜14 hours and still others that are nearly completely insensitive to photoperiod.

Flowering depends on when seeds are planted and on the latitude in which they are planted. Therefore, in some embodiments, a photoperiod insensitive sorghum planted in Georgia in April can flower in approximately 48-55 days; whereas a highly photoperiod sensitive sorghum planted in Georgia in April can flower in ˜175-180 days, or may even fail to flower at all.

The maturity gene (Ma1) contains one or more mutation or deletions in some S. bicolor genotypes such that sorghum plants containing this mutant gene are photoperiod insensitive (day-neutral). Identification of this gene allows for identification of orthologous genes in related plants. Moreover, based on this identification, methods of modulating photoperiod sensitivity in plants by modulating the expression control sequences of maturity gene in that plant are disclosed. Methods are also disclosed for modulating photoperiod sensitivity involving modulating the activity of the protein encoded by the Maturity (Ma1) gene in the plant.

A. Ma1

Compositions and methods for modifying photoperiod sensitivity in plants are provided. The methods can involve modulating the activity of the endogenous gene or gene(s) responsible for photoperiod sensitivity in the plant.

For example, the methods can involve promoting the expression of one or more endogenous gene orthologous to sorghum grain maturity gene 1 (Ma1). Thus, the methods can involve introducing to the plant a composition that promotes maturity gene 1 (Ma1) activity in a Sorghum plant.

The term “Maturity gene” refers to the Ma1 gene found in Sorghum as well as orthologous genes serving the same function in related plants.

Sorghum

Sorghum has been an excellent biomass source with its high yield potential, high water use efficiency, and established production systems and is a representative plant that can be used with the disclosed methods and compositions. Sorghum is a genus of numerous species of grasses, some of which are raised for grain and some of which are used as fodder plants either cultivated or as part of pasture. The plants are cultivated in warmer climates worldwide. Sorghum is in the subfamily Panicoideae and the tribe Andropogoneae.

Sorghum is well adapted to growth in hot, arid or semi-arid areas. The many subspecies are divided into four groups—grain sorghums (such as milo), grass sorghums (for pasture and hay), sweet sorghums (used to produce sorghum syrups), and broom corn (for brooms and brushes).

Sorghum species include, but are not limited to Sorghum almum, Sorghum amplum, Sorghum angustum, Sorghum arundinaceum, Sorghum bicolor, Sorghum brachypodum, Sorghum bulbosum, Sorghum burmahicum, Sorghum controversum, Sorghum drummondii, Sorghum ecarinatum, Sorghum exstans, Sorghum grande, Sorghum halepense, Sorghum interjectum, Sorghum intrans, Sorghum laxiflorum, Sorghum leiocladum, Sorghum macrospermum, Sorghum matarankense, Sorghum miliaceum, Sorghum nigrum, Sorghum nitidum, Sorghum plumosum, Sorghum propinquum, Sorghum purpureosericeum, Sorghum stipoideum, Sorghum timorense, Sorghum trichocladum, Sorghum versicolor, Sorghum virgatum, and Sorghum vulgare.

Sorghum Maturity Gene 1

There are six classic maturity genes in sorghum that control flowering time termed Ma1-Ma6. Therefore, in general, sorghum plants with recessive Ma1-Ma6 genes (with low or no activity) flower earlier than plants with dominant or active Ma1-Ma6 genes that repress flowering.

Nucleic acid sequences for Ma1 genes in Sorghum bicolor and Sorghum propinquum are provided. It is understood that the skilled artisan can identify orthologous sequences in other Sorghum species for use in the present compositions and methods. For example, Ma1 genes from Sorghum almum, Sorghum amplum, Sorghum angustum, Sorghum arundinaceum, Sorghum brachypodum, Sorghum bulbosum, Sorghum burmahicum, Sorghum controversum, Sorghum drummondii, Sorghum ecarinatum, Sorghum exstans, Sorghum grande, Sorghum halepense, Sorghum interjectum, Sorghum intrans, Sorghum laxiflorum, Sorghum leiocladum, Sorghum macrospermum, Sorghum matarankense, Sorghum miliaceum, Sorghum nigrum, Sorghum nitidum, Sorghum plumosum, Sorghum purpureosericeum, Sorghum stipoideum, Sorghum timorense, Sorghum trichocladum, Sorghum versicolor, Sorghum virgatum, and Sorghum vulgare can be identified and used in the disclosed methods.

Within the species Sorghum bicolor, there are both day-neutral (photoperiod insensitive) and short-day flowering forms. The vast majority of wild members of the species are short-day, as are forms cultivated in the tropics. Forms cultivated in temperate latitudes (such as most of the USA) for seed/grain have been selected for day-neutral mutations. Therefore, the skilled artisan can use the guidance provided by the sequence comparisons to identify variants of Ma1 genes that can generate a photoperiod sensitive or insensitive phenotype.

Also disclosed is a transgenic plant having a nucleic acid molecule, or antisense constructs thereof, encoding a Ma1 gene product, or variant, such as a codon optimized variant thereof, optionally operatively linked to an heterologous regulatory element. For example, disclosed is a transgenic plant characterized by high photoperiod sensitivity, low photoperiod sensitivity, or photoperiod insensitivity, wherein the cells of the plant express a nucleic acid molecule encoding an Ma1 gene product, or antisense construct thereof, that is operatively linked to an expression control sequence. In some embodiments, the construct encodes an inhibitory nucleic acid such as siRNA or RNAi that when express down regulates the expression of Ma1.

Nucleic Acids

Ma1 Gene

Disclosed are polynucleotides containing a maturity gene from a sorghum plant. It is understood that where coding sequences for a maturity gene are provided, also provided are the non-coding sequences that are known or can be identified to correspond to the coding sequences that are provided. For example, where a maturity gene is provided, also provided for use in the disclosed compositions and methods is the 5′ untranslated region (UTR), which contains the endogenous promoter for the maturity gene. It is understood that the skilled artisan can identify these sequences with routine skill and experimentation based on the sequences that are provided.

1. Sequences for Short Day Flowering

The S. propinquum cultivar from which the sequences described below are derived is a short-day cultivar, that has a dominant (functional) Ma1 allele. Sequences for a dominant Ma1 gene are therefore provided.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in short day S. propinquum includes the nucleic acid sequence:

1
AAAAGAAAAG TGAGCACACC ACGACCTGTC ATCAGCTCAT GGTCAGCTCT ACAAACTTAT

61
AGATTGCATC GAGATCTAAG ACTCAGGTAC AAATCATGTC AACATCTAAT GGTTTAGAAA

121
ATGAAAAGTT TTGAGTTTCA AAATATGATA CGTGATATTA ACATTTGAAC TTTTAGCAAG

181
ATCTGAAATA AAAAATTCAA CTAGATCATG TTAACATTGA TATAATCGCT TCCAATCGCC

241
TCCCATCACT TCCGCTAGAA AACTTTTTTT CTCGATTTAA TTAATGAAAG GGTAATAACA

301
TCATTGTACA AGATTCTTTC AAACCTCAAC CCCTATCATC GACGGTGACG GCTCCCTATA

361
ACACGCACTA GTGGACGCCG GGCGGGTGGA ACCCTAAGAA GATTTAAAAA AACTTAAGAA

421
GAAGATTTTT ATCTAACTAA CTATAGTACT TATATCATAC ACTATACTAT TCAAAATATT

481
ATTTTCACAA TTATGAATTT ACCCTTTTAC TCTTCATTAA AAAAATACGA AAAAAGAATC

541
ACCACGTCTC TATTTAGGGT CCTAGTCCCC ATAATTTAAG AGGCGGTGAG AGACGATGTG

601
ACGTCTATGG ACCACCGACC AAAGACACAC CTATCGTCTC CCATCGCCTT GCTTCCATCG

661
CCTCTCATCG CTTTTCATAT TCTAGATCCA GCGGCCATAG ACACACCAAT CGTTTCTCAT

721
CGCCTCTCCA ACCATTGTAA AAATATTTAT AATTTTGATA TAAAATTTGT CTTCACTTGA

781
GTTCATGCCA AAAAAATTAT ACATATTATT TTCGTGTGAG AATTTACAGA AGTGGACTCT

841
TAAGATGTCC AAATGTAAAT GACCCTATTT ATTATGAGGC GCGGATCTAT AGGCCTGACT

901
CTGAAAATGG ATTATGGATT TGAGATAATA AATTTAAGGG CCTATCTTCG CACATAACAT

961
CTATAGTTCC TAAATTTTTT TTTATTGTAG TAGTAGAACT TTTCTCCCTG TAAACCAAGT

1021
TGACGCTGGG CTTTATTTTG CGACACAGAA CACCAAATTG GTGGCTATGA ACTCTTCCAC

1081
CTGGGCAGGG AAAACGGTTT ATTATGTTTC TCTTTAATTT ATCTATCGTG GCACTATAAC

1141
ACAACATGGC TTTGCCGACA CTTCCAACTA TCGGCAAAGG GTACCTTTAC CGACACTTAA

1201
CGTCTCACGA AAGGTTTTGC CGACAATTTT CAAACAGTCG CGGTAGAAGC AGTTGGCGAA

1261
ACTTTTGCCG ACAGTTAAAG GCATCGCCGA CACATTTTCT GTAGTCAAAT GGCATACCTA

1321
CGCCGACAGT TGAACTTTCA CCGACAGTGA ACCCTTTGCC GACAGTTTGG ACCTACGCCG

1381
ACAGTTTGGA CCTTTTCCGA CAGTTGGTAT GTTAGCGAAA CCGTTTCTAG GGTGTTTCAT

1441
AAACCATGCC TTGTCCAACA GTAGAAGTGT CGGCAAAACT ATATTGCTAG GATGTAGATA

1501
CAATTTAAAT ATTTTAATAA ATACACATCA CATTGATTGA GCAAAATCAC ATGGTCTGTT

1561
TTCACTAAAA CTGTCAGAGG TACACTCCAG TACTACCAGT ACGTCGCCCG CACAGTGGCC

1621
AAGGATTTTA CTGCTACTGT TGATTAACAT AAGCACTTGC GACTTTCCCT AAAATCTTTT

1681
ATAAAACAAC GGCCGCAATA ATATTGAACT ATTTTTTTTC TAGTACCAAA ATTAGAATTT

1741
GATCCCTCAC CTCATTACAT CCATAGTAAC ATGACCAGAT ATATATGGAC AGGATGGGAT

1801
CACTCAGCGA GCAGATACAC TGAGCGATTC ATAATCAGAT TTTTTAATTT CTTCTAGTGA

1861
AGTGGGGTTT TCCTAGTCTT TTAACATTCA AAATTTAGTA CAAACTTTCC CTAGTAAATG

1921
CCTTCTAGTA AAGATTTCCT AGTATTTTGA CTAGCGATAG TGTTTTATTA CTAATTAAAA

1981
ACATTAGAAG AACTCCATTT AGTGATTGGT TGTTTGGATT AGTCTTCTCA CGTTAGACCT

2041
ATATATGCAG GACAACTCAA GCCAGCATAA ATATATGAAA TATCTTGGTG TTTGTTTGTC

2101
TGACACAGGC AACCGCGTTT GGTATAAATG TGTTTTCTTG TTTACATTTT ACCATCTATA

2161
GTCATCTCAA TGTTATATAG TAGAGGCTTC ATGTTTGTAG TAGATAAGGT AGAGAATTGA

2221
GAATATTTTA TTTTTGTGCG ACCATCAATT TTATGTAATC TGCATTGTCT AATGCTTTAT

2281
TTGACATTTG AAACTACTTA ATTTGACAGT TATGCAGGTC CGCATGATCC TATGAAAGCA

2341
ATTAATTAGT ACGGGTAAAC TGCACTACAC AAGTTTGCTA GTACTATTCT ATTAACCGAC

2401
CTGTCAATAT TACCTTAAGT TACTGATTTC AATTAGAATC TAACACATTC AGGAAAAGAA

2461
GTTTCACTAG TACAAAAATC ATTTTCGTTG GCACGTTGTT TTTTTTTTCA CAGGCAGTTC

2521
ACAATATCAT GGTGCTAGTA GAAAAATTTC AACGGGCCCA ACAAGAGAAC CGCCAGGCGG

2581
TCTTCTTAAT TCAACCGCCT GTGTAAACTT TCCATTTACA TAGGCGGCTT ACGATAAAAA

2641
CCGTGTGTAT AAATACCATT AACACAGGCA GTCGAGTTAC GACAACCGCC TGTGTAAATG

2701
TGTCTTTTTA CACAGGCGGT TTGTATAGAG GGCCGCCTGT GCTAATATAT TTACACAGGC

2761
TATGAGCCGC CTGTGTTAAG TCTTCTATAA ATACCCTTCG TCCACCTCCA GACAAGAACA

2821
GTTACTCCCA TGAGCTCTGC ACACTGGCGG ACCAGACGAT TCCAGTTTCC AAGGGGGGAG

2881
GTTTTGATTT TCATTTCTTT GGTGAGAAAC TTCCAAAAGG TTAGTTAGTG CCATTGATGC

2941
TATTTTTTAA GCGATTCTTT GGTTCAATTC TTGTATTGGA GGTGCTCTAG ATCTAGAGTT

3001
CATCATGCAT TCTTGCTTAG GGTTAGAGTT CATAGGGCAA AAAGAGAGAG ATTTAGCTAA

3061
ATTTTTATGT AAATTCATAG TAAATTGTAA AAATTAAAAA AAATAAAAAA TAAATACTTT

3121
TTAGAATTCT TGTGAGTAGA TCTATACAAT AGAGTAATGA TGAGGATATT TTGAAGTTTA

3181
TAATTTTGAT TCAGTTTTAG CTTTTCTTTT TTCAGATGAA TTAGACTTTA TAAACTCAAA

3241
CATTAAAATG TTGAAAATCA TAAAATGGCA AATAAATACT TTTTCAAATC TTTGTGCATA

3301
AATACTTCAT AGAAATCCTT GAATTATTCC TAAATTTTAT ACAATTGTTT CTTATAATTA

3361
TGAAAATGAG TTTAAACAAT TATTTAAATT CCATAAATTG TAACTCCGTA AGGTGTAGGT

3421
TTTCATCTCT GTTTAATAGA AGGAGGTTAG TATCTTAGTT AAGTCTGTTT TCGGGGGTTA

3481
TATTAGTTTT GTTTTTAGAT TGACCTACAT TAATTGTTCT TAACTAATTA CAGCTAAATA

3541
TGGAGAGGTC ATTATGGATG TACAACTTAT CAAGATTGGA CCTATCATAT GTAGTGCAGG

3601
TCCAAAAATT TATTGATGTC GCAAAGATAC ATGCTCGCAG AACAAAGGCG AAGCACATAT

3661
GTTGTCCATG CGCAGACTGC AAAAATATTA TGGTATTTGA CAATGTAGAA GCAATTACTT

3721
CCCATCTGGT TTGAAGAGGA TTTATGGAGG ACTACTTGAT TTGGACAAAA CATGGTGAGG

3781
GTAGTTTTGC ACCTTATATG CGGACAACTG ACAACACTGC AACTAACATC AATGTGGAGG

3841
GTCCAATGCC ACCTCTCAAT GAATTTCATG CTATGCCAGA TGTTAATGAA ACTCATACGT

3901
CTGATGTCAA TGAAACTCAG CATGCTAACA CAGATGTTGT TGAAGATGCA GATTTCTTAG

3961
AGGCAATAAT GAACCGTTGT GCGGATCCAT CAATATTCTT CATGAAGGGA ATGAAAGCAT

4021
TGAAGAAGGC AGCAGAGGAC ACTTTGTACG ACGAGTCAAA AGGTTGTACC AAACAATGGT

4081
CGACATTATG TGTTGTTCTT CAGTTTTTGA CGATGAAGGC TAGACATGGT TGGTCCGATG

4141
CTAGCTTCAA TGATTTCTTG CGTGTACTTG GAGACCTTCT TCCTAAGGAG AACAAAGTGC

4201
CTGCTAACAC ATACTATGCA AAGAAGCTAG TCAGTCCACT TACGATAGGT GTTGAGAAGA

4261
TCCACGCATG TAGAAATCAT TGTATTCTAT ATCGAGGTGA TCAATATAAA GACTTAGACA

4321
GTTGTCCAAA CTGTGGTGCC AGTAGGTACA AGACAAACAA AGATTTTCGG GAGGAAGAGA

4381
ATCTAGCCTC TGTTTCTACA GGGAGGAAGC GAAAGAAGAC CCAAACAAAG ACTCAACAAG

4441
ACAAGCGCTC AAAGCCTAGT AGCAATGAAG AAGTGGACTA TTATGCATTG AGAAGAGTCT

4501
CCCTATGAGC CAAAAAAGGG GACAGCAGCA GGCACAACTC TCTTTCTGAA AGGACTTGGA

4561
AAGCAGCGGA CGGCACGGCT CATTGAGCTC GAACCGTCAC AGAAAAAGGA AGCCACCGCC

4621
CAGTCAATAG AAGCCATGCC CCCATCAAAG GAAGCCCCAA GTGGCGATGT ACATATTGAA

4681
CAGCCATCAA GTCAACCATT GACCCTAAAG GATATCAGAA AGCCAACGAT TGATGATTAT

4741
GTCAATGTCC CTAGTGACTA TGTGCCCGGA AGGCCTATGC TCCAATGGAC GCTGCTCGAT

4801
TAGATTCAAT GGCTGATAAA AAGGTTTCAT GACTGGTACA TGAGAGCAGT GCATGCTAGC

4861
CTCCATGGAA TCAGAGTTGA TATACCAACA GACATGTTTG CTACTGGTAA CAAAAAAAGC

4921
AAGACATTTG TTACCTTTGA GGACATGCAC TTGTTATTGA ACTATAGGCG GCTTGACGTC

4981
CAACTCATAA CAATCTGGTG CCTGTAAGTA TCACTCATGC ACACACAATT ATTATATATT

5041
AATATGTAGT GTGAAACTCT AATATGTAGA TGTTGTCTGT AGTTTGCAAG ATCACGAGCA

5101
GATGTCATTA TTATCTGCCG GATCGATGGT CGGTTATCTG AGCCCTATCA AGTTACAAGA

5161
AAATATGAAC AAATTCGTAT TATCAAAGGA AGATAGAGCA AAGATAGAGG AAGACAAAAC

5221
ACCAGGATAA TTATGCCATC TATCTTGGTA GATCAATGCT GAGGTATAAA TATAGGGATT

5281
TTATATTGGC ACCATACAAC ATTAGGTAAG CTTGACTTCA TATACGTATT TCAAATTATC

5341
GTGTAAACAA TATACATGTG TCGCTCACTC ATTTATTCAT GCAGTGACCA TTGGATTGTT

5401
TTTTATATTT ATCCCTTCGA AGGGAAGGTG CTTGTCCTAG ACTCTTTACA TGTTCCTCCC

5461
GAGAAGTATC AACCATTCTT GGTTCAATTA GAAAGGTGAG CCAACATGAA ACCACATGCG

5521
TACTTATATA AATTAGAGTT TCAAAATAAC TTTAGTGATT TAGGTTCGAT ATCTACGGGG

5581
CATGGCGGTT TTATAAGAAA CAAAAGGGAC CTGTCGACGC TGCACGCTCA GATCCTAGGA

5641
TCCCATTGAT GATACAACAC CACTATCCGG TAAGTTTTCT GAACACATTT CATCATATAA

5701
ATAATACATA AAGCATGGCA AATTTAGAAT AATCCGTTGC TCATTATATA GTGCCACAAG

5761
CAACCACCTG GATCGGTCTA TTGTGGGTAC TATGTCTGTG AGTTTATAAG GCAGCGGGGA

5821
CGTTACGTCA AGGACAAAAA TATGGTAAAT AATATCTATG TATGAAAGTT TTCTCATTAA

5881
AGCTGCAAAA TTATATATTG AACATGTGTC AATCATGCTT TTAAACTTTA TTTTCAGCCG

5941
AAAAAGCAAG GAAAAGACGT GCCCTTTACA CCAAAGACTC TGGAAGATAT AGTAGCATAC

6001
TTGTGTGGTT TTATTATGAG AGAAATAATT TCAAGTGACA GTGCATATTT TGATCATGAG

6061
GGCGATTTAG CAAGTGATAA ATTTAGAGTG CTGACAGACA TAGCAGGTCT AAATCTGAAG

6121
CGAAACGACA TGTAAACATT GTATGGTTGT GCGGATAACA TGCATTGACG TGTATATATA

6181
TAATTTTATG GTTGATGTTT GATTTGTTTA CAATTCTATA ATATATATAT GTGGTGTATG

6241
TATGATGTTG TGTGTGTATA TATATATATA TATATATATA TATATATATA TATATATATA

6301
TATATATATA TATATAATGT TTAGCACTGT GTTTGGTGGG AAAAATTAAA ATTTGAAATA

6361
TATATAAAAA ATTATTTACA CAGACAGTGT ACGTGTCGAG CGTCGTCCTG TGCTATACAA

6421
ATACATTCTA ACAGGCGGCT CGCCTTGTCC ACCGGTCGGT TAAAAATACA TTTCCACACN

6481
GGCCTGGCTG GGAGAGCCGC CTGTGAAAAC ATAATTTTCA CAGGCGGCTC GCACAGCCCC

6541
GCCTGTACTG TGGTCCATTT TGTACTGACC CCTGGTACAG GCGGTGGGCT TGGCCGCCTG

6601
TGAAGATGCT TTTAGCACCG CCTGTAAAAA TGTTTTTTGT AGCAGTGTTT TTCTTATTAG

6661
TAGTATCTTT TATACTAATT AAGATTCAAT AAAAATTCAC CATGACATCC CCATTGCCAA

6721
GAGAATATTT CGCCGCCCCT CAAAGCAGCC AATAAGGCTT TACTAAAAAG ACTATCCACG

6781
CAGTAGAGAT TTAGTCAAAA TATTCCAATA GCAATTGTTT CCTGCCTGCT TGACCTTCGT

6841
CAGCCACTCA CTGTATAAAT ATCGCACCAC GCCCTTTGCA GGCTTACAGA GCTTGTATTA

6901
CGTACTAACA AGGCACACAC AGTACCCTGT GTTCACCGGC CCTGCACAAA ACTCAAGCAG

6961
TTATTACTAA CATGGCGGCT AACGATTCCT TGGTTACTGC TCATGTGATA GGAGATGTCT

7021
TGGACCCCTT CTATACAACC GTTGACATGA TGATCCTATT CGATGGTACT CCTATTATCA

7081
GCGGCATGGA GTTGCGCGCT CCGGCGGTTT CTGACAGGCC AAGGGTTGAA ATTGGAGGAG

7141
ATGATTATCG AGTTGCATAT ACTCTGGTAA ACTCATGCCA TGTCAATTAA CTAGTAGTTG

7201
AATTTAGATG CTGGTGGTAT CGTGGATACA TGTACTATAT GTTATGGTTG ATACATATTT

7261
GTTTAATTGA TCGCAACACC ATTTGCGGTA ACTTCAAATT ACATTCTTTC AATATATAGG

7321
TGATGGTCGA TCCTGATGCT CCTAACCCAA GCAACCCAAC CTTGAGGGAG TACTTGCACT

7381
GGTAAGAGAA ACCTATAGAC GACAATTATT GTTGTTGGCA TGTTTTGCCC ACATATACTT

7441
TGTGTGTGTA TATTTGTGCT TATGCTTCTC CATAAAATTT TGGTGTATGT CTCAAGAGAG

7501
ATAGGTATAG AGGTTAGCAG TCCTTTAAAA ATGGTTTAAT CCAGTAGTTT TTTTTCGGTC

7561
GGACTGCTCG AATTATTGTA TATATGGAGA TCACATGCTA GTAACTTTTT CAATAATTTC

7621
ATGTTTCGAG CAGGATGGTG ACTGACATCC CAGCATCAAC TGATAATACA TACGGTGAGT

7681
ACACCCCTAT TCCCATTTTG AAACAAGTAG AATGTCTATT TTTATGATTT AGTATGTTCG

7741
TGACAATAGG CTATAGCTAT TTTGAAACTT CGGGAGCATA AAATAGTACT CGATTTTGTA

7801
TAACCATAAA CACACAGCTA GCCAATCTCT ATTCATATTT ATTTTAGTTT TATTTGCCGA

7861
ACCATCCTCA ACATCATAGC CACTTGATCG ATCATCTCAA TCAGCGTTTG TATCCTTGCC

7921
CGCTTGATTA TCATCCATGG CAGTTCATAT TTTTTTTCAT TTCTTTCATG CTTGTTATAG

7981
TTTTATCTGA TGAATCCAAG ATGTTATTGA TCAATTAGTT CAGATGAGCA GTAATGCATG

8041
TTGGAGGTTT GGTAGTATAT ATACGTTCAA AATTTCACGA AATCGGTAAT TACGGTGGGA

8101
GCCAAAAAAA ATTCCAAAAT TTCGTATTAC ATTAATAATG CATGTGCTGT AGACTCATAT

8161
TTTCTATGAT TTCGATTCTG TCACCATCCT GCTCGAATAT TTAAATCATG CTAATATTTT

8221
GTTTACATCT AAATCTTTTA TAAAAATTAT AATTTATATT TGGGTTTAAC AATTTCGGGC

8281
GCGTTTAGTG AGATTGGGTA ATTTCGGAGC GAGGCCACCG GCCACACGAA AAATTNCTAT

8341
ACACGNACTA TATGTGTACA TGTACATGCA TGGCACCCTG ATAGGCTACC CCATGGGGAA

8401
AAAATTGGAA ACGGACCATT CATACGCAGT CGTGGTGCAG ACTGTGGGCC ACAATAGCAG

8461
TGTAAACATA ATTACGGTAA TCAAATACCC CATGGGACCA TATATATCAT CCACAGATCC

8521
GTACGGTGCT TCCGTGTGGA TGGTCTACAC CAGATCTTTT CCACACCATA AGGGCAGCAA

8581
TGCAGCATCA TATTCATATA TGCACTAGTG ATGTACCATT TGGCTTATAT CATATTCAAC

8641
CTAACTCCTT GGAAACATTA TGATATTCTA TTGGGTTGAA GATGTCACTA CTACAAAAAA

8701
AAATCTTATG AGAGGTGTTT TGAAAACTGC CGGAGGTGCT TAAAGGAGAC AGACGAGTTA

8761
GGACAACCGT CTCTATTAAT GTGTACTAAC TGAGGTAGTT ACCGTAACGT GCCTGACTTG

8821
ATTAACAGAT TCAACCGTCT CAGTAAAGGC CATGATTAAC CGAAACAGAT TCGAGAGTTT

8881
TCTTAAGTAG TTAAACTATT TTAATCTTCA CCGAACTTAT AGAAAATGAA AGAGCTAACA

8941
CCAATATTTA TAAAAATAAA TTAGTATCAC TAAATACATC ACGAAATCTA TTTGGTGTTG

9001
TAGAAGTTAT CCTTTTCTAT AAAATTGATC AAATTTATGA TAACTTAGTT TTAGGAATTC

9061
ATTTATTTTA GGACAACTGA GGAAGTACAT ATTTTTTAAG TCATCCACAA AGTAGTGGAT

9121
CCAATTTATT ACATTACTCT ACTACTTCAA ACTGAACAAA AGCCTAATCC TGGTTATTTT

9181
TAGAGTGATT TTTTACAACA TCAGCAGTAG TCCAGAAAAT GGGAGGACAT TAATAAAAGT

9241
GAAAAGGAGC AGAAGAAAGA TTACGGTATT TTATTTGTGC TATTTGTTTA ACTATTGGCA

9301
GTTTGGGACC GAAATAAATA ACTGTTCGTA GCTCTATATT TGTCGATTCA AAAAGTGTAA

9361
CGATGATTTT TGTGTTTCAA AAGAAAAATA AAGAAGTGCA CCAATGATTG GATATCATAG

9421
GCTATATATG TTGGATTAAT TGCATCCAAC GTATATAGTG AAAATGCTTT TCAATCAAGT

9481
AATCTTCGAG CGGTTACCAG TTTTAATAGT TGCGAGTCGT CGTTTTTTAT GTACCCTAGG

9541
ACATATATAT CCGCATGTAG ACGATGATGA GACTAGCAAG TTTTTTTTTT TTTTTGAGCA

9601
AATACATAAT TATTGGATTT GCAGGCCGTG AGATGATGTG CTACGAGCCC CCTGCCCCGT

9661
CCACGGGCAT CCACCGTATG GTGCTGGTGC TATTCCAGCA GCTTGGCCGT GACACGGTGT

9721
TCGCGGCGCC GTCCAGGCGC CACAACTTCA ACACCCGTGC CTTCGCCCGC CGCTACAACC

9781
TCGGCGCGCC CGTCGCCGCC ATGTTCTTCA ACTGCCAGCG CCAGACCGGC TCCGGTGGCC

9841
CCAGGTTCAC CGGGCCCTAC ACCAGCCGAC GTCGTGCGGG CTGATGACGA CGATCGTCGT

9901
TACGTCACGT GTACCGTACA CATATATGTA TAGATATACA TGCATGCATG TTCCATGGTA

9961
TAGGATCGGT GACAAAACGT CTAATAATGT ATACACACAC ATGCATGGAA TGCATGTAAT

10021
AAGAGAATAT ATGTATAATA AGTAGGGGAG AGCATGCATA TATTGTGTAC ACGCGTCCGA

10081
TGCGTATAGC CCTTTACATT ATTGTAGTTG TAATCAGCTG TTTAAGCATT CTGCTGTGTC

10141
AGAACATGAT GCATATATAG TTTGGTGTGA GTATTGATCT AGTGGAACTC TTATCAGCCT

10201
TCAACTCTTA TCACAAGTGT AAGATATAGC TTTTATACCT TCAGGTGTCT TCCCAGTGTA

10261
CCTAGAAATG CTACAACGGT TGTATTTTAT CTATGCGCTT CACTACTGGA AACCTGAATA

10321
CTTCTGTGGA TGTCGAATTT TTCTGTGCGT TTTTTTCGAT ACACACGGAA AAATTATAAT

10381
TATTCTGTGG GTTTTAAAAT ATCCTCATAG AAAAATACAA ATACCCACAG AAAAATTATA

10441
TCATTTTTCT GTGCGTGACA ATACACTCAC AGAAAAATTA CAATTTTTGT GTGTGTTTAT

10501
ATAAAACGCA CAGAAAAAAT AATCACACAC AGAAAAATTA TAATTATTCT GTAGGTTTCT

10561
ATAAAACGCA CATAAAAAAT AAACACACAC TGAAAAATAG AACAAGCACC CTCATACTAA

10621
ATTCATATAA ACACCCATAT TTTTTTCTTT TTAATCTCTC TGTAAAACTT GTAACTAGTT

10681
TTTCCCTCTC GTACTAACTC CAAATTGGAT GATTT

(SEQ ID NO:1 Sb06g012260—S. propinquum) or functional fragment, or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:1.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:1, including introns, can be:

1
ATGGCGGCTA ACGATTCCTT GGTTACTGCT CATGTGATAG GAGATGTCTT GGACCCCTTC

61
TATACAACCG TTGACATGAT GATCCTATTC GATGGTACTC CTATTATCAG CGGCATGGAG

121
TTGCGCGCTC CGGCGGTTTC TGACAGGCCA AGGGTTGAAA TTGGAGGAGA TGATTATCGA

181
GTTGCATATA CTCTGGTAAA CTCATGCCAT GTCAATTAAC TAGTAGTTGA ATTTAGATGC

241
TGGTGGTATC GTGGATACAT GTACTATATG TTATGGTTGA TACATATTTG TTTAATTGAT

301
CGCAACACCA TTTGCGGTAA CTTCAAATTA CATTCTTTCA ATATATAGGT GATGGTCGAT

361
CCTGATGCTC CTAACCCAAG CAACCCAACC TTGAGGGAGT ACTTGCACTG GTAAGAGAAA

421
CCTATAGACG ACAATTATTG TTGTTGGCAT GTTTTGCCCA CATATACTTT GTGTGTGTAT

481
ATTTGTGCTT ATGCTTCTCC ATAAAATTTT GGTGTATGTC TCAAGAGAGA TAGGTATAGA

541
GGTTAGCAGT CCTTTAAAAA TGGTTTAATC CAGTAGTTTT TTTTCGGTCG GACTGCTCGA

601
ATTATTGTAT ATATGGAGAT CACATGCTAG TAACTTTTTC AATAATTTCA TGTTTCGAGC

661
AGGATGGTGA CTGACATCCC AGCATCAACT GATAATACAT ACGGTGAGTA CACCCCTATT

721
CCCATTTTGA AACAAGTAGA ATGTCTATTT TTATGATTTA GTATGTTCGT GACAATAGGC

781
TATAGCTATT TTGAAACTTC GGGAGCATAA AATAGTACTC GATTTTGTAT AACCATAAAC

841
ACACAGCTAG CCAATCTCTA TTCATATTTA TTTTAGTTTT ATTTGCCGAA CCATCCTCAA

901
CATCATAGCC ACTTGATCGA TCATCTCAAT CAGCGTTTGT ATCCTTGCCC GCTTGATTAT

961
CATCCATGGC AGTTCATATT TTTTTTCATT TCTTTCATGC TTGTTATAGT TTTATCTGAT

1021
GAATCCAAGA TGTTATTGAT CAATTAGTTC AGATGAGCAG TAATGCATGT TGGAGGTTTG

1081
GTAGTATATA TACGTTCAAA ATTTCACGAA ATCGGTAATT ACGGTGGGAG CCAAAAAAAA

1141
TTCCAAAATT TCGTATTACA TTAATAATGC ATGTGCTGTA GACTCATATT TTCTATGATT

1201
TCGATTCTGT CACCATCCTG CTCGAATATT TAAATCATGC TAATATTTTG TTTACATCTA

1261
AATCTTTTAT AAAAATTATA ATTTATATTT GGGTTTAACA ATTTCGGGCG CGTTTAGTGA

1321
GATTGGGTAA TTTCGGAGCG AGGCCACCGG CCACACGAAA AATTNCTATA CACGNACTAT

1381
ATGTGTACAT GTACATGCAT GGCACCCTGA TAGGCTACCC CATGGGGAAA AAATTGGAAA

1441
CGGACCATTC ATACGCAGTC GTGGTGCAGA CTGTGGGCCA CAATAGCAGT GTAAACATAA

1501
TTACGGTAAT CAAATACCCC ATGGGACCAT ATATATCATC CACAGATCCG TACGGTGCTT

1561
CCGTGTGGAT GGTCTACACC AGATCTTTTC CACACCATAA GGGCAGCAAT GCAGCATCAT

1621
ATTCATATAT GCACTAGTGA TGTACCATTT GGCTTATATC ATATTCAACC TAACTCCTTG

1681
GAAACATTAT GATATTCTAT TGGGTTGAAG ATGTCACTAC TACAAAAAAA AATCTTATGA

1741
GAGGTGTTTT GAAAACTGCC GGAGGTGCTT AAAGGAGACA GACGAGTTAG GACAACCGTC

1801
TCTATTAATG TGTACTAACT GAGGTAGTTA CCGTAACGTG CCTGACTTGA TTAACAGATT

1861
CAACCGTCTC AGTAAAGGCC ATGATTAACC GAAACAGATT CGAGAGTTTT CTTAAGTAGT

1921
TAAACTATTT TAATCTTCAC CGAACTTATA GAAAATGAAA GAGCTAACAC CAATATTTAT

1981
AAAAATAAAT TAGTATCACT AAATACATCA CGAAATCTAT TTGGTGTTGT AGAAGTTATC

2041
CTTTTCTATA AAATTGATCA AATTTATGAT AACTTAGTTT TAGGAATTCA TTTATTTTAG

2101
GACAACTGAG GAAGTACATA TTTTTTAAGT CATCCACAAA GTAGTGGATC CAATTTATTA

2161
CATTACTCTA CTACTTCAAA CTGAACAAAA GCCTAATCCT GGTTATTTTT AGAGTGATTT

2221
TTTACAACAT CAGCAGTAGT CCAGAAAATG GGAGGACATT AATAAAAGTG AAAAGGAGCA

2281
GAAGAAAGAT TACGGTATTT TATTTGTGCT ATTTGTTTAA CTATTGGCAG TTTGGGACCG

2341
AAATAAATAA CTGTTCGTAG CTCTATATTT GTCGATTCAA AAAGTGTAAC GATGATTTTT

2401
GTGTTTCAAA AGAAAAATAA AGAAGTGCAC CAATGATTGG ATATCATAGG CTATATATGT

2461
TGGATTAATT GCATCCAACG TATATAGTGA AAATGCTTTTCAATCAAGTA ATCTTCGAGC

2521
GGTTACCAGT TTTAATAGTT GCGAGTCGTC GTTTTTTATG TACCCTAGGA CATATATATC

2581
CGCATGTAGA CGATGATGAG ACTAGCAAGT TTTTTTTTTT TTTTGAGCAA ATACATAATT

2641
ATTGGATTTG CAGGCCGTGA GATGATGTGC TACGAGCCCC CTGCCCCGTC CACGGGCATC

2701
CACCGTATGG TGCTGGTGCT ATTCCAGCAG CTTGGCCGTG ACACGGTGTT CGCGGCGCCG

2761
TCCAGGCGCC ACAACTTCAA CACCCGTGCC TTCGCCCGCC GCTACAACCT CGGCGCGCCC

2821
GTCGCCGCCA TGTTCTTCAA CTGCCAGCGC CAGACCGGCT CCGGTGGCCC CAGGTTCACC

2881
GGGCCCTACA CCAGCCGACG TCGTGCGGGC TGA

(SEQ ID NO:2 Sb06g012260—S. propinquum), or functional fragment, or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:2.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in short day S. propinquum includes the nucleic acid sequence:

1
CCCTGACCCT TGTTGGGCAA CATTTAGAGT CGTTAGCTTT GCAATTCTTT GGTTCCAATG

61
GATGGTTATC ATTTAGACAT ATTGGTCATG CTTAGTCAAA ACTTTATTGT TCGGCTATAA

121
ACTTTTCAGT ACTTTGTAAT AATTGGCTCG ATAGATGAAG CCGGGTATAA CATATCCTTT

181
ATCTAAAAAA ATTAGTTAAC ATGAACTTCA TATTCAATTC TTCATATCTC ACTAGCATCT

241
TTATTGTCTA GTTAGTTTTG TAGCATTGCA AAAAGCATGC AACTATATAC AATGAAACGG

301
AATAAAATTT CAGCTCTATT AATTTATATT TCAAATATAG GCCACTATAG CCATATTTCG

361
TGCTCAAGGC CACAAAATCT TGCGTACTTC CCTGTTGGTA CCAAAGAGAA GACGTTATTT

421
AACTTTGTTT GACTCTTCAA TATGGTTTGA ATCAGAAAAT TAGTTAAAAG AAAAGTGAGC

481
ACACCACGAC CTGTCATCAG CTCATGGTCA GCTCTACAAA CTTATAGATT GCATCGAGAT

541
CTAAGACTCA GGTACAAATC ATGTCAACAT CTAATGGTTT AGAAAATGAA AAGTTTTGAG

601
TTTCAAAATA TGATACGTGA TATTAACATT TGAACTTTTA GCAAGATCTG AAATAAAAAA

661
TTCAACTAGA TCATGTTAAC ATTGATATAA TCGCTTCCAA TCGCCTCCCA TCACTTCCGC

721
TAGAAAACTT TTTTTCTCGA TTTAATTAAT GAAAGGGTAA TAACATCATT GTACAAGATT

781
CTTTCAAACC TCAACCCCTA TCATCGACGG TGACGGCTCC CTATAACACG CACTAGTGGA

841
CGCCGGGCGG GTGGAACCCT AAGAAGATTT AAAAAAACTT AAGAAGAAGA TTTTTATCTA

901
ACTAACTATA GTACTTATAT CATACACTAT ACTATTCAAA ATATTATTTT CACAATTATG

961
AATTTACCCT TTTACTCTTC ATTAAAAAAA TACGAAAAAA GAATCACCAC GTCTCTATTT

1021
AGGGTCCTAG TCCCCATAAT TTAAGAGGCG GTGAGAGACG ATGTGACGTC TATGGACCAC

1081
CGACCAAAGA CACACCTATC GTCTCCCATC GCCTTGCTTC CATCGCCTCT CATCGCTTTT

1141
CATATTCTAG ATCCAGCGGC CATAGACACA CCAATCGTTT CTCATCGCCT CTCCAACCAT

1201
TGTAAAAATA TTTATAATTT TGATATAAAA TTTGTCTTCA CTTGAGTTCA TGCCAAAAAA

1261
ATTATACATA TTATTTTCGT GTGAGAATTT ACAGAAGTGG ACTCTTAAGA TGTCCAAATG

1321
TAAATGACCC TATTTATTAT GAGGCGCGGA TCTATAGGCC TGACTCTGAA AATGGATTAT

1381
GGATTTGAGA TAATAAATTT AAGGGCCTAT CTTCGCACAT AACATCTATA GTTCCTAAAT

1441
TTTTTTTTAT TGTAGTAGTA GAACTTTTCT CCCTGTAAAC CAAGTTGACG CTGGGCTTTA

1501
TTTTGCGACA CAGAACACCA AATTGGTGGC TATGAACTCT TCCACCTGGG CAGGGAAAAC

1561
GGTTTATTAT GTTTCTCTTT AATTTATCTA TCGTGGCACT ATAACACAAC ATGGCTTTGC

1621
CGACACTTCC AACTATCGGC AAAGGGTACC TTTACCGACA CTTAACGTCT CACGAAAGGT

1681
TTTGCCGACA ATTTTCAAAC AGTCGCGGTA GAAGCAGTTG GCGAAACTTT TGCCGACAGT

1741
TAAAGGCATC GCCGACACAT TTTCTGTAGT CAAATGGCAT ACCTACGCCG ACAGTTGAAC

1801
TTTCACCGAC AGTGAACCCT TTGCCGACAG TTTGGACCTA CGCCGACAGT TTGGACCTTT

1861
TCCGACAGTT GGTATGTTAG CGAAACCGTT TCTAGGGTGT TTCATAAACC ATGCCTTGTC

1921
CAACAGTAGA AGTGTCGGCA AAACTATATT GCTAGGATGT AGATACAATT TAAATATTTT

1981
AATAAATACA CATCACATTG ATTGAGCAAA ATCACATGGT CTGTTTTCAC TAAAACTGTC

2041
AGAGGTACAC TCCAGTACTA CCAGTACGTC GCCCGCACAG TGGCCAAGGA TTTTACTGCT

2101
ACTGTTGATT AACATAAGCA CTTGCGACTT TCCCTAAAAT CTTTTATAAA ACAACGGCCG

2161
CAATAATATT GAACTATTTT TTTTCTAGTA CCAAAATTAG AATTTGATCC CTCACCTCAT

2221
TACATCCATA GTAACATGAC CAGATATATA TGGACAGGAT GGGATCACTC AGCGAGCAGA

2281
TACACTGAGC GATTCATAAT CAGATTTTTT AATTTCTTCT AGTGAAGTGG GGTTTTCCTA

2341
GTCTTTTAAC ATTCAAAATT TAGTACAAAC TTTCCCTAGT AAATGCCTTC TAGTAAAGAT

2401
TTCCTAGTAT TTTGACTAGC GATAGTGTTT TATTACTAAT TAAAAACATT AGAAGAACTC

2461
CATTTAGTGA TTGGTTGTTT GGATTAGTCT TCTCACGTTA GACCTATATA TGCAGGACAA

2521
CTCAAGCCAG CATAAATATA TGAAATATCT TGGTGTTTGT TTGTCTGACA CAGGCAACCG

2581
CGTTTGGTAT AAATGTGTTT TCTTGTTTAC ATTTTACCAT CTATAGTCAT CTCAATGTTA

2641
TATAGTAGAG GCTTCATGTT TGTAGTAGAT AAGGTAGAGA ATTGAGAATA TTTTATTTTT

2701
GTGCGACCAT CAATTTTATG TAATCTGCAT TGTCTAATGC TTTATTTGAC ATTTGAAACT

2761
ACTTAATTTG ACAGTTATGC AGGTCCGCAT GATCCTATGA AAGCAATTAA TTAGTACGGG

2821
TAAACTGCAC TACACAAGTT TGCTAGTACT ATTCTATTAA CCGACCTGTC AATATTACCT

2881
TAAGTTACTG ATTTCAATTA GAATCTAACA CATTCAGGAA AAGAAGTTTC ACTAGTACAA

2941
AAATCATTTT CGTTGGCACG TTGTTTTTTT TTTCACAGGC AGTTCACAAT ATCATGGTGC

3001
TAGTAGAAAA ATTTCAACGG GCCCAACAAG AGAACCGCCA GGCGGTCTTC TTAATTCAAC

3061
CGCCTGTGTA AACTTTCCAT TTACATAGGC GGCTTACGAT AAAAACCGTG TGTATAAATA

3121
CCATTAACAC AGGCAGTCGA GTTACGACAA CCGCCTGTGT AAATGTGTCT TTTTACACAG

3181
GCGGTTTGTA TAGAGGGCCG CCTGTGCTAA TATATTTACA CAGGCTATGA GCCGCCTGTG

3241
TTAAGTCTTC TATAAATACC CTTCGTCCAC CTCCAGACAA GAACAGTTAC TCCCATGAGC

3301
TCTGCACACT GGCGGACCAG ACGATTCCAG TTTCCAAGGG GGGAGGTTTT GATTTTCATT

3361
TCTTTGGTGA GAAACTTCCA AAAGGTTAGT TAGTGCCATT GATGCTATTT TTTAAGCGAT

3421
TCTTTGGTTC AATTCTTGTA TTGGAGGTGC TCTAGATCTA GAGTTCATCA TGCATTCTTG

3481
CTTAGGGTTA GAGTTCATAG GGCAAAAAGA GAGAGATTTA GCTAAATTTT TATGTAAATT

3541
CATAGTAAAT TGTAAAAATT AAAAAAAATA AAAAATAAAT ACTTTTTAGA ATTCTTGTGA

3601
GTAGATCTAT ACAATAGAGT AATGATGAGG ATATTTTGAA GTTTATAATT TTGATTCAGT

3661
TTTAGCTTTT CTTTTTTCAG ATGAATTAGA CTTTATAAAC TCAAACATTA AAATGTTGAA

3721
AATCATAAAA TGGCAAATAA ATACTTTTTC AAATCTTTGT GCATAAATAC TTCATAGAAA

3781
TCCTTGAATT ATTCCTAAAT TTTATACAAT TGTTTCTTAT AATTATGAAA ATGAGTTTAA

3841
ACAATTATTT AAATTCCATA AATTGTAACT CCGTAAGGTG TAGGTTTTCA TCTCTGTTTA

3901
ATAGAAGGAG GTTAGTATCT TAGTTAAGTC TGTTTTCGGG GGTTATATTA GTTTTGTTTT

3961
TAGATTGACC TACATTAATT GTTCTTAACT AATTACAGCT AAATATGGAG AGGTCATTAT

4021
GGATGTACAA CTTATCAAGA TTGGACCTAT CATATGTAGT GCAGGTCCAA AAATTTATTG

4081
ATGTCGCAAA GATACATGCT CGCAGAACAA AGGCGAAGCA CATATGTTGT CCATGCGCAG

4141
ACTGCAAAAA TATTATGGTA TTTGACAATG TAGAAGCAAT TACTTCCCAT CTGGTTTGAA

4201
GAGGATTTAT GGAGGACTAC TTGATTTGGA CAAAACATGG TGAGGGTAGT TTTGCACCTT

4261
ATATGCGGAC AACTGACAAC ACTGCAACTA ACATCAATGT GGAGGGTCCA ATGCCACCTC

4321
TCAATGAATT TCATGCTATG CCAGATGTTA ATGAAACTCA TACGTCTGAT GTCAATGAAA

4381
CTCAGCATGC TAACACAGAT GTTGTTGAAG ATGCAGATTT CTTAGAGGCA ATAATGAACC

4441
GTTGTGCGGA TCCATCAATA TTCTTCATGA AGGGAATGAA AGCATTGAAG AAGGCAGCAG

4501
AGGACACTTT GTACGACGAG TCAAAAGGTT GTACCAAACA ATGGTCGACA TTATGTGTTG

4561
TTCTTCAGTT TTTGACGATG AAGGCTAGAC ATGGTTGGTC CGATGCTAGC TTCAATGATT

4621
TCTTGCGTGT ACTTGGAGAC CTTCTTCCTA AGGAGAACAA AGTGCCTGCT AACACATACT

4681
ATGCAAAGAA GCTAGTCAGT CCACTTACGA TAGGTGTTGA GAAGATCCAC GCATGTAGAA

4741
ATCATTGTAT TCTATATCGA GGTGATCAAT ATAAAGACTT AGACAGTTGT CCAAACTGTG

4801
GTGCCAGTAG GTACAAGACA AACAAAGATT TTCGGGAGGA AGAGAATCTA GCCTCTGTTT

4861
CTACAGGGAG GAAGCGAAAG AAGACCCAAA CAAAGACTCA ACAAGACAAG CGCTCAAAGC

4921
CTAGTAGCAA TGAAGAAGTG GACTATTATG CATTGAGAAG AGTCTCCCTA TGAGCCAAAA

4981
AAGGGGACAG CAGCAGGCAC AACTCTCTTT CTGAAAGGAC TTGGAAAGCA GCGGACGGCA

5041
CGGCTCATTG AGCTCGAACC GTCACAGAAA AAGGAAGCCA CCGCCCAGTC AATAGAAGCC

5101
ATGCCCCCAT CAAAGGAAGC CCCAAGTGGC GATGTACATA TTGAACAGCC ATCAAGTCAA

5161
CCATTGACCC TAAAGGATAT CAGAAAGCCA ACGATTGATG ATTATGTCAA TGTCCCTAGT

5221
GACTATGTGC CCGGAAGGCC TATGCTCCAA TGGACGCTGC TCGATTAGAT TCAATGGCTG

5281
ATAAAAAGGT TTCATGACTG GTACATGAGA GCAGTGCATG CTAGCCTCCA TGGAATCAGA

5341
GTTGATATAC CAACAGACAT GTTTGCTACT GGTAACAAAA AAAGCAAGAC ATTTGTTACC

5401
TTTGAGGACA TGCACTTGTT ATTGAACTAT AGGCGGCTTG ACGTCCAACT CATAACAATC

5461
TGGTGCCTGT AAGTATCACT CATGCACACA CAATTATTAT ATATTAATAT GTAGTGTGAA

5521
ACTCTAATAT GTAGATGTTG TCTGTAGTTT GCAAGATCAC GAGCAGATGT CATTATTATC

5581
TGCCGGATCG ATGGTCGGTT ATCTGAGCCC TATCAAGTTA CAAGAAAATA TGAACAAATT

5641
CGTATTATCA AAGGAAGATA GAGCAAAGAT AGAGGAAGAC AAAACACCAG GATAATTATG

5701
CCATCTATCT TGGTAGATCA ATGCTGAGGT ATAAATATAG GGATTTTATA TTGGCACCAT

5761
ACAACATTAG GTAAGCTTGA CTTCATATAC GTATTTCAAA TTATCGTGTA AACAATATAC

5821
ATGTGTCGCT CACTCATTTA TTCATGCAGT GACCATTGGA TTGTTTTTTA TATTTATCCC

5881
TTCGAAGGGA AGGTGCTTGT CCTAGACTCT TTACATGTTC CTCCCGAGAA GTATCAACCA

5941
TTCTTGGTTC AATTAGAAAG GTGAGCCAAC ATGAAACCAC ATGCGTACTT ATATAAATTA

6001
GAGTTTCAAA ATAACTTTAG TGATTTAGGT TCGATATCTA CGGGGCATGG CGGTTTTATA

6061
AGAAACAAAA GGGACCTGTC GACGCTGCAC GCTCAGATCC TAGGATCCCA TTGATGATAC

6121
AACACCACTA TCCGGTAAGT TTTCTGAACA CATTTCATCA TATAAATAAT ACATAAAGCA

6181
TGGCAAATTT AGAATAATCC GTTGCTCATT ATATAGTGCC ACAAGCAACC ACCTGGATCG

6241
GTCTATTGTG GGTACTATGT CTGTGAGTTT ATAAGGCAGC GGGGACGTTA CGTCAAGGAC

6301
AAAAATATGG TAAATAATAT CTATGTATGA AGTTTTCTCA TTAAAGCTGC AAAATTATAT

6361
ATTGAACATG TGTCAATCAT GCTTTTAAAC TTTATTTTCA GCCGAAAAAG CAAGGAAAAG

6421
ACGTGCCCTT TACACCAAAG ACTCTGGAAG ATATAGTAGC ATACTTGTGT GGTTTTATTA

6481
TGAGAGAAAT AATTTCAAGT GACAGTGCAT ATTTTGATCA TGAGGGCGAT TTAGCAAGTG

6541
ATAAATTTAG AGTGCTGACA GACATAGCAG GTCTAAATCT GAAGCGAAAC GACATGTAAA

6601
CATTGTATGG TTGTGCGGAT AACATGCATT GACGTGTATA TATATAATTT TATGGTTGAT

6661
GTTTGATTTG TTTACAATTC TATAATATAT ATATGTGGTG TATGTATGAT GTTGTGTGTG

6721
TATATATATA TATATATATA TATATATATA TATATATATA TATATATATA TATATATATA

6781
ATGTTTAGCA CTGTGTTTGG TGGGAAAAAT TAAAATTTGA AATATATATA AAAAATTATT

6841
TACACAGACA GTGTAGTGTG AGCTGCCTGT GTAAAAATAC ATTTATACAG GCGGCTCACC

6901
TTGTCNNNNC AGGCGGTGCT AAAAGCATCT TCACAGGCGG CCAAGCCCAC CGCCTGTACC

6961
AGGGGTCAGT ACAAAATGGA CCACAGTACA GGCGGGGCTG TGCGAGCCGC CTGTGAAAAC

7021
ATAATTTTCA CAGGCGGCTC GCACAGCCCC GCCTGTACTG TGGTCCATTT TGTACTGACC

7081
CCTGGTACAG GCGGTGGGCT TGGCCGCCTG TGAAGATGCT TTTAGCACCG CCTGTAAAAA

7141
TGTTTTTTGT AGCAGTGTTT TTCTTATTAG TAGTATCTTT TATACTAATT AAGATTCAAT

7201
AAAAATTCAC CATGACATCC CCATTGCCAA GAGAATATTT CGCCGCCCCT CAAAGCAGCC

7261
AATAAGGCTT TACTAAAAAG ACTATCCACG CAGTAGAGAT TTAGTCAAAA TATTCCAATA

7321
GCAATTGTTT CCTGCCTGCT TGACCTTCGT CAGCCACTCA CTGTATAAAT ATCGCACCAC

7381
GCCCTTTGCA GGCTTACAGA GCTTGTATTA CGTACTAACA AGGCACACAC AGTACCCTGT

7441
GTTCACCGGC CCTGCACAAA ACTCAAGCAG TTATTACTAA CATGGCGGCT AACGATTCCT

7501
TGGTTACTGC TCATGTGATA GGAGATGTCT TGGACCCCTT CTATACAACC GTTGACATGA

7561
TGATCCTATT CGATGGTACT CCTATTATCA GCGGCATGGA GTTGCGCGCT CCGGCGGTTT

7621
CTGACAGGCC AAGGGTTGAA ATTGGAGGAG ATGATTATCG AGTTGCATAT ACTCTGGTAA

7681
ACTCATGCCA TGTCAATTAA CTAGTAGTTG AATTTAGATG CTGGTGGTAT CGTGGATACA

7741
TGTACTATAT GTTATGGTTG ATACATATTT GTTTAATTGA TCGCAACACC ATTTGCGGTA

7801
ACTTCAAATT ACATTCTTTC AATATATAGG TGATGGTCGA TCCTGATGCT CCTAACCCAA

7861
GCAACCCAAC CTTGAGGGAG TACTTGCACT GGTAAGAGAA ACCTATAGAC GACAATTATT

7921
GTTGTTGGCA TGTTTTGCCC ACATATACTT TGTGTGTGTA TATTTGTGCT TATGCTTCTC

7981
CATAAAATTT TGGTGTATGT CTCAAGAGAG ATAGGTATAG AGGTTAGCAG TCCTTTAAAA

8041
ATGGTTTAAT CCAGTAGTTT TTTTTCGGTC GGACTGCTCG AATTATTGTA TATATGGAGA

8101
TCACATGCTA GTAACTTTTT CAATAATTTC ATGTTTCGAG CAGGATGGTG ACTGACATCC

8161
CAGCATCAAC TGATAATACA TACGGTGAGT ACACCCCTAT TCCCATTTTG AAACAAGTAG

8221
AATGTCTATT TTTATGATTT AGTATGTTCG TGACAATAGG CTATAGCTAT TTTGAAACTT

8281
CGGGAGCATA AAATAGTACT CGATTTTGTA TAACCATAAA CACACAGCTA GCCAATCTCT

8341
ATTCATATTT ATTTTAGTTT TATTTGCCGA ACCATCCTCA ACATCATAGC CACTTGATCG

8401
ATCATCTCAA TCAGCGTTTG TATCCTTGCC CGCTTGATTA TCATCCATGG CAGTTCATAT

8461
TTTTTTTCAT TTCTTTCATG CTTGTTATAG TTTTATCTGA TGAATCCAAG ATGTTATTGA

8521
TCAATTAGTT CAGATGAGCA GTAATGCATG TTGGAGGTTT GGTAGTATAT ATACGTTCAA

8581
AATTTCACGA AATCGGTAAT TACGGTGGGA GCCAAAAAAA ATTCCAAAAT TTCGTATTAC

8641
ATTAATAATG CATGTGCTGT AGACTCATAT TTTCTATGAT TTCGATTCTG TCACCATCCT

8701
GCTCGAATAT TTAAATCATG CTAATATTTT GTTTACATCT AAATCTTTTA TAAAAATTAT

8761
AATTTATATT TGGGTTTAAC AATTTCGGGC GCGTTTAGTG AGATTGGGTA ATTTCGGAGC

8821
GAGGCCACCG GCCACACGAA AAATTCTATA CACGACTATA TGTGTACATG TACATGCATG

8881
GCACCCTGAT AGGCTACCCC ATGGGGAAAA AATTGGAAAC GGACCATTCA TACGCAGTCG

8941
TGGTGCAGAC TGTGGGCCAC AATAGCAGTG TAAACATAAT TACGGTAATC AAATACCCCA

9001
TGGGACCATA TATATCATCC ACAGATCCGT ACGGTGCTTC CGTGTGGATG GTCTACACCA

9061
GATCTTTTCC ACACCATAAG GGCAGCAATG CAGCATCATA TTCATATATG CACTAGTGAT

9121
GTACCATTTG GCTTATATCA TATTCAACCT AACTCCTTGG AAACATTATG ATATTCTATT

9181
GGGTTGAAGA TGTCACTACT ACAAAAAAAA ATCTTATGAG AGGTGTTTTG AAAACTGCCG

9241
GAGGTGCTTA AAGGAGACAG ACGAGTTAGG ACAACCGTCT CTATTAATGT GTACTAACTG

9301
AGGTAGTTAC CGTAACGTGC CTGACTTGAT TAACAGATTC AACCGTCTCA GTAAAGGCCA

9361
TGATTAACCG AAACAGATTC GAGAGTTTTC TTAAGTAGTT AAACTATTTT AATCTTCACC

9421
GAACTTATAG AAAATGAAAG AGCTAACACC AATATTTATA AAAATAAATT AGTATCACTA

9481
AATACATCAC GAAATCTATT TGGTGTTGTA GAAGTTATCC TTTTCTATAA AATTGATCAA

9541
ATTTATGATA ACTTAGTTTT AGGAATTCAT TTATTTTAGG ACAACTGAGG AAGTACATAT

9601
TTTTTAAGTC ATCCACAAAG TAGTGGATCC AATTTATTAC ATTACTCTAC TACTTCAAAC

9661
TGAACAAAAG CCTAATCCTG GTTATTTTTA GAGTGATTTT TTACAACATC AGCAGTAGTC

9721
CAGAAAATGG GAGGACATTA ATAAAAGTGA AAAGGAGCAG AAGAAAGATT ACGGTATTTT

9781
ATTTGTGCTA TTTGTTTAAC TATTGGCAGT TTGGGACCGA AATAAATAAC TGTTCGTAGC

9841
TCTATATTTG TCGATTCGAA AGTGTAACGA TGATTTTTGT GTTTCAAAAG AAAAATAAAG

9901
AAGTGCACCA ATGATTGGAT ATCATAGGCT ATATATGTTG GATTAATTGC ATCCAACGTA

9961
TATAGTGAAA ATGCTTTTCA ATCAAGTAAT CTTCGAGCGG TTACCAGTTT TAATAGTTGC

10021
GAGTCGTCGT TTTTTATGTA CCCTAGGACA TATATATCCG CATGTAGACG ATGATGAGAC

10081
TAGCAAGTTT TTTTTTTTTT TTGAGCAAAT ACATAATTAT TGGATTTGCA GGCCGTGAGA

10141
TGATGTGCTA CGAGCCCCCT GCCCCGTCCA CGGGCATCCA CCGTATGGTG CTGGTGCTAT

10201
TCCAGCAGCT TGGCCGTGAC ACGGTGTTCG CGGCGCCGTC CAGGCGCCAC AACTTCAACA

10261
CCCGTGCCTT CGCCCGCCGC TACAACCTCG GCGCGCCCGT CGCCGCCATG TTCTTCAACT

10321
GCCAGCGCCA GACCGGCTCC GGTGGCCCCA GGTTCACCGG GCCCTACACC AGCCGACGTC

10381
GTGCGGGCTG ATGACGACGA TCGTCGTTAC GTCACGTGTA CCGTACACAT ATATGTATAG

10441
ATATACATGC ATGCATGTTC CATGGTATAG GATCGGTGAC AAAACGTCTA ATAATGTATA

10501
CACACACATG CATGGAATGC ATGTAATAAG AGAATATATG TATAATAAGT AGGGGAGAGC

10561
ATGCATATAT TGTGTACACG CGTCCGATGC GTATAGCCCT TTACATTATT GTAGTTGTAA

10621
TCAG

(SEQ ID NO:3 Sb06g012260 (10.6 KB)—S. propinquum), or functional fragment, or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:3. Each N=can be any nucleotide or combination of any 2, 3, 4, or 5 nucleotides.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:3, including introns, can be:

1
ATGGCGGCTA ACGATTCCTT GGTTACTGCT CATGTGATAG GAGATGTCTT GGACCCCTTC

61
TATACAACCG TTGACATGAT GATCCTATTC GATGGTACTC CTATTATCAG CGGCATGGAG

121
TTGCGCGCTC CGGCGGTTTC TGACAGGCCA AGGGTTGAAA TTGGAGGAGA TGATTATCGA

181
GTTGCATATA CTCTGGTAAA CTCATGCCAT GTCAATTAAC TAGTAGTTGA ATTTAGATGC

241
TGGTGGTATC GTGGATACAT GTACTATATG TTATGGTTGA TACATATTTG TTTAATTGAT

301
CGCAACACCA TTTGCGGTAA CTTCAAATTA CATTCTTTCA ATATATAGGT GATGGTCGAT

361
CCTGATGCTC CTAACCCAAG CAACCCAACC TTGAGGGAGT ACTTGCACTG GTAAGAGAAA

421
CCTATAGACG ACAATTATTG TTGTTGGCAT GTTTTGCCCA CATATACTTT GTGTGTGTAT

481
ATTTGTGCTT ATGCTTCTCC ATAAAATTTT GGTGTATGTC TCAAGAGAGA TAGGTATAGA

541
GGTTAGCAGT CCTTTAAAAA TGGTTTAATC CAGTAGTTTT TTTTCGGTCG GACTGCTCGA

601
ATTATTGTAT ATATGGAGAT CACATGCTAG TAACTTTTTC AATAATTTCA TGTTTCGAGC

661
AGGATGGTGA CTGACATCCC AGCATCAACT GATAATACAT ACGGTGAGTA CACCCCTATT

721
CCCATTTTGA AACAAGTAGA ATGTCTATTT TTATGATTTA GTATGTTCGT GACAATAGGC

781
TATAGCTATT TTGAAACTTC GGGAGCATAA AATAGTACTC GATTTTGTAT AACCATAAAC

841
ACACAGCTAG CCAATCTCTA TTCATATTTA TTTTAGTTTT ATTTGCCGAA CCATCCTCAA

901
CATCATAGCC ACTTGATCGA TCATCTCAAT CAGCGTTTGT ATCCTTGCCC GCTTGATTAT

961
CATCCATGGC AGTTCATATT TTTTTTCATT TCTTTCATGC TTGTTATAGT TTTATCTGAT

1021
GAATCCAAGA TGTTATTGAT CAATTAGTTC AGATGAGCAG TAATGCATGT TGGAGGTTTG

1081
GTAGTATATA TACGTTCAAA ATTTCACGAA ATCGGTAATT ACGGTGGGAG CCAAAAAAAA

1141
TTCCAAAATT TCGTATTACA TTAATAATGC ATGTGCTGTA GACTCATATT TTCTATGATT

1201
TCGATTCTGT CACCATCCTG CTCGAATATT TAAATCATGC TAATATTTTG TTTACATCTA

1261
AATCTTTTAT AAAAATTATA ATTTATATTT GGGTTTAACA ATTTCGGGCG CGTTTAGTGA

1321
GATTGGGTAA TTTCGGAGCG AGGCCACCGG CCACACGAAA AATTCTATAC ACGACTATAT

1381
GTGTACATGT ACATGCATGG CACCCTGATA GGCTACCCCA TGGGGAAAAA ATTGGAAACG

1441
GACCATTCAT ACGCAGTCGT GGTGCAGACT GTGGGCCACA ATAGCAGTGT AAACATAATT

1501
ACGGTAATCA AATACCCCAT GGGACCATAT ATATCATCCA CAGATCCGTA CGGTGCTTCC

1561
GTGTGGATGG TCTACACCAG ATCTTTTCCA CACCATAAGG GCAGCAATGC AGCATCATAT

1621
TCATATATGC ACTAGTGATG TACCATTTGG CTTATATCAT ATTCAACCTA ACTCCTTGGA

1681
AACATTATGA TATTCTATTG GGTTGAAGAT GTCACTACTA CAAAAAAAAA TCTTATGAGA

1741
GGTGTTTTGA AAACTGCCGG AGGTGCTTAA AGGAGACAGA CGAGTTAGGA CAACCGTCTC

1801
TATTAATGTG TACTAACTGA GGTAGTTACC GTAACGTGCC TGACTTGATT AACAGATTCA

1861
ACCGTCTCAG TAAAGGCCAT GATTAACCGA AACAGATTCG AGAGTTTTCT TAAGTAGTTA

1921
AACTATTTTA ATCTTCACCG AACTTATAGA AAATGAAAGA GCTAACACCA ATATTTATAA

1981
AAATAAATTA GTATCACTAA ATACATCACG AAATCTATTT GGTGTTGTAG AAGTTATCCT

2041
TTTCTATAAA ATTGATCAAA TTTATGATAA CTTAGTTTTA GGAATTCATT TATTTTAGGA

2101
CAACTGAGGA AGTACATATT TTTTAAGTCA TCCACAAAGT AGTGGATCCA ATTTATTACA

2161
TTACTCTACT ACTTCAAACT GAACAAAAGC CTAATCCTGG TTATTTTTAG AGTGATTTTT

2221
TACAACATCA GCAGTAGTCC AGAAAATGGG AGGACATTAA TAAAAGTGAA AAGGAGCAGA

2281
AGAAAGATTA CGGTATTTTA TTTGTGCTAT TTGTTTAACT ATTGGCAGTT TGGGACCGAA

2341
ATAAATAACT GTTCGTAGCT CTATATTTGT CGATTCGAAA GTGTAACGAT GATTTTTGTG

2401
TTTCAAAAGA AAAATAAAGA AGTGCACCAA TGATTGGATA TCATAGGCTA TATATGTTGG

2461
ATTAATTGCA TCCAACGTAT ATAGTGAAAA TGCTTTTCAA TCAAGTAATC TTCGAGCGGT

2521
TACCAGTTTT AATAGTTGCG AGTCGTCGTT TTTTATGTAC CCTAGGACAT ATATATCCGC

2581
ATGTAGACGA TGATGAGACT AGCAAGTTTT TTTTTTTTTT TGAGCAAATA CATAATTATT

2641
GGATTTGCAG GCCGTGAGAT GATGTGCTAC GAGCCCCCTG CCCCGTCCAC GGGCATCCAC

2701
CGTATGGTGC TGGTGCTATT CCAGCAGCTT GGCCGTGACA CGGTGTTCGC GGCGCCGTCC

2761
AGGCGCCACA ACTTCAACAC CCGTGCCTTC GCCCGCCGCT ACAACCTCGG CGCGCCCGTC

2821
GCCGCCATGT TCTTCAACTG CCAGCGCCAG ACCGGCTCCG GTGGCCCCAG GTTCACCGGG

2881
CCCTACACCA GCCGACGTCG TGCGGGCTGA

(SEQ ID NO:4 Sb06g012260 (10.6 kb)—S. propinquum) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:4.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in short day S. propinquum includes the nucleic acid sequence:

1
CTATGCTCCA ATGGACGCTG CTCGATTAGA TTCAATGGCT GATAAAAAGG TTTCATGACT

61
GGTACATGAG AGCAGTGCAT GCTAGCCTCC ATGGAATCAG AGTTGATATA CCAACAGACA

121
TGTTTGCTAC TGGTAACAAA AAAAGCAAGA CATTTGTTAC CTTTGAGGAC ATGCACTTGT

181
TATTGAACTA TAGGCGGCTT GACGTCCAAC TCATAACAAT CTGGTGCCTG TAAGTATCAC

241
TCATGCACAC ACAATTATTA TATATTAATA TGTAGTGTGA AACTCTAATA TGTAGATGTT

301
GTCTGTAGTT TGCAAGATCA CGAGCAGATG TCATTATTAT CTGCCGGATC GATGGTCGGT

361
TATCTGAGCC CTATCAAGTT ACAAGAAAAT ATGAACAAAT TCGTATTATC AAAGGAAGAT

421
AGAGCAAAGA TAGAGGAAGA CAAAACACCA GGATAATTAT GCCATCTATC TTGGTAGATC

481
AATGCTGAGG TATAAATATA GGGATTTTAT ATTGGCACCA TACAACATTA GGTAAGCTTG

541
ACTTCATATA CGTATTTCAA ATTATCGTGT AAACAATATA CATGTGTCGC TCACTCATTT

601
ATTCATGCAG TGACCATTGG ATTGTTTTTT ATATTTATCC CTTCGAAGGG AAGGTGCTTG

661
TCCTAGACTC TTTACATGTT CCTCCCGAGA AGTATCAACC ATTCTTGGTT CAATTAGAAA

721
GGTGAGCCAA CATGAAACCA CATGCGTACT TATATAAATT AGAGTTTCAA AATAACTTTA

781
GTGATTTAGG TTCGATATCT ACGGGGCATG GCGGTTTTAT AAGAAACAAA AGGGACCTGT

841
CGACGCTGCA CGCTCAGATC CTAGGATCCC ATTGATGATA CAACACCACT ATCCGGTAAG

901
TTTTCTGAAC ACATTTCATC ATATAAATAA TACATAAAGC ATGGCAAATT TAGAATAATC

961
CGTTGCTCAT TATATAGTGC CACAAGCAAC CACCTGGATC GGTCTATTGT GGGTACTATG

1021
TCTGTGAGTT TATAAGGCAG CGGGGACGTT ACGTCAAGGA CAAAAATATG GTAAATAATA

1081
TCTATGTATG AAGTTTTCTC ATTAAAGCTG CAAAATTATA TATTGAACAT GTGTCAATCA

1141
TGCTTTTAAA CTTTATTTTC AGCCGAAAAA GCAAGGAAAA GACGTGCCCT TTACACCAAA

1201
GACTCTGGAA GATATAGTAG CATACTTGTG TGGTTTTATT ATGAGAGAAA TAATTTCAAG

1261
TGACAGTGCA TATTTTGATC ATGAGGGCGA TTTAGCAAGT GATAAATTTA GAGTGCTGAC

1321
AGACATAGCA GGTCTAAATC TGAAGCGAAA CGACATGTAA ACATTGTATG GTTGTGCGGA

1381
TAACATGCAT TGACGTGTAT ATATATAATT TTATGGTTGA TGTTTGATTT GTTTACAATT

1441
CTATAATATA TATATGTGGT GTATGTATGA TGTTGTGTGT GTATATATAT ATATATATAT

1501
ATATATATAT ATATATATAT ATATATATAT ATATATATAT AATGTTTAGC ACTGTGTTTG

1561
GTGGGAAAAA TTAAAATTTG AAATATATAT AAAAAATTAT TTACACAGAC AGTGTAGTGT

1621
GAGCTGCCTG TGTAAAAATA CATTTATACA GGCGGCTCAC CTTGTNNNNN CAGGCGGTGC

1681
TAAAAGCATC TTCACAGGCG GCCAAGCCCA CCGCCTGTAC CAGGGGTCAG TACAAAATGG

1741
ACCACAGTAC AGGCGGGGCT GTGCGAGCCG CCTGTGAAAA CATAATTTTC ACAGGCGGCT

1801
CGCACAGCCC CGCCTGTACT GTGGTCCATT TTGTACTGAC CCCTGGTACA GGCGGTGGGC

1861
TTGGCCGCCT GTGAAGATGC TTTTAGCACC GCCTGTAAAA ATGTTTTTTG TAGCAGTGTT

1921
TTTCTTATTA GTAGTATCTT TTATACTAAT TAAGATTCAA TAAAAATTCA CCATGACATC

1981
CCCATTGCCA AGAGAATATT TCGCCGCCCC TCAAAGCAGC CAATAAGGCT TTACTAAAAA

2041
GACTATCCAC GCAGTAGAGA TTTAGTCAAA ATATTCCAAT AGCAATTGTT TCCTGCCTGC

2101
TTGACCTTCG TCAGCCACTC ACTGTATAAA TATCGCACCA CGCCCTTTGC AGGCTTACAG

2161
AGCTTGTATT ACGTACTAAC AAGGCACACA CAGTACCCTG TGTTCACCGG CCCTGCACAA

2221
AACTCAAGCA GTTATTACTA ACATGGCGGC TAACGATTCC TTGGTTACTG CTCATGTGAT

2281
AGGAGATGTC TTGGACCCCT TCTATACAAC CGTTGACATG ATGATCCTAT TCGATGGTAC

2341
TCCTATTATC AGCGGCATGG AGTTGCGCGC TCCGGCGGTT TCTGACAGGC CAAGGGTTGA

2401
AATTGGAGGA GATGATTATC GAGTTGCATA TACTCTGGTA AACTCATGCC ATGTCAATTA

2461
ACTAGTAGTT GAATTTAGAT GCTGGTGGTA TCGTGGATAC ATGTACTATA TGTTATGGTT

2521
GATACATATT TGTTTAATTG ATCGCAACAC CATTTGCGGT AACTTCAAAT TACATTCTTT

2581
CAATATATAG GTGATGGTCG ATCCTGATGC TCCTAACCCA AGCAACCCAA CCTTGAGGGA

2641
GTACTTGCAC TGGTAAGAGA AACCTATAGA CGACAATTAT TGTTGTTGGC ATGTTTTGCC

2701
CACATATACT TTGTGTGTGT ATATTTGTGC TTATGCTTCT CCATAAAATT TTGGTGTATG

2761
TCTCAAGAGA GATAGGTATA GAGGTTAGCA GTCCTTTAAA AATGGTTTAA TCCAGTAGTT

2821
TTTTTTCGGT CGGACTGCTC GAATTATTGT ATATATGGAG ATCACATGCT AGTAACTTTT

2881
TCAATAATTT CATGTTTCGA GCAGGATGGT GACTGACATC CCAGCATCAA CTGATAATAC

2941
ATACGGTGAG TACACCCCTA TTCCCATTTT GAAACAAGTA GAATGTCTAT TTTTATGATT

3001
TAGTATGTTC GTGACAATAG GCTATAGCTA TTTTGAAACT TCGGGAGCAT AAAATAGTAC

3061
TCGATTTTGT ATAACCATAA ACACACAGCT AGCCAATCTC TATTCATATT TATTTTAGTT

3121
TTATTTGCCG AACCATCCTC AACATCATAG CCACTTGATC GATCATCTCA ATCAGCGTTT

3181
GTATCCTTGC CCGCTTGATT ATCATCCATG GCAGTTCATA TTTTTTTTCA TTTCTTTCAT

3241
GCTTGTTATA GTTTTATCTG ATGAATCCAA GATGTTATTG ATCAATTAGT TCAGATGAGC

3301
AGTAATGCAT GTTGGAGGTT TGGTAGTATA TATACGTTCA AAATTTCACG AAATCGGTAA

3361
TTACGGTGGG AGCCAAAAAA AATTCCAAAA TTTCGTATTA CATTAATAAT GCATGTGCTG

3421
TAGACTCATA TTTTCTATGA TTTCGATTCT GTCACCATCC TGCTCGAATA TTTAAATCAT

3481
GCTAATATTT TGTTTACATC TAAATCTTTT ATAAAAATTA TAATTTATAT TTGGGTTTAA

3541
CAATTTCGGG CGCGTTTAGT GAGATTGGGT AATTTCGGAG CGAGGCCACC GGCCACACGA

3601
AAAATTCTAT ACACGACTAT ATGTGTACAT GTACATGCAT GGCACCCTGA TAGGCTACCC

3661
CATGGGGAAA AAATTGGAAA CGGACCATTC ATACGCAGTC GTGGTGCAGA CTGTGGGCCA

3721
CAATAGCAGT GTAAACATAA TTACGGTAAT CAAATACCCC ATGGGACCAT ATATATCATC

3781
CACAGATCCG TACGGTGCTT CCGTGTGGAT GGTCTACACC AGATCTTTTC CACACCATAA

3841
GGGCAGCAAT GCAGCATCAT ATTCATATAT GCACTAGTGA TGTACCATTT GGCTTATATC

3901
ATATTCAACC TAACTCCTTG GAAACATTAT GATATTCTAT TGGGTTGAAG ATGTCACTAC

3961
TACAAAAAAA AATCTTATGA GAGGTGTTTT GAAAACTGCC GGAGGTGCTT AAAGGAGACA

4021
GACGAGTTAG GACAACCGTC TCTATTAATG TGTACTAACT GAGGTAGTTA CCGTAACGTG

4081
CCTGACTTGA TTAACAGATT CAACCGTCTC AGTAAAGGCC ATGATTAACC GAAACAGATT

4141
CGAGAGTTTT CTTAAGTAGT TAAACTATTT TAATCTTCAC CGAACTTATA GAAAATGAAA

4201
GAGCTAACAC CAATATTTAT AAAAATAAAT TAGTATCACT AAATACATCA CGAAATCTAT

4261
TTGGTGTTGT AGAAGTTATC CTTTTCTATA AAATTGATCA AATTTATGAT AACTTAGTTT

4321
TAGGAATTCA TTTATTTTAG GACAACTGAG GAAGTACATA TTTTTTAAGT CATCCACAAA

4381
GTAGTGGATC CAATTTATTA CATTACTCTA CTACTTCAAA CTGAACAAAA GCCTAATCCT

4441
GGTTATTTTT AGAGTGATTT TTTACAACAT CAGCAGTAGT CCAGAAAATG GGAGGACATT

4501
AATAAAAGTG AAAAGGAGCA GAAGAAAGAT TACGGTATTT TATTTGTGCT ATTTGTTTAA

4561
CTATTGGCAG TTTGGGACCG AAATAAATAA CTGTTCGTAG CTCTATATTT GTCGATTCGA

4621
AAGTGTAACG ATGATTTTTG TGTTTCAAAA GAAAAATAAA GAAGTGCACC AATGATTGGA

4681
TATCATAGGC TATATATGTT GGATTAATTG CATCCAACGT ATATAGTGAA AATGCTTTTC

4741
AATCAAGTAA TCTTCGAGCG GTTACCAGTT TTAATAGTTG CGAGTCGTCG TTTTTTATGT

4801
ACCCTAGGAC ATATATATCC GCATGTAGAC GATGATGAGA CTAGCAAGTT TTTTTTTTTT

4861
TTTGAGCAAA TACATAATTA TTGGATTTGC AGGCCGTGAG ATGATGTGCT ACGAGCCCCC

4921
TGCCCCGTCC ACGGGCATCC ACCGTATGGT GCTGGTGCTA TTCCAGCAGC TTGGCCGTGA

4981
CACGGTGTTC GCGGCGCCGT CCAGGCGCCA CAACTTCAAC ACCCGTGCCT TCGCCCGCCG

5041
CTACAACCTC GGCGCGCCCG TCGCCGCCAT GTTCTTCAAC TGCCAGCGCC AGACCGGCTC

5101
CGGTGGCCCC AGGTTCACCG GGCCCTACAC CAGCCGACGT CGTGCGGGCT GATGACGACG

5161
ATCGTCGTTA CGTCACGTGT ACCGTACACA TATATGTATA GATATACATG CATGCATGTT

5221
CCATGGTATA GGATCGGTGA CAAAACGTCT AATAATGTA

(SEQ ID NO:5 Sb06g012260 (5.2 kb)—S. propinquum) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:5. N=1, 2, 3, 4, or 5 nucleotides in length.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:5, including introns, can be:

1
ATGGCGGCTA ACGATTCCTT GGTTACTGCT CATGTGATAG GAGATGTCTT GGACCCCTTC

61
TATACAACCG TTGACATGAT GATCCTATTC GATGGTACTC CTATTATCAG CGGCATGGAG

121
TTGCGCGCTC CGGCGGTTTC TGACAGGCCA AGGGTTGAAA TTGGAGGAGA TGATTATCGA

181
GTTGCATATA CTCTGGTAAA CTCATGCCAT GTCAATTAAC TAGTAGTTGA ATTTAGATGC

241
TGGTGGTATC GTGGATACAT GTACTATATG TTATGGTTGA TACATATTTG TTTAATTGAT

301
CGCAACACCA TTTGCGGTAA CTTCAAATTA CATTCTTTCA ATATATAGGT GATGGTCGAT

361
CCTGATGCTC CTAACCCAAG CAACCCAACC TTGAGGGAGT ACTTGCACTG GTAAGAGAAA

421
CCTATAGACG ACAATTATTG TTGTTGGCAT GTTTTGCCCA CATATACTTT GTGTGTGTAT

481
ATTTGTGCTT ATGCTTCTCC ATAAAATTTT GGTGTATGTC TCAAGAGAGA TAGGTATAGA

541
GGTTAGCAGT CCTTTAAAAA TGGTTTAATC CAGTAGTTTT TTTTCGGTCG GACTGCTCGA

601
ATTATTGTAT ATATGGAGAT CACATGCTAG TAACTTTTTC AATAATTTCA TGTTTCGAGC

661
AGGATGGTGA CTGACATCCC AGCATCAACT GATAATACAT ACGGTGAGTA CACCCCTATT

721
CCCATTTTGA AACAAGTAGA ATGTCTATTT TTATGATTTA GTATGTTCGT GACAATAGGC

781
TATAGCTATT TTGAAACTTC GGGAGCATAA AATAGTACTC GATTTTGTAT AACCATAAAC

841
ACACAGCTAG CCAATCTCTA TTCATATTTA TTTTAGTTTT ATTTGCCGAA CCATCCTCAA

901
CATCATAGCC ACTTGATCGA TCATCTCAAT CAGCGTTTGT ATCCTTGCCC GCTTGATTAT

961
CATCCATGGC AGTTCATATT TTTTTTCATT TCTTTCATGC TTGTTATAGT TTTATCTGAT

1021
GAATCCAAGA TGTTATTGAT CAATTAGTTC AGATGAGCAG TAATGCATGT TGGAGGTTTG

1081
GTAGTATATA TACGTTCAAA ATTTCACGAA ATCGGTAATT ACGGTGGGAG CCAAAAAAAA

1141
TTCCAAAATT TCGTATTACA TTAATAATGC ATGTGCTGTA GACTCATATT TTCTATGATT

1201
TCGATTCTGT CACCATCCTG CTCGAATATT TAAATCATGC TAATATTTTG TTTACATCTA

1261
AATCTTTTAT AAAAATTATA ATTTATATTT GGGTTTAACA ATTTCGGGCG CGTTTAGTGA

1321
GATTGGGTAA TTTCGGAGCG AGGCCACCGG CCACACGAAA AATTCTATAC ACGACTATAT

1381
GTGTACATGT ACATGCATGG CACCCTGATA GGCTACCCCA TGGGGAAAAA ATTGGAAACG

1441
GACCATTCAT ACGCAGTCGT GGTGCAGACT GTGGGCCACA ATAGCAGTGT AAACATAATT

1501
ACGGTAATCA AATACCCCAT GGGACCATAT ATATCATCCA CAGATCCGTA CGGTGCTTCC

1561
GTGTGGATGG TCTACACCAG ATCTTTTCCA CACCATAAGG GCAGCAATGC AGCATCATAT

1621
TCATATATGC ACTAGTGATG TACCATTTGG CTTATATCAT ATTCAACCTA ACTCCTTGGA

1681
AACATTATGA TATTCTATTG GGTTGAAGAT GTCACTACTA CAAAAAAAAA TCTTATGAGA

1741
GGTGTTTTGA AAACTGCCGG AGGTGCTTAA AGGAGACAGA CGAGTTAGGA CAACCGTCTC

1801
TATTAATGTG TACTAACTGA GGTAGTTACC GTAACGTGCC TGACTTGATT AACAGATTCA

1861
ACCGTCTCAG TAAAGGCCAT GATTAACCGA AACAGATTCG AGAGTTTTCT TAAGTAGTTA

1921
AACTATTTTA ATCTTCACCG AACTTATAGA AAATGAAAGA GCTAACACCA ATATTTATAA

1981
AAATAAATTA GTATCACTAA ATACATCACG AAATCTATTT GGTGTTGTAG AAGTTATCCT

2041
TTTCTATAAA ATTGATCAAA TTTATGATAA CTTAGTTTTA GGAATTCATT TATTTTAGGA

2101
CAACTGAGGA AGTACATATT TTTTAAGTCA TCCACAAAGT AGTGGATCCA ATTTATTACA

2161
TTACTCTACT ACTTCAAACT GAACAAAAGC CTAATCCTGG TTATTTTTAG AGTGATTTTT

2221
TACAACATCA GCAGTAGTCC AGAAAATGGG AGGACATTAA TAAAAGTGAA AAGGAGCAGA

2281
AGAAAGATTA CGGTATTTTA TTTGTGCTAT TTGTTTAACT ATTGGCAGTT TGGGACCGAA

2341
ATAAATAACT GTTCGTAGCT CTATATTTGT CGATTCGAAA GTGTAACGAT GATTTTTGTG

2401
TTTCAAAAGA AAAATAAAGA AGTGCACCAA TGATTGGATA TCATAGGCTA TATATGTTGG

2461
ATTAATTGCA TCCAACGTAT ATAGTGAAAA TGCTTTTCAA TCAAGTAATC TTCGAGCGGT

2521
TACCAGTTTT AATAGTTGCG AGTCGTCGTT TTTTATGTAC CCTAGGACAT ATATATCCGC

2581
ATGTAGACGA TGATGAGACT AGCAAGTTTT TTTTTTTTTT TGAGCAAATA CATAATTATT

2641
GGATTTGCAG GCCGTGAGAT GATGTGCTAC GAGCCCCCTG CCCCGTCCAC GGGCATCCAC

2701
CGTATGGTGC TGGTGCTATT CCAGCAGCTT GGCCGTGACA CGGTGTTCGC GGCGCCGTCC

2761
AGGCGCCACA ACTTCAACAC CCGTGCCTTC GCCCGCCGCT ACAACCTCGG CGCGCCCGTC

2821
GCCGCCATGT TCTTCAACTG CCAGCGCCAG ACCGGCTCCG GTGGCCCCAG GTTCACCGGG

2881
CCCTACACCA GCCGACGTCG TGCGGGCTGA

(SEQ ID NO:6 Sb06g012260 (5.2 kb)—S. propinquum) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:6.

The coding sequence of the maturity Ma1 gene, without introns, as it is found in short-day S. propinquum can include the nucleic acid sequence:

(SEQ ID NO:7, Sb06g012260—S. propinquum, or fragment, or a variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:7.

A maturity Ma1 protein as it is found in short-day S. propinquum can include the amino acid sequence:

MAANDSLVTAHVIGDVLDPFYTTVDMMILFDGTPIISGMELRAPAVSDRP

RVEIGGDDYRVAYTLVMVDPDAPNPSNPTLREYLHWMVTDIPASTDNTYG

REMMCYEPPAPSTGIHRMVLVLFQQLGRDTVFAAPSRRHNFNTRAFARRY

NLGAPVAAMFFNCQRQTGSGGPRFTGPYTSRRRAG*

(SEQ ID NO:8, Sb06g012260) or functional fragment, or variant thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:8.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in short day S. propinquum includes the nucleic acid sequence:

1
CACTAGTACA AAAATCATTT TCGTTGGCAC GTTGTTTTTT TTTTCACAGG CAGTTCACAA

61
TATCATGGTG CTAGTAGAAA AATTTCAACG GGCCCAACAA GAGAACCGCC AGGCGGTCTT

121
CTTAATTCAA CCGCCTGTGT AAACTTTCCA TTTACATAGG CGGCTTACGA TAAAAACCGT

181
GTGTATAAAT ACCATTAACA CAGGCAGTCG AGTTACGACA ACCGCCTGTG TAAATGTGTC

241
TTTTTACACA GGCGGTTTGT ATAGAGGGCC GCCTGTGCTA ATATATTTAC ACAGGCTATG

301
AGCCGCCTGT GTTAAGTCTT CTATAAATAC CCTTCGTCCA CCTCCAGACA AGAACAGTTA

361
CTCCCATGAG CTCTGCACAC TGGCGGACCA GACGATTCCA GTTTCCAAGG GGGGAGGTTT

421
TGATTTTCAT TTCTTTGGTG AGAAACTTCC AAAAGGTTAG TTAGTGCCAT TGATGCTATT

481
TTTTAAGCGA TTCTTTGGTT CAATTCTTGT ATTGGAGGTG CTCTAGATCT AGAGTTCATC

541
ATGCATTCTT GCTTAGGGTT AGAGTTCATA GGGCAAAAAG AGAGAGATTT AGCTAAATTT

601
TTATGTAAAT TCATAGTAAA TTGTAAAAAT TAAAAAAAAT AAAAAATAAA TACTTTTTAG

661
AATTCTTGTG AGTAGATCTA TACAATAGAG TAATGATGAG GATATTTTGA AGTTTATAAT

721
TTTGATTCAG TTTTAGCTTT TCTTTTTTCA GATGAATTAG ACTTTATAAA CTCAAACATT

781
AAAATGTTGA AAATCATAAA ATGGCAAATA AATACTTTTT CAAATCTTTG TGCATAAATA

841
CTTCATAGAA ATCCTTGAAT TATTCCTAAA TTTTATACAA TTGTTTCTTA TAATTATGAA

901
AATGAGTTTA AACAATTATT TAAATTCCAT AAATTGTAAC TCCGTAAGGT GTAGGTTTTC

961
ATCTCTGTTT AATAGAAGGA GGTTAGTATC TTAGTTAAGT CTGTTTTCGG GGGTTATATT

1021
AGTTTTGTTT TTAGATTGAC CTACATTAAT TGTTCTTAAC TAATTACAGC TAAATATGGA

1081
GAGGTCATTA TGGATGTACA ACTTATCAAG ATTGGACCTA TCATATGTAG TGCAGGTCCA

1141
AAAATTTATT GATGTCGCAA AGATACATGC TCGCAGAACA AAGGCGAAGC ACATATGTTG

1201
TCCATGCGCA GACTGCAAAA ATATTATGGT ATTTGACAAT GTAGAAGCAA TTACTTCCCA

1261
TCTGGTTTGA AGAGGATTTA TGGAGGACTA CTTGATTTGG ACAAAACATG GTGAGGGTAG

1321
TTTTGCACCT TATATGCGGA CAACTGACAA CACTGCAACT AACATCAATG TGGAGGGTCC

1381
AATGCCACCT CTCAATGAAT TTCATGCTAT GCCAGATGTT AATGAAACTC ATACGTCTGA

1441
TGTCAATGAA ACTCAGCATG CTAACACAGA TGTTGTTGAA GATGCAGATT TCTTAGAGGC

1501
AATAATGAAC CGTTGTGCGG ATCCATCAAT ATTCTTCATG AAGGGAATGA AAGCATTGAA

1561
GAAGGCAGCA GAGGACACTT TGTACGACGA GTCAAAAGGT TGTACCAAAC AATGGTCGAC

1621
ATTATGTGTT GTTCTTCAGT TTTTGACGAT GAAGGCTAGA CATGGTTGGT CCGATGCTAG

1681
CTTCAATGAT TTCTTGCGTG TACTTGGAGA CCTTCTTCCT AAGGAGAACA AAGTGCCTGC

1741
TAACACATAC TATGCAAAGA AGCTAGTCAG TCCACTTACG ATAGGTGTTG AGAAGATCCA

1801
CGCATGTAGA AATCATTGTA TTCTATATCG AGGTGATCAA TATAAAGACT TAGACAGTTG

1861
TCCAAACTGT GGTGCCAGTA GGTACAAGAC AAACAAAGAT TTTCGGGAGG AAGAGAATCT

1921
AGCCTCTGTT TCTACAGGGA GGAAGCGAAA GAAGACCCAA ACAAAGACTC AACAAGACAA

1981
GCGCTCAAAG CCTAGTAGCA ATGAAGAAGT GGACTATTAT GCATTGAGAA GAGTCTCCCT

2041
ATGAGCCAAA AAAGGGGACA GCAGCAGGCA CAACTCTCTT TCTGAAAGGA CTTGGAAAGC

2101
AGCGGACGGC ACGGCTCATT GAGCTCGAAC CGTCACAGAA AAAGGAAGCC ACCGCCCAGT

2161
CAATAGAAGC CATGCCCCCA TCAAAGGAAG CCCCAAGTGG CGATGTACAT ATTGAACAGC

2221
CATCAAGTCA ACCATTGACC CTAAAGGATA TCAGAAAGCC AACGATTGAT GATTATGTCA

2281
ATGTCCCTAG TGACTATGTG CCCGGAAGGC CTATGCTCCA ATGGACGCTG CTCGATTAGA

2341
TTCAATGGCT GATAAAAAGG TTTCATGACT GGTACATGAG AGCAGTGCAT GCTAGCCTCC

2401
ATGGAATCAG AGTTGATATA CCAACAGACA TGTTTGCTAC TGGTAACAAA AAAAGCAAGA

2461
CATTTGTTAC CTTTGAGGAC ATGCACTTGT TATTGAACTA TAGGCGGCTT GACGTCCAAC

2521
TCATAACAAT CTGGTGCCTG TAAGTATCAC TCATGCACAC ACAATTATTA TATATTAATA

2581
TGTAGTGTGA AACTCTAATA TGTAGATGTT GTCTGTAGTT TGCAAGATCA CGAGCAGATG

2641
TCATTATTAT CTGCCGGATC GATGGTCGGT TATCTGAGCC CTATCAAGTT ACAAGAAAAT

2701
ATGAACAAAT TCGTATTATC AAAGGAAGAT AGAGCAAAGA TAGAGGAAGA CAAAACACCA

2761
GGATAATTAT GCCATCTATC TTGGTAGATC AATGCTGAGG TATAAATATA GGGATTTTAT

2821
ATTGGCACCA TACAACATTA GGTAAGCTTG ACTTCATATA CGTATTTCAA ATTATCGTGT

2881
AAACAATATA CATGTGTCGC TCACTCATTT ATTCATGCAG TGACCATTGG ATTGTTTTTT

2941
ATATTTATCC CTTCGAAGGG AAGGTGCTTG TCCTAGACTC TTTACATGTT CCTCCCGAGA

3001
AGTATCAACC ATTCTTGGTT CAATTAGAAA GGTGAGCCAA CATGAAACCA CATGCGTACT

3061
TATATAAATT AGAGTTTCAA AATAACTTTA GTGATTTAGG TTCGATATCT ACGGGGCATG

3121
GCGGTTTTAT AAGAAACAAA AGGGACCTGT CGACGCTGCA CGCTCAGATC CTAGGATCCC

3181
ATTGATGATA CAACACCACT ATCCGGTAAG TTTTCTGAAC ACATTTCATC ATATAAATAA

3241
TACATAAAGC ATGGCAAATT TAGAATAATC CGTTGCTCAT TATATAGTGC CACAAGCAAC

3301
CACCTGGATC GGTCTATTGT GGGTACTATG TCTGTGAGTT TATAAGGCAG CGGGGACGTT

3361
ACGTCAAGGA CAAAAATATG GTAAATAATA TCTATGTATG AAAGTTTTCT CATTAAAGCT

3421
GCAAAATTAT ATATTGAACA TGTGTCAATC ATGCTTTTAA ACTTTATTTT CAGCCGAAAA

3481
AGCAAGGAAA AGACGTGCCC TTTACACCAA AGACTCTGGA AGATATAGTA GCATACTTGT

3541
GTGGTTTTAT TATGAGAGAA ATAATTTCAA GTGACAGTGC ATATTTTGAT CATGAGGGCG

3601
ATTTAGCAAG TGATAAATTT AGAGTGCTGA CAGACATAGC AGGTCTAAAT CTGAAGCGAA

3661
ACGACATGTA AACATTGTAT GGTTGTGCGG ATAACATGCA TTGACGTGTA TATATATAAT

3721
TTTATGGTTG ATGTTTGATT TGTTTACAAT TCTATAATAT ATATATGTGG TGTATGTATG

3781
ATGTTGTGTG TGTATATATA TATATATATA TATATATATA TATATATATA TATATATATA

3841
TATATATATA TAATGTTTAG CACTGTGTTT GGTGGGAAAA ATTAAAATTT GAAATATATA

3901
TAAAAAATTA TTTACACAGA CAGTGTACGT GTCGAGCGTC GTCCTGTGCT ATACAAATAC

3961
ATTCTAACAG GCGGCTCGCC TTGTCCACCG GTCGGTTAAA AATACATTTC CACACNGGCC

4021
TGGCTGGGAG AGCCGCCTGT GAAAACATAA TTTTCACAGG CGGCTCGCAC AGCCCCGCCT

4081
GTACTGTGGT CCATTTTGTA CTGACCCCTG GTACAGGCGG TGGGCTTGGC CGCCTGTGAA

4141
GATGCTTTTA GCACCGCCTG TAAAAATGTT TTTTGTAGCA GTGTTT

(SEQ ID NO:19—Sb07g008600—S. propinquum) or a functional fragment or variant thereof having 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:19.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:19, including introns, can be:

1
ATGCCCCCAT CAAAGGAAGC CCCAAGTGGC GATGTACATA TTGAACAGCC ATCAAGTCAA

61
CCATTGACCC TAAAGGATAT CAGAAAGCCA ACGATTGATG ATTATGTCAA TGTCCCTAGT

121
GACTATGTGC CCGGAAGGCC TATGCTCCAA TGGACGCTGC TCGATTAGAT TCAATGGCTG

181
ATAAAAAGGT TTCATGACTG GTACATGAGA GCAGTGCATG CTAGCCTCCA TGGAATCAGA

241
GTTGATATAC CAACAGACAT GTTTGCTACT GGTAACAAAA AAAGCAAGAC ATTTGTTACC

301
TTTGAGGACA TGCACTTGTT ATTGAACTAT AGGCGGCTTG ACGTCCAACT CATAACAATC

361
TGGTGCCTGT AAGTATCACT CATGCACACA CAATTATTAT ATATTAATAT GTAGTGTGAA

421
ACTCTAATAT GTAGATGTTG TCTGTAGTTT GCAAGATCAC GAGCAGATGT CATTATTATC

481
TGCCGGATCG ATGGTCGGTT ATCTGAGCCC TATCAAGTTA CAAGAAAATA TGAACAAATT

541
CGTATTATCA AAGGAAGATA GAGCAAAGAT AGAGGAAGAC AAAACACCAG GATAATTATG

601
CCATCTATCT TGGTAGATCA ATGCTGAGGT ATAAATATAG GGATTTTATA TTGGCACCAT

661
ACAACATTAG GTAAGCTTGA CTTCATATAC GTATTTCAAA TTATCGTGTA AACAATATAC

721
ATGTGTCGCT CACTCATTTA TTCATGCAGT GACCATTGGA TTGTTTTTTA TATTTATCCC

781
TTCGAAGGGA AGGTGCTTGT CCTAGACTCT TTACATGTTC CTCCCGAGAA GTATCAACCA

841
TTCTTGGTTC AATTAGAAAG GTGAGCCAAC ATGAAACCAC ATGCGTACTT ATATAAATTA

901
GAGTTTCAAA ATAACTTTAG TGATTTAGGT TCGATATCTA CGGGGCATGG CGGTTTTATA

961
AGAAACAAAA GGGACCTGTC GACGCTGCAC GCTCAGATCC TAGGATCCCA TTGATGATAC

1021
AACACCACTA TCCGGTAAGT TTTCTGAACA CATTTCATCA TATAAATAAT ACATAAAGCA

1081
TGGCAAATTT AGAATAATCC GTTGCTCATT ATATAGTGCC ACAAGCAACC ACCTGGATCG

1141
GTCTATTGTG GGTACTATGT CTGTGAGTTT ATAAGGCAGC GGGGACGTTA CGTCAAGGAC

1201
AAAAATATGG TAAATAATAT CTATGTATGA AAGTTTTCTC ATTAAAGCTG CAAAATTATA

1261
TATTGAACAT GTGTCAATCA TGCTTTTAAA CTTTATTTTC AGCCGAAAAA GCAAGGAAAA

1321
GACGTGCCCT TTACACCAAA GACTCTGGAA GATATAGTAG CATACTTGTG TGGTTTTATT

1381
ATGAGAGAAA TAATTTCAAG TGACAGTGCA TATTTTGATC ATGAGGGCGA TTTAGCAAGT

1441
GATAAATTTA GAGTGCTGAC AGACATAGCA GGTCTAAATC TGAAGCGAAA CGACATGTAA

(SEQ ID NO:28—Sb07g008600—S. propinquum) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:28.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:28, without introns, can be:

(SEQ ID NO:29—Sb07g008600—S. propinquum) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:29.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in short day S. propinquum includes the nucleic acid sequence:

1
CACTAGTACA AAAATCATTT TCGTTGGCAC GTTGTTTTTT TTTTCACAGG CAGTTCACAA

61
TATCATGGTG CTAGTAGAAA AATTTCAACG GGCCCAACAA GAGAACCGCC AGGCGGTCTT

121
CTTAATTCAA CCGCCTGTGT AAACTTTCCA TTTACATAGG CGGCTTACGA TAAAAACCGT

181
GTGTATAAAT ACCATTAACA CAGGCAGTCG AGTTACGACA ACCGCCTGTG TAAATGTGTC

241
TTTTTACACA GGCGGTTTGT ATAGAGGGCC GCCTGTGCTA ATATATTTAC ACAGGCTATG

301
AGCCGCCTGT GTTAAGTCTT CTATAAATAC CCTTCGTCCA CCTCCAGACA AGAACAGTTA

361
CTCCCATGAG CTCTGCACAC TGGCGGACCA GACGATTCCA GTTTCCAAGG GGGGAGGTTT

421
TGATTTTCAT TTCTTTGGTG AGAAACTTCC AAAAGGTTAG TTAGTGCCAT TGATGCTATT

481
TTTTAAGCGA TTCTTTGGTT CAATTCTTGT ATTGGAGGTG CTCTAGATCT AGAGTTCATC

541
ATGCATTCTT GCTTAGGGTT AGAGTTCATA GGGCAAAAAG AGAGAGATTT AGCTAAATTT

601
TTATGTAAAT TCATAGTAAA TTGTAAAAAT TAAAAAAAAT AAAAAATAAA TACTTTTTAG

661
AATTCTTGTG AGTAGATCTA TACAATAGAG TAATGATGAG GATATTTTGA AGTTTATAAT

721
TTTGATTCAG TTTTAGCTTT TCTTTTTTCA GATGAATTAG ACTTTATAAA CTCAAACATT

781
AAAATGTTGA AAATCATAAA ATGGCAAATA AATACTTTTT CAAATCTTTG TGCATAAATA

841
CTTCATAGAA ATCCTTGAAT TATTCCTAAA TTTTATACAA TTGTTTCTTA TAATTATGAA

901
AATGAGTTTA AACAATTATT TAAATTCCAT AAATTGTAAC TCCGTAAGGT GTAGGTTTTC

961
ATCTCTGTTT AATAGAAGGA GGTTAGTATC TTAGTTAAGT CTGTTTTCGG GGGTTATATT

1021
AGTTTTGTTT TTAGATTGAC CTACATTAAT TGTTCTTAAC TAATTACAGC TAAATATGGA

1081
GAGGTCATTA TGGATGTACA ACTTATCAAG ATTGGACCTA TCATATGTAG TGCAGGTCCA

1141
AAAATTTATT GATGTCGCAA AGATACATGC TCGCAGAACA AAGGCGAAGC ACATATGTTG

1201
TCCATGCGCA GACTGCAAAA ATATTATGGT ATTTGACAAT GTAGAAGCAA TTACTTCCCA

1261
TCTGGTTTGA AGAGGATTTA TGGAGGACTA CTTGATTTGG ACAAAACATG GTGAGGGTAG

1321
TTTTGCACCT TATATGCGGA CAACTGACAA CACTGCAACT AACATCAATG TGGAGGGTCC

1381
AATGCCACCT CTCAATGAAT TTCATGCTAT GCCAGATGTT AATGAAACTC ATACGTCTGA

1441
TGTCAATGAA ACTCAGCATG CTAACACAGA TGTTGTTGAA GATGCAGATT TCTTAGAGGC

1501
AATAATGAAC CGTTGTGCGG ATCCATCAAT ATTCTTCATG AAGGGAATGA AAGCATTGAA

1561
GAAGGCAGCA GAGGACACTT TGTACGACGA GTCAAAAGGT TGTACCAAAC AATGGTCGAC

1621
ATTATGTGTT GTTCTTCAGT TTTTGACGAT GAAGGCTAGA CATGGTTGGT CCGATGCTAG

1681
CTTCAATGAT TTCTTGCGTG TACTTGGAGA CCTTCTTCCT AAGGAGAACA AAGTGCCTGC

1741
TAACACATAC TATGCAAAGA AGCTAGTCAG TCCACTTACG ATAGGTGTTG AGAAGATCCA

1801
CGCATGTAGA AATCATTGTA TTCTATATCG AGGTGATCAA TATAAAGACT TAGACAGTTG

1861
TCCAAACTGT GGTGCCAGTA GGTACAAGAC AAACAAAGAT TTTCGGGAGG AAGAGAATCT

1921
AGCCTCTGTT TCTACAGGGA GGAAGCGAAA GAAGACCCAA ACAAAGACTC AACAAGACAA

1981
GCGCTCAAAG CCTAGTAGCA ATGAAGAAGT GGACTATTAT GCATTGAGAA GAGTCTCCCT

2041
ATGAGCCAAA AAAGGGGACA GCAGCAGGCA CAACTCTCTT TCTGAAAGGA CTTGGAAAGC

2101
AGCGGACGGC ACGGCTCATT GAGCTCGAAC CGTCACAGAA AAAGGAAGCC ACCGCCCAGT

2161
CAATAGAAGC CATGCCCCCA TCAAAGGAAG CCCCAAGTGG CGATGTACAT ATTGAACAGC

2221
CATCAAGTCA ACCATTGACC CTAAAGGATA TCAGAAAGCC AACGATTGAT GATTATGTCA

2281
ATGTCCCTAG TGACTATGTG CCCGGAAGGC CTATGCTCCA ATGGACGCTG CTCGATTAGA

2341
TTCAATGGCT GATAAAAAGG TTTCATGACT GGTACATGAG AGCAGTGCAT GCTAGCCTCC

2401
ATGGAATCAG AGTTGATATA CCAACAGACA TGTTTGCTAC TGGTAACAAA AAAAGCAAGA

2461
CATTTGTTAC CTTTGAGGAC ATGCACTTGT TATTGAACTA TAGGCGGCTT GACGTCCAAC

2521
TCATAACAAT CTGGTGCCTG TAAGTATCAC TCATGCACAC ACAATTATTA TATATTAATA

2581
TGTAGTGTGA AACTCTAATA TGTAGATGTT GTCTGTAGTT TGCAAGATCA CGAGCAGATG

2641
TCATTATTAT CTGCCGGATC GATGGTCGGT TATCTGAGCC CTATCAAGTT ACAAGAAAAT

2701
ATGAACAAAT TCGTATTATC AAAGGAAGAT AGAGCAAAGA TAGAGGAAGA CAAAACACCA

2761
GGATAATTAT GCCATCTATC TTGGTAGATC AATGCTGAGG TATAAATATA GGGATTTTAT

2821
ATTGGCACCA TACAACATTA GGTAAGCTTG ACTTCATATA CGTATTTCAA ATTATCGTGT

2881
AAACAATATA CATGTGTCGC TCACTCATTT ATTCATGCAG TGACCATTGG ATTGTTTTTT

2941
ATATTTATCC CTTCGAAGGG AAGGTGCTTG TCCTAGACTC TTTACATGTT CCTCCCGAGA

3001
AGTATCAACC ATTCTTGGTT CAATTAGAAA GGTGAGCCAA CATGAAACCA CATGCGTACT

3061
TATATAAATT AGAGTTTCAA AATAACTTTA GTGATTTAGG TTCGATATCT ACGGGGCATG

3121
GCGGTTTTAT AAGAAACAAA AGGGACCTGT CGACGCTGCA CGCTCAGATC CTAGGATCCC

3181
ATTGATGATA CAACACCACT ATCCGGTAAG TTTTCTGAAC ACATTTCATC ATATAAATAA

3241
TACATAAAGC ATGGCAAATT TAGAATAATC CGTTGCTCAT TATATAGTGC CACAAGCAAC

3301
CACCTGGATC GGTCTATTGT GGGTACTATG TCTGTGAGTT TATAAGGCAG CGGGGACGTT

3361
ACGTCAAGGA CAAAAATATG GTAAATAATA TCTATGTATG AAGTTTTCTC ATTAAAGCTG

3421
CAAAATTATA TATTGAACAT GTGTCAATCA TGCTTTTAAA CTTTATTTTC AGCCGAAAAA

3481
GCAAGGAAAA GACGTGCCCT TTACACCAAA GACTCTGGAA GATATAGTAG CATACTTGTG

3541
TGGTTTTATT ATGAGAGAAA TAATTTCAAG TGACAGTGCA TATTTTGATC ATGAGGGCGA

3601
TTTAGCAAGT GATAAATTTA GAGTGCTGAC AGACATAGCA GGTCTAAATC TGAAGCGAAA

3661
CGACATGTAA ACATTGTATG GTTGTGCGGA TAACATGCAT TGACGTGTAT ATATATAATT

3721
TTATGGTTGA TGTTTGATTT GTTTACAATT CTATAATATA TATATGTGGT GTATGTATGA

3781
TGTTGTGTGT GTATATATAT ATATATATAT ATATATATAT ATATATATAT ATATATATAT

3841
ATATATATAT AATGTTTAGC ACTGTGTTTG GTGGGAAAAA TTAAAATTTG AAATATATAT

3901
AAAAAATTAT TTACACAGAC AGTGTAGTGT GAGCTGCCTG TGTAAAAATA CATTTATACA

3961
GGCGGCTCAC CTTGTCNNNN CAGGCGGTGC TAAAAGCATC TTCACAGGCG GCCAAGCCCA

4021
CCGCCTGTAC CAGGGGTCAG TACAAAATGG ACCACAGTAC AGGCGGGGCT GTGCGAGCCG

4081
CCTGTGAAAA CATAATTTTC ACAGGCGGCT CGCACAGCCC CGCCTGTACT GTGGTCCATT

4141
TTGTACTGAC CCCTGGTACA GGCGGTGGGC TTGGCCGCCT GTGAAGATGC TTTTAGCACC

4201
GCCTGTAAAA ATGTTTTTTG TAGCAGTGTT T

(SEQ ID NO:20) or a functional fragment or variant thereof having 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:20 (Sb07g008600—S. propinquum). Each N=can be any nucleotide or combination of any 2, 3, 4, or 5 nucleotides.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:20, including introns, can be:

1
ATGCCCCCAT CAAAGGAAGC CCCAAGTGGC GATGTACATA TTGAACAGCC ATCAAGTCAA

61
CCATTGACCC TAAAGGATAT CAGAAAGCCA ACGATTGATG ATTATGTCAA TGTCCCTAGT

121
GACTATGTGC CCGGAAGGCC TATGCTCCAA TGGACGCTGC TCGATTAGAT TCAATGGCTG

181
ATAAAAAGGT TTCATGACTG GTACATGAGA GCAGTGCATG CTAGCCTCCA TGGAATCAGA

241
GTTGATATAC CAACAGACAT GTTTGCTACT GGTAACAAAA AAAGCAAGAC ATTTGTTACC

301
TTTGAGGACA TGCACTTGTT ATTGAACTAT AGGCGGCTTG ACGTCCAACT CATAACAATC

361
TGGTGCCTGT AAGTATCACT CATGCACACA CAATTATTAT ATATTAATAT GTAGTGTGAA

421
ACTCTAATAT GTAGATGTTG TCTGTAGTTT GCAAGATCAC GAGCAGATGT CATTATTATC

481
TGCCGGATCG ATGGTCGGTT ATCTGAGCCC TATCAAGTTA CAAGAAAATA TGAACAAATT

541
CGTATTATCA AAGGAAGATA GAGCAAAGAT AGAGGAAGAC AAAACACCAG GATAATTATG

601
CCATCTATCT TGGTAGATCA ATGCTGAGGT ATAAATATAG GGATTTTATA TTGGCACCAT

661
ACAACATTAG GTAAGCTTGA CTTCATATAC GTATTTCAAA TTATCGTGTA AACAATATAC

721
ATGTGTCGCT CACTCATTTA TTCATGCAGT GACCATTGGA TTGTTTTTTA TATTTATCCC

781
TTCGAAGGGA AGGTGCTTGT CCTAGACTCT TTACATGTTC CTCCCGAGAA GTATCAACCA

841
TTCTTGGTTC AATTAGAAAG GTGAGCCAAC ATGAAACCAC ATGCGTACTT ATATAAATTA

901
GAGTTTCAAA ATAACTTTAG TGATTTAGGT TCGATATCTA CGGGGCATGG CGGTTTTATA

961
AGAAACAAAA GGGACCTGTC GACGCTGCAC GCTCAGATCC TAGGATCCCA TTGATGATAC

1021
AACACCACTA TCCGGTAAGT TTTCTGAACA CATTTCATCA TATAAATAAT ACATAAAGCA

1081
TGGCAAATTT AGAATAATCC GTTGCTCATT ATATAGTGCC ACAAGCAACC ACCTGGATCG

1141
GTCTATTGTG GGTACTATGT CTGTGAGTTT ATAAGGCAGC GGGGACGTTA CGTCAAGGAC

1201
AAAAATATGG TAAATAATAT CTATGTATGA AGTTTTCTCA TTAAAGCTGC AAAATTATAT

1261
ATTGAACATG TGTCAATCAT GCTTTTAAAC TTTATTTTCA GCCGAAAAAG CAAGGAAAAG

1321
ACGTGCCCTT TACACCAAAG ACTCTGGAAG ATATAGTAGC ATACTTGTGT GGTTTTATTA

1381
TGAGAGAAAT AATTTCAAGT GACAGTGCAT ATTTTGATCA TGAGGGCGAT TTAGCAAGTG

1441
ATAAATTTAG AGTGCTGACA GACATAGCAG GTCTAAATCT GAAGCGAAAC GACATGTAA

(SEQ ID NO:30—Sb07g008600 (10.6 kb)—S. propinquum) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:30.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:30, without introns, can be:

(SEQ ID NO:31—Sb07g008600—S. propinquum) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:31.

2. Sequences for Day-Neutral Flowing

The S. bicolor cultivar from which the sequences described below are derived are day-neutral, and have the recessive (loss of function) Ma1 allele. Sequences for a recessive Ma1 gene are therefore provided.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in day-neutral S. bicolor can include the nucleic acid sequence:

1
AAAAGAAAAG TGAGCACACC ACGACCTATC ATCAGCTCAT GGTCAGCTCT ACAAACTTAT

61
AGATTGCATC GAGATCTAAG ACTCAGGTAC AAATCATGTC AACATCTAAT GGTTTAGAAA

121
ATGAAAAAAG TTTTGAGTTT CAAAATATGA TACTTGAAAT TAACATTTGA ACTTTTTAGC

181
AAGATCTGAA AATAAAAAAT TCAACTAAAA AATTTATAGA TCATGTTAAC ATTGATATAA

241
TCGCTTCCAA TCGCCTCCCA TCGCTTCAGC TAGAAAACTT TTTTTCTCGA TTTAATTAAT

301
GAAATAGTAA TAACGTCATT GTACAAGATT CTTTCAAACC CCAACCCCTA TCATCGACGG

361
TGAGGGCTCC TATAATATGC ACTAGTGGAC GCCGGGTGGG TGGAACCTAA GAAGATTTTA

421
AAAAAAAAAT TAAGAAGAAG ATTTTTATCT AACTAACTAT ATATAGTACT TATATCATAC

481
ACTATACTAT TCAAAATATT ATTTTCACAA TTATGAATTT ACCCTTTTAC TCTTTATTAA

541
AAAAATATGA ATAAAGAATT ATCACGCCTC TATTTAGGGT CCTAATCCCC ATAATTTAAG

601
AGGCGATGAG AGGCGATGTG ACATCTATGG CCCACCGACC AAAGACACAA CTATCGCCTC

661
CCATCACCTT GCTTCTATCG CCTCTCATAG CTTTTCATAT TCTAGGTCCA CCGGCCATAG

721
ACACACCAAT CGCTTATCAT CGCCTTTTCC AACCATTGTA AAAATATTCA TAATTTTGAT

781
ATAAAATTTG TCTTCACTTG AGTATGGGAA AAAAATTATA CATAATGTTT TCGTGTGAGA

841
ATTTACAGGA ATGAACCCTT AAGATGTCCA AATGTAAATG ACCCTATTTA TTAAGAGGAG

901
CGGATCTATA GGCCTGGCTC TGAAAATGGA TTATGGATTG GAGATACTAA ATTTAAGGGC

961
CTATCTTCGC ACATAACATC TATAGTTCCT AAATAATTTT TTATTGTAGT AGTAGAACTT

1021
TTCTCCCTGT AAACCATAAA CCAAGTTGAC GCTGGGCTTT ATTTTGCGAC ACAGAACACC

1081
AAATTGGTGG CTATGAACTC TTCCACCTGG GCAGGGAAAA CGGTTTATTA TGTTCCTCTT

1141
TAATTTATCT ATCGTGGTCT GTTTTCACTA AAACTGTCAT ATTGCTACAC TCCAGTACTA

1201
CCAGTACGTC GCCCGCACAT AGTGGCCAAG GATTTTACTG CTACTGTTGA TTAACATAAG

1261
CACTTGCGAC TTTCCCTAAC ATCTTTTATA AAACAACGGC CGCAATAATA TTGAACTGTT

1321
TTTTTCTAGT ACCAAAAATA GAATTTGATC CCTCACCTCA TTACATCCAT AGTAACATGA

1381
CCAGATATAT ATGGACAGGC CGGGATCACT CGCCAGCAGA TACCCTGAGC GATTCATAAC

1441
CAGAATTTTT AATTTTTTCT AGTGAAGTGG GGTTCTCCTA GTCCTTTAAC ATTCAAAATT

1501
TAGTACAAAC TTTCCTTAGT AAATGTCTTC TAGTAAAGAT TTCCTAGTGT TTTGATTTGG

1561
TAGTGTTTTA TTACTAATTA AAAATATTAG AAGAACTCCA TCATTTTGGT AGTGATTGGT

1621
TGTTTGGATT AGTCTTCTCA CGTTAGACCT ATATATGCAG GACAACTCAA GCCAGCATAA

1681
ATATATGAAA TATCTTGGTG TTTGTTTGTC TGACACAGGC AACCGTGTTT GGTATAAATG

1741
TGTTTTCTTG TTTACGTTTT ACCATCTATA GTCATCTCAA TGTTTATATA GTAGAGACTT

1801
CATGTTTGTA GTAGATAAGG TAGAGAATTG AGAATATTTT ATTTTTGTGC GACCATCAAT

1861
TTTATGTAAT CTGCATTGTC TAATGCTTTA TTTGACATTT GAAACTACTT AATTTGACCG

1921
TTATGCAGGT CCGCATGATC CTATGAAAGC AATTAATTAG TACGGGTACT GCACTACACA

1981
AGTTTGCTAG TACTATTCTA TTAACCGACC TGTCAATATT ACCTTAAGTT ACTGATTTCA

2041
ATTAGAATCT AACACATTCA GGAAAAGAAG TTTTCCTTAT TAGTAGTAAC TTTTTATACT

2101
AATTAAGATT CAATAAAAAT TCACCATGAC ATCCCCATTG CCAAGAGAAT ATTTCGCCGC

2161
CCCTCAAAGC AGCCAAGGCT TTACTAAAAA GACTATCCAC GCAGTAGAGA TTTAGTCAAA

2221
ATATTCCAAT AGCAATTGTT TTCTGCCTGC TTGACCTTCG TCAGCCACTC ACTGTATAAA

2281
TATCGCACCA CGCCCTTTGC AGGCTTACAG AGCTTGTACT ACGTACTAAC AAGGCACACA

2341
CAATACCCTG TGTTCACCGG CCCTGCACAA AACTCAAGCA GTTATTACTA ACATGGCGGC

2401
TAACGATTCC TTGGTTACTG CTCATGTGAT AGGAGATGTC TTGGACCCCT TCTATACAAC

2461
CGTTGATATG ATGATCCTAT TCGATGGTAC TCCTATTATC AGCGGCATGG AGTTGCGTGC

2521
TCCGGCGGTT TCTGACAGGC CAAGGGTTGA GATTGGAGGA GATGATTATC GAGTTGCATA

2581
TACTCTGGTA AACTCATGTC ATGTCAATTA ACTAGTAGTT GAATTTAGAT GCTGGTCGTA

2641
TCGTGGATAC ATGAACTATA TGTTATGGTT GATACATATT TGTTTAATTG ATCGCAACAC

2701
CATTTGTGGT AACTTCAAAT AACATTCTTT CAATATATAG GTGATGGTCG ATCCTGATGC

2761
TCCTAACCCA AGCAACCCAA CCTTGAGGGA GTACTTGCAC TGGTAAGAGA AACCTATAGA

2821
CGACAATTAT TGTTGTTGGC ATGTTCTGCC CACATATACT TTGCTAGTGT GTGTATATTT

2881
GTGCTTATGC TTCTCCATAA ATTTTGGTGT ATGTCCCAAG AGAGATAGGT ATAGAGGTTA

2941
GCAGTCCTTT AAAAATGGTT TAATCCAGTA GTTTTTTTTC GGTCGGCCGG ACTGCTAGTA

3001
ACTTTCAATC ATTTCATGTT TCGAGCAGGA TGGTGACTGA CATCCCAGCA TCAACTGATA

3061
ATACATACGG TGAGATCACC CCTATTCCCA TTTTGAGACA AGTAGAATGT CTATTTTTAT

3121
GATCTAGTAT GTTCGTGACA ATAGGCTAGC TATTTTGAAA CTTCGGGAGC ATAAAATAGT

3181
ACTCGATTTT GTATAACCAT AAACACAGCT AGCCAATCTC TATTCATATT TATTTTAGTT

3241
TTATTTGCCG AACCATCCTC AACATCATAG CCACTTGATC GATCATCTCA ATCAGCGTTT

3301
GTATCCTTGC CCGCTTTGAT TATCATCCAT GACAGTTCAT ATTTTTTTTC ATTTCTTTCA

3361
TGCTTGTTAT AGTTTTATCT GATGAATCCG AGATGTTATT GATCAATTAG TTCAGATGAG

3421
CAGTAATGTA TGTTGGAGGT TTGGTAGTAT ATATACGTTC AATATTTCAC GAAATCGGTA

3481
ATTACGAAAA TCCCAAAATT TTGAATTACA TTAATAATGC ATGTGACTCA TATTTTCTAT

3541
GATTTCTATT CTGTTGCATA TTCTTGTACT CAATAGATAT TTAAATCATG CTAATATTTT

3601
GTTTAGATCT AAATCTTTTA GAAAAATTAT AATTTATATT TGGGTTTAAC AATTTCGGGC

3661
GCGTTTAGTG AGATTGGGTA ATTTCGGAGC GAGGCGGCCG CCGGCCACGA AAAATTCTAT

3721
ACACGACTAT ATGTGTACAT GTACATGCAT GGCACCTTGA TAGGCTACCC CGGCCCGCAT

3781
GGGGAAAAAA TTGGAAACGG ACCATTCATA CGCAGTCGTG GTGCCGACTG TGGGCCACAA

3841
TAGCAGTGTA AACATAATTA CGGTAATCAA ATACCCCGTG GGACCATATA TATCATCCAC

3901
AGATCCGTAC GGTGCTTCCG TGTGGATGGT CTACCCCAGA TCTTTTCCAC CCCATAAGGG

3961
CAGCAATGCA GCATCATATT CATATGCACT AGTGATGTAC CATTTGGCTT ATATCATATT

4021
CAACCTAACT CCTTGGAAAC ATTATGATGT TCTATTGGGG TGAAGATGTC ACTACTAAAA

4081
AAAGATCTTA TGAGAGGTGT TTTGAAAACT GCCCGAGGTG GTTAAAGGAG ACGGACGAGT

4141
TAGGACAACT GCCTCTATTA ATGTGTATTA ACCGAGGTAG TTACCGTAAC GTGCCTGACT

4201
TGATTAACAG ATTCAACCGT CTCAGTAAAG ACCATGATTA ACCGAAACGG AATCGAGAGT

4261
TTTCTCAAGT AGTTAAACTA TTTTAAACTG CACCGAACTT ATAAAAATGG TAGAGCTAAC

4321
ACCAATATTT ATAAAAATAA ATTAGTATCA CTAAATACAT CACGAAATCT ATTTGGTGTT

4381
GTAGAAGTTA TCCTTTTCTA TAAAATTGAT CAAATTTATG ATAACTTAGT TTTAGGAATT

4441
GATTTATTTT AGGACAACTA AGGAAGTACA TTTTTTAAAG TCATCCACAA AGTAGTGGAT

4501
CCAATTTATT ACATTACTCC ACTACTTCAA ACTGAACAAA AGCCTAATCC TGGTTATTTT

4561
GAGAGTGATT TTTTACAACA TCAGCAGTAG TCCAGAAAAT GGGAGGACAT TAATAAAAGT

4621
GAAAAGGAGC AGAAGAAAGA TTACGGTATT TTATTTGTGC TATTTGTTTA ACTATTGGCA

4681
GTTTGGGACC GAAAATAAAT AACTGTTCGT AGCTCTATAT TTGTCCATTC GAAAGTGTAA

4741
CGATGATTAT TGTGTTTCAA AAGATAAATA AAGAAGTGCA CCAATGATTT GATATCATAG

4801
GCTATATAAT CCAACATGGT GAAAATGCTT TTCAATCAAG TAATCTTCGA GCGGTTACCA

4861
GTTTTAATAG TTGCGAGTCG TCGTTTTTTA TGTACCCTAG GACATATATA TATCCGCATG

4921
TAGACGATGA GACTAGCTAG TTTTTTTTTT TTTGAGCAAA TACATAATTA TTGGATTTGC

4981
AGGCCGTGAG ATGATGTGCT ACGAGCCCCC TGCCCCGTCC ACGGGCATCC ACCGGATGGT

5041
GCTGGTGCTA TTCCAGCAGC TTGGCCGTGA CACGGTGTTC GCGGCGCCGT CCAGGCGCCA

5101
CAACTTCAAC ACCCGTGCCT TCGCCCGCCG CTACAACCTC GGCGCGCCCG TCGCCGCCAT

5161
GTTCTTCAAC TGCCAGCGCC AGACCGGCTC CGGTGGCCCC AGGTTCACCG GGCCCTACAC

5221
CAGCCGCCGT CGTGCGGGCT GATGACGACG ATCGTCGTTA CGTCACGTGT ACCGTACATA

5281
TATATGTAAG ATATACATGC ATGTTCCATG GTAAGGATCG GTGACAAAAC GTCTAATAAT

5341
GTATACACAC ATATGCATGG AATGCATGTA ATAAGAGAAT ATATGTATAA TAAGTAGGGG

5401
GGAGCATGCA TATATTGTAC ACGCGTCCGA TGCGTATATA GCCCTATACA TTATTGTAGT

5461
TGTAATCAGC TGTTTAAGCA TTCTGCTGTG TCAGAACATG ATGCATATAT AGTTTGGTGT

5521
CAGTATTGAT GTTGTGGAAC TCTTATCAGC CTTCATCTCA TCACAAGTGA AAGATATAGC

5581
TTTTATACCT CCAAGTGTCT TCCCAATGTA CGTACCTAGA ACTTTTCTAA GAAATGCTAC

5641
AAATGTTGTA TTTTATCTGT GCGCTTCACT ACTGGAAACC CGAATATTTC TGTGGATGTC

5701
GAATTTTTCT GTGCGTTTTT TTCGATACGC ACGGAAAAAT TATAATTATT TTGTGAGTTT

5761
TAAAATACCC TCACAGAAAA ATACAAATAC CCACAGAACA ATTATATCAT TTTTCTGTGC

5821
GTGACAATAC ACTCACAAAA ATTACAATTT TTGTGTGTGT TTATATAAAA TGCACAGAAA

5881
AAAATAATCA CACACAGAAA AATTATACTT ATTCTGTGGG TTTCTATAAA ACGCACATAA

5941
AAAAATAAAC ACACAGAGAA AAATAGAACA AGCACCCTCA TACTAACTTC ATATGAACAC

6001
GCATATTTTT TCTTTTTAAT CTCTCTGTAA AACTTGTAAC TAGTTTTTCC CACTCGTACT

6061
AACTCCAAAT TGGATGATTT

(SEQ ID NO:9, Sb06g012260—S. bicolor), or a variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:9.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:10, including introns, can be:

1
ATGGCGGCTA ACGATTCCTT GGTTACTGCT CATGTGATAG GAGATGTCTT GGACCCCTTC

61
TATACAACCG TTGATATGAT GATCCTATTC GATGGTACTC CTATTATCAG CGGCATGGAG

121
TTGCGTGCTC CGGCGGTTTC TGACAGGCCA AGGGTTGAGA TTGGAGGAGA TGATTATCGA

181
GTTGCATATA CTCTGGTAAA CTCATGTCAT GTCAATTAAC TAGTAGTTGA ATTTAGATGC

241
TGGTCGTATC GTGGATACAT GAACTATATG TTATGGTTGA TACATATTTG TTTAATTGAT

301
CGCAACACCA TTTGTGGTAA CTTCAAATAA CATTCTTTCA ATATATAGGT GATGGTCGAT

361
CCTGATGCTC CTAACCCAAG CAACCCAACC TTGAGGGAGT ACTTGCACTG GTAAGAGAAA

421
CCTATAGACG ACAATTATTG TTGTTGGCAT GTTCTGCCCA CATATACTTT GCTAGTGTGT

481
GTATATTTGT GCTTATGCTT CTCCATAAAT TTTGGTGTAT GTCCCAAGAG AGATAGGTAT

541
AGAGGTTAGC AGTCCTTTAA AAATGGTTTA ATCCAGTAGT TTTTTTTCGG TCGGCCGGAC

601
TGCTAGTAAC TTTCAATCAT TTCATGTTTC GAGCAGGATG GTGACTGACA TCCCAGCATC

661
AACTGATAAT ACATACGGTG AGATCACCCC TATTCCCATT TTGAGACAAG TAGAATGTCT

721
ATTTTTATGA TCTAGTATGT TCGTGACAAT AGGCTAGCTA TTTTGAAACT TCGGGAGCAT

781
AAAATAGTAC TCGATTTTGT ATAACCATAA ACACAGCTAG CCAATCTCTA TTCATATTTA

841
TTTTAGTTTT ATTTGCCGAA CCATCCTCAA CATCATAGCC ACTTGATCGA TCATCTCAAT

901
CAGCGTTTGT ATCCTTGCCC GCTTTGATTA TCATCCATGA CAGTTCATAT TTTTTTTCAT

961
TTCTTTCATG CTTGTTATAG TTTTATCTGA TGAATCCGAG ATGTTATTGA TCAATTAGTT

1021
CAGATGAGCA GTAATGTATG TTGGAGGTTT GGTAGTATAT ATACGTTCAA TATTTCACGA

1081
AATCGGTAAT TACGAAAATC CCAAAATTTT GAATTACATT AATAATGCAT GTGACTCATA

1141
TTTTCTATGA TTTCTATTCT GTTGCATATT CTTGTACTCA ATAGATATTT AAATCATGCT

1201
AATATTTTGT TTAGATCTAA ATCTTTTAGA AAAATTATAA TTTATATTTG GGTTTAACAA

1261
TTTCGGGCGC GTTTAGTGAG ATTGGGTAAT TTCGGAGCGA GGCGGCCGCC GGCCACGAAA

1321
AATTCTATAC ACGACTATAT GTGTACATGT ACATGCATGG CACCTTGATA GGCTACCCCG

1381
GCCCGCATGG GGAAAAAATT GGAAACGGAC CATTCATACG CAGTCGTGGT GCCGACTGTG

1441
GGCCACAATA GCAGTGTAAA CATAATTACG GTAATCAAAT ACCCCGTGGG ACCATATATA

1501
TCATCCACAG ATCCGTACGG TGCTTCCGTG TGGATGGTCT ACCCCAGATC TTTTCCACCC

1561
CATAAGGGCA GCAATGCAGC ATCATATTCA TATGCACTAG TGATGTACCA TTTGGCTTAT

1621
ATCATATTCA ACCTAACTCC TTGGAAACAT TATGATGTTC TATTGGGGTG AAGATGTCAC

1681
TACTAAAAAA AGATCTTATG AGAGGTGTTT TGAAAACTGC CCGAGGTGGT TAAAGGAGAC

1741
GGACGAGTTA GGACAACTGC CTCTATTAAT GTGTATTAAC CGAGGTAGTT ACCGTAACGT

1801
GCCTGACTTG ATTAACAGAT TCAACCGTCT CAGTAAAGAC CATGATTAAC CGAAACGGAA

1861
TCGAGAGTTT TCTCAAGTAG TTAAACTATT TTAAACTGCA CCGAACTTAT AAAAATGGTA

1921
GAGCTAACAC CAATATTTAT AAAAATAAAT TAGTATCACT AAATACATCA CGAAATCTAT

1981
TTGGTGTTGT AGAAGTTATC CTTTTCTATA AAATTGATCA AATTTATGAT AACTTAGTTT

2041
TAGGAATTGA TTTATTTTAG GACAACTAAG GAAGTACATT TTTTAAAGTC ATCCACAAAG

2101
TAGTGGATCC AATTTATTAC ATTACTCCAC TACTTCAAAC TGAACAAAAG CCTAATCCTG

2161
GTTATTTTGA GAGTGATTTT TTACAACATC AGCAGTAGTC CAGAAAATGG GAGGACATTA

2221
ATAAAAGTGA AAAGGAGCAG AAGAAAGATT ACGGTATTTT ATTTGTGCTA TTTGTTTAAC

2281
TATTGGCAGT TTGGGACCGA AAATAAATAA CTGTTCGTAG CTCTATATTT GTCCATTCGA

2341
AAGTGTAACG ATGATTATTG TGTTTCAAAA GATAAATAAA GAAGTGCACC AATGATTTGA

2401
TATCATAGGC TATATAATCC AACATGGTGA AAATGCTTTT CAATCAAGTA ATCTTCGAGC

2461
GGTTACCAGT TTTAATAGTT GCGAGTCGTC GTTTTTTATG TACCCTAGGA CATATATATA

2521
TCCGCATGTA GACGATGAGA CTAGCTAGTT TTTTTTTTTT TGAGCAAATA CATAATTATT

2581
GGATTTGCAG GCCGTGAGAT GATGTGCTAC GAGCCCCCTG CCCCGTCCAC GGGCATCCAC

2641
CGGATGGTGC TGGTGCTATT CCAGCAGCTT GGCCGTGACA CGGTGTTCGC GGCGCCGTCC

2701
AGGCGCCACA ACTTCAACAC CCGTGCCTTC GCCCGCCGCT ACAACCTCGG CGCGCCCGTC

2761
GCCGCCATGT TCTTCAACTG CCAGCGCCAG ACCGGCTCCG GTGGCCCCAG GTTCACCGGG

2821
CCCTACACCA GCCGCCGTCG TGCGGGCTGA

(SEQ ID NO:10 Sb06g012260—S. bicolor) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:10.

The coding sequence, without introns, of the maturity Ma1 gene as it is found in day-neutral S. bicolor can include the nucleic acid sequence:

(SEQ ID NO:11, Sb06g012260 —S. bicolor), or a variant thereof, for example a codon optimized variant, having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:11.

In this embodiment, the maturity Ma1 protein as it is found in short-day—S. bicolor can include the amino acid sequence SEQ ID NO:8, or a variant thereof having at least 95% sequence identity to SEQ ID NO:8.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in day-neutral S. bicolor can include the nucleic acid sequence:

1
TTCCACCTGG GCAGGGAAAA CGGTTTATTA TGTTCCTCTT TAATTTATCT ATCGTGGTCT

61
GTTTTCACTA AAACTGTCAT ATTGCTACAC TCCAGTACTA CCAGTACGTC GCCCGCACAT

121
AGTGGCCAAG GATTTTACTG CTACTGTTGA TTAACATAAG CACTTGCGAC TTTCCCTAAC

181
ATCTTTTATA AAACAACGGC CGCAATAATA TTGAACTGTT TTTTTCTAGT ACCAAAAATA

241
GAATTTGATC CCTCACCTCA TTACATCCAT AGTAACATGA CCAGATATAT ATGGACAGGC

301
CGGGATCACT CGCCAGCAGA TACCCTGAGC GATTCATAAC CAGAATTTTT AATTTTTTCT

361
AGTGAAGTGG GGTTCTCCTA GTCCTTTAAC ATTCAAAATT TAGTACAAAC TTTCCTTAGT

421
AAATGTCTTC TAGTAAAGAT TTCCTAGTGT TTTGATTTGG TAGTGTTTTA TTACTAATTA

481
AAAATATTAG AAGAACTCCA TCATTTTGGT AGTGATTGGT TGTTTGGATT AGTCTTCTCA

541
CGTTAGACCT ATATATGCAG GACAACTCAA GCCAGCATAA ATATATGAAA TATCTTGGTG

601
TTTGTTTGTC TGACACAGGC AACCGTGTTT GGTATAAATG TGTTTTCTTG TTTACGTTTT

661
ACCATCTATA GTCATCTCAA TGTTTATATA GTAGAGACTT CATGTTTGTA GTAGATAAGG

721
TAGAGAATTG AGAATATTTT ATTTTTGTGC GACCATCAAT TTTATGTAAT CTGCATTGTC

781
TAATGCTTTA TTTGACATTT GAAACTACTT AATTTGACCG TTATGCAGGT CCGCATGATC

841
CTATGAAAGC AATTAATTAG TACGGGTACT GCACTACACA AGTTTGCTAG TACTATTCTA

901
TTAACCGACC TGTCAATATT ACCTTAAGTT ACTGATTTCA ATTAGAATCT AACACATTCA

961
GGAAAAGAAG TTTTCCTTAT TAGTAGTAAC TTTTTATACT AATTAAGATT CAATAAAAAT

1021
TCACCATGAC ATCCCCATTG CCAAGAGAAT ATTTCGCCGC CCCTCAAAGC AGCCAAGGCT

1081
TTACTAAAAA GACTATCCAC GCAGTAGAGA TTTAGTCAAA ATATTCCAAT AGCAATTGTT

1141
TTCTGCCTGC TTGACCTTCG TCAGCCACTC ACTGTATAAA TATCGCACCA CGCCCTTTGC

1201
AGGCTTACAG AGCTTGTACT ACGTACTAAC AAGGCACACA CAATACCCTG TGTTCACCGG

1261
CCCTGCACAA AACTCAAGCA GTTATTACTA ACATGGCGGC TAACGATTCC TTGGTTACTG

1321
CTCATGTGAT AGGAGATGTC TTGGACCCCT TCTATACAAC CGTTGATATG ATGATCCTAT

1381
TCGATGGTAC TCCTATTATC AGCGGCATGG AGTTGCGTGC TCCGGCGGTT TCTGACAGGC

1441
CAAGGGTTGA GATTGGAGGA GATGATTATC GAGTTGCATA TACTCTGGTA AACTCATGTC

1501
ATGTCAATTA ACTAGTAGTT GAATTTAGAT GCTGGTCGTA TCGTGGATAC ATGAACTATA

1561
TGTTATGGTT GATACATATT TGTTTAATTG ATCGCAACAC CATTTGTGGT AACTTCAAAT

1621
AACATTCTTT CAATATATAG GTGATGGTCG ATCCTGATGC TCCTAACCCA AGCAACCCAA

1681
CCTTGAGGGA GTACTTGCAC TGGTAAGAGA AACCTATAGA CGACAATTAT TGTTGTTGGC

1741
ATGTTCTGCC CACATATACT TTGCTAGTGT GTGTATATTT GTGCTTATGC TTCTCCATAA

1801
ATTTTGGTGT ATGTCCCAAG AGAGATAGGT ATAGAGGTTA GCAGTCCTTT AAAAATGGTT

1861
TAATCCAGTA GTTTTTTTTC GGTCGGCCGG ACTGCTAGTA ACTTTCAATC ATTTCATGTT

1921
TCGAGCAGGA TGGTGACTGA CATCCCAGCA TCAACTGATA ATACATACGG CCGTGAGATC

1981
ACCCCTATTC CCATTTTGAG ACAAGTAGAA TGTCTATTTT TATGATCTAG TATGTTCGTG

2041
ACAATAGGCT AGCTATTTTG AAACTTCGGG AGCATAAAAT AGTACTCGAT TTTGTATAAC

2101
CATAAACACA GCTAGCCAAT CTCTATTCAT ATTTATTTTA GTTTTATTTG CCGAACCATC

2161
CTCAACATCA TAGCCACTTG ATCGATCATC TCAATCAGCG TTTGTATCCT TGCCCGCTTT

2221
GATTATCATC CATGACAGTT CATATTTTTT TTCATTTCTT TCATGCTTGT TATAGTTTTA

2281
TCTGATGAAT CCGAGATGTT ATTGATCAAT TAGTTCAGAT GAGCAGTAAT GTATGTTGGA

2341
GGTTTGGTAG TATATATACG TTCAATATTT CACGAAATCG GTAATTACGA AAATCCCAAA

2401
ATTTTGAATT ACATTAATAA TGCATGTGAC TCATATTTTC TATGATTTCT ATTCTGTTGC

2461
ATATTCTTGT ACTCAATAGA TATTTAAATC ATGCTAATAT TTTGTTTAGA TCTAAATCTT

2521
TTAGAAAAAT TATAATTTAT ATTTGGGTTT AACAATTTCG GGCGCGTTTA GTGAGATTGG

2581
GTAATTTCGG AGCGAGGCGG CCGCCGGCCA CGAAAAATTC TATACACGAC TATATGTGTA

2641
CATGTACATG CATGGCACCT TGATAGGCTA CCCCGGCCCG CATGGGGAAA AAATTGGAAA

2701
CGGACCATTC ATACGCAGTC GTGGTGCCGA CTGTGGGCCA CAATAGCAGT GTAAACATAA

2761
TTACGGTAAT CAAATACCCC GTGGGACCAT ATATATCATC CACAGATCCG TACGGTGCTT

2821
CCGTGTGGAT GGTCTACCCC AGATCTTTTC CACCCCATAA GGGCAGCAAT GCAGCATCAT

2881
ATTCATATGC ACTAGTGATG TACCATTTGG CTTATATCAT ATTCAACCTA ACTCCTTGGA

2941
AACATTATGA TGTTCTATTG GGGTGAAGAT GTCACTACTA AAAAAAGATC TTATGAGAGG

3001
TGTTTTGAAA ACTGCCCGAG GTGGTTAAAG GAGACGGACG AGTTAGGACA ACTGCCTCTA

3061
TTAATGTGTA TTAACCGAGG TAGTTACCGT AACGTGCCTG ACTTGATTAA CAGATTCAAC

3121
CGTCTCAGTA AAGACCATGA TTAACCGAAA CGGAATCGAG AGTTTTCTCA AGTAGTTAAA

3181
CTATTTTAAA CTGCACCGAA CTTATAAAAA TGGTAGAGCT AACACCAATA TTTATAAAAA

3241
TAAATTAGTA TCACTAAATA CATCACGAAA TCTATTTGGT GTTGTAGAAG TTATCCTTTT

3301
CTATAAAATT GATCAAATTT ATGATAACTT AGTTTTAGGA ATTGATTTAT TTTAGGACAA

3361
CTAAGGAAGT ACATTTTTTA AAGTCATCCA CAAAGTAGTG GATCCAATTT ATTACATTAC

3421
TCCACTACTT CAAACTGAAC AAAAGCCTAA TCCTGGTTAT TTTGAGAGTG ATTTTTTACA

3481
ACATCAGCAG TAGTCCAGAA AATGGGAGGA CATTAATAAA AGTGAAAAGG AGCAGAAGAA

3541
AGATTACGGT ATTTTATTTG TGCTATTTGT TTAACTATTG GCAGTTTGGG ACCGAAAATA

3601
AATAACTGTT CGTAGCTCTA TATTTGTCCA TTCGAAAGTG TAACGATGAT TATTGTGTTT

3661
CAAAAGATAA ATAAAGAAGT GCACCAATGA TTTGATATCA TAGGCTATAT AATCCAACAT

3721
GGTGAAAATG CTTTTCAATC AAGTAATCTT CGAGCGGTTA CCAGTTTTAA TAGTTGCGAG

3781
TCGTCGTTTT TTATGTACCC TAGGACATAT ATATATCCGC ATGTAGACGA TGAGACTAGC

3841
TAGTTTTTTT TTTTTTGAGC AAATACATAA TTATTGGATT TGCAGGCCGT GAGATGATGT

3901
GCTACGAGCC CCCTGCCCCG TCCACGGGCA TCCACCGGAT GGTGCTGGTG CTATTCCAGC

3961
AGCTTGGCCG TGACACGGTG TTCGCGGCGC CGTCCAGGCG CCACAACTTC AACACCCGTG

4021
CCTTCGCCCG CCGCTACAAC CTCGGCGCGC CCGTCGCCGC CATGTTCTTC AACTGCCAGC

4081
GCCAGACCGG CTCCGGTGGC CCCAGGTTCA CCGGGCCCTA CACCAGCCGC CGTCGTGCGG

4141
GCTGATGACG ACGATCGTCG TTACGTCACG TGTACCGTAC ATATATATGT AAGATATACA

4201
TGCATGTTCC ATGGTAAGGA TCGGTGACAA AACGTCTAAT AATGTATACA CACATATGCA

4261
TGGAATGCAT GTAATAAGAG AATATATGTA TAATAAGTAG GGGGGAGCAT GCATATATTG

4321
TACACGCGTC CGATGCGTAT ATAGCCCTAT ACATTATTGT AGTTGTAATC A

(SEQ ID NO:12, Sb06g012260 —S. bicolor), or a variant, for example a codon optimized variant, thereof having at least at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:12.

The coding sequence of the maturity Ma1 gene of SEQ ID NO:12, including introns, can be:

1
ATGGCGGCTA ACGATTCCTT GGTTACTGCT CATGTGATAG GAGATGTCTT GGACCCCTTC

61
TATACAACCG TTGATATGAT GATCCTATTC GATGGTACTC CTATTATCAG CGGCATGGAG

121
TTGCGTGCTC CGGCGGTTTC TGACAGGCCA AGGGTTGAGA TTGGAGGAGA TGATTATCGA

181
GTTGCATATA CTCTGGTAAA CTCATGTCAT GTCAATTAAC TAGTAGTTGA ATTTAGATGC

241
TGGTCGTATC GTGGATACAT GAACTATATG TTATGGTTGA TACATATTTG TTTAATTGAT

301
CGCAACACCA TTTGTGGTAA CTTCAAATAA CATTCTTTCA ATATATAGGT GATGGTCGAT

361
CCTGATGCTC CTAACCCAAG CAACCCAACC TTGAGGGAGT ACTTGCACTG GTAAGAGAAA

421
CCTATAGACG ACAATTATTG TTGTTGGCAT GTTCTGCCCA CATATACTTT GCTAGTGTGT

481
GTATATTTGT GCTTATGCTT CTCCATAAAT TTTGGTGTAT GTCCCAAGAG AGATAGGTAT

541
AGAGGTTAGC AGTCCTTTAA AAATGGTTTA ATCCAGTAGT TTTTTTTCGG TCGGCCGGAC

601
TGCTAGTAAC TTTCAATCAT TTCATGTTTC GAGCAGGATG GTGACTGACA TCCCAGCATC

661
AACTGATAAT ACATACGGCC GTGAGATCAC CCCTATTCCC ATTTTGAGAC AAGTAGAATG

721
TCTATTTTTA TGATCTAGTA TGTTCGTGAC AATAGGCTAG CTATTTTGAA ACTTCGGGAG

781
CATAAAATAG TACTCGATTT TGTATAACCA TAAACACAGC TAGCCAATCT CTATTCATAT

841
TTATTTTAGT TTTATTTGCC GAACCATCCT CAACATCATA GCCACTTGAT CGATCATCTC

901
AATCAGCGTT TGTATCCTTG CCCGCTTTGA TTATCATCCA TGACAGTTCA TATTTTTTTT

961
CATTTCTTTC ATGCTTGTTA TAGTTTTATC TGATGAATCC GAGATGTTAT TGATCAATTA

1021
GTTCAGATGA GCAGTAATGT ATGTTGGAGG TTTGGTAGTA TATATACGTT CAATATTTCA

1081
CGAAATCGGT AATTACGAAA ATCCCAAAAT TTTGAATTAC ATTAATAATG CATGTGACTC

1141
ATATTTTCTA TGATTTCTAT TCTGTTGCAT ATTCTTGTAC TCAATAGATA TTTAAATCAT

1201
GCTAATATTT TGTTTAGATC TAAATCTTTT AGAAAAATTA TAATTTATAT TTGGGTTTAA

1261
CAATTTCGGG CGCGTTTAGT GAGATTGGGT AATTTCGGAG CGAGGCGGCC GCCGGCCACG

1321
AAAAATTCTA TACACGACTA TATGTGTACA TGTACATGCA TGGCACCTTG ATAGGCTACC

1381
CCGGCCCGCA TGGGGAAAAA ATTGGAAACG GACCATTCAT ACGCAGTCGT GGTGCCGACT

1441
GTGGGCCACA ATAGCAGTGT AAACATAATT ACGGTAATCA AATACCCCGT GGGACCATAT

1501
ATATCATCCA CAGATCCGTA CGGTGCTTCC GTGTGGATGG TCTACCCCAG ATCTTTTCCA

1561
CCCCATAAGG GCAGCAATGC AGCATCATAT TCATATGCAC TAGTGATGTA CCATTTGGCT

1621
TATATCATAT TCAACCTAAC TCCTTGGAAA CATTATGATG TTCTATTGGG GTGAAGATGT

1681
CACTACTAAA AAAAGATCTT ATGAGAGGTG TTTTGAAAAC TGCCCGAGGT GGTTAAAGGA

1741
GACGGACGAG TTAGGACAAC TGCCTCTATT AATGTGTATT AACCGAGGTA GTTACCGTAA

1801
CGTGCCTGAC TTGATTAACA GATTCAACCG TCTCAGTAAA GACCATGATT AACCGAAACG

1861
GAATCGAGAG TTTTCTCAAG TAGTTAAACT ATTTTAAACT GCACCGAACT TATAAAAATG

1921
GTAGAGCTAA CACCAATATT TATAAAAATA AATTAGTATC ACTAAATACA TCACGAAATC

1981
TATTTGGTGT TGTAGAAGTT ATCCTTTTCT ATAAAATTGA TCAAATTTAT GATAACTTAG

2041
TTTTAGGAAT TGATTTATTT TAGGACAACT AAGGAAGTAC ATTTTTTAAA GTCATCCACA

2101
AAGTAGTGGA TCCAATTTAT TACATTACTC CACTACTTCA AACTGAACAA AAGCCTAATC

2161
CTGGTTATTT TGAGAGTGAT TTTTTACAAC ATCAGCAGTA GTCCAGAAAA TGGGAGGACA

2221
TTAATAAAAG TGAAAAGGAG CAGAAGAAAG ATTACGGTAT TTTATTTGTG CTATTTGTTT

2281
AACTATTGGC AGTTTGGGAC CGAAAATAAA TAACTGTTCG TAGCTCTATA TTTGTCCATT

2341
CGAAAGTGTA ACGATGATTA TTGTGTTTCA AAAGATAAAT AAAGAAGTGC ACCAATGATT

2401
TGATATCATA GGCTATATAA TCCAACATGG TGAAAATGCT TTTCAATCAA GTAATCTTCG

2461
AGCGGTTACC AGTTTTAATA GTTGCGAGTC GTCGTTTTTT ATGTACCCTA GGACATATAT

2521
ATATCCGCAT GTAGACGATG AGACTAGCTA GTTTTTTTTT TTTTGAGCAA ATACATAATT

2581
ATTGGATTTG CAGGCCGTGA GATGATGTGC TACGAGCCCC CTGCCCCGTC CACGGGCATC

2641
CACCGGATGG TGCTGGTGCT ATTCCAGCAG CTTGGCCGTG ACACGGTGTT CGCGGCGCCG

2701
TCCAGGCGCC ACAACTTCAA CACCCGTGCC TTCGCCCGCC GCTACAACCT CGGCGCGCCC

2761
GTCGCCGCCA TGTTCTTCAA CTGCCAGCGC CAGACCGGCT CCGGTGGCCC CAGGTTCACC

2821
GGGCCCTACA CCAGCCGCCG TCGTGCGGGC TGA

(SEQ ID NO:13 Sb06g012260—S. bicolor) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:13.

In some embodiments, the maturity Ma1 gene (including non-coding sequence) as it is found in day-neutral S. bicolor can include the nucleic acid sequence:

1
ATGCCCCCAT CAAAGGAAGC CCCAAGTGGC GATGTACATG TCAAACAGCC ATCAAGTCAA

61
CCATTGACCC TAAAGGATAT CAGAAAGCCA ACGATTGATG ATTATGTCAA TGTCCCCAGT

121
GACTATGTGC CCGGAAGGCC TATGCTCCAA TGGACGCTGC TTGATAAGAT TCAATGGCCG

181
ATAAAAAGGT TTCATGACTG GTACATGAGA GCAGTGCATG CTGGCCTCCA TGCAATCAGA

241
GTTGATATAC CAGCAAACGT GTTTGCTACT GGTAACGAAA AAAGCAAGGC ATTTGTTATC

301
TTTGAGGACA TGCACTTGTT ATTGAACTAT AGGCGGCTTG ACGTCCAACT CATAACAATC

361
TGGTGTCTGT AAGTACCACT CATGCACACA CAATTATTAT TAATATGTAG TGTGAAACTC

421
TAATATGTAG ATGTTGTCTG TAGTTTGCAA GATCACGAGT AGAGGTCATT ATTATCTACC

481
GGATCAATGG TCGGTTATCT GAGCCCTATC AAGTTACAAG AAAATATGCA CAAATTTGTA

541
TTATCAAAGG AAGATAGAGC AAAGATAGAG GAAGACAAAA CACCAGAAAA AGTTGCAGAA

601
GCTATAAAAG AGTTGCAAAG AAAATACGAG GATAATTATG CCCTCTACCT TGGTAGATCA

661
ATGCTGAGGT ATAAGTATAG GGATTTTATA TTGGCACCTT ACAACTTTAG GTAAGCTTGA

721
CTTCATATAC GTACTTCAAA TAATTATCGT GTAAACAATA TACATGTGTC GCTCACTCAT

781
TTATTCATGC AGTGACCATT GGATTGTTTT TTATATTTAT CCCTTCGAAA GGAAGGTGCT

841
TGTCCTAGAC TCTTTACATG TTCCTCCCGA GAAGTATCAA CCATTCTTGG TTCAATTAGA

901
AAGGTGAGCC AACATGAAAC CACATGCGTA CTTATATAAA TTAGAGTTTC AAAACAACTT

961
TAGTGATTTA TATTCGATAT CTACAGGGCA TGGCGGTTTT ATAAGAAACA AAAGGGACCG

1021
GTCGACGCCG CACGCTCAGA TCCTAGGGTG CCATTGATGA TACAACACCA CTATCCGGTA

1081
AGTTGTCCGA ACACATTTCA TCATATAAAT AATACATAAA GCATGGCAAA TTTAGAATAA

1141
TCCGTTGCTC ATTATATAGT GCCACAAGCA ACCATCTGGA TCGGTCTATT GTGGGTACTA

1201
TGTCTGTGAG TTTATAAGGC AGCGGGGACG TTACGTCACG GACAAAAATA TGGTAAATAA

1261
TATCTATGTA TGAAGTTTTC TCATTAAAGT TGCAAAATTA TATATTGAAC ATGTGTCAAT

1321
CATGCTTTTA AACTTTGTTT CCAGCCAAAA AAGCAAAAAA AGGACGTGCC CTTTACACCA

1381
AAGACTCTGG AAGATATAGT AGCAGACTTG TGTGGTTTTA TTATGAGAGA AATAATTCCA

1441
AGTGACGGTG CATATTTTGA TCATGAGGGC GATTTAGCAA GTGATAAATT TAGAGTGCTG

1501
ACAGACATAG CAGGTCTAAA TCTGAAGCGA AATGACATG

(SEQ ID NO:32—Sb07g008600—S. bicolor) or functional fragment or variant, such as a codon optimized variant, thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:32.

The coding sequence, without introns, of the maturity Ma1 gene according to SEQ ID NO:32 as it is found in day-neutral S. bicolor can include the nucleic acid sequence:

(SEQ ID NO:33, Sb07g008600—S. bicolor), or a variant thereof, for example a codon optimized variant, having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:33.

Therefore, a maturity Ma1 protein as it is found in short-day S. bicolor can include the amino acid sequence:

MPPSKEAPSGDVHVKQPSSQPLTLKDIRKPTIDDYVNVPSDYVPGRPMLQ

WTLLDKIQWPIKRFHDWYMRAVHAGLHAIRVDIPANVFATGNEKSKAFV

IFEDMHLLLNYRRLDVQLITIWCLDHWIVFYIYPFERKVLVLDSLHVPP

EKYQPFLVQLERAWRFYKKQKGPVDAARSDPRVPLMIQHHYPCHKQ

PSGSVYCGYYVCEFIRQRGRYVTDKNMPKKQKKDVPFTPKTLEDIVA

DLCGFIMREIIPSDGAYFDHEGDLASDKFRVLTDIAGLNLKRNDM

(SEQ ID NO:34, Sb07g008600—S. bicolor) or functional fragment, or variant thereof having at least 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity to SEQ ID NO:34.

A polynucleotide is therefore disclosed having the nucleic acid sequence SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 19, 20, 28, 29, 30, 31, 32, and 33. A polynucleotide having a nucleic acid sequence at least 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identical to SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 19, 20, 28, 29, 30, 31, 32, or 33 is also disclosed. A polynucleotide that hybridizes under stringent conditions to a polynucleotide consisting of the nucleic acid sequence SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 19, 20, 28, 29, 30, 31, 32, or 33 is also disclosed.

A polypeptide is therefore disclosed having the amino acid sequence SEQ ID NO: 8 and 34. A polypeptide having an amino acid sequence at least 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identical to SEQ ID NO: 8 or 34 is also disclosed.

A polynucleotide that is a fragment of Ma1 gene is also disclosed. Therefore, a polynucleotide having a nucleic acid sequence at least 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identical to a fragment of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 19, 20, 28, 29, 30, 31, 32, and 33 is disclosed. The fragment can be at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 50, 75, 100, 150, 200, 250, 300, 350, 400, 500, or more nucleotides shorter than SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 19, 20, 28, 29, 30, 31, 32, or 33.

A polypeptide that is a fragment of the Ma1 protein is also disclosed having the amino acid sequence SEQ ID NO: 8 or 34. A polypeptide having an amino acid sequence at least 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% identical to a fragment of SEQ ID NO: 8 or 34 is disclosed. The fragment can be at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, or 30 amino acids shorter than SEQ ID NO: 8 or 34.

B. Photoperiod Sensitivity Expression Control

1. Photoperiod Sensitivity

The expression control sequences of Ma1 are also provided for use in putting expression of other plant genes under photoperiod control. For example, the expression control sequence of the Ma1 gene in the short-day S. propinquum having a dominant (functional) Ma1 allele can be used to induce photoperiod sensitivity of other plant genes.

The day-neutral haplotype of S. bicolor is characterized by a number of insertions, deletions and polymorphisms relative to S. propinquum. The mutations in S. bicolor include three deletions in the expression control sequence (5′ UTR) and one deletion in the second intron: (1) a 423 nucleotide deletion beginning with nucleotide 1,132 numbering for the first nucleotide of SEQ ID NO:1 or nucleotide 1597 numbering from the first nucleotide of SEQ ID NO:3; (2) a 4,186 nucleotide deletion beginning with nucleotide 2,465 from SEQ ID NO:1, or 4,231 nucleotide deletion beginning with nucleotide 2,930 numbering from the first nucleotide of SEQ ID NO:3 (3) a 3 nucleotide deletion beginning with nucleotide 6,753 numbering from the first nucleotide of SEQ ID NO:1, or nucleotide 7,263 numbering from the first nucleotide of SEQ ID NO:3 or nucleotide 2,024 numbering from the first nucleotide of SEQ ID NO:5; (4) a 27 nucleotide deletion beginning with nucleotide number 7,563 numbering from the first nucleotide of SEQ ID NO:1, or nucleotide 8,073 numbering from the first nucleotide of SEQ ID NO:3, or nucleotide 2,834 numbering from the first nucleotide of SEQ ID NO:5 (FIG. 3B).

Other insertions, deletions, and polymorphisms in or around S. bicolor Ma1 relative to S. propinquum Ma1, and their association with photoperiod sensitivity can be determined by one of skill in the art using the compositions and methods described herein. For example, additional deletions, insertions, and polymorphisms can be determined by comparing SEQ ID NO: 1, 3, or 5 of S. propinquum Ma1 to SEQ ID NO: 9 or 12 of S. bicolor using global sequence alignment tools. A global alignment shows an end-to-end alignment of two sequences. Tools for preparing global alignments are available in the art, for example, using EMBOSS Needle software available at ebi.ac.uk/Tools/psa/which creates a global alignment of two sequences using the Needleman-Wunsch algorithm.

Accordingly, one or more of the Ma1 expression control sequences in S. propinquum that are mutated or absent from S. bicolor can be operably linked to a plant gene coding sequence to impart photoperiod sensitive (i.e., short-day) control over the plant gene coding sequence.